Amat 2100

Recueil de notes
pour le cours MAT 2100 : Analyse 3
M. C. Delfour
Département de mathématiques et de statistique
Université de Montréal
C.P. 6128, succ. Centre-ville
Montréal, Canada H3C 3J7
delfour@dms.umontreal.ca
http://www.dms.umontreal.ca/˜delfour/
Version 9.0
Montréal, le 15 avril 2017

ii
Table des matières
Préface xi
Orientation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi
1 Des entiers naturels aux réels 1

1 Nombres entiers naturels N (+, ·, <) . . . . . . . . . . . . . . . . . . . 1
2 Nombres entiers Z (+, ·, <) . . . . . . . . . . . . . . . . . . . . . . . . 2
3 Nombres rationnels Q (+, ·, <) . . . . . . . . . . . . . . . . . . . . . . 3
4 Nombres réels R(+, ·, <) . . . . . . . . . . . . . . . . . . . . . . . . . 5
4.1 Des fissures dans l’ensemble Q des rationnels . . . . . . . . . 5
4.2 ◮ Construction de R : les coupures de Dedekind . . . . . . . 7
4.2.1 Définition des coupures . . . . . . . . . . . . . . . . 8
4.2.2 Relation d’ordre, addition et multiplication . . . . . 8
4.2.3 Propriété P7 de complétude . . . . . . . . . . . . . 10
4.2.4 Réels étendus R . . . . . . . . . . . . . . . . . . . . 12
4.3 Bornitudes, infimum et supremum . . . . . . . . . . . . . . . 13
4.4 Densité des rationnels et des irrationnels dans R . . . . . . . 15
4.5 Valeur absolue . . . . . . . . . . . . . . . . . . . . . . . . . . 16
4.6 Représentation décimale des nombres réels . . . . . . . . . . . 18
5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2 Quelques notions ensemblistes et algébriques 23

1 Relation, application et fonction . . . . . . . . . . . . . . . . . . . . 23
1.1 Application et fonction . . . . . . . . . . . . . . . . . . . . . 23
1.2 Relation binaire et relation d’équivalence . . . . . . . . . . . 25
2 Cardinal et dénombrabilité . . . . . . . . . . . . . . . . . . . . . . . 27
2.1 Définitions et exemples . . . . . . . . . . . . . . . . . . . . . 27
2.2 Quelques résultats généraux . . . . . . . . . . . . . . . . . . . 30
2.3 R n’est pas dénombrable . . . . . . . . . . . . . . . . . . . . . 32
2.4 ◮ Cardinalité du continu c et cardinaux transfinis . . . . . . 33
2.5 ◮ ℵ0 , ℵ1 , ℵ2 , ℵ3 , · · · , hypothèse du continu, et axiome du choix 34
3 Corps, ensemble ordonné et corps ordonné . . . . . . . . . . . . . . . 34
3.1 Corps et corps commutatif . . . . . . . . . . . . . . . . . . . 34
3.2 Ensemble ordonné . . . . . . . . . . . . . . . . . . . . . . . . 36
3.3 Corps ordonné . . . . . . . . . . . . . . . . . . . . . . . . . . 39
iii
iv Table des matières
4 Nombres complexes et hypercomplexes . . . . . . . . . . . . . . . . . 40

4.1 Nombres complexes . . . . . . . . . . . . . . . . . . . . . . . 40
4.2 ◮ Nombres hypercomplexes . . . . . . . . . . . . . . . . . . . 42
5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3 Topologie et suites dans les espaces métriques 47

1 Espace vectoriel, norme, produit scalaire . . . . . . . . . . . . . . . . 47
1.1 L’espace Rn , n ≥ 1 . . . . . . . . . . . . . . . . . . . . . . . . 47
1.2 Espace vectoriel . . . . . . . . . . . . . . . . . . . . . . . . . 48
1.3 Norme et espace vectoriel normé . . . . . . . . . . . . . . . . 49
1.4 Produit scalaire . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2 Métrique et espace métrique . . . . . . . . . . . . . . . . . . . . . . . 55
2.1 Définition et exemples . . . . . . . . . . . . . . . . . . . . . . 55
2.2 Quelques propriétés . . . . . . . . . . . . . . . . . . . . . . . 58
3 Ensemble ouvert et ensemble fermé . . . . . . . . . . . . . . . . . . . 59
3.1 Boule ouverte et boule trouée . . . . . . . . . . . . . . . . . . 59
3.2 Ensemble ouvert et intérieur d’un ensemble . . . . . . . . . . 60
3.3 Ensemble fermés et adhérence d’un ensemble . . . . . . . . . 64
3.4 Frontière d’un ensemble . . . . . . . . . . . . . . . . . . . . . 70
4 Ensembles compacts . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5 Caractérisation de la compacité dans Rk . . . . . . . . . . . . . . . . 75
6 Suites de Cauchy, complétude et complété . . . . . . . . . . . . . . . 79
6.1 Suites de Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . 79
6.2 Espace métrique complet . . . . . . . . . . . . . . . . . . . . 84
6.3 Complété d’un espace métrique . . . . . . . . . . . . . . . . . 86
7 Compacité et compacité séquentielle . . . . . . . . . . . . . . . . . . 89
8 Ensembles parfaits . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
9 Ensembles connexes et ensembles convexes . . . . . . . . . . . . . . . 96
9.1 Ensembles connexes . . . . . . . . . . . . . . . . . . . . . . . 96
9.2 Ensembles convexes, sous-ensembles linéaire et affine . . . . . 100
10 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
4 Fonctions, limites et continuités 107

1 Rappels sur les applications et les fonctions . . . . . . . . . . . . . . 107
2 Limite d’une fonction . . . . . . . . . . . . . . . . . . . . . . . . . . 109
2.1 Limite d’une fonction en un point d’accumulation . . . . . . 109
2.2 Limite d’une fonction d’une variable réelle aux infinis . . . . 113
2.3 Limite inférieure et limite supérieure d’une fonction à valeurs
réelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
3 Fonctions continues . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
3.1 Définitions et propriétés . . . . . . . . . . . . . . . . . . . . . 115
3.2 Application ouverte ou fermée, homéomorphisme . . . . . . . 120
3.3 Métriques équivalentes . . . . . . . . . . . . . . . . . . . . . . 122
3.4 Prolongement continu . . . . . . . . . . . . . . . . . . . . . . 127
4 Continuité et compacité . . . . . . . . . . . . . . . . . . . . . . . . . 134
5 Continuité et connexité . . . . . . . . . . . . . . . . . . . . . . . . . 136
Table des matières v
6 Fonctions uniformément continues . . . . . . . . . . . . . . . . . . . 138

6.2 Prolongement uniformément continu . . . . . . . . . . . . . . 141
7 Fonctions lipschitziennes . . . . . . . . . . . . . . . . . . . . . . . . . 142
7.2 Prolongement lipschitzien . . . . . . . . . . . . . . . . . . . . 144
8 Application contractante et théorème du point fixe . . . . . . . . . . 145
9 Fonctions d’une variable réelle . . . . . . . . . . . . . . . . . . . . . . 146
9.1 Limites à gauche, limites à droite, discontinuités . . . . . . . 146
9.2 Fonction monotone . . . . . . . . . . . . . . . . . . . . . . . . 148
9.3 ◮ Fonction à variation bornée, fonction absolument continue 150
10 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
5 Espaces vectoriels, convergences et applications linéaires 155

1 Rappels : espace vectoriel, norme, et espace de Banach . . . . . . . . 155
2 Suites, espaces et séries de fonctions . . . . . . . . . . . . . . . . . . 157
2.1 Convergences des suites de fonctions . . . . . . . . . . . . . . 157
2.2 Espaces de Banach de fonctions bornées/continues . . . . . . 161
2.3 Espace de fonctions lipschitziennes . . . . . . . . . . . . . . . 164
2.4 Séries de fonctions . . . . . . . . . . . . . . . . . . . . . . . . 166
3 ◮ Espaces de Banach de fonctions différentiables . . . . . . . . . . . 167
4 Produit scalaire et espaces de Hilbert . . . . . . . . . . . . . . . . . . 169
5 Applications linéaires et linéaires continues . . . . . . . . . . . . . . 172
6 Espaces vectoriels de dimension finie . . . . . . . . . . . . . . . . . . 177
6.1 Espace euclidien . . . . . . . . . . . . . . . . . . . . . . . . . 177
6.2 L’espace des applications linéaires . . . . . . . . . . . . . . . 178
6.3 Orthogonalité et transposition . . . . . . . . . . . . . . . . . 181
7 Groupe général linéaire : métriques et complétude . . . . . . . . . . 185
7.1 Rappels sur la notion de groupe . . . . . . . . . . . . . . . . 185
7.2 Définition et propriétés . . . . . . . . . . . . . . . . . . . . . 186
7.3 Une première métrique sur GL (n) . . . . . . . . . . . . . . . 188
7.4 ◮ Une seconde métrique sur GL (n) invariante à droite . . . . 189
8 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
6 Dérivée, dérivées directionnelles et différentielles 199

1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
2 Fonctions numériques d’une variable réelle . . . . . . . . . . . . . . . 200
2.1 Continuité et différentiabilité . . . . . . . . . . . . . . . . . . 202
2.2 Théorème de la moyenne ou des accroissements finis . . . . . 204
2.3 Propriété de la dérivée d’une fonction dérivable partout . . . 206
2.4 Théorème de Taylor . . . . . . . . . . . . . . . . . . . . . . . 206
3 Fonctions de plusieurs variables réelles . . . . . . . . . . . . . . . . . 208
3.1 Dérivée directionelle et différentielle au sens de Gateaux . . . 208
3.1.1 Définitions et propriétés . . . . . . . . . . . . . . . . 208
3.1.2 Opérations algébriques et premiers exemples . . . . 209
3.1.3 Gateaux différentiabilité n’entraı̂ne pas continuité . 212
vi Table des matières
3.1.4 Dérivées partielles, gradient, application et matrice

jacobiennes . . . . . . . . . . . . . . . . . . . . . . . 214
3.2 Approche géométrique à la différentielle . . . . . . . . . . . . 216
3.3 Dérivée directionnelle et différentielle au sens de Hadamard . 220
3.3.1 Formulation équivalente à l’approche de Hadamard 220
3.3.2 Définitions . . . . . . . . . . . . . . . . . . . . . . . 223
3.3.3 Continuité des fonctions Hadamard directionnelle-
ment dérivables . . . . . . . . . . . . . . . . . . . . 227
3.3.4 Opérations algébriques sur les dérivées directionnelles
et les différentielles . . . . . . . . . . . . . . . . . . 228
3.3.5 Dérivation et différentiation en chaı̂ne des fonctions
composées . . . . . . . . . . . . . . . . . . . . . . . 229
3.4 Différentielle de Fréchet . . . . . . . . . . . . . . . . . . . . . 233
3.5 Fonctions lipschitziennes et différentiabilité . . . . . . . . . . 236
3.5.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . 236
3.5.2 Gateaux dérivabilité et Lipschitzité donnent Hada-
mard dérivabilité . . . . . . . . . . . . . . . . . . . . 237
3.6 Théorème de la moyenne pour les fonctions vectorielles . . . . 238
3.7 Fonctions de classes C (p) , p ≥ 0, et matrice hessienne . . . . . 241
3.7.1 Classes C (0) et C (1) . . . . . . . . . . . . . . . . . . 241
3.7.2 Classe C (2) , matrice hessienne et classe C (p) . . . . 244
3.8 Généralisation et perspectives : les semi-différentielles . . . . 248
3.9 Tableau des notions de dérivabilité et de différentiabilité . . . 249
4 Fonctions convexes et optimisation . . . . . . . . . . . . . . . . . . . 249
4.1 Fonctions convexes . . . . . . . . . . . . . . . . . . . . . . . . 249
4.2 Fonctions convexes directionnellement dérivables . . . . . . . 251
4.3 Optimisation convexe : condition nécessaire et suffisante . . . 254
4.4 Optimisation différentiable sans contraintes : conditions
nécessaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256
5 Théorèmes de la fonction inverse, de la fonction implicite et du rang 260
5.1 Théorème de la fonction inverse . . . . . . . . . . . . . . . . . 260
5.2 Théorème de la fonction implicite . . . . . . . . . . . . . . . . 264
5.3 Théorèmes du rang et des multiplicateurs de Lagrange . . . . 266
6 ◮ Déterminants et formules de changement de variable . . . . . . . . 275
6.1 Formule de Leibniz . . . . . . . . . . . . . . . . . . . . . . . . 275
6.2 Formule de Laplace ou formule de récurrence . . . . . . . . . 282
6.3 Comatrice ou matrice des cofacteurs et calcul de l’inverse . . 285
6.4 Aire, volume et leur généralisation en dimension n > 3 . . . . 286
6.5 Formule de changement de variable pour l’intégrale de volume 288
6.6 Intégrale de ligne, de surface et de sous-variétés de dimension
supérieure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
7 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291
Annexe A. Corrigés des exercices 297

1 Exercices du Chapitre 1 . . . . . . . . . . . . . . . . . . . . . . . . . 297
Table des matières vii

Éléments de bibliographie 357

viii Table des matières
Table des figures
1.1 Richard Dedekind (1831-1916). . . . . . . . . . . . . . . . . . . . . . 7
2.1 Georg Cantor (1845–1918). . . . . . . . . . . . . . . . . . . . . . . . 27

2.2 William Rowan Hamilton (1805–1865). . . . . . . . . . . . . . . . . . 43
2.3 Plaque commémorative de la naissance des quaternions sur le pont de
Broom (Dublin). ≪Ici, le 16 octobre 1843, alors qu’il se promenait, Sir
William Rowan Hamilton découvrit dans un éclair de génie la formule
fondamentale sur la multiplication des quaternions i2 = j 2 = k 2 =
ijk = −1 et la grava sur une pierre du pont. ≫ . . . . . . . . . . . . 44
3.1 Maurice René Fréchet (1878–1973). . . . . . . . . . . . . . . . . . . . 55

3.2 Felix Hausdorff (1868–1942). . . . . . . . . . . . . . . . . . . . . . . 57
3.3 Augustus De Morgan (1806–1871). . . . . . . . . . . . . . . . . . . . 68
3.4 Heinrich Eduard Heine (1821–1881). . . . . . . . . . . . . . . . . . . 78
3.5 Félix Edouard Justin Émile Borel (1871–1956). . . . . . . . . . . . . 78
3.6 Bernard Placidus Johann Nepomuk Bolzano (1781–1848). . . . . . . 79
3.7 Karl Theodor Wilhelm Weierstrass (1815–1897) et Sofia Kovalevskaı̈a
(1850–1891). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
3.8 Augustin Louis Cauchy (1789–1857). . . . . . . . . . . . . . . . . . . 80
3.9 L’ensemble de Cantor . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.1 Exemples de fonctions f . Pour E = R, la limite y de f (x) en a existe

pour les seconde et troisième fonctions, mais pas pour la première. . 110
4.2 Johann Peter Gustav Lejeune Dirichlet (1805–1859). . . . . . . . . . 111
4.3 Limite de sin(1/x) en a = 0 ? . . . . . . . . . . . . . . . . . . . . . . 112
4.4 Heinrich Franz Friedrich Tietze (1880–1964). . . . . . . . . . . . . . 128
4.5 Construction de l’escalier de Cantor . . . . . . . . . . . . . . . . . . 151
6.1 Exemples de dérivées à droite et à gauche. . . . . . . . . . . . . . . . 202

6.2 Exemples 3.2 et 3.10. . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
6.3 Exemple 3.3 (échelle logarithmique) . . . . . . . . . . . . . . . . . . 213
6.4 Exemple 3.4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
6.5 Fonction convexe et fonction concave . . . . . . . . . . . . . . . . . . 250
6.6 Tangence du convexe U à l’ensemble de niveau de f passant par x ∈ U .254
ix
x Table des figures
6.7 Tangence du sous-espace affine A ou linéaire S à un ensemble de

niveau de f . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256
6.8 Demi-tangente dh(0; +1) au chemin h(t) dans U au point h(0) = x. . 270
6.9 Fonction de l’Exercice 7.3. . . . . . . . . . . . . . . . . . . . . . . . . 291
Préface
Orientation
Ce recueil de notes de cours s’appuie principalement sur les chapitres 1, 2, 4,
7 et 9 du livre de W. Rudin [1] qui est un grand classique dans le domaine en
Amérique du Nord. On présume que les notions fondamentales en dimension un
(topologie, suites, séries, dérivées, intégrale de Riemann, etc.) ont été acquises dans
un premier cours d’analyse (par exemple, MAT 1000). Il n’est pas possible dans le
cadre d’un cours d’une session d’inclure l’intégrale de Lebesgue.
La partie sur les espaces métriques est considérablement augmentée pour aller
au delà des principales définitions et résultats et en entrevoir les applications et les
retombées. C’est le cadre le plus général dans lequel tout peut se faire via la notion
de suite sans imposer de structure algébrique. La notion de métrique déjà très
présente en géométrie se retrouve de nos jours un peu partout comme, par exemple,
en intelligence artificielle, en théorie du codage (métrique de Hamming), en théorie
des graphes, en analyse des données, en statistique et en imagerie. On a choisi
de donner un traitement exhaustif de la compacité, de la compacité séquentielle,
du complété et de la complétude. On fleurte un peu avec la topologie générale et
l’analyse fonctionnelle.
Un des objectifs importants est d’appuyer les notions abstraites par des cons-
tructions et des exemples concrets d’espaces métriques. La partie sur la continuité
et la convergence uniforme donnent l’occasion de construire les premiers espaces
métriques de fonctions. À l’aide de la fonction caractéristique et de la fonction
distance on construit aussi des métriques sur l’ensemble des sous-ensembles d’un
ensemble arbitraire. On retrouve entre autres la métrique de Pompéiu-Hausdorff.
On donne aussi deux exemples de métriques complètes sur le groupe général linéaire
dont l’une est invariante à droite.
La partie sur la différentiabilité a été considérablement développée pour bien
mettre en lumière le passage de la notion de dérivée en dimension un à celle
de différentielle à partir de la dimension deux. Ces notions se prolongent quasi-
intégralement aux espaces vectoriels de dimension infinie menant naturellement au
Calcul des variations et de ses rejetons, mais aussi au calcul différentiel sur des sous-
variétés régulières de l’espace euclidien. On ne peut malheureusement dans le cadre
d’un cours d’une session aller au delà de quelques applications en optimisation et
xi
xii Préface
de l’obtention des gros théorèmes de la fonction inverse, de la fonction implicite et

de quelques formes du théorème du rang.
Il y a plusieurs directions pour la suite de ce cours, mais l’intégration est
prioritaire. L’intégration de Riemann, de Riemann-Stieljes et de Lebesgue sont des
sujets incontournables. Le livre suivant (au moins la première moitié qui serait
l’équivalent d’une session au DMS) est fortement recommandé :
R.L. Wheeden and A. Zygmund Measure and integral, Marcel Dek-
ker, New York and Basel, 1977.
Avec l’intégrale de Lebesgue, on obtient l’exemple d’un espace de Hilbert de fonc-
tions. Avec la théorie des distributions, on obtient les espaces de Sobolev qui sont
fondamentaux en équations aux dérivées partielles. Un autre sujet est la géométrie
différentielle. Voir, par exemple, le livre suivant :
M. Berger et B. Gostiaux Géométrie différentielle : variétés, courbes
et surfaces, 2-eme éd., Presses Universitaire de France, Paris, 1992. (tra-
duction anglaise, Differential geometry : Manifolds, curves and surfaces,
Springer-Verlag, New York, 1988.
Un autre est l’optimisation avec les idées de semicontinuité et de semi-différentielles
qui prolongent et complètent les notions correspondantes vues dans le cours :
M. Delfour, Introduction à l’optimisation et au calcul semi-différentiel,
Collection Sciences Sup., Mathématiques appliqués pour le Master/SMAI,
Dunod, Paris 2012.
La version anglaise de ce livre
M. Delfour, Introduction to optimization and semidifferential calcu-
lus, SIAM-MOS series, Society for Industrial and Applied Mathematics,
Philadelphia, USA, 2012.
existe aussi sous forme électronique. Elle peut s’obtenir gratuitement (chapitre par
chapitre) à partir d’une machine du réseau de l’Université de Montréal à l’adresse
suivante :
http ://epubs.siam.org/doi/book/10.1137/1.9781611972153
Michel Delfour
Montréal, le 1 janvier 2017

Chapitre 1
Des entiers naturels
aux réels
1 Nombres entiers naturels N (+, ·, <)

On prend comme point de départ l’ensemble des entiers naturels
déf
N = {1, 2, 3, . . .}
sur lequel on définit une addition et une multiplication.

L’ addition + : N × N → N
∀x, y ∈ N, x+y ∈N
qui a comme propriétés :
P1 (commutativité) x+y = y+x

P2 (associativité) (x + y) + z = x + (y + z).
La multiplication · : N × N → N
∀x, y ∈ N, x·y ∈N
qui a comme propriétés :
P1 (commutativité) x·y =y·x

P2 (associativité) (x · y) · z = x · (y · z).
P4 (élément neutre multiplicatif) ∃ 1 ∈ N tel que ∀x ∈ N, x · 1 = x.
Enfin, on a une propriété de la multiplication par rapport à l’addition :
P3 (distributivité) x · (y + z) = x · y + x · z.
On a aussi les deux relations d’ordre (< et ≤) suivantes :
1
2 Chapitre 1. Des entiers naturels aux réels
- Première relation d’ordre (strict) sur N (<)
x<y si il existe n ∈ N tel que y = x + n
qui est transitive, c’est-à-dire si p < q et q < r, alors p < r.

- Seconde relation d’ordre sur N (≤)
x≤y si x = y ou x < y
qui est aussi transitive, c’est-à-dire si p ≤ q et q ≤ r, alors p ≤ r.
2 Nombres entiers Z (+, ·, <)

Comme il n’est pas toujours possible pour deux entiers a et b dans N de trouver
x ∈ N tel que (ou résoudre l’équation)
a + x = b,
on enrichie les entiers naturels en introduisant les notions d’élément neutre et d’in-
verse additifs :
- existence de l’élément neutre 0 pour l’addition :
P4 (élément neutre additif)

∃ 0 tel que ∀x ∈ N, x+0=x
- existence d’un inverse pour l’addition :
P5 (existence d’un inverse additif)

∀x ∈ N, ∃ (−x) tel que x + (−x) = 0.
On peut alors définir l’opération − : Z × Z → Z

déf
∀x, y ∈ Z, x − y = x + (−y).
On a ainsi construit les nombres entiers

déf
Z = {. . . , −3, −2, −1, 0, 1, 2, 3, . . .} .
Les définitions d’ordre demeurent les mêmes.

- Première relation d’ordre (strict) sur Z (<) :
x<y si il existe n ∈ N tel que y = x + n
- Seconde relation d’ordre sur Z (≤) :
x≤y si x = y ou x < y
3. Nombres rationnels Q (+, ·, <) 3
On résume les propriétés sur Z.

P1 (commutativité) x + y = y + x et x · y = y · x
P2 (associativité) (x + y) + z = x + (y + z) et
(x · y) · z = x · (y · z)
P3 (distributivité) x · (y + z) = x · y + x · z
P4 (élément neutre) - additif ∃ 0 tel que ∀x ∈ Z, 0+x=x
- multiplicatif ∃ 1 tel que ∀x ∈ Z, 1·x = x
P5 (∃ un inverse additif) ∀x ∈ Z, ∃ − x tel que x + (−x) = 0


 a) ∀x, y ∈ Z tel que x > 0 et y > 0



 x+y >0

P6 (relation d’ordre) b) ∀x ∈ Z



 une seule propriété est vraie :



x > 0, x = 0, ou 0 > x.
3 Nombres rationnels Q (+, ·, <)

Ici encore, il n’est pas toujours possible de trouver x ∈ Z tel que (ou résoudre
l’équation)
q·x =p (3.1)
pour toute paire d’entiers p et q dans Z. Il suffit de prendre par exemple q = 2 et

p = 1.
On ajoute à Z les nombres de la forme p/q avec p, q ∈ Z, q 6= 0. La paire (p, q)
n’est cependant pas unique car toutes les paires (np, nq), 0 6= n ∈ Z, sont aussi
solution de l’équation (3.1).
On forme alors les classes d’équivalence
déf
[p/q] = {p′ /q ′ : pq ′ = p′ q}
et on obtient ainsi l’ensemble des nombres rationnels

déf
Q = {[p/q] : ∀p ∈ Z et ∀q ∈ Z tel que q 6= 0}
qui par définition contient les ééments de Z de la forme [p/1], p ∈ Z. Il y a donc

plusieurs représentants dans chaque classe d’équivalence ou plusieurs façons d’écrire
un nombre rationnel donné.
Il peut être utile ou souhaitable de choisir ou construire un représentant dans
chaque classe. Par ce faire on introduit la notion de plus grand commun facteur
(diviseur) de deux entiers positifs p et q non nuls que l’on écrira
(p, q).
On peut maintenant procéder de la façon suivante :

a) si p = 0, on écrit 0/1
b) si p 6= 0,
i) on choisit d’abord le signe + ou −
ii) on se ramène à p/q, pour p, q ∈ N
iii) on simplifie la fraction autant que possible en divisant p et q par leur
plus grand commun facteur (diviseur) (p, q).
Ce représentant unique est appelé forme réduite.
La structure (+, ·, <) sur Q subsiste. On peut vérifier que l’addition, la mul-
tiplication et les relations d’ordre sont bien définies :
- l’addition
déf
[p1 /q1 ] + [p2 /q2 ] = [(p1 · q2 + p2 · q1 )/q1 q2 ],
- la multiplication
déf
[p1 /q1 ] · [p2 /q2 ] = [p1 · p2 /q1 · q2 ],
- la relation d’ordre
(
p1 · q2 − p2 · q1 < 0 lorsque q1 · q2 > 0
[p1 /q1 ] < [p2 /q2 ] si
p1 · q2 − p2 · q1 > 0 lorsque q1 · q2 < 0
qui est toujours transitive, c’est-à-dire,

p1 p2 p2 p3 p1 p3
< et < , ⇒ < .
q1 q2 q2 q3 q1 q3
On résume les propriétés sur Q.
(
(x + y) + z = x + (y + z)
P2 (associativité)
et (x · y) · z = x · (y · z)
(
(additif) ∃ 0 ∈ Q tel que ∀x ∈ Q, 0 + x = x
P4 (éléments neutres)
(multiplicatif) ∃ 1 ∈ Q tel que ∀x ∈ Q, x · 1 = x

 (additif) ∀x ∈ Q, ∃ − x ∈ Q tel que x + (−x) = 0

P5 (existence d’inverses) (multiplicatif) ∀x ∈ Q, x 6= 0, ∃x−1 ∈ Q


tel que x · x−1 = 1

 a) ∀x, y ∈ Q tel que x > 0 et y > 0, on a


 x + y > 0 et x · y > 0
P6 (relation d’ordre)
 b) ∀x ∈ Q, une seule propriété est vraie :



x > 0, x = 0, ou 0 > x.
4. Nombres réels R(+, ·, <) 5
La relation d’ordre < possède la propriété que pour tout x et y dans Q, on a
x = y, x < y, ou x < y.
Elle demeure transitive, c’est-à-dire,
x < y et y < z ⇒ x < z.
Enfin, on peut définir l’opération de division ÷ : Z × Z \{0} → Q
déf
∀x, y ∈ Z, y 6= 0, x ÷ y = [x/y].
4 Nombres réels R(+, ·, <)

4.1 Des fissures dans l’ensemble Q des rationnels
Si l’on prend le point de vue intuitif que les ensembles N et Z sont des points
le long d’une droite orientée, il y a des trous constitués d’intervalles de longueur un
entre deux éléments consécutifs distincts de N ou de Z : par exemple, entre 1 et 2.
Ce n’est pas le cas de l’ensemble Q des nombres rationnels.
Théorème 4.1. Soient a et b dans Q tel que a < b. Alors il existe c ∈ Q tel que
a < c < b.
Démonstration. On prend c = (a + b)/2 qui appartient bien à Q. Alors, il est facile

de vérifier à partir de la définition que a + b < 2b et 2a < a + b. De là en divisant
par 2, a < (a + b)/2 < b.
Comme il n’y a pas de trous entre deux nombres rationnels distincts, ce premier
résultat inciterait à croire que Q formerait un continuum. Ce n’est cependant pas le
cas et c’est ce qui va motiver √ la construction du continuum des nombres réels. En
effet, on verra plus loin que 2 peut être approché par en dessus et par en dessous
par des rationnels sans jamais l’atteindre :
√
1< 2<2
√
1.4 < 2 < 1.5
√
1.41 < 2 < 1.42
...
√
1.414 213 562 4 < 2 < 1.414 213 562 5
Il n’y a pas de trous dans l’ensemble Q, mais plutôt des fissures.
Théorème 4.2. Il n’existe pas de x ∈ Q tel que x2 = 2 ou de façon équivalente
∀x ∈ Q, x2 6= 2.
Démonstration. On note d’abord que si m ∈ Z est pair, alors m2 est pair. Si m ∈ Z

est impair, alors m = 2k + 1 pour un k ∈ Z et
m2 = (2k + 1)2 = 4 · (k 2 + k) + 1
est impair. Ceci implique que m ∈ Z est impair (resp. pair) si et seulement si m2
est impair (resp. pair).
On raisonne par l’absurde. Supposons qu’il existe x ∈ Q tel que x2 = 2. Alors
x est de la forme m/n pour m et n dans Z, n 6= 0. On prend maintenant x sous sa
forme réduite m/n où le plus grand commun diviseur (m, n) de m et n est 1. On
obtient alors m2 = 2 · n2 ce qui entraı̂ne que m est pair.
Il existe donc r ∈ Z tel que m = 2r. De l’équation (m/n)2 = 2, il vient
4 r 2 = 2 n2 ⇒ 2 r 2 = n2
et on en conclut que n2 et a fortiori n sont pair. Comme m est aussi pair, le plus
grand commun diviseur (m, n) ≥ 2 et cela contredit le choix initial d’une forme
réduite pour x = m/n telle que (m, n) = 1.
Ceci met en lumière le phénomène suivant.
Théorème 4.3. (i) Il n’existe pas de plus grand nombre rationnel positif de
carré inférieur ou égal à 2.
(ii) Il n’existe pas de plus petit nombre rationnel positif de carré supérieur ou
égal à 2.
√ √
En particulier, pour tout r ∈ Q tel que r2 ≤ 2, on a − 2 < r < 2.
Démonstration. (i) Soient Q+ = {x ∈ Q : x ≥ 0} et A = {p ∈ Q+ : p2 ≤ 2}. Du

Théorème 4.2 on sait que A = {p ∈ Q+ : p2 < 2}. Prenons p ∈ A et montrons que
nous pouvons toujours lui associer un nombre q ∈ A tel que p < q, ce qui montrerait
qu’il n’y a pas de plus grand élément dans A.
Associons à p ∈ A le nombre rationnel
déf p2 − 2 2 − p2
q = p− =p+ >p
p+2 p+2
puisque p2 − 2 < 0 et p + 2 > 0.
Pour conclure, il faut maintenant montrer que q ∈ A. On estime la différence
2 2
p2 − 2 2p + 2 q∈A
q2 − 2 = p− −2= −2
p+2 p+2
⇒ et
4p2 + 8p + 4 − 2(p2 + 4p + 4) 2(p2 − 2)
= = < 0. p < q.
(p + 2)2 (p + 2)2
Il n’y a donc pas de plus grand élément dans A.

(ii) La démonstration est la même en commençant avec l’ensemble B = {p ∈
Q+ : p2 ≥ 2}.
Il y a cependant des nombres rationnels M ∈ Q (borne supérieure) tel que
∀p ∈ A = {p ∈ Q+ : p2 < 2}, p≤M
et des nombres rationnels m ∈ Q (borne inférieure) tel que
∀p ∈ B = {p ∈ Q+ : p2 > 2}, p ≥ m.
Il suffit de prendre par exemple M = 2 et m = 1. En effet, s’il existait un p ∈ A tel

que p > 2, cela entraı̂nerait p2 > 4 ce qui contredit la condition p2 ≤ 2.
Ces nombres M et m sont respectivement une borne supérieure de A et une
borne inférieure de B. Ceci va nous amener naturellement à parler d’ensembles
bornés supérieurement (resp. inférieurement) et pour ce type d’ensembles de plus pe-
tite borne supérieure (resp. plus grande borne inférieure). Malheureusement, comme
l’indique le Théorème 4.3, ces dernières bornes ne se trouvent pas nécessairement
dans Q.
4.2 ◮ Construction de R : les coupures de Dedekind
Figure 1.1. Richard Dedekind (1831-1916).
Nous allons maintenant décrire rapidement la construction faite en 1872 par

Richard Dedekind 1 qui va nous permettre de remplir les trous dans l’ensemble Q des
rationnels et construire les nombres réels en suivant, par exemple, la présentation
de W. Rudin [1, Annexe, pages 17–20] ou de E. G. H. Landau [1]. Dedekind
reçut son doctorat en 1852 à Göttingen et il fut le dernier élève de Gauss.
1. R. Dedekind [1].
4.2.1 Définition des coupures

L’idée de base est de mettre en correspondance les nombres rationnels avec
des coupures dans Q comme suit :
déf
r ←→ r∗ = {p ∈ Q : p < r}.
∈Q coupure
Pour construire les nombres manquants, on étend la notion de coupure. C’est une
construction purement algébrique.
Définition 4.1.
Un ensemble α de nombres rationnels est appelé une coupure si
i) α contient au moins un rationnel mais pas tous les rationnels, c’est-à-dire,
∅ 6= α $ Q,
ii) si on a p ∈ α et q ∈ Q tel que q < p, alors q ∈ α,
iii) α ne contient pas de plus grand rationnel.
On notera par R l’ensemble de toutes les coupures de Q.
Nous pouvons identifier chaque rationnel r ∈ Q à une coupure particulière.

déf
Théorème 4.4. Soient r ∈ Q et α = {p ∈ Q : p < r}. Alors α est une coupure.
Définition 4.2.
On dira que la coupure {p ∈ Q : p < r} associée à r ∈ Q est une coupure rationnelle
et on la notera r∗ .
Il y a donc un plongement naturel de Q dans R. Mais il y a aussi d’autres

coupures qui correspondent intuitivement à des nombres irrationnels. On vérifiera
aisément que l’ensemble
déf
α = x ∈ Q+ : x2 < 2 ∪ {Q \ Q+ }
√
est une coupure
√ √qui correspondra à la racine carrée 2. De la même façon on
peut définir 3, 5, etc. Ces coupures irrationnelles vont contribuer à boucher des
fissures de Q. Mais l’ensemble des coupures contient aussi des nombres qui ne s’ex-
priment pas à l’aide de radicaux comme π = 3, 14159 . . . et e = 2, 7182818284 . . . .
4.2.2 Relation d’ordre, addition et multiplication

On a la propriété suivante.
Théorème 4.5. Soient α une coupure et p et q dans Q tel que p ∈ α et q ∈

/ α.
Alors p < q.
On peut définir une relation d’ordre pour les coupures.
Définition 4.3.
Soient α et β deux coupures.
i) On écrira α < β (ou β > α) si
∃p ∈ Q tel que p ∈ β et p ∈
/ α.
ii) On écrira α ≤ β si α = β ou α < β.
Définition 4.4.
Soient α et β deux coupures de Q.
i) L’addition est définie comme l’addition des deux ensembles
déf
α + β = {s + t : s ∈ α et t ∈ β} .
ii) L’élément additif neutre

déf
0∗ = {p ∈ Q : p < 0}.
iii) L’inverse additif

déf
−α = {r ∈ Q : ∃s > 0 tel que − r − s ∈
/ α} .
iv) La valeur absolue d’une coupure α est l’ensemble

(
déf α, si α ≥ 0∗
|α| =
−α, si α < 0∗ .
Définition 4.5.
Soient α et β deux coupures de Q.
i) La multiplication de deux coupures α ≥ 0∗ et β ≥ 0∗ est définie comme
déf
α·β = s · t : s ∈ α ∩ Q+ et t ∈ β ∩ Q+ ∪ (Q \ Q+ ).
et celle de deux coupures arbitraires α et β comme


 α · β, si α ≥ 0∗ , β ≥ 0∗ ,


 (−α) · (−β), si α < 0∗ , β < 0∗ ,
déf
α·β =

 − [(−α) · β] si α < 0∗ , β ≥ 0∗ ,


− [α · (−β)], si α ≥ 0∗ , β < 0∗ .
ii) L’ élément multiplicatif neutre

déf
1∗ = {p ∈ Q : p < 1}.
On peut alors démontrer que l’on a conservé toutes les propriétés sur Q.
(
(x + y) + z = x + (y + z)
et (x · y) · z = x · (y · z)
(
(additif) ∃0∗ tel que ∀x ∈ R, 0∗ + x = x
(multiplicatif) ∃1∗ tel que ∀x ∈ R, x · 1∗ = x
 ∗
 (additif) ∀x ∈ R, ∃ − x tel que x + (−x) = 0

P5 (existence d’inverses) (multiplicatif) ∀x ∈ R, x 6= 0∗ , ∃x−1 ∈ R


tel que x · x−1 = 1∗

 a) ∀x, y ∈ R tel que x > 0∗ et y > 0∗ on a


 x + y > 0∗ et x · y > 0∗

 b) ∀x ∈ R une seule propriété est vraie :


x > 0∗ , x = 0∗ , ou 0∗ > x.
On a la propriété suivante.
Théorème 4.6. Si α et β sont deux coupures tel que α ≤ β, alors α ⊂ β.
Démonstration. Si α ≤ β, ou bien α = β et il n’y a rien à démontrer ou bien
∃p ∈ Q tel que p ∈
/ α et p ∈ β.
Dans le second cas, on raisonne par l’absurde. S’il existe p ∈ α tel que p ∈/ β, alors,
par définition de <, on aurait la contradiction β < α par la propriété P6 b).
4.2.3 Propriété P7 de complétude

Mais, comme nous avons beaucoup travaillé, nous obtenons une propriété de
plus qui découle du théorème dit de complétude de Dedekind.
Théorème 4.7 (Théorème de complétude de Dedekind). Soit A et B deux sous-
ensembles de R tel que
a) A ∪ B = R
b) A ∩ B = ∅
c) A 6= ∅ et B 6= ∅
d) si α ∈ A et β ∈ B, alors α < β.
Alors il existe un et un seul γ ∈ R tel que
∀α ∈ A, α ≤ γ et ∀β ∈ B, γ ≤ β.
De ce théorème on tire le corollaire suivant.

Corollaire 1. Sous les hypothèses du Théorème 4.7, ou bien A contient un plus

grand élément ou B contient un plus petit élément.
La dernière étape est d’établir les propriétés de complétude P7 et P7*. On
aura besoin des notions suivantes.
Définition 4.6.
Soit E ⊂ R.
a) On dit que E est borné supérieurement si
∃M ∈ R tel que ∀x ∈ E, x ≤ M.
Un tel nombre M est appelé une borne supérieure de E.

b) On dit que E est borné inférieurement si
∃m ∈ R tel que ∀x ∈ E, m ≤ x.
Un tel nombre m est appelé une borne inférieure de E.

c) Si E est borné supérieurement et inférieurement, on dit que E est borné.
Définition 4.7. a) Soit E ⊂ R un ensemble borné supérieurement. On dit

que b0 ∈ R est est la plus petite borne supérieure de E si
i) b0 est une borne supérieure de E,
ii) pour toute autre borne supérieure M 6= b0 de E, on a b0 < M .
La plus petite borne supérieure b0 de E est unique et sera notée sup E.
b) Soit E ⊂ R un ensemble borné inférieurement. On dit que b0 ∈ R est est
la plus grande borne inférieure de E si
i) b0 est une borne inférieure de E,
ii) pour toute autre borne inférieure m 6= b0 de E, on a b0 > m.
La plus grande borne inférieure b0 de E est unique et sera notée inf E.
On peut maintenant donner la dernière propriété de R.

Théorème 4.8 (Propriété P7 de complétude). Tout sous-ensemble E, ∅ 6= E ⊂ R,
borné supérieurement possède une plus petite borne supérieure sup E ∈ R
On a évidemment la propriété duale suivante.
Théorème 4.9 (Propriété P7* de complétude). Tout sous-ensemble E, ∅ 6= E ⊂
R, borné inférieurement possède une plus grande borne inférieure inf E ∈ R.
Démonstration de P7. On fait appel au Théorème de complétude de Dedekind 4.7
en construisant les ensembles A et B à partir de E de la façon suivante :
déf déf
A = {α ∈ R : ∃x ∈ E tel que α < x} et B = R \A.
Par définition, aucun élément de A n’est une borne supérieure de E et tous les
éléments de B sont des bornes supérieures de E. Pour montrer que sup E ∈ R, il
suffit de montrer que B possède un plus petit élément.
On voit que les hypothèses a) et b) du Théorème de complétude de Dedekind
sont vérifiées. Il reste à vérifier
c) A 6= ∅ et B 6= ∅
d) si α ∈ A et β ∈ B, alors α < β.
Comme E 6= ∅, prenons x ∈ E. Alors A 6= ∅ car il contient tous les α ∈ R tel que
α < x. D’autre part, puisque E est borné supérieurement, il existe y ∈ R tel que
x ≤ y pour tout x ∈ E. Par définition, y ∈ B, B 6= ∅, et c) est vérifiée.
Enfin, si α ∈ A, il existe x0 ∈ E tel que α < x0 . Si β ∈ B, il n’existe pas de
x ∈ E tel que β < x. Donc pour tout x ∈ E, on a β ≥ x. Finalement, α < x0 ≤ β,
α < β, et d) est vérifiée. Les hypothèses a), b), c), et d) sont donc vérifiées.
Par le Théorème de complétude de Dedekind, il existe un et un seul γ ∈ R tel
que
∀α ∈ A, α ≤ γ et ∀β ∈ B, γ ≤ β.
De là, γ est une borne supérieure de A, et, ou bien γ ∈ A ou bien γ ∈ B. Par
définition, aucun élément de A n’est une borne supérieure de E et tous les éléments
de B sont des bornes supérieures de E.
On montre enfin que γ ∈ / A ce qui entraı̂ne que γ ∈ B est la plus petite borne
supérieure de E. Si γ ∈ A, alors il existerait x ∈ E tel que γ < x. On pourrait alors
choisir α ∈ R tel que γ < α < x. Comme α < x, on aurait par définition α ∈ A et
γ ne serait pas une borne supérieure de A. Donc γ ∈ B.
Démonstration de P7*. Par hypothèse, il existe une borne b ∈ R tel que pour tout
x ∈ E, on a b ≤ x. Donc pour tout x ∈ E, on a −x ≤ −b et −b est une borne
déf
supérieure de l’ensemble −E = {−x : x ∈ E}. Par la propriété P7 de complétude,
il existe une plus petite borne supérieure
b0 = sup −E ∈ R
de −E et b0 ≤ −b. On a donc
∀x ∈ E, −x ≤ b0 ⇒ ∀x ∈ E, −b0 ≤ x
et −b0 est une borne inférieure de E. Mais on a montré que pour toute borne
inférieure b de E, on a b0 ≤ −b ou de façon équivalente b ≤ −b0 . Donc −b0 est la
plus grande borne inférieure de E et inf E = −b0 ∈ R.
4.2.4 Réels étendus R

On peut introduire les points ±∞ en éliminant la condition i),
∅ 6= α $ Q,
de la Définition 4.1 de coupure. Ce faisant on introduit deux nouvelles coupures.

Définition 4.8.
Un ensemble α ⊂ Q de nombres rationnels est appelé une coupure étendue si
ii) si on a p ∈ α et q ∈ Q tel que q < p, alors q ∈ α,
iii) α ne contient pas de plus grand rationnel.
On notera par R l’ensemble de toutes les coupures étendues de Q.
Avec cette nouvelle définition Q et ∅ sont des coupures étendues que l’on notera
déf déf
−∞ = ∅ et + ∞ = Q.
Pour toute autre coupure étendue α, on a ∅ 6= α $ Q et l’on retombe sur la notion

de coupure de la Définition 4.1. On obtient donc
R = R ∪{±∞}
et, de la Définition 4.3 d’ordre, on a, pour tout α tel que ∅ 6= α $ Q,
−∞ = ∅ < α < Q = +∞.
4.3 Bornitudes, infimum et supremum

Maintenant que la construction de l’ensemble des réels a été esquissée, on
revient à sa forme plus intuitive comme par exemple celle d’une droite orientée sur
laquelle on a fixé une origine 0.
On répète donc les définitions de bornitude, d’infimum et de supremum du
paragraphe précédents dans ce contexte.
Définition 4.9 (Définition 4.6).

Soit E ⊂ R.
a) On dit que E est borné supérieurement si
∃M ∈ R tel que ∀x ∈ E, x ≤ M.
Un tel nombre M est appelé une borne supérieure de E.

b) On dit que E est borné inférieurement si
∃m ∈ R tel que ∀x ∈ E, m ≤ x.
Un tel nombre m est appelé une borne inférieure de E.

c) Si E est borné supérieurement et borné inférieurement, on dit que E est
borné.
déf
Exemple 4.1. 1) Soit E = {1, 2, 3}. Alors 0 est une borne inférieure de E et
π une borne supérieure. E est borné.
déf
2) Soit E = {1/n : n ∈ N}. Alors 0 est une borne inférieure de E et 1 une
borne supérieure. E est borné.
déf
3) Soit E = {p : p > 0}. Alors 0 est une borne inférieure de E et E n’est pas
borné supérieurement.
déf
4) Soit E = {p : p2 < 2}. Alors −2 est une borne inférieure de E et 3/2 une
borne supérieure.
Définition 4.10 (Définition 3.5).
a) Soit E ⊂ R un ensemble borné supérieurement. On dit que b0 ∈ R est est

la plus petite borne supérieure de E si
ii) pour toute autre borne supérieure M 6= b0 de E, on a b0 < M .
La plus petite borne supérieure b0 de E est unique et sera notée sup E.
b) Soit E ⊂ R un ensemble borné inférieurement. On dit que b0 ∈ R est est
la plus grande borne inférieure de E si
ii) pour toute autre borne inférieure m 6= b0 de E, on a b0 > m.
La plus grande borne inférieure b0 de E est unique et sera notée inf E.
c) Lorsque E 6= ∅ n’est pas borné supérieurement, on posera sup E = +∞.
Lorsque E 6= ∅ n’est pas borné inférieurement, on posera inf E = −∞.
Remarque 4.1.
Si E 6= ∅, alors −∞ ≤ inf E ≤ sup E ≤ +∞. Si E = ∅, alors par convention on
posera inf ∅ = +∞ et sup ∅ = −∞.
Théorème 4.10 (Propriétés de complétude). Soit E, ∅ 6= E ⊂ R.

(i) Propriétés P7. E borné supérieurement ⇒ sup E ∈ R
(i) Propriétés P7*. E borné inférieurement ⇒ inf E ∈ R
Exemple 4.2.
déf
Soit E = {1, 2, 3}. Alors inf E = 1 ∈ E et sup E = 3 ∈ E.
Lorsque E est un ensemble fini, inf E ∈ E et sup E ∈ E. Lorsque E n’est pas

un ensemble fini et que par exemple inf E ∈/ E, il peut être intéressant de construite
une suite d’éléments de E qui converge vers inf E. Dans ce cas, on peut utiliser les
conditions équivalentes suivantes.
Théorème 4.11. Soit E ⊂ R.
a) b0 est la plus petite borne supérieure de E si et seulement si
ii’) pour tout M tel que b0 > M , il existe x0 ∈ E tel que b0 ≥ x0 > M .
b) b0 est la plus grande borne inférieure de E si et seulement si
ii’) pour tout m tel que b0 < m, il existe x0 ∈ E tel que b0 ≤ x0 < m.
Exemple 4.3.
Par exemple si b0 = sup E est finie et b0 ∈
/ E, on construit pour chaque n ∈ N, xn ∈
E tel que b0 ≥ xn > b0 −1/n. Cette suite comporte un nombre infini d’éléments.
Démonstration du Théorème 4.11. On démontre seulement a). Le cas b) est sem-

blable. Il est aussi suffisant de démontrer l’équivalence des conditions ii) et ii’)
puisque la condition i) est commune.
ii) ⇒ ii’) De i), on sait que b0 est une borne supérieure de E. Pour M tel que
0
b > M , on sait de ii) que M n’est pas une borne supérieure de E car dans ce cas
on aurait b0 ≤ M . Il existe donc x0 ∈ E tel que x0 > M . Comme b0 est une borne
supérieure de E, par i), on a aussi b0 ≥ x0 et finalement b0 ≥ x0 > M .
ii) ⇐ ii’) De i), on sait que b0 est une borne supérieure de E. Supposons que
M soit une borne supérieure de E tel que b0 > M . Alors de ii’), il existe x0 ∈ E
tel que b0 ≥ x0 > M . Ceci contredit le fait que M est une borne supérieure de E.
Donc b0 ≤ M .
Exemple 4.4 (Exemple 1.30 page 19).

déf
Calculer le b0 = sup E de
déf
E = x ∈ R : x2 < 4 .
Comme 0 ∈ E, l’ensemble E est non-vide.

déf
b0 = sup E est possiblement +∞ si E n’est pas borné supérieurement.
Si b0 > 2 , alors
∃x ∈ E tel que b0 ≥ x > 2 ⇒ x2 > 4 ⇒ x∈

/ E (d’où contradiction).
Il reste donc les cas b0 ≤ 2. Comme 0 ∈ E, b0 ≥ 0 et donc 0 ≤ b0 ≤ 2.

Si b0 < 2, on pose
déf b0 + 2
x = ⇒ 0 ≤ b0 < |x < 2 ⇒ x2 < 4}
{z ⇒ x∈E
2
puisque x≥0
ce qui contredit le fait que b0 = sup E.

Il ne reste donc plus que le cas b0 = 2. On en conclut que sup E = 2.
4.4 Densité des rationnels et des irrationnels dans R

On a déjà démontré le Théorème 4.1 qui dit qu’entre deux rationnels on
peut toujours trouver un rationnel différent des deux premiers. On va donner deux
résultats analogues pour les réels.
Théorème 4.12. Soient a et b dans R tel que a < b.
i) (densité des nombres rationnels)
Il existe r ∈ Q tel que a < r < b.
ii) (densité des nombres irrationnels)

Il existe s ∈ R \ Q tel que a < s < b.
Corollaire 1. Soient a et b dans R tel que a < b.

i) Il existe une infinité de nombres rationnels entre a et b.
ii) Il existe une infinité de nombres irrationnels entre a et b.
Démonstration du Théorème 4.12. i) Puisque b − a > 0 et que R est archimédien,

il existe n ∈ N tel que n (b − a) > 1, d’où b > a + 1/n. Comme na ∈ R, il existe
m ∈ Z tel que m − 1 ≤ na < m, d’où na < m ≤ na + 1. En divisant par n, il vient
m 1
a< ≤ a + < b.
n n
On prend r = m/n ∈ Q. √ √
ii) √ √ on a a − 2 < b − 2 et√de la partie i) il existe r ∈√Q tel
Puisque a < b,
que a − 2 < r < b − 2 ce qui entraı̂ne a < r + 2 < b. On prend s = r + 2 qui
est bien un irrationnel.
Démonstration du Corollaire 1. i) On sait qu’il en existe au moins un. Supposons

qu’il en existe un nombre fini n ≥ 1, c’est-à-dire {ri }ni=1 ⊂ Q tel que a < r1 < r2 <
· · · < rn < b. On applique alors le Théorème 4.12 (i) au couple a < r1 . Il existe
r0 ∈ Q tel que a < r0 < r1 . On a donc construit un autre rationnel entre a et b ce
qui contredit notre hypothèse.
ii) Même procédé pour les irrationnels.
4.5 Valeur absolue

On sait maintenant comment additionner, multiplier, et comparer les nombres
réels. Il nous manque une moyen de mesurer l’écart ou la distance entre deux
nombres.
Définition 4.11.
La valeur absolue de x ∈ R que l’on désigne par |x| est définie par
(
déf x, si x ≥ 0
|x| =
−x, si x < 0.
On a immédiatement les résultats suivants.
Lemme 4.1. Pour tout x ∈ R,

(i) | − x| = |x|,
(ii) −|x| ≤ x ≤ |x|.
(iii) Pour tout b ≥ 0, |x| ≤ b ⇐⇒ −b ≤ x ≤ b.
Démonstration. (i) Par définition.

(ii) Si x ≥ 0, |x| = x ≥ 0 et −|x| ≤ 0 ≤ x = |x| ≤ |x|. Si x < 0, alors −x > 0 et
donc
−| − x| ≤ −x ≤ | − x|.
Mais de (i) | − x| = |x| entraı̂ne
−|x| ≤ −x ≤ |x| ⇒ −|x| ≤ x ≤ |x|.
(iii) Si x ≥ 0, alors −b ≤ 0 ≤ x = |x| ≤ b. Si x < 0, alors −b ≤ 0 ≤ −x = |x| ≤ b ce

qui entraı̂ne
−b ≤ −x ≤ b ⇒ −b ≤ x ≤ b.
On a les propriétés fondamentales suivantes. On verra plus loin qu’elles ca-

ractérisent une norme.
Théorème 4.13. Pour tout x et y dans R :

(i) |x| ≥ 0 ;
(ii) |x| = 0 ⇐⇒ x = 0 ;
(iii) |xy| = |x||y| ;
(iv) (inégalité du triangle) |x + y| ≤ |x| + |y|.
Démonstration. (i) Par définition, si x ≥ 0, |x| = x ≥ 0. Si x < 0, |x| = −x > 0 ≥ 0.

(ii) (⇐) Comme de (i) 0 = |0| ≥ 0, on a |0| = 0. (⇒) On démontre l’implication
inverse par contradiction : x 6= 0 ⇒ |x| > 0. Comme x 6= 0, alors ou bien x > 0 ou
bien x < 0. Dans le premier cas, |x| = x > 0 ; dans le second cas, |x| = −x > 0.
Donc, pour tout x 6= 0, on a |x| 6= 0.
(iii) Il y a quatre cas.
1. (x ≥ 0 et y ≥ 0) Alors |x| = x, |y| = y et xy = |x||y| ≥ 0. Donc, par
défintion de la valeur absolue, |xy| = xy et |xy| = |x||y|
2. (x ≥ 0 et y < 0) Alors |x| = x, |y| = −y et −xy = −yx = (−y)x = x(−y) =
|x||y| ≥ 0 par la propriété P1 (multiplication). Donc, par définition de la
valeur absolue, |xy| = −xy = |x||y|.
3. (x < 0 et y ≥ 0) On interchange les rôles de x et y du cas 2.
4. (x ≤ 0 et y ≤ 0) On prend l’opposé des rôles de x et y du cas 1.

(iv) On a de (iii) du Lemme, −|x| ≤ x ≤ |x| et −|y| ≤ y ≤ |y|. En additionnant,
−|x| − |y| = −(|x| + |y|) ≤ x + y≤ |x| + |y|. Le résultat suit du Lemme (iii) : |x +
y| ≤ ||x| + |y|| = |x| + |y|.
4.6 Représentation décimale des nombres réels

Il est pratique d’exprimer les nombres et plus particulièrement les rationnels
sous une forme compacte. On le fait en introduisant une base. La plus commune est
la base 10. Par l’intermédiaire de la division on a par exemple
5
= 2.5 = 2.5 0000 . . .
2
1 1 4 2 8 5 7
= 0.142857 142857 · · · = 0 + 1 + 2 + 3 + 4 + 5 + 5 + . . .
7 10 10 10 10 10 10
142857 142857
= + + ...
106 1012

4 3 3 3
− = −1.333 · · · = −1 − + + + . . .
3 101 102 103
Ce sont trois exemples de nombres rationnels. On remarquera qu’à partir d’un
certain rang il y a périodicité des décimales. Ce n’est
√ cependant pas toujours le
cas. Considérons par exemple le nombre irrationnel 2 dont on peut construire les
décimales par encadrements successifs. En effet
√
12 < 2 < 22 = 4 ⇒ 1 < 2 < 2.
En subdivisant l’intervalle [1, 2] en 10 parties de longueur 1/10, on trouve que

√
1.4 < 2 < 1.5
√
Considérons par exemple le nombre irrationnel 2 dont on peut construire les
décimales par encadrements successifs. En effet
√
12 < 2 < 22 = 4 ⇒ 1 < 2 < 2.
En subdivisant l’intervalle [1, 2] en 10 parties de longueur 1/10, on trouve que

√
(1.4)2 = 1.96 < 2 < 2.25 = (1.5)2 ⇒ 1.4 < 2 < 1.5
En subdivisant l’intervalle [1.4, 1.5] en 10 parties de longueur 1/100, on trouve que

√
(1.41)2 = 1.9881 < 2 < 2.0164 = (1.42)2 ⇒ 1.41 < 2 < 1.42
En continuant le procédé on trouve, par exemple, que

√
1.414 213 562 4 < 2 < 1.414 213 562 5
√
On dit que 1.414 213 562 4 . . . est un développement décimal de 2. Par ce procédé,
on n’entrevoit pas de périodicité, mais cela ne démontre rien.
Un autre phénomène observable est que certains nombres ont deux développements
décimaux distincts comme le montre l’exemple suivant
217 1 7
=2+ + = 2.17 = 2.17 000000 . . ..
100 10 100
Considérons maintenant le développement périodique x = 2.169 999 . . . . Alors
100x = 216.999 . . . et 1000x = 2169.999 . . . ⇒ 900x = 2169 − 216 = 1953
En simplifiant par 9 on obtient x = 1953/900 = 217/100. Il y a donc deux dévelop-

pements décimaux pour le même rationnel. Lorsqu’il y a périodicité des décimales
à partir d’un certain rang on écrira les décimales qui se répètent surmontés d’un
barre comme suit
1
7 | {z } 142857
= 0. 142857 | {z } · · · = 0.142857
4 217
− = −1.333 · · · = −1.3 = 2.17 = 2.169
3 100
En particulier, x = 0.999 . . ., 10x = 9.999 . . ., 9x = 9 . . ., et
1 = 0.999 999 · · · = 0.9.
possède deux représentations décimales.

Théorème 4.14. Soient deux nombres réels x et y dans R de développements
décimaux
x = 0, a1 a2 a3 . . .
y = 0, b1 b2 b3 . . .
Si on suppose que
1) ∃ n tel que an 6= bn et
2) ni l’un ni l’autre ne se termine par une suite infinie de 9
alors x 6= y en tant que nombres réels.

Corollaire 1. Si un nombre réel possède deux développements décimaux distincts,
alors l’un deux se termine par des 9 et l’autre est fini.
Démonstration du Théorème. On peut supposer sans perte de généralité que an >
bn . Donc
a1 = b1 , a2 = b2 , . . . , an−1 = bn−1 , an > bn .
On multiplie chaque nombre par 10n−1 et on enlève sa partie entière. Comme an >
bn , on a an ≥ bn + 1 et Il vient
0, an an+1 an+2 . . . ≥ 0, an 00 · · · ≥ 0, bn 00 · · · + 0, 100 . . .

≥ 0, an 00 · · · ≥ 0, bn 00 · · · + 0, 099 . . . = 0, bn 99 . . .
> 0, bn bn+1 bn+2 . . .
⇒ 0, an an+1 an+2 · · · > 0, bn bn+1 bn+2 . . .
d’où x > y.
Corollaire 2. Si un nombre réel possède deux développements décimaux distincts,

alors l’un deux se termine par des 9 et l’autre est fini.
Démonstration du Corollaire. Il suffit de considérer un nombre réel 0 ≤ x ≤ 1. Par
le Théorème l’un des deux développements se termine par une suite infinie de 9,
c’est-à-dire
x = 0, a1 . . . am 999 . . .
= 0, a1 . . . am 000 · · · + 0, 0 . . . 0999 . . .
= 0, a1 . . . am 000 · · · + 0, 0 . . . 1000 . . .
= 0, a1 . . . (am + 1)000 . . .
et le développement est fini.
Définition 4.12.
Un développement décimal de la forme
n0 , a1 a2 . . . an b 1 b 2 . . . b m b 1 b 2 . . . b m . . .
| {z } | {z } | {z }
n≥0 m≥1 m≥1
où la partie b1 b2 . . . bm se répète à l’infini est dit périodique :

1. périodique pur si n = 0
2. périodique mixte (ou éventuellement périodique) si n ≥ 1.
Exemple 4.5.
Le rationnel 1/7 est périodique pur avec n = 0 et
1
= 0, 142857 | {z } . . . = 0, 142857
| {z } 142857
7
m=6 m=6
Le rationnel 33/100 possède deux développements :

33
= 0, |{z}
33 |{z}
0 |{z}
0 . . . = 0.330
100
n=2 m=1 m=1
33
= 0, |{z} 9 |{z}
32 |{z} 9 . . . = 0.329
100
n=2 m=1 m=1
Théorème 4.15. x ∈ R admet un développement décimal périodique ⇐⇒ x ∈ Q.

Démonstration. Il suffit de considérer les x > 0.
(⇒) Soit un nombre réel x ∈ R avec le développement décimal périodique
suivant
x = n0 , a1 a2 . . . an b 1 b 2 . . . b m b 1 b 2 . . . b m . . .
| {z } | {z } | {z }
n≥0 m≥1 m≥1
On a
10n x = n0 a1 a2 . . . an , b 1 b 2 . . . b m b 1 b 2 . . . b m . . .
| {z } | {z } | {z }
n≥0 m≥1 m≥1
n+m
10 x = n0 a1 a2 . . . an b 1 b 2 . . . b m , b 1 b 2 . . . b m b 1 b 2 . . . b m . . .
| {z } | {z } | {z } | {z }
n≥0 m≥1 m≥1 m≥1
D’où
déf
(10n+m − 10n )x = N0 = n0 a1 a2 . . . an b1 b2 . . . bm − n0 a1 a2 . . . an ∈ N ∪{0}
N0
⇒ x= n m ∈ Q.
10 (10 − 1)
Démonstration. (suite) (⇐) On considère un nombre x ∈ Q, x > 0 de forme réduite

p/q, q > 0 et p > 0, et de développement décimal
p
x= = n0 , k1 k2 k3 . . .
q
S’il existe i0 tel que pour tout i ≥ i0 , ki = 9, alors le développement décimal de x
est périodique par définition. Sinon, on procède comme suit :
p
0≤ − n0 = 0, k1 k2 k3 . . . < 1.
q
En multipliant par q > 0, on ne change pas les inégalités et on obtient un entier
0 ≤ p − n0 q = q · {0, k1 k2 k3 . . .} < q.
| {z }
∈N ∪{0}
On recommence en multipliant par 10.

p p
0 ≤ 10 − n0 = k1 , k2 k3 k4 . . . ⇒ 0 ≤ 10 − n0 − k1 = 0, k2 k3 k4 · · · < 1
q q
En multipliant par q > 0, on ne change pas les inégalités et on obtient un nouvel
entier en regroupant les parties entières
0 ≤ 10(p − n0 q) − qk1 = q · {0, k2 k3 k4 . . .} < q

| {z }
∈N ∪{0}
On poursuit ainsi en multipliant successivement par 102 , 103 , etc. On obtient ainsi
(par exemple, par induction mathématique) :
∀i ≥ 1, 0 ≤ q · {0, ki ki+1 ki+2 . . .} < q

⇒ ∀i ≥ 1, q · {0, ki ki+1 ki+2 . . .} ∈ {0, 1, . . . , q − 1}.
Comme {0, 1, . . . , q − 1} est fini, Il existe un couple (i, j), 1 ≤ i < j, tel que
q · {0, ki ki+1 ki+2 . . .} = q · {0, kj kj+1 kj+2 . . .}

Il existe un couple (i, j), 1 ≤ i < j, tel que
q · {0, ki ki+1 ki+2 . . .} = q · {0, kj kj+1 kj+2 . . .}

⇒ ∀ℓ ≥ 0, ki+ℓ = kj+ℓ = ki+ℓ+(j−i) ,
⇒ ∀ℓ ≥ 0, ki+ℓ = ki+ℓ+(j−i) = kj+ℓ+(j−i) = ki+ℓ+2(j−i) ,
⇒ ∀N ≥ 0, ∀ℓ ≥ 0, ki+ℓ+N (j−i) = ki+ℓ
⇒ ∀N ≥ 0, ∀ℓ, 0 ≤ ℓ < j − i, ki+ℓ+N (j−i) = ki+ℓ .
Le développement est donc éventuellement périodique de période j − i de la forme

p
x= = n0 , k1 k2 . . . ki−1 ki ki+1 . . . ki+(j−i)−1 kj kj+1 . . . kj+(j−i)−1 . . .
q | {z }| {z }| {z }
n=i−1 m=j−i≥1 m=j−i≥1
puisque
kj = ki , kj+1 = ki+1 , . . . , kj+(j−i)−1 = ki+(j−i)−1 = kj−1 .
5 Exercices
Exercice 5.1 (W. Rudin [1, exercice 1, p. 21]).
Montrer que si r ∈ Q et s ∈ R \ Q, alors r + s ∈ R \ Q et rs ∈ R \ Q ∪{0}.

Soit A, ∅ 6= A ⊂ R et
déf
−A = {−a : a ∈ A} .
Montrer que inf A = − sup(−A).

Chapitre 2
Quelques notions
ensemblistes et
algébriques
1 Relation, application et fonction

1.1 Application et fonction
La définition usuelle en mathématiques d’une fonction est ensembliste et pré-
suppose essentiellement celle de couple et de produit cartésien.
Définition 1.1. (i) Une relation ou graphe fonctionnel est un triplet (E, F, Y )
tel que
F ⊂ E × Y.
Le domaine 1 de F est
déf
X = {x ∈ E : ∃y ∈ Y tel que (x, y) ∈ F }
et l’image de x ∈ X
déf
Im (x) = {y ∈ Y : tel que (x, y) ∈ F }.
(ii) On associe à chaque x ∈ X le sous-ensemble unique Im (x) de Y
déf
x 7→ f (x) = Im (x) : X → P(Y ),
où P(Y ) dénote l’ensemble des sous-ensembles de Y . On appellera f l’ap-
plication multivoque 2 associée au triplet (E, F, Y ) parce qu’elle fait corres-
pondre à chaque point du domaine X plusieurs points de Y .
1. La notation usuelle est DF plutôt que X.
2. Set-valued analysis ou multivalued analysis en anglais. La pratique de permette à une
fonction en mathématiques de signifier aussi une fonction multivoque a été oubliée dans la
première moitié du XXe s‘ecle. On peut en apprécier l’évolution dans les différentes versions de
G. H. Hardy [1] commençant en 1921. Cette théorie fut systématiquement développée pour la
première fois C. Berge [1] en 1959. On en palpe les retombées avec les équations différentielles
multivoques et la théorie de la viabilité dans J. P. Aubin et A. Cellina [1] en 1984. Cette analyse
devient aussi centrale en théorie de l’optimisation avec l’introduction de la notion de sous-gradient
en analyse convexe. On peut trouver un traitement fort complet de l’analyse multivoque dans
J. P. Aubin et H. Frankowska [1].
23
24 Chapitre 2. Quelques notions ensemblistes et algébriques
(iii) On définit l’image d’un sous-ensemble A de X par

déf
f (A) = {y ∈ Y : ∃x ∈ A tel que (x, y) ∈ F } . (1.1)
L’association à chaque A ⊂ X de l’image f (A) de A
A 7→ f (A) : P(X) → P(Y ), (1.2)
où P(X) dénote l’ensemble des sous-ensembles de X, est appelée applica-

tion induite que l’on désignera par la même notation f . On définit aussi
l’application inverse induite :
déf
B 7→ f −1 (B) = {x ∈ X : ∃y ∈ B tel que (x, y) ∈ F } : P(Y ) → P(X).
(1.3)
(iv) Lorsque pour chaque x ∈ X, Im (x) est un singleton, on associe à chaque

x ∈ X le seul point {f (x)} = Im (x) ∈ Y :
x 7→ f (x) : X → Y. (1.4)
On dira que f est une application ou fonction de X dans Y .
Une application ou fonction f est donc

(i) la donnée de deux ensembles,
• l’ensemble de départ X et
• l’ensemble d’arrivée Y ,
(ii) et d’une relation associant à chaque élément x de l’ensemble de départ X
un et un seul élément de l’ensemble d’arrivée Y , que l’on appelle image de
x par f et que l’on note f (x)
x 7→ f (x).
∈X ∈Y
On dit alors que f est une application de X dans Y
(notée f : X → Y ),
ou encore une application à arguments dans X et à valeurs dans Y .
Définition 1.2. (i) L’image d’une application f : X → Y est la collection des

f (x) pour x parcourant X ; c’est le sous-ensemble de Y :
déf
Im (f ) = {f (x) : x ∈ X} ⊂ Y.
(ii) Le graphe d’une application f : X → Y est le sous-ensemble du produit

cartésien X × Y constitué des couples (x, f (x)) pour x variant dans X
déf
G(f ) = {(x, f (x)) : x ∈ X} ⊂ X × Y.
1. Relation, application et fonction 25
Définition 1.3.
Soit f : X → Y une application.
(i) f est injective si
∀x1 , x2 ∈ X tel que f (x1 ) = f (x2 ), on a x1 = x2 .
(ii) f est surjective si
∀y ∈ Y, ∃x ∈ X tel que f (x) = y.
(iii) f est bijective si f est à la fois injective et surjective.

Lorsque f est bijective l’application inverse ou réciproque
f −1 : Y → X
est bien définie.
Le terme fonction est souvent utilisé pour les applications à valeurs numériques,
réelles ou complexes, c’est-à-dire lorsque l’ensemble d’arrivée est R ou C. On parle
alors de fonction réelle ou de fonction complexe.
La notion de fonction en tant que correspondance entre deux types d’objet
est relativement ancienne. Mais le terme n’apparait qu’à la fin du XVIIe siècle
sous la plume de Leibniz en 1694, il s’agit alors de fonction associée à une courbe
géométrique : Leibniz dit ainsi que l’abscisse, l’ordonnée ou le rayon de courbure
d’une courbe en un point M est une fonction du point M .
À la même époque, Newton parle de fluente pour des quantités dépendant
d’une variable qu’il appelle le temps (tout en précisant que le rôle joué par le temps,
peut l’être par une autre quantité).
La notation sous la forme f ne s’est pas mise en place tout de suite. Jean Ber-
noulli propose d’appeler X la fonction de x, Leibniz invente une notation permettant
de travailler sur plusieurs fonctions différentes : x|1 et x|2 sont ainsi deux fonctions
dépendant de x. La notation f x apparait chez Euler en 1734. Les fonctions sont
alors toujours à valeurs numériques (réelles ou complexes) et possèdent en outre
des propriétés restrictives (liées à une équation algébrique, continuité eulérienne,
développable en série entière...).
En pratique, la communauté mathématique dans son ensemble continue à uti-
liser ces deux termes dans leur sens historique, le terme fonction étant utilisé comme
synonyme du terme application dans le cas particulier où l’ensemble d’arrivée est
R ou C (l’ensemble de départ étant systématiquement pris égal au domaine de
définition).
1.2 Relation binaire et relation d’équivalence

Une relation binaire R dans un ensemble A est, intuitivement, une proposition
tel que pour chaque couple ordonné (a, b) d’éléments de A, on puisse déterminer si
a R b (a est en relation R avec b) est ou n’est pas vrai. On exprime ceci formellement
en langage ensembliste.
Définition 1.4. (i) Une relation binaire R dans un ensemble A est un sous-
ensemble R de A × A. La notation a R b signifiera que (a, b) ∈ R.
(ii) Une relation binaire R dans A est appelée une relation d’équivalence si :
(1) (réflexivité) ∀a ∈ A, a R a ;
(2) (symétrie) aRb ⇒ bRa;
(3) (transitivité) a R b et b R c ⇒ a R c.
Pour une relation d’équivalence R on dira que a et b sont équivalents si
a R b.
(iii) Soit R une relation d’équivalence dans A. Le sous-ensemble
déf
Ra = {b ∈ A : b R a} (1.5)
est appelé R-classe d’équivalence de a.

(iv) Soit R une relation d’équivalence dans A. L’ensemble {Ra : a ∈ A} dont
les éléments sont les R-classes d’équivalence est appelé espace quotient de
A par R et sera noté A/R. L’application
déf
a 7→ pA (a) = Ra : A → A/R (1.6)
est appelée projection de A sur A/R.
Exemple 1.1.
Les relations binaires suivantes sont des relations d’équivalence :
- ≪ est égal à≫ pour les nombres réels ;
- ≪ a la même date de naissance que≫ sur l’ensemble des humains ;
- ≪ est semblable à≫ sur l’ensemble des triangles ;
- ≪ x = y mod n ≫ sur les nombres entiers ;
- ≪ a la même valeur absolue que ≫ pour les nombres réels ;
- ≪ a le même cosinus que ≫ pour l’ensemble des angles.
Lemme 1.1. Soit R une relation d’équivalence dans A.

(i) ∪a∈A Ra = A.
(ii) Si a R b, alors Ra = Rb.
(iii) Si a R b n’est pas vraie, alors Ra ∩ Rb = ∅.
Démonstration. (i) Comme R est réflexive, pour tout a ∈ A on a a ∈ Ra, et donc

A = ∪a∈A {a} ⊂ ∪a∈A Ra ⊂ A.
(ii) Soit x ∈ Ra. En utilisant la transitivité de R,
x R a et a R b ⇒ x R b
2. Cardinal et dénombrabilité 27
ce qui montre que Ra ⊂ Rb. Dans l’autre sens, comme R est symétrique, b R a
et, par le même raisonnement x R b ⇒ x R a par transitivité, ce qui démontre que
Rb ⊂ Ra.
(iii) On suppose que Ra ∩ Rb 6= ∅. En choisissant ξ ∈ Ra ∩ Rb, il vient
ξ R a et ξ R b. Donc par symétrie et transitivité a R b en contradiction avec notre
hypothèse.
Théorème 1.1. Soit R une relation d’équivalence dans A. La collection des classes
d’équivalence distinctes de A partitionne A en sous-ensembles mutuellement dis-
joints, appelés classes de R-équivalence, tel que pour toute paire a, b ∈ A
∃α tel que a ∈ Aα et b ∈ Aα ⇐⇒ a R b.
Démonstration. Soit {Aα : α ∈ A} la collection des classes de R-équivalence. Pour

chaque Aα il existe a ∈ A tel que Aα = Ra et par Lemme 1.1 (i) ∪a∈A Ra = A.
Si Ra ∩ Rb 6= ∅, il existe c ∈ A tel que c R a et c R b soient vraies. Par symétrie
a R c est vraie et par transitivité a R b est vraie. Par le Lemme 1.1 (ii), Ra = Rb.
Enfin, par le Lemme 1.1 (ii) : si a R b, alors Ra = Rb. Réciproquement, si a ∈ Aα
et b ∈ Aα , alors il existe c ∈ A tel que Aα = Rc et donc a R c et b R c sont vraies ce
qui entraı̂ne a R b vraie par symétrie et transitivité.
2 Cardinal et dénombrabilité
2.1 Définitions et exemples
En mathématiques, les nombres cardinaux, sont une généralisation des entiers
naturels N, utilisés pour mesurer la cardinalité (taille) des ensembles. La cardinalité
d’un ensemble fini est un entier naturel, le nombre d’éléments dans l’ensemble. Les
nombres cardinaux transfinis décrivent les tailles des ensembles infinis. La cardi-
nalité est définie en terme de bijections. Deux ensembles ont le même cardinal s’il
existe une bijection entre eux. Dans le cas des ensembles finis, ceci coı̈ncide avec
la notion intuitive de taille. Dans le cas des ensembles infinis, le comportement est
plus complexe.
Figure 2.1. Georg Cantor (1845–1918).

La notion de cardinalité, comme on la comprend de nos jours, fut formulée

par Georg Cantor, qui est à l’origine de la théorie des ensembles, entre 1874 et
1884. Cantor a été confronté à la résistance de la part des mathématiciens de son
époque, en particulier Kronecker. Poincaré, bien qu’il connût et appréciât les travaux
de Cantor, avait de profondes réserves sur son maniement de l’infini en tant que
totalité achevée.
Si l’on considère des ensembles finis de nombres comme
{1, 2, 3, 4} et {10, 20, 25, 60}
on voit facilement qu’ils contiennent chacun le même nombre d’éléments.

Si on considère maintenant les ensembles N, Z, Q, ou R, ils contiennent tous
un nombre infini d’éléments bien que les inclusions sucessives N ⊂ Z ⊂ Q ⊂ R
soient strictes. Y-a-t-il plus de nombres dans le dernier que dans le premier ?
Définition 2.1. (i) On dira que deux ensembles A et B ont le même cardinal 3
ou sont équipotents s’il existe une bijection entre A et B.
(ii) A est fini s’il est vide ou s’il existe n ∈ N tel que A soit équipotent à
{1, 2, . . . , n}. Sinon, on dira que A est infini.
(iii) A est dénombrable s’il a le même cardinal que N.
(iv) A est au plus dénombrable s’il est fini ou dénombrable.
(v) A est non-dénombrable s’il n’est ni fini ni dénombrable.
Si A et B sont finis, cela revient à dire qu’ils ont le même nombre d’éléments.
L’avantage c’est que maintenant on va pouvoir aussi comparer des ensembles infinis.
Exemple 2.1.
(i) N et 2 N (nombres pairs) ont le même cardinal. Il suffit de choisir la bijection
déf
x 7→ f (x) = 2x : N → 2 N, x 7→ f −1 (x) = x/2 : 2 N → N .
(ii) N et Z ont le même cardinal et donc Z est dénombrable. On choisit la

bijection x

 , si est pair
déf 2
f : N → Z, x 7→ f (x) =
1−x
 , si x est impair
2
dont l’inverse est
(
−1 −1 2y, si y ∈ N
f : Z → N, y 7→ f (y) =
1 − 2y, si y ∈ Z \ N .
On remarque que construire une bijection entre N et un ensemble A revient

à énumérer les éléments de A les uns à la suite des autres en commençant par un
3. Notes sur les cardinaux, http : //en.wikipedia.org/wiki/Cardinaln umber http :
//f r.wikipedia.org/wiki/N ombrec ardinal.
premier élément, puis un autre, etc, et de façon à ne pas en oublier et à ne pas faire
de répétitions :
1 2 3 4 5 ....
l l l l l l
f (1) = 0 f (2) = 1 f (3) = −1 f (4) = 2 f (5) = −2 . . . .
On forme ainsi une suite ordonnée a1 , a2 , a3 , . . ..
Exemple 2.2.
N × N est dénombrable. Le processus ci-dessous énumère en fait toutes les paires de
(p, q) ∈ N × N. On compose le tableau suivant et on le parcourt dans le sens des
flèches.
(1, 1) → (2, 1) (3, 1) → (4, 1) (5, 1) → (6, 1) (7, 1) . . .
ւ ր ւ ր ւ ր
(1, 2) (2, 2) (3, 2) (4, 2) (5, 2) (6, 2) (7, 2) . . .
↓ ր ւ ր ւ ր ւ
(1, 3) (2, 3) (3, 3) (4, 3) (5, 3) (6, 3) (7, 3) . . .
ւ ր ւ ր ւ ր
(1, 4) (2, 4) (3, 4) (4, 4) (5, 4) (6, 4) (7, 4) . . .
(1, 5) (2, 5) (3, 5) (4, 5) (5, 5) (6, 5) (7, 5) . . .
ւ ր ւ ր ւ ր
(1, 6) (2, 6) (3, 6) (4, 6) (5, 6) (6, 6) (7, 6) . . .
.. .. .. .. .. .. ..
. . . . . . .
Exemple 2.3.
Q est dénombrable. On commence d’abord par énumérer Q+ , les rationnels positifs.
1/1 → 2/1 3/1 → 4/1 5/1 → 6/1 7/1 . . .
ւ ր ւ ր ւ ր
1/2 2/2 3/2 4/2 5/2 6/2 7/2 . . .
1/3 2/3 3/3 4/3 5/3 6/3 7/3 . . .
ւ ր ւ ր ւ ր
1/4 2/4 3/4 4/4 5/4 6/4 7/4 . . .
1/5 2/5 3/5 4/5 5/5 6/5 7/5 . . .
ւ ր ւ ր ւ ր
1/6 2/6 3/6 4/6 5/6 6/6 7/6 . . .
.. .. .. .. .. .. ..
. . . . . . .
Le processus ci-dessus énumère toutes les paires de (p, q) ∈ N × N. Si chaque paire
représente un rationnel p/q, il y a donc des répétitions.
Exemple 2.4.
Si chaque paire représente un rationnel p/q, il y a donc des répétitions. Il suffit donc
de sauter un nombre déjà rencontré.
1/1 → 2/1 3/1 → 4/1 5/1 → 6/1 7/1 . . .

ւ ր ւ ր ւ ր
1/2 2/2 3/2 4/2 5/2 6/2 7/2 . . .
1/3 2/3 3/3 4/3 5/3 6/3 7/3 . . .
ւ ր ւ ր ւ ր
1/4 2/4 3/4 4/4 5/4 6/4 7/4 . . .
1/5 2/5 3/5 4/5 5/5 6/5 7/5 . . .
ւ ր ւ ր ւ ր
1/6 2/6 3/6 4/6 5/6 6/6 7/6 . . .
.. .. .. .. .. .. ..
. . . . . . .
Exemple 2.5.
On peut ensuite énumérer Q− de la même manière, puis ensuite combiner Q+ , Q−
et {0} comme suit
0, 1, −1, 2, −2, 1/2, −1/2, 1/3, −1/3, 3, −3, 4, −4, . . .
2.2 Quelques résultats généraux

Théorème 2.1. Tout sous-ensemble infini d’un ensemble dénombrable est lui-même
dénombrable.
Démonstration. Soit E un sous-ensemble infini d’un ensemble dénombrable A. on

peut donc ranger les éléments de A dans une suite {xn } d’éléments disctincts. On
construit alors par récurrence la suite {nk } de la manière suivante :
- n1 est le premier entier tel que xn1 ∈ E
- une fois déterminé les éléments n1 , n2 , . . . , nk−1 , avec k ≥ 2, nk est le plus
petit entier strictement plus grand que nk−1 tel que xnk ∈ E.
On définit ensuite la bijection k 7→ f (k) = xnk : N → E.
Remarque 2.1.
Donc, aucun ensemble non-dénombrable ne peut être contenu dans un ensemble
dénombrable.
Définition 2.2.
Soit E un ensemble arbitraire. Si, à chaque élément α d’un ensemble quelconque A,
on associe un sous-ensemble Eα de E, on dit que l’on a défini une collection ou une
famille {Eα : α ∈ A} de sous-ensembles de E, que l’on écrira simplement {Eα }.
On adopte aussi les notations suivantes.
Définition 2.3. (i) ∪α∈A Eα = {x ∈ E : ∃α tel que x ∈ Eα }.

(ii) ∩α∈A Eα = {x ∈ E : ∀α, x ∈ Eα }.
(iii) ∪ni=1 Ei = E1 ∪ · · · ∪ En et ∩ni=1 Ei = E1 ∩ · · · ∩ En .
(iv) ∪∞ ∞
i=1 Ei = E1 ∪ E2 ∪ . . . et ∩i=1 Ei = E1 ∩ E2 ∩ . . . . Le symbole ∞ indique
que l’on considère une famille dénombrable étiquetée 1, 2, 3, . . . .
On a la commutativité, l’associativité et la distributivité des opérations ∪ et ∩.

Théorème 2.2. Soit {En }, n = 1, 2. . . . , une suite d’ensemble dénombrables. Alors
leur réunion
déf
E = ∪∞
n=1 En
est également dénombrable.

Démonstration. Comme chaque En est dénombrable, ses éléments peuvent être
rangés comme une suite {xn,k }, k = 1, 2, 3, . . . . On forme alors le tableau constitué
d’une infinité de lignes et de colonne suivant
E1 E2 E3 E4 E5 E6 E7 ...
x1,1 → x2,1 x3,1 → x4,1 x5,1 → x6,1 x7,1 ...

ւ ր ւ ր ւ ր
x1,2 x2,2 x3,2 x4,2 x5,2 x6,2 x7,2 ...
x1,3 x2,3 x3,3 x4,3 x5,3 x6,3 x7,3 ...
ւ ր ւ ր ւ ր
x1,4 x2,4 x3,4 x4,4 x5,4 x6,4 x7,4 ...
x1,5 x2,5 x3,5 x4,5 x5,5 x6,5 x7,5 ...
ւ ր ւ ր ւ ր
x1,6 x2,6 x3,6 x4,6 x5,6 x6,6 x7,6 ...
.. .. .. .. .. .. ..
. . . . . . .
dont la nième colonne est constituée des éléments de la suite {xn,k } associée à En .
En suivant les flèches, les éléments du tableau sont rangés en une suite où chaque
élément de l’union apparait au moins une fois. On en déduit que E est au plus
dénombrable. Enfin, comme E1 ⊂ E et que E1 est dénombrable, E est dénombrable.
Corollaire 1. Si l’ensemble I est au plus dénombrable et, si pour tout i ∈ I,

l’ensemble Ei l’est aussi, alors la réunion ∪i∈I Ei est au plus dénombrable.
Théorème 2.3. Soit A un ensemble dénombrable et An l’ensemble des suites de
longueur n ≥ 1
déf
(a1 , . . . , an ) ∈ An = A × · · · × A. (2.1)
| {z }
n fois
Alors An est dénombrable.

Démonstration. Par récurrence. Pour n = 1, A1 = A est dénombrable. Supposons
que pour A1 jusqu’à An−1 le soient. On a alors une bijection
(a1 , . . . , an ) 7→ ((a1 , . . . , an−1 ), an ) : An → An−1 × A.
An peut alors être identifié à la réunion ∪a∈A An−1 qui est une réunion dénombrable
d’ensembles dénombrables. An est alors dénombrable par le Théorème 2.2.
En passant des suites finies au suite infinies, le Théorème 2.3 n’est plus vrai.
Théorème 2.4. Soit A = {0, 1} et l’ensemble
déf
E = {(a1 , a2 , . . . ) : ai ∈ A} (c’est-à-dire, E = A × A × . . . ) (2.2)
des suites d’éléments de A. Alors, E n’est pas dénombrable.

Démonstration. Supposons que E soit dénombrable. Alors, on peut ranger ses éléments
dans le tableau suivant :
x1 = (a11 , a12 , a13 , a14 , a15 , . . . )
x2 = (a21 , a22 , a23 , a24 , a25 , . . . )
x3 = (a31 , a32 , a33 , a34 , a35 , . . . )
..
.
À partir de cette liste, on construit une nouvelle suite y = (b1 , b2 , b3 , b4 , b5 , . . . ), où

(
déf 1, si ann = 0
bn =
0, si ann = 1.
Comme cette nouvelle suite diffère de chaque suite xn dans E par au moins un
élément, elle n’appartient pas à E ce qui contredit la définition de E.
2.3 R n’est pas dénombrable

Cantor montra que les ensembles des nombres entiers, des nombres rationnels,
et des nombres algébriques sont tous dénombrables, mais l’ensemble des nombres
réels ne l’est pas.
Théorème 2.5. R n’est pas dénombrable.
Démonstration diagonale de Georg Cantor. On raisonne par l’absurde. On fait l’hy-

pothèse que R est dénombrable. On peut alors trouver une façon d’écrire les éléments
de R les uns à la suite des autres sans oubli ni répétition. On a la liste suivante sous
forme de développements décimaux :
a1 = n1 , a11 a12 a13 a14 a15 . . .
a2 = n2 , a21 a22 a23 a24 a25 . . .
a3 = n3 , a31 a32 a33 a34 a35 . . .
..
.
où ni représente la partie entière du i-ième nombre ai de la liste et les aij sont les
chiffres du développement décimal de ai .
À partir de cette liste, on construit
( le réel b = 0, b1 b2 b3 b4 b5 . . . où
déf 5, si aii 6= 5
bi =
4, si aii = 5.
On constate que ce b ∈ R n’apparait nulle part dans la liste ! En effet, par construc-
tion, pour chaque i on a bi 6= aii et donc b 6= ai . Ceci contredit notre hypothèse que
la liste des éléments de R était complète. R n’est donc pas dénombrable.
Exemple 2.6 (Exercice 5.2). (i) L’ensemble des irrationnels R \ Q n’est pas
dénombrable.
(ii) Le segment ]a, b[ et le segment ]c, d[ ont le même cardinal.
(iii) Le segment ]0, 1[ et R ont le même cardinal.
2.4 ◮ Cardinalité du continu c et cardinaux transfinis

Cantor comprit que le fait qu’il y ait une bijection entre deux ensembles est la
bonne façon de dire que deux ensembles ont la même taille, appelée cardinalité dans
le cas des ensembles finis. Il appliqua cette notion aux ensembles infinis comme par
exemple les entiers naturels N.
Il appela tous les ensembles ayant la même cardinalité que N des ensembles
dénombrables et introduisit la notation ℵ0 : un ensemble dénombrable est un en-
semble qui peut être mis en bijection avec les nombres entiers, c’est-à-dire que
l’on peut, d’un certaine façon, numéroter tous ses éléments par des entiers (sans
répétition mais ce n’est pas essentiel). Il montre que les ensembles des nombres
entiers relatifs, des nombres rationnels, et des nombres algébriques sont tous dé-
nombrables. Il est aussi possible pour un sous-ensembles strict d’un ensemble infini
d’avoir la même cardinalité que l’ensemble d’origine, ce qui ne peut arriver avec les
sous-ensembles stricts d’ensembles finis.
Dans son article de 1874, Cantor démontre qu’il existe des cardinaux d’ordre
plus élevé (les cardinaux transfinis) en montrant que la cardinalité de R est plus
grande que la cardinalité de N. Sa première présentation fait appel à une démons-
tration compliquée, mais dans un article en 1891 il démontre le même résultat en
utilisant l’ingénieux et simple argument diagonal (voir démonstration du Théorème
2.5). Le nouveau cardinal, appelé cardinalité du continu fut appelé c (en écriture
gothique) par Cantor.
2.5 ◮ ℵ0 , ℵ1 , ℵ2 , ℵ3 , · · · , hypothèse du continu, et axiome du

choix
Cantor développa aussi une large portion de la théorie générale des cardinaux ;
il démontra qu’il y a un plus petit transfini (ℵ0 ) et que pour chaque cardinal, il y
a un cardinal suivant plus grand (ℵ1 , ℵ2 , ℵ3 , · · · ). Son hypothèse du continu est la
proposition que c est ℵ1 , mais on s’est aperçu que ceci est indépendant des axiomes
habituels de la théorie des ensembles ; on ne peut ni le démontrer, ni le nier sous
ces hypothèses (voir théorie des ensembles de Zermelo-Fraenkel, axiome du choix,
et axiome de fondation de Frege).
Il y a donc une suite transfinie de nombres cardinaux :
0, 1, 2, 3, · · · , n, · · · ; ℵ0 , ℵ1 , ℵ2 , · · · , ℵα , · · · .
La suite commence avec les entiers naturels (cardinaux finis), qui sont suivis par les
nombres aleph (les cardinaux infinis d’ensembles bien ordonnés). Les nombres aleph
sont indicés par des (nombres) ordinaux. Sous l’hypothèse de l’axiome du choix,
”Étant donné un ensemble X d’ensembles non vides, il existe une
fonction définie sur X, appelée fonction de choix, qui à chacun d’entre
eux associe un de ses éléments”,
la suite des nombres transfinis inclut tous les nombres cardinaux. Si l’on rejette
cette hypothèse, la situation devient plus compliquée, avec des nombres cardinaux
infinis qui ne sont pas des alephs. La cardinalité est étudiée en elle-même comme
une partie de la théorie des ensembles.
3 Corps, ensemble ordonné et corps ordonné

3.1 Corps et corps commutatif
Un corps est une structure algébrique dans laquelle sont possibles les addi-
tions, soustractions, multiplications et calculs d’inverses multiplicatifs. C’est une
généralisation de la structure de R. Il faut signaler une différence entre la définition
de la version anglaise de W. Rudin [1] qui est celle d’un corps commutatif et la
définition française de corps qui ne suppose pas que la multiplication soit commu-
tative (voir le traduction française de son livre).
Des exemples de corps commutatifs sont le corps des nombres rationnels Q, le
corps des nombres réels R, et le corps des nombres complexes C. L’exemple le plus
célèbre de corps non commutatif est celui des quaternions introduits par William
Rowan Hamilton en 1843.
3. Corps, ensemble ordonné et corps ordonné 35
Définition 3.1. (i) Un corps 4 est un ensemble K muni de deux opérations,

appelées addition et multiplication, satisfaisant les axiomes suivants :
(A) Axiomes de l’addition
(A1) ∀x, y ∈ K, x + y ∈ K
(A2) commutativité : ∀x, y ∈ K, x + y = y + x
(A3) associativité : ∀x, y, z ∈ K, (x + y) + z = x + (y + z)
(A4) élément neutre : ∃ 0 ∈ K tel que ∀x ∈ K, 0 + x = x
(A5) inverse additif : ∀x ∈ K, ∃ − x ∈ K tel que x + (−x) = 0.
(M) Axiomes de la multiplication
(M1) ∀x, y ∈ K, x y ∈ K
(M3) associativité : ∀x, y, z ∈ K, (x y) z = x (y z)
(M4) élément neutre : ∃ 1 ∈ K, 1 6= 0, tel que ∀x ∈ K, 1 x = x
(M5) inverse multiplicatif : ∀x ∈ K, x 6= 0, ∃ x−1 ∈ K tel que x x−1 = 1.
(D) Axiomes de distributivité
∀x, y, z ∈ K, x (y + z) = x y + x z.
(ii) K est un corps commutatif si, en plus,
(M) Axiomes de la multiplication
(M2) commutativité : ∀x, y ∈ K, x y = y x.
Les propriétés P1 à P5 font de Q et R des corps commutatifs.

(
(x + y) + z = x + (y + z)
et (x · y) · z = x · (y · z)
(
(additif) ∃0∗ tel que ∀x ∈ R, 0∗ + x = x
(multiplicatif) ∃1∗ tel que ∀x ∈ R, x · 1∗ = x
 ∗
 (additif) ∀x ∈ R, ∃ − x tel que x + (−x) = 0

P5 (existence d’inverses) (multiplicatif) ∀x ∈ R, x 6= 0∗ , ∃x−1 ∈ R


tel que x · x−1 = 1∗

 a) ∀x, y ∈ R tel que x > 0∗ et y > 0∗ on a


 x + y > 0∗ et x · y > 0∗

 b) ∀x ∈ R une seule propriété est vraie :


x > 0∗ , x = 0∗ , ou 0∗ > x.
P7 (complétude)
∀E, ∅ 6= E ⊂ R, borné supérieurement, on a sup E ∈ R.
4. Le vocabulaire actuel vient de R. Dedekind qui définit un corps (Körper en allemand,
c’est la raison pour laquelle un corps quelconque est souvent nommé K) comme un sous-ensemble
de nombres réels ou complexes stable par addition, soustraction, multiplication et division.
Proposition 3.1. Dans tout corps, l’addition vérifie les quatre propriétés sui-
vantes :
(a) x + y = x + z ⇒ y=z
(b) x + y = x ⇒ y=0
(c) x + y = 0 ⇒ y = −x
(d) −(−x) = x.
Proposition 3.2. Dans tout corps, la multiplication vérifie les quatre propriétés
suivantes :
(a) x 6= 0 et xy = xz ⇒ y=z
(b) x 6= 0 et xy = x ⇒ y=1
(c) x 6= 0 et xy = 1 ⇒ y = x−1
(d) x 6= 0 et (x−1 )−1 = x.
Proposition 3.3. Dans tout corps, on a les quatre propriétés suivantes : pour tout
x, y ∈ K
(a) 0 x = 0
(b) x 6= 0 et y 6= 0 ⇒ xy 6= 0
(c) (−x)y = −(xy) = x(−y)
(d) (−x)(−y) = xy.
3.2 Ensemble ordonné

On a vu que, en plus d’engendrer la notion de corps, l’ensemble R des nombres
réels possède aussi la relation d’ordre P6. Cette notion d’ordre a elle aussi une
axiomatisation pour un ensemble arbitraire.
Définition 3.2.
Soit E un ensemble.
(i) Un ordre sur E est une relation, notée ≤, ayant les propriétés suivantes.
(a) ∀x ∈ E, x ≤ x.
(b) ∀x, y ∈ E, x ≤ y et y ≤ x ⇒ x = y.
(c) ∀x, y, z ∈ E, x ≤ y et y ≤ z ⇒ x ≤ z.
(ii) On a un ordre total si, en outre, on a la propriété supplémentaire :
(d) ∀x, y ∈ E, x ≤ y ou y ≤ x.
(iii) On dira que x est strictement inférieur à y et on écrira x < y si x ≤ y et
x 6= y.
Définition 3.3.
Un ensemble ordonné est un ensemble sur lequel un ordre a été défini.
N, Z, Q et R sont des ensembles ordonnés munis d’un ordre total.

Exemple 3.1.
Soit Rk l’ensemble des suites finies x = (x1 , . . . , xk ) et pour x et y dans Rk l’ordre
x≤y si ∀i, 1 ≤ i ≤ k, xi ≤ yi .
C’est un ordre mais pas un ordre total.
Exemple 3.2.
La relation A ⊂ B sur l’ensemble des sous-ensembles de N est un ordre mais pas un
ordre total car pour A = {1, 2, 3} et B = {5, 6, 7}, on n’a ni A ⊂ B ni B ⊂ A.
Définition 3.4.
Soit E un ensemble ordonné et A, ∅ 6= A ⊂ E.
(i) On dit que A est borné supérieurement (majoré) dans E si
∃α ∈ E tel que ∀x ∈ A, x ≤ α
et que α est une borne supérieure (majorant) de A dans E.
(ii) On dit que A est borné inférieurement (minoré) dans E si
∃β ∈ E tel que ∀x ∈ A, x ≥ β
et que β est une borne inférieure (minorant) de A dans E.
Définition 3.5 (W. Rudin [1, Définition 1.8, p. 3]).

Soit E un ensemble ordonné et A, ∅ 6= A ⊂ E.
(a) Si A est borné supérieurement (majoré), on dit que A possède une plus
petite borne supérieure (plus petit majorant), s’il existe α ∈ E tel que
(i) α est une borne supérieure (majorant) de A et
(ii) ∀β < α, β n’est pas borne supérieure (majorant) de A.
On l’écrira sup A.
(b) Si A est borné inférieurement (minoré), on dit que A possède une plus
grande borne inférieure (plus grand minorant), s’il existe α ∈ E tel que
(i) α est une borne inférieure (minorant) de A et
(ii) ∀β > α, β n’est pas une borne inférieure (minorant) de A.
On l’écrira inf A.
Définition 3.6.
Soit E un ensemble ordonné.
(i) E a la propriété de la borne supérieure si
∀A, ∅ 6= A ⊂ E, bornée supérieurement (majorée), sup A ∈ E. (3.1)
(ii) E a la propriété de la borne inférieure si

∀A, ∅ 6= A ⊂ E, bornée inférieurement (minorée), inf A ∈ E. (3.2)
N, Z et R ont la propriété de la borne supérieure (propriété (P7)) et celle de borne

inférieure de la Définition 3.6, mais pas Q.
En fait les deux propriétés sont équivalentes et il suffit de retenir la première.
Théorème 3.1. Un ensemble ordonné E a la propriété de la borne supérieure si

et seulement si il a la propriété de la borne inférieure.
Démonstration. Supposons la propriété de la borne supérieure pour E. Soit A ⊂ E

un minoré (borné inférieurement) non vide. Soit M l’ensemble (non vide) de tous
les minorants (bornes inférieures) de A
déf
M = {y ∈ E : ∀x ∈ A, y ≤ x} ⇒ ∀x ∈ A, ∀y ∈ M, y ≤ x.
Donc, tout x ∈ A est un majorant (borne supérieure) de M , M est majoré (borné

supérieurement), et sup M ∈ E. Par définition de la plus petite borne supérieure de
M,
∀x ∈ A, sup M ≤ x ⇒ sup M ∈ M,
c’est-à-dire, sup M est aussi une borne inférieure de A. Est-ce que c’est la plus
grande borne inférieure de A ? S’il existait une borne inférieure z de A tel que
z > sup M , on aurait z ∈ / M et, par définition de M , z ne serait pas une borne
inférieure de A. De cette contradiction, on conclut que inf A = sup M et E a la
propriété de la borne inférieure. La réciproque de démontre de façon analogue.
On utilisera souvent les caractérisations suivantes des deux notions de la

Définition 3.5 du Chapitre 1. Elles sont la généralisation des équivalences du Théorème
4.11 du Chapitre 1 pour le corps des réels R.
Théorème 3.2. Soit E un ensemble ordonné et A, ∅ 6= A ⊂ E.

- Les conditions suivantes sont équivalentes.
(a) b0 est la plus petite borne supérieure de A
(b) (i) b0 est une borne supérieure de A,
(ii’) pour tout M tel que b0 > M , il existe x0 ∈ A tel que b0 ≥ x0 > M .
(c) (i) b0 est une borne supérieure de A,
(ii”) pour toute borne supérieure M de A tel que b0 6= M , on a M > b0 .
- Les conditions suivantes sont équivalentes.
(a) b0 est la plus grande borne inférieure de A
(b) (i) b0 est une borne inférieure de A,
(ii’) pour tout m tel que b0 < m, il existe x0 ∈ A tel que b0 ≤ x0 < m.
(c) (i) b0 est une borne inférieure de A,
(ii”) pour toute borne inférieure m de A tel que b0 6= m, on a b0 < m.
Démonstration. Il suffit de démontrer les équivalences pour la borne supérieure.

(a) ⇒ (b). Soit M tel que b0 > M . Alors de (ii), M n’est pas une borne
supérieure. Il existe donc x0 ∈ A tel que x0 > M et, comme b0 est une borne
supérieure de A, b0 ≥ x0 > M .
(b) ⇒ (c). Pour toute borne supérieure M de A tel que b0 6= M , on aurait de
(ii’) une contradiction si M < b0 . Donc M ≥ b0 et comme M 6= b0 , on a M > b0 .
(c) ⇒ (a). Soit M < b0 . Comme M 6= b0 , si M était une borne supérieure, on
aurait par (ii”) la contradiction M > b0 . Donc M n’est pas une borne supérieure
de A.
Exemple 3.3.
Soit l’ensemble ordonné E = {x ∈ R : x > 0}. Supposons que A, ∅ 6= A ⊂ E, soit
borné supérieurement dans E. Comme A est aussi borné supérieurement en tant
que sous-ensemble de R, on sait par la propriété P7 que sup A ∈ R. Il vient alors
∀x ∈ A, 0 < x ≤ sup A ⇒ sup A ∈ E.
Donc, E a la propriété de la borne supérieure.

Maintenant, supposons que A soit borné inférieurement dans E, c’est-à-dire,
il existe un m ∈ E tel que 0 < m ≤ x pour tout x ∈ A. Comme A ⊂ R et que m
est aussi une borne inférieure de A dans R, on a par la propriété P7* du Théorème
4.10 du Chapitre 1 que inf A ∈ R et inf A ≥ m > 0. Donc, inf A ∈ E et E a la
propriété de la borne inférieure.
3.3 Corps ordonné

Dans le cas d’un corps, il faut faire attention car W. Rudin [1] ajoute quelques
propriétés à celles de la Définition 3.3 d’un ensemble ordonné qui serait un corps.
Définition 3.7.
Un corps ordonné est un corps K muni d’un ordre total ≤ tel que :
(i) ∀x, y, z ∈ K, y<z ⇒ x+y <x+z
(ii) ∀x, x > 0, ∀y, y > 0, xy > 0.
Proposition 3.4. On a dans tout corps ordonné :
(a) Si x 6= 0, x et −x sont de signe contraire.
(b) x > 0 et y < z ⇒ xy < xz
(c) x < 0 et y < z ⇒ xy > xz
(d) Si x 6= 0, alors x2 > 0. En particulier 1 > 0
(e) Si 0 < x < y, alors 0 < y −1 < x−1 .

4 Nombres complexes et hypercomplexes

4.1 Nombres complexes
Une des motivations pour étendre le corps des nombres réels aux nombres
complexes est l’impossibilité de trouver une solution
x ∈ R tel que x2 = −1.
Comme dans les cas précédents de N par rapport à Z ou de Q par rapport à R, on

est amené à construire un ensemble plus gros dans lequel cette équation trouvera
une solution.
On considère le produit cartésien R2 = R × R des paires ordonnées (x1 , x2 ).
On peut définir une addition et la multiplication par un scalaire, c’est-à-dire, par
un élément de R : pour x = (x1 , x2 ), y = (y1 , y2 ) et α ∈ R
déf
x + y = (x1 , x2 ) + (y1 , y2 ) = (x1 + y1 , x2 + y2 ), (4.1)
déf
α x = α (x1 , x2 ) = (α x1 , α x2 ). (4.2)
On peut aussi y ajouter un produit scalaire et une norme : pour x = (x1 , x2 ),

y = (y1 , y2 )
q
déf déf √
x · y = x1 y1 + x2 y2 , kxk = x · x = x21 + x22 (4.3)
et la base canonique orthonormale

déf déf
e1 = (1, 0), e2 = (0, 1). (4.4)
Tout x = (x1 , x2 ) peut s’écrire sous la forme
x = (x1 , x2 ) = x1 (1, 0) + x2 (0, 1).
On identifie R avec le sous-ensemble R ×{0} de R2 via l’injection
x 7→ (x, 0) : R → R2
où l’addition et la multiplication deviennent
(x1 , 0) + (x2 , 0) = (x1 + x2 , 0) et (x1 , 0) ⊙ (x2 , 0) = (x1 x2 , 0).
On cherche maintenant un prolongement de la multiplication dans R ×{0} à une

multiplication ⊙ de deux éléments de R2 . On voudrait que cette multiplication ⊙
donne l’existence de (x1 , x2 ) ∈ R2 tel que
(x1 , x2 ) ⊙ (x1 , x2 ) = (−1, 0). (4.5)
Afin de rendre convivial le calcul qui en résulte, on introduit la notation

déf déf
1 = (1, 0) et i = (0, 1). (4.6)
4. Nombres complexes et hypercomplexes 41
pour les deux éléments de la base. Tout x = (x1 , x2 ) peut s’écrire sous la forme
x = (x1 , x2 ) = x1 (1, 0) + x2 (0, 1) = x1 + i x2
en omettant le 1.
On introduit maintenant la table de multiplication 2.1 des éléments de base 1
et i de façon à vérifier l’équation (4.5). Par définition, on a bien
Table 2.1. Table de multiplication
⊙ 1 i
1 1 i
i i −1
(0, 1) ⊙ (0, 1) = −1 (1, 0). (4.7)

| {z } | {z } | {z }
i i −1
En utilisant les règles de l’addition et de la multiplication dans R, la table de

multiplication 2.1 et le fait que ces multiplications soient commutatives (i⊙1 = 1⊙i),
on obtient
(x1 + i x2 ) (y1 + i y2 ) = x1 y1 + i2 x2 y2 + i (x1 y2 +x2 y1 )
= (x1 y1 − x2 y2 ) + i (x1 y2 +x2 y1 ).
Ceci mène à la définition suivante de la multiplication ⊙ sur R2 :
déf
(x1 , x2 ) ⊙ (y1 , y2 ) = (x1 y1 − x2 y2 , x1 y2 +x2 y1 ). (4.8)
déf
Théorème 4.1. Muni de l’addition + et de la multiplication ⊙, C = (R2 , +, ⊙)
est un corps commutatif. Le produit scalaire et la norme dans R2 sont donnés par
x · y = x ⊙ ȳ et kxk = |x|, (4.9)
où
déf déf √
x̄ = (x1 , −x2 ) et |x| = x ⊙ x̄. (4.10)
x̄ est appelé le conjugué de x et |x| le module de x.
Le module héritera donc de toutes les propriétés de la norme dans R2 .
C = (R2 , +, ⊙) est appelé le corps des complexes et pour x = x1 + i x2 ,
déf déf
Re x = x1 et Im x = x2
sont dénommés partie réelle et partie imaginaire de x. R est un sous-corps de C via
l’injection x 7→ x : R → C. On peut maintenant trouver une ou des solutions dans
C de l’équation x2 = a pour a < 0.
On résume les propriétés des nombres complexes.
Théorème 4.2. Pour tout x, y ∈ C,

(a) x + y = x̄ + ȳ ;
(b) x y = x̄ ȳ ;
(c) x + x̄ = 2 Re (x) et x − x̄ = 2 Im (x) ;
(d) x x̄ ∈ R et x x̄ > 0 si x 6= 0.
Théorème 4.3. Pour tout x, y ∈ C,

(a) |0| = 0 et x 6= 0 ⇒ |x| > 0 ;
(b) |x̄| = |x| ;
(c) |x y| = |x| |y| ;
(d) |Re (x)| ≤ |x| et |Im (x)| ≤ |x|
(e) |x + x̄| ≤ |x| + |x̄|.
Comme pour les suites de réels, on adoptera la notation

n
X déf
xj = x1 + · · · + xn (4.11)
j=1
pour la somme de n nombres complexes x1 , . . . , xn . On obtient aussi l’inégalité de

Cauchy-Schwarz à partir de celle dans R2 .
Théorème 4.4. Soient a1 , . . . , an et b1 , . . . , bn des nombres complexes. Alors

 1/2  1/2
n
X Xn Xn
aj b̄j ≤ |aj |2   |bj |2  .
j=1 j=1 j=1
4.2 ◮ Nombres hypercomplexes

Peut-on définir une multiplication dans Rn pour n > 2 ? C’est le cas de R4 .
Un quaternion est un type de nombre hypercomplexe. L’ensemble des quaternions,
noté H, constitue une extension de l’ensemble des nombres complexes, extension
similaire à celle qui avait conduit de l’ensemble des nombres réels R à celui des
nombres complexes C.
Les quaternions furent mis en forme au XIXe siècle par Hamilton 5 qui cher-
chait à construire un ensemble de nombres ayant, dans l’espace, des propriétés
analogues à celles que possèdent les nombres complexes dans le plan. Il les présente
comme des quadruplets de réels, le premier élément étant un ≪scalaire ≫, et les trois
éléments restants formant un ≪vecteur ≫, ou ≪imaginaire pur ≫. Il put ainsi définir
une multiplication avec les bonnes propriétés. L’ensemble des quaternions peut être
muni d’une addition et d’une multiplication qui font de lui un des premiers exemples
de corps non commutatif.
5. William Rowan Hamilton (1805–1865). Voir W. R. Hamilton [1].
4. Nombres complexes et hypercomplexes 43
Figure 2.2. William Rowan Hamilton (1805–1865).
Tout quaternion (a, b, c, d) ∈ R4 est une combinaison linéaire des quatre qua-
ternions ≪unités ≫ : 1 = (1, 0, 0, 0), i = (0, 1, 0, 0), j = (0, 0, 1, 0), et k = (0, 0, 0, 1) :
∀(a, b, c, d) ∈ R4 , (a, b, c, d) = a 1 + b i + c j + d k.
Ces quaternions unités ne sont autres que les quatre éléments de la base orthonor-
male dans R4 . La définition de la multiplication s’obtient à partir de la Table de
multiplication 2.2.
Table 2.2. Table de multiplication
⊙ 1 i j k
1 1 i j k
i i −1 k −j
j j −k −1 i
k k j −i −1
Une plaque commémorative rappelant cette découverte se trouve à Dublin.

La relation qui existe entre les quaternions et les rotations en dimension 3 fait de
l’ensemble des quaternions un outil utile pour le traitement de l’espace comme en
infographie ou en théorie de la commande.
La théorie a été généralisée aux octonions qui sont une extension non-asso-
ciative des quaternions qui étaient eux-même une extension non-commutative des
complexes. Ils ont été découverts en 1843 par John T. Graves, un ami de William
Hamilton, qui les appela octaves.
Les complexes, les quaternions et les octonions correspondent aux espaces
euclidiens R2 , R4 et R8 de dimensions paires. Peut-on définir une multiplication sur
Figure 2.3. Plaque commémorative de la naissance des quaternions sur

le pont de Broom (Dublin). ≪Ici, le 16 octobre 1843, alors qu’il se promenait, Sir
William Rowan Hamilton découvrit dans un éclair de génie la formule fondamentale
sur la multiplication des quaternions i2 = j 2 = k 2 = ijk = −1 et la grava sur une
pierre du pont. ≫
les espaces euclidiens de dimensions impaires comme R3 ou R5 ? Oui dans R3 , on

a le produit vectoriel utilisé en électromagnétisme. Étant donné deux vecteurs x =
(x1 , x2 , x3 ) et y = (y1 , y2 , y3 ), on définit le produit suivant qui n’est pas commutatif :
déf
x × y = (x2 y3 − x3 y2 , x3 y1 − x1 y3 , x1 y2 − x2 y1 ). (4.12)
En introduisant la base orthonormale e1 = (1, 0, 0), e2 = (0, 1, 0), e3 = (0, 0, 1), on

obtient la table de multiplication suivante :
Table 2.3. Table de multiplication pour le produit vectoriel dans R3
× e1 e2 e3
e1 0 e3 −e2
e2 −e3 0 e1
e3 e2 −e1 0
Ici. il ne s’agit pas d’un corps puisque qu’il n’y a pas d’élément neutre (axiome
(M4)) et pas d’inverse (axiome (M5)) multiplicatif. Il n’y a pas non plus de com-
mutativité (axiome (M2)).
5 Exercices
Montrer qu’il est impossible de définir sur l’ensemble des nombres complexes C un
ordre total qui lui confère une structure de corps ordonné. (Indication : −1 est un
carré.
5. Exercices 45
Exercice 5.2.
Démontrer les résultats suivants.
(i) L’ensemble des irrationnels R \ Q n’est pas dénombrable.
Chapitre 3
Topologie et suites
dans les
espaces métriques
1 Espace vectoriel, norme, produit scalaire

1.1 L’espace Rn , n ≥ 1
Soient R l’ensemble des nombres réels et |x| la valeur absolue de x. Les nota-
tions suivantes seront utilisées pour les réels positifs et les réels strictement positifs
déf déf
R+ = {x ∈ R : x ≥ 0} et R+ = {x ∈ R : x > 0}
et la notation R = R ∪{±∞} pour l’ensemble étendu des réels (droite réelle achevée).
Pour un entier n ≥ 1, on considère maintenant les suites ordonnées x =
(x1 , . . . , xn ) de nombres réels xi . On appelle produit cartésien l’ensemble de toutes
ces suites
déf
Rn = R × . . . × R. (1.1)
| {z }
n fois
On définit sur Rn une l’addition et une multiplication par un scalaire :

déf
∀x, y ∈ Rn , x + y = (x1 + y1 , . . . , xn + yn )
déf
∀α ∈ R, x ∈ Rn , α x = (αx1 , . . . , αxn ).
L’élément neutre additif est 0 = (0, . . . , 0).

On associe à Rn la base (algébrique) suivante.
Définition 1.1.
La base canonique orthonormale de Rn est l’ensemble {eni ∈ Rn : 1 ≤ i ≤ n} des
éléments de Rn définis par
(
n déf déf 1, si i = j
(ei )j = δij , δij =
0, si i 6= j,
47
48 Chapitre 3. Topologie et suites dans les espaces métriques
où la fonction de deux variables δij est appelée symbole de Kronecker. Explicitement,
en1 = (1, 0, 0, . . . , 0, 0), en2 = (0, 1, 0, . . . , 0, 0), ..., enn = (0, 0, 0, . . . , 0, 1).
Lorsque le contexte est clair, on écrira simplement {ei } sans l’indice n.
1.2 Espace vectoriel

On peut aussi considérer les éléments x = (x1 , . . . , xn ) de Rn comme des
vecteurs et parler de Rn comme d’un espace vectoriel sur R de dimension n. Ceci
mène à la formalisation suivante.
Définition 1.2.
Soit E un ensemble non vide. On dit que (E, +, ×) est un espace vectoriel sur R
muni d’une addition
x, y 7→ x + y : E × E → E
et d’une multiplication par un scalaire
α, x 7→ α × x : R ×E → E
si (E, +) est un groupe commutatif et pour tout α et β dans R et x et y dans E
α × (x + y) = α × x + α × y,
(α + β) × x = α × x + β × x,
α × (βx) = (αβ) × x,
1 × x = x.
Exemple 1.1.
Les suites infinies x = (x1 , x2 , . . . ) ∈ R × R × . . . de réels avec les opérations
déf déf
x + y = (x1 + y1 , x2 + y2 , . . . ) et α x = (α x1 , α x3 , . . . )
forment un espace vectoriel de dimension infinie.
Exemple 1.2.
L’ensemble des fonctions f : [0, 1] → R est un espace vectoriel pour l’addition et la
multiplication par un scalaire suivantes :
déf déf
(f + g)(x) = f (x) + g(x) et (α f )(x) = α f (x).
En particulier, l’ensemble C[0, 1] des fonctions continues f : [0, 1] → R est un espace

vectoriel pour ces deux opérations. De même, l’ensemble des polynômes P k [0, 1] de
degré inférieur ou égal à k (k ≥ 0, un entier) définis dans l’intervalle [0, 1] est un
espace vectoriel.
1. Espace vectoriel, norme, produit scalaire 49
1.3 Norme et espace vectoriel normé

On introduit les définitions suivantes qui étendent celles de valeur absolue et
de multiplication dans R.
Définition 1.3. (i) La norme euclidienne sur Rn

" n #1/2
déf
X 2
kxkRn = |xi | (1.2)
i=1
que l’on écrira simplement kxk lorsque le contexte le permet.

(ii) Le produit scalaire sur Rn
n
X
déf
x·y = xi yi (1.3)
i=1
√
pour lequel kxkRn = x · x.
Pour n = 1, kxkR1 coı̈ncide avec la valeur absolue |x| et x · y avec le produit x y.

On parle de norme euclidienne parce qu’elle donne la longueur de la droite
entre deux points x = (x1 , . . . , xn ) et y = (y1 , . . . , yn ) de Rn
" n #1/2
X 2
kx − ykRn = |xi − yi | ,
i=1
c’est-à-dire, la plus petite distance entre les deux points comme en géométrie eucli-
dienne.
On peut vérifier les propriétés suivantes pour la norme euclidienne.
Théorème 1.1. Pour tous x, y, z ∈ Rn et α ∈ R

(a) kxkRn ≥ 0 ;
(b) kxkRn = 0 ⇐⇒ x = 0;
(c) kαxkRn = |α| kxkRn ;
(d) |x · y| ≤ kxkRn kykRn (inégalité de Cauchy-Schwarz 1 ) ;
(e) kx + ykRn ≤ kxkRn + kykRn (inégalité du triangle) ;
(f) kx − zkRn ≤ kx − ykRn + ky − zkRn .
1. Cette inégalité fut démontrée par Augustin Louis Cauchy en 1821 pour l’espace euclidien.
En 1859 Viktor Yakovlevich Bunyakovsky, étudiant de Cauchy, nota qu’en prenant les limites on
peut obtenir une forme intégrale de l’inégalité de Cauchy. Le résultat général pour un espace vecto-
riel muni d’un produit scalaire fut obtenu par Hermann Amandus Schwarz en 1885. Bunyakovsky
a donc obtenu le premier exemple de cette inégalité en dimension infinie de nombreuses années
avant Schwarz.
Démonstration. Les propriétés (a), (b) et (c) sont faciles à vérifier et la propriété
(f) est une conséquence de (e) : kx − zk = k(x − y) + (y − z)k.
(d) Le polynôme quadratique
n
X n
X n
X n
X
0≤ (xi + λ yi )2 = x2i + 2 λ xi yi + λ2 yi2
1=1 1=1 1=1 1=1
est positif quelque soit λ. On sait que, lorsque a ≥ 0, la condition a λ2 + b λ + c ≥ 0

pour tout λ, enraı̂ne b2 − 4 a c ≤ 0, c’est-à-dire,
n
!2 n
! n
!
X X X
xi yi − x2i yi2 ≤0
1=1 1=1 1=1
ce qui donne l’inégalité (d) de Cauchy-Schwarz avec des carrés.

Pour (e), on utilise Cauchy-Schwarz pour le terme croisé
n
X n
X n
X n
X
2 2
kx + yk = (xi + yi ) = x2i +2 xi yi + yi2
1=1 1=1 1=1 1=1
2
≤ kxk2 + 2 kxk kyk + kyk2 = (kxk + kyk) .
En prenant la racine carré positive de chaque membre, on obtient (e).
On formalise la notion de norme sur un espace vectoriel.
Définition 1.4. (i) Une norme sur un espace vectoriel V est une application
déf
p : V → R+ = {x ∈ R : x ≥ 0}
vérifiant les propriétés suivantes

(N1) ∀λ ∈ R, ∀v ∈ V, p(λv) = |λ|p(v) ;
(N2) ∀u, v ∈ V, p(u + v) ≤ p(u) + p(v) ;
(N3) v ∈ V et p(v) = 0 ⇒ v = 0.
(ii) On dira que V est un espace vectoriel normé si V est un espace vectoriel
muni d’une norme.
Il y a d’autres choix de norme sur Rn comme

" n #1/p
déf
X p déf
kxkp = |xi | , 1 ≤ p < ∞, et kxk∞ = max |xi | .
1≤i≤n
i=1
Pour p = 2, la boule de centre 0 et de rayon r > 0,

déf
Br (0) = y ∈ R2 : kykR2 < r ,
est bien un disque de rayon r dans le plan donné par l’inégalité y12 + y22 < r2 . Pour
p = 1, la “boule”
déf
Br (0) = y ∈ R2 : kyk1 < r
est un losange donné par l’inégalité |y1 | + |y2 | < r, et, pour p = ∞, la “boule”
déf
Br (0) = y ∈ R2 : kyk∞ < r
est un carré donné par l’inégalité max{|y1 |, |y2 |} < r.

Les propriétés (a), (c), (e) et (b) du Théorème 1.1 sont indépendantes de p.
Théorème 1.2. Soit p, 1 ≤ p ≤ ∞, x = (x1 , . . . , xn ) ∈ Rn . La fonction

( n
)1/p
déf
X
x 7→ kxkp = |xi |p : Rn → R+ , 1 ≤ p < ∞,
i=1 (1.4)
déf
x 7→ kxk∞ = max |xi | : Rn → R+ , p = ∞,
1≤i≤n
possède les propriétés suivantes :

(i) kxkp = 0 ⇐⇒ x = 0 ;
(ii) kαxkp = |α| kxkp ;
(iii) (inégalité de Hölder) 2 pour 1 ≤ p < ∞ et q tel que 1/p + 1/q = 1,
n n
!1/p n
!1/q
X X X
p q
|xi yi | ≤ |xi | |yi | = kxkp kykq , 1 < p < ∞,
i=1 i=1 i=1
Xn n
X
|xi yi | ≤ |xi | max |yj | = kxk1 kyk∞ , p = 1;
1≤j≤n
i=1 i=1
(iv) (inégalité de Minkowski) 3
n
!1/p n
!1/p n
!1/p
X X X
|xi + yi |p ≤ |xi |p + |yi |p , 1 ≤ p < ∞,
i=1 i=1 i=1
max |xi + yi | ≤ max |xi | + max |yi |, p = ∞.
1≤i≤n 1≤i≤n 1≤i≤n
(v) La fonction kxkp est une norme sur Rn .
Démonstration. Les parties (i) et (ii) sont évidentes. Le cas p = 1 est immédiat.
2. Otto Ludwig Hölder (1859–1937). C’est la généralisation de l’inégalité de Cauchy-Schwarz
qui correspond à p = 2.
3. Hermann Minkowski (1864–1909). Voir aussi la démonstration plus directe de la Remarque
3.3 du Chapitre 4 page 123.
On passe donc au cas 1 < p < ∞. Soit α > 0 et β > 0 tel que α + β = 1. On a
besoin de l’ inégalité arithmético-géométrique pondérée suivante : pour tous u > 0
et v > 0, on a
uα v β ≤ α u + β v ou uα v 1−α ≤ α u + (1 − α) v. (1.5)
En effet, pour t > 0, la fonction t 7→ tα : R+ = ]0, ∞[ → R est concave puisque,

pour 0 < α < 1, sa dérivée seconde α (α − 1) tα−2 est négative pour t > 0. Cette
courbe se trouve donc en dessous de sa tangente au point t = 1, c-à-d.,
tα ≤ 1 + α (t − 1) ⇒ tα ≤ α t + β. (1.6)
En substituant t = u/v et en multipliant chaque membre de (1.6) par v, on obtient

(1.5).
(iii) Inégalité de Hölder. Soit 1 < p < ∞ et q tel que 1/p + 1/q = 1. Soit
x = (x1 , . . . , xn ) et y = (y1 , . . . , yn ). On applique (1.5) avec
|xi |p |yi |q 1 1 1
ui = Pn p
, vi = Pn q
, α= , β =1−α=1− = .
j=1 |xj | j=1 |yj | p p q
On obtient
!1/p !1/q
|x |p |y |q 1 |x |p 1 |yi |q
Pn i p
Pn i q
≤ Pn i + P n
j=1 |xj | j=1 |yj | p j=1 |xj |p q j=1 |yj |
q
|xi | |y | 1 |x |p 1 |yi |q
Pn p 1/p
Pn i q 1/q ≤ Pn i p
+ Pn q
( j=1 |xj | ) ( j=1 |yj | ) p j=1 |xj | q j=1 |yj |
|xi | |yi | 1 |xi |p 1 |yi |q
Pn P n ≤ P n + P n .
( j=1 |xj |p )1/p ( j=1 |yj |q )1/q p j=1 |xj |p q j=1 |yj |
q
Puis on somme par rapport à i

Pn Pn p
Pn
i=1 |xP
i | |yi | 1 i=1 |xi | 1 |y |q 1 1
Pn n ≤ P n + Pni=1 i q = + = 1
p 1/p
( j=1 |xj | ) ( j=1 |yj | ) q 1/q p j=1 |xj |p q j=1 |yj | p q
 1/p  1/q
X n n
X n
X Xn
xi yi ≤ |xi yi | ≤  |xj |p   |yj |q  .
i=1 i=1 j=1 j=1
Pour p = 1, q = ∞ et
n n n n
!
X X X X
xi yi ≤ |xi yi | ≤ |xi | |yi | ≤ |xi | max |yj |.
1≤j≤n
i=1 i=1 i=1 i=1
(iv) Inégalité de Minkowski. Pour 1 < p < ∞

n
X n
X n
X
|xi + yi |p = |xi + yi |p−1 |xi + yi | ≤ |xi + yi |p−1 (|xi | + |yi |).
i=1 i=1 i=1
En utilisant l’inégalité de Hölder,

 1/q  1/p
Xn n
X n
X
|xi + yi |p−1 |xi | ≤  |xi + yi |(p−1)q   |xj |p 
i=1 j=1 j=1
 1−1/p  1/p
n
X n
X
≤ |xi + yi |p   |xj |p 
j=1 j=1
puisque (p − 1)q = p et par le même argument

 1−1/p  1/p
Xn n
X n
X
|xi + yi |p−1 |yi | ≤  |xi + yi |p   |yj |p  .
i=1 j=1 j=1
En additionnant
 1−1/p  1/p  1/p 
n
X n
X n n
X X 
|xi + yi |p ≤  |xi + yi |p   |xj |p  +  |yj |p  
i=1 j=1 j=1 j=1
" n #1/p  1/p  1/p

X Xn Xn
⇒ |xi + yi | p
≤ |xj |p  +  |yj |p  .
i=1 j=1 j=1
Enfin, pour p = 1
n
X n
X n
X n
X
|xi + yi | ≤ |xi | + |yi | = |xi | + |yi |;
i=1 i=1 i=1 i=1
pour p = ∞
|xi + yi | ≤ |xi | + |yi | ≤ max |xi | + max |yi |
1≤i≤n 1≤i≤n
⇒ max |xi + yi | ≤ max |xi | + max |yi |.

1≤i≤n 1≤i≤n 1≤i≤n
Exemple 1.3.
On revient à l’exemple 1.2 de l’espace vectoriel C[0, 1] des fonctions continues f :
[0, 1] → R. Les fonctions
Z 1
f 7→ max |f (x)| et f 7→ |f (x)| dx
x∈[0,1] 0
sont des normes sur C[0, 1]. On verra plus loin que pour un sous-ensemble borné
fermé K ⊂ Rn , l’espace des fonctions continues sur K,
déf déf
C(K) = {f : K → R | f est continue sur K} , kf kC(K) = sup |f (x)|
x∈K
est un espace vectoriel normé pour la norme kf kC(K).

Exemple 1.4.
Si l’on passe à des espaces de suites infinies comme
( ∞
)
déf
X
ℓp = x = (x1 , x2 , . . . ) : xi ∈ R et |xi |p < ∞ , 1 ≤ p < ∞,
i=1
on peut encore montrer que ℓp est un espace vectoriel, mais il n’est plus de dimension
finie. On peut aussi vérifier que la fonction
∞
!1/p
déf
X p
kxkℓp = |xi |
i=1
est une norme sur ℓp .
1.4 Produit scalaire

La notion de produit scalaire sur Rn de la Définition 1.3 s’axiomatise.
Définition 1.5.
Soit V un espace vectoriel sur R. Un produit scalaire sur V est une application
(x, y) 7→ x · y : V × V → R (1.7)
dotée des propriétés suivantes :

(PS1) x · x ≥ 0 pour tout x ∈ V ;
(PS2) x · x = 0 si et seulement si x = 0 ;
(PS3) x · y = y · x pour tout x, y ∈ V ;
(PS4) (λx + µy, z) = λ x · z + µ y · z pour tout λ, µ ∈ R et x, y, z ∈ V .
On peut vérifier que le produit scalaire induit la norme suivante sur V :

√
kxk = x · x. (1.8)
Exemple 1.5.
On revient à l’exemple 1.2 de l’espace vectoriel C[0, 1] des fonctions continues f :
[0, 1] → R. La fonction
Z 1
déf
f, g 7→ f · g = f (x) g(x) dx
0
est un produit scalaire ce qui fait que

Z 1/2
p 1
2
f ·f = f (x) dx
0
est une autre norme sur C[0, 1].

2. Métrique et espace métrique 55
2 Métrique et espace métrique

2.1 Définition et exemples
La notion de norme permet de définir la distance d(x, y) = ky − xk entre deux
points x et y d’un espace vectoriel V . On peut cependant se passer de la structure
algébrique d’espace vectoriel et même de toute structure algébrique en introdui-
sant une notion axiomatique fort simple de distance d(x, y) entre deux points x et
y pour un ensemble arbitraire. D’après J.-L. Verley [1], c’est par l’analyse des
principales propriétés de la distance usuelle que Fréchet introduisit la notion d’es-
pace métrique, développée ensuite par Hausdorff. Elle sera suffisante pour parler de
Figure 3.1. Maurice René Fréchet (1878–1973).
topologie, de convergence et de continuité et pour démontrer de nombreux résultats

fondamentaux pour une multitude d’espaces rencontrés en analyse classique et en
analyse fonctionnelle.
Définition 2.1. (i) Une métrique sur un ensemble X est une fonction
déf
(x, y) 7→ d(x, y) : X × X → R+ , R+ = {x ∈ R : x ≥ 0}
qui satisfait les trois axiomes suivants :

(M1) d(x, y) = 0 ⇐⇒ x = y;
(M2) (symétrie) d(x, y) = d(y, x) ;
(M3) (inégalité du triangle) d(x, y) ≤ d(x, z) + d(z, y).
On appelle aussi d(x, y) la distance entre x et y.
(ii) Un ensemble X doté d’une métrique d est appelé espace métrique. On
l’écrira X, (X, d) ou (X, dX ) selon le degré de précision désiré.
Il est important d’insister sur le fait que l’on n’a supposé aucune structure algébrique
sur X comme le montre l’exemple suivant.
Exemple 2.1 (Exercice 10.12).

Si X est un ensemble infini, on pose pour tout x, y ∈ X
(
1, si x 6= y
d(x, y) =
0, si x = y.
L’espace (X, d) est un espace métrique. En effet, d(x, y) ≥ 0 pour tous x, y ∈ X.

On a, par définition de d, d(x, y) = 0 ⇐⇒ x = y et d(x, y) = d(y, x). Pour
(M3), si x = y, alors d(x, y) = 0 ≤ d(x, z) + d(z, y). Pour x 6= y, d(x, y) = 1 et
ou bien x 6= z ou y 6= z. Ceci implique que d(x, z) = 1 ou d(y, z) = 1 et donc
d(x, y) = 1 ≤ d(x, z) + d(z, y).
Si X est un espace vectoriel normé, alors il est facile de vérifier que
d(x, y) = kx − yk
est une métrique sur X à partir des propriétés (N1), (N2) et (N3) de la Définition
1.4 du Chapitre 2 (voir l’Exercice 10.5). Les espaces R, Rn , ℓp et C(K) sont donc
des espaces métriques.
On termine par l’exemple de la métrique de Hausdorff.
Exemple 2.2 (Métrique de Hausdorff 4 et fonction distance).

L’espace des parties fermées A d’un borné fermé K ⊂ Rn
déf
F (K) = {A : ∅ 6= A ⊂ K et A fermé}
n’est pas un espace vectoriel. On peut cependant y définir une métrique.

On introduit la fonction distance dA pour A, ∅ 6= A ⊂ Rn ,
déf
x 7→ dA (x) = inf kx − akRn : Rn → R,
a∈A
qui est une fonction continue dans Rn et l’ensemble

déf
Cd (K) = {dA : ∅ 6= A ⊂ K et A fermé} .
On met chaque partie A en correspondance avec la fonction distance dA
A ←→ dA
∈F (K) ∈Cd (K)
ce qui permet d’identifier Cd (K) à F (K). Comme l’espace des fonctions continues
C(K) est un espace normé pour la norme du sup sur K, cela induit la métrique
suivante sur F (K) :
déf
d(A, B) = kdA − dB kC(K) = sup |dA (x) − dB (x)|.
x∈K
2. Métrique et espace métrique 57
Figure 3.2. Felix Hausdorff (1868–1942).
Cette métrique n’est autre que la métrique de Hausdorff 5

déf
d(A, B) = max{sup dB (x), sup dA (y)}
x∈A y∈B
qui est généralement définie sur les sous-ensembles compacts de Rn plutôt que
sur les sous-ensembles compacts d’un compact K. L’avantage de cette dernière
construction est de pouvoir dans un second temps définir une métrique sur tous
les sous-ensembles fermés de Rn bornés ou non-bornés (voir M. C. Delfour et
J.-P. Zolésio [1, pp. 268–275].
En effet, pour x ∈ K, xA ∈ A, et xB ∈ B
|x − xA | ≤ |x − xB | + |xB − xA |
⇒ dA (x) ≤ |x − xB | + dA (xB ) ≤ |x − xB | + sup dA (y)
y∈B
⇒ dA (x) ≤ dB (x) + sup dA (y) ⇒ dA (x) − dB (x) ≤ sup dA (y).

y∈B y∈B
En interchangeant les rôles de A et de B

∀x ∈ K, |dA (x) − dB (x)| ≤ max sup dA (z), sup dB (y)
z∈B y∈A

⇒ sup |dA (x) − dB (x)| ≤ max sup dA (z), sup dB (y) .
x∈K z∈B y∈A
4. L’écart mutuel entre deux ensembles fut introduit par D. Pompéiu [1] dans sa thèse
présentée à Paris en mars 1905. C’est le premier exemple d’une métrique entre deux ensembles. Elle
fut étudiée avec plus de détails par F. Hausdorff [2, “Quellenangaben”, p. 280, and Chap. VIII,
sect. 6] en 1914.
5. Felix Hausdorff (1868–1942) est considéré comme l’un des fondateurs de la topologie mo-
derne.
Dans l’autre sens comme A ⊂ K et B ⊂ K,
sup |dA (x) − dB (x)| ≥ sup |dA (x) − dB (x)| = sup dB (x)
x∈K x∈A x∈A
sup |dA (x) − dB (x)| ≥ sup |dA (x) − dB (x)| = sup dA (x)
x∈K x∈B x∈B

⇒ sup |dA (x) − dB (x)| ≥ max sup dB (x), sup dA (x) .
x∈K x∈A x∈B
Ces quelques exemples illustrent la richesse de la structure d’espace métrique,

mais tous les espaces de fonctions ne sont cependant pas métriques ou métrisables.
2.2 Quelques propriétés

On peut vérifier les propriétés suivantes qui découlent de la définition et des
opérations sur R+ (voir les Exercices 10.3 et 10.4).
(i) Pour tout espace métrique (X, d) et pour toute constante α > 0, la fonction
déf
(x, y) 7→ (αd)(x, y) = α d(x, y)
est une métrique sur X.

(ii) Si d1 et d2 sont deux métriques sur X, la fonction
déf
(x, y) 7→ (d! + d2 )(x, y) = d1 (x, y) + d2 (x, y)

(iii) Pour tout espace métrique (X, d), la fonction
déf d(x, y)
(x, y) 7→ d(x, y) =
1 + d(x, y)
(iv) Soit {dn : n ≥ 1} une suite de fonctions dn : X × X → R+ tel que pour
tout entier n ≥ 1 6
∀x, y ∈ X, dn (x, y) = dn (y, x) (2.1)

∀x, y, z ∈ X, dn (x, z) ≤ dn (x, y) + dn (y, z) (2.2)
x = y ⇒ dn (x, y) = 0 (2.3)
et, en plus,
d1 (x, y) = 0 ⇒ x = y. (2.4)
6. Une application d : X × X → R+ vérifiant les conditions (2.1) à (2.3) est applelée pseu-
dométrique ou écart. En introduisant la relation déquivalence x R y si d(x, y) = 0 et en posant
déf
d∗ (Rx, Ry) = d(x, y) on obtient une métrique sur l’espace quotient X ∗ = X/R.
3. Ensemble ouvert et ensemble fermé 59
La fonction
X∞
déf 1 dn (x, y)
(x, y) 7→ d∞ (x, y) = n 1 + d (x, y)
n=1
2 n
est bien définie et est une métrique sur X.

(v) Soient (Xi , di ), 1 ≤ i ≤ n, des espaces métriques 7
déf
X1 × · · · × Xn = {(x1 , . . . , xn ) : xi ∈ Xi } (2.5)
l’espace produit des Xi . Alors la fonction

déf
(x, y) = ((x1 , . . . , xn ), (y1 , . . . , yn )) 7→ d∞ (x, y) = max di (xi , yi )
1≤i≤n (2.6)
: (X1 × · · · × Xn ) × (X1 × · · · × Xn ) → R+
est une métrique sur X1 × · · · × Xn . De la même façon, pour tout p,

1 ≤ p < ∞, la fonction
( n
)1/p
déf
X
p
dp (x, y) = di (xi , yi ) (2.7)
i=1
est une métrique sur X1 × · · · × Xn .
3 Ensemble ouvert et ensemble fermé

3.1 Boule ouverte et boule trouée
Dans un espace métrique (X, d) les notions d’ensemble ouvert et d’ensemble
fermé peuvent être introduites à l’aide de deux types de boules.
- Boule ouverte centrée en x ∈ X de rayon r > 0 :
déf
Br (x) = {y ∈ X : d(x, y) < r}.
- Boule ouverte trouée centrée en x ∈ X de rayon r > 0 :

déf
Br′ (x) = {y ∈ X : 0 < d(x, y) < r}.
Remarque 3.1.
Attention à la terminologie boule ouverte et à sa notation, car elles peuvent être
trompeuses. Soit R2 muni de la métrique usuelle
déf p
d((x2 , y2 ), (x1 , y1 )) = |y2 − y1 |2 + |x2 − x1 |2 .
7. Certains auteurs associent un nom aux métriques dp : Manhattan pour p = 1 parce que
c’est la plus petite distance entre deux points parcourue par un taxi lorsqu’il se déplace dans une
ville américaine où les rues sont agencées selon un réseau ou quadrillage, Euclide pour p = 2,
Minkowski pour 1 < p < ∞, et Tchebychev ou distance de l’échiquier pour p = ∞.
La boule ouverte de rayon un en (0, 0) dans (R2 , d),

n p o
déf
B1 (0, 0) = (x, y) ∈ R × R : x2 + y 2 < 1 ,
correspond bien à l’intuition que l’on se fait d’une boule. Cependant, si l’on prend
X = Q2 , l’ensemble des points de R2 de coordonnées rationnelles, avec la métrique
d, la boule ouverte de rayon un en (0, 0) dans (Q2 , d) est
n p o
déf
B1 (0, 0) = (x, y) ∈ Q × Q : x2 + y 2 < 1 .
Si l’on prend X = {(x, 0) : x ∈ Q} avec la métrique d, la boule ouverte de rayon un

en (0, 0) dans (X, d) est
déf
B1 (0, 0) = {(x, 0) : x ∈ Q et |x| < 1} ⊂ Q × Q.
Pour être précis, il faudrait ajouter l’indice X et utiliser la notation B1X (0, 0)
pour bien la distinguer de celle de la boule ouverte de rayon un en (0, 0) dans R2 .
Comme l’espace X est en général fixé, on choisit de laisser tomber l’indice X pour
alléger la notation.
3.2 Ensemble ouvert et intérieur d’un ensemble

Définition 3.1.
Soit E une partie d’un espace métrique (X, d).
(i) a ∈ X est un point intérieur de E s’il existe r > 0 tel que Br (a) ⊂ E.
(ii) L’intérieur de E est l’ensemble de tous les points intérieurs de E que l’on
◦
désignera par int E ou E. Par définition int E ⊂ E.
(iii) V (x) est un voisinage de x s’il existe r > 0 tel que Br (x) ⊂ V (x).
(iv) E est ouvert si chaque point de E est un point intérieur de E.
Les notions de boule ouverte, de point intérieur et d’intérieur ne sont pas

intrinsèques car elle dépendent non seulement de E mais aussi du choix de l’espace
ambiant X comme le montre l’exemple suivant.
Exemple 3.1.
Soient R muni de la métrique d(x, y) = |x− y| et Y = {x ∈ R : x ≥ 0}. On considère
pour b > 0 le sous-ensemble E = {x ∈ R : 0 ≤ x < b} pour lequel E ⊂ Y ⊂ R. Le
point 0 n’est pas un point intérieur de E dans (R, d) puisque pour tout r, 0 < r < b,
BrR (0) = {x : −r < x < r} 6⊂ {x ∈ R : 0 ≤ x < b} = E.
Le point 0 est cependant un point intérieur de E dans (Y, d) puisque
BbY (0) = {y ∈ Y : |y − 0| < b} = {y ∈ R : 0 ≤ y < b} = E.

De même, tout point x, 0 < x < b, est un point intérieur car pour r = min{x, b−x} >
0, on a x ≥ r, b − x ≥ r et
BrY (x) = {y ∈ Y : |y − x| < r} = {y ∈ R : x − r < y < x + r} ⊂ E.
Donc, E est ouvert dans (Y, d) mais pas dans (R, d).
On justifie maintenant la terminologie initiale de boule ouverte.

Théorème 3.1. Soit (X, d) un espace métrique.
(i) La boule Br (x) est un ensemble ouvert.
(ii) Pour tout E ⊂ X, int E est ouvert.
(iii) E est ouvert si et seulement si E = int E.
(iv) L’ensemble vide ∅ et tout l’espace X sont des ouverts.
(v) L’ intersection ∩m
i=1 Gi d’une famille finie {Gi : 1 ≤ i ≤ m} d’ouverts est
un ensemble ouvert.
(vi) L’ union ∪α∈A Gα d’une famille arbitraire {Gα : α ∈ A} d’ouverts est un
ensemble ouvert.
Démonstration. (i) Soit y ∈ Br (x). Par définition, d(y, x) < r et h = r −d(y, x) > 0.
Par l’inégalité du triangle
∀z ∈ Bh (y), d(z, x) ≤ d(z, y) + d(y, x) < h + d(y, x) = r ⇒ z ∈ Br (x)
et y ∈ int Br (x). Donc tout point de Br (x) est un point intérieur et Br (x) est un
ensemble ouvert.
(ii) Pour chaque x ∈ int E, il existe r > 0 tel que Br (x) ⊂ E. Donc, pour tout
y ∈ Br (x), on a 0 < d(y, x) < r. Soit ρ = r − d(y, x) > 0. On a
∀z ∈ Bρ (y), d(z, x) ≤ d(z, y) + d(y, x) < r − d(y, x) + d(y, x) = r

⇒ Bρ (y) ⊂ Br (x) ⊂ E ⇒ y ∈ int E.
On en conclut que Br (x) ⊂ int E et que x est un point intérieur de int E. Donc
int E est ouvert. On a aussi montré que int E ⊂ int (int E).
(iii) De la partie (ii), int E est ouvert. Si E = int E, alors E est ouvert.
Réciproquement, par définition, int E ⊂ E. Si E est ouvert, alors pour chaque
x ∈ E, il existe r > 0 tel que Br (x) ⊂ E et x ∈ int E. Donc E ⊂ int E et E = int E.
(iv) De la partie (iii). Comme il n’y a pas de points dans ∅, l’ensemble de ses
points intérieurs est vide : int ∅ = ∅. Par définition de Br (x), pour tout x ∈ X et
tout r > 0, on a toujours Br (x) ⊂ X et donc X ⊂ int X ⊂ X. Donc X = int X et
X est un ouvert.
(v) Si ∩m m
i=1 Gi = ∅, le résultat est vrai. Sinon, soit x ∈ ∩i=1 Gi . Comme pour
chaque i, x ∈ Gi et que Gi est ouvert, il existe ri > 0 tel que Bri (x) ⊂ Gi . On
prend r = min{ri : 1 ≤ i ≤ m} > 0 qui est strictement positif. Donc
∀i, 1 ≤ i ≤ m, Br (x) ⊂ Gi ⇒ Br (x) ⊂ ∩m

i=1 Gi .
(vi) Si tous les Gα sont vides, l’union est vide et il n’y a rien à démontrer.
Sinon, pour chaque x ∈ ∪α∈A Gα , il existe α ∈ A tel que x ∈ Gα . Comme Gα est
ouvert, il existe r > 0 tel que
Br (x) ⊂ Gα ⊂ ∪α∈A Gα
et x est un point intérieur de ∪α∈A Gα .
Définition 3.2.
Soit (X, d) un espace métrique.
(i) La famille T de tous les ouverts dans X est appelée la topologie 8 de X
générée par la métrique d.
(ii) On dit qu’une famille d’ouverts {Oα } est une base de (X, d) si tout ouvert
de X est la réunion d’ouverts de cette famille.
Théorème 3.2. Soit (X, d) un espace métrique. La famille de toutes les boules
ouvertes {Br (x) : x ∈ X, r > 0} plus l’ensemble vide ∅ est une base de (X, d).
Démonstration. Par le Théorème 3.1 (iii), lorsque ∅ 6= E ⊂ X est ouvert, il coı̈ncide
avec son intérieur int E. Si x ∈ int E, il existe rx > 0 tel que Brx (x) ⊂ E. Donc
E ⊂ ∪x∈E Brx (x) ⊂ E ⇒ E = ∪x∈E Brx (x).
On revient à l’Exemple 3.1. Si (X, d) est un espace métrique, alors pour toute
partie Y ⊂ X, (Y, d) est aussi un espace métrique avec ses ouverts. Il est donc
important de bien comprendre l’utilisation de la notation ambigue Br (x) pour la
boule ouverte. En effet la boule ouverte de centre a ∈ X et de rayon r > 0 dans
(X, d) est définie comme
déf
BrX (a) = {z ∈ X : d(x, a) < r},
alors que la boule ouverte de centre b ∈ Y et de rayon r > 0 dans (Y, d) est définie
comme
déf
BrY (b) = {z ∈ Y : d(y, b) < r}.
Si a ∈ Y ⊂ X, on a alors
BrY (a) = Y ∩ BrX (a).

8. Soit X un ensemble. Une topologie T sur X est une collection de parties de X vérifiant
les axiomes suivants :
(O 1) toute union d’ensembles de T est dans T ,
(O 2) toute intersection finie d’ensembles de T est dans T ,
(O 3) ∅ ∈ T et X ∈ T .
Pour simplifier on laisse tomber les indices X et Y lorsque le contexte le permet,

mais il ne faut pas perdre de vue les différences.
On introduit la terminologie suivante qui n’ajoute rien de plus à ce que l’on a
dit jusqu’ici.
Définition 3.3.
Soient (X, d) un espace métrique et Y ⊂ X. Un ensemble G ⊂ Y est ouvert relati-
vement à Y si G est ouvert dans (Y, d), c’est-à-dire, pour chaque x ∈ G
∃r > 0 tel que BrY (x) ⊂ G, (3.1)
où BrY (x) est la boule dans Y :

déf
BrY (x) = {y ∈ Y : d(y, x) < r} .
L’ensemble de tous les ouverts par rapport à (Y, d) forme la topologie relative de
(Y, d) par rapport à la topologie de (X, d).
Un ouvert relativement à X est ouvert relativement à Y , mais, comme on l’a vu

précédemment dans l’Exemple 3.1, si X 6= Y , alors un ouvert relativement à Y n’est
pas nécessairement ouvert relativement à X.
Théorème 3.3. Soient (X, d) un espace métrique et Y ⊂ X. E ⊂ Y est ouvert
relativement à (Y, d) si et seulement si il existe un ouvert O relativement à (X, d)
tel que E = O ∩ Y .
Démonstration du Théorème 3.3. Si E est ouvert relativement à (Y, d), pour chaque
x ∈ E il existe rx > 0 tel que
{z ∈ Y : d(z, x) < rx } ⊂ E ⇒ Y ∩ {z ∈ X : d(z, x) < rx } ⊂ Y ∩ E = E.
Soit
déf
O = ∪x∈E {z ∈ X : d(z, x) < rx }.
C’est un ouvert relativement à X en tant qu’union de boules ouvertes dans X et
O ∩ Y = ∪x∈E {z ∈ Y : d(z, x) < rx }.
Mais comme E est ouvert relativement à Y ,
∪x∈E {z ∈ Y : d(z, x) < rx } ⊂ E = ∪x∈E {x} ⊂ ∪x∈E {z ∈ Y : d(z, x) < rx }
⇒ E = ∪x∈E {z ∈ Y : d(z, x) < rx } = O ∩ Y.
Réciproquement, si O est un ouvert dans X tel que E = O ∩ Y , alors tout point
x ∈ E ⊂ O est un point intérieur de O dans X. Donc, il existe rx > 0 tel que
{z ∈ X : d(z, x) < rx } ⊂ O et
{z ∈ Y : d(z, x) < rx } = {z ∈ X : d(z, x) < rx } ∩ Y ⊂ O ∩ Y = E.
De là, par définition, x est un point intérieur de E relativement à Y et E est ouvert
relativement à Y .
3.3 Ensemble fermés et adhérence d’un ensemble

Les notions d’ensemble fermé et de point d’adhérence peuvent être amenées
de plusieurs façons. On commence ici par les notions de point d’accumulation et de
point isolé. La notion de point d’accumulation sera nécessaire plus tard pour définir
la notion de limite d’une fonction en un point.
Définition 3.4.
(i) a ∈ E est un point isolé de E si
∃r > 0 tel que Br′ (a) ∩ E = ∅.
(ii) a ∈ X est un point d’accumulation de E si
∀r > 0, Br′ (a) ∩ E 6= ∅.
On désignera par E ′ l’ensemble des points d’accumulation de E.
Remarque 3.2.
De cette définition, on constate que les points isolés de E sont donnés par
déf
/ E′}
E\E ′ = {x ∈ E : x ∈ (3.2)
(voir Définition 3.6 du complémentaire en page 65.)
Il faut être prudent en présence de définitions aussi générales même dans R.
Exemple 3.2.
Soit R avec la métrique d(x, y) = |x − y|. On se donne les sous-ensembles
F = {x ∈ R : x > 0} et E = {x ∈ R : 0 < x ≤ b}, 0 < b,
pour lesquels E ⊂ F ⊂ R. Équipé de la même métrique d, (F, d) et (E, d) sont aussi

On s’intéresse maintenant aux point d’accumulation du sous-ensemble E par
rapport à (R, d), (F, d) et (E, d). On applique donc la définition avec X égal à R,
F et E.
(i) Dans (R, d), int E = {x ∈ R : 0 < x < b} et E ′ = [0, b] = E ∪ {0}.
(ii) Dans (F, d), int E = {x ∈ R : 0 < x < b} et E ′ = (0, b] = E.
(iii) Dans (E, d), int E = {x ∈ R : 0 < x ≤ b} et E ′ = (0, b] = E.
On voit que dans les deux derniers cas, le point 0 n’est pas un point d’accumulation
ce qui est contraire à notre intuition qui a tendance à voir l’ensemble E dans le
contexte de R où 0 est un point d’accumulation.
Théorème 3.4. Soit E une partie de (X, d).

(i) Si x ∈ X est un point d’accumulation de E, alors tout voisinage de x
contient une infinité de points de E.
(ii) Si E ne contient qu’un nombre fini de points, alors tous ses points sont
des points isolés.
Démonstration. (i) Il suffit de démontrer pour toute boule ouverte Br (x) contient
une infinité de points de E. Supposons donc qu’il existe r > 0 tel que Br (x) ne
contienne qu’un nombre fini de points x1 , . . . xn de E distincts de x. Soit
déf
r = min{d(xi , x) : 1 ≤ i ≤ n}.
Le rayon r > 0 puisqu’il n’y a qu’un nombre fini de points distincts de x et en

conséquence la boule trouée est vide : Br′ (x) = ∅. Par définition, x serait un point
isolé de E ce qui contredit l’hypothèse de départ.
(ii) C’est un corollaire de (i).
On passe maintenant à la notion tout aussi délicate d’ensemble fermé.
Définition 3.5.
Soit E une partie d’un espace métrique (X, d). E est un ensemble fermé s’il contient
tous ses points d’accumulation, c’est-à-dire, si E ′ ⊂ E.
Encore une fois, il faut être prudent en présence de définitions aussi générales.
Exemple 3.3 (Exemple 3.2).

Soit R avec la métrique d(x, y) = |x − y|. On se donne les sous-ensembles
F = {x ∈ R : x > 0} et E = {x ∈ R : 0 < x ≤ b}, 0 < b,
pour lesquels E ⊂ F ⊂ R. Équipé de la même métrique d, (F, d) et (E, d) sont aussi

On applique donc la définition d’un fermé à E avec X égal à R, F et E.
(i) Dans (R, d), E ′ = [0, b] et 0 ∈
/E ⇒ E n’est pas fermé dans (R, d).
′
(ii) Dans (F, d), E = (0, b] = E ⇒ E est fermé dans (F, d).
′
(iii) Dans (E, d), E = (0, b] = E ⇒ E est fermé dans (E, d).
Comme pour la notion de point d’accumulation, on voit qu’être fermé n’est pas une
propriété intrinsèque de E.
On introduit maintenant la notion de complémentaire qui permettra d’établir

un lien direct entre les ouverts et les fermés et de déduire plusieurs propriétés des
fermés de celles des ouverts et vice-versa.
Définition 3.6.
Soient A et B deux parties d’un ensemble X.
(i) L’ensemble {x ∈ A : x ∈
/ B} est le complément de B par rapport à A. On
écrira A\B ou ∁A B.
(ii) Lorsque A = X on écrira ∁B ou X\B et on dira que ∁B est le complément
de B par rapport à X.
De retour aux fermés et aux ouverts, on a le résultat suivant.
Théorème 3.5. Soit E une partie d’un espace métrique (X, d).
(i) E est ouvert si et seulement si X\E est fermé. En particulier, X et ∅ sont
à la fois ouverts et fermés dans (X, d).
(ii) E est fermé dans (X, d) si et seulement si X\E est ouvert dans (X, d).
Démonstration. (i) (⇒) Par l’absurde : si X\E n’est pas fermé, alors il existe un
point d’accumulation x ∈ (X\E)′ qui n’appartient pas à X\E. Donc x ∈ E. Comme
E est ouvert, il existe r > 0 tel que Br (x) ⊂ E et donc
∃r > 0 tel que Br (x) ∩ (X\E) = ∅ ⇒ ∃r > 0 tel que Br′ (x) ∩ (X\E) = ∅
/ X\E. Mais ceci contredit le fait que x ∈ (X\E)′ .

puisque x ∈
(⇐) Comme X\E est fermé, (X\E)′ ⊂ X\E. Pour tout x ∈ E on a donc
x∈/ (X\E)′ ce qui veut dire que
∃r > 0 tel que Br′ (x) ∩ (X\E) = ∅
et comme x ∈
/ (X\E)
∃r > 0 tel que Br (x) ∩ (X\E) = ∅ ⇒ Br (x) ⊂ E ⇒ x ∈ int E.
Comme tous les points de E sont des points intérieurs, E est ouvert par définition.
(ii) On applique la partie (i) à X\E : E = X\(X\E) est fermé si et seulement
X\E est ouvert.
On complète maintenant la liste des propriétés des fermés en introduisant la

notion de point d’adhérence qui englobe à la fois celles de point d’accumulation et
de point isolé.
Définition 3.7.
(i) a ∈ X est un point d’adhérence de E si pour tout r > 0 on a Br (a)∩E 6= ∅.
(ii) L’adhérence de E est l’ensemble de tous les points d’adhérence de E. On
la notera E.
6 ∅. On a
On voit que E ⊂ E puisque, pour tout r > 0, Br (x) ∩ E ∋ {x} =
aussi pour tout point d’accumulation x ∈ E ′
∀r > 0, Br′ (x) ∩ E 6= ∅ ⇒ Br x) ∩ E 6= ∅ ⇒ E ′ ⊂ E.
Lemme 3.1. Soit E une partie d’un espace métrique (X, d).
(i) E = E ∪ E ′ et
E= E′ ∪ E\E ′ .
points d’accumulation points isolés de E
de E
(ii) int (X\E) = X\E et int E = X\(X\E).
Démonstration. (i) On a déjà montré que E ∪ E ′ ⊂ E. Dans l’autre sens, pour tout
point d’adhérence x ∈ E et toute boule ouverte Br (x), on a Br (x) ∩ E 6= ∅. Si pour
tout r > 0, Br′ (x) ∩ E 6= ∅, alors x est un point d’accumulation de E. S’il existe
r > 0 tel que Br′ (x) ∩ E = ∅, alors comme {x} = Br (x) ∩ E 6= ∅, on a x ∈ E. Par
définition, c’est un point isolé de E. Donc E ⊂ E ∪ E ′ .
/ E = E ′ ∪ E, c’est-à-dire x ∈
(ii) Soit x ∈ X\E. Alors, de la partie (i), x ∈ / E′
′
et x ∈ / E. Donc, il existe r > 0 tel que Br (x) ∩ E = ∅. Comme x ∈ / E on a
Br (x) ∩ E = ∅ et Br (x) ⊂ X\E. Par définition x ∈ int X\E ce qui montre que
X\E ⊂ int (X\E).
Dans l’autre sens, si x ∈ int (X\E), il existe r > 0 tel que Br (x) ⊂ X\E ce
qui implique que Br (x) ∩ E = ∅. Donc, x ∈ / E et, de là, x ∈ X\E. Pour la seconde
identité voir l’Exercice 10.10 (a).
On montre maintenant que l’adhérence de E est un fermé ce explique la termi-

nologie largement utilisée fermeture de E pour l’adhérence de E. Comme le montre
l’Exercice 10.8, on aurait pu démontrer ce résultat directement sans passer par le
complémentaire et le Théorème 3.5.
Théorème 3.6. Soit E une partie d’un espace métrique (X, d). L’adhérence E de
E est fermée dans (X, d).
Démonstration. Par le Théorème 3.1 (ii), int (X\E) est ouvert. Par le Lemme 3.1
(ii), int (X\E) = X\E. Par le Théorème 3.5 (i), son complement E = X\(int (X\E))
est fermé.
On complète maintenant la liste des propriétés de l’adhérence.
Théorème 3.7. Soit E une partie d’un espace métrique (X, d).
(i) x ∈ X est un point d’adhérence de E si et seulement si, pour tout voisinage
V (x) de x, V (x) ∩ E 6= ∅.
(ii) E est fermé si et seulement si E = E.
(iii) Pour toutes parties A et B de X tel que A ⊂ B, on a A ⊂ B. Si B est
fermé, alors A ⊂ B. En particulier A = A.
Démonstration. (i) Comme les boules en x sont des voisinages de x, la condition

implique que pour tout r > 0, Br (x) ∩ E 6= ∅. Réciproquement, comme pour tout
voisinage V (x) de x, il existe r > 0 tel que Br (x) ⊂ V (x), on a V (x) ∩ E ⊃
Br (x) ∩ E 6= ∅.
(ii) Comme du Théorème 3.6 E est fermée, E = E entraı̂ne que E est fermé.
Réciproquement, si E est fermé, il contient tous ses points d’accumulation, c’est-à-
dire, E ′ ⊂ E. Par le Lemme 3.1 (i), E = E ′ ∪E et trivialement E ⊂ E = E ′ ∪E ⊂ E.
De là, E = E.
(iii) Pour x ∈ A, on a Br (x) ∩ A 6= ∅ pour tout r > 0. Comme A ⊂ B,
Br (x) ∩ B 6= ∅ pour tout r > 0 et x ∈ B. Donc A ⊂ B. Si, en plus B est fermé,
alors B = B et A ⊂ B = B.
Comme A ⊂ A, on a A ⊂ A et comme A ⊂ A et que A est fermé, on a A ⊂ A

et A = A.
Théorème 3.8. Soit E ⊂ R non-vide et borné supérieurement dans R. Alors
sup E ∈ E et, si E est fermé, sup E ∈ E.
Corollaire 1. Soit E ⊂ R non-vide et borné inférieurement dans R. Alors inf E ∈
E et, si E est fermé, inf E ∈ E.
Démonstration. Si sup E ∈ E, alors sup E ∈ E ⊂ E. Sinon, sup E ∈
/ E. Si, en plus,
sup E ∈
/ E, il existe r > 0 tel que
Br (sup E) ∩ E = ∅
⇒ ∀x ∈ E, sup E + r ≤ x ou x ≤ sup E − r
Dans le premier cas, comme sup E est une borne supérieure de E, on a x ≤ sup E
pour tout x ∈ E et cela impliquerait sup E + r ≤ x ≤ sup E et r ≤ 0 une contra-
diction. Comme le premier a été exclus, il ne reste donc que le second cas
∀x ∈ E, x ≤ sup E − r.
Cependant, par définition du sup E, on sait qu’il existe x0 ∈ E tel que
sup E − r < x0 ≤ sup E
ce qui contredit ce qui précède.
Figure 3.3. Augustus De Morgan (1806–1871).
Pour obtenir les propriétés des ensembles fermés à partir de celles des ouverts,
on utilise la propriété du complémentaire et les règles de De Morgan. 9
Théorème 3.9. Pour toute famille {Xα : α ∈ A} de parties d’un ensemble X
∁(∪α∈A Xα ) = ∩α∈A ∁Xα et ∁(∩α∈A Xα ) = ∪α∈A ∁Xα . (3.3)

9. Augustus De Morgan (1806–1871) est un mathématicien et logicien britannique.
Démonstration. On a les équivalences suivantes : x ∈ ∁(∪α∈A Xα ) ⇐⇒ x ∈ /

∪α∈A Xα ⇐⇒ ∀α ∈ A, x ∈ / Xα ⇐⇒ ∀α ∈ A, x ∈ ∁Xα ⇐⇒ x ∈ ∩α∈A ∁Xα .
Pour la seconde relation, on applique la première à la famille {∁Xα : α ∈ A}
et on prend le complément des deux membres
∁(∪α∈A ∁Xα ) = ∩α∈A ∁∁Xα = ∩α∈A Xα (3.4)
⇒ ∪α∈A ∁Xα = ∁∁(∪α∈A ∁Xα ) = ∁ (∩α∈A Xα ) . (3.5)

(i) L’ union d’une famille finie {Fi : 1 ≤ i ≤ m} de fermés est un ensemble
fermé.
(ii) Pour toutes parties A et B de X, A ∪ B = A ∪ B et A ∩ B ⊂ A ∩ B.
(iii) L’ intersection d’une famille arbitraire {Fα : α ∈ A} de fermés est un
ensemble fermé.
(iv) E = ∩{F : F fermé et E ⊂ F }.
Démonstration. (i) Par les règles de De Morgan via le complémentaire et le Théorème
3.5 en utilisant le fait que l’intersection d’une famille finie d’ouverts est ouverte.
(ii) Comme A et B sont fermés, de la partie (i) leur union A ∪ B est fermée.
Donc A ∪ B ⊂ A ∪ B entraı̂ne A ∪ B ⊂ A ∪ B. Dans l’autre sens A ⊂ A ∪ B et
B ⊂ A ∪ B entraı̂nent A ∪ B ⊂ A ∪ B. De là, A ∪ B = A ∪ B.
Pour l’intersection, A ∩ B ⊂ A et A ∩ B ⊂ B entraı̂nent A ∩ B ⊂ A par le
Théorème 3.7 (iii) et A ∩ B ⊂ B, d’où le résultat.
(iii) Par les règles de De Morgan via le complémentaire et le Théorème 3.5.
(iv) On pose A = ∩{F : F fermé et E ⊂ F }. Par définition de A, E ⊂ A
et A est fermé comme intersection de fermés. Du Théorème 3.7 (iv), E ⊂ A. Mais
comme E est fermé et E ⊂ E, il vient
E ⊂ ∩{F : F fermé et E ⊂ F } ⊂ {E : E fermé et E ⊂ E} = E
et E = A.
Remarque 3.3.
En général, on n’a que A ∩ B ⊂ A ∩ B. Il suffit de prendre A = (0, 1) et B = (1, 2)
dans R. On a A ∩ B = ∅ mais A = [0, 1], B = [1, 2] et A ∩ B = {1}.
Remarque 3.4 (Exercice 10.6).

L’identité A ∪ B = A ∪ B se généralise à une famille finie A1 , A2 , . . . de sous-
ensembles d’un espace métrique :
∪ni=1 Ai = ∪ni=1 Ai .
Mais, pour une famille dénombrable, on a seulement
∞
∪∞
i=1 Ai ⊃ ∪i=1 Ai .
3.4 Frontière d’un ensemble

Enfin, on donne la définition et quelques propriétés de la frontière d’un en-
semble.
Définition 3.8.
Soit E une partie d’un espace métrique (X, d). La frontière de E est définie comme
E ∩ X\E. On la notera ∂E.
La boule ouverte Br (x) dans R2 a pour frontière le cercle de rayon r. Cela correspond
bien à notre intuition d’une frontière ou du bord d’un objet géométrique. Il y a
cependant des frontières que l’on pourrait qualifier d’épaisses.
Exemple 3.4.
On considère le sous-ensemble E = Br (x) ∩ (Q × Q) de X = R × R des points à
coordonnées rationnelles dans le disque Br (x). Par densité des rationnels et des
irrationnels dans R,
E = Br (x), ∁E = R × R ⇒ ∂E = Br (x).
On peut donc dire que la frontière de E est épaisse.
Théorème 3.11. Soit E une partie d’un espace métrique (X, d). Alors,
∂(X\E) = ∂E (3.6)
E = int E ∪ ∂E et ∂E = E\int E (3.7)
X\E = int (X\E) ∪ ∂E et ∂E = X\E\int (X\E). (3.8)
Démonstration. Par définition, ∂E = E ∩ X\E et ∂(X\E) = X\E ∩ E. Donc

∂E = ∂(X\E). On a vu que int E ⊂ E ⊂ E. On peut donc écrire
E = int E ∪ (E\int E).
Du Lemme 3.1, int (X\E) = X\E et, en l’applicant au complément X\E,
int E = X\(X\E) ⇒ X\int E = (X\E)

⇒ E\int E = E ∩ (X\int E) = E ∩ (X\E) = ∂E
et E = int E ∪ ∂E. De plus,
∅ = int E ∩ (E\int E) = int E ∩ ∂E ⇒ ∂E = E\int E.
De la même façon, comme ∂E = E ∩ X\E = ∂(X\E),
X\E = int (X\E) ∪ ∂(X\E) = int (X\E) ∪ ∂E,
int (X\E) ∩ ∂E = ∅ et ∂E = X\E\int (X\E).

4. Ensembles compacts 71
4 Ensembles compacts
La compacité est une propriété topologique importante qui se définit en topo-
logie générale, à partir de la notion de recouvrement ouvert. Toutefois dans le cadre
des espaces métriques (comprenant notamment les espaces vectoriels normés), il
est possible d’en donner une caractérisation en termes de suites. Il est fréquent de
faire prendre à cette dernière le rôle d’une définition. La notion de compacité ainsi
présentée est appelée compacité séquentielle. On la verra un peu plus loin.
Définition 4.1.
(i) Une famille d’ouverts {Gα : α ∈ A} est un recouvrement ouvert de E si
E ⊂ ∪α∈A Gα .
(ii) E est compacte si de tout recouvrement ouvert {Gα : α ∈ A} de E on peut

extraire un sous-recouvrement fini, c’est-à-dire,
∃α1 , . . . , αn ∈ A tel que E ⊂ ∪ni=1 Gαi .
Remarque 4.1.
De ces définitions, tout ensemble fini est compact. L’ensemble vide ∅ est compact.
En effet, si X = ∅, le seul recouvrement ouvert de ∅ n’a qu’un seul élément ∅ et la
définition est vérifiée. Si X 6= ∅, alors de tout recouvrement ouvert {Gα : α ∈ A}
de ∅, on a un sous-recouvrement par n’importe quel Gα : ∅ ⊂ Gα .
On a vu que les notions d’ensembles ouvert ou fermé dépendent du sous-

espace métrique par rapport auquel elles sont définies. Il n’en est pas de même pour
la notion d’ensemble compacte qui est une notion intrinsèque.
Théorème 4.1. Soit un espace métrique (X, d), Y ⊂ X et E ⊂ Y . E est compact
relativement à (Y, d) si et seulement si il est compact relativement à (X, d).
Démonstration. Soit E compact relativement à X. On considère un recouvrement
ouvert {Gα : α ∈ A} dans Y de E. Du Théorème 3.3 pour chaque ouvert Gα par
rapport à Y , il existe un ouvert Oα par rapport à X tel que Gα = Oα ∩ Y . La
famille d’ouverts {Oα : α ∈ A} dans X est donc un recouvrement ouvert de E et,
comme E est compact relativement à X, il existe un sous-recouvrement fini :
∃α1 , . . . , αn ∈ A tel que E ⊂ ∪ni=1 Oαi
⇒ ∃α1 , . . . , αn ∈ A tel que E = E ∩ Y ⊂ ∪ni=1 Oαi ∩ Y = ∪ni=1 Gαi .
Par définition, E est compact relativement à Y .
Réciproquement, on considère un recouvrement ouvert {Oα : α ∈ A} de E
dans X. Du Théorème 3.3, Gα = Oα ∩ Y est ouvert par rapport à Y . Comme
E⊂Y
E = E ∩ Y ⊂ ∪α∈A Oα ∩ Y = ∪α∈A Gα
et {Gα : α ∈ A} est un recouvrement ouvert de E dans Y . Comme E est compact

relativement à Y , il existe un sous-recouvrement fini puisque de E :
E ⊂ ∪ni=1 Gαi .
Enfin, comme Gα ⊂ Oα ,
E ⊂ ∪ni=1 Gαi ⊂ ∪ni=1 Oαi
ce qui donne la compacité de E par rapport à X.
Remarque 4.2.
En particulier, si Y = E, la compacité relativement à (E, d) signifie que les ouverts
du recouvrement {Gα : α ∈ A} de E relativement à (E, d) sont des sous-ensembles
de E et non de X :
E = ∪α∈A Gα .
E est donc égal à l’union d’un nombre fini de Gα . La notion de compacité de E ne

dépend pas du cadre ambient (X, d), mais seulement de E et de la métrique d.
Définition 4.2.
Soit E une partie d’un espace métrique (X, d). (E, d) est borné si E = ∅ ou s’il
existe x ∈ X et r > 0 tel que E ⊂ Br (x).
Remarque 4.3.
Comme la compacité, la bornitude est une notion intrinsèque. En effet, pour ∅ 6=
E ⊂ Y ⊂ X, on a
E borné dans (X, d) ⇐⇒ E borné dans (Y, d) ⇐⇒ E borné dans (E, d).
Si E est borné dans (X, d), il existe x ∈ X et r > 0 tel que E ⊂ BrX (x). On choisit
un point a ∈ E :
X
∀y ∈ E, d(y, a) ≤ d(y, x) + d(x, a) < r + d(x, a) ⇒ E ⊂ Br+d(x,a) (a)
X X Y
⇒ E ⊂ Br+d(x,a) (a) ∩ E ⊂ Br+d(x,a) (a) ∩ Y = Br+d(x,a) (a)
et E est borné non seulement dans (Y, d) mais aussi dans (E, d). Enfin, si E est
borné dans (E, d), il existe x ∈ E et r > 0 tel que E ⊂ BrE (x) ⊂ BrX (x) et E est
borné dans (X, d).
Théorème 4.2. Toute partie compacte d’un espace métrique (X, d) est bornée et
fermée.
En général, la réciproque de ce théorème n’est pas vraie comme le montre l’Exemple

4.1 en dimension un plus bas et l’Exemple 7.1 page 92 en dimension infinie que l’on
verra plus tard. Cependant, elle l’est pour l’espace euclidien E = Rk ou tout fermé
E ⊂ Rk avec la métrique d(x, y) = kx − yk comme on le verra au Théorème 5.4.
4. Ensembles compacts 73
Exemple 4.1.
On considère l’espace métrique R+ = {x ∈ R : x > 0}, le sous-ensemble E = ]0, 1]
est borné et fermé dans R+ . Il n’est cependant pas compact dans R+ car s’il l’était,
par le Théorème 4.1, il devrait aussi être compact dans R, où il n’est pas fermé car
0 est un point d’accumulation de E dans R qui n’appartient pas à E.
Démonstration du Théorème 4.2. Soit K un compact dans (X, d).

(i) Si K = ∅, il est borné par convention. Sinon, soit x ∈ K. Comme X =
∪∞n=1 n (x), la famille de boules ouvertes {Bn (x) : n ≥ 1} est un recouvrement
B
ouvert de K et il existe un sous-recouvrement fini {Bni (x) : 1 ≤ i ≤ m} de K. Donc
K ⊂ Br (x) pour r = max{ni : 1 ≤ i ≤ m} et K est bornée.
(ii) On montre que ∁K est ouvert ce qui impliquera que K est fermé par le
Théorème 3.5. Si K = X ou K = ∅, alors ∁K est ouvert. Sinon, ∅ 6= K $ X et
∁K n’est pas vide. Soit x ∈ ∁K. Pour tout y ∈ K, d(y, x) > 0. On associe à chaque
y ∈ K, un rayon ry tel que 0 < ry < d(y, x)/2 et les boules
déf déf
Bry (x) = {z ∈ X : d(z, x) < ry } et Bry (y) = {z ∈ X : d(z, y) < ry }
⇒ Bry (y) ∩ Bry (y) = ∅ ⇒ Bry (y) ⊂ ∁Bry (x)
puisque l’intersection est vide par choix du rayon ry . La famille de boules {Bry (y) :
y ∈ K} est un recouvrement ouvert de K. Par compacité, il existe un sous-
recouvrement {Bryi (yi ) : 1 ≤ i ≤ n} de K tel que
K ⊂ ∪ni=1 Bryi (yi )

⇒ K ⊂ ∪ni=1 Bryi (yi ) ⊂ ∪ni=1 ∁Bryi (x) = ∁ ∩ni=1 Bryi (x)
par les règles de de Morgan. On choisit r = min{ryi ; 1 ≤ i ≤ n} > 0 Donc,
Br (x) = Bmin{ryi ;1≤i≤n} (x) = ∩ni=1 Bryi (x)

⇒ K ⊂ ∁Br (x) ⇒ Br (x) ⊂ ∁K.
Comme il existe r > 0 tel que Br (x) ⊂ ∁K, x est un point intérieur de ∁K et ∁K
est ouvert.
Théorème 4.3. Soit K un compact dans un espace métrique (X, d). Toute partie
fermée E de K est compacte.
Démonstration. Soit {Gα : α ∈ A} un recouvrement ouvert de E dans X. Comme
E est fermé, ∁E est ouvert et la famille {Gα : α ∈ A} plus ∁E est un recouvrement
ouvert de K :
K ⊂ E ∪ ∁E ⊂ ∪α∈A Gα ∪ ∁E.
Par compacité. il existe un recouvrement fini
K ⊂ ∪ni=1 Gαi ∪ ∁E ⇒ E ⊂ K ⊂ ∪ni=1 Gαi ∪ ∁E ⇒ E ⊂ ∪ni=1 Gαi
et E est compact.
Corollaire 1. Si E est fermée et K est compacte, alors E ∩ K est compacte.

Démonstration. Comme K est compacte, elle est fermée et K ∩ E est fermée. Enfin,
comme K ∩ E ⊂ K, l’intersection K ∩ E est compacte par le théorème.
Théorème 4.4. Soit {Kα : α ∈ A} une famille de compacts dans un espace
métrique (X, d) vérifiant la propriété d’intersection finie non-vide, c’est-à-dire,
∀α1 , . . . , αn ∈ A, ∩ni=1 Kαi 6= ∅. (4.1)
Alors
∩α∈A Kα 6= ∅. (4.2)
Démonstration. De la propriété (4.1), pour chaque α, Kα 6= ∅. Supposons ∩α∈A Kα =

∅ et fixons un indice β ∈ A. On peut alors écrire en utilisant la règle de De Morgan

Kβ ∩ ∩α∈A Kα = ∅ ⇒ Kβ ⊂ ∁ ∩α∈A Kα = ∪α∈A ∁Kα .
α6=β α6=β α6=β
Comme chaque ∁Kα est ouvert, on a un recouvrement ouvert du compact Kβ . Par

définition de la compacité, il existe un sous-recouvrement
Kβ ⊂ ∪ni=1 ∁Kαi = ∁ [∩ni=1 Kαi ] ⇒ Kβ ∩ [∩ni=1 Kαi ] = ∅

⇒ Kβ ∩ Kα1 ∩ · · · ∩ Kαn = ∅
ce qui contredit la propriété d’intersection finie non-vide.

Corollaire 1. Si {Kn : n ∈ N} est une suite décroissante de compacts non-vides
dans (X, d), alors ∩∞
n=1 Kn 6= ∅.
Démonstration. En effet, comme la suite est décroissante, on a pour toute sous-

famille finie {Kni : 1 ≤ i ≤ m},
∩m
i=1 Kni = Kmax{ni :1≤i≤m} 6= ∅.
et donc la propriété d’intersection finie non-vide.

Théorème 4.5. Si K est compact, alors tout sous-ensemble infini E de K possède
au moins un point d’accumulation, c’est-à-dire, E ′ ∩ K 6= ∅.
Remarque 4.4.
La réciproque de ce théorème est vraie, mais sa démonstration nécessite quelques
résultats préliminaires non-triviaux. On peut y arriver en regardant la question du
point de vue de la topologie générale et en considérant les espaces métriques comme
un cas particulier. Cela conduirait à l’introduction de notions trop générales pour
ces notes. L’approche privilégiée sera donc de passer par les suites et les sous-suites
qui sont de toutes façons une partie incontournable des espaces métriques. Cette
réciproque sera démontrée plus loin au paragraphe 7 en page 89 où l’on introduira
aussi la notion de compacité séquentielle.
5. Caractérisation de la compacité dans Rk 75
Démonstration du Théorème 4.5. Par l’absurde. Si E ′ ∩ K = ∅, alors pour tout

y ∈ K, il existe ry > 0 tel que
E ∩ Br′ y (y) = ∅.
La famille {Bry (y) : y ∈ Y } est un recouvrement ouvert de K. Comme K est

compact, il existe un recouvrement fini, c-à-d., y1 , . . . , yn dans K tel que
n
[
E⊂K ⊂ Bryi (yi )
i=1
n
[ [n n
[
⇒ E=E∩ Bryi (yi ) = E ∩ Bryi (yi ) ⊂ {yi }.
i=1 i=1 i=1
On en conclut que E ne possède qu’un nombre fini de points ce qui contredit l’hy-
pothèse que E est infini.
5 Caractérisation de la compacité dans Rk

Un segment I est un sous-ensemble de R de la forme
déf
[a, b] = {x ∈ R : a ≤ x ≤ b} (5.1)
pour un couple de réels a < b. La notion de segment s’étend à Rk , k ≥ 2. Un pavé

P de dimension k est un sous-ensemble de Rk de la forme
déf
P = {x = (x1 , . . . , xk ) : ai ≤ xi ≤ bi , 1 ≤ i ≤ k} (5.2)
pour des paires de réels ai < bi , 1 ≤ i ≤ k. On rappelle que l’espace vectoriel Rk

muni d’une des normes d(x, y) = kx − ykp , 1 ≤ p ≤ ∞, est un espace métrique. Les
résultats de ce paragraphe sont indépendants du choix de p.
En préparation du théorème principal, on démontre trois résultats intermé-
diaires (voir aussi l’Exemple 10.16) qui établissent que le segment et le pavé sont
compacts. Si on l’avait su du début, on aurait obtenu les deux prochains théorèmes
à partir du Corollaire 1 au Théorème 4.4.
Théorème 5.1. Pour toute suite décroissante de segments {In } dans R, c’est-à-
dire,
∀n ≥ 1, In+1 ⊂ In ,
on a ∩∞
n=1 In 6= ∅.
Démonstration. Chaque In est de la forme [an , bn ] pour an < bn . Comme l’ensemble

E = {an : n ≥ 1} est borné supérieurement par b1 , sup E = supn≥1 an ∈ R.
Appelons ce point x. Pour tout n ≥ 1 et m ≥ 1, on a
an ≤ an+m < bn+m ≤ bm ⇒ ∀m ≥ 1, x = sup an ≤ bm .

n≥1
On a donc x ≤ bm pour tout m ≥ 1 et comme x est une borne supérieure de E on

a aussi am ≤ x pout tout m ≥ 1. Donc, x ∈ Im = [am , bm ] pour tout m ≥ 1 et
∩∞
m=1 Im ⊃ {x} 6= ∅.
Théorème 5.2. Pour toute suite décroissante de pavés {Pn } dans Rk , c’est-à-dire,
∀n ≥ 1, Pn+1 ⊂ Pn ,
on a ∩∞
n=1 Pn 6= ∅.
Démonstration. Pour chaque n, y = (y1 , . . . , yk ) ∈ Pn si

déf
∀i, 1 ≤ i ≤ k, yi ∈ Ini = [ani , bni ], ani < bni .
Comme la suite de pavés (non-vide) {Pn } est décroissante, pour chaque i la suite
des segments (non-vide) {Ini } est décroissante. Par le Théorème 5.1, ∩∞ n=1 Ini 6= ∅
et il existe xi ∈ ∩∞ I
n=1 ni . De là, il existe x = (x1 , . . . , xk ) ∈ ∩∞
P
n=1 n .
Théorème 5.3. Tout pavé de dimension k est compact dans Rk .
Démonstration. Soit le pavé
déf
P = {x = (x1 , . . . , xk ) : ai ≤ xi ≤ bi , 1 ≤ i ≤ k} (5.3)
pour des paires de réels ai < bi , 1 ≤ i ≤ k. On introduit aussi les points a =
(a1 , . . . , ak ) et b = (b1 , . . . , bk ) de Rk . Pour tout x, y ∈ P
∀i, ai − bi ≤ xi − yi ≤ bi − ai et bi − ai > 0
⇒ ∀i, |xi − yi | ≤ bi − ai = |bi − ai |
⇒ ∀x, y ∈ P, kx − yk ≤ kb − ak.
Si P n’est pas compact, alors il existe un recouvrement ouvert {Gα : α ∈ A} de P

qui n’a pas de sous-recouvrement fini. On procède à la construction suivante. On
divise chaque arête de P en deux en introduisant le point milieu ci = (ai + bi )/2.
k
Ceci crée 2k pavés {Pj0 : 1 ≤ j ≤ 2k } tel que ∪2j=1 Pj0 = P et
1
∀x, y ∈ Pj0 , kx − yk ≤ kb − ak.
2
Comme il n’y a pas de recouvrement fini de P par la famille d’ouverts {Gα : α ∈ A},
il existe un pavé P 0 = Pj00 qui ne peut pas être recouvert par sous-recouvrement
fini. On divise chaque arête de P 0 en deux en introduisant le point milieu. Ceci cée
k
2k pavés {Pj1 : 1 ≤ j ≤ 2k } tel que ∪2j=1 Pj1 = P 0 et
1
∀x, y ∈ Pj1 , kx − yk ≤ kb − ak.
22
Comme il n’y a pas de recouvrement fini de P 1 par la famille d’ouverts {Gα : α ∈ A},
il existe un pavé P 2 = Pj11 qui ne peut pas être recouvert par sous-recouvrement
fini. On répète alors la construction ce qui donne une suite décroissante {P n } de
pavés tel que
5. Caractérisation de la compacité dans Rk 77
(a) P 0 ⊃ P 1 ⊃ P 2 ⊃ · · · ⊃ P n ⊃ . . . ,
(b) P n ne peu être recouvert par un nombre fini de Gα ,
(c) pour tout x, y ∈ P n , kx − yk ≤ kb − ak/2n .
k
De (a) par le Théorème 5.2, ∩∞ n
n=1 P 6= ∅ et il existe x ∈ R tel que x ∈ P pour
n
tout n ≥ 1. Comme x ∈ P , il existe un Gα tel que x ∈ Gα et, comme Gα est ouvert,

il existe une boule de rayon r > 0 tel que Br (x) ⊂ Gα . Il existe un entier N tel que
pour tout n > N
kb − ak
∀n > N, < r.
2n
Par la propriété (c), pour tout n > N , P n ⊂ Br (x) ⊂ Gα ce qui contredit (b).
Pour le résultat général suivant, on utilise une forme équivalente de la Définition

4.2 d’un borné pour l’espace métrique E = Rk muni de la métrique d(x, y) = kx−yk
via la boule Br (0) puisque 0 ∈ Rk .
Définition 5.1.
Un sous-ensemble E de Rk est borné si E = ∅ ou
∃r > 0 tel que kxk ≤ r pour tout x ∈ E, (5.4)
où k k est une norme sur Rk .
Théorème 5.4. Pour un sous-ensemble E de Rk , les trois propriétés suivantes sont

équivalentes :
(i) E est fermé et borné ;
(ii) E est compact ;
(iii) tout sous-ensemble infini de E possède un point d’accumulation dans E.
L’équivalence de (i) et (ii) est connue sous le nom de théorème de Heine-Borel. 10 11
10. Heine est surtout connu pour le théorème de Heine-Borel en 1872 dont l’historique débute
au XIXème siècle avec la recherche de bases solides pour l’anayse réelle. L’élément central de la
théorie était la notion de continuité uniforme et le théorème qui dit que toute fonction continue sur
un intervalle fermé est uniformément continue. Dirichlet fut le premier à le démontrer en utilisant
implicitement l’existence d’un sous-recouvrement fini d’un recouvrement ouvert d’un intervalle
fermé dans sa démonstration. Il utilisa cette démonstration dans ses conférences de 1862 (qui
furent publiées seulement en 1904) avant que Heine ne le démontre en 1872. Plus tard, Eduard
Heine, Karl Weierstrass et Salvatore Pincherle utilisèrent des techniques semblables. Émile Borel
en 1895 fut le premier à formuler et à démontrer une forme de ce qui est maintenant appelé le
théorème de Heine-Borel. Sa formulation était limitée à des recouvrements dénombrables. Lebesgue
(1898) et Schoenflies (1900) le généralisèrent à des recouvrements arbitraires.
11. Professeur à la Faculté des sciences de Paris, spécialiste de la théorie des fonctions et des
probabilités, membre de l’Académie des sciences, a été aussi un homme politique français, député,
et ministre. Avec René Baire et Henri Lebesgue, il était parmi les pionniers de la théorie de la
mesure et de son application à la théorie des probabilités. Le concept de tribu borélienne est nommé
Figure 3.4. Heinrich Eduard Heine (1821–1881).
Figure 3.5. Félix Edouard Justin Émile Borel (1871–1956).
Démonstration. (i) ⇒ (ii). Comme E est borné, il existe un pavé P tel que E ⊂ P .
Comme P est fermé et que P est compact, alors E est compact par le Théorème
4.3.
(ii) ⇒ (iii). Par le Théorème 4.5.
(iii) ⇒ (i). Par l’absurde. Si E n’était pas borné, pour chaque n ≥ 1, il
existerait xn ∈ E tel que kxn k > n. Le sous-ensemble de S = {xn : n ≥ 1} de E
est infini. Si S avait un point d’accumulation x, alors, par le Théorème 3.4 (i), pour
tout r > 0 la boule Br (x) contiendrait un nombre infini de points de S. Mais ceci
n’est pas possible car, si x ∈ S ′ , alors
∀n ≥ 1, kxn − xk ≥ kxn k − kxk > n − kxk

⇒ ∀n > r + kxk, kxn − xk > r,
et la boule Br (x) ne contiendrait qu’un nombre fini de points de S.

Si E n’est pas fermé, il ne contient pas tous ses points d’accumulation. Soit
′
x0 ∈/ E un point d’accumulation de E. Comme, pour tout n ≥ 1, B1/n (x0 ) ∩ E 6= ∅,
il existe xn ∈ E tel que xn 6= x et kxn − x0 k < 1/n. L’ensemble F = {xn } de ces
points est infini. Par (iii), F ⊂ E possède au moins un point d’accumulation y ∈ E
en son honneur. Dans l’un de ses livres sur les probabilités, il présente l’amusante expérience de
pensée connue sous le nom paradoxe du singe savant ou analogues. Il a également édité un certain
nombre d’articles de recherche sur la théorie des jeux ainsi qu’un véritable monument sur le jeu
de bridge. Il a créé en 1928, avec le soutien financier des Rockefeller et des Rothschild, le Centre
Mathématique qu’il a nommé Institut Henri-Poincaré (où se trouve maintenant le Centre Émile
Borel), et qu’il a dirigé pendant plus de trente ans.
6. Suites de Cauchy, complétude et complété 79
et, comme x0 n’est pas un point d’accumulation, y 6= x0 . Par construction de {xn },

il existe N tel que pour n > N , kxn − x0 k < ky − x0 k/2. Donc pour n > N
ky − x0 k ky − x0 k
ky − xn k ≥ ky − x0 k − kx0 − xn k > ky − x0 k − = > 0.
2 2
On en conclut que la boule Bky−x0 k/2 (y) contient au plus un nombre fini de points
de F . Ceci contredit le fait que y soit un point d’accumulation de F , car, dans ce
cas, on aurait un nombre infini de point de F dans Bky−x0 k/2 (y) par le Théorème
3.4 (i). E est donc fermé.
Figure 3.6. Bernard Placidus Johann Nepomuk Bolzano (1781–1848).
On déduit de ce dernier théorème.

Théorème 5.5 (Théorème de Bolzano-Weierstrass 12 13 ). Tout sous-ensemble infini
E borné dans Rk admet au moins un point d’accumulation dans Rk .
Démonstration. Comme E est borné, il est contenu dans un pavé P qui est compact
par le Théorème 5.3. Donc, E admet au moins un point d’accumulation dans P par
le Théorème 5.4.
6 Suites de Cauchy, complétude et complété

6.1 Suites de Cauchy
On peut généraliser la notion de suite et de suite de Cauchy 14 dans R à celle
de suite dans un espace métrique (X, d).
12. Bolzano est connu pour le théorème de Bolzano, ainsi que pour le théorème de Bolzano-
Weierstrass, développé conjointement avec Karl Weierstrass.
13. Souvent cité comme le père de l’analyse moderne, Weierstrass consolida des travaux de
Cauchy sur les nombres irrationnels et leur amena une nouvelle compréhension. Il eut comme
étudiants Sofia Kovalevskaı̈a (1850–1891) et Georg Cantor. Ne pouvant s’inscrire à l’université du
fait de son sexe, Kovalevskaı̈a suit les cours privés de Karl Weierstrass et de Hermann Ludwig von
Helmholtz. Elle est la première femme au monde à obtenir un doctorat de mathématiques, en 1874
à l’université de Göttingen. À titre de repère, Marie Sklodowska-Curie est née en 1867.
14. Augustin Louis, baron Cauchy, est un mathématicien français, membre de l’Académie des
sciences et professeur à l’École polytechnique. Il fut l’un des mathématiciens les plus prolifiques,
Figure 3.7. Karl Theodor Wilhelm Weierstrass (1815–1897) et Sofia Ko-

valevskaı̈a (1850–1891).
Figure 3.8. Augustin Louis Cauchy (1789–1857).
Définition 6.1.
Soit un espace métrique (X, d).
(i) Une suite dans (X, d) est une application x : N → (X, d). On utilisera la
notation xn = x(n) pour ses éléments et {xn } pour désigner la suite.
(ii) Une suite {xn } est dite d-Cauchy si
∀ε > 0, ∃N > 0 tel que ∀n, m > N, d(xn , xm ) < ε. (6.1)
(iii) Une suite {xn } est dite d-convergente si

∃x ∈ X, ∀ε > 0, ∃N > 0 tel que ∀n > N, d(xn , x) < ε. (6.2)
On écrira xn → x.
derrière Leonhard Euler, avec près de 800 parutions et sept ouvrages ; sa recherche couvre l’en-
semble des domaines mathématiques de l’époque. On lui doit notamment en analyse l’introduction
des fonctions holomorphes et des critères de convergence des séries et des séries entières. Ses tra-
vaux sur les permutations furent précurseurs de la théorie des groupes. En optique, on lui doit
des travaux sur la propagation des ondes électromagnétiques. Son œuvre a fortement influencé le
développement des mathématiques au XIXe siècle.
(iv) Une suite {xn } est d-divergente si elle n’est pas d-convergente :
∀x ∈ X, ∃ε > 0, ∀N, ∃n > N, d(xn , x) ≥ ε.
On peut vérifier que la notion de suite d-Cauchy est intrinsèque alors que celle de
suite convergente ne l’est pas. En effet, la suite xn = 1/n est Cauchy dans R, R+
et R+ . Elle est convergente vers 0 dans R et R+ mais pas dans R+ puisque 0 ∈ / R+ .
La notion de suite d-Cauchy dépend de la métrique d. La même suite peut
être d-Cauchy pour une métrique et ne pas l’être pour une autre métrique.
Exemple 6.1 (Exercice 10.15).

Soit X = R muni de la métrique d(x, y) = |x − y|. On peut vérifier que
déf x y
dϕ (x, y) = − (6.3)
1 + |x| 1 + |y|
est aussi une métrique sur R. Cette seconde métrique est reliée à la première par
l’intermédiaire de la bijection
déf x
x 7→ ϕ(x) = : R → ] − 1, 1[ (6.4)
1 + |x|
puisque dϕ (x, y) = d(ϕ(x), ϕ(y)). On peut vérifier que la suite {n}, n ≥ 1, est
dϕ -Cauchy, mais pas d-Cauchy puisque n → +∞.
Toute suite d-convergente dans (X, d) est une suite d-Cauchy, mais la réciproque
n’est pas nécessairement vraie car il n’est pas toujours possible de trouver un point
dans X. On résume quelques propriétés.
Théorème 6.1. Soit un espace métrique (X, d) et {xn } une suite d’éléments de X.
(a) xn → x si et seulement si pour tout r > 0, Br (x) ∩ {xn } contient tous les
éléments de la suite sauf au plus un nombre fini de ses éléments.
(b) Si {xn } converge, elle converge vers un point unique dans X que l’on ap-
pelera la limite de la suite.
(c) Toute suite de Cauchy est bornée.
(d) Toute suite convergente est de Cauchy. En particulier de (c), si {xn }
converge, elle est bornée.
(e) Si x ∈ X est un point d’accumulation de E ⊂ X, alors il existe une suite
{xn } ⊂ E qui converge vers x.
Démonstration. (a) Par définition, pour tout r > 0, il existe N > 0 tel que pour
tout n > N , xn ∈ Br (x) et Br (x) contient tous les points de {xn } sauf au plus les
N premiers. Réciproquement, pour r = ε > 0, soit N le plus grand indice tel que
xN ∈/ Bε (x). Alors, ∀n > N , xn ∈ Bε (x) et d(xn , x) < ε.
(b) Si la suite admettait deux limites distinctes x et x′ , pour ε > 0, aurait
N > 0 et N ′ > 0 tels que
déf
∀n > N = max{N, N ′ }, d(xn , x) < ε et d(xn , x′ ) < ε.
Il vient donc par l’inégalité du triangle
∀n > N , d(x, x′ ) ≤ d(x, xn ) + d(xn , x′ ) < 2ε ⇒ ∀ε > 0, d(x, x′ ) < 2ε.
En laissant ε tendre vers 0, on a d(x, x′ ) et, par définition d’une métrique, x′ = x.

(c) Par définition, il existe N > 0 tel que, pour tout m, n > N , d(xm , xn ) < 1
et donc
∀n > N, d(xn , xN +1 ) < 1

∀1 ≤ n ≤ N, d(xn , xN +1 ) ≤ max d(xj , xN +1 ) + 1
1≤j≤N
déf
⇒ ∀n ≥ 1, d(xn , xN +1 ) ≤ r = max d(xj , xN +1 ) + 1 ⇒ {xn } ⊂ Br (xN +1 ).
1≤j≤N
La suite est donc bornée.

(d) Si xn → x, pour tout ε > 0, il existe N tel que
∀n > N, d(xn , x) < ε/2

⇒ ∀n, m > N, d(xn , xm ) ≤ d(xn , x) + d(x, xm ) < ε/2 + ε/2 = ε
et {xn } est Cauchy.

(e) Si x ∈ X est un point d’accumulation de E, alors pour tout r > 0, Br′ (x) ∩
E 6= ∅. En prenant r = 1/n, n ≥ 1, il existe xn ∈ E, xn 6= x, tel que d(xn , x) < 1/n.
On en conclut que xn → x.
Définition 6.2.
Soient un espace métrique (X, d) et une suite {xn } dans X.
(i) Étant donnée une suite d’entiers naturels {nk } ⊂ N telle que
n1 < n2 < n3 < · · · < nk < nk+1 < . . . ,
la suite {xnk } est appelée sous-suite de la suite {xn }.

(ii) Si une sous-suite {xnk } converge vers un point x ∈ X, alors x est appelé
valeur d’adhérence de la suite {xn }.
Remarque 6.1.
Pour tout k ≥ 1, nk ≥ k et nk → +∞ lorsque k → +∞.
Exemple 6.2.
Les suites {1/k 2 }, {1/(2k)}, {1/3k } sont des sous-suites de {1/n} avec
{1/k 2}, nk = k 2 , {1/(2k)}, nk = 2k, {1/3k }, nk = 3k .
Elles convergent toutes vers la même limite 0.

La suite {1, 1/2, 1/8, 1/4, 1/16. . . .} n’est pas une sous-suite de {1/n}.
La suite {(−1)n } diverge, mais les sous-suites
{(−1)2k }, nk = 2k, et {(−1)2k+1 }, nk = 2k + 1,
convergent vers les valeurs d’adhérence 1 et −1.


(a) {xn } converge vers x si et seulement si toute sous-suite {xnk } de {xn }
converge vers x.
(b) Si tout sous-ensemble infini F de K possède au moins un point d’accumu-
lation dans K, c’est-à-dire, F ′ ∩ K 6= ∅, alors pour toute suite {xn } ⊂ K,
il existe une sous-suite {xnk } et x ∈ K tel que xnk → x. En particulier,
ceci est vrai de toute suite {xn } dans un compact K.
(c) De toute suite bornée dans Rk , on peut extraire une sous-suite convergente.
(d) L’ensemble A = A({xn }) des valeurs d’adhérence d’une suite {xn } est
fermé.
Démonstration. (a) La démonstration est laissée au lecteur.
(b) Par le Théorème 4.5, si K est compact, alors, tout sous-ensemble infini F
de K a un point d’accumulation dans K. C’est un cas particulier du cas général.
Soit S = ∪∞ n=1 {xn } l’ensemble des éléments de la suite {xn }. Si S est fini,
alors S = {s1 , . . . , sm }. Alors,
∃si ∈ S, ∀k ≥ 1, ∃nk ≥ k tel que xnk = si .
Sinon,
∀i, ∃k i , ∀n ≥ ki , xn 6= si
déf
⇒ ∀i, ∀n ≥ N = max{k1 , . . . , km }, xn 6= si
⇒ ∀n ≥ N , ∀i, 1 ≤ i ≤ m, xn 6= si ⇒ ∀n ≥ N , xn ∈
/ S.
Ceci contredit le fait que {xn : n ≥ 1} = S. On peut donc extraire de la suite {xnk }
une sous-suite de {xn } telle que nk > nk−1 pour tout k ≥ 2.
Si S est infini dans K, alors S possède un point d’accumulation x ∈ K : pour
′
tout k ≥ 1, B1/k (x) ∩ S 6= ∅. On construit une sous-suite de {xn } qui converge
vers x ∈ K comme suit. Pour k = 1, on prend un point arbitraire xn1 ∈ B1′ (x) ∩ S.
′
Pour k = 2, on peut trouver un point xn2 ∈ B1/2 (x) ∩ S tel que n2 > n1 puisque
′
B1/2 (x)∩S contient un nombre infini de points de S. On continue ainsi. À l’étape k,
′ ′
on peut trouver un point xnK ∈ B1/k (x) ∩ S tel que nk > nk−1 puisque B1/k (x) ∩ S
contient un nombre infini de points de S. On a ainsi construit une sous-suite {xnk }
de telle que d(xnk , x) < 1/k. Donc, il existe x ∈ K et une sous-suite {xnk } de {xn }
telle que xnk → x.
(c) Comme {xn } est bornée dans Rk , il existe r > 0 tel que {xn } ⊂ Br (0) ⊂
Br (0). Puisque Br (0) est bornée et compacte, on applique la partie (b).
(d) Soit A l’ensemble des valeurs d’adhérence de {xn } et soit x ∈ X un point
d’accumulation de A, c-à-d., x ∈ A′ . Pour tout r > 0, Br′ (x) ∩ A 6= ∅. Pour
r = 1/(2k), k ≥ 1, il existe x∗k ∈ A tel que d(x∗k , x) < 1/(2k). Pour k = 1, il existe
une sous-suite de {xn } qui converge vers x∗1 . On choisit dans cette sous-suite un
point xn1 tel que d (xn1 , x∗1 ) < 1/2 ce qui donne
d (xn1 , x) ≤ d (xn1 , x∗1 ) + d (x∗1 , x) < 1/2 + 1/2 = 1.

Pour k = 2, il existe une sous-suite de {xn } qui converge vers x∗2 . On choisit dans
cette sous-suite un point xn2 tel que n2 > n1 et d (xn2 , x∗2 ) < 1/4 ce qui donne
d (xn2 , x) ≤ d (xn2 , x∗2 ) + d (x∗2 , x) < 1/4 + 1/4 = 1/2.
À l’étape k, il existe une sous-suite de {xn } qui converge vers x∗k . On choisit dans
cette sous-suite un point xnk tel que nk > nk−1 et d (xnk , x∗k ) < 1/(2k) ce qui donne
d (xnk , x) ≤ d (xnk , x∗k ) + d (x∗k , x) < 1/(2k) + 1/(2k) = 1/k.
On a donc construit une sous-suite {xnk } de {xn } qui converge vers x. Par définition,
x ∈ A et A est fermé.
6.2 Espace métrique complet

Définition 6.3.
Un espace métrique (X, d) est complet si toutes ses suites de Cauchy convergent
(dans X).
Rk et C sont des espaces métriques complets, mais Q ne l’est pas.

On démontre maintenant que toute suite de Cauchy dans un compacte K
(resp., l’espace euclidien Rk ) est convergente dans K (resp., Rk ). On aura besoin
de la notion de diamètre.
Définition 6.4.
Soit (X, d) un espace métrique. On associe à tout sous-ensemble E
déf
diam (E) = sup d(x, y)
x,y∈E
que l’on appellera le diamètre de E. Lorsque E est vide, on a

diam ∅ = supx,y∈∅ d(x, y) = −∞ par la convention adoptée pour le sup.
On peut associer à une suite {xn } les ensembles EN = {xn : n > N }, N ≥ 1. Il est
facile de vérifier à partir des définitions que
{xn } Cauchy ⇐⇒ lim diam EN = 0.

N →∞

(a) Pour tout E ⊂ X, diam E = diam E.
(b) Si {Kn } est une suite décroissante de compacts non-vides de X et que
lim diam Kn = 0,
n→∞
alors ∩∞
n=1 Kn est un singleton.
Démonstration. (a) Si E = ∅, E = ∅ et supx,y∈E d(x, y) = −∞ = supx,y∈E d(x, y).

Pour E 6= ∅, comme E ⊂ E, on a diam E ≤ diam E. Soit deux points x, y ∈ E.
Pour tout ε > 0, il existe x′ , y ′ ∈ E tel que
d(x, x′ ) < ε et d(y, y ′ ) < ε

⇒ d(x, y) ≤ d(x, x′ ) + d(x′ , y ′ ) + d(y ′ , y) < d(x′ , y ′ ) + 2ε ≤ diam E + 2ε
⇒ diam E = sup d(x, y) ≤ diam E + 2ε.
x,y∈E
En laissant tendre ε vers zéro, diam E ≤ diam E et, en combinant avec la première
inégalité, diam E = diam E .
(b) Par le Corollaire au Théorème 4.4, K = ∩∞
n=1 Kn 6= ∅. Si K n’est pas un
singleton, diam K > 0 et comme K ⊂ Kn :
∀n ≥ 1, diam Kn ≥ diam K > 0,
ce qui contredirait l’hypothèse que diam Kn → 0.
Théorème 6.4. (i) Soit (X, d) un espace métrique compact. Toute suite de
Cauchy dans X converge vers un point de X. Donc (X, d) est complet.
(ii) Toute suite de Cauchy dans Rk est convergente dans Rk . Donc Rk est
complet.
Démonstration. (i) Soit {xn } une suite de Cauchy dans X. On a vu que
déf
lim diam EN = 0, EN = {xn : n > N }.
N →∞
Par le Théorème 6.3 (a), diam EN = diam EN et
lim diam EN = 0. (6.5)

N →∞
Comme, EN +1 ⊂ EN ⊂ X, on a EN +1 ⊂ EN ⊂ X, puisque le compact X est fermé.

De plus, chaque EN est compact comme sous-ensemble fermé du compact X. On
obtient une suite décroissante {EN } de sous-ensembles compacts non vides de X.
Par le Théorème 6.3 (b), X ⊃ ∩∞ N =1 EN = {x} est un singleton. Par construction
x ∈ X est le candidat pour la limite de la suite de Cauchy {xn }. Pour tout ε > 0,
il existe N0 tel que, pour tout N > N0 , diam EN < ε. Comme x ∈ EN ,
∀y ∈ EN , d(y, x) ≤ diam EN < ε ⇒ ∀N > N0 +1, d(xN , x) < ε.
Ceci implique que xN → x ∈ X.

(ii) Soit {xn } une suite de Cauchy dans Rk . Du Théorème 6.1 (c), elle est
bornée : il existe x0 ∈ Rk et r > 0 tel que {xn } ⊂ Br (x0 ). Comme Br (x0 ) est
borné et fermé dans Rk , il est compact par le Thérorème 5.4. On se retrouve alors
dans les condition de la partie (i) et la suite de Cauchy converge vers un point
x ∈ Br (x0 ) ⊂ Rk .
6.3 Complété d’un espace métrique

Maintenant que l’on a introduit les suites de Cauchy et la notion d’espace
complet, on peut revenir sur la construction des réels par G. Cantor [1] en 1872. 15
C’est un cas particulier de la construction générale du complété d’un espace métrique
(E, d) qui fait l’objet de l’exercice 24 de W. Rudin [1, p. 76].
Comme on peut parler de suite de Cauchy {xn } dans (X, d) sans qu’il existe
un point x ∈ X vers lequel la suite converge, on peut donc plonger l’espace X dans
l’ensemble S de toutes les suites de Cauchy {xn } ⊂ X. Cependant, ce plongement
est multivoque car il y a plusieurs suites de Cauchy qui convergent vers un point
de X. Il est donc nécessaire d’introduire une notion de suites équivalentes via une
relation d’équivalence et de considérer l’ensemble des classes d’équivalence (voir le
paragraphe 1.2 du Chapitre 2) en page 25.
Lemme 6.1. Si {xn } et {yn } sont deux suites de Cauchy dans X, alors la suite
{d(xn , yn )} est Cauchy.
Démonstration. Pour tout ε > 0,
∃Nx tel que ∀m, n > Nx , d(xn , xm ) < ε/2

∃Ny tel que ∀m, n > Ny , d(yn , ym ) < ε/2.
Donc, pour tout m, n > N = max{Nx , Ny },
d(xn , yn ) ≤ d(xn , xm ) + d(xm , ym ) + d(ym , yn ) < d(xm , ym ) + ε

⇒ |d(xn , yn ) − d(xm , ym )| < ε.
La suite {d(xn , yn )} est Cauchy.
On définit la relation binaire suivante entre deux suites de Cauchy {xn } et

{yn } de S (S, l’ensemble de toutes les suites de Cauchy {xn } dans X).
Définition 6.5.
Soit (X, d) un espace métrique. Étant données deux suites de Cauchy {xn } et {yn }
dans X : {xn } R {yn } si
lim d(xn , yn ) = 0.
n→∞
Lemme 6.2. Soit (X, d) un espace métrique. Alors R de la Définition 6.5 est une
relation d’équivalence dans S au sens de la Définition 1.4 du Chapitre 2.
Démonstration. La relation R est réflexive car
0 = d(xn , xn ) → 0.
15. Même date que pour la construction de Dedekind.

Elle est symétrique car d(xn , yn ) = d(yn , xn ). Elle est transitive car pour trois suites
{xn }, {yn } et {zn } dans S telles que {xn } R {yn } et {yn } R {zn }
d(xn , zn ) ≤ d(xn , yn ) + d( yn , zn )
⇒ 0 ≤ lim d(xn , zn ) ≤ lim d(xn , yn ) + lim d(xn , yn ) = 0 + 0 = 0.
n→∞ n→∞ n→∞
Donc, {xn } R {zn }.
Notation 6.1.
b = S/R l’ensemble de toutes les classes d’équivalence de suites de
On notera X
Cauchy dans X. Ces classes définissent un partition de l’ensemble S des suites de
Cauchy dans X.
Pour A et B dans X, b on considère les suites de Cauchy {xn } et {x′n } dans A

′
et {yn } et {yn } dans B :
d(xn , yn ) ≤ d(xn , x′n ) + d(x′n , yn′ ) + d(yn′ , yn )

⇒ lim d(xn , yn ) ≤ lim d(xn , x′n ) + lim d(x′n , yn′ ) + lim d(yn′ , yn )
n→∞ n→∞ n→∞ n→∞
′ ′
= lim d(xn , yn ).
n→∞
Par symétrie de d,
lim d(x′n , yn′ ) ≤ lim d(xn , yn ) ⇒ lim d(x′n , yn′ ) = lim d(xn , yn ).
n→∞ n→∞ n→∞ n→∞
Comme la limite est indépendante du choix du représentant dans chaque classe A

et B, la fonction
ˆ B) déf
(A, B) 7→ d(A, b ×X
= lim d(xn , yn ) : X b → R+ (6.6)
n→∞
est bien définie.

b d)
Lemme 6.3. Soit un espace métrique (X, d). Alors (X, ˆ est un espace métrique.
ˆ B) = 0, il existe {xn } ∈ A et {yn } ∈ B tel que

Démonstration. (M1). Si d(A,
ˆ B) = 0.
lim d(xn , yn ) = d(A,
n→∞
Par définition {xn } R {yn } et, par le Lemme 1.1 du Chapitre 2, A = B. Récipro-
quement, si A = B, pour tout {xn } ∈ A et {yn } ∈ B, {xn } ∈ B, {xn } R {yn },
ˆ B) = lim d(xn , yn ) = 0.
lim d(xn , yn ) = 0 et d(A,
n→∞ n→∞
(M2). dˆ est symétrique par symétrie de d.

(M3). Pour tout {xn } ∈ A, {yn } ∈ B et {zn } ∈ C,
d(xn , zn ) ≤ d(xn , yn ) + d(yn , zn )

et, comme chaque suite converge dans R,

lim d(xn , zn ) ≤ lim d(xn , yn ) + lim d(yn , zn )
n→∞ n→∞ n→∞
ˆ C) ≤ d(A,
⇒ d(A, ˆ B) + d(B,
ˆ C).
b d)
On a vérifié les trois axiomes d’une métrique et (X, ˆ est un espace métrique.
Tout élément x ∈ X pourra alors être identifié à la classe d’équivalence de la

suite constante {x} que l’on notera R{x}. La classe R{x} contient non seulement la
suite constante, mais aussi toutes les suites de Cauchy {xn } dans X qui convergent
vers x puisque
ˆ
d(R{xn }, R {x}) = lim d(xn , x) = 0.
n→∞
On définit l’applicarion
déf b
x 7→ ϕ(x) = R{x} : X → X. (6.7)
On désignera par X0 l’image ϕ(X) de X par ϕ dans X. b Par construction, X0

contient toutes les classes d’équivalence des suites convergentes dans X et seulement
ces suites.
ˆ
On vérifie que, par définition de d,
∀x, y ∈ X, ˆ
d(ϕ(x), ϕ(y)) = lim d(x, y) = d(x, y).
n→∞
On dit que ϕ est une isométrie de X dans le sous-ensemble X0 de X. b L’application

ˆ
ϕ est injective car d(ϕ(x), ϕ(y)) = 0 entraı̂ne d(x, y) = 0 et x = y. On peut donc
identifier X au sous-espace X0 de X. b Dans cette optique, dˆ peut être considérée
comme un prolongement de la métrique d dans X au plus gros espace X. b
On introduit maintenant la notion de densité.
Définition 6.6.
Soit (X, d) un espace métrique. E ⊂ X est dense dans X si tout point de X est un
point d’adhérence de E (ou encore E = X).
b d)
Théorème 6.5. Soit (X, d) un espace métrique. L’espace (X, ˆ est un espace
b
métrique complet et X0 = ϕ(X) est dense dans X.
Démonstration. (i) (X0 est dense dans (X,b d).)
ˆ Soit A ∈ X b et {xn } ∈ A. À chaque
xn ∈ X, on associe la suite constante et sa classe d’équivalence ϕ(xn ) ∈ X0 . Alors,
b d).
la suite ϕ(xn ) converge vers A dans (X, ˆ En effet, pour tout n ≥ 1,
ˆ
d(ϕ(xn ), A) = lim d(xn , xm )
m→∞
et, comme {xn } est Cauchy, pour tout ε > 0 il existe N tel que
∀m, n > N, d(xn , xm ) < ε
ˆ
⇒ ∀n > N, d(ϕ(x n ), A) = lim d(xn , xm ) < ε
m→∞
7. Compacité et compacité séquentielle 89
et A ∈ X b est la limite de la suite {ϕ(xn )} ⊂ X0 .

b d)
(ii) ((X, b d).
ˆ est complet.) Soit {An } une suite de Cauchy dans (X, ˆ Par
b
densité de X0 dans X, pour chaque n, il existe yn ∈ X tel que
ˆ
d(ϕ(y n ), An ) < 2
−n
.
La nouvelle suite {yn } ⊂ X est Cauchy :

ˆ
d(yn , ym ) = d(ϕ(y ˆ ˆ ˆ
n ), ϕ(ym )) ≤ d(ϕ(yn ), An ) + d(An , Am ) + d(Am , ϕ(ym ))
ˆ n , Am ) + 2−m .
≤ 2−n + d(A
Comme {An } est Cauchy, pour tout ε > 0, il existe N1 tel que
∀n, m > N1 , ˆ n , Am ) < ε/3

d(A
et il existe N2 tel que pour tout n > N2 , 2−n < ε/3. Donc, pour tout n, m >
max{N1 , N2 }, d(yn , ym ) < ε et la suite {yn } est bien Cauchy. Il existe donc B ∈ Xb
tel que {yn } ∈ B. Il reste à montrer que B est la limite de la suite {An }. En effet,
ˆ An ) ≤ d(B,
d(B, ˆ ϕ(yn )) + d(ϕ(y
ˆ n ), An ) ≤ lim d(ym , yn ) + 2
−n
.
m→∞
Comme {yn } est Cauchy le premier terme du membre de droite tend vers zéro
lorsque n tend vers l’infini. De même pour 2−n . On a donc bien construit un point
B∈X b tel que An → B.
Remarque 6.2.
La construction de Cantor correspond à X = Q et à la métrique
déf
(x, y) 7→ d(x, y) = |x − y| : Q × Q → Q+ = {x ∈ Q : x ≥ 0}.
Bien que la Definition 2.1 de la métrique comme une application (x, y) 7→ d(x, y) :
X × X → R+ présuppose que R ait déjà été construit, la métrique définie plus
haut dans Q reste un rationnel positif ou nul. On n’a donc pas besoin de R. On
peut donc construire Q, b l’ensemble des classes d’équivalence des suites de Cauchy
dans Q. Cependant, dans notre construction, la définition (6.6) de la métrique dˆ
b nécessite la connaissance de R. Il faudrait voir comment G. Cantor [2] a
sur Q
contourné cette difficulté et comment il obtient la propriété (P7) s’il l’obtient.
7 Compacité et compacité séquentielle

Comme on l’a indiqué au début du paragraphe 4, il est possible de donner une
caractérisation de la compacité dans un espace métrique en termes de suites.
Définition 7.1.
Un sous-ensemble E d’un espace métrique (X, d) est séquentiellement compact si
E = ∅ ou toute suite {xn } dans E possède une sous-suite {xnk } qui converge vers
un élément x ∈ E.
Pour les espaces topologiques généraux, la compacité entraı̂ne la compacité séquen-

tielle, mais la réciproque est fausse. Cependant, pour les espaces métriques et seule-
ment dans ce cas, la compacité peut être caractérisée par les suites.
Définition 7.2.
Soit (X, d) un espace métrique. Un sous-ensemble E de X est précompact si E = ∅
ou si, pour chaque r > 0, il existe un nombre fini {x1 , x2 , . . . , xnr } de points de E
tel que
E ⊂ ∪ni=1
r
Br (xi ) (7.1)
ou, de façon équivalente, si, pour tout r > 0, on peut recouvrir E par un nombre
fini de parties de E de diamètre inférieur à r.
Théorème 7.1. Soit E un sous-ensemble d’un espace métrique (X, d). E est sé-
quentiellement compact si et seulement si E est précompact et complet.
Démonstration. Si E = ∅, il n’y a rien à démontrer. On suppose donc que E 6= ∅.
(⇒) (E précompact.) Par l’absurde. On suppose que, pour un certain r > 0,
aucune union finie de boules de rayon r ne recouvre E. On construit la suite {xn }
de points de E suivante. On prend x1 ∈ E et
∀n ≥ 1, / ∪nk=1 Br (xk ) .
xn+1 ∈ E tel que xn+1 ∈
On a donc une suite de points mutuellement distants d’au moins r > 0 :
∀m 6= n ≥ 1, d(xm , xn ) ≥ r.
Cette suite ne peut donc pas avoir de sous-suite convergente, ce qui contredit l’hy-
pothèse de compacité séquentielle de E.
(E complet.) Si {xn } est une suite de Cauchy dans E, il existe x ∈ E et une
sous-suite qui converge vers x. Comme la suite est de Cauchy toute la suite converge
vers x ∈ E et E est complet.
(⇐) Soit une suite {xn } ⊂ E et S = ∪∞ n=1 {xn } l’ensemble des points de la
suite. Si S = {s1 , . . . , sm } est fini, alors il existe si ∈ S et une sous-suite constante
xnk = si tel que xnk → si lorsque k → ∞ (même démonstration que pour le
Théorème 6.2 (b)).
Considérons le cas S infini. Comme E est précompact, pour tout r > 0, il existe
un ensemble fini de points de E tel que E soit recouvert par les boules ouvertes de
rayon r centrées en ces points. Une de ces boules contient donc un nombre infini de
points de S. On procède alors à la construction suivante :
déf
r = 1/2, ∃y1 ∈ E tel que S1 = B1/2 (y1 ) ∩ S infini
déf
r = 1/22 , ∃y2 ∈ E tel que S2 = B1/22 (y2 ) ∩ S1 infini
...
déf
r = 1/2k , ∃yk ∈ E tel que Sk = B1/2k (yk ) ∩ Sk−1 infini.
7. Compacité et compacité séquentielle 91
On a ainsi construit une suite décroissante S ⊃ S1 ⊃ S2 ⊃ . . . de diamètre

diam (Sk ) < 1/2k−1 . Comme Sk est infini, pour chaque k ≥ 1, il existe xnk ∈ Sk tel
que nk > nk−1 et {xnk } est une sous-suite de {xn }. Comme xnk+1 ∈ Sk+1 ⊂ Sk ⊂
B1/2k (yk ) et xnk ∈ Sk ⊂ B1/2k (yk ),
1 1 1
d(xnk , xnk+1 ) ≤ d(xnk , yk ) + d(yk , xnk+1 ) < k
+ k = k−1 .
2 2 2
Cette sous-suite est de Cauchy. En effet, pour k ′ > k,
′ ′
kX −1 kX −1
1 1
d(xnk′ , xnk ) ≤ d(xni+1 , xni ) ≤ < k−2 .
2i−1 2
i=k i=k
Donc pour tout ε > 0, il existe K tel que, pour tout k, k ′ > K, d(xnk′ , xnk ) < ε.
Comme E est complet cette sous-suite {xnk } de {xn } converge vers un point x ∈ E
et E est bien séquentiellement compact.
Théorème 7.2. Soit un espace métrique (X, d) et un sous-ensemble séquentielle-

ment compact E de X. Si {Gα }α∈A est un recouvrement ouvert de E, alors
∃r > 0, ∀x ∈ E, ∃α ∈ A, Br (x) ⊂ Gα .
Les rayons r > 0 qui jouissent de cette propriété sont appellés les nombres de
Lebesgue du recouvrement ouvert {Gα }α∈A .
Démonstration. On procède par l’absurde. On suppose que
∀r > 0, ∃xr ∈ E, ∀α ∈ A, Br (xr ) 6⊂ Gα .
En particulier, on construit une suite de points de E comme suit
∀n ≥ 1, ∃xn ∈ E, ∀α ∈ A, B1/n (xn ) 6⊂ Gα . (7.2)
Comme, par hypothèse, E est séquentiellement compact, il existe une sous-suite

{xnk } de (xn ) convergeant vers un point x ∈ E. Puisque les {Gα } recouvrent E,
il existe αx ∈ A tel que x ∈ Gαx . Comme Gαx est ouvert, il existe ε > 0 tel que
Bε (x) ⊂ Gαx . Finalement,
1
∀y ∈ B1/nk (xnk ), d(y, x) ≤ d(y, xnk ) + d(xnk , x) < + d(xnk , x)
nk
∀ε > 0, ∃K1 tel que ∀k > K1 , d(xnk , x) < ε/2
1
∃K > K1 tel que < ε/2
nK
⇒ ∀y ∈ B1/nK (xnK ), d(y, x) ≤ d(y, xnK ) + d(xnK , x) < ε
⇒ B1/nK (xnK ) ⊂ Bε (x) ⊂ Gαx
ce qui contredit la construction (7.2).

Théorème 7.3 (Bolzano-Weierstrass). Soit un espace métrique (X, d) et un sous-

ensemble E de X. Les propriétés suivantes sont équivalentes.
(i) E est compact.
(ii) E est séquentiellement compact.
(iii) Tout sous-ensemble infini F de E possède (au moins) un point d’accumu-
lation dans E, c’est-à-dire, F ′ ∩ E 6= ∅.
(iv) E est précompact et complet.
Remarque 7.1.
L’implication (iii) ⇒ (i) est la réciproque du Theorem 4.5 page 74.
Démonstration. (i) ⇒ (iii) du Théorème 4.5 et

(iii) ⇒ (ii). Soit {xn } une suite dans E. Par le Théorème 6.2 (b), il existe
x ∈ E et une sous-suite {xn′k } converge vers x. Par définition, E est séquentiellement
compact.
(ii) ⇒ (i). Soit E séquentiellement compact. On considère un recouvrement
ouvert {Gα } de E. D’après le Théorème 7.2,
∃r > 0, ∀x ∈ E, ∃α(x) ∈ A, Br (x) ⊂ Gα(x) .
D’après le Théorème 7.1, E est recouvert par un nombre fini de boules de rayon r,
c’est-à-dire, il existe une partie finie {x1 , x2 , . . . , xn } ⊂ E telle que E ⊂ ∪ni=1 Br (xi )
ce qui donne
E ⊂ ∪ni=1 Br (xi ) ⊂ ∪ni=1 Gα(xi ) .

Comme Gα(xi ) : 1 ≤ i ≤ n est un sous-recouvrement fini de E, E est compact.
(ii) ⇔ (iv) par le Théorèm 7.1.
Exemple 7.1.
En général, un sous-ensemble borné et fermé d’un espace métrique n’est ni séquen-
tiellement compact ni compact. L’exemple classique est celui de l’espace métrique
ℓ2 des suites x = (x1 , x2 , . . . ) : xi ∈ R, i ≥ 1, de carré sommable :
( ∞
) "∞ #1/2
déf
X X
ℓ2 = x = (x1 , x2 , . . . ) : |xi |2 < ∞ , d(x, y) = |xi − y i |2 .
i=1 i=1
2
On considère la sphère de rayon un et de centre 0 dans ℓ
déf
E = {x ∈ ℓ2 : d(x, 0) = 1}
et la suite {xn } ⊂ E telle que (xn )k = δnk . Par définition, E ⊂ B2 (0) et E est borné.
Pour montrer que E est fermé, on montre que son complément est ouvert. En effet,
pour tout x ∈ ℓ2 tel que d(0, x) 6= 1, ou bien d(0, x) < 1 et on a B1−d(0,x) (x) ⊂ ∁E ;
ou bien d(0, x) > 1 et on a Bd(0,x)−1 (x) ⊂ ∁E. On vérifie que
√
∀m 6= n, d(xm , xn ) = 2
8. Ensembles parfaits 93
et il n’y a pas de sous-suites convergentes. E n’est donc pas séquentiellement com-

pact et, a fortiori, pas compact.
Définition 7.3.
Soit (X, d) un espace métrique. (X, d) est séparable s’il contient un sous-ensemble
dense dénombrable.
L’espace Rk est séparable (voir Exercice 10.17).
Théorème 7.4. Un espace métrique (X, d) compact est séparable.
Démonstration. Cf. Exercices 10.19 et 10.20.
8 Ensembles parfaits
Définition 8.1.
Soit (X, d) un espace métrique. Un sous-ensemble E de X est parfait si E est fermé
et ne contient aucun point isolé.
Remarque 8.1.
Comme pour tout fermé on a E = E = E ′ ∪ E\E ′ et qu’il n’y a pas de points isolés,
il vient E = E = E ′ et E = E ′ . Réciproquement, si E = E ′ , alors E est parfait
puisque E ′ est un ensemble fermé (voir Exercice 10.8) et que l’ensemble des points
isolés E\E ′ est vide.
Théorème 8.1. Tout sous-ensemble parfait non-vide de (Rk , dp ) 16 , 1 ≤ p ≤ ∞,

est non-dénombrable.
Démonstration. Soit E un ensemble parfait non-vide. Il est fermé, non vide et ne

contient que des points d’accumulations. C’est donc un ensemble infini. Si on le
suppose dénombrable, on peut ordonner ses points en une suite ordonnée {sn }.
On prend le premier point x1 = s1 de la suite {sn } et un rayon r1 > 0
quelconque. Soit B1 = Br1 (x1 ). Comme x1 est un point d’accumulation de E,
Br′ 1 (x1 ) ∩ E 6= ∅ et il existe des points de E dans la boule trouée. On saute dans
l’ordre en commençant par s2 tous les points de la suite {sn } qui ne sont pas dans
Br′ 1 (x1 ). Soit x2 = sn2 le premier point de la suite {sn } qui se trouve dans Br′ 1 (x1 ).
En particulier, x2 6= x1 On choisit le rayon
1 d(x2 , x1 ) ≥ 2r2
r2 = min {d(x2 , x1 ), r1 − d(x2 , x1 )} > 0 ⇒
2 0 < d(x2 , x1 ) ≤ r1 − 2r2 .
Ce choix de r2 entraı̂ne Br2 (x2 ) ⊂ Br1 (x1 ) et s1 , . . . , sn2 ∈

/ Br2 (x2 ) puisque
∀y ∈ Br2 (x2 ), d(y, x1 ) ≤ d(y, x2 ) + d(x2 , x1 ) ≤ r2 + d(x2 , x1 ) < r1 − r2 < r1

d(x1 , x2 ) ≥ 2r2 > r2 .
16. dp , 1 ≤ p ≤ ∞, est la métrique associée aux normes définies au Théorème 1.2 page 51.
Comme x2 est un point d’accumulation de E, Br′ 2 (x2 )∩E 6= ∅ et il existe des points
de E dans la boule trouée. On saute dans l’ordre en commençant par sn2 +1 tous les
points de la suite {sn } qui ne sont pas dans Br′ 2 (x2 ). Soit x3 = sn3 le premier point
de la suite {sn } qui se trouve dans Br′ 2 (x2 ). En particulier, x3 6= x2 . On choisit le
rayon
1 d(x3 , x2 ) ≥ 2r3
r3 = min {d(x3 , x2 ), r2 − d(x3 , x2 )} > 0 ⇒
2 0 < d(x3 , x2 ) ≤ r2 − 2r3 .
Ce choix de r3 entraı̂ne Br3 (x3 ) ⊂ Br2 (x2 ) et x2 ∈

/ Br3 (x3 ) puisque
∀y ∈ Br3 (x3 ), d(y, x2 ) ≤ d(y, x3 ) + d(x3 , x2 ) ≤ r3 + d(x3 , x2 ) < r2

d(x2 , x3 ) ≥ 2r3 > r3 .
À l’étape k, on a construit la suite de boules Bk = Brk (xk ) tel que

(i) Brk+1 (xk+1 ) ⊂ Brk (xk )
(ii) s1 , s2 , . . . , snk ∈
/ Brk+1 (xk+1 )
(iii) Br′ nk+1 (xk+1 ) ∩ E 6= ∅.
On pose Kk = Bk ∩ E. La boule Bk est bornée et fermée et donc compacte.
Comme E est fermé, l’intersection Kk = Bk ∩ E est fermée et donc compacte
comme sous-ensemble fermé du compact Bk . De plus, puisque xk+1 est un point
d’accumulation de E,
Kk = Bk ∩ E ⊃ Br′ k+1 (xk+1 ) ∩ E 6= ∅.
On a donc une suite décroissante {Kk } de compacts non-vides. Par le Corollaire 1

au Théorème 4.4,
∅ 6= K = ∩∞
k=1 Kk ⊂ E.
Par construction de la suite décroissante de boules Bk = Brk (xk ), on a successive-

ment éliminé tous les points de la suite {sn }, c-à-d., E ∩ [∩∞
k=1 Brk (xk )] = ∅. On
obtient alors la contradiction
h i
∅ 6= K ⊂ ∩∞ k=2 E ∩ B rk (xk )
∞ ∞
⊂ E ∩ ∩k=2 Brk−1 (xk−1 ) = E ∩ [∩k=1 Brk (xk )] = ∅,
car ∩∞
k=1 Brk (xk ) ne contient aucun point de E.
Corollaire 1. Tout intervalle de R et, en particulier, R est non-dénombrable.

Les ouverts dans R ont une structure bien particulière.
Théorème 8.2. Tout sous-ensemble ouvert G de R peut s’écrire comme la réunion
au plus dénombrable d’intervalles ouverts disjoints {Ii } (Ii ∩ Ij = ∅ si i 6= j),
c’est-à-dire, [
G= Ii .
8. Ensembles parfaits 95
Démonstration. W. Rudin [1, exercice 29 p. 42]. Comme G est ouvert, à chaque

x ∈ G on peut associer le plus grand intervalle ouvert Ix contenant x et contenu
dans G. Il suffit de prendre
déf
[ [
Ix = J ⇒ G= Ix .
J intervalle ouvert x∈G
contenant x
Si x et x′ sont deux points de G tels que x 6= x′ , alors Ix ∩ Ix′ = ∅ ou Ix = Ix′ .

En effet, si Ix ∩ Ix′ 6= ∅, l’union Ix ∪ Ix′ est un intervalle ouvert contenant x et
x′ . Comme, par définition, Ix est le plus grand intervalle dans G contenant x, on
a x ∈ Ix ∪ Ix′ ⊂ Ix et x′ ∈ Ix ∪ Ix′ ⊂ Ix′ . Ceci entraı̂ne Ix = Ix ∪ Ix′ = Ix′ .
Maintenant, dans tout intervalle ouvert Ix , il existe un rationnel r ∈ Q ∩Ix . Comme
r ∈ Ix ∩ Ir 6= ∅ on a nécessairement Ix = Ir et
[ [ [
G= Ix ⊂ Ir ⇒ G = Ir .
x∈G r∈Q ∩G r∈Q ∩G
Le nombre d’intervalles distincts dans l’union est donc au plus dénombrable. Enfin,
comme on sait que si r 6= r′ sont deux points de G ∩ Q on a Ir ∩ Ir′ = ∅ ou Ir = Ir′ ,
il suffit de retenir les indices correspondant à des intervalles disjoints.
Contrairement à ce que l’on pourrait penser, un fermé n’est pas la réunion
d’une famille au plus dénombrable d’intervalles fermés. L’ensemble de Cantor est
un sous-ensemble parfait de l’intervalle [0, 1]. C’est donc un fermé qui n’est pas la
réunion dénombrable d’une famille d’intervalles fermés disjoints (ici des intervalles
triviaux ne contenant qu’un point).
Exemple 8.1 (Ensemble triadique de Cantor).

Soit E0 = [0, 1]. Comme il est borné et fermé, E0 est compact. On enlève l’intervalle
0 1/3 2/3 1
Figure 3.9. L’ensemble de Cantor
ouvert médian de E0

1 2
,
3 3
pour obtenir le nouveau fermé

déf déf 1 déf 2 1
E1 = I11 ∪ I12 ⊂ E0 , I11 = 0, et I12 = ,1 , |I1,k | =
3 3 3
qui lui aussi est compact. Ensuite, on enlève les intervalles ouverts médians de I11
et I12 . Chacun laisse deux nouveaux intervalles fermés de longueur 3−2

déf 1 déf 2 3 déf 6 7 déf 8
I21 = 0, , I22 = , , I23 = , et I24 = ,1
9 9 9 9 9 9
pour obtenir le nouveau fermé
déf 1
E2 = I21 ∪ I22 ∪ I23 ∪ I24 ⊂ E1 , |I2,k | =
32
qui lui aussi est compact. À l’étape n, on enlève encore l’ouvert médian de chaque
intervalle I(n−1)k , 1 ≤ k ≤ 2n−1 , ce qui laisse deux nouveaux intervalles fermés de
longueur 3−n pour obtenir le nouveau fermé
2n
[
déf 1
En = Ink ⊂ En−1 , |Ink | = n
3
k=1
comme union finie des intervalles fermés Ink . En est donc compact. L’ensemble
∞
\
déf
C = En
n=1
est l’ensemble triadique de Cantor. L’intersection ∩∞ n=1 En est fermée et non-vide et

compact comme intersection d’une famille décroissante de compacts non-vides. Par
construction, on observe que les deux extrémités de chaque intervalle Ink vont se
retrouver dans E.
Pour que C soit parfait, il ne faut pas qu’il y ait de point isolé. On considère
un point x ∈ C. Pour chaque n ≥ 1, il existe k, 1 ≤ k ≤ 2n , tel que x ∈ Ink . Soit
xn l’une des extrémités de Ink différente de x. La suite {xn }, xn 6= x, converge vers
x puisque |xn − x| ≤ 1/3n. Le point x est donc un point d’accumulation de C.
Enfin, comme la somme des longueurs des intervalles de l’ensemble En est
2n (1/3n ) = (2/3)n , elle tend vers 0 lorsque n tend vers l’infini. Cependant, comme C
est parfait, on sait que C infini et non-dénombrable par le Théorème 8.1. On observe
aussi que le complément [0, 1]\C est un ouvert qui est bien l’union dénombrable des
intervalles ouverts disjoints enlevés à chaque étape de la construction de C.
9 Ensembles connexes et ensembles convexes

9.1 Ensembles connexes
Définition 9.1.
(i) Deux sous-ensembles A et B de X sont séparés dans X si A ∩ B = ∅ et
A ∩ B = ∅.
(ii) Le sous-ensemble E ⊂ X est connexe s’il n’est pas la réunion de deux
ensembles séparés non-vides.
Dans cette définition les adhérences sont prises par rapport à (X, d).
9. Ensembles connexes et ensembles convexes 97
Par définition de deux ensembles séparés,
A∩B ⊂A∩B = ∅ ⇒ A∩B =∅
et A et B sont disjoints. À ce niveau de généralité, ∅ et tout sous-ensemble A de

X sont séparés et ∅ est connexe.
Exemple 9.1.
1) Les intervalles [0, 1] et ]1, 2] ne sont pas séparés.
2) R, Rk , les intervalles [a, b], ]a, b], [a, b[ , et ]a, b[ dans R sont connexes.
3) Q et l’ensemble à deux éléments {0, 1} ne sont pas connexes.
En topologie générale, on trouve une définition différente de la connexité (par-

tie (ii) du Théorème 9.1). Il y a cependant équivalence.
Définition 9.2 (Topologie générale).

Soit (X, d) un espace métrique. Le sous-ensemble E ⊂ X est connexe s’il n’est pas
la réunion de deux ensembles non-vides, disjoints et ouverts de (E, d).
Théorème 9.1. Soit E un sous-ensemble d’un espace métrique (X, d). Les pro-
priétés suivantes sont équivalentes :
(i) E est la réunion de deux ensembles séparés non-vides de (X, d) ;
(ii) E est la réunion de deux ouverts de (E, d) 17 non-vides et disjoints ;
(iii) il existe un sous-ensemble G, ∅ 6= G $ E, qui soit à la fois fermé et
ouvert 18 dans (E, d).
Démonstration. (i) ⇒ (ii) E est la réunion A ∪ B de deux ensembles séparés A et
B non-vides. Alors,
)
A ∩ B = ∅ ⇒ ∅ 6= A ⊂ E\B
⇒ E = A ∪ B = E\B ∪ E\A .
B ∩ A = ∅ ⇒ ∅ 6= B ⊂ E\A
E est donc la réunion de deux ouverts non-vides par rapport à la topologie induite
sur (E, d). En effet, par le Théorème 3.3, E\B = E ∩ [X\B] est l’intersection de E
et de l’ouvert X\B dans (X, d). Même chose pour E\A. Quant à leur intersection

E\B ∩ E\A = E\(A ∪ B) ⊂ E\(A ∪ B) = ∅.
Ceci donne le résultat.

(ii) ⇒ (iii) Il existe deux ouverts par rapport à la topologie induite sur (E, d)
qui sont non-vides et disjoints dans E tel que E = A ∪ B. Les complémentaires sont
donc fermés dans (E, d) :
)
∅ 6= A = E\B fermé
⇒ ∅ 6= A $ E.
∅ 6= B = E\A
17. Ouverts par rapport à la topologie induite (ou relative) sur (E, d).
18. Ouverts et fermés par rapport à la topologie induite (ou relative) sur (E, d).
A est donc à la fois ouvert et fermé et différent de ∅ et E.

(iii) ⇒ (i) Soit G, ∅ 6= G $ E à la fois ouvert et fermé dans (E, d). Alors
E = G ∪ (E\G) et G ∩ (E\G) = ∅.
Comme G est ouvert et fermé dans (E, d), le complément E\G est fermé et ouvert
dans (E, d). Par le Théorème 3.3, il existe des ouverts O et O′ dans (X, d) tel que
G=E∩O et E\G = E ∩ O′
⇒ E\G = E ∩ (X\O) et G = E ∩ (X\O′ ).
Ces ensembles sont séparés car pour les fermetures dans (X, d)
G ∩ E\G = E ∩ O ∩ E ∩ (X\O) ⊂ E ∩ O ∩ E ∩ (X\O) = ∅

E\G ∩ G= E\G ∩ E\(E\G) = E ∩ O′ ∩ E ∩ (X\O′ ) ⊂ E ∩ O′ ∩ E ∩ (X\O′ ) = ∅
puisque X\O et X\O′ sont fermés dans (X, d) comme compléments des ouverts O
et O′ . On a utilisé le fait que A ∩ B ⊂ A ∩ B par le Théorème 3.10 (ii). G et E\G
sont donc séparés.
En prenant systématiquement le contraire de chaque propriété, on obtient des
conditions équivalentes pour la connexité.
Corollaire 1. Soit E un sous-ensemble d’un espace métrique (X, d). Les propriétés
suivantes sont équivalentes :
(i) E est connexe dans (X, d) (Définition 9.1 (ii)) ;
(ii) E n’est pas la réunion de deux sous-ensembles non-vides, disjoints et ou-
verts dans (E, d) 19 (Définition 9.2) ;
(iii) les seuls sous-ensembles de E qui soient à la fois fermés et ouverts 20 dans
(E, d) sont ∅ et E.
Remarque 9.1.
Dans la Définition 9.1 (ii), on travaille avec des adhérences dans (X, d), alors que
pour l’autre définition, les ouverts sont par rapport à la topologie induite sur (E, d)
et non par rapport à celle de (X, d). La notion de connexité est donc, comme celles
de compacité et de bornitude, une notion intrinsèque.
Exemple 9.2.
On considère l’ensemble à deux éléments X = {0, 1} dans R avec la métrique
d(x, y) = |x − y|. Les ensembles ∅ et X sont ouverts et fermés. Les ensembles
{0} et {1} sont ouverts car B1/2 (0) = {0} et B1/2 (1) = {1}. Ils sont fermés car les
compléments des ouverts {0} et {1}
{0} = X\{1} et {1} = X\{0}
sont fermés. L’espace X = {0, 1} n’est donc pas connexe.

19. Ouverts par rapport à la topologie induite (ou relative) sur (E, d).
20. Ouverts et fermés par rapport à la topologie induite (ou relative) sur (E, d).
9. Ensembles connexes et ensembles convexes 99
Exemple 9.3.
On considère dans R2 le sous-ensemble X = B1 (0, 0) ∪ B1 (3, 3). Les deux boules
sont non-vides, disjointes et sont des ensembles ouverts dans (X, d). L’espace X
n’est donc pas connexe. De plus, par complémentarité, B1 (0, 0) = X\B1 (3, 3)
et B1 (3, 3) = X\B1 (0, 0) sont fermées dans (X, d) par le Théorème 3.5 et, par
conséquent, ouvertes et fermées dans (X, d) sans être égales à ∅ ou X. Attention,
elles ne seraient pas fermées dans (R2 , d).
Théorème 9.2. E ⊂ R est connexe si et seulement si

∀x, y ∈ E, x < y, x < z < y ⇒ z ∈ E.
Démonstration. (⇒) Par l’absurde. Supposons qu’il existe x, y ∈ E et z ∈ R tels
que x < z < y et z ∈
/ E. Alors
déf déf
E = Az ∪ Bz , où Az = E∩ ] − ∞, z[ et Bz = E∩ ]z, +∞[ .
Comme x ∈ Az et y ∈ Bz , ces deux ensembles ne sont pas vides. Enfin,
Az ∩ Bz ⊂ ] − ∞, z[ ∩ [z, +∞[ = ∅
Az ∩ Bz ⊂ ] − ∞, z] ∩ ]z, +∞[ = ∅
et Az et Bz sont séparés. Comme E = Az ∪ Bz , E n’est pas connexe ce qui contredit
l’hypothède du théorème.
(⇐) Par l’absurde. Supposons que E ne soit pas connexe. On peut alors trouver
deux ensembles séparés A et B non vides tels que E = A∪B, A∩B = ∅ et A∩B = ∅.
En particulier, A ∩ B = ∅ et il existe x ∈ A et y ∈ B tel que x 6= y. On a donc ou
bien x < y ou bien x > y. Supposons, sans perte de généralité, que x < y. Posons
déf
zA = sup (A ∩ [x, y]) .
Comme (A ∩ [x, y]) est borné supérieurement par y, sup (A ∩ [x, y]) ∈ R et
zA ∈ (A ∩ [x, y]) ⊂ A ⇒ zA ∈
/B et x ≤ zA < y.
Si zA ∈/ A, alors x < zA < y et zA ∈ E = A ∪ B. Donc, zA ∈ B ce qui contredit la
fait que zA ∈
/ B.
On a donc zA et x ≤ zA < y. On construit les points
1
∀n ≥ 2, zn = zA + (y − zA )
n
pour lesquels
zA < zn < y ⇒ zn ∈ E = (A ∪ B) ∩ [x, y]
par hypothèse. Mais, comme par définition,
zA = sup (A ∩ [x, y]) < zn ⇒ zn ∈ B.
Finalement, lorsque n → ∞,
zn → zA ⇒ zA ∈ B
ce qui donne une autre contradiction puisque zA ∈ A et A ∩ B = ∅.
9.2 Ensembles convexes, sous-ensembles linéaire et affine

La condition du théorème 9.2 peut s’écrire de façon équivalente
∀x, y ∈ E, ∀λ, 0 < λ < 1, λ x + (1 − λ) y ∈ E. (9.1)
Un sous-ensemble connexe dans R est le prototype d’un ensemble convexe dans un

espace vectoriel.
Définition 9.3.
Soit (X, +, ×) un espace vectoriel sur R au sens de la Définition 1.1 du Chapitre 2.
(i) E ⊂ X est convexe si
∀x, y ∈ E, ∀λ, 0 < λ < 1, λ × x + (1 − λ) × y ∈ E. (9.2)
(ii) A ⊂ X est un sous-espace affine si
∀x, y ∈ A, ∀α ∈ R, α × x + (1 − α) × y ∈ A. (9.3)
(iii) S ⊂ X est un sous-espace linéaire si
∀x, y ∈ S, ∀α, β ∈ R, α × x + β × y ∈ S. (9.4)
Par définition, ∅ est à la fois un sous-espace affine, un sous-espace linéaire et un

convexe.
Remarque 9.2.
Dire que E est convexe revient à dire que, pour toute paire de points x, y, x 6= y,
déf
dans E, le segment [x, y] = {λx + (1 − λ)y : 0 ≤ λ ≤ 1} est contenu dans E.
La boule Br (x) dans Rn est convexe. Les sous-espaces affines et les sous-espaces
linéaires sont des convexes.
Le lecteur attentif pourra s’apercevoir que la partie (⇐) de la démonstration
du Théorème 9.2 peut servir à démontrer le résultat général intuitif suivant.
Théorème 9.3. Soit (X, +, ×) un espace vectoriel normé sur R au sens de la
Définition 1.1 du Chapitre 2. Alors tout partie convexe de X est connexe.
Démonstration. Par l’absurde. Supposons que E ne soit pas connexe. On peut alors
trouver deux ensembles séparés A et B non vides tels que E = A ∪ B, A ∩ B = ∅
et A ∩ B = ∅. En particulier, A ∩ B = ∅ et il existe x ∈ A et y ∈ B tel que x 6= y.
On considère le segment [x, y] = {λx + (1 − λ)y; 0 ≤ λ ≤ 1}. On peut sans perte de
généralité orienter ce segment de façon que x < y. En posant
déf
zA = sup (A ∩ [x, y])
on se retrouve dans les conditions de la démonstration de la seconde partie du

Théorème 9.2 qui mène à deux contradictions.
10. Exercices 101
Un sous-espace affine est la translation d’un sous-espace linéaire unique.
Théorème 9.4. Soit (X, +, ×) un espace vectoriel sur R au sens de la Définition

1.1 du Chapitre 2. Soit A un sous-espace affine de X. Il existe un sous-espace
linéaire unique S de X tel que
∀a ∈ A, A = a + S.
Démonstration. On fixe a ∈ A et l’on considère l’ensemble S = A − a. Pour tout

α ∈ R et x ∈ S, il existe xA ∈ A tel que x = xA − a et α x = α (xA − a) + (1 −
α) (a − a) = α xA + (1 − α) a − a ∈ S. Pour tout x, y ∈ S, il existe xA et yA dans A
tel que x = xA − a et y = yA − a. Alors

1 1 1 1
(x + y) = xA + 1 − yA − a ∈ S ⇒ x + y = 2 (x + y) ∈ S.
2 2 2 2
Finalement, pour tout α et β dans R et x et y dans S, αx ∈ S et βy ∈ S, et leur

somme αx + βy ∈ S. Donc, S est bien un sous-espace linéaire.
Il reste à montrer que ce sous-espace est indépendant de a. Soit un autre point
déf
a ∈ A et son sous-espace linéaire S ′ = A − {a′ }. Alors
′
∀x′ ∈ S ′ = A − {a′ }, ∃x′A ∈ A tel que x′ = x′A − a′

⇒ x′ = x′A − a + (−1) (a′ − a) ∈ S ⇒ S′ ⊂ S
| {z } | {z }
∈S ∈S
et réciproquement
∀x ∈ S = A − {a}, ∃xA ∈ A tel que x = xA − a

⇒ x = xA − a′ + (−1) (a − a′ ) ∈ S ⇒ S ⊂ S ′ .
| {z } | {z }
∈S ∈S
Le sous-espace linéaire est donc unique et pour tout a ∈ A, S = A − a.
10 Exercices
Soient x, y ∈ Rk . Établir que
kx + yk2 + kx − yk2 = 2 kxk2 + 2 kyk2.
Interpréter géométriquement ce résultat.

Soit x ∈ Rk , k ≥ 2. Démontrer qu’il existe y ∈ Rk , y 6= 0, tel que x · y = 0.
Exercice 10.3.
Soit R+ = {x ∈ R : x ≥ 0}.
(i) Montrer que, pour tout espace métrique (X, d) et pour toute constante
α > 0, la fonction
déf
(x, y) 7→ (αd)(x, y) = α d(x, y)

(ii) Si d1 et d2 sont deux métriques sur X, montrer que la fonction
déf
(x, y) 7→ (d! + d2 )(x, y) = d1 (x, y) + d2 (x, y)

(iii) Montrer que, pour tout espace métrique (X, d), la fonction
déf d(x, y)
(x, y) 7→ d(x, y) =
1 + d(x, y)

tout entier n ≥ 1
∀x, y ∈ X, dn (x, y) = dn (y, x) (10.1)

x = y ⇒ dn (x, y) = 0 (10.3)
et, en plus,
d1 (x, y) = 0 ⇒ x = y. (10.4)
Montrer que la fonction

X∞
déf 1 dn (x, y)
(x, y) 7→ d∞ (x, y) =
n=1
2n 1 + dn (x, y)
est bien définie et qu’elle est une métrique sur X.
Exercice 10.4.
Soient (Xi , di ), 1 ≤ i ≤ n, des espaces métriques et
déf
X1 × · · · × Xn = {(x1 , . . . , xn ) : xi ∈ Xi } (10.5)
l’espace produit des Xi . Montrer que la fonction

déf
1≤i≤n (10.6)
: (X1 × · · · × Xn ) × (X1 × · · · × Xn ) → R+
10. Exercices 103
est une métrique sur X1 × · · · × Xn . De la même façon, pour tout p, 1 ≤ p < ∞,

montrer que la fonction
( n
)1/p
déf
X
p
dp (x, y) = di (xi , yi ) (10.7)
i=1
est une métrique sur X1 × · · · × Xn . (Utiliser l’inégalité de Minkowski du Théorème

1.2)
Exercice 10.5.
Soit E un espace vectoriel normé au sens des Définitions 1.1 et 1.4 du Chapitre 2.
Montrer que
déf
d(x, y) = kx − yk
est une métrique sur E.

Soient A1 , A2 , . . . des sous-ensembles d’un espace métrique. On pose
Bn = ∪ni=1 Ai et B = ∪∞
i=1 Ai .
Démontrer que
∀n ≥ 1, Bn = ∪ni=1 Ai et B ⊃ ∪∞
i=1 Ai .
Donner un exemple où l’inclusion est stricte.

Donner un exemple d’un ensemble borné de R ayant exactement trois points d’ac-
cumulation.

On désigne par E ′ l’ensemble des points d’accumulation d’un sous-ensemble d’un
espace métrique (X, d). Établir que E ′ est fermé et que E et E ont les mêmes points
d’accumulation. E et E ′ ont-ils toujours les mêmes points d’accumulation ?

Tout point d’un ensemble fermé E ⊂ R2 est-il point d’accumulation de E ? Re-
prendre le problème en supposant E ouvert.

Soit (X, d) un espace métrique et E un sous-ensemble de X. Montrer que
(a) ∁ int E = ∁E.
(b) Est-ce que E et int E ont le même intérieur ?
(c) Est-ce que E et int E ont la même adhérence ?
Exercice 10.11 (W. Rudin [1, exercice 14 p. 42]).

Donner un exemple d’un recouvrement ouvert de l’intervalle ]0, 1[ dont on ne peut
extraire de sous-recouvrement fini.

(
1, si x 6= y
d(x, y) =
0, si x = y.
Montrer que d est une métrique sur X. Quels en sont les ouverts ? les fermés ? les
compacts ?
Exercice 10.13.
On considère l’ensemble à deux éléments {0, 1} dans R équipé d’une métrique arbi-
traire d (il en existe au moins une : d(x, y) = |x − y|).
(i) Énumérer tous les ouverts de ({0, 1}, d). Justifier.
(ii) Énumérer tous les compacts de ({0, 1}, d). Justifier.
(iii) Est-ce que ({0, 1}, d) est complet ? Justifier.
(iv) Énumérer tous les fermés de X = {0, 1, 2} pour une métrique arbitraire
dX sur X. Justifier.

Soit {xn } une suite de Cauchy d’une espace métrique (X, d) ayant une valeur
d’adhérence x ∈ X. Montrer que xn → x.
Exercice 10.15.
Soit X = R muni de la métrique d(x, y) = |x − y|.
(i) Montrer que l’application
déf x
x 7→ ϕ(x) = : R → ] − 1, 1[ (10.8)
1 + |x|
est une bijection.
(ii) Vérifier que
déf x y
dϕ (x, y) = d(ϕ(x), ϕ(y)) = − (10.9)
1 + |x| 1 + |y|
est une métrique sur R.
(iii) Vérifier que la suite {n}, n ≥ 1, est dϕ -Cauchy, mais pas d-Cauchy.

Soient (X, d) un espace métrique complet et {En } une suite décroissante de fermés
bornés non-vides tel que
lim diam (En ) = 0.
n→∞
Montrer que ∩∞
n=1 En est un singleton.
10. Exercices 105

On dit qu’un espace métrique est séparable s’il contient un sous-espace dénombrable
et dense. Montrer que Rk est séparable.

On dit qu’une famille d’ouverts {Oα } est une base de X si tout ouvert de X est
la réunion d’ouverts de cette famille. Montrer qu’un espace métrique séparable
posssède une base dénombrable.

Soit un espace métrique (X, d) dans lequel tout sous-ensemble infini possède au
moins un point d’accumulation. Démontrer que X est séparable. Indication : Soit
r > 0 et x1 ∈ X ; ayant déterminé x1 . . . . , xj ∈ X, choisir, s’il existe, un point
xj+1 tel que d(xj , xj+1 ) ≥ r pour tout i = 1, . . . , j. Montrer que cette construction
s’arrête au bout d’un nombre fini de boules ouvertes de rayon r. Prendre r = 1/n
(n = 1, 2, 3, . . . ) et considérer les centres des boules correspondantes.

Démontrer que tout espace métrique compact K a une base dénombrable et qu’il
est donc séparable. Indication : pour tout entier n > 0, il existe un nombre fini de
boules ouvertes de rayon 1/n recouvrant K.
Chapitre 4
Fonctions,
limites et continuités
1 Rappels sur les applications et les fonctions

Il faut se reporter à la Définition 1.1 au début du Chapitre 2 pour la définition
d’une application (fonction) et celles d’application induite ou d’application inverse
induite. On utilisera indifféremment les termes applications et fonctions.
Définition 1.1.
Soit une fonction f : X → Y , l’ensemble P(X) des sous-ensembles de X et l’en-
semble P(Y ) des sous-ensembles de Y .
(i) À chaque A ⊂ X, on associe l’image de A par f
déf
f (A) = {f (x) : x ∈ A} ⊂ Y. (1.1)
On utilisera la (même) notation f pour l’application induite
A 7→ f (A) : P(X) → P(Y ). (1.2)
(ii) À chaque B ⊂ Y , on associe l’image inverse ou réciproque de B par f

déf
f −1 (B) = {x ∈ X : f (x) ∈ B} ⊂ X. (1.3)
On utilisera la notation f −1 pour l’application inverse induite
B 7→ f −1 (B) : P(Y ) → P(X). (1.4)
On rappelle les relations et résultats suivants.

Théorème 1.1. Soit f : X → Y . Alors l’application inverse induite f −1 : P(Y ) →
P(X) préserve les opérations élémentaires suivantes :
(1) f −1 (∪α Bα ) = ∪α f −1 (Bα ) ;
107
108 Chapitre 4. Fonctions, limites et continuités
(2) f −1 (∩α Bα ) = ∩α f −1 (Bα ) ;

(3) f −1 (B1 \B2 ) = f −1 (B1 )\f −1 (B2 ).
Démonstration. Exercice 10.1.
L’application inverse induite f −1 commute donc avec les opérations de réunion,

d’intersection, et de complémentarité. Ce n’est pas le cas de l’application induite f .
Théorème 1.2. Soit f : X → Y . Alors l’application induite f : P(X) → P(Y )

préserve les opérations suivantes :
(1) f (∪α Aα ) = ∪α f (Aα ) ;
(2) f (∩α Aα ) ⊂ ∩α f (Aα ).
Un exemple pour lequel f (A1 ∩ A2 ) $ f (A1 ) ∩ f (A2 ) dans la partie (2) est la
fonction x 7→ f (x) = 1 : R → R avec A1 = [0, 1] et A2 = [2, 3]. En effet, A1 ∩A2 = ∅,
f (A1 ∩ A2 ) = ∅ et f (A1 ) ∩ f (A2 ) = {1}.
Théorème 1.3. Soit f : X → Y . Alors

(1) pour chaque A ⊂ X, on a A ⊂ f −1 [f (A)],
(2) pour chaque A ⊂ X et B ⊂ Y , on a

f A ∩ f −1 (B) = f (A) ∩ B (1.5)
et, en particulier,

f f −1 (B) = f (X) ∩ B. (1.6)
Comme l’application inverse induite de la composition existe toujours, on a le

résultat suivant.
Théorème 1.4. Soit f : X → Y et g : Y → Z. Alors (g ◦ f )−1 = f −1 ◦ g −1 , où

f −1 , g −1 et (g ◦ f )−1 sont les applications inverses induites.
Théorème 1.5. On se donne :

- un ensemble arbitraire X et un recouvrement {Aα } de X par des sous-
ensembles de X, c’est-à-dire X = ∪α Aα ;
- un autre ensemble arbitraire Y et une famille fα : Aα → Y d’applications
tel que
∀α, β, fα |Aα ∩Aβ = fβ |Aα ∩Aβ .

2. Limite d’une fonction 109
Alors, il existe une application unique f : X → Y qui est un prolongement de chaque

fα :
∀α, f |A α = f α .
Théorème 1.6. Soit f : X → Y et g : Y → X tel que g ◦ f = IX , où IX est la
fonction identité sur X. Alors f est injective et g est surjective.
2 Limite d’une fonction

2.1 Limite d’une fonction en un point d’accumulation
Définition 2.1.
Soient
- (X, dX ) et (Y, dY ) deux espaces métriques,
- E ⊂ X et a ∈ E ′ un point d’accumulation de E, c-à-d., x ∈ X tel que
pour tout r > 0, Br′ (x) ∩ E 6= ∅),
- f : E → (Y, dY ) une fonction.
(i) On dit que f (x) tend vers y ∈ Y lorsque x ∈ E tend vers a si
∀ε > 0, ∃δ > 0 tel que ∀x ∈ E , 0 < dX (x, a) < δ, dY (f (x), y) < ε. (2.1)
On dira que y est la limite 1 de f en a par rapport à E et on l’écrira
lim f (x) ou simplement lim f (x) (2.2)
x→a x→a
E
lorsque le contexte ne prête pas à confusion.

(ii) La limite de f : E → (Y, dY ) en un point isolé de E n’est pas définie.
Remarque 2.1.
Pour une fonction f : (X, dX ) → (Y, dY ), il ne faut pas confondre la Définition 2.1
de la limite en a ∈ E ′ de f : E → (Y, dY ) avec celle (plus forte) de limite en a ∈ E ′
de f : X → (Y, dY )
lim f (x) (2.3)
x→a
X
qui signifie
∀ε > 0, ∃δ > 0 tel que ∀x ∈ X , 0 < dX (x, a) < δ, dY (f (x), y) < ε, (2.4)
où l’on approche du point a non seulement par des points x de E mais aussi par
des points dans le plus gros ensemble X.
1. C’est K. Weierstrass qui le premier introduisit la définition epsilon-delta de la limite d’une
fonction de la manière qu’elle est écrite de nos jours. Il introduisit aussi la notation lim et limx→a
(voir l’histoire des mathématiques de D. Burton [1, pp. 558–559]).
Exemple 2.1.
Soient X = R2 , E = B1 (0, 0), a ∈ R2 tel que kak = 1 et la fonction
(
déf 1, si x ∈ B1 (0, 0),
f (x) =
0, si x ∈ R2 \B1 (0, 0).
Cette fonction n’a pas de limite en a dans R2 , mais elle en a une dans B1 (0, 0)
lim f (x) = 1 6= 0 = f (a).
x → a
B1 (0,0)
Elle n’est pas non plus égale à la valeur de f en a.
y f (a) = y
f (a) f (a)
a a a
Figure 4.1. Exemples de fonctions f . Pour E = R, la limite y de f (x) en

a existe pour les seconde et troisième fonctions, mais pas pour la première.
Exemple 2.2.
La fonction de Dirichlet 2 sur R
(
déf 0, si x ∈ Q
f (x) =
1, si x ∈ R \ Q
ne possède de limite en aucun point de R.

Si f (x) a une limite y en a ∈ R, alors pour ε = 1/4 > 0, il existe δ > 0 tel que
0 < |x − a| < δ ⇒ |f (x) − y| < 1/4.
2. Dirichlet a été élevé en Allemagne, puis a été ensuite envoyé en France pour suivre ses
études supérieures. Il fut en contact avec les plus grands mathématiciens français de l’époque, à
l’instar de Legendre, Laplace ou Fourier. Il retourne ensuite en 1825 en Allemagne où il travaille
avec Gauss, dont il reprendra la chaire à l’Université de Göttingen, et Jacobi. Il eut entre autres
comme élève Riemann. Les travaux de Dirichlet ont surtout porté sur les séries de Fourier et
l’arithmétique, où on lui doit l’essentiel de la démonstration du dernier théorème de Fermat à
l’aide des entiers de Dirichlet pour le cas où le paramètre est égal à cinq. On lui doit également des
travaux sur les intégrales et la recherche de fonctions discontinues. Un célèbre problème d’analyse
porte son nom : le Problème de Dirichlet. Dirichlet a également travaillé sur le théorème de Fermat-
Wiles. Aussi, il a prouvé le théorème de Dirichlet conjecturé à l’origine par Legendre et Gauss. Il
est fait membre étranger de la Royal Society en 1855.
Figure 4.2. Johann Peter Gustav Lejeune Dirichlet (1805–1859).
Comme l’intervalle (a − δ, a + δ) contient une infinité de rationnels et d’ irrationnels

et que la fonction ne prend que les valeurs 0 et 1, il vient
0 < |x − a| < δ ⇒ |0 − y| < 1/4 et |1 − y| < 1/4

⇒ −1/4 < y < 1/4 et 3/4 < y < 5/4
une contradiction.
Comme pour les points d’accumulation, on a une caractérisation de la limite

en termes de suites.
Théorème 2.1. Soient X, Y, E, f, a et y comme dans la Définition 2.1. Alors
lim f (x) = y (2.5)

x→a
E
si et seulement si
lim f (xn ) = y (2.6)

n→∞
pour toute suite {xn } ⊂ E, xn 6= a, qui converge vers a.

Démonstration. (⇒). En effet, soit une suite {xn } ⊂ E, xn 6= a, qui converge vers
a. Soit un couple (ε, δ) associé à la limite. Il existe N ≥ 1 tel que pour tout n > N ,
0 < dX (xn , a) < δ et donc
∀n > N, dY (f (xn ), y) < ε
et limn→∞ f (xn ) = y.
(⇐). Par l’absurde. Supposons
∃ε > 0 tel que ∀δ > 0, ∃x ∈ E, 0 <dX (x, a) < δ, dY (f (x), y) ≥ ε. (2.7)
Pour chaque n ≥ 1,
∃xn ∈ E, 0 <dX (xn , a) < 1/n, dY (f (xn ), y) ≥ ε. (2.8)
On obtient bien une suite {xn } ⊂ E, xn 6= a, qui converge vers a mais pour laquelle
f (xn ) ne converge pas vers y en contradiction avec notre hypothèse.
Corollaire 1. Si f admet une limite en a par rapport à E, cette limite est unique.
Démonstration. Supposons qu’il existe deux limites y1 et y2 . Par le théorème, il
existerait une suite {xn } ⊂ E, xn 6= a, qui converge vers a tel que
lim f (xn ) = y1 et lim f (xn ) = y2 .

n→∞ n→∞
Comme la limite d’une suite convergente est unique, il vient y1 = y2 .
1.5
0.5
-2.5 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5
-0.5
-1
-1.5
Figure 4.3. Limite de sin(1/x) en a = 0 ?
Exemple 2.3.
déf
Soit la fonction x 7→ f (x) = sin(1/x) : R \{0} → R. On prend les suites
π
déf 2 1
x+
n = →0 ⇒ f (x+ n ) = sin + 2nπ = 1
π 4n + 1 2
2 1 π
déf
x−
n = → 0 ⇒ f (x−
n ) = sin − + 2nπ = −1.
π 4n − 1 2
f (x) n’a donc pas de limite en x = 0.
Définition 2.2.
(i) Une fonction f : (X, d) → R est dite fonction à valeurs réelles.
(ii) Une fonction f : (X, d) → C est dite fonction à valeurs complexes.
(iii) Pour k ≥ 1, on dira que f : (X, d) → Rk et f : (X, d) → Ck sont des
fonctions à valeurs vectorielles.
Pour les fonctions à valeurs vectorielles, on peut définir les opérations suivantes :
déf déf déf
(f + g)(x) = f (x) + g(x), (f · g)(x) = f (x) · g(x), (λ f )(x) = λ f (x) (2.9)
pour λ ∈ R.
Théorème 2.2. Soient f, g : (X, d) → C, E ⊂ X, a ∈ X un point d’accumulation
de E et y et z dans C tel que
lim f (x) = y et lim g(x) = z.
x→a x→a
Alors,
(a) limx→a (f + g)(x) = y + z ;
(b) limx→a (f g)(x) = y z ;
(c) limx→a (f /g) (x) = y/z si z 6= 0.
Si f et g étaient des fonctions à valeurs vectorielles, on aurait
(a) limx→a (f + g)(x) = y + z,
(b) limx→a (f · g)(x) = y · z,
en raisonnant composante par composante.
2.2 Limite d’une fonction d’une variable réelle aux infinis

Comme il y a un ordre dans R, la notion de limite d’une fonction f : R → (Y, d)
en un point de R peut être étendue à ±∞.
Définition 2.3.
Soit f : R → (Y, d).
(i) Soit E un sous-ensemble de R qui n’est pas borné supérieurement. On dit
f tend vers y ∈ Y lorsque x ∈ E tend vers +∞ si
∀ε > 0, ∃M tel que ∀x ∈ E, x > M, dY (f (x), y) < ε. (2.10)
On écrira
lim f (x) = y ou lim f (x) = y. (2.11)
x→ +∞ x→ +∞
E
(ii) Soit E un sous-ensemble de R qui n’est pas borné inférieurement. On dit

f tend vers y ∈ Y lorsque x ∈ E tend vers −∞ si
∀ε > 0, ∃m tel que ∀x ∈ E, x < m, dY (f (x), y) < ε. (2.12)
On écrira
lim f (x) = y ou lim f (x) = y. (2.13)
x→ −∞ x→ −∞
E
Si Y est un espace vectoriel comme R, C, Rk et Ck , alors les opérations algébriques

associées à ces espaces s’appliquent aux limites de fonctions en ±∞.
2.3 Limite inférieure et limite supérieure d’une fonction à

valeurs réelles
On considère des fonctions f : (X, d) → R. Par exemple, la fonction x 7→
f (x) = sin(1/x) : R \{0} → R de l’Exemple 2.3 qui n’a pas de limite en x = 0. On
peut cependant trouver des suites xn → 0 telles que la suite {f (xn )} tende vers
chaque point de l’intervalle [−1, 1] qui est l’ensemble des points d’accumulation de
toutes les suites {f (xn )} lorsque xn → 0. Comme il y a une relation d’ordre sur
R, on peut distinguer ce qui est en dessus et ce qui est en dessous et parler de −1
comme une limite inférieure et de +1 comme une limite supérieure.
On se place dans le contexte suivant :
(i) (X, d) est un espace métrique et E, ∅ 6= E ⊂ X,
(ii) a ∈ E ′ est un point d’accumulation de E,
(iii) f : E → R.
On considère d’abord le cas inférieure. On associe à ε > 0, l’infimum suivant
déf
g(ε) = inf f (x). (2.14)
x∈Bε′ (a)∩E
Comme g(ε) est l’infimum de f sur l’ensemble non-vide Bε′ (a) ∩ E, il est égal à un
réel ou à −∞. La fonction g(ε) est monotone croissante lorsque ε tend vers 0 car
0 < ε1 < ε2 ⇒ g(ε1 ) ≥ g(ε2 ).
Donc, la limite suivante existe dans R = R ∪{±∞} :
lim g(ε)∈ R,
εց0
et, comme g(ε) croı̂t lorsque ε → 0, on a aussi
lim g(ε) = sup g(ε).

εց0 ε>0
On en arrive à la définition suivante.
Définition 2.4.
Soient (X, d) un espace métrique, E, ∅ 6= E ⊂ X, a ∈ E ′ est un point d’accumula-
tion de E, et f : E → R.
(i) On appelle limite inférieure de f lorsque x tend vers a dans E la quantité
déf
lim inf f (x) = sup inf f (x).
x→a ε>0 x∈Bε′ (a)∩E
E
(ii) On appelle limite supérieure de f lorsque x tend vers a dans E la quantité

déf
lim sup f (x) = inf sup f (x).
x→a ε>0 x∈B ′ (a)∩E
E ε
Les limites inférieure et supérieure ne sont pas définies en un point isolé.

3. Fonctions continues 115
On vérifiera que pour la fonction f (x) = sin(1/x) de l’Exemple 2.3
lim inf f (x) = −1 et lim sup f (x) = 1.

x→0 x→0
R R
Mais pour la fonction f (x) = 1/x, on aura
lim inf f (x) = −∞ et lim sup f (x) = +∞.

x→0 x→0
R R
3 Fonctions continues
3.1 Définitions et propriétés
Définition 3.1.
Soient
- (X, dX ) et (Y, dY ) deux espaces métriques et
- E un sous-ensemble non-vide de X.
(i) Une fonction f : (E, dX ) → (Y, dY ) est continue en a ∈ E si
∀ε > 0, ∃δ > 0 tel que ∀x ∈ E , dX (x, a) < δ, dY (f (x), f (a)) < ε. (3.1)
(ii) Une fonction f : (E, dX ) → (Y, dY ) est continue sur E si f est continue en tout
point de E.
Remarque 3.1.
Il aurait été suffisant de donner la définition pour E = X, mais on a voulu mettre
l’accent sur une ambiguı̈té possible pour une fonction f : X → R lorsque E ( X.
En effet, la continuité par rapport à (X, d),
∀ε > 0, ∃δ > 0 tel que ∀x ∈ X , dX (x, a) < δ, dY (f (x), f (a)) < ε, (3.2)
implique la continuité par rapport à (E, d), mais la réciproque n’est en général pas
vraie. Par exemple, si l’on considère la fonction
( )
déf 1, kxk ≤ 1
x 7→ f (x) = : Rk → R
0, kxk > 1
et pour E la boule fermée B1 (0) dans Rk , la fonction f : B1 (0) → R est constante

et donc continue sur B1 (0), mais comme fonction f : Rk → R elle est discontinue
sur la frontière ∂E qui correspond à la sphère S k−1 = {x ∈ Rk : kxk = 1}.
Remarque 3.2.
La métrique d : (X × X, d1 ) → R est continue lorsque l’espace produit X × X est
muni de la métrique (voir l’Exercice 10.4 du Chapitre 3)
déf
d1 ((x, y), (x′ , y ′ )) = d(x, x′ ) + d(y, y ′ ).
Soient (a, b) et (x, y) ∈ X × X. Par l’inégalité du triangle répétée
d(x, y) − d(a, b) ≤ d(x, y) − d(a, y) + [d(a, y) − d(a, b)]

⇒ |d(x, y) − d(a, b)| ≤ |d(x, y) − d(a, y)| + |d(a, y) − d(a, b)|
≤ d(x, a) + d(y, b)
⇒ |d(x, y) − d(a, b)| ≤ d(x, a) + d(y, b) = d1 ((x, y), (a, b)).
On obtient donc la continuité sur l’espace produit X × X.
Comme la compacité, la continuité peut être caractérisée à l’aide de suites.

Théorème 3.1. (X, dX ) et (Y, dY ) deux espaces métriques et E un sous-ensemble
de X. Alors f : (E, dX ) → (Y, dY ) est continue en a ∈ E si et seulement si
∀{xn } ⊂ E telle que xn → a, lim f (xn ) = f (a). (3.3)

n→∞
Démonstration. (⇒) Soit un couple (ε, δ) associé à la continuité de f en a. On

considère une suite {xn } ⊂ E qui converge vers a. Il existe N ≥ 1 tel que pour tout
n > N , dX (xn , a) < δ et donc
∀n > N, dY (f (xn ), f (a)) < ε ⇒ lim f (xn ) = f (a).

n→∞
(⇐) Par l’absurde. Supposons
∃ε > 0 tel que ∀δ > 0, ∃x ∈ E, dX (x, a) < δ, dY (f (x), f (a)) ≥ ε. (3.4)
Pour chaque n ≥ 1,
∃xn ∈ E, dX (xn , a) < 1/n, dY (f (xn ), f (a)) ≥ ε. (3.5)
On obtient bien une suite {xn } ⊂ E qui converge vers a mais pour laquelle f (xn )
ne converge pas vers f (a) en contradiction avec notre hypothèse.
Par définition de la continuité, toute fonction f est continue en un point isolé de E.
En effet, a ∈ E est un point isolé de E s’il existe r > 0 tel que Br′ (a) ∩ E = ∅. Donc,
pour tout δ, 0 < δ ≤ r, Bδ (a) = {a} et f (a) − f (a) = 0 ce qui trivialement donne la
continuité en a. La continuité n’a donc à être vérifiée qu’aux points d’accumulation
de E. Des Théorèmes 2.1 et 3.1 on a le résultat suivant.
Corollaire 1. Soient (X, dX ) et (Y, dY ) deux espaces métriques, E un sous-ensemble
de X et f : (E, dX ) → (Y, dY ). Si a ∈ E est un point d’accumulation de E, c’est-à-
dire, a ∈ E ∩ E ′ , alors f est continue en a ∈ E si et seulement si
lim f (x) = f (a).

x→a
E
À la lumière du Corollaire 1, les opérations sur des fonctions continues f :

E ⊂ (X, dX ) → R du Théorème 2.2 donnent des fonctions continues. L’opération
fonctionnelle qui est peut-être la plus importante est celle de la composition de deux
fonctions.
Théorème 3.2. Soient (X, dX ), (Y, dY ) et (Z, dZ ) trois espaces métriques, E ⊂ X,

f : (E, dX ) → (Y, dY ) continue en a ∈ E,
g : (f (E), dY ) → (Z, dZ ) continue en f (a) ∈ f (E),
et la composée g ◦ f de f et de g
déf
x 7→ (g ◦ f )(x) = g(f (x)) : (E, dX ) → (Z, dZ ).
Alors g ◦ f est continue en a ∈ E.
Démonstration. Soit ε > 0. Comme g est continue en f (a), il existe η > 0 tel que
∀y ∈ f (E) tel que dY (y, f (a)) < η, dZ (g(y), g(f (a)) < ε.
Par continuité de f en a, il existe δ > 0 tel que
∀x ∈ E tel que dX (x, a) < δ, dY (f (x), f (a)) < η.
En combinant les deux propriétés
∀x ∈ E tel que dX (x, a) < δ, dZ (g(f (x)), g(f (a)) < ε
et g ◦ f est continue en a.
Pour simplifier la présentation, on donne les prochains théorèmes avec E = X.
Théorème 3.3. Soient (X, dX ) et (Y, dY ) deux espaces métriques et une fonction
f : (X, dX ) → (Y, dY ). Les propriétés suivantes sont équivalentes.
(i) f est continue sur X.
(ii) Pour tout A ⊂ X, on a f (A) ⊂ f (A).
(iii) Pour tout B ⊂ Y , on a f −1 (B) ⊂ f −1 (B).
(iv) ∀ F un fermé dans Y , f −1 (F ) est un fermé dans X.
(v) ∀ O un ouvert dans Y , f −1 (O) est un ouvert dans X.
Démonstration. (i) ⇒ (ii) Soit A ⊂ X et b ∈ A. On montre que f (b) ∈ f (A). Ceci

revient à montrer que f (b) est un point d’adhérence de f (A) ou que
∀ε > 0, Bε (f (b)) ∩ f (A) 6= ∅.
Par définition de la continuité, il existe δ > 0 tel que
f (Bδ (b)) ⊂ Bε (f (b)) ⇒ f (Bδ (b)) ∩ f (A) ⊂ Bε (f (b)) ∩ f (A)

⇒ f (Bδ (b) ∩ A) ⊂ f (Bδ (b)) ∩ f (A) ⊂ Bε (f (b)) ∩ f (A)
| {z }
par le Théorème 1.2 (2). Comme b ∈ A, on a Bδ (b) ∩ A 6= ∅ et, a fortiori, f (Bδ (b) ∩
A) 6= ∅ ce qui entraı̂ne Bε (f (b)) ∩ f (A) 6= ∅ tel que désiré.
(ii) ⇒ (iii) Soit A = f −1 (B). Alors
f (A) ⊂ f (A) = f (f −1 (B)) = f (X) ∩ B ⊂ B

| {z } | {z }
par le Théorème 1.3 (2). Il vient alors du Théorème 1.3 (1)

f −1 (B) = A ⊂ f −1 (f (A)) ⊂ f −1 B .
(iii) ⇒ (iv) Soit F ⊂ Y fermé. Alors, comme F = F ,
f −1 (F ) ⊂ f −1 (F ) ⊂ f −1 (F ) = f −1 (F ) ⇒ f −1 (F ) = f −1 (F )
| {z }
et f −1 (F ) est fermé.
(iv) ⇒ (v) Pour tout ouvert O ⊂ Y , Y \O est fermé et
f −1 (Y \O) est fermé.
Par le Théorème 1.1 (3)
f −1 (Y \O) = f −1 (Y )\f −1 (O) = X\f −1 (O)

| {z }
et f −1 (O) est donc ouvert comme complement d’un fermé.

(v) ⇒ (i) On associe à chaque a ∈ X la boule ouverte Bε (f (a)) dans Y . Par
hypothèse, son image inverse
f −1 (Bε (f (a)))
est ouverte dans X. Puisque a ∈ f −1 (f (a)) ⊂ f −1 (Bε (f (a))), a est un point
intérieur de f −1 (Bε (f (a))) et il existe δ > 0 et une boule Bδ (a) dans X tel que
Bδ (a) ⊂ f −1 (Bε (f (a))) = X ∩ f −1 (Bε (f (a)))

⇒ f (Bδ (a)) ⊂ f f −1 (Bε (f (a))) = f (X) ∩ Bε (f (a)) ⊂ Bε (f (a))
| {z }
par le Théorème 1.3 (2). Mais f (Bδ (a)) ⊂ Bε (f (a)) est la forme ensembliste de la
définition (ε, δ) de la continuité en a.
Comme pour la notion de limite, les opérations suivantes sont permises pour
les fonctions continues à valeurs réelles ou complexes.
Théorème 3.4. Soient f, g : (X, d) → C ou R des fonctions continues sur X. Alors
(a) f + g est continue sur X ;
(b) f g est continue sur X ;
(c) f /g est continue sur X si g(x) 6= 0 pour tout x ∈ X.
Pour des fonctions à valeurs vectorielles f, g : (X, d) → Ck ou Rk continues sur X,
(a) f + g est continue sur X ;
(b) f · g est continue sur X.
Dans la base orthonormale de Rk , les applications

déf
y 7→ pi (y) = ei · y : Rk → R
qui associent à y ses composantes {yi } sont continues puisque
 1/2
Xk
dR (pi (y), pi (z)) = |pi (y) − pi (z)| ≤  |pj (y) − pj (z)|2 
j=1
 1/2
Xk
= |yj − zj |2  = dRk (y, z).
j=1
k
Même chose pour C :
 1/2
k
X
dC (pi (y), pi (z)) = |pi (y) − pi (z)| ≤  |pj (y) − pj (z)|2  = dCk (y, z).
j=1
On peut donc associer à une fonction à valeurs vectorielles f : (X, d) → Rk

k
ou C ses composantes (f1 (x), . . . , fk (x)). Pour des fonctions à valeurs vectorielles
la continuité est donc équivalente à la continuité composante par composante.
Théorème 3.5. Soit f : (X, d) → Ck ou Rk . Alors f est continue sur X si et
seulement si, pour chaque i, fi est continue sur X.
Démonstration. Considérons f : (X, d) → Rk . Si f est continue, alors la composition
f ◦ pi est continue. Réciproquement, si f ◦ pi est continue pour chaque i,
 1/2  1/2
Xk Xk
dRk (f (x′ ), f (x)) =  |pj (f (x′ )) − pj (f (x))|2  = |fj (x′ ) − fj (x)|2  .
j=1 j=1
Étant donné ε > 0, il existe δi > 0 tel que

√
∀x′ , dR (x′ , x) < δi , dR (fi (x′ ), fi (x)) < ε/ k.
En prenant δ = min{δ1 , . . . , δk },
 1/2
k
X √ 2
∀x′ , dR (x′ , x) < δ, dRk (f (x′ ), f (x)) <  ε/ k  =ε
j=1
et f est continue en x.
En combinant ce théorème et le Théorème 3.4 qui dit que les sommes, produits
et multiplication par un scalaire de fonctions continues sont continus, on en déduit
que les fonctions polynômiales de la forme
k
X
P (x) = cn1 ,...,nk xn1 1 . . . xnk k
i=1
pour des entiers ni positifs ou nuls sont continues sur Rk . Plus généralement les
fonctions rationnelles
P (x)
f (x) = , Q(x) 6= 0, (3.6)
Q(x)
pour deux fonctions polynômiales P et Q sont continues aux points x tels que
Q(x) 6= 0.
Enfin, la norme sur Rk
x 7→ kxk : Rk → R (3.7)
est convexe et continue car de l’inégalité du triangle
kλx + (1 − λ)x′ k ≤ kλxk + k(1 − λ)x′ k ≤ λ kxk + (1 − λ) kx′ k

dR (kx′ k, kxk) = |kx′ k − kxk| ≤ kx′ − xk = dR (x′ , x).
Donc, pour toute fonction à valeurs vectorielles f continue, la fonction
x 7→ kf (x)k : Rk → R (3.8)
est continue en tant que fonction composée de deux fonctions continues.
3.2 Application ouverte ou fermée, homéomorphisme

Définition 3.2.
Soit f : (X, dX ) → (Y, dY ).
(i) L’application f est ouverte si, pour chaque ouvert O dans X, f (O) est
ouvert dans Y .
(ii) L’application f est fermée si, pour chaque fermé F dans X, f (F ) est fermé
dans Y .
Définition 3.3.
Soit f : (X, dX ) → (Y, dY ) une bijection.
(i) On dit que f est un homéomorphisme si f est continue sur X et f −1 est
continue sur Y . On écrira f : X ∼
=Y.
(ii) On dit que deux espaces (X, dX ) et (Y, dY ) sont homéomorphes s’il existe
un homéomorphisme f entre X et Y . On écrira X ∼ = Y.
Exemple 3.1.
P 1/2
déf k
Pour k ≥ 1 on introduit la norme euclidienne kx − ykRk = i=1 |xi − yi |2 et
déf
la métrique dRk (x, y) = kx − ykRk . L’application
déf x
x 7→ ϕ(x) = : (Rk , dRk ) → (B1 (0), dRk ) (3.9)
1 + kxkRk
dont l’inverse est

y
y 7→ ϕ−1 (y) = : (B1 (0), dRk ) → (Rk , dRk )
1 − kykRk
est un homéomorphisme. L’ensemble étendu des réels R = R ∪{±∞} est homéo-

morphe à [−1, 1] via le prolongement ϕ̂ de la bijection ϕ
déf x
x 7→ ϕ̂(x) = : (R, df ) → [−1, 1]
1 + |x|
en identifiant ±∞ à ±1, c’est-à-dire, ϕ̂(±∞) = ±1, pour la métrique dϕ (x, y) =

|ϕ(x) − ϕ(y)| sur R.
Exemple 3.2.
Avec la même norme et métrique de l’Exemple 3.3 sur Rk , k = 2, 3, soit p = (0, 0, 1)
le pôle nord de la sphère
q
déf
S 2 = x ∈ R3 : kxkR3 = x21 + x22 + x23 = 1 ⊂ R3 .
L’application ϕ : (R2 , d2 ) → (S 2 \{p}, d3 ) définie par

déf 2z1 2z2 z12 + z22 − 1
(z1 , z2 ) 7→ ϕ(z1 , z2 ) = , , , (3.10)
z12 + z22 + 1 z12 + z22 + 1 z12 + z22 + 1
est un homéomorphisme. Son inverse est la projection stéréographique

déf x1 x2
(x1 , x2 , x3 ) 7→ ϕ−1 (x1 , x2 , x3 ) = , : (S 2 \{p}, d3 ) → (R2 , d2 ).
1 − x3 1 − x3
Si l’on ajoute le point à l’infini 3 à R2 on obtient toute la sphère S 2 . Ceci revient à

construire le complété de R2 pour la nouvelle métrique
déf
x, y 7→ dϕ (x, y) = kϕ(x) − ϕ(y)kR3 : R2 × R2 → R+ (3.11)
sur R2 . L’ensemble composé de R2 et du point à l’infini s’appelle la sphère de

Riemann. 4 Cette construction se généralise à Rn , n ≥ 1, et au corps des complexes
C comme cas particulier (n = 2).
3. La notion de point à l’infini apparait au XVe siècle dans le cadre du développement des
méthodes de la perspective conique, avec l’invention de la “costruzione abbreviata” d’Alberti.
L’utilisation de ces points par les géomètres des XVIe et XVIIe siècles (par exemple Maurolico ou
da Vignola en Italie, Stevin en Hollande, Desargues et Pascal en France), puis la systématisation
de leur usage au XIXe , a conduit à la création d’une discipline mathématique : la géométrie
projective. La généralisation du langage géométrique dans les mathématiques du XXe sicle, et la
possibilité de compactifier les corps des réels et des complexes par l’ajout d’un élément à l’infini
a conduit à son tour à l’utilisation de la terminologie “point à l’infini” dans d’autres branches des
mathématiques que celles directement dérivées de la géométrie.
4. Cette notion est à la base de la géométrie projective. On parle de droite projective assimi-
lable au cercle, de plan projectif assimilable à la sphère, et ainsi de suite.
Théorème 3.6. Soit f : (X, dX ) → (Y, dY ) une bijection. Les propriétés suivantes
sont équivalentes :
(i) f est un homéomorphisme ;
(ii) f est continue et ouverte ;
(iii) f est continue et fermée ;
(iv) pour tout A ⊂ X, f (A) = f (A).
Démonstration. (i) ⇒ (ii) Du Théorème 3.3, comme f −1 est continue pour tout
ouvert O dans X,
f (O) = (f −1 )−1 (O) est ouvert.
(ii) ⇒ (iii) Du Théorème 3.3, comme f = (f −1 )−1 est ouverte, f −1 est conti-
nue. Du même théorème, pour tout fermé F dans X
f (F ) = (f −1 )−1 (F ) est fermé.
(iii) ⇒ (iv) Comme f est continue on a du Théorème 3.3 f (A) ⊂ f (A). Comme
f est fermée, on a aussi f (A) fermé. Donc
f (A) ⊂ f (A) ⊂ f (A) = f (A) ⇒ f (A) = f (A).
(iv) ⇒ (i) Comme pour tout A ⊂ X, f (A) ⊂ f (A), f est continue par le
Théorème 3.3. Pour établir la continuité de f −1 , il suffit de montrer que pour tout
fermé F ⊂ X, (f −1 )−1 (F ) = f (F ) est fermé. En faisant A = F , on a f (F ) =
f (F ) = f (F ) et f (F ) est fermé dans Y .
On peut facilement vérifier le résultat suivant à partir du Théorème 1.6.
Théorème 3.7. Soient f : (X, dX ) → (Y, dY ) et g : (Y, dY ) → (X, dX ) deux
applications continues tel que g ◦ f = IX et f ◦ g = IY . Alors f est bijective,
g = f −1 et f est un homéomorphisme.
3.3 Métriques équivalentes

Définition 3.4.
Deux métriques d1 et d2 sur un ensemble X sont équivalentes 5 si l’application
identité
déf
x 7→ IX (x) = x : (X, d1 ) → (X, d2 ) (3.12)
est un homéomorphisme. On écrira d1 ∼ d2 .

5. Pour éviter de parler de topologie, on donne ici une forme équivalente de la définition pour
les espaces métriques.
Définition 3.5 (J. Dugundji [1, Déf. 3.1 et Th. 3.2, sec. 3, Chapitre IX, p. 184]).
Soient deux métriques d1 et d2 sur l’espace X. On dit que d1 et d2 sont équivalentes si les topologies
T (d1 ) et T (d2 ) sont équivalentes (T (di ) = l’ensemble de tous les ouverts dans (X, di )).
Théorème 3.8. Soient deux métriques d1 et d2 sur un ensemble X. Elles sont

équivalentes si et seulement si pour tout a ∈ X et ε > 0
(i) il existe δ1 = δ1 (a, ε) > 0 tel que
∀x ∈ X tel que d1 (x, a) < δ1 , d2 (x, a) < ε
(ii) il existe δ2 = δ2 (a, ε) > 0 tel que
∀x ∈ X tel que d2 (x, a) < δ2 , d1 (x, a) < ε.
Démonstration. Par définition d’un homéomorphisme et de la continuité de l’iden-

tité dans les deux sens.
Exemple 3.3.
On a montré au Théorème 1.2 du Chapitre 3 que les fonctions
" k
#1/p
déf
X déf
p
dp (x, y) = |xi − yi | , p ≥ 1 un entier, d∞ (x, y) = max |xi − yi |,
1≤i≤k
i=1
sont toutes des métriques sur Rk . Pour montrer qu’elles sont toutes équivalentes, il
suffit de montrer l’équivalence des normes. Pour 1 ≤ p, q < ∞ et x ∈ Rk
k
" k #1/p " k #1/q " k #1/p
X X X X
p p p q p
∀i, |xi | ≤ |xi | ⇒ |xi | ≤ |xi | ⇒ |xi | ≤ |xi | k 1/q
i=1 i=1 i=1 i=1
1/q 1/p
⇒ kxkp ≤ k kxkq et kxkq ≤ k kxkp .
Par la même technique, pour 1 ≤ p < ∞ et x ∈ Rk
∀i, |xi | ≤ kxkp ⇒ kxk∞ = max |xi | ≤ kxkp

1≤i≤k
" k #1/p
X
p
|xi | ≤ max |xi | = kxk∞ ⇒ kxkp = |xi | ≤ k 1/p kxk∞ .
1≤i≤k
i=1
On en conclut que pour tous 1 ≤ p, q ≤ ∞
dp (x, y) = kx − ykp ≤ k 1/p kx − ykq = dq (x, y)

dq (x, y) = kx − ykq ≤ k 1/q kx − ykp = dp (x, y)
On a bien un homéomorphisme : pour tout ε > 0 :

(i) ∃δq = ε/k 1/p > 0 tel que
∀x, y ∈ Rk , dq (x, y) < δq , dp (x, y) < k 1/p δq = ε
(ii) ∃δp = ε/k 1/q > 0 tel que
∀x, y ∈ Rk , dp (x, y) < δp , dq (x, y) < k 1/q δp = ε

On voit que les δp et δq ne dépendent que de ε. Cette continuité est plus forte que la
simple continuité. En particulier, l’homéomorphisme x 7→ IRk (x) = x : (Rk , dp ) →
(Rk , dq ) transporte les suites de Cauchy en suites de Cauchy puisque pour tous
1 ≤ p, q ≤ ∞
dp (xn , xm ) = kxn − xm kp ≤ k 1/p kxn − xm kq = dq (xn , xm )

dq (xn , xm ) = kxn − xm kq ≤ k 1/q kxn − xm kp = dp (xn , xm )
Exemple 3.4 (Exercice 10.14, page 154).

P 1/2
k
L’homéomorphisme ϕ de l’Exemple 3.1 pour k ≥ 1 et dRk (x, y) = i=1 |xi − yi |2
déf x
x 7→ ϕ(x) = : (Rk , dRk ) → (B1 (0), dRk ) (3.13)
1 + kxkRk
induit la nouvelle métrique équivalente suivante sur Rk

déf
dϕ (x, y) = dRk (ϕ(x), ϕ(y)) = kϕ(x) − ϕ(y)kRk
dRk (x, y) = kϕ−1 (ϕ(x)) − ϕ−1 (ϕ(y))kRk
puisque ϕ et ϕ−1 sont continues.

L’homéomorphisme ϕ : (R2 , dR2 ) → (S 2 \{p}, dR3 ) de l’Exemple 3.2

déf 2z1 2z2 z12 + z22 − 1
(z1 , z2 ) 7→ ϕ(z1 , z2 ) = , , (3.14)
z12 + z22 + 1 z12 + z22 + 1 z12 + z22 + 1
induit aussi la nouvelle métrique équivalente suivante sur R2

déf
dϕ (x, y) = dR3 (ϕ(x), ϕ(y)) = kϕ(x) − ϕ(y)kR3
kx − ykR2 = kϕ−1 (ϕ(x)) − ϕ−1 (ϕ(y))kR2
puisque ϕ et ϕ−1 sont continues.
Un autre propriété intéressante qui s’ajoute à celles du paragraphe 2.2 du

Chapitre 3 page 58 est que, parmi toutes les métriques équivalentes, on peut toujours
en choisir une qui soit bornée sur X.
Théorème 3.9. Soit d une métrique sur X et M > 0.
(i) La fonction
déf
(x, y) 7→ dM (x, y) = min{d(x, y), M } : X × X → R+ (3.15)

(ii) La métrique dM est équivalente à la métrique d.
Démonstration. (i) dM est une métrique. En effet, dM (x, y) = 0 < M entraı̂ne

d(x, y) = dM (x, y) = 0 et donc x = y. Il y a symétrie car
dM (x, y) = min{d(x, y), M } = min{d(y, x), M } = dM (y, x).
Pour l’inégalité du triangle, on a déjà d(x, z) ≤ d(x, y) + d(y, z). Si d(x, y) ≥ M ou

d(y, z) ≥ M , alors dM (x, y) = M ou dM (y, z) = M et
dM (x, z) = min{d(x, z), M } ≤ M ≤ dM (x, y) + dM (y, z).
Si d(x, y) < M et d(y, z) < M , alors dM (x, y) = d(x, y) et dM (y, z) = d(y, z) et
dM (x, z) = min{d(x, z), M } ≤ d(x, z) ≤ d(x, y) + d(y, z) = dM (x, y) + dM (y, z).
(ii) On applique le Théorème 3.8 en un point a ∈ X et ε > 0. Dans un sens,

par définition, on a dM (x, a) ≤ d(x, a). En prenant δ = ε,
∀x ∈ X, d(x, a) < δ ⇒ dM (x, a) ≤ d(x, a) < δ = ε.
Dans l’autre sens, on prend δ = min{M, ε} > 0
∀x ∈ X, dM (x, a) < δ ≤ M ⇒ d(x, a) = dM (x, a) < δ ≤ ε.
On peut facilement vérifier les propriétés suivantes sont préservées.
Théorème 3.10. Soient d1 , d2 deux métriques équivalentes sur X. Une fonction
f : (X, d1 ) → (Y, dY )
est continue, ouverte, ou fermée si et seulement si
f : (X, d2 ) → (Y, dY )
est respectivement continue, ouverte, ou fermée.
En général, un homéomorphisme ne préserve pas les suites de Cauchy. On

verra plus loin qu’il faut la continuité uniforme 6 pour transporter les suites de
Cauchy en suites de Cauchy. Ceci veut dire que pour deux métriques équivalentes,
une suite de Cauchy pour l’une peut ne pas l’être pour l’autre comme on l’a indiqué
dans l’Exemple 6.1 du Chapitre 3. La complétude est donc une propriété de la
métrique. Ce n’est pas une notion topologique (voir la note 5 au bas de la page 122
et J. Dugundji [1, Chap. XIV, pp. 292–293]). On revient donc sur cet exemple
important avec plus de détails incluant l’équivalence des deux métriques.
6. Voir la Définition 6.1 page 138 et le Théorème 6.2 page 140.

Exemple 3.5 (Exemple 6.1 du Chapitre 3 page 81 et les Exemples 3.1 et 3.4).
Soit d(x, y) = |x − y| la métrique sur X = R et la bijection
déf x
x 7→ ϕ(x) = : R → ] − 1, 1[ (3.16)
1 + |x|
qui a pour inverse
déf y
y 7→ ϕ−1 (y) = : ] − 1, 1[ → R . (3.17)
1 − |y|
Les fonctions ϕ et ϕ−1 sont continues comme quotients de deux fonctions continues
dont le dénominateur ne s’annulle pas. La fonction ϕ est donc un homéomorphisme
par le Théorème 3.7.
On a vu dans l’Exemple 6.1 du Chapitre 3 que la fonction
déf x y
dϕ (x, y) = d(ϕ(x), ϕ(y)) = − (3.18)
1 + |x| 1 + |y|
est aussi une métrique sur R. L’application identité
déf
x 7→ I(x) = x : (R, d) → (R, dϕ ) (3.19)
qui est donc une bijection continue dans les deux sens et les deux métriques d et dϕ
sont équivalentes sur R au sens de la Définition 3.4. En effet, comme ϕ est continue,
x y
∀ε > 0, ∃δ1 > 0, ∀y, |y − x| < δ1 , − <ε
1 + |x| 1 + |y|
⇒ ∀y, |y − x| < δ1 , dϕ (y, x) < ε.
Dans l’autre sens, x = ϕ−1 (ϕ(x)) et
d(y, x) = |y − x| = |ϕ−1 (ϕ(y)) − ϕ−1 (ϕ(x))|.
Comme ϕ−1 est aussi continue au point ϕ(x),
∀ε > 0, ∃δ2 > 0, ∀z ∈ ] − 1, 1[ , |z − ϕ(x)| < δ2 , ϕ−1 (z) − ϕ−1 (ϕ(x)) < ε.
En particulier,
∀y ∈ R, |ϕ(y) − ϕ(x)| < δ2 , ϕ−1 (ϕ(y)) − ϕ−1 (ϕ(x)) < ε
⇒ ∀y ∈ R, dϕ (y, x) < δ2 , d(y, x) = |y − x| < ε.
La fonction ϕ est cependant un peu plus continue que son inverse ϕ−1 . En effet,
x y x − y + x |y| − y |x|
dϕ (x, y) = − =
1 + |x| 1 + |y| (1 + |x|) (1 + |y|)
(1 + |y|) (x − y) + y (|y| − |x|)
=
(1 + |x|) (1 + |y|)
(1 + |y|) |x − y| + |y| |y − x|
≤ < 2 |y − x| = 2 d(y, x).
(1 + |x|) (1 + |y|)
Comme dϕ (x, y) < 2 d(y, x), toute suite d-Cauchy est dϕ -Cauchy : dϕ (xn , xm ) <
2 |xn − xm | = 2 d(xn , xm ). Cependant, la réciproque est fausse. La suite {n} n’est
pas d-Cauchy car n → +∞ mais elle est dϕ -Cauchy. En effet, pour tout ε > 0,
N > 1/ε, n > N et k ≥ 1,
n n+k k 1 1
dϕ (n, n + k) = − = < < < ε.
1+n 1+n+k (1 + n) (1 + n + k) 1+n n
3.4 Prolongement continu

On a vu à la Remarque 3.1 que, pour une fonction f : (X, dX ) → R et un
sous-ensemble A ⊂ X, la continuité de f : (A, dX ) → R sur A n’implique pas
nécessairement celle de f : (X, dX ) → R en tout point de A. En général, cette
dernière notion est plus forte. Les deux notions de continuité coı̈ncident cependant
pour un point intérieur de A et donc pour A ouvert, mais, en général, pas pour un
point frontière de A.
On peut alors se poser la question suivante. Étant donnée une fonction f :
(A, dX ) → (Y, dY ) continue sur A ⊂ X, peut-on la prolonger en une fonction F :
(X, dX ) → (Y, dY ) continue sur X ? Ce n’est pas toujours possible comme le montre
l’exemple de la fonction continue x 7→ f (x) = 1/(x (1 − x)) : (0, 1) → R définie sur
l’intervalle ouvert (0, 1) qui ne possède pas de prolongement continu sur tout R.
Définition 3.6.
Soit A, ∅ 6= A ⊂ X. On dit que F : X → Rn est un prolongement de f : A → Rn si
∀a ∈ A, F (a) = f (a) (ou sous forme compacte F |A = f ).
La fonction F |A : A → Rn est appelée restriction de F à A.
On peut démontrer facilement en dimension un (X = R) que la conjoncture est

vraie pour un fermé A à partir du Théorème 8.2 du Chapitre 3.
Théorème 3.11. Soit A, ∅ 6= A ⊂ R, fermé et f : A → Rn une fonction continue
sur A. Alors, il existe un prolongement F : R → Rn de f continu sur R.
Démonstration. Il suffit de démontrer le résultat pour n = 1 et de l’appliquer à
chaque composante de f dans le cas vectoriel. Comme A est fermé, son complément
R \A est ouvert dans R. Par le Théorème 8.2 du Chapitre 3, tout sous-ensemble
ouvert de R peut s’écrire comme la réunion au plus dénombrable intervalles ouverts
disjoints {Ii } (Ii ∩ Ij = ∅ si i 6= j), c’est-à-dire
[
R \A = Ii .
i
Chaque Ii est de la forme ]ai , bi [ et, nécessairement ai ∈ A et bi ∈ A où les valeurs

de la fonction f sont f (ai ) et f (bi ). On définit le prolongement F de f sur ]ai , bi [
comme suit
déf bi − x x − ai
F (x) = f (ai ) + f (bi ) , ai < x < b i . (3.20)
b i − ai b i − ai
C’est une fonction continue sur [ai , bi ] qui coı̈ncide avec f aux deux extrémités
de l’intervalle [ai , bi ]. En procédant intervalle par intervalle, on construit ainsi une
fonction continue sur R dont la restriction à A est f .
Le prolongement n’est pas unique car, au lieu de tracer une droite entre
(ai , f (ai )) et (bi , f (bi )), on aurait pu prendre n’importe quelle fonction continue
sur [ai , bi ] passant par (ai , f (ai )) et (bi , f (bi )).
Ce résultat demeure vrai non seulement dans l’espace euclidien Rn de dimen-
sion n ≥ 2 mais aussi dans un espace métrique arbitraire (X, d). En 1915 H. Tietze
Figure 4.4. Heinrich Franz Friedrich Tietze (1880–1964).
[1] construisit le prolongement

1/dA (x)
déf f (a)
F (x) = sup
a∈A 1 + d(x, a)2
d’une fonction f : A → R pour A fermé sous l’hypothèse que inf x∈A f (x) > 0. Cette
restriction n’est pas contraignante car on peut à l’aide d’un homéomorphisme de R,
comme par exemple
déf z
z 7→ h(z) = + 2 : R → ]1, 2[ ,
1 + |z|
transformer n’importe quelle fonction f : A → R en une fonction f˜ = h◦f : A → R+ .

En 1919, F. Hausdorff [1, p. 296] 7 construisit un autre prolongement ne
nécessitant pas l’hypothèse que inf x∈A f (x) > 0. On démontre le théorème directe-
ment pour ce prolongement pour l’espace euclidien Rn , mais il est aussi vrai dans un
espace topologique T4, et en particulier dans un espace métrique, en faisant appel
au Lemme de Uryshohn 8 en topologie. On aura besoin de la fonction distance déjà
rencontrée dans l’Exemple 2.2 de la métrique de Hausdorff au Chapitre 3 page 56.
7. Voir page 57.
8. Pavel Samouilovitch Urysohn (1898-1924).
Lemme 3.1. Soient (X, d) un espace métrique et A, ∅ 6= A ⊂ X.

(i) La fonction
déf
x 7→ dA (x) = inf d(a, x) : (X, d) → R (3.21)
a∈A
est bien définie 9 et
∀x, y ∈ X, |dA (y) − dA (x)| ≤ d(y, x). (3.22)
(ii) Si, en plus, (X, d) est complet, alors, pour tout A, ∅ 6= A ⊂ X,
{x ∈ X : dA (x) = 0} = A et dA = dA .
(iii) Si (X, d) = (Rn , d) est l’espace euclidien pour la métrique dp (x, y) = kx −

ykp , 1 ≤ p ≤ ∞, correspondant à une norme, alors, pour tout A, ∅ 6= A ⊂
Rn , et tout x ∈ Rn , il existe p ∈ A tel que dA (x) = d(x, p).
Démonstration. (i) Comme la fonction a 7→ dX (x, a) : A → R est non-négative,
elle est bornée inférieurement et son infimum par rapport à A appartient à R.
L’application
déf
x 7→ dA (x) = inf dX (x, a) : (X, dX ) → R (3.23)
a∈A
est donc bien définie.

Par l’inégalité du triangle pour tout a ∈ A
d(a, y) ≤ d(a, x) + d(x, y) ⇒ inf d(a, y) ≤ inf d(a, x) + d(x, y)

a∈A a∈A
et dA (y) ≤ dA (x) + d(x, y). En interchangeant les rôles de x et de y, on obtient

dA (x) ≤ dA (y) + d(y, x). Enfin, par symétrie de d(x, y), on obtient (3.22).
(ii) Pour tout a ∈ A, 0 ≤ dA (a) ≤ d(a, a) = 0 et A ⊂ d−1 A {0} et, comme
dA {0} est fermé, A ⊂ d−1
−1
A {0}. Dans l’autre sens, par l’absurde. S’il existe x ∈ X
tel que dA (x) = 0 et x ∈
/ A, alors x ∈ X\A qui est ouvert. Il existe r > 0 tel que
{y ∈ X : d(y, x) ≤ r} ⊂ B2r (x) ⊂ X\A

⇒ A ⊂ A ⊂ {y ∈ X : d(y, x) > r}
⇒ 0 = dA (x) = inf d(a, x) ≥ inf d(y, x) ≥ r > 0
a∈A y∈X
d(y,x)>r
ce qui donne une contradiction. Enfin, comme A ⊂ A, dA (x) ≥ dA (x) pour tout
x ∈ X. Par définition de l’infimum dA (x), pour tout n ≥ 1, il existe bn ∈ A tel que
1
dA (x) ≤ d(bn , x) < dA (x) +
2n
9. On verra plus loin qu’elle est non seulement continue mais aussi lipschitzienne sur X au
sens de la Définition 7.1 page 142.
et il existe xn ∈ A tel que d(an , bn ) < 1/(2n). Il vient donc
1 1
dA (x) ≤ d(an , x) ≤ d(an , bn ) + d(bn , x) < + dA (x) +
2n 2n
⇒ dA (x) ≤ dA (x)
et on a bien dA = dA sur X.
(iii) Si x ∈ A, on a dA (x) = 0 et ΠA (x) = {x}. Sinon, par définition de
l’infimum, pour tout n ≥ 1, il existe an ∈ A tel que
1 1
inf d(a, x) ≤ d(an , x) < inf d(a, x) + ⇒ 0 ≤ d(an , x) − inf d(a, x) <
a∈A a∈A n a∈A n
et la suite {d(an , x)} converge vers dA (x). Comme cette suite est bornée dans R,
la suite {an } est aussi bornée dans Rn . Par le Théorème 6.2 (c) du Chapitre 3, de
toute suite bornée dans Rn , on peut extraire une sous-suite convergente : il existe
p ∈ Rn et {ank } tel que ank → p et donc la limite p ∈ A. Enfin, par continuité de
la métrique,
d(ank , x) → d(p, x) et dA (x) = d(p, x)
et, pour chaque x ∈ X, il existe p ∈ A tel que dA (x) = d(p, x).
Théorème 3.12. Soient (X, d) = (Rn , d) l’espace euclidien pour la métrique d

correspondant à une norme, A, ∅ 6= A ⊂ X, fermé et f : (A, d) → R une fonction
continue sur A.
(i) On suppose qu’il existe deux réels λ < µ tel que
∀a ∈ A, λ < f (a) < µ. (3.24)
Alors la fonction 10


 f (x), si x ∈ A,
déf
F (x) = d(x, a) (3.25)
 inf f (a) +
 a∈A −1 , si x ∈ X\A,
dA (x))
est un prolongement continu de f à X tel que
∀x ∈ X, λ < F (x) < µ. (3.26)
(ii) Toute application continue f : A → Rn possède un prolongement continu

sur X.
Démonstration. On procède en trois étapes pour démontrer (i).
10. C’est le prolongement utilisé par F. Hausdorff [1, p. 296] en 1919 pour démontrer ce
théorème (voir aussi R. Engelking [1, exercice 4.1.F, p. 247, Théorème 2.1.8]).
(a) On démontre d’abord que la fonction F est bien définie et qu’elle vérifie
les inégalités (3.26). La fonction F est bien définie pour x ∈ A. Pour x ∈ X\A,
comme A est fermė, on a d(x, a) ≥ dA (x) > 0 et
d(x, a)
∀a ∈ A, f (a) + − 1 ≥ f (a) > λ.
dA (x)
Comme cette fonction est bornée inférieurement, son infimum, F (x), par rapport à
A, appartient à R. La fonction F est donc bien définie et

d(x, a)
F (x) = inf f (a) + − 1 ≥ inf f (a) ≥ λ.
a∈A dA (x) a∈A
Par hypothèse, pour tout x ∈ A, F (x) = f (x) > λ. Mais l’inégalité est aussi stricte
en tout point x ∈ X\A car dA (x) > 0. Sinon, F (x) = λ et, par définition de
l’infimum, pour tout n ≥ 1, il existe an ∈ A tel que
d(x, an ) 1
λ ≤ f (an ) + −1<λ+ .
dA (x) n
Comme f (an ) > λ et d(x, an )/dA (x) − 1 ≥ 0,
f (an ) → λ et d(x, an ) → dA (x).
Comme la suite {d(x, an )} est bornée la suite {an } l’est aussi. Du Lemme 3.1 (iii),
il existe une sous-suite {ank } ⊂ A et p ∈ A tel que ank → p et d(x, ank ) → d(x, p) =
dA (x). Par continuité de f sur A, il vient aussi f (ank ) → f (p) et on obtient la
contradiction λ < f (p) = λ. Pour la borne supérieure, comme il existe p ∈ A tel
que d(x, p) = dA (x),

d(x, a) d(x, p)
F (x) = inf f (a) + − 1 ≤ f (p) + − 1 = f (p) < µ.
a∈A dA (x) dA (x)
(b) F continu sur X\A. Comme X\A est un ouvert, en tout point x ∈ X\A,
il existe r > 0 tel que B2r (x) ⊂ X\A. On a donc
dA (x) = inf d(x, a) ≥ 2r.

a∈A
Pour tout y ∈ Br (x)
d(a, y) ≥ d(a, x) − d(y, x) ≥ dA (x) − d(y, x)

⇒ dA (y) = inf d(a, y) ≥ dA (x) − d(y, x) > 2r − d(y, x) > 2r − r = r
a∈A
⇒ inf dA (y) > r > 0.

y∈Br (x)
Soit y ∈ Br (x). Par définition de l’infimum, pour tout ε > 0,

d(aε , y)
∃aε ∈ A tel que F (y) ≤ f (aε ) + − 1 < F (y) + ε ≤ µ + ε
dA (y)
d(aε , y) d(aε , y)
⇒ λ+ − 1 ≤ f (aε ) + − 1 < F (y) + ε ≤ µ + ε
dA (y) dA (y)
⇒ d(aε , y) ≤ [µ − λ + 1 + ε] dA (y) < [µ − λ + 1 + ε] dA (y)
⇒ d(aε , y) < [µ − λ + 1 + ε] [dA (x) + d(x, y)]
< [µ − λ + 1 + ε] [dA (x) + r] .
On pose
déf
c(ε) = [µ − λ + 1 + ε] [dA (x) + r] > dA (x) + r ≥ 3r
⇒ d(aε , y) < c(ε).
Soient y, z ∈ Br (x) et le aε ∈ A asspcié à y et ε

d(z, aε ) d(y, aε ) d(z, aε ) d(y, aε )
F (z) ≤ f (aε ) + − 1 = f (aε ) + −1+ − .
dA (z) dA (y) dA (z) dA (y)
On estime
d(z, aε ) d(y, aε ) d(z, y) + d(y, aε ) d(y, aε )
− ≤ −
dA (z) dA (y) dA (z) dA (y)

d(z, y) 1 1
= + d(y, aε ) −
dA (z) dA (z) dA (y)

d(z, y) dA (y) − dA (z)
≤ + d(y, aε )
r dA (z) dA (y)
d(z, y) d(z, y)
≤ + d(y, aε )
r r2
1 c(ε)
≤ + 2 d(z, y).
r r
On obtient donc pour tout ε > 0

1 c(ε)
F (z) ≤ F (y) + ε + + 2 d(z, y).
r r
En laissant ε tendre vers 0, on obtient finalement

1 [µ − λ + 1] [dA (x) + r]
F (z) − F (y) ≤ + d(z, y).
r r2
Comme la constante est indépendante de y et z, on peut changer leurs rôles et il
vient

1 [µ − λ + 1] [dA (x) + r]
|F (z) − F (y)| ≤ + d(z, y),
r r2
d’où la continuité uniforme de F sur Br (x) et en particulier en x.

(c) Il reste à établir la continuité en un point frontière x ∈ ∂A. Soient x ∈ ∂A
et une suite {yn } convergeant vers x dans (X, d), c’est-à-dire, d(yn , x) → 0. On
extrait de cette suite deux sous-suites {ynk } ⊂ A et {yn′k } ⊂ X\A en séparant les
éléments qui appartiennent à A de ceux qui appartiennent à X\A. L’une ou l’autre
de ces sous-suites contient un nombre infini d’éléments. Si c’est {ynk }, alors ynk → x
et, par continuité de f sur A, f (ynk ) → f (x). L’autre cas est moins immédiat.
Soit une suite {yn } ⊂ X\A convergeant vers x dans (X, d), c’est-à-dire,
d(yn , x) → 0. On veut démontrer que F (yn ) → f (x). On construit la suite sui-
vante : par définition de l’infimum, pour tout entier n ≥ 1 il existe an ∈ A tel
que
d(an , yn ) 1
F (yn ) ≤ f (an ) + − 1 < F (yn ) + . (3.27)
dA (yn ) n
De là
d(an , yn ) 1
0≤ < F (yn ) − f (an ) + 1 + ≤ µ − λ + 2
dA (yn ) n
⇒ d(an , yn ) < (µ − λ + 2) dA (yn ) ≤ (µ − λ + 2) d(x, yn )
⇒ d(an , x) ≤ d(an , yn ) + d(yn , x) ≤ (µ − λ + 3) d(x, yn ).
Comme yn → x, il vient an → x et par continuité f (an ) → f (x).

Comme on a déjà établi que F est borné inférieurement par λ et supérieure-
ment par µ,
λ ≤ F (yn ) ≤ µ.
Il existe donc F̂ ∈ R et une sous-suite {F (ynk } telle que F (ynk ) → F̂ . De là, comme
d(an ,yn )
dA (yn ) − 1 ≥ 0,
d(ank , ynk ) 1
f (ank ) ≤ f (ank ) + − 1 < F (ynk ) + ⇒ f (x) ≤ F̂ .
dA (ynk ) nk
Pour démontrer l’inégalité dans l’autre sens, par définition de dA (ynk ) en tant qu’in-
fimum sur A, il existe bnk ∈ A tel que

1
0 < dA (ynk ) ≤ d(bnk , ynk ) < 1+ dA (ynk ) (3.28)
k

1
⇒ d(bnk , x) ≤ d(bnk , ynk ) + d(ynk , x) < 1 + dA (ynk ) + d(ynk , x)
k

1
≤ 2+ d(ynk , x)
k
⇒ bnk → x et f (bnk ) → f (x). (3.29)
Comme F est un infimum par rapport à A, en utilisant (3.28) et (3.29)

d(bnk , ynk ) 1
F (ynk ) ≤ f (bnk ) + − 1 ≤ f (bnk ) + 1 + −1 (3.30)
dA (ynk ) k
1
⇒ F̂ = lim F (ynk ) ≤ lim f (bnk ) + lim = f (x) ⇒ F̂ ≤ f (x). (3.31)
k→∞ k→∞ k→∞ k
En combinant ceci avec le résultat précédent, il vient F̂ = f (x). Donc, comme toute
sous-suite convergente de {F (yn )} converge vers f (x), on en conclut que toute la
suite converge, c’est-à-dire, F (yn ) → f (x), ce qui complète la démonstration de la
continuité du prolongement F sur X.
(ii) Pour une application f : A → R, on utilise l’homéomorphisme (3.16) de
l’Exemple 3.5
déf z
z 7→ h(z) = : R → ] − 1, 1[ .
! + |z|
On associe à la fonction f : A → R continue sur A, la nouvelle fonction continue

déf
x 7→ f˜(x) = h(f (x)) : A → ] − 1, 1[
qui satisfait les hypothèses de la partie (i) avec λ = −1, µ = +1. On obtient alors
un prolongement Fe : X → ] − 1, 1[ . Il suffit ensuite de revenir en introduisant la
fonction F = h−1 ◦ Fe continue sur X pour laquelle
F |A = (h−1 ◦ Fe )|A = h−1 ◦ Fe|A = h−1 ◦ (h ◦ f ) = f.
On obtient donc bien un prolongement continu F de f à X.

Pour une application f : A → Rn , on applique ce qui précède composante par
composante.
4 Continuité et compacité
Définition 4.1.
Une fonction f : (X, dX ) → (Y, dY ) est bornée sur un sous-ensemble E de X, s’il
existe x0 ∈ E et M > 0 tel que f (E) ⊂ BM (f (x0 )).
Lorsque (Y, dY ) = (Rn , dp ), dp (x, y) = kx − ykp , 1 ≤ p ≤ ∞, on peut remplacer

f (x0 ) par 0 ∈ Rn , c’est-à-dire,
∃M > 0, ∀x ∈ E, kf (x)kp ≤ M.
La continuité préserve la compacité.
Théorème 4.1. Soit f : (X, dX ) → (Y, dY ) continue. Si X est compact, alors f (X)
est compact dans (Y, dY ). En particulier, f (X) est fermée et bornée et l’application
f est bornée sur X.
4. Continuité et compacité 135
Démonstration. Soit {Gα } un recouvrement ouvert de f (X). Comme f est continue

f −1 (Gα ) est ouvert. Du Théorème 1.1 (1)
f −1 (∪α Gα ) = ∪α f −1 (Gα )
f (X) ⊂ ∪α Gα ⇒ f −1 [f (X)] ⊂ f −1 [∪α Gα ] ⊂ ∪α f −1 (Gα ).
Par le Théorème 1.3 (1)
X ⊂ f −1 [f (X)] ⊂ ∪α f −1 (Gα ).
La famille {f −1 (Gα )} est donc un recouvrement ouvert du compact X. Il existe

donc un sous-recouvrement fini
X ⊂ ∪ni=1 f −1 (Gαi ) = ∪ni=1 X ∩ f −1 (Gαi )

⇒ f (X) ⊂ f ∪ni=1 X ∩ f −1 (Gαi ) = ∪ni=1 f X ∩ f −1 (Gαi ) .

Par le Théorème 1.3 (2), f X ∩ f −1 (Gαi ) = f (X) ∩ Gαi et

f (X) ⊂ ∪ni=1 f X ∩ f −1 (Gαi ) = ∪ni=1 f (X) ∩ Gαi ⊂ ∪ni=1 Gαi .
On a donc construit un sous-recouvrement fini de f (X) qui est donc compact.
On en déduit le théorème d’existence de Weierstrass.
Théorème 4.2. Soit f : (X, dX ) → (R, dR ) une application continue pour la

métrique dR (x, y) = |x − y|. Si X est compact, alors
∃a ∈ X tel que f (a) = inf f (X) et ∃b ∈ X tel que f (b) = sup f (X). (4.1)
Démonstration. Par compacité de X, f (X) est compact. Il est donc borné et, a for-
tiori, borné inférieurement et supérieurement. Par le Théorème 3.8 et son corollaire
du Chapitre 3
inf f (X) ∈ f (X) et sup f (X) ∈ f (X).
Comme f (X) est aussi fermé, on a
inf f (X) ∈ f (X) et sup f (X) ∈ f (X),
d’où l’existence des points a et b dans X.
Théorème 4.3. Soit f : (X, dX ) → (Y, dY ) une application bijective et continue

sur X. Si X est compact, alors l’application réciproque
f −1 : (Y, dY ) → (X, dX )
est bien définie et continue sur Y .

Démonstration. Comme pour une bijection f on a f = (f −1 )−1 , il suffit de démontrer

que pour tout ouvert G dans X, f (G) = (f −1 )−1 (G) est ouvert dans Y . Le complément
X\G de l’ouvert G ⊂ X est fermé dans le compact X. X\G est donc compact
comme sous-ensemble fermé d’un compact. Par le théorème précédent f (X\G) est
compact. Du Théorème 1.1 (3)
f (X\G) = f (X)\f (G) = Y \f (G)
et f (G) est ouvert dans Y comme complement d’un fermé.
Exemple 4.1.
Soient
déf déf
X = [0, 2π[ et Y = {x ∈ R2 : kxk = 1}
et l’application continue et bijective
t 7→ (cos t, sin t) : [0, 2π[ → {x ∈ R2 : kxk = 1}.
L’ensemble X n’est pas compact dans R et l’application réciproque f −1 n’est pas

continue en (1, 0) puisque pour ε > 0 tendant vers 0,
p p
f −1 {( 1 − ε2 , ε)} → 0 et f −1 {( 1 − ε2 , −ε)} → 2π.
L’hypothèse de compacité de X est donc essentielle dans le théorème même si son

image par f , le cercle de rayon 1, est ici compacte dans R2 .
5 Continuité et connexité
On a vu au Chapitre 3 que, comme la compacité et la bornitude, la connexité
est une notion intrinsèque. Elle aussi est préservée par la continuité.
Théorème 5.1. Soit f : (X, dX ) → (Y, dY ) continue. Si E ⊂ X est connexe, alors
f (E) est connexe dans (Y, dY ).
Démonstration. Par l’absurde. Supposons que f (E) = A ∪ B pour deux sous-
ensembles séparés non-vides A et B de Y . Alors
E ⊂ f −1 (f (E)) = f −1 (A ∪ B) = f −1 (A) ∪ f −1 (B)

⇒ E = (E ∩ f −1 (A)) ∪ (E ∩ f −1 (B))
Posons
déf déf
G = E ∩ f −1 (A) et H = E ∩ f −1 (B) ⇒ E =G∪H
par le Théorème 1.1 (1). Comme A et B ne sont pas vides, par le Théorème 1.3 (2)
f (G) = f (E ∩ f −1 (A)) = f (E) ∩ A = A 6= ∅ ⇒ G 6= ∅

−1
f (H) = f (E ∩ f (B)) = f (E) ∩ B = B 6= ∅ ⇒ H 6= ∅
5. Continuité et connexité 137
et G et H ne sont pas vides. Il reste à montrer que G et H sont séparés pour obtenir
une contradiction. Il vient
A⊂A ⇒ f −1 (A) ⊂ f −1 (A) ⇒ G = E ∩ f −1 (A) ⊂ E ∩ f −1 (A)
B⊂B ⇒ f −1 (B) ⊂ f −1 (B) ⇒ H = E ∩ f −1 (B) ⊂ E ∩ f −1 (B)
Comme f est continue, par le Théorème 3.3, f −1 (A) et f −1 (B) sont fermés et
G ⊂ E ∩ f −1 (A) ⊂ E ∩ f −1 (A) ⇒ G ⊂ E ∩ f −1 (A)
H ⊂ E ∩ f −1 (B) ⊂ E ∩ f −1 (B) ⇒ H ⊂ E ∩ f −1 (B).
Enfin, par le Théorème 1.1 (2)

G ∩ H ⊂ (E ∩ f −1 A) ∩ E ∩ f −1 (B) = (E ∩ E) ∩ f −1 (A) ∩ f −1 (B)

= E ∩ f −1 (A ∩ B) = ∅

H ∩ G ⊂ (E ∩ f −1 B) ∩ E ∩ f −1 (A) = (E ∩ E) ∩ f −1 (B) ∩ f −1 (A)

= E ∩ f −1 (B ∩ A) = ∅
⇒ G∩H =∅ et G ∩ H = ∅.
G et H sont bien séparés ce qui contredit le fait que E est connexe.
On obtient ainsi le Théorème des valeurs intermédiaires.
Théorème 5.2. Soit f : [a, b] → R, a < b, continue sur [a, b].
(i) Si f (a < f (b), alors
∀c, f (a) < c < f (b) ⇒ ∃x, a < x < b, tel que f (x) = c.
(ii) Si f (a > f (b), alors

∀c, f (a) > c > f (b) ⇒ ∃x, a < x < b, tel que f (x) = c.
Démonstration. (i) Comme [a, b] est connexe, f ([a, b]) est connexe. Par le Théorème
9.2 du Chapitre 3, tout c tel que f (a) < c < f (b) appartient à f ([a, b]). Il existe
donc x ∈ [a, b] tel que f (x) = c. Comme f (a) < f (x) < f (b), x ne peut être a ou b.
(ii) Même démonstration.
La réciproque de ce théorème n’est pas vraie. On peut avoir la propriété des
valeurs intermédiaires sans que f soit continue.
Exemple 5.1.
La fonction f : [−2, 2] → R possède la propriété des valeurs intermédiaires sur
[−2, 2], mais n’est pas continue en x = −1 et x = 1


 x, − 2 ≤ x ≤ −1
déf
f (x) = − x, −1<x<1 (5.1)


x, 1 ≤ x ≤ 2.
Avant de terminer, considérons l’ensemble à deux éléments {0, 1} qui n’est pas
connexe pour la métrique d(x, y) = |x − y| et la famille des fonctions
f : (X, d) → {0, 1}. (5.2)
Si X est connexe et non vide et f est continue sur X, son image f (X) doit être
connexe. Elle ne peut donc être que {0} ou {1}. Ceci signifie que si X est connexe,
il n’existe pas de fonction continue et surjective de (X, d) dans {0, 1}.
La réciproque est vraie et donne une nouvelle caractérisation de la connexité
qui s’ajoute à celles du Corollaire 1 au Théorème 9.1 du Chapitre 3.
Théorème 5.3. (X, d) est connexe si et seulement si il n’existe pas d’application
continue et surjective de (X, d) dans {0, 1}.
Démonstration. Il suffit de démontrer la réciproque. Supposons que X ne soit pas
connexe, alors, par le Théorème 9.1 du Chapitre 3, il existe E, ∅ 6= E $ X, qui est
à la fois ouvert et fermé dans (X, d). La fonction surjective
( )
déf 1, si x ∈ E
x 7→ χE (x) = : (X, d) → {0, 1}
0, si x ∈ X\E
est donc surjective. Dans {0, 1}, les ouverts sont ∅, {0}, {1}, et {0, 1}. Les images
inverses
f −1 (∅) = ∅, f −1 ({1}) = E, f −1 ({0}) = X\E, f −1 ({0, 1}) = X
sont toutes des sous-ensembles ouverts de X car, E étant ouvert et fermé, X\E
est ouvert. L’application surjective χE est donc continue ce qui contredit notre
hypothèse.
Remarque 5.1.
La fonction χE est appelée fonction caractéristique de E. À toute fonction f :
(X, d) → {0, 1} on peut associer l’ensemble
déf
E = {x ∈ X : f (x) = 1}
et la fonction caractéristique χE pour laquelle f = χE . Il y a donc une bijection
entre l’ensemble des fonctions caractéristiques et l’ensemble P(X) :
déf
E 7→ χE : P(X) → {0, 1}X = {χE : E ⊂ X}. (5.3)
La notation {0, 1}X peut être interprétée comme une extension de la notation du
produit {0, 1}n de n copies de {0, 1}.
6 Fonctions uniformément continues

Définition 6.1.
Une fonction f : (X, dX ) → (Y, dY ) entre deux espaces métriques est uniformément
6. Fonctions uniformément continues 139
continue sur E ⊂ X si, pour tout ε > 0, il existe δ > 0 tel que
∀x, x′ ∈ E pour lesquels dX (x′ , x) < δ, dY (f (x′ ), f (x)) < ε.
Une fonction uniformément continue sur E est continue sur E, mais la réciproque
n’est pas vraie comme le montre l’exemple de la fonction
f (x) = 1/x, x ∈ X = R+ = {x ∈ R : x > 0}, (6.1)
qui n’est pas uniformément continue sur ]0, 1], mais qui est uniformément continue
sur [1, +∞). La fonction f (x) = x sur R est uniformément continue mais pas bornée
sur R.
Exemple 6.1 (Fonction distance).

Par le Lemme 3.1, la fonction distance dA associée à un sous-ensemble non-vide A
de l’espace métrique (X, d) est uniformément continue sur X.
Théorème 6.1. Soit f : (X, dX ) → (Y, dY ) continue sur X. Si X est compact,

alors f est uniformément continue sur X.
Démonstration. Soit ε > 0. Comme f est continue en chaque point x ∈ X,
ε
∃δ(ε, x) > 0 tel que ∀x′ ∈ X, dX (x′ x) < δ(ε, x), dY (f (x′ ), f (x)) < . (6.2)
2
La famille de boules {Bδ(ε,x)/2 (x) : x ∈ X} forme un recouvrement ouvert du
compact X. Il existe donc un sous-recouvrement fini
X ⊂ ∪m
i=1 Bδ(ε,xi )/2 (xi ).
On choisit
δ = min {δ(ε, xi )/2} > 0

1≤i≤m
puisque le minimum est pris par rapport à un nombre fini de scalaires strictement
positifs. Ayant construit un δ correspondant au ε, on vérifie maintenant la continuité
uniforme. Soient x′ , x ∈ X tel que dX (x′ , x) < δ. Comme il y a recouvrement fini,
il existe xi ∈ X tel que x ∈ Bδ(ε,xi )/2 (xi ) et donc
δ(ε, xi )
dX (x′ , xi ) ≤ dX (x′ , x) + dX (x, xi ) ≤ δ + < δ(ε, xi )
2
ε
⇒ dY (f (x′ ), f (xi )) < .
2
De là, pour x′ , x ∈ X tel que dX (x′ , x) < δ,
ε ε
dY (f (x′ ), f (x)) < dY (f (x′ ), f (xi )) + dY (f (xi ), f (x)) < + =ε
2 2
ce qui donne bien la continuité uniforme.
La compacité est essentielle comme le montrent les exemples suivants.
Exemple 6.2 (E borné mais pas compact dans Rk ).

Il existe donc un point d’accumulation a de E qui n’appartienne pas à E.
(i) La fonction
déf 1
x 7→ f (x) = : B1′ (a) → R
kx − ak
est continue sur E = B1′ (a), mais pas bornée et pas uniformément continue.
(ii) La fonction
déf 1
x 7→ f (x) = : B1′ (a) → R
1 + kx − ak
est continue et bornée par 1 sur E = B1′ (a), f (B1′ (a)) = (1/2, 1), mais il
n’existe pas de point de E = B1′ (a) qui réalise le sup f (E) = 1.
Exemple 6.3 (E fermé, mais pas borné dans Rk ). (i) La fonction

déf
x 7→ f (x) = x : R → R
est uniformément continue sur E = R, mais non-bornée.
(ii) La fonction
déf
x 7→ f (x) = 1 − e−x : R+ → R+ , R+ = {x ∈ R : x ≥ 0}
est continue er bornée sur E = R+ , f (R+ ) = (0, 1], mais il n’existe pas de
point de E = R+ qui réalise le inf f (E) = 0.
(iii) Toute fonction f : Z → R est uniformément continue pour δ < 1.
La continuité uniforme est suffisante pour transporter les suites de Cauchy en

suites de Cauchy. En effet, la fonction x 7→ f (x) = 1/x : ]0, 1[ → R est continue sur
]0, 1[ . La suite {1/(2n)} est Cauchy dans ]0, 1[ , mais la suite {f (1/(2n)} = {2n}
n’est pas Cauchy dans R.
Théorème 6.2. Soit f : (X, dX ) → (Y, dY ) une application uniformément continue
sur E ⊂ X. La suite {f (xn )} image d’une suite de Cauchy {xn } dans (E, dX ) est
une suite de Cauchy dans (f (E), dY ).
Démonstration. Soit {xn } une suite de Cauchy dans (E, dX ). Par continuité uni-
forme sur E, pour tout ε > 0, il existe δ > 0 tel que
∀n, m ≥ 1 tel que dX (xn , xm ) < δ, dY (f (xn , xm ) < ε.
Comme la suite {xn } est de Cauchy, il existe N ≥ 1 tel que
∀n, m > N, dX (xn , xm ) < δ.
Donc, pour tout ε > 0, il existe N ≥ 1 tel que
∀n, m > N, dY (f (xn ), f (xm )) < ε.
La suite {f (xn )} est Cauchy dans (Y, dY ).
6. Fonctions uniformément continues 141
Remarque 6.1.
La composition g ◦ f de deux fonctions f : (X, dX ) → (Y, dY ) uniformément conti-
nue sur E ⊂ X et g : (Y, dY ) → (Z, dZ ) uniformément continue sur f (E) ⊂ Y
est uniformément continue sur X (voir Exercice 10.11). Les opérations habituelles
préservent la continuité uniforme sur un sous-ensemble E de (X, dX ) : pour f, g :
(X, dX ) → R
déf déf
(f + g)(x) = f (x) + g(x) et ∀α ∈ R, (αf )(x) = α f (x).
6.2 Prolongement uniformément continu

Les fonctions uniformément continues sur un sous-ensemble E d’un espace
métrique (X, dX ) ont aussi une propriété fort intéressante : elles possèdent un pro-
longement uniformément continu sur l’adhérence E de E dans (X, dX ) et, si E = X
b de X.
n’est pas complet, sur le complété X
Théorème 6.3. Soit f : (X, dX ) → (Y, dY ), où (Y, dY ) est un espace métrique
complet.
(i) Si f est uniformément continue sur un sous-ensemble E de X, alors il
existe un prolongement unique f¯ : (E, dX ) → (Y, dY ) uniformément continu
sur E.
b dˆX ) le complété de (X, dX ). 11 Si f est uniformément continue
(ii) Soit (X,
b dˆX ) → (Y, dY )
sur (X, dX ), alors il existe un prolongement unique fˆ : (X,
uniformément continu sur X. b
Démonstration. (i) Soit x ∈ X un point d’accumulation de E dans (X, dX ) qui ne

soit pas dans E. Alors, on peut construire une suite de Cauchy {xn } ⊂ E, xn 6= x,
en choisissant pour chaque n ≥ 1
′
xn ∈ E ∩ B1/n (x).
Par le Théorème 6.2, la suite {f (xn )} ⊂ f (E) est Cauchy dans (Y, dY ). Comme
(Y, dY ) est complet, la suite {f (xn )} converges vers un point y ∈ Y . Ce point
est unique car toutes les suites de Cauchy {xn } ⊂ E convergeant vers x sont
équivalentes. Par continuité uniforme, les suites de Cauchy {f (xn )} ⊂ f (E) sont
aussi équivalentes et elles ont donc toutes la même limite y. On pose f¯(x) = y ce
qui définit f¯ uniquement en tout point d’accumulation de E qui n’est pas dans E.
Par hypothèse, f¯ = f est continue en tout point de E et, par construction, f¯ est
continue en tout point d’accumulation de E qui n’appartient pas à E.
b = S/R est l’ensemble de toutes les
11. Voir la définition donnée en (6.7) au Chapitre 3. X
classes d’équivalence de suites de Cauchy dans (X, dX ) et l’application
déf b
x 7→ ϕ(x) = R{x} : X → X. (6.3)
b dˆX ).
est une isométrie de (X, dX ) sur l’image X0 = ϕ(X) de X par ϕ dans (X,
Il reste à montrer que f¯ est uniformément continue sur E. Comme f est

uniformément continue sur E, pour tout ε > 0, il existe δ > 0 tel que
∀x1 , x2 ∈ E tel que dX (x1 .x2 ) < 3δ, dY (f (x1 ), f (x2 )) < ε/3.
Soient x̄1 , x̄2 ∈ E tel que dX (x̄1 , x̄2 ) < δ. Par construction de f¯, il existe x1 , x2 ∈ E
tel que
dX (x̄2 , x2 ) < δ et dY (f (x̄2 ), f (x2 )) < ε/3

dX (x̄1 , x1 ) < δ et dY (f (x̄1 ), f (x1 )) < ε/3.
Ceci entraı̂ne
dX (x1 , x2 ) ≤ dX (x1 , x̄1 ) + dX (x̄1 , x̄2 ) + dX (x̄2 , x2 ) < δ + δ + δ = 3δ
et par continuité uniforme sur E
dY (f (x1 ), f (x2 )) < ε/3.
Finalement,
dY (f (x̄2 ), f (x̄1 )) ≤ dY (f (x̄2 ), f (x2 )) + dY (f (x2 ), f (x1 )) + dY (f (x1 ), f (x̄1 ))

< ε/3 + ε/3 + ε/3 = ε.
On a bien la continuité uniforme sur E.

b au Théorème 6.5 du Chapitre 3, l’image
(ii) Par construction du complété X
b
X0 = ϕ(X) de X dans X par l’isométrie ϕ est dense dans X b : X0 = X.b Comme ϕ
est une isométrie, ϕ est un homéomorphisme de X sur X0 . En particulier, ϕ−1 est
continue sur X0 . On applique donc la première partie du théorème à l’application
f ◦ ϕ−1 : (ϕ(X), d) ˆ → (Y, dY ). Cette application est uniformément continue sur
ϕ(X) car, par isométrie,
dX (x1 , x2 ) = dXb (ϕ(x1 ), ϕ(x2 )) < δ

−1
⇒ dY (f ◦ ϕ (ϕ(x1 )), f ◦ ϕ−1 (ϕ(x2 )) = dY (f (x1 ), f (x2 )) < ε.
7 Fonctions lipschitziennes
Définition 7.1.
Soit une fonction f : (X, dX ) → (Y, dY ) entre deux espaces métriques.
(i) f est lipschitzienne en x ∈ X s’il existe une constante c(x) > 0 et un rayon
r(x) > 0 tel que
∀x1 , x2 ∈ Br(x) (x), dY (f (x1 ), f (x2 )) ≤ c(x) dX (x1 , x2 ).

7. Fonctions lipschitziennes 143
(ii) f est lipschitzienne sur un sous-ensemble E de X s’il existe c(E) > 0 tel
que
∀x1 , x2 ∈ E, dY (f (x1 ), f (x2 )) ≤ c(E) dX (x1 , x2 ).
On associe à f et E la plus petite constante de Lipschitz
déf dY (f (x1 ), f (x2 ))

Lip (f, E) = sup . (7.1)
x1 ,x2 ∈E dX (x1 , x2 )
x1 6=x2
Il vient immédiatement.
Théorème 7.1. Une fonction f : (X, dX ) → (Y, dY ) lipschizienne sur E ⊂ X est

uniformément continue sur E.
Démonstration. Pour ε > 0, on prend δ = ε/c(E) > 0.
Exemple 7.1.
La norme x 7→ f (x) = kxk2 : (Rn , d2 ) → (R, dR ) est lipschitzienne sur (Rn , d2 ) de
constante c(Rn ) = 1 pour les métriques d2 (x, y) = kx − yk2 et dR (a, b) = |a − b|
puisque
∀y, z ∈ Rn , dR (f (y), f (z)) = |f (y) − f (z)| = |kyk2 − kzk2|

≤ ky − zk2 = d2 (y, z).
La fonction f (x) = kxk22 est lipschitzienne en x ∈ Rn puisque pour tout r > 0
∀y, z ∈ Br (x), |f (y) − f (z)| = kyk22 − kzk22

≤ ky + zk2 ky − zk2 ≤ 2(r + kxk2 )ky − zk2 ,
pour la constante locale c(x) = 2(r + kxk2 ).
Exemple 7.2 (Fonction distance).

Soit dA la fonction distance associée à un sous-ensemble non-vide A de l’espace
métrique (X, d). Par le Lemme 3.1, dA est une fonction lipschizienne sur (X, dX )
de constante c(X) = 1.
Remarque 7.1.
La composition g ◦ f de deux fonctions f : (X, dX ) → (Y, dY ) lipschitzienne en
x ∈ X et g : (Y, dY ) → (Z, dZ ) lipschitzienne en f (x) ∈ Y est lipschitzienne en
x ∈ X (voir Exercice 10.11). Les opérations habituelles préservent la continuité
lipschitzienne sur un sous-ensemble E de (X, dX ) : pour f, g : (X, dX ) → Rn
déf déf
(f + g)(x) = f (x) + g(x) et ∀α ∈ R, (αf )(x) = α f (x).
7.2 Prolongement lipschitzien

Théorème 7.2. Soient E un sous-ensemble non-vide d’un espace métrique (X, dX )
et, pour chaque entier k ≥ 1, la métrique d2 (y1 , y2 ) = ky1 − y2 k2 sur Rk associée à
la norme euclidienne
( k )1/2
X 2
kyk2 = |xi | .
i=1
(i) Étant donné une fonction f : (E, dX ) → R lipschitzienne sur E de constante

Lip (f, E), la fonction
déf
x 7→ F (x) = inf {f (a) + Lip (f, E) dX (x, a)} : (X, dX ) → R (7.2)
a∈E
est un prolongement lipschitzien de f à X de constante Lip (F, X) =

Lip (f, E).
(ii) Étant donné une fonction f : (E, dX ) → (Rk , d2 ) lipschitzienne sur E, il
existe un prolongement √lipschitzien F : (X, dX ) → (Rk , d2 ) de f à X de
constante Lip (F, X) ≤ k Lip (f, E).
Démonstration. (i) La fonction a 7→ f (a) + Lip (f, E) dX (x, a) : E → R est bornée
inférieurement puisque pour tout a et b dans A
f (a) ≥ f (b) − Lip (f, E) dX (b, a)
≥ f (b) − Lip (f, E) [dX (x, a) + dX (b, x)]
⇒ f (a) + Lip (f, E) dX (x, a) ≥ f (b) − Lip (f, E) dX (b, x)
⇒ inf {f (a) + Lip (f, E) dX (x, a)} ≥ f (b) − Lip (f, E) dX (b, x).
a∈A
L’infimum appartient donc bien à R et l’application x 7→ F (x) : X → R est bien

définie.
On vérifie maintenant que c’est un prolongement. Si b ∈ E,
F (b) = inf {f (a) + Lip (f, E) dX (b, a)} ≤ f (b) + Lip (f, E) dX (b, b) = f (b).
a∈E
Comme f est lipschitzienne sur E, on a aussi pour tout a ∈ E
f (b) ≤ f (a) + Lip (f, E) dX (b, a)

⇒ f (b) ≤ inf {f (a) + Lip (f, E) dX (b, a)} = F (b).
a∈E
On obtient F (b) = f (b) sur E. F est donc bien un prolongement de f à X.

Enfin, F est lipschitzienne sur X. Pour x, y ∈ X, par l’inégalité du triangle
{f (a) + Lip (f, E) dX (y, a)} ≤ {f (a) + Lip (f, E) dX (x, a)} + Lip (f, E) dX (y, x).
En prenant l’infimum par rapport à a ∈ A de chaque côté
F (y) ≤ F (x) + Lip (f, E) dX (y, x).

8. Application contractante et théorème du point fixe 145
En intercheangeant les rôles de x et y, il vient

|F (y) − F (x)| ≤ Lip (f, E) dX (y, x).
(ii) Lorsque k > 1, chaque composante de f = (f1 , . . . , fk ) vérifie
∀x, y ∈ E, |fi (y) − fi (x)| ≤ kf (y) − f (x)kRk ≤ c(f, E) dX (y, x).
On associe donc à chaque composante fi le prolongement Fi de la partie (ii) pour
lequel
|Fi (x) − Fi (y)| ≤ Lip (f, E) dX (x, y).
Ceci donne un prolongement F = (F1 , . . . , Fk ) : (X, dX ) → Rk de f à X tel que

k
X k
X
|Fi (x) − Fi (y)|2 ≤ (Lip (f, E) dX (x, y))2
i=1 i=1
√
⇒ kF (x) − F (y)kRk ≤ k Lip (f, E) dX (x, y).
Remarque 7.2.
On peut améliorer l’estimé de la constante de Lipschitz du prolongement de la partie
(ii). Le théorème de M. D. Kirszbraun [1] 12 affirme que pour un sous-ensemble
E d’un espace de Hilbert H1 et une fonction lipschitzienne f : U → H2 , H2 un
autre espace de Hilbert, sur U , il existe un prolongement F : H1 → H2 lipschitzien
avec la même constante de Lipschitz : Lip (F, H1 ) = Lip (f, E). On a comme cas
particulier les espaces euclidiens H1 = Rn et H2 = Rk . C’est sous cette forme que
Kirszbraun démontra initiallement son résultat. La version hilbertienne se trouve
par exemple dans J. T. Schwartz [1, p. 21]. En général, ce résultat n’est pas vrai
dans les espaces de Banach même s’ils sont de dimension finie comme Rk , k > 1,
équipé de la norme
( k )1/p
déf
X
kxkℓp (Rk ) = |xi |p , p 6= 2
i=1
(J. T. Schwartz [1, p. 20]).
8 Application contractante et théorème du point fixe

Définition 8.1.
Soit (X, d) un espace métrique. L’application ϕ : (X, d) → (X, d) est dite contrac-
tante ou est une contraction si
∃k, 0 < k < 1, ∀x, y ∈ X, d(ϕ(x), ϕ(y)) ≤ k d(x, y). (8.1)
12. Le théorème fut démontré par Mojzesz David Kirszbraunc (1903 ou 1904–1942), et plus
tard de nouveau par Frederick A. Valentine (1911– 2002) (cf. F. A. Valentine [1, 2]).
Les applications contractantes sont donc des applications lipschitziennes d’un espace
métrique dans lui même.
Théorème 8.1. Soient (X, d) un espace métrique complet et ϕ : (X, d) → (X, d)
une application contractante. Alors
∃x ∈ X tel que ϕ(x) = x
et ce point est unique.
Démonstration. Soit x0 ∈ X un point quelconque. On construit la suite suivante :
x1 = ϕ(x0 ), x2 = ϕ(x1 ), ... , xn+1 = ϕ(xn ), ...
Soit k, 0 < k < 1, la constante telle que
∀x, y ∈ X, d(ϕ(x), ϕ(y)) ≤ k d(x, y).
On vérifie que
d(x2 , x1 ) = d(ϕ(x1 ), ϕ(x0 )) ≤ k d(x1 , x0 ),
d(x3 , x2 ) = d(ϕ(x2 ), ϕ(x1 )) ≤ k d(x2 , x1 ) ≤ k 2 d(x1 , x0 ),
d(x4 , x3 ) = d(ϕ(x3 ), ϕ(x2 )) ≤ k d(x3 , x2 ) ≤ k 3 d(x1 , x0 ),
...
d(xn+1 , xn ) ≤ k n d(x1 , x0 ).
On a ainsi construit une suite {xn } qui est de Cauchy : pour n < m
m
X m
X kn
d(xn , xm ) ≤ d(xi , xi−1 ) ≤ k i−1 d(x1 , x0 ) ≤ d(x1 , x0 ).
i=n+1 i=n+1
1−k
Comme X est complet, il existe un point x ∈ X tel que xn → x. L’application ϕ

est lipschitzienne sur X de constante k. Elle est donc continue et
ϕ(x) = lim ϕ(xn ) = lim xn+1 = x.
n→∞ n→∞
Le point x est unique, car s’il y en avait un autre y 6= x, on aurait d(x, y) 6= 0 et

ϕ(x) = x et ϕ(y) = y ⇒ d(x, y) = d(ϕ(x), ϕ(y)) ≤ k d(x, y) ⇒ k≥1
ce qui contredit l’hypothèse du théorème.
9 Fonctions d’une variable réelle

9.1 Limites à gauche, limites à droite, discontinuités
Comme les réels forment un ensemble ordonné que l’on peut identifier à la
droite orientée, on peut distinguer la gauche de la droite et introduire la notion de
limite à gauche et de limite à droite d’une fonction f : R → (Y, d) en un point x0 ∈ R
comme cas particulier de la notion de limite de la Définition 2.1 où l’ensemble E
serait {x ∈ R : x < x0 } pour la gauche et {x ∈ R : x > x0 } pour la droite.
9. Fonctions d’une variable réelle 147
Définition 9.1.
Soit f : R → (Y, d) et x0 ∈ R.
(i) f possède une limite à gauche en x0 si
lim f (x) (9.1)

x<x0
x→x0
existe. On l’écrira alors
f (x0 − ) ou lim f (x). (9.2)

x→x−
0
(ii) f possède une limite à droite en x0 si
lim f (x) (9.3)

x>x0
x→x0
existe. On l’écrira alors
f (x0 + ) ou lim f (x). (9.4)

x→x+
0
On en déduit que
lim f (x) existe

x→x0
⇐⇒ f (x0 + ) et f (x0 − ) existent et f (x0 + ) = f (x0 − ).
x∈R
limite limite
à droite à gauche
lim f (x)
x→a−
lim f (x)
x→a+
a a
Définition 9.2.
Soit f : ]a, b[ → (Y, d), a < b, et x ∈ ]a, b[ un point de discontinuité de f .
(i) La fonction f possède un point de discontinuité de la première espèce en
x ∈ ]a, b[ si f (x+ ) et f (x− ) existent.
(ii) La fonction f possède un point de discontinuité de la seconde espèce en
x ∈ ]a, b[ si x n’est pas une discontinuité de la première espèce.
Il y a deux cas possibles pour une discontinuité de la première espèce :

a) f (x− ) 6= f (x+ ) ;
b) f (x− ) = f (x+ ) 6= f (x).

La fonction de l’Exemple 5.1 possède une discontinuité de la premièr espèce en −1
et 1.
Exemple 9.1.
Les fonctions f : R → R suivantes ont des discontinuités de seconde espèce.
a) Discontinuité de seconde espèce en tout point de R :
(
déf 1, si x ∈ Q
f (x) =
0, si x ∈ R \ Q .
Il s’agit de la fonction caractéristique χQ .

b) Discontinuité de seconde espèce en tout point x 6= 0 et continue en x = 0 :
(
déf x, si x ∈ Q
f (x) =
0, si x ∈ R \ Q .
c) Discontinuité de seconde espèce en x = 0 et continue en tout point x 6= 0 :


 sin 1 ,

si x 6= 0
déf
f (x) = x

 0, si x = 0.
9.2 Fonction monotone

Pour les fonctions à valeurs réelles, on peut introduire la notion de monotoni-
cité et étudier leurs discontinuités.
Définition 9.3.
Soit une fonction f : ]a, b[ → R.
(i) f est croissante sur ]a, b[ si
a<x<y<b ⇒ f (x) ≤ f (y)
(ii) f est décroissante sur ]a, b[ si
a<x<y<b ⇒ f (x) ≥ f (y)
Dans les deux cas, on dira que f est monotone sur ]a, b[ .
Par définition, f est décroissante si et seulement si −f est croissante. Il suffira donc

d’étudier les propriétés des fonctions croissantes.
Théorème 9.1. Soit une fonction f : ]a, b[ → R croissante.
9. Fonctions d’une variable réelle 149
(i) Pour tout x ∈ ]a, b[ , f (x+ ) et f (x− ) existent et
sup f (z) = f (x− ) ≤ f (x) ≤ f (x+ ) = inf f (z). (9.5)

a<z<x x<z<b
En particulier, f n’a pas de discontinuités de seconde espèce.

(ii) Pour tout a < x < y < b
f (x+ ) ≤ f (y − ).
(iii) L’ensemble des points de discontinuité de f est au plus dénombrable.

On a des résultats symétriques pour les fonctions décroissantes.
Démonstration. (i) Par définition d’une fonction croissante, pour tout a < x < y <
b, on a f (x) ≤ f (y). L’ensemble {f (t) : a < t < x} est donc borné supérieurement
par f (y) et
déf
∀z, a < z < x, f (z) ≤ A = sup f (t) ∈ R et A ≤ f (x) ≤ f (y);
a<t<x
l’ensemble {f (t) : x < t < b} est borné inférieurement par f (x) et

déf
∀z, x < z < b, f (z) ≥ B = inf f (t) ∈ R et f (x) ≤ B.
x<t<b
On montre maintenant que A = f (x− ). Puisque A ∈ R, pour tout ε > 0,
∃z, a < z < x, tel que A − ε < f (z) ≤ A.
On pose δ = x − z > 0 : pour tout y, a < y < x, tel que |x − y| < δ, on a
z =x−δ <y <x ⇒ A − ε < f (z) ≤ f (y) ≤ sup f (z) = A

a<z<x
⇒ ∀y, a < y < x, tel que |x − y| < δ, |f (y) − A| < ε.
Par définition de la limite à gauche,
f (x− ) = A = sup f (t) ≤ f (x).

a<t<x
De la même façon
f (x) ≤ f (x+ ) = B = inf f (t)

x<t<b
et cela donne (9.5).

(ii) Pour a < x < y < b, il existe t tel que a < x < t < y < b et
f (x+ ) = inf f (z) ≤ f (t) ≤ sup f (z) = f (y − ).

x<z<b a<z<y
(iii) Soit E l’ensemble des points de discontinuité de f . On a montré que

f (x− ) ≤ f (x) ≤ f (x+ ) et que les discontinuités de f sont de première espèce.
On utilise maintenant la densité des rationnels dans ]a, b[ pour construire une
application injective r : E → Q.
Si x ∈ E, ou bien f (x− ) < f (x) ≤ f (x+ ) et il existe un rationnel r(x) tel
que f (x− ) < r(x) < f (x) ≤ f (x+ ), ou bien f (x− ) ≤ f (x) < f (x+ ) et il existe
un rationnel r(x) tel que f (x− ) ≤ f (x) < r(x) < f (x+ ). On a donc construit une
fonction r : E → r(E) ⊂ Q. Cette fonction est injective puisque pour x1 , x2 ∈ E,
x1 < x2 , il vient dans tous les cas r(x1 ) < r(x2 ). E peut donc être identifié au
sous-ensemble r(E) de Q qui est au plus dénombrable.
Remarque 9.1.
On peut montrer que les points de discontinuité d’une fonction monotone ne sont
pas nécessairement des points isolés.
9.3 ◮ Fonction à variation bornée, fonction absolument

continue
À partir des fonctions monotones, on peut introduire les fonctions à variation
bornée (voir, par exemple, E. Asplund et L. Bungart [1, Chapitre 6]).
Définition 9.4.
Soit f : [a, b] → R, a < b. f est à variation bornée sur [a, b] si le supremum
( n )
déf
X
Var [a, b] = sup |f (ak ) − f (ak−1 | : n ≥ 0, a ≤ a0 ≤ · · · ≤ an ≤ b (9.6)
k=1
pris par rapport à toutes les suites finies a0 , . . . , an et à tous les entiers n ≥ 0 est
fini. On appelle Var [a, b] la variation totale de f sur [a, b].
Si f est monotone, Var [a, b] = |f (b) − f (a)|.

Ces fonctions peuvent s’écrire comme la différence de deux fonctions mono-
tones croissantes. Elles n’ont donc que des discontinuités de première espèce en
nombre au plus dénombrable. Elles se décomposent en la somme d’une fonction
absolument continue et d’une fonction de saut.
Définition 9.5.
Soit f : [a, b] → R, a < b. f est absolument continue sur [a, b] si pour tout ε > 0,
il existe δ > 0 tel que pour toute suite a ≤ a1 ≤ b1 ≤ · · · ≤ ak ≤ bk ≤ · · · ≤ an ≤
bn ≤ b et tout n ≥ 1 tel que
X n n
X
|bk − ak | < δ, on a |f (bk ) − f (ak )| < ε. (9.7)
k=1 k=1
Les fonctions absolument continues sont les seules fonctions qui sont l’intégrale de
leur dérivée. Déterminer cette classe de fonction était l’une des préoccupations de
Henri Lebesgue. En effet, on savait qu’il existait des fonctions continues mono-
tones croissantes qui n’étaient pas l’intégrale (au sens de Lebesgue) de leur dérivée
10. Exercices 151
presque partout. C’est le cas de l’≪escalier de Cantor≫ qui est une fonction mono-
tone, définie et continue partout sur le segment [0, 1] (voir Figure 4.5). Sa dérivée
est, évidemment, égale à zéro en tout point appartenant à un intervalle contigu
f (x)
0
0 1
Figure 4.5. Construction de l’escalier de Cantor
quelconque, c’est-à-dire, presque partout. Par conséquent, pour cette fonction on a

Z x
0= f ′ (t) dt < f (x) − f (0) = f (x), 0 < x ≤ 1. (9.8)
0
10 Exercices
Exercice 10.1.
Soit f : X → Y . Alors l’application inverse induite f −1 : P(Y ) → P(X) préserve
les opérations élémentaires suivantes :
(1) f −1 (∪α Bα ) = ∪α f −1 (Bα ).
(2) f −1 (∩α Bα ) = ∩α f −1 (Bα ).
(3) f −1 (B1 \B2 ) = f −1 (B1 )\f −1 (B2 ).
Exercice 10.2.
Soit f : X → Y . Alors l’application induite f : P(X) → P(Y ) préserve les
opérations suivantes :
(1) f (∪α Bα ) = ∪α f (Bα ).
(2) f (∩α Bα ) ⊂ ∩α f (Bα ).
Exercice 10.3.
Soit f : X → Y . Alors
(1) pour chaque A ⊂ X, f −1 [f (A)] ⊃ A.
(2) pour chaque A ⊂ X et B ⊂ Y ,

f A ∩ f −1 (B) = f (A) ∩ B (10.1)
et, en particulier,

f f −1 (B) = f (X) ∩ B. (10.2)
Exercice 10.4.
Soit f : X → Y et g : Y → Z. Alors, pour les applications induites, on a (g ◦ f )−1 =
f −1 ◦ g −1 .
Exercice 10.5. (i) Soit un ensemble arbitraire X et soit {Aα } un recouvre-

ment de X par des sous-ensembles de X.
(ii) Soit Y un autre ensemble et une famille fα : Aα → Y d’applications tel
que
Alors, il existe une application unique f : X → Y qui est un prolongement de
chaque fα :
∀α, f |A α = f α .
Exercice 10.6.
Soit f : X → Y et g : Y → X tel que g ◦ f = IX où IX est la fonction identité sur
X. Alors f est injective et g est surjective.
Exercice 10.7 (W. Rudin [1, Exercice 3, p. 91]).

Soit f : (X, dX ) → R une application continue. Montrer que
déf
f −1 {0} = {x ∈ X : f (x) = 0} (10.3)
est fermé dans (X, d).

Soient f, g : (X, dX ) → (Y, dY ) deux applications continues entre deux espaces
métriques et E un sous-ensemble dense dans (X, d). Montrer que
(i) f (E) est dense dans (f (X), dY ) ;
(ii) f = g sur E entraı̂ne f = g sur X.
Exercice 10.9 (W. Rudin [1, Exercice 7, p. 91]). (i) On se donne la fonction
f : R2 → R
 2 
 xy , si (x, y) 6
= (0, 0)
déf
f (x, y) = x2 + y 4
 
0, si (x, y) = (0, 0)
10. Exercices 153
Montrer que f est bornée sur R2 et n’est pas continue en (0, 0), mais que
sa restriction à toute droite passant par (0, 0) est continue.
(ii) On se donne la fonction g : R2 → R
 2 
 xy , si (x, y) 6= (0, 0)
déf
g(x, y) = x2 + y 6
 
0, si (x, y) = (0, 0)
Montrer que g n’est bornée sur aucun voisinage de (0, 0) et n’est pas conti-
nue en (0, 0), mais que sa restriction à toute droite passant par (0, 0) est
continue.

Démontrer que l’on peut remplacer la définition de la continuité uniforme sur X
par : pour tout ε > 0, il existe δ > 0 tel que
∀E ⊂ X tel que diam (E) < δ, diam f (E) < ε.

Démontrer.
(i) La composition g◦f de deux fonctions f : (X, dX ) → (Y, dY ) uniformément
continue sur E ⊂ X et g : (Y, dY ) → (Z, dZ ) uniformément continue sur
f (E) ⊂ Y est uniformément continue sur X
(ii) La composition g ◦ f de deux fonctions f : (X, dX ) → (Y, dY ) lipschit-
zienne en x ∈ X et g : (Y, dY ) → (Z, dZ ) lipschitzienne en f (x) ∈ Y est
lipschitzienne en x ∈ X.

On dit qu’une application f : (X, dX ) → (Y, dY ) est ouverte si l’image f (O) de
tout ouvert O dans X est ouverte dans Y . Montrer qu’une application f : R → R
continue et ouverte est monotone.
Exercice 10.13.
Soient deux espaces métriques (X, dX ) et (Y, dY ) et leur produit
déf
X × Y = {(x, y) : x ∈ X et y ∈ Y } . (10.4)
(i) Montrer que
déf
((x, y), (x′ , y ′ )) 7→ dX×Y ((x, y), (x′ , y ′ )) = dX (x, x′ ) + dY (y, y ′ )
(10.5)
: (X × Y ) × (X × Y ) → R+
définit une métrique sur X × Y .
(ii) Montrer que la projection sur X
déf
(x, y) 7→ pX (x, y) = x : (X × Y, dX×Y ) → (X, dX )
est lipschitzienne sur X × Y .
Exercice 10.14.
On dénote par dn (y, x) = ky − xkRn la métrique euclidienne sur Rn , n ≥ 1 un entier.
Soit le pole nord p = (0, 0, 1) ∈ R3 de la sphère de rayon un
q
(2) déf déf
S = x = (x1 , x2 , x3 ) : kxkR3 = x1 + x2 + x3 = 1 ⊂ R3 .
2 2 2

déf x1 x2
x = (x1 , x2 , x3 ) 7→ ϕ(x) = , : S (2) \{p} → R2 (10.6)
1 − x3 1 − x3
est une bijection et donner l’expression de l’application inverse ϕ−1 .

(ii) Montrer que ϕ : (S (2) \{p}, d3 ) → (R2 , d2 ) est un homéomorphisme. (On
peut supposer que toute fonction polynômiale est continue et utiliser les
théorèmes sur le produit et le quotient d’applications continues.)
(iii) Montrer que la fonction
déf
(x, y) 7→ ρ(x, y) = d3 (ϕ−1 (x), ϕ−1 (y)) : R2 × R2 → R+ (10.7)
est une métrique sur R2 .

(iv) Montrer que l’application ϕ : (S (2) \{p}, d3) → (R2 , ρ) est une isométrie et
c2 , ρ̂) de (R2 , ρ).
donc une isométrie de (S (2) \{p}, d ) dans le complété (R
3
c2 , ρ̂) de (R2 , ρ) est compact.
(v) Montrer que le complété (R
Chapitre 5
Espaces vectoriels,
convergences et
applications linéaires
1 Rappels : espace vectoriel, norme, et espace de

Banach
On revient sur les notions introduites au Chapitre 3.
Définition 1.1.
Soit E un ensemble non vide. On dit que E est un espace vectoriel sur R muni d’une
addition
x, y 7→ x + y : E × E → E
et d’une multiplication à gauche ou multiplication par un scalaire
λ, x 7→ λ x : R ×E → E
si (E, +) est un groupe commutatif, c’est-à-dire

(EV 1) x + y = y + x (commutativité),
(EV 2) (x + y) + z = x + (y + z) (associativité),
(EV 3) il existe un élément 0 (vecteur zéro ou origine de E) dans E tel que
∀x ∈ E, x + 0 = x,
(EV 4) pour chaque x ∈ E, il existe −x (inverse additif de x) tel que
x + (−x) = 0,
et pour tout λ et µ dans R et x et y dans E

(EV 5) λ (x + y) = λx + λy,
(EV 6) (λ + µ) x = λx + µx,
(EV 7) (λµ) x = λ (µx),
(EV 8) pour tout x, 1 x = x.
155
156 Chapitre 5. Espaces vectoriels, convergences et applications linéaires
Les éléments d’un espace vectoriel sont appelés vecteurs. La définition d’espace
vectoriel s’applique aussi au cas où R est remplacé par C.
Définition 1.2.
Soit E un espace vectoriel. Une norme sur E est une application
x 7→ kxkE : E → R+ (1.1)
qui satifait les axiomes suivants :
(N1) kxkE = 0 ⇐⇒ x = 0.
(N2) kλxkE = |λ| kxkE .
(N3) kx + ykE ≤ kxkE + kykE (inégalité du triangle).
Un espace vectoriel muni d’une norme est applelé espace vectoriel normé ou sim-
plement espace normé.
Théorème 1.1. Soit E un espace (vectoriel) normé. La fonction

déf
(x, y) 7→ d(x, y) = kx − ykE : E × E → R+ (1.2)
Démonstration. En effet, on a l’axiome (M1) car
x=y ⇐⇒ kx − yk = 0
par (N1). Pour (M2), ky − xk = k(−1)(x − y)k = kx − yk par (N2). Enfin, pour
(M3),
kx − zk = k(x − y) + (y − z)k ≤ kx − yk + ky − zk
par (N3).
Définition 1.3.
Un espace vectoriel normé est applelé espace de Banach s’il est complet par rapport
à la métrique associée à sa norme.
Exemple 1.1.
L’espace euclidien Rn est un espace vectoriel normé pour les opérations
déf
(x1 , . . . , xn ) + (y1 , . . . , yn ) = (x1 + y1 , . . . , xn + yn )
(1.3)
déf
λ (x1 , . . . , xn ) = (λ x1 , . . . , λ xn )
et l’une des normes du Théorème 1.2 du Chapitre 3 (voir aussi le Théorème 1.1 du
Chapitre 3 pour p = 2) :
( n )1/p
déf
X déf
p
kxkp = |xi | , 1 ≤ p < +∞, ou kxk∞ = max |xi | . (1.4)
1≤i≤n
i=1
Elle sont toutes équivalente (voir l’Exemple 3.3 du Chapitre 3). Par le Théorème
6.4 du Chapitre 3, Rn est complet par rapport à la métrique correspondant à p = 2.
C’est donc un espace de Banach. En fait, on peut montrer que Rn est un espace de
Banach pour toutes les normes k kp , 1 ≤ p ≤ +∞.
2. Suites, espaces et séries de fonctions 157
2 Suites, espaces et séries de fonctions

2.1 Convergences des suites de fonctions
On peut introduire de nombreux types de convergence d’une suite de fonctions
{fn } vers une fonction f . Certains peuvent être globaux comme
Z b
|fn (x) − f (x)|2 dx → 0
a
d’autres ponctuels comme
∀x, a ≤ x ≤ b, fn (x) → f (x).
On considère ici les convergences ponctuelles pour lesquelles on introduit un peu de

vocabulaire.
Définition 2.1.
Soient un ensemble E 6= ∅, un espace normé (F, k kF ), une suite de fonctions {fn },
fn : E → F , et une fonction f : E → F .
(i) La suite {fn } converge vers f (converge simplement ou ponctuellement) si
∀x ∈ E, fn (x) → f (x) dans F.
(ii) La suite {fn } converge uniformément vers f sur E si
∀ε > 0, ∃N > 0, ∀n > N, ∀x ∈ E, kfn (x) − f (x)kF < ε.
(iii) La famille {fα } est simplement bornée sur E si
∀x ∈ E, ∃φ(x) ≥ 0, ∀α, kfα (x)kF ≤ φ(x).
(iv) La famille {fα } est uniformément bornée sur E si
∃M > 0, ∀α, ∀x ∈ E, kfα (x)kF ≤ M.
(v) Soit (E, dE ) un espace métrique.

(a) La famille {fα } est équicontinue en x ∈ E si
∀ε > 0, ∃δ > 0, ∀α, ∀y ∈ E , dE (y, x) < δ, kfα (x) − fα (y)kF < ε.
(b) La famille {fα } est uniformément équicontinue sur E si
∀ε > 0, ∃δ > 0, ∀α, ∀x, y ∈ E , dE (y, x) < δ, kfα (x) − fα (y)kF < ε.
On donne maintenant l’équivalent du critère de Cauchy pour des suites de fonctions.

Théorème 2.1. Soit F un espace de Banach, un ensemble E 6= ∅ et une suite de

fonctions {fn }, fn : E → F . Les conditions suivantes sont équivalentes :
(i) Il existe f : E → F tel que fn converge uniformément vers f sur E.
(ii) (critère de Cauchy uniforme) Pour tout ε > 0, il existe N > 0 tel que
∀n, m > N, ∀x ∈ E, kfn (x) − fm (x)kF < ε. (2.1)
(iii) Pour tout ε > 0, il existe N > 0 tel que

∀n, m > N, sup kfn (x) − fm (x)kF < ε. (2.2)
x∈E
Démonstration. Les parties (ii) et (iii) sont clairement équivalentes.

(i) ⇒ (ii). S’il existe f : E → F tel que fn converge uniformément vers f ,
alors, par définition,
∀ε > 0, ∃N > 0, ∀n > N, ∀x ∈ E, kfn (x) − f (x)kF < ε/2.
Par l’inégalité du triangle, pour tous n, m > N
∀x ∈ E, kfn (x) − fm (x)kF < ε.
(ii) ⇒ (i). Réciproquement, si la condition de Cauchy (2.1) est vérifée, alors,
pour chaque x ∈ E, la suite {fn (x)} est Cauchy dans l’espace de Banach F . Il existe
donc f (x) ∈ F tel que fn (x) → f (x). Comme cette limite est unique pour chaque
x ∈ E, cela définit une fonction f : E → F pour laquelle la suite {fn } converge
simplement vers f .
Pour montrer la convergence uniforme sur E, on repart de la propriété (2.1) :
∀ε > 0, ∃N tel que ∀n, m > N, ∀x ∈ E, kfn (x) − fm (x)kF < ε/2.
Donc, pour tout x ∈ E et n, m > N
kfn (x)−f (x)kF ≤ kfn (x)−fm (x)kF + kfm (x)−f (x)kF < ε/2 + kfm (x)−f (x)kF .
Puisque la suite {fm (x)} converge vers f (x), il existe m > N assez grand pour que
kfm (x) − f (x)kF < ε/2 et il vient
∀n > N, ∀x ∈ E, kfn (x) − f (x)kF < ε/2 + ε/2 = ε.
Par définition, la suite {fn } converges uniformément vers f sur E.
La convergence simple d’une suite de fonctions continues n’est pas suffisante
pour obtenir la continuité de la fonction limite comme le montre l’exemple suivant.
Exemple 2.1.
Pour chaque entier n ≥ 1, soit la fonction continue fn : [0, 2] → R définie par


1, si x ∈ [0, 1],
déf
fn (x) = 1 − n(x − 1), si x ∈ [1, 1 + 1/n],


0, si x ∈ [1 + 1/n, 2].
Il est facile de vérifier que

(
1, si x ∈ [0, 1],
lim fn (x) =
n→∞ 0, si x ∈ ]1, 2],
est une fonction discontinue en x = 1. Cette suite est simplement convergente mais
pas uniformément convergente sur [0, 2]. En effet, pour tout n ≥ 1

1 1 1
sup |fn (x) − f (x)| ≥ fn 1 + −f 1+ = .
x∈[0,2] 2n 2n 2
Théorème 2.2. Soient F un espace de Banach, (E, d) un espace métrique et une

suite de fonctions {fn }, fn : E → F , convergeant uniformément vers f : E → F .
Alors
(i) Si les fonctions {fn } sont continues sur E, alors f est continue sur E,
(ii) Si les fonctions {fn } sont uniformément continues sur E, alors f est uni-
formément continue sur E et la famille {fn } est uniformément équicontinue
sur E.
(iii) Si les fonctions {fn } sont uniformément bornées sur E, alors f est bornée
sur E.
Démonstration. Par hypothèse, pour tous x, y ∈ E et tout n ≥ 1 on a l’estimé
kf (x) − f (y)kF ≤ kf (x) − fn (x)kF + kfn (x) − fn (y)kF + kfn (y) − f (y)kF . (2.3)
(i) Soit ε > 0. Puisque fn converge uniformément vers f , on a par la Définition

2.1 (ii)
∃N > 0, ∀n > N, ∀z ∈ E, kfn (z) − f (z)kF ≤ ε/3. (2.4)
En revenant à l’estimé (2.3) pour n̄ > N , il vient
∀y ∈ E, kf (x) − f (y)kF ≤ ε/3 + kfn̄ (x) − fn̄ (y)kF + ε/3. (2.5)
Enfin, comme fn̄ est continue en x, il existe δ > 0 tel que
∀y ∈ E, d(y, x) < δ, kfn̄ (x) − fn̄ (y)kF < ε/3

⇒ ∀y ∈ E, d(y, x) < δ, kf (x) − f (y)kF < ε
et la fonction f est continue en x et donc sur E.

(ii) On reprend la fin de la démonstration de la partie (i) juste après (2.5).
Enfin, comme fn̄ est uniformément continue sur E, il existe δ > 0 tel que
∀x, y ∈ E, d(y, x) < δ, kfn̄ (x) − fn̄ (y)kF < ε/3

⇒ ∀x, y ∈ E, d(y, x) < δ, kf (x) − f (y)kF < ε
et la fonction f est uniformément continue sur E.

Enfin, on a pour tous x, y ∈ E
kfn (y) − fn (x)kF ≤ kfn (y) − f (y)kF + kf (y) − f (x)kF + kf (x) − fn (x)kF
De (2.4), il existe N > 0 tel que pour tout n > N
kfn (y) − fn (x)kF ≤ ε/3 + kf (y) − f (x)kF + ε/3.
Par continuité uniforme de f , il existe δ0 > 0 tel que
∀x, y ∈ E, d(y, x) < δ0 , kf (x) − f (y)kF < ε/3
ce qui entraı̂ne
∀x, y ∈ E, d(y, x) < δ0 , ∀n > N, kfn (x) − fn (y)kF < ε.
Enfin, comme f1 , . . . , fN est une famille finie de fonctions uniformément continues,

il existe δ, 0 < δ ≤ δ0 , tel que
∀x, y ∈ E, d(y, x) < δ, ∀n ≤ N, kfn (x) − fn (y)kF < ε.
La famille composée de {fn } et de f est donc uniformément équicontinue sur E.

(iii) Soit M la borne sur la famille {fn } :
∀n ≥ 1, ∀x ∈ E, kfn (x)kF ≤ M.
Pour tout n ≥ 1,
kf (x)kF ≤ kf (x) − fn (x)kF + kfn (x)kF ≤ kf (x) − fn (x)kF + M.
Par convergence simple, en laissant n tendre vers l’infini, kf (x)kF ≤ M .
La condition (2.3) de convergence uniforme du théorème est suffisante pour

que la fonction limite soit continue mais elle n’est pas nécessaire comme le montre
l’exemple suivant.
Exemple 2.2 (W. Rudin [1, Théorème 7.12 p. 139]).

On considère la suite suivante de fonctions continues définies sur [0, 1] :
déf
fn (x) = n2 x(1 − x2 )n , n ≥ 1.
C’est un fonction non-négative telle que fn (1) = fn (0) = 0. Les limites aux deux
bouts sont donc 0. Pour 0 < x < 1, on applique le critère du quotient :
2
fn+1 (x) n+1
= (1 − x2 ) → (1 − x2 ) < 1
fn (x) n
⇒ lim fn (x) = 0.
n→∞
La suite {fn } converge donc √

simplement, mais pas uniformément vers la fonction
f = 0. En effet, pour xn = 1/ 1 + 2n
n
n2 1
sup |fn (x) − f (x)| ≥ |fn (xn ) − f (xn )| = √ 1−
x∈[0,1] 1 + 2n 2n + 1
n n
n2 1 n3/2 1
≥ √ 1− = 1− .
4n n 2 n
Comme (1−1/n)n tend vers e−1 lorsque n tend vers l’infini, le côté droit de l’inégalité
tend vers l’infini et la convergence n’est pas uniforme.
2.2 Espaces de Banach de fonctions bornées/continues

On introduit maintenant à titre d’exemples l’espace des fonctions bornées au
sens de la Définition 4.1 du Chapitre 4 et de ses deux sous-espaces de fonctions
continues et uniformément continues qui coı̈ncident lorsque (E, d) est un compact.
Exemple 2.3.
Soit E un ensemble non-vide et F un espace de Banach. L’espace
déf
B(E; F ) = {f : (E, d) → F | f bornée sur E} (2.6)
déf déf
(f + g)(x) = f (x) + g(x), (λ f )(x) = λ f (x) (2.7)
est un espace vectoriel car il hérite des propriétés de l’espace F : les deux opérations
sont bien définies et préservent la “bornitude” sur E. La fonction
déf
f 7→ kf kB(E;F ) = sup kf (x)kF : B(E; F ) → R+ (2.8)
x∈E
est donc bien définie : comme f est bornée sur E, le supremum est un réel positif.
De plus, c’est une norme car les trois propriétés qui la caractérisent sont vérifées :
0 = sup kf (x)kF ⇐⇒ f (x) = 0 sur E,

x∈E
sup kλ f (x)kF = sup |λ| kf (x)kF = |λ| sup kf (x)kF
x∈E x∈E x∈E
kf (x) + g(x)kF ≤ kf (x)kF + kg(x)kF ≤ sup kf (x)kF + sup kg(x)kF
x∈E x∈E
⇒ sup kf (x) + g(x)kF ≤ sup kf (x)kF + sup kg(x)kF
x∈E x∈E x∈E
⇒ kf + gkB(E;F ) ≤ kf kB(E;F ) + kgkB(E;F ).
C’est un espace vectoriel normé.
On passe aux sous-espaces de fonctions continues.

Exemple 2.4.
Soit E 6= ∅ un sous-ensemble d’un espace métrique (X, d) et F un espace de Ba-
nach. Soit C 0 (E; F ) l’espace des fonctions continues sur E mais pas nécessairement
bornées sur E. Le sous-espace
déf
B 0 (E; F ) = {f : (E, d) → F | f continue et bornée sur E} (2.9)
déf déf
(f + g)(x) = f (x) + g(x), (λ f )(x) = λ f (x) (2.10)
déf
x∈E
est un espace vectoriel normé car c’est un sous-espace de B(E; F ) muni de la même
norme (métrique) (2.8) et un espace vectoriel car les deux opérations préservent la
continuité. Lorsque Y = R, on adoptera la notation B 0 (E) pour B 0 (E; R).
Le second espace est l’espace des fonctions uniformément continues bornées sur E
qui est un sous-espace de B 0 (E; F ) de l’Exemple 2.4.
Exemple 2.5.
Soit E 6= ∅ un sous-ensemble d’un espace métrique (X, d) et F un espace de Banach.
L’espace 1
déf
C 0 (E; F ) = {f : (E, d) → F | f uniformément continue et bornée sur E} (2.12)
déf déf
(f + g)(x) = f (x) + g(x), (λ f )(x) = λ f (x) (2.13)
déf
x∈E
est un espace vectoriel car les deux opérations préservent la continuité uniforme et
que C 0 (E; F ) ⊂ B 0 (E; F ) avec la même métrique (2.8). La notation E rappelle le
fait qu’il y a toujours un prolongement uniformément continu unique à E (Théorème
6.3, Chapitre 4) et dans ce cas-ci le prolongement est aussi borné. est une norme sur
C 0 (E; F ) puisque C 0 (E; F ) ⊂ B 0 (E; F ). Lorsque Y = R, on adoptera la notation
C 0 (E) pour C 0 (E; R).
On groupe les propriétés des espaces C 0 (E; F ) ⊂ B 0 (E; F ) ⊂ B(E; F ) dans

un seul théorème.
Théorème 2.3. Soit F un espace de Banach.
(i) Soit un ensemble E 6= ∅. L’espace (vectoriel) normé B(E; F ) tel que défini
dans l’Exemple 2.3 muni de la norme (2.8) est un espace de Banach.
(ii) Soit E 6= ∅ un sous-ensemble d’un espace métrique (X, d). L’espace (vec-
toriel) normé B 0 (E; F ) tel que défini dans l’Exemple 2.4 muni de la norme
(2.8) est un espace de Banach.
(iii) Soit E 6= ∅ un sous-ensemble d’un espace métrique (X, d). L’espace (vec-
toriel) normé C 0 (E; F ) tel que défini dans l’Exemple 2.5 muni de la norme
(2.8) est un espace de Banach.
1. On adopte la notation de R. A. Adams et J. J. F. Fournier [1].
(iv) Soit E 6= ∅ un sous-ensemble compact d’un espace métrique (X, d). Alors
déf
C 0 (E; F ) = {f : (E, d) → F |f continue sur E} (2.15)
muni de la norme (2.8) est un espace de Banach et
C 0 (E; F ) = B 0 (E; F ) = C 0 (E; F ). (2.16)
Démonstration. (i) Il reste à montrer que B(E; F ) est complet. Soit {fn } une suite
de Cauchy dans B(E; F ) : pour tout ε > 0 il existe N > 0 tel que
∀n, m > N, kfn − fm kB(E;F ) < ε. (2.17)
Par l’équivalence des parties (iii) et (i) du Théorème 2.1, il existe f : E → F tel que
{fn } convergerge uniformément vers f . Ceci définit la fonction f : E → F candidate
pour la limite de la suite {fn }. Mais une suite de Cauchy est toujours bornée :
∃M tel que ∀n ≥ 1, kfn kB(E;F ) = sup kfn (x)kF ≤ M.

x∈E
Les fonctions de la famille {fn } sont donc uniformément bornées sur E. Par le
Théorème 2.2, la fonction f est aussi bornée sur E. Elle appartient donc à B(E; F )
qui est par ce fait complet.
(ii) Il faut montrer que B 0 (E; F ) est complet. Soit {fn } une suite de Cauchy
dans B 0 (E; F ). Comme B 0 (E; F ) ⊂ B(E; F ) et que ce dernier est complet, il existe
f ∈ B(E; F ) tel que {fn } converge uniformément vers f sur E. Comme les {fn }
sont continues, f est continue par le Théorème 2.2 (i) et B 0 (E; F ) est complet.
(iii) Il faut montrer que C 0 (E; F ) est complet. Soit {fn } une suite de Cauchy
dans C 0 (E; F ). Comme C 0 (E; F ) ⊂ B 0 (E; F ) et que ce dernier est complet, il existe
f ∈ B 0 (E; F ) tel que {fn } converge uniformément vers f sur E. Comme les {fn }
sont uniformément continues, f est uniformément continue par le Théorème 2.2 (ii)
et B 0 (E; F ) est complet.
(iv) Toute fonction continue sur E est bornée par le Théorème 4.1 et uni-
formément continue par le Théorème 6.1 du Chapitre 4. Les trois espaces coı̈ncident
donc avec la même norme (2.8). Conséquemment C 0 (E; F ) est un Banach.
Exemple 2.6.
Une limitation importante des définitions des espaces B 0 (E; F ) et C 0 (E; F ) est
la condition que les fonctions soient bornées sur E. Dans certains cas, on peut
palier à cette difficulté. Par exemple, lorsque E = Ω, un sous-ensemble ouvert de
Rk , on montre qu’il existe une suite croissante de compacts non vides Kk tel que
Ω = ∪k≥1 Kk et, pour tout compact K ⊂ Ω, il existe k ≥ 1 tel que K ⊂ Kk (voir
l’Exercice 8.3 en fin de chapitre). À l’aide de cette suite on peut déinir une métrique
sur l’espace
déf
C 0 (Ω) = {f : Ω → R |f continue sur Ω}
des fonctions continues sur Ω, où Ω n’est pas nécessairement borné (voir l’Exercice
8.4 en fin de chapitre). La construction se fait comme suit. Pour f ∈ C 0 (Ω) et k ≥ 1
on définit
déf
qk (f ) = sup |f (x)|
x∈Kk
et on choisit pour métrique sur C 0 (Ω) la fonction

∞
X
déf 1 qk (f − g)
d(f, g) = .
2k 1 + qk (f − g)
k=1
C’est la métrique de convergence uniforme sur les compacts. (voir la propriété (iv)
du paragraphe 2.2, page 58, et l’Exercice 10.3 (iv) page 101 du Chapitre 3).
2.3 Espace de fonctions lipschitziennes

On donne un dernier exemple pour compléter le palmarès des espaces de fonc-
tions continues.
Exemple 2.7.
Soit E 6= ∅ un sous-ensemble d’un espace métrique (X, d) et F un espace de Banach.
déf
C 0,1 (E; F ) = {f : E → F | f lipschitzienne et bornée sur E} (2.18)
déf déf
(f + g)(x) = f (x) + g(x), (λ f )(x) = λ f (x) (2.19)
est un espace vectoriel car ces opérations préservent la “lipschitzité” et la “bor-

nitude” sur E. La notation E rappelle le fait qu’il y a toujours un prolongement
uniformément continu unique à E et, dans ce cas-ci, le prolongement est aussi borné
et lipschitzien de même constante. On introduit la fonction
déf |f (x) − f (y)|

f 7→ c(f, E) = sup : C 0,1 (E; F ) → R+ (2.20)
x6=y∈E d(x, y)
qui n’est pas une norme sur C 0,1 (E; F ) et on dénote par kf kB(E;F ) la norme (2.8)
sur B 0 (E; F ). La nouvelle fonction
déf
f 7→ kf kC 0,1 (E;F ) = kf kB(E;F ) + c(f, E) : C 0,1 (E; F ) → R+ (2.21)
est maintenant une norme.
Théorème 2.4. L’espace (vectoriel) normé C 0,1 (E; F ) tel que défini dans l’Exemple
2.7 avec la norme (2.21) est un espace de Banach.
Démonstration. Soit {fn } une suite de Cauchy pour la norme C 0,1 (E; F ). Comme
C 0,1 (E; F ) ⊂ C 0 (E; F ) et que kf kB(E;F )) ≤ kf kC 0,1 (E;F ) , {fn } est aussi une suite
de Cauchy dans C 0 (E; F ). Par la démonstration du Théorème 2.3 (iii), il existe
une fonction limite f qui est uniformément continue et bornée sur E et fn → f

uniformément pour la norme (2.8). Il reste à démontrer que f ∈ C 0,1 (E; F ) et que
c(fn −f, E) → 0 puisque l’on sait déjà que f ∈ C 0 (E; F ) et que kfn −f kB(E;F ) → 0.
Par définition d’une suite de Cauchy pour la norme C 0,1 (E; F ),
∃M > 0, ∀n ≥ 1, kfn kB(E;F ) + c(fn , E) ≤ M

∀ε > 0, ∃N > 0, ∀m, n > N, kfn − fm kB(E;F ) + c(fn − fm , E) < ε.
Pour tout x, y ∈ E et tout n, m > N on a l’estimé
k(fn (x) − fm (x)) − (fn (y) − fm (y))kF

≤ c(fn − fm , E) < ε.
d(x, y)
En laissant m tendre vers l’infini, il vient
k(fn (x) − f (x)) − (fn (y) − f (y))kF

≤ε
d(x, y)
k(fn (x) − f (x)) − (fn (y) − f (y))kF
⇒ ∀n > N, c(fn − f, E) = sup ≤ ε.
x6=y∈E d(x, y)
Par l’inégalité du triangle, pour n > N ,
kf (x) − f (y)kF kf (x) − fn (x) − (f (y) − fn (y))kF kfn (x) − fn (y)kF

≤ +
d(x, y) d(x, y) d(x, y)
kf (x) − f (y)kF
⇒ ∀x 6= y ∈ E, ≤ c(fn − f, E) + c(fn , E) ≤ ε + M
d(x, y)
et f est bien lipschitzienne sur E. Enfin, comme on a montré que pour la suite de
Cauchy {fn } dans la norme (2.21) de C 0,1 (E; F ),
∃N > 0, ∀n > N, kfn − f kB(E;F ) + c(fn − f, E) < ε,
f ∈ C 0,1 (E; F ) est bien la limite de {fn } pour la norme (2.21) de C 0,1 (E; F ).
Remarque 2.1.
Ici aussi on peut se libérer de la contrainte que les fonctions soient bornées en
remplaçant la norme du supremum par la norme de kf (x0 )kF en un point de x0 ∈ E :
déf
f 7→ kf kLip (E;F ) = kf (x0 )kF + c(f, E) : Lip (E; F ) → R+ (2.22)
où
déf
Lip (E; F ) = {f : E → F | f lipschitzienne sur E} . (2.23)
2.4 Séries de fonctions

On rappelle que, étant donné une suite {ai }∞
i=1 dans R et les sommes partielles
n
X
déf
sn = ai ,
i=1
la série dénotée
∞
X X
ai ou ai
i=1
est la suite des sommes partielles {sn }. La série est dite convergente si la suite {sn }
converge.
Définition 2.2.
Soient E 6= ∅ un sous-ensemble d’un espace métrique (X, d), F un espace de Banach,
une suite de fonctions {fi }, fi : E → F , et, pour chaque x ∈ E, les sommes partielles
n
X
déf
sn (x) = fi (x), n ≥ 1. (2.24)
i=1
P
(i) On dit que la série fi converge (ou converge simplement ou ponctuelle-
ment sur E) si la suite de fonctions {sn } converge (simplement sur E).
P
(ii) On dit que fi converge uniformément (sur E) si la suite de fonctions
{sn } converge uniformément (sur E).
Le critère suivant est dit de Weierstrass.

Théorème 2.5. Soient E 6= ∅ un sous-ensemble d’un espace métrique (X, d), F
un espace de Banach, et une suite de fonctions {fi }, fi : E → F , vérifiant
∀i ≥ 1, ∃ai ≥ 0, ∀x ∈ E, kfi (x)kF ≤ ai . (2.25)
P P
Si la série numérique ai converge, alors la série de fonctions fi converge uni-
formément.
P
Démonstration. Si ai est convergente, alors pour tout ε > 0, il existe N tel que
m
X
∀m ≥ n > N, ai < ε.
i=n
Donc pour tous m ≥ n > N et tout x ∈ E

m
X m
X m
X
ksm (x) − sn−1 (x)kF = fi (x) ≤ kfi (x)kF ≤ ai < ε.
i=n F i=n i=n
Comme le critère de Cauchy est satisfait pour la suite de fonctions {sn }, elles
convergent uniformément par le Théorème 2.1 et, par définition, la série converge
uniformément.
3. ◮ Espaces de Banach de fonctions différentiables 167
3 ◮ Espaces de Banach de fonctions différentiables

Bien que l’on n’abordera la différentielle d’une fonction de plusieurs variables
qu’au prochain chapitre, il est intéressant d’anticiper un peu et de présenter des
espaces de Banach de fonctions k-fois continûment différentiables dans un sou-
ensemble ouvert Ω de Rn .
Exemple 3.1.
Soit Ω un sous-ensemble ouvert non-vide de Rn . L’espace
 

 f continue et bornée sur Ω 
déf
B 1 (Ω) = f : Ω → R ∂i f continue et bornée sur Ω, (3.1)

 

1≤i≤n
déf déf
(f + g)(x) = f (x) + g(x), (λ f )(x) = λ f (x), (3.2)
où ∂i f est la dérivée partielle ∂f /∂xi de f , est un espace vectoriel. La fonction

n
X
déf
f 7→ kf kB1 (Ω) = kf kB(Ω;R) + k∂i f kB(Ω;R) (3.3)
i=1
est une norme sur B 1 (Ω). C’est un espace de Banach.
Exemple 3.2.
Soit Ω un sous-ensemble ouvert non-vide de Rn . L’espace
 

 f uniformément continue et bornée sur Ω  
déf
C 1 (Ω) = f : Ω → R ∂i f uniformément continue et bornée sur Ω, (3.4)

 

1≤i≤n
déf déf
(f + g)(x) = f (x) + g(x), (λ f )(x) = λ f (x), (3.5)
où ∂i f est la dérivée partielle ∂f /∂xi de f , est un espace vectoriel. La fonction

n
X
déf
f 7→ kf kC 1 (Ω) = kf kB(Ω;R) + k∂i f kB(Ω;R) (3.6)
i=1
est une norme sur C 1 (Ω). C’est un espace de Banach.
Exemple 3.3.
De la même façon on peut définir B k (Ω) et C k (Ω) pour k ≥ 2 sur un sous-ensemble
ouvert non-vide Ω de Rn . On introduit d’abord des notations compactes pour les
dérivées partielles de tout ordre. Soit Nn l’ensemble de toutes les n-suites d’entiers
α = (α1 , . . . , αn ) ∈ Nn . Un élément de Nn sera appelé un multi-index. Pour chaque
α ∈ Nn , on définit l’ordre |α| de α et la dérivée partielle ∂ α comme suit :
n
X ∂ |α|
|α| = αi , ∂α = . (3.7)
i=1
∂xα
1
1
. . . ∂xα
n
n
On définit de façon récursive pour k ≥ 2 les ensembles

déf
B k (Ω) = f ∈ B k−1 (Ω) : ∂ α f ∈ B 0 (Ω), ∀α, |α| = k
déf
C k (Ω) = f ∈ C k−1 (Ω) : ∂ α f ∈ C 0 (Ω), ∀α, |α| = k .
Ce sont des espaces vectoriels. On considère les fonctions 2

déf
|f |0,Ω = sup |f (x)|
x∈Ω
 déf

 max sup |∂ α f (x)|
 |f |m,Ω = |α|=m  (3.8)
x∈Ω
, 1 ≤ m ≤ k.

 kf km,Ω déf 

= max |f |m,Ω
0≤m≤k
Les fonctions (f, g) 7→ |f − g|m,Ω pour m ≥ 1 ne sont pas des métriques mais
seulement des pseudo-métriques. Elles vérifient les axiomes (M2) et (M3), mais
|f |m,Ω = 0 n’entraı̂ne pas f = 0 pour l’axiome (M1). La fonction
f 7→ kf kk,Ω : B k (Ω) → R+ (3.9)
est une norme sur B k (Ω) et sur son sous-espace C k (Ω). Ce sont des espaces de
Banach.
Exemple 3.4.
Soit Ω un sous-ensemble ouvert non-vide de Rn . Les espaces
 

 f continue et bornée sur Ω 

∞ déf n
B (Ω) = f : Ω → R ∀k ≥ 1, ∀α ∈ N tel que |α| = k (3.10)

 α


∂ f continue et bornée sur Ω
 

 f uniformément continue et bornée sur Ω  
déf
C ∞ (Ω) = f : Ω → R ∀k ≥ 1, ∀α ∈ Nn tel que |α| = k (3.11)

 

∂ α f uniformément continue et bornée sur Ω
pour l’addition et la multiplication par un scalaire

déf déf
(f + g)(x) = f (x) + g(x), (λ f )(x) = λ f (x), (3.12)
sont des espaces vectoriels. Toutes les normes sur B k (Ω) et C k (Ω) sont des normes
sur B ∞ (Ω) et C ∞ (Ω), mais B ∞ (Ω) et C ∞ (Ω) ne sont pas complets par rapport à
2. Les |f |m,Ω , m ≥ 1, sont des semi-normes. Une semi-norme sur un espace vectoriel E est
une application q : E → R+ vérifiant les axiomes suivants :
(i) homogénéité : ∀λ ∈ R, ∀x ∈ E, q(λ x) = |λ| q(x) ;
(ii) sous-additivité : ∀x, y ∈ E, q(x + y) ≤ q(x) + q(y).
Comme q(0) = 0 par (i), il ne manque que l’implication q(x) = 0 ⇒ x = 0 pour en faire une
norme.
4. Produit scalaire et espaces de Hilbert 169
ces normes. Cependant, la fonction 3

∞
X 1 |f − g|k,Ω
(f, g) 7→ : B ∞ (Ω) × B ∞ (Ω) → R+ (3.13)
2k 1 + |f − g|k,Ω
k=0
est une métrique par rapport à laquelle B ∞ (Ω) et C ∞ (Ω) sont complets 4 .
4 Produit scalaire et espaces de Hilbert

Une importante famille d’espaces normés est celle pour laquelle il existe un
produit scalaire. 5
Définition 4.1.
Soit E un espace vectoriel. Un produit scalaire sur E est une application (x, y) 7→
(x|y) : E × E → R qui possède les propriétés suivantes :
(PS 1) (x|x) ≥ 0 pour tout x ∈ E.
(PS 2) (x|x) = 0 ⇐⇒ x = 0.
(PS 3) (x|y) = (y|x) pour tout x, y ∈ E.
(PS 4) (λx + µy|z) = λ(x|z) + µ(y|z) pour tout λ, µ ∈ R et x, y, z ∈ E.
Un espace vectoriel muni d’un produit scalaire est appelé espace préhilbertien. 6
Remarque 4.1.
Pour les besoins de la définition, on a adopté la notation (x|y) pour le produit
scalaire afin de le distinguer de la notation (x, y) pour une paire de points de E. On
utilisera la notation (x, y) pour le produit scalaire lorsque le contexte le permet.
Théorème 4.1. Soit E un espace vectoriel muni d’un produit scalaire. L’application
déf p
x 7→ kxk = (x|x) : E → R+ (4.1)
définit une norme sur E et l’application
(x, y) 7→ kx − yk : E × E → R+ (4.2)
est une métrique sur E. De plus, on a l’ inégalité de Cauchy-Schwarz
∀x, y ∈ E, |(x|y)| ≤ kxk kyk. (4.3)
p
Démonstration. Pourp(N1), kxk = p (x|x) = 0 ⇐⇒ p (x|x) = 0 ⇐⇒ x = 0.
2
Pour (N2), kλxk = (λx|λx) = |λ| (x|x) = |λ| (x|x) = |λ| kxk. Pour (N3),
pour tout λ ∈ R
0 ≤ (x + λy|x + λy) = (x|x) + λ2 (y|y) + 2λ(x|y)
2
p p
⇒ |(x|y)| − (x|x) (y|y) ≤ 0 ⇒ (x|y) ≤ |(x|y)| ≤ (x|x) (y|y).
3. Voir la propriété (iv) du paragraphe 2.2 du Chapitre 3, page 58.
4. Ce sont des espaces de Fréchet.
5. Inner product en anglais pour le distinguer du produit extérieur à valeurs dans E.
6. Inner product space en anglais.
Donc
kx + yk2 = (x + y|x + y) =(x|x) + (y|y) + 2 (x|y)

p p
≤ (x|x) + (y|y) + 2 (x|x) (y|y)
= kx||2 + kyk2 + 2kxk kyk = (kxk + kyk)2 .
⇒ kx + yk ≤ kxk + kyk.
Définition 4.2.
Un espace vectoriel muni d’un produit scalaire est appelé espace de Hilbert s’il
est complet pour la métrique correspondant à la norme associée à son produit
scalaire.
L’espace euclidien Rn de l’Exemple 1.1 avec le produit scalaire

n
X
déf
x·y = xi yi (4.4)
i=1
est un espace de Hilbert de dimension finie.
Exemple 4.1.
On a vu au Chapitre 3 que l’espace des suites infinies
( ∞
)
X
2 déf 2
ℓ = x = (x1 , x2 , . . . ) : xi ∈ R et |xi | < ∞ ,
i=1
est un espace vectoriel avec la norme

"∞ #1/2
déf
X 2
kxkℓ2 = |xi | .
i=1
Muni du produit scalaire

∞
X
déf
(x|y) = xi yi (4.5)
i=1
c’est un espace de Hilbert.
Exemple 4.2.
Soit C 0 ([0, 2]) l’espace de Banach des fonctions continues sur [0, 2] muni de la norme
du sup. En utilisant l’intégrale de Riemann, il est facile de vérifier que la fonction
Z 2
déf
(f, g) 7→ (f |g) = f (x) g(x) dx : C 0 ([0, 2]) × C 0 ([0, 2]) → R (4.6)
0
4. Produit scalaire et espaces de Hilbert 171
est un produit scalaire sur C 0 ([0, 2]). L’espace C 0 ([0, 2]) muni de ce produit scalaire
est préhilbertien, mais il n’est pas complet par rapport à la norme associée
Z 1/2
p 2
2
kf kL2 = (f, f ) = f (x) ) dx .
0
En effet, considérons la suite de fonctions 7 {fn } ⊂ C 0 ([0, 2]) définies comme suit :
pour chaque entier n ≥ 1


 1, si 0 ≤ x ≤ 1,


 1
fn (x) = 1 − n (x − 1),
déf si 1 < x < 1 + ,
n (4.7)



 1
 0, si 1 + ≤ x ≤ 2.
n
Ce n’est pas une suite de Cauchy dans pour la norme du supremum puisque
∀n ≥ 1, kf2n − fn kC 0 ([0.2]) = 1/2.
Mais elle est Cauchy pour la norme k kL2 . En effet, pour m > n > N


 0, si 0 ≤ x ≤ 1



 1

 (m − n) (x − 1),
 si 1 < x < 1 +
m
déf
fn (x) − fm (x) = 1 1 (4.8)

 1 − n (x − 1), si 1 + ≤x<1+

 m n



 1
 0, si 1 + ≤ x ≤ 2
n
et
Z 2
|fn (x) − fm (x)|2 dx
0
Z 1+1/m Z 1+1/n
2 2
= (m − n) |x − 1| dx + |1 − n (x − 1)|2 dx
1 1+1/m
h Z
1 n i2 1+1/n
≤ (m − n)2 3
+ 1− dx
3m m 1+1/m
h i h
n 2 1 n i2 1 1 1 1 41 4 1
≤ 1− + 1− − ≤ + < < .
m 3m m n m 3m n 3n 3N
Il est facile de voir que la fonction fn converge simplement (ponctuellement)

vers la fonction
(
déf 1, si 0 ≤ x ≤ 1
f (x) = (4.9)
0, si 1 < x ≤ 2.
7. Voir l’Exemple 2.1 page 158.

qui est discontinue en x = 1 et que



 0, si 0 ≤ x ≤ 1


 1
fn (x) − f (x) = 1 − n (x − 1), si 1 < x < 1 +
n (4.10)



 1
 0, si 1 + ≤ x ≤ 2.
n
En étendant l’intégrale de Riemann à des fonctions continues par morceaux, il vient
Z 2 Z 1+1/n Z
2 1 1 1
|fn (x) − f (x)|2 dx = |1 − n (x − 1)| dx = |1 − y|2 dx = → 0.
0 1 n 0 3n
La suite {fn } converge donc vers la fonction f ∈ / C 0 ([0, 2]) ce qui montre que
0
C ([0, 2]) n’est pas complet par rapport à la métrique associée ‘a la norme k·kL2 .
Bien qu’un espace de Hilbert soit plus proche de l’espace euclidien qu’un espace
de Banach, les espaces de Hilbert de fonctions nécessitent l’introduction de la théorie
de la mesure de Lebesgue 8 pour définir l’espace L2 (Ω) des fonctions mesurables de
carré intégrable et de la théorie des distributions pour définir les espaces de Sobolev
H k (Ω) des fonctions k-fois différentiables au sens des distributuions. Ce sont les
analogues de C 0 (Ω), C 0 (Ω), C k (Ω) et C k (Ω).
5 Applications linéaires et linéaires continues

Définition 5.1.
Une application f : E → F entre deux espaces vectoriels E et F est linéaire si
∀x, y ∈ E, f (x + y) = f (x) + f (y) (additivité) (5.1)
∀α ∈ R, ∀x ∈ E, f (λx) = λ f (x) (homogénéité). (5.2)
Elle préserve les deux opérations sur un espace vectoriel.
Les deux propriétés peuvent être combinées en une seule :

∀x, y ∈ E, ∀λ, µ ∈ R, f (λx + µy) = λ f (x) + µ f (y) (linéarité). (5.3)
Définition 5.2.
Soient (E, k ·kE ) et (F, k ·kF ) deux espaces normés. On désigne par L(E, F ) l’espace
de toutes les applications f : E → F linéaires et continues.
On verra plus loin au Théorème 6.1 page 178 que si E est de dimension finie, alors les
applications linéaires sur E sont continue. Cependant, en général, une application
linéaire n’est pas continue et cela même si E et F sont des espaces de Hilbert.
8. Par rapport à l’intégrale de Riemann, l’intégrale de Lebesgue permet d’intégrer des fonc-
tions qui sont ni continues ni bornées. Le cadre hilbertien est aussi mieux adapté aux problèmes
de la physique impliquant un potentiel ou une énergie que la nature cherche à minimiser. C’est le
principe de la moindre quantité d’action énoncé par Maupertuis en 1746 à l’Académie des sciences
en 1744, et à l’Académie royale des sciences de Prusse. Par exemple, les solutions de problèmes
aux limites pour l’équation de Laplace satisfont le principe de Dirichlet.
5. Applications linéaires et linéaires continues 173
Exemple 5.1.
La fonction
df
f 7→ : C 1 ( ]0, 1[ ) → C 0 ( ]0, 1[ )
dx
est linéaire. Elle n’est pas continue si C 1 ( ]0, 1[ ) est équippé de la norme
kf kC 0 ( ]0,1[ ) = sup |f (x)|,
0<x<1
mais elle l’est pour la norme kf kC 1 ( ]0,1[ ) définie en (3.3) page 167.
Théorème 5.1. Soit f : E → F une application linéaire entre deux espaces normés
E et F . Les propriétés suivantes sont équivalentes.
(i) f est continue sur E.
(ii) f est continue en 0.
(iii) f est uniformément continue sur E.
(iv) Il existe M > 0 tel que
∀x ∈ E, kf (x)kF ≤ M kxkE . (5.4)
Démonstration. (i) ⇒ (ii) Par définition.

(ii) ⇒ (iii) Par linéarité, f (0) = 0. Par continuité en 0, pour tout ε > 0 il
existe δ > 0 tel que
∀x ∈ E, kxkE = kx − 0kE < δ, , kf (x)kF = kf (x) − f (0)kF < ε.
Toujours par linéarité, pour tout x, x′ ∈ E, f (x′ ) − f (x) = f (x′ − x). Donc,
∀x, x′ ∈ E, kx − x′ kE < δ, kf (x) − f (x′ )kF = kf (x − x′ )kF < ε.
et f est uniformément continue sur E.
(iii) ⇒ (iv) On fixe ε et δ. Pour x 6= 0 et (δ/2) x/kxkE , par linéarité,

δ 1 δ x 2ε
kf (x)kF = f < ε ⇒ kf (x)kF < kxkE .
2 kxkE 2 kxkE F δ
On prend M = 2ε/δ.
(iv) ⇒ (i) Soient ε > 0 et δ = ε/M > 0. Pour tous x, y ∈ E tel que ky − xkE <
δ, on a par linéarité de f
kf (y) − f (x)kF = kf (y − x)kF ≤ M ky − xkX < M δ = ε.
f est donc uniformément continue et a fortiori continue sur E.
Remarque 5.1.
De la partie (iv), on a aussi que f est lipschitzienne sur E :
∀x, y ∈ E, kf (y) − f (x)kF = kf (y − x)kF ≤ M ky − xkE .
Lorsqu’une application linéaire n’est pas continue, on peut toujours palier à

cette difficulté en enrichissant la norme de l’espace de départ.
Théorème 5.2. Soit f : E → F une application linéaire entre deux espaces normés
E et F .
(i) La fonction
déf
x 7→ kxkf = kxkE + kf (x)kF (5.5)
est une norme sur E.

(ii) L’application
x 7→ f (x) : (E, k kf ) → (F, k kF ) (5.6)
est linéaire et continue sur E.
La norme (5.6) est appelée norme du graphe.
Démonstration. La partie (ii) est une conséquence de l’inégalité
kf (x)kF ≤ kxkE + kf (x)kF = kxkf
et du Théorème 5.1 Il reste à vérifier les trois axiomes de la norme.

(N1) Comme f est linéaire, f (0) = 0 et
x=0 ⇒ kxkE = 0 et kf (0)kF = k0kF = 0 ⇒ k0kf = k0kE + kf (0)kF = 0.
Dans l’autre sens, kxkE + kf (x)kF = 0 entraı̂ne kxkE = 0 et x = 0 puisque kxkE

est une norme.
(N2) Pour λ ∈ R,
kλxkE + kf (λx)kF = |λ| kxkE + kλf (x)kF = |λ| kxkE + |λ| kf (x)kF = |λ| kxkf .
(N3)
kx + ykE + kf (x + y)kF = kx + ykE + kf (x) + f (y)kF

≤ kxkE + kf (x))kF + kykE + kf (y)kF = kxkf + kykf .
La structure d’espace vectoriel normé se transmet à l’espace des applications

linéaires continues.
Théorème 5.3. Soient E et F deux espaces normés.

(i) L(E, F ) est un espace vectoriel pour
déf déf
(f + g)(x) = f (x) + g(x), (λf )(x) = λ f (x). (5.7)
5. Applications linéaires et linéaires continues 175
(ii) La fonction
déf kf (x)kF
f 7→ kf kL(E,F ) = sup : L(E, F ) → R+ (5.8)
06=x∈E kxkE
est une norme sur L(E, F ).

(iii) Si F est un espace de Banach, L(E, F ) est un espace de Banach pour la
norme (5.8).
Remarque 5.2.
On voit facilement que kf kL(E,R) est la partie c(f, E) de la norme 9 sur C 0,1 (E).
Il est intéressante de noter que, pour les applications linéaires et continues, c(f, E)
devient une norme ce qui permet d’écarter la contrainte que f soit bornée sur E. En
effet, c(f, E) = 0 implique que f est constante, mais comme f est linéaire f (0) = 0
ce qui force la constante à être nulle.
Démonstration. (i) Directement des définitions.

(ii) Axiome (N1). Si f = 0, alors, pour tout x 6= 0, kf (x)kF /kxkE = 0 et
kf kL(E,F ) = 0. Réciproquement, kf kL(E,F ) = 0 entraı̂ne f (x) = 0 pour tout x 6= 0
et f = 0. Axiome (N2). Pour λ ∈ R,
kλf (x)kF |λ| kf (x)kF kf (x)kF

kλf kL(E,F ) = sup = sup = |λ| sup .
06=x∈E kxkE 06=x∈E kxkE 06=x∈E kxkE
Axiome (N3). Pour f, g ∈ L(E, F ) et x 6= 0
k(f + g)(x)kF kf (x) + g(x)kF kf (x)kF kg(x)kF

= ≤ + ≤ kf kL(E,F ) + kgkL(E,F ).
kxkE kxkE kxkE kxkE
(iii) Soit {fn } une suite de Cauchy dans L(E, F ) : pour tout ε > 0, il existe
N > 0 tel que, pour tout m, n > N ,
kfn (x) − fm (x)kF k(fn − fm )(x)kF

≤ sup = kfn − fm kL(E,F ) < ε. (5.9)
kxkE 06=x∈E kxkE
Pour chaque x 6= 0, la suite {fn (x)} est une suite de Cauchy et, comme F est
complet, il existe une limite f (x) ∈ F tel que fn (x) → f (x). Pour x = 0, fn (0) =
0 → 0 et on prend f (0) = 0. La fonction f est linéaire car pour tout x, x′ ∈ E et
λ, µ ∈ R,
f (λx + µx′ ) − [λf (x) + µf (x′ )] = [f (λx + µx′ ) − fn (λx + µx′ )]

+ fn (λx + µx′ ) − [λfn (x) + µfn (x′ )]
− λ [f (x) − fn (x)] − µ [f (x′ ) − fn (x′ )]
= [f (λx + µx′ ) − fn (λx + µx′ )]
− λ [f (x) − fn (x)] − µ [f (x′ ) − fn (x′ )].
9. Voir la définition (2.21) page 164.
Comme le membre de droite tend vers 0, on obtient la linéarité de f . Pour montrer

que f est continue, on fait appel à la condition (iv) du Thórème 5.1 qui caractérise
la continuité de l’application linéaire f sur E. Comme la suite de Cauchy {fn } dans
L(E, F ) est bornée par une constante M , on a pour tout x ∈ E
kf (x)kF ≤ kf (x) − fn (x)kF + kfn (x)kF
≤ kf (x) − fn (x)kF + kfn kL(E,F ) kxkE
≤ kf (x) − fn (x)kF + M kxkE .
En laissant n tendre vers l’infini, il reste la condition (iv) du Thórème 5.1
∀x ∈ E, kf (x)kF ≤ M kxkE .
On a démontré que f ∈ L(E, F ).
Il ne reste plus qu’à montrer que fn → f dans la norme de L(E, F ). On
procède aux estimés suivants : pour m, n > N et x 6= 0
kfn (x) − f (x)kF kfn (x) − fm (x)kF kfm (x) − f (x)kF
≤ +
kxkE kxkE kxkE
kfn (x) − fm (x)kF kfm (x) − f (x)kF
≤ sup +
06=x∈E kxk E kxkE
kfm (x) − f (x)kF
<ε+ .
kxkE
En laissant m tendre vers l’infini, il reste pour n > N
kfn (x) − f (x)kF kfn (x) − f (x)kF
∀x 6= 0, ≤ε ⇒ kfn − f kL(E,F ) = sup ≤ ε.
kxkE 06=x∈E kxkE
Enfin, comme kfn − f kL(E,F ) ≤ ε pour tout n > N , f est la limite de {fn } dans
L(E, F ) et L(E, F ) est complet.
On donne un dernier résultat.
Théorème 5.4. Si f ∈ L(E, F ) est bijective, alors f −1 est linéaire. Si , en plus,
f −1 est continue, alors il existe 0 < m ≤ M tel que
∀x ∈ E, m kxkE ≤ kf (x)kF ≤ M kxkE . (5.10)
−1
Démonstration. (i) Comme f ∈ L(E, F ) est bijective, f est bijective. Pour tout
λ, µ ∈ R et y1 , y2 ∈ F , il existe x1 , x2 ∈ E tel que yi = f (xi ) : par linéarité de f
f −1 (λy1 + µy2 ) = f −1 (λf (x1 ) + µf (x2 ))
= f −1 (f (λx1 + µx2 )) = λx1 + µx2 = λf −1 (y1 ) + µf −1 (y2 )
et f −1 est linéaire.
(ii) Par hypothèse f −1 est continue et, de la partie (i), f −1 ∈ L(F, E). Du
Théorème 5.1 (iv), il existe M ′ > 0 tel que kf −1 (y)kE ≤ M ′ kykF et il existe M > 0
tel que kf (x)kF ≤ M kxkE . De là, en prenant y = f (x), pour tout x ∈ E
1
kxkE = kf −1 (f (x))kE ≤ M ′ kf (x)kF ⇒ kxkE ≤ kf (x)kF ≤ M kxkE
M′
et on prend m = 1/M ′ .
6. Espaces vectoriels de dimension finie 177
6 Espaces vectoriels de dimension finie

6.1 Espace euclidien
On revient à l’espace euclidien Rn de dimension n avec son produit scalaire et
sa norme (euclidienne)
n
X déf √
x·y = xi yi , kxk = x · x. (6.1)
i=1
Rn qui muni de ce produit scalaire est un espace de Hilbert. Comme on l’a vu à

l’Exemple 1.1, il y a une infinité d’autres normes sur Rn comme par exemple les
normes kxkp , 1 ≤ p ≤ ∞, qui sont toutes équivalentes à la norme kxk2 . Dans ce
paragraphe, la notation kxk sera réservée à cette norme kxk2 .
Il est utile pour le calcul d’assimiler un élément x = (x1 , . . . , xn ) ∈ Rn à la
matrice n × 1
 
x1
déf  . 
~x =  ..  (6.2)
xn
et d’utiliser la matrice tranposée ~x⊤ pour écrire le produit scalaire comme produit
de deux matrices
 
y1
⊤
.
x · y = ~x ~y = x1 . . . xn  ..  . (6.3)
yn
Il ne faudra donc pas confondre les différentes notations

 
x1
 
x, ~x, ~x⊤ et (x1 , . . . , xn ),  ...  , x1 . . . xn .
xn
Pour alléger la notation, on laissera tomber la flèche de ~x lorsque le contexte le

permettra et on identifiera x et ~x.
Définition 6.1. (i) Un sous-ensemble S de Rn est appellé sous-espace linéaire

n
de R si S est un espace vectoriel.
(ii) Une suite {x1 , . . . , xk }, k ≥ 1, dans Rn est linéairement indépendante si,
pour toute suite de scalaires {α1 , . . . , αk } vérifiant
k
X
αi xi = 0,
i=1
on a αi = 0, 1 ≤ i ≤ k. Sinon, on dit que la suite {x1 , . . . , xk } est

linéairement dépendante.
(iii) On dit qu’un sous-espace linéaire S de Rn est de dimension k s’il existe une
suite {x1 , . . . , xk } linéairement indépendante et toute suite {y1 , . . . , yℓ },
ℓ > k, est linéairement dépendante. On écrira dim S = k.
(iv) On associe à U ⊂ Rn , 10 le plus petit sous-espace linéaire de Rn qui contient
U
déf
\
Vect (U ) = S. (6.4)
S sous-espace linéaire
tel que U⊂S
On peut vérifier que tout sous-espace linéaire de Rn est fermé dans Rn et que
Vect (U ) est aussi un sous-espace linéaire fermé.
Définition 6.2.
La base canonique orthonormale de Rn est l’ensemble {eni ∈ Rn : 1 ≤ i ≤ n},
(
déf déf 1, si i = j
(eni )j = δij , δij =
0, si i 6= j,
c’est-à-dire, les éléments
en1 = (1, 0, 0, . . . , 0, 0), en2 = (0, 1, 0, n . . . , 0, 0), ..., enn = (0, 0, 0, . . . , 0, 1).
En particulier, eni · enj = δij . La fonction de deux indices δij est appelée symbole de
Kronecker.
Lorsque le contexte le permet, on écrira simplement {ei } sans l’indice n.
6.2 L’espace des applications linéaires

Théorème 6.1. (i) Soit f : Rn → R une fonction linéaire pour la norme
euclidienne sur Rn . Il existe un élément unique a ∈ Rn tel que
 
x1
n
 . 
∀x ∈ R , f (x) = a · x = a1 . . . an  ..  ,
xn
f est continue et kf kL(Rn ,R) = kak.

(ii) Soit L : Rn → Rm une application linéaire pour les normes euclidiennes
sur Rn et Rm . Alors L est continue sur Rn . Il existe une matrice m × n
unique A = {aij } telle que
    
m n a11 . . . a1n x1
X X  ..
L(x1 , . . . , xn ) =  
aij xj ei =  . . .. ..   ... 
.  
 , (6.5)
i=1 j=1 am1 . . . amn xn
10. En anglais, on écrit span (U ) pour Vect (U ).
où aij = L(enj ) · em

i , et  1/2
Xm X
n 
déf
kLkL(Rn ,Rm ) ≤ kAk2 , kAk2 = a2ij , (6.6)
 
i=1 j=1
où la norme kAk2 est appelée norme de Frobenius. 11

(iii) L(Rn , Rm ) est un espace de Banach pour la norme kLkL(Rn ,Rm ) .
(iv) L(Rn , Rm ) est un espace de Hilbert pour le produit scalaire, appelé produit
de Frobenius, 12
m X
X n √
déf
A·· B = aij bij , kAk2 = A·· A, (6.7)
i=1 j=1
des matrices A et B associées à deux éléments L et M de L(Rn , Rm ). Il

peut être identifié à Rmn muni de la norme euclidienne.
Remarque 6.1.
(i) Si l’on utilise une autre norme kak∗ que la norme euclidienne kak dans la partie
(i) du théorème, on n’aura que l’inégalité kf kL(Rn ,R) ≤ kak∗ . En général, les normes
kf kL(Rn ,R) et kak∗ seront équivalentes, mais pas égales.
(ii) La norme de Frobénius kAk2 est équivalente mais pas égale à la norme
kLkL(Rn ,Rm ) de l’application linéaire correspondante.
Démonstration. (i) Soit une fonction linéaire f : Rn → R. Tout point x = (x1 , . . . , xn )

peut s’écrire
n
X
x= xi ei
i=1
et, par linéarité de f ,

 
n f (e1 )
X déf  
f (x) = xi f (ei ) = x · g, g =  ...  .
i=1 f (en )
Le vecteur g est unique. Pour tout ε > 0, on prend δ = ε/(kgk + 1). De là,
∀y, ky − xk < δ ⇒ |f (y) − f (x)| = |f (y − x)| = |g · (y − x)|

≤ kgk ky − xk
kgk
< kgk δ = ε < ε.
kgk + 1
f est donc continue en tout point de Rn .

11. Ferdinand Georg Frobenius (1849–1917).
12. On peut montrer que A·· B = tr (A⊤ B) = tr (A B ⊤ ).
Si f est identiquement nulle, on prend g = 0. Sinon, par Cauchy-Schwarz,

pour le produit scalaire
|f (x)|
∀x ∈ Rn , |f (x)| = |x · g| ≤ kxk kgk ⇒ kf kL(Rn ,R) = sup ≤ kgk.
06=x∈Rn kxk
Mais, comme |f (g)| = |g · g| = kgk2, le supremum est atteint et kf kL(Rn ,R) = kgk.
(ii) On applique (i) à chaque composante Li (x) = ei · L(x) de L : il existe
ai ∈ Rn tel que Li (x) = ai · x. En utilisant les composantes (ai1 , . . . , ain ) de chaque
ai , on forme ainsi la matrice A :
      
L1 (x) a1 · x a11 . . . a1n x1
 ..   ..   .. . .. . 
..   ... 

L(x) =  .  =  .  =  . 
Ln (x) an · x an1 . . . ann xn
| {z } | {z }
A x
Les parties (iii) et (iv) sont immédiates.

L’opération de composition de deux applications linéaires correspond à la mul-
tiplication de leurs matrices associées.
Théorème 6.2. Soient trois entiers ℓ, m, n plus grands ou égaux à 1.
(i) La composition L ◦ M de L ∈ L(Rℓ , Rm ) et de M ∈ L(Rn , Rℓ )
M L
x 7→ M (x) 7→ L(M (x)) : Rn −→
| R
ℓ
{z −→} R
m
L◦M
est un élément de L(Rn , Rm ) et

kL ◦ M kL(Rn ,Rm ) ≤ kLkL(Rℓ ,Rm ) kM kL(Rn ,Rℓ ) . (6.8)
(ii) Si A est la matrice m × ℓ associée à L et B est la matrice ℓ × n associée à

M , alors la matrice m × n associée à la composition L ◦ M est le produit
ℓ
X
déf
(A B)ij = aik bkj , 1 ≤ i ≤ m, 1 ≤ j ≤ n. (6.9)
k=1
des matrices A et B et
kABk2 kAk2 kBk2
z }| { z }| {
 1/2 z( }| {
)1/2  1/2
Xm X
n  m X
X ℓ X X 
ℓ n
(A B)2ij ≤ a2ik b2kj . (6.10)
   
i=1 j=1 i=1 k=1 k=1 j=1
(iii) Pour tout A ∈ L(Rn , Rm ),

déf déf
Ker A = {x ∈ Rn : Ax = 0} ⊂ Rn et Im A = {Ax : x ∈ Rn } ⊂ Rm (6.11)
sont des sous-espaces (fermés) linéaires de Rn et de Rm , respectivement.
Lorsque m = n, les éléments de l’espace L(Rn , Rn ) peuvent être identifiés avec

2
des matrices carrées n × n. Comme L(Rn , Rn ) peut être identifié à Rn , la composi-
2
tion ou le produit matriciel induit un produit non-commutatif sur Rn comme dans
le cas des quaternions pour R4 .
6.3 Orthogonalité et transposition

Définition 6.3.
L’orthogonal d’une partie U de Rn est le sous-ensemble
déf
U ⊥ = {y ∈ Rn : y · x = 0, ∀x ∈ U } .
On a un premier ensemble de propriétés.

Théorème 6.3. Soit U ⊂ Rn .
(i) U ⊥ est un sous-espace linéaire de Rn et U ⊂ (U ⊥ )⊥ .
(ii) Pour toute paire U1 ⊂ U2 , on a U2⊥ ⊂ U1⊥ .
(iii) U ⊥ = (Vect U )⊥ .
(iv) Pour tout sous-espace linéaire S non vide de Rn ,
(S ⊥ )⊥ = S.
(v) Pour tout U ⊂ Rn , (U ⊥ )⊥ = Vect U .

Démonstration. (i) En effet, pour tout x ∈ U et pour tout y1 et y2 dans U ⊥ et α,
β dans R,
(αy1 + βy2 ) · x = αy1 · x + βy2 · x = 0
et αy1 + βy2 ∈ U ⊥ . Soit x ∈ U . Par définition de U ⊥ , pour tout y ∈ U ⊥ , y · x = 0.

Mais, par définition de (U ⊥ )⊥ , x ∈ (U ⊥ )⊥ et U ⊂ (U ⊥ )⊥ .
(ii) Pour tout h ∈ U2⊥ , on a h · x = 0 pour tout x ∈ U2 . Comme U1 ⊂ U2 , il
vient h ∈ U1⊥ .
(iii) Comme U ⊂ Vect U , on a de (ii) (Vect U )⊥ ⊂ U ⊥ . Réciproquement, soit
une combinaison linéaire αx + βy de deux ééments x, y de U . On a
∀h ∈ U ⊥ , h · (αx + βy) = α h · x + β h · y = α0 + β 0 = 0
et h ∈ (Vect U )⊥ .
(iv) De la partie (i) on sait que S ⊂ (S ⊥ )⊥ . La réciproque n’est en général
pas vraie, mais ici S est un sous-espace linéaire. On considère le problème de mini-
misation suivant pour un point arbitraire z ∈ (S ⊥ )⊥ :
déf 1
inf f (x), f (x) = kx − zk2 .
x∈S 2
déf
Ce problème possède une solution x0 ∈ S. En effet, comme f (x) ≥ 0, m =
inf f (S) ∈ R. Soit M > m, alors
déf
∃x ∈ S, m ≤ f (x) < M 6 ∅.
⇒ SM = {x ∈ S : f (x) ≤ M } =
Puisque f est continue sur Rn , SM est fermé. Il est aussi borné car
1 √
∀x ∈ SM , kx − zk2 ≤ M ⇒ kx − zk ≤ 2M .
2
Donc, SM est compact, f (SM ) est compact et inf f (SM ) ∈ f (SM ). Comme m =
inf f (S) = inf f (SM ), il existe x0 ∈ SM ⊂ S tel que m = f (x0 ). Pour tout t > 0 et
tout s ∈ S, x0 + ts ∈ S, f (x0 + ts) ≥ f (x0 ) et
f (x0 + ts) − f (x0 ) t
0≤ = (x0 − z) · s + ksk2 → (x0 − z) · s
t 2
lorsque t → 0. Comme S est linéaire, ±s ∈ S et
±(x0 − z) · s ≥ 0 ⇒ ∀s ∈ S, (x0 − z) · s = 0.
Donc x0 − z ∈ S ⊥ . Comme x0 ∈ S et que, par hypothèse, z ∈ (S ⊥ )⊥ , on obtient
(x0 − z) · x0 = 0 et (x0 − z) · z = 0.
| {z } ∈S | {z } ∈(S ⊥ )⊥
∈S ⊥ ∈S ⊥
On obtient finalement
kx0 − zk2 = (x0 − z) · x0 − (x0 − z) · z = 0 ⇒ z = x0 ∈ S
et (S ⊥ )⊥ ⊂ S.
(v) découle des parties (iii) et (iv).
Soit l’application linéaire A : Rn → Rm (qui admet pour représentation une
matrice m × n). On définit l’application transposée ou adjointe A⊤ : Rm → Rn de
A : Rn → Rm par le processus suivant. Pour tout y ∈ Rm , l’application x 7→ y · Ax :
Rn → R est linéaire. Il existe donc un unique vecteur a(y) ∈ Rn tel que
∀x ∈ Rn , a(y) · x = y · Ax
et ceci induit une application

déf
y 7→ A⊤ y = a(y) : Rm → Rn
quie est linéaire. En effet, pour tout α, β dans R et y1 , y2 dans Rm , on a

∀x ∈ Rn , a(αy1 + βy2 ) · x = (αy1 + βy2 ) · Ax = α y1 · Ax + β y2 · Ax
= α a(y1 ) · x + β a(y2 ) · x
= [α a(y1 ) + β a(y2 )] · x
⇒ a(αy1 + βy2 ) = α a(y1 ) + β a(y2 ).
Par construction, A⊤ vérifie l’identité
∀x ∈ Rn , y ∈ Rm , y · Ax = A⊤ y · x. (6.12)
Si Aij = Aeni · em
j est la matrice n × m associée à A pour les bases orthonormales
n m
canoniques {eni : 1 ≤ i ≤ n} et {em j : 1 ≤ j ≤ m} de R et R , alors la matrice
⊤ ⊤
m × n associée à A est donnée par (A )ij = Aji .
Théorème 6.4. (i) Pour tout A ∈ L(Rn , Rm ), on a l’identité
kA⊤ kL(Rm ,Rn ) = kAkL(Rn ,Rm )
(ii) Soient trois entiers ℓ, m, n plus grands ou égaux à 1 et la composition A◦ B

de A ∈ L(Rℓ , Rm ) et de B ∈ L(Rn , Rℓ )
déf B A
x 7→ B(x) 7→ (A ◦ B)(x) = A(B(x)) : Rn |−→ R ℓ m
{z −→} R .
A◦B
L’application
(A, B) 7→ A ◦ B : L(Rℓ , Rm ) × L(Rn Rℓ ) → L(Rn , Rm )
est continue.
(iii) Pour tout A ∈ L(Rn , Rm ), on a les identités suivantes :
(A⊤ )⊤ = A (6.13)
[Im A]⊥ = Ker(A⊤ ) (6.14)
⊥ ⊤
[Ker A] = Im (A ). (6.15)
⊤
A injective ⇐⇒ Ker A = {0} ⇐⇒ A surjective.
(iv) Pour tout A ∈ L(Rn , Rm ), l’image AU d’un convexe U est convexe.

Démonstration. (i) Du Théorème 6.1 (i), on a
|Ax · y|
kAxk = kAxkL(Rn ,R) = sup
06=y∈Rm kyk
kAxk |Ax · y|
⇒ kAkL(Rn ,Rm ) = sup = sup sup
06=x∈Rn kxk 06=x∈R 06=y∈R kxk kyk
n m
|x · A⊤ y|
kA⊤ yk = kA⊤ ykL(Rm ,R) = sup
06=x∈Rn kxk
⊤
kA yk |x · A⊤ y|
⇒ kA⊤ kL(Rm ,Rn ) = sup = sup sup .
06=y∈Rm kyk 06=y∈Rm 06=x∈Rn kxk kyk
Comme Ax · y = x · A⊤ y et que l’on peut changer l’ordre de deux supremum, il vient

kA⊤ kL(Rm ,Rn ) = kAkL(Rn ,Rm ) .
(ii) Soient (A, B), (C, D) ∈ L(Rℓ , Rm )×L(Rn Rℓ ). En utilisant (i) et l’inégalité
(6.8) du Théorème 6.2 (i) :
kC ◦ D − A ◦ Bk ≤ kC ◦ D − C ◦ Bk + kC ◦ B − A ◦ Bk
≤ k(C ◦ D − C ◦ B)⊤ k + k(C − A) ◦ Bk
≤ kD⊤ ◦ C ⊤ − B ⊤ ◦ C ⊤ k + kC − Ak kBk
≤ k(D⊤ − B ⊤ ) ◦ C ⊤ k + kC − Ak kBk
≤ k(D − B)⊤ k kC ⊤ k + kC − Ak kBk
≤ kD − Bk kCk + kC − Ak kBk
≤ max{kCk, kBk} (kD − Bk + kC − Ak) |
≤ kD − Bk kCk + kC − Ak kBk
≤ max{kC − Ak + kAk, kBk} (kD − Bk + kC − Ak) .
Étant donné ε > 0, 0 < δ < 1 et (C, D) tel que
kC − Ak + kD − Bk < δ,
il vient
kC ◦ D − A ◦ Bk < max{1 + kAk, kBk} δ.
Il suffit alors de chosir δ tel que
δ = min{1, 1/ max{1 + kAk, kBk}} > 0
pour obtenir la continuité de la composition au point (A, B).

(iii) a) Pour tout x ∈ Rn et y ∈ Rm ,
Ax · y = x · A⊤ y = (A⊤ )⊤ x · y.
Donc,
∀y ∈ Rm , Ax · y = (A⊤ )⊤ x · y, ⇒ ∀x ∈ Rn , Ax = (A⊤ )⊤ x, ⇒ A = (A⊤ )⊤ .
b) Par définition,
[Im A]⊥ = {y ∈ Rm : Ax · y = 0, ∀x ∈ Rn }.
Mais
0 = Ax · y = x · A⊤ y, ∀x ∈ Rn ⇒ A⊤ y = 0 ⇒ y ∈ Ker A⊤ .
Réciproquement,
y ∈ Ker A⊤ ⇒ A⊤ y = 0 ⇒ ∀x ∈ Rn , x · A⊤ y = 0
et
0 = x · A⊤ y = Ax · y, ∀x ∈ Rn ⇒ y ∈ [Im A]⊥ .
7. Groupe général linéaire : métriques et complétude 185
c) De (6.14) en remplaçant A par A⊤ et en utilisant l’identité (6.13),
[Im A⊤ ]⊥ = Ker (A⊤ )⊤ = Ker A ⇒ ([Im A⊤ ]⊥ )⊥ = (Ker A)⊥ .
Enfin par le Théorème 6.3, comme Im A⊤ est un sous-espace linéaire (Im A⊤ )⊥⊥ =
Im A⊤ . d) Conéquence de (c).
(iv) L’image d’un convexe est un convexe par linéarité.
7 Groupe général linéaire : métriques et complétude

7.1 Rappels sur la notion de groupe
On aura maintenant besoin de la définition abstraite de groupe que l’on illus-
trera par quelques exemples.
Définition 7.1.
Soit X un ensemble arbitraire et une opération sur X × X que l’on notera +. On
dira que (X, +) est un groupe si les propriétés (ou axiomes) suivantes sont vérifiées :
(i) pour tous x, y ∈ X, x + y ∈ X (loi de composition interne) ;
(ii) pour tous x, y, z ∈ X, (x + y) + z = x + (y + z) (associativité) ;
(iii) il existe un élément neutre 0 pour lequel x + 0 = x = 0 + x quelque soit
x∈X;
(iv) chaque x ∈ X possède un inverse ou opposé −x tel que x + (−x) = 0 =
(−x) + x.
On dira que le groupe est commutatif ou abélien si, en plus, x + y = y + x pour tous
x, y ∈ X.
L’exemple le plus simple d’un groupe est l’ensemble R ou Z muni de l’addition

+ pour laquelle on peut vérifier les propriétés suivantes :
(i) pour tous x, y ∈ R, x + y ∈ R ;
(ii) pour tous x, y, z ∈ R, (x + y) + z = x + (y + z) ;
(iii) 0 est l’élément neutre pour lequel x + 0 = x = 0 + x pour tout x ∈ R ;
(iv) chaque x ∈ R possède un inverse (additif) −x tel que x + (−x) = 0 =
(−x) + x.
Dans ce cas ce groupe est commutatif, c’est-à-dire, x + y = y + x.
Mais, la notion de groupe n’est pas limitée à l’opération d’addition. En effet,
pour l’ensemble R \{0} des réels non-nuls où Q \{0} des rationnels non-nuls muni
de la multiplication × on peut vérifier les propriétés suivantes :
(i) pour tous x, y ∈ R \{0}, x × y ∈ R \{0} ;
(ii) pour tous x, y, z ∈ R \{0}, (x × y) × z = x × (y × z) ;
(iii) 1 est l’élément neutre pour lequel x × 1 = x = 1 × x pour tout x ∈ R \{0} ;
(iv) chaque x ∈ R \{0} possède un inverse (multiplicatif) x−1 tel que x× x−1 =
1 = x−1 × x.
Ici aussi ce groupe est commutatif, c’est-à-dire, x × y = y × x.

Un exemple qui ne fait pas intervenir des nombres est celui de l’ensemble
P(X) des sous-ensembles d’un ensemble arbitraire X et de l’ensemble vide ∅ muni
de l’opération différence symétrique △
déf
A △ B = [A\B] ∪ [B\A] .
On peut vérifier les propriétés suivantes pour (P(X), △) :

(i) pour tous A, B ∈ P(X), A △ B ∈ P(X) ;
(ii) pour tous A, B, C ∈ P(X), (A △ B) △ C = A △ (B △ C) ;
(iii) ∅ est l’élément neutre pour lequel A △ ∅ = A = A △ ∅ pour tout
A ∈ P(X) ;
(iv) chaque A ∈ P(X) possède un inverse puisque A △ A = ∅. Ici A est son
propre inverse, c’est-à-dire, A−1 = A.
Ce groupe est aussi commutatif, c’est-à-dire, A △ B = B △ A.
7.2 Définition et propriétés

La composition ◦ de deux applications bijectives et linéaires est bijective et
linéaire, l’application identité I est l’élément neutre par rapport à ◦, et l’application
inverse d’une application linéaire et bijective est linéaire et bijective. Les applications
bijectives et linéaires forment donc un groupe pour la composition ◦ (voir Théorème
7.1 (i) plus bas).
Définition 7.2. (i) On utilisera la notation L(Rn ) pour L(Rn , Rn ).

(ii) On définit le sous-ensemble de L(Rn )
déf
GL (n) = {A ∈ L(Rn ) : A bijective} . (7.1)
On l’appellera groupe général linéaire de degré n.
GL (n) peut être identifié avec le groupe des matrices n × n inversibles muni de
la multiplication matricielle. Pour simplifier, on utilisera la même notation pour
l’application linéaire et sa matrice associée.
On aura besoin plus tard du résultat technique suivant.
Lemme 7.1. A ∈ L(Rn ) est injective si et seulement si elle est bijective.
Démonstration. Si A est bijective, elle est injective. Réciproquement, si A est injec-

tive et Im A 6= Rn , alors la suite {Ae1 , . . . , Aen } qui génère Im A est linéairement
dépendante, c’est-à-dire, il existe {α1 , . . . , αn } pas tous nuls tel que
n
X
αi Aei = 0.
i=1
Par linéarité et injectivité de A

n
! n n
X X X
A αi ei = αi Aei = 0 ⇒ αi Aei = 0.
i=1 i=1 i=1
Puisque la suite {e1 , . . . , en } est linéairement indépendante dans Rn , tous les αi

sont nuls ce qui contredit le fait que Im A 6= Rn .
Théorème 7.1. (i) GL (n) est un groupe par rapport à la composition ◦.
(ii) Si A ∈ GL (n) et B ∈ L(Rn ) et si
kB − AkL(Rn ) kA−1 kL(Rn ) < 1, (7.2)
alors B ∈ GL (n).
(iii) GL (n) est un sous-ensemble ouvert de L(Rn ) et l’application
déf
A 7→ g(A) = A−1 : GL (n) → GL (n) (7.3)
est bijective et continue pour la norme kAkL(Rn ) .
Démonstration. (i) On vérifie les quatre propriétés d’un groupe.
(a) Pour tout A, B ∈ GL (n), A ◦ B ∈ L(Rn ) par le Lemme 7.1 Par le Théorème
6.4 (iii), A ◦ B est bijective si et seulement si elle est injective. Donc, A(B(x)) =
(A ◦ B)(x) = 0 entraı̂ne B(x) = 0 et x = 0 car A et B sont injectives.
(b) [(A ◦ B) ◦ C](x) = (A ◦ B)(C(x)) = A(B(C(x))) = A((B ◦ C)(x))) = [A ◦ (B ◦
C)](x).
(c) L’identité I appartient à GL (n) et A(x) = I(A(x)) = (I ◦ A)(x).
(d) Comme A est linéaire et bijectif, par le Théorème 5.4, A−1 est linéaire et bijectif
et donc A−1 ∈ GL (n). De plus, A−1 ◦ A = I = A ◦ A−1 .
(ii) On pose α = 1/kA−1 kL(Rn ) et β = kB − AkL(Rn ) ce qui implique β < α.
Pour tout x
α kxk = α kA−1 Axk ≤ α kA−1 k kAxk =kAxk
≤ k(A − B)xk + kBxk ≤ β kxk + kBxk
⇒ (α − β) kxk ≤ kBxk
avec α − β > 0. On a donc x = 0 si Bx = 0 et l’application linéaire B est injective
et, a posteriori, bijective.
(iii) Pour A ∈ GL (n), soit α = 1/kA−1 kL(Rn ) . On considère la boule ouverte
Bα (A). Pour tout B ∈ Bα (A)
1
kB − AkL(Rn ) < α = ⇒ kB − AkL(Rn ) kA−1 kL(Rn ) < 1
kA−1 k L(Rn )
et de la partie (i) B ∈ GL (n). Donc Bα (A) ⊂ GL (n) et GL (n) est ouvert.

L’application A 7→ g(A) = A−1 est bijective car
∀B ∈ GL (n), B = (B −1 )−1 = g(B −1 ) et
g(A) = g(B) ⇒ B = AA−1 B = A g(A) B = B = A g(B) B = A B −1 B = A.
Soit A, B ∈ GL (n) et α = 1/kA−1 kL(Rn ) :
B −1 − A−1 = B −1 (A − B) A−1
kB −1 kL(Rn )
kB −1 kL(Rn ) − kA−1 kL(Rn ) ≤ kB −1 − A−1 kL(Rn ) ≤ kA − BkL(Rn )
α
α − kA − BkL(Rn ) 1
⇒ kB −1 kL(Rn ) ≤ kA−1 kL(Rn ) =
α α
1
⇒ kB −1 kL(Rn ) ≤
α − kA − BkL(Rn )
si kA − BkL(Rn ) < α. De plus,
kB −1 − A−1 kL(Rn ) ≤ kB −1 kL(Rn ) kA − BkL(Rn ) kA−1 kL(Rn )

1 kA − BkL(Rn )
≤ .
α − kA − BkL(Rn ) α
Pour ε > 0, il suffit de prendre
αε
kA − BkL(Rn ) < δ = α <α
1 + αε
pour obtenir
αε
1 α 1+αε
kB −1 − A−1 kL(Rn ) < αε =ε
α − α 1+αε α
ce qui donne la continuité de g en A.
7.3 Première métrique sur GL (n)

GL (n) est un sous-ensemble ouvert de l’espace de Banach L(Rn ) muni de la
norme kAkL(Rn ) . Ce n’est pas un sous-espace vectoriel car I + (−1)I = 0 n’est pas
inversible. Il n’est pas fermé pour la métrique
ρ(A, B) = kA − BkL(Rn )
sur L(Rn ) car la suite de Cauchy {(1/k)I} converge vers 0 lorsque k tend vers l’infini
et 0 n’appartient pas à GL (n).
Peut-on définir une métrique complète sur le groupe GL (n) ? Oui, il suffit
d’ajouter la norme de la différence des inverses
déf
d0 (A, B) = kA − BkL(Rn ) + kA−1 − B −1 kL(Rn ) . (7.4)
ce qui donne bien une métrique.
Théorème 7.2. Le groupe GL (n) par rapport à la composition est un espace
métrique complet pour la métrique (7.4). La composition
(A, B) 7→ A ◦ B : (GL (n), d0 ) × (GL (n), d0 ) → (GL (n), d0 )
est continue par rapport à cette métrique.
Démonstration. (i) d0 est une métrique. Si A = B, on a d0 (A, A) = kA − AkL(Rn ) +

kA−1 −A−1 kL(Rn ) = 0. Si d0 (A, B) = 0, on a kA−BkL(Rn ) et A = B. La fonction d0
est symétrique catr la norme de kA − BkL(Rn ) est symétrique. Enfin, on a l’inégalité
du triangle toujours parce que kAkL(Rn ) est une norme.
(ii) (GL (n), d0 ) est complet. En effet, si {An } est une suite de Cauchy par
n
rapport à cette métrique, {An } et {A−1n } sont des suites de Cauchy dans L(R )
n
qui est un espace de Banach. Il existe donc A et B dans L(R ) tel que An → A et
A−1
n → B. Du Théorème 6.4 (ii), par continuité de la composition, il vient alors
I = An ◦ A−1
n → A◦B et I = A−1
n ◦ An → B ◦ A
ce qui entraı̂ne B = A−1 et A ∈ GL (n).

(iii) On a montré au Théorème 6.4 (ii) que la composition
(A, B) 7→ A ◦ B : L(Rn ) × L(Rn ) → L(Rn )
est continue par rapport à la norme kAkL(Rn ) + kBkL(Rn ) sur L(Rn ) × L(Rn ). Donc
(A−1 , B −1 ) 7→ (A ◦ B)−1 = B −1 ◦ A−1 : L(Rn ) × L(Rn ) → L(Rn )
est continue par rapport à la norme kA−1 kL(Rn ) + kB −1 kL(Rn ) ce qui entraı̂ne la
continuité de la composition pour la métrique d0 .
7.4 ◮ Une seconde métrique sur GL (n) invariante à droite

On a cependant perdu une propriété importante de la norme sur les es-
paces vectoriels : l’invariance par rapport à la translation, c’est-à-dire, kf − gk =
k(f + h) − (g + h)k pour tout h. Grâce à cette propriété, on a Br (f ) = f + Br (0) et
la boule en f est une translation de la boule à l’origine 0 et tout voisinage du point
f est la translation par f d’un voisinage de l’origine 0. Pour récupérer l’analogue
de cette propriété dans un groupe, il faut procéder de façon un peu différente que
dans le cas d’un espace ou d’un sous-espace vectoriel. Pour une structure de groupe
l’élément neutre est la transformation identité I à comparer avec la structure d’es-
pace vectoriel où le groupe associé à l’addition + a pour élément neutre l’origine 0.
I joue donc pour GL (n) le rôle de l’origine.
Dans un premier temps on introduit la distance de A ∈ GL (n) à l’identité I
déf
d0 (A, I) = kA − IkL(Rn ) + kA−1 − IkL(Rn ) . (7.5)
Ceci permet de contrôller à la fois A et son inverse A−1 puisque d0 (A−1 , I) =

d0 (A, I). Ensuite, on étend la distance d0 à deux éléments A et B de GL (n)
déf
d0 (A, B) = d0 (A ◦ B −1 , I) = kA ◦ B −1 − IkL(Rn ) + kB ◦ A−1 − IkL(Rn ) .
On a la symétrie d0 (B, A) = d0 (A, B) car (A ◦ B −1 )−1 = B ◦ A−1 . Il y a invariance

à droite puisque pour tout A, B, C ∈ GL (n)
déf
d0 (A ◦ C, B ◦ C) = d0 ((A ◦ C ◦ (B ◦ C)−1 , I) = d0 (A ◦ B −1 , I) = d0 (A, B).
C’est la propriété analogue à la translation pour la norme sur un espace vectoriel

normé : kf − gk = k(f + h) − (g + h)k. On obtient alors pour les boules
Br (I) = {X ∈ GL (n) : d0 (X, I) < r}

Br (I) ◦ A = Br (A), (7.6)
Br (A) = {Y ∈ GL (n) : d0 (Y, A) < r}.
La composition remplace la translation.

On a bien une application
(A, B) 7→ d0 (A, B) : GL (n) × GL (n) → R+
qui vérifie les deux premiers axiomes d’une métrique. Pour (M1)
0 = d0 (A, B) = kA ◦ B −1 − IkL(Rn ) + kB ◦ A−1 − IkL(Rn )

⇒ A ◦ B −1 = I et B ◦ A−1 = I ⇒ A=B
et, réciproquement, A = B entraı̂ne A ◦ B −1 = I et d0 (A, B) = 0. Pour (M2)
d0 (A, B) = kA ◦ B −1 − IkL(Rn ) + kB ◦ A−1 − IkL(Rn )

= kB ◦ A−1 − IkL(Rn ) + kA ◦ B −1 − IkL(Rn ) = d0 (B, A).
Malheureusement, on n’a pas l’axiome (M3) de l’inégalité du triangle. 13

Heureusement, pour ce groupe, il y a une construction canonique pour récupérer
l’axiome (M3). On modifie la définition de la distance d0 (A, I) de A ∈ GL (n) à
l’identité I pour y intégrer l’inégalité du triangle. 14 On considère toutes les facto-
risations finies {Fi } de A dans GL (n) :
A = F1 ◦ · · · ◦ Fk , Fi ∈ GL (n),
et la nouvelle distance entre A et I

k
X
déf
d(A, I) = inf kFi − IkL(Rn ) + kFi−1 − IkL(Rn ) (7.7)
F1 ,...,Fk ∈GL (n)
A=F1 ◦···◦Fk i=1
que l’on étend, comme précédemment, à toute paire A, B ∈ GL (n)

déf
d(A, B) = d(A ◦ B −1 , I). (7.8)
Par construction, d est encore invariante à droite : d(A ◦ C, B ◦ C) = d(A, B).

Théorème 7.3. La fonction d définie en (7.7)-(7.8) est une métrique invariante à
droite sur le groupe GL (n) et (GL (n), d) est un espace métrique complet.
13. Étant donné un ensemble X, une fonction d : X × X → R est une semi-métrique sur X si
(i) d(F.G) ≥ 0, pour tout F, G,
(ii) d(F, G) = 0 ⇐⇒ F = G,
(iii) d(F, G) = d(G, F ), pour tout F, G.
Cette notion remonte à M. Fréchet et K. Menger [1] en 1928.
14. On retouve cette construction chez A. M. Micheletti [1] en 1972.
Cette construction est générique et s’applique à certaines familles de trans-

formations de Rn qui ne sont pas nécessairement linéaires. Elles interviennent, par
exemple, en imagerie. 15
On aura besoin du lemme suivant que l’on démontrera plus tard.
Lemme 7.2. Pour chaque A ∈ GL (n), on a
d(A, I) ≤ kA − IkL(Rn ) + kA−1 − IkL(Rn ) ≤ d(A, I) ed(A,I) . (7.9)
Démonstration du Théorème 7.3. (i) Pour l’axiome (M1). Si A = B, alors A◦B −1 =

I et
k
X
d(A, B) = inf kFi − IkL(Rn ) + kFi−1 − IkL(Rn )
F1 ,...,Fk ∈GL (n)
i=1
A◦B −1 =F1 ◦···◦Fk
≤ kI − IkL(Rn ) + kI −1 − IkL(Rn ) = 0.
Dans l’autre sens, par le Lemme 7.2, d(A◦B −1 , I) = d(A, B) = 0 implique A◦B −1 =
I et A = B ce qui vérifie l’axiome (M1). L’axiome (M2) est immédiat puisque
kFi − IkL(Rn ) + kFi−1 − IkL(Rn ) = kFi−1 − IkL(Rn ) + kFi − IkL(Rn ) .
L’axiome (M3) aussi. En effet, soient A, B, C ∈ L(Rn ). On a A ◦ C −1 = (A ◦ B −1 ) ◦

(B ◦ C −1 ). Soit {Fi } une factorisation finie de A ◦ B −1 dans GL (n)
A ◦ B −1 = F1 ◦ · · · ◦ Fk , Fi ∈ GL (n),
et {Gj } une factorisation finie de B ◦ C −1 dans GL (n)
B ◦ C −1 = G1 ◦ · · · ◦ Gℓ , Gj ∈ GL (n), .
Ceci nous donne la factorisation finie
A ◦ C −1 = F1 ◦ · · · ◦ Fk ◦ G1 ◦ · · · ◦ Gℓ
15. Voir les travaux de R. Azencott [2] en 1994 et de A. Trouvé [1, 2, 3] en 1995 et les
travaux de F. Mémoli [1] et F. Mémoli et G. Sapiro [1] basés sur les idées de M. Gromov [1]
pour les structures métriques et les isométries (Prix Abel 2009).
de A ◦ C −1 . Par définiton
k
X
d(A, C) ≤ kFi − IkL(Rn ) + kFi−1 − IkL(Rn )
i=1
ℓ
X
+ kGj − IkL(Rn ) + kGj−1 − IkL(Rn )
j=1
k
X
⇒ d(A, C) ≤ inf kFi − IkL(Rn ) + kFi−1 − IkL(Rn )
F1 ,...,Fk ∈GL (n)
i=1
A◦B −1 =F1 ◦···◦Fk
ℓ
X
+ inf kGj − IkL(Rn ) + kG−1
j − IkL(Rn )
G1 ,...,Gℓ ∈GL (n)
j=1
B◦C −1 =G1 ◦···◦Gℓ
⇒ d(A, C) ≤ d(A, B) + d(B, C).
(ii) Il reste à démontrer que GL (n) est complet par rapport à cette métrique.
Soit {An } une suite de Cauchy dans (GL (n), d). On procède en quatre étapes.
n
(a) Bornitude de {An } et {A−1 n } dans L(R ). Par l’inégalité du triangle
|d(I, Am ) − d(I, An )| ≤ d(Am , An ),
{d(I, An )} est Cauchy, et donc bornée par une constante L. Du Lemme 7.2
∀n ≥ 1, kAn − Ik + kA−1
n − Ik ≤ d(An , I) e
d(An ,I)
≤ L eL
déf
⇒ kAn k + kA−1 −1 −1 L
n k ≤ kIk + kAn − Ik + kIk + kAn − Ik ≤ c = 2 + L e .
n
Les suites {An } et {A−1
n } sont donc bornées dans L(R ).
−1 n
(b) Convergence de {An } et {An } dans L(R ). Pour tout m, n
An − Am = (An ◦ A−1
m − I) ◦ Am et A−1 −1 −1 −1
n − Am = (An ◦ Am − I) ◦ Am
et
−1
kAm − An k ≤ kAn ◦ Am − Ik kAm k ≤ c kAn ◦ A−1
m − Ik
kA−1 −1 −1 −1 −1
m − An k ≤ kAn ◦ Am − Ik kAm k ≤ c kAn ◦ Am − Ik
kAm − An k + kA−1 −1 −1 −1
m − An k ≤ c (kAn ◦ Am − Ik + kAn ◦ Am − Ik)
≤ c d(An , Am ) ed(An,Am ) .
n
Les suites {An } et {A−1n } sont donc Cauchy dans l’espace de Banach L(R ) et il
n −1
existe A et B dans L(R ) tel que An → A et An → B.
(c) A est bijective. Par le Théorème 6.4 (ii), la composition (F, G) 7→ F ◦ G :
L(Rn ) × L(Rn ) → L(Rn ) est continue :
I = An ◦ A−1
n →A◦B et I = An−1 ◦ An → B ◦ A.
On a donc bien B = A−1 et A ∈ GL (n) est un candidat pour la limite de {An }

dans (GL (n), d). De plus, kAk + kA−1 k ≤ c.
(d) Convergence de An vers A dans (GL (n), d). On procède aux estimés
d(An , A) = d(I, A ◦ A−1 −1
n ) ≤ kI − A ◦ An k + kI − An ◦ A
−1
k
= k(An − A) ◦ A−1
n k + k(A − An ) ◦ A
−1
k
≤ kAn − Ak (kA−1n k + kA
−1
k)
≤ kAn − Ak 2 c.
Comme kAn − Ak tend vers 0, d(An , A) tend vers 0 et A est bien la limite de An
dans (GL (n), d).
Démonstration du Lemme 7.2. Par définition
k
X
déf
d(A, I) = inf kFi − IkL(Rn ) + kFi−1 − IkL(Rn )
F1 ,...,Fk ∈GL (n)
A=F1 ◦···◦Fk i=1
≤ kA − IkL(Rn ) + kA−1 − IkL(Rn ) .

Soit F1 ◦ · · · + ◦Fk une factorisation de A :
A − I =F1 ◦ · · · + ◦Fk − I
=(F1 ◦ · · · ◦ Fk − F2 ◦ · · · ◦ Fk )
+ (F2 ◦ · · · ◦ Fk − F3 ◦ · · · ◦ Fk ) + · · · + Fk − I
=(F1 − I) ◦ (F2 ◦ · · · ◦ Fk )
+ (F2 − I) ◦ (F3 ◦ · · · ◦ Fk ) + · · · + (Fk − I).
On a les estimés suivants
kA − Ik ≤kF1 − Ik kF2 ◦ · · · ◦ Fk k
+ kF2 − Ik kF3 ◦ · · · ◦ Fk k + · · · + kFk − Ik
k
Y k
Y
≤kF1 − Ik kFi k + kF2 − Ik kFi k + · · · + kFk − Ik.
i=2 i=3
Puisque (1 + x) ≤ ex pour x ≥ 0, on a l’inégalité

kFi k ≤ kFi − Ik + kIk = 1 + kFi − Ik ≤ ekFi −Ik .
En l’applicant cette inégalité à plusieurs reprises, pour tout j, 1 ≤ j ≤ k,
k
Y k
Y Pk Pk
kFi −Ik
kFi k ≤ ekFi −Ik = e i=j ≤e i=i kFi −Ik
.
i=j i=j
Finalement,
k
X Pk
kFi −Ik
kA − Ik =kF1 ◦ · · · + ◦Fk − Ik ≤ kFi − Ik e i=1 ,
i=1
et, de la même façon,
k
X Pk
kFi−1 −Ik
kA−1 − Ik ≤ kFi−1 − Ik e i=1
i=1
k
X Pk
kFi − Ik + kFi−1 − Ik e i=1 (kFi −Ik+kFi −Ik) .
−1
⇒ kA−1 − Ik + kA−1 − Ik ≤
i=1
Comme la fonction x ex est monotone strictement croissante pour x ≥ 0, on peut

prendre l’infimum sur toutes les factorisation finie {Fi } de A ce qui donne l’inégalité
(7.9).
8 Exercices
Exercice 8.1.
Soit {fn } une suite de fonctions dans C 0 (K), K ⊂ Rn compact. Montrer que si
{fn } est uniformément équicontinue et que pour chaque x ∈ K, la suite {fn (x)}
dans R converge vers une fonction f : K → R,
fn (x) → f (x),
alors {fn } converge uniformément vers f . (Une famille de fonctions {fα }, fα : K →

R, est uniformément équicontinue sur K si, pour chaque ε > 0, il existe δ > 0 tel
que
∀α, ∀x, y ∈ K tel que ky − xk < δ, |fα (y) − fα (x)| < ε.)
Exercice 8.2.
Soit (X, d) un espace métrique compact, l’ensemble
déf
X = {A : ∅ 6= A ⊂ X et A fermé}
déf
et ∀A ∈ X , ∀x ∈ X, dA (x) = inf d(a, x).
a∈A
(i) Montrer que les fonctions x 7→ dA (x) : X → R+ et
déf
(A, B) 7→ ρX (A, B) = sup |dA (x) − dB (x)| : X × X → R+
x∈X
sont bien définies.

(ii) Montrer que pour tout A ∈ X , d−1
A {0} = A.
(iii) Montrer que ρX est une métrique sur X .
(iv) Montrer que (X , ρX ) est un espace métrique complet.
8. Exercices 195
Exercice 8.3.
Soit Ω un sous-ensemble ouvert non-vide de Rn . Montrer qu’il existe une suite
croissante de compacts non vides Kk tel que Ω = ∪k≥1 Kk et, pour tout compact
K ⊂ Ω, il existe k ≥ 1 tel que K ⊂ Kk .
Exercice 8.4.
Soit Ω un ouvert non-vide de Rn et
déf
C(Ω) = {f : Ω → R |f continue sur Ω}
l’espace des fonctions continues sur Ω, où Ω n’est pas nécessairement borné. Soit
{Kk } la famille des sous-ensembles compacts construite dans l’Exercice 8.3 et pour
tout f ∈ C(Ω) et k ≥ 1 on pose
déf
qk (f ) = sup |f (x)|.
x∈Kk

∞
X
d(f, g) =
2k 1 + qk (f − g)
k=1
est une métrique sur C(Ω).
Exercice 8.5. (i) Montrer que si A ∈ L(Rn ) est inversible, alors A−1 ∈ L(Rn ).
(ii) Montrer que si A ∈ L(Rn , Rm ) est injective, alors A⊤ A ∈ L(Rn ) est inver-
sible, où A⊤ ∈ L(Rm , Rn ) est l’application transposée de A.
(iii) Montrer que pour A ∈ L(Rn , Rm ), Ker A et Im A sont des sous-espaces
linéaires (espaces vectoriels).
Exercice 8.6. (i) Trouver et caractériser tous les A ∈ GL (n) tels que
d(Ax, Ay) = d(x, y) (8.1)
pour l’une des métriques complètes sur GL (n).

(ii) Est ce que l’ensemble
{A ∈ GL (n) : d(Ax, Ay) = d(x, y) x, y ∈ Rn } (8.2)
forme un groupe ?
Exercice 8.7.
Soit X = R \{0} et la fonction
déf 1 1
x, y 7→ d(x, y) = |x − y| + − .
x y
Montrer que (X, d) est un espace métrique complet.

Exercice 8.8.
On considère l’ensemble P(X) des sous-ensembles d’un ensemble arbitraire X in-
cluant l’ensemble vide ∅ muni de l’opération différence symétrique △
déf
A △ B = [A\B] ∪ [B\A] .
Montrer que (P(X), △) vérifie les propriétés d’un groupe abélien ((i) à (v)) :
A ∈ P(X) ;
(iv) chaque A ∈ P(X) possède un inverse puisque A △ A = ∅. Ici A est son
propre inverse, c’est-à-dire, A−1 = A ;
(v) (commutativité) A △ B = B △ A ;
(vi) pour A, B, C ∈ P(X), (A △ B) ∩ C = (A ∩ C) △ (B ∩ C).
Exercice 8.9.
Soit X un ensemble arbitraire et P(X) l’ensemble de tous les sous-ensembles de X
incluant l’ensemble vide ∅. Soit l’ensemble
déf
{0, 1}X = {toutes les applications f : X → {0, 1}}
de toutes les applications définies sur X à valeurs dans l’ensemble à deux éléments
{0, 1}. On associe à chaque A ∈ P(X) la fonction caractéristique
(
déf 1, si x ∈ A
χA (x) =
0, si x ∈ X\A.
A 7→ χA : P(X) → {0, 1}X
est bien définie et bijective.

(ii) Montrer que {0, 1}X est un groupe abélien pour l’opération
déf
(f1 △ f2 )(x) = |f1 (x) − f2 (x)| (8.3)
et en déduire que
(χA △ χB )(x) = |χA (x) − χB (x)| = χA△B (x). (8.4)
pour la différence symétrique entre A et B dans P(X)

déf
A △ B = [A\B] ∪ [B\A]. (8.5)
8. Exercices 197

déf
d(f, g) = sup |f (x) − g(x)| (8.6)
x∈X
définit une métrique sur {0, 1}X et que ({0, 1}X , d) est complet.
(iv) Montrer que (P(X), ρ) est un espace métrique complet pour la métrique
déf
ρ(A, B) = sup |χA (x) − χB (x)| .
x∈X
(v) En supposant démontré que P(X) est un groupe abélien pour l’opération
binaire différence symétrique (8.5) (voir la section 7.1), montrer que △ est
continue par rapport à la métrique ρ.
Exercice 8.10 (Arzelà-Ascoli).

Soit (X, d) un espace métrique compact et C 0 (X; Rk ) pour k ≥ 1 muni de la norme
k
!1/2
déf
X
2
kf kC 0 = sup kf (x)k, kyk = |yi | . (8.7)
x∈X i=1
Démontrer les énoncés suivants.

(i) Si S est un sous-ensemble compact de C 0 (X; Rk ), alors S est fermé,
(a) S est uniformément équicontinu et
(b) S est uniformément borné, c’est-à-dire, ∃M > 0, ∀f ∈ S, ∀x ∈
X, kf (x)k ≤ M .
(ii) Réciproquement, si S est un sous-ensemble de C 0 (X; Rk ) vérifiant (a) et
(b), alors l’adhérence S de S est compacte dans C 0 (X; Rk ).
Chapitre 6
Dérivée,
dérivées directionnelles
et différentielles
1 Introduction
Selon certains historiens le calcul différentiel ou infinitésimal serait implicite-
ment apparu très tôt. Par exemple, le mathématicien astronome Aryabhata (476–
550 ap. J.-C.) en 499 ap. J.-C. utilisait une notion d’infinitésimaux et exprimait
un problème d’astronomie sous la forme d’une équation différentielle élémentaire. 1
Pour d’autres historiens, le calcul différentiel fut inventé au XVIIe siècle.
Si l’on accepte ce point de vue, la première idée du calcul différentiel et de la
règle pour le calcul des extrema d’une fonction remonteraient à Pierre de Fermat 2
en 1638. Il imagina, pour déterminer les maxima et minima d’une fonction et les
tangentes à certaines courbes 3 , une méthode, dite de maximis et minimis, qui le fait
regarder comme le premier inventeur du calcul différentiel. Les idées menant aux
notions de fonction, de dérivée, et d’intégrale furent développées pendant le XVIIe
siècle. Il est généralement accepté que la notion de dérivée est due à Leibniz 4
et Newton. 5 La condition obtenue par Fermat pour l’extremum d’une fonction
algébrique est donc de facto généralisée sous la forme f ′ (x) = 0. Elle est utilisée en
1691 dans la démonstration du Théorème de Rolle 6 qui mène à la règle de l’Hôpital 7
en 1696.
La publication des principaux ouvrages de Newton 8 prit plusieurs années,
1. George G. Joseph, The Crest of the Peacock, Princeton University Press (2000), pp. 298–
300.
2. Pierre de Fermat (1601–1665).
3. D’abord consignée dans une lettre à Mersenne (le correspondant de nombreux scientifiques
de l’époque qui assurait la diffusion de nouveaux résultats) en 1638, la première version imprimée
de la méthode se trouve dans le cinquième volume de Supplementum Cursus Mathematici (1642)
écrit par Herigone, et ce n’est qu’en 1679 qu’elle apparaı̂t dans Varia opera mathematica sous
le titre de Methodus ad disquirendam Maximam et Minimam suivie de De tangentibus linearum
curvarum.
4. Gottfried Wilhelm Leibniz (1646–1716).
5. Sir Isaac Newton (1643–1728).
6. Michel Rolle (1652–1719).
7. Guillaume François Antoine de l’Hôpital (1661–1704).
8. La Method of Fluxions complétée 1671 et publiéee en 1736 et Philosophiae Naturalis
199
200 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
alors que Leibniz publia le premier (Nova methodus, 9 1684) et le domaine fut
subséquemment tourmenté par une querelle de priorité entre les deux inventeurs
du calcul.
≪Au début du calcul différentiel, l’utilisation de quantités infinitési-
males fut perçue comme non rigoureuse et farouchement critiquée par

plusieurs auteurs, notamment par Michel Rolle et Bishop Berkeley. Ber-
keley qualifia les infinitésimaux de fantômes de quantités évanessantes
dans son livre, The Analyst, en 1734. Plusieurs mathématiciens, in-
cluant Maclaurin, essayèrent de démontrer le bien-fondé de l’utilisation
des infinitésimaux, mais ce n’est que 150 ans plus tard, grâce aux tra-
vaux de Cauchy 10 et de Weierstrass 11 qui permettreront finalement
d’éviter les notions rudimentaires de quantités infinitésimales, que le cal-
cul différentiel et intégral put s’appuyer sur des bases solides. Dans les
écrits de Cauchy, on trouve un spectre versatile d’approches fondamen-
tales, incluant une définition de la continuité en termes d’infinitésimaux,
et un prototype (quelque peu imprécis) d’une définition de type (ε, δ)
de la limite pour définir la différentiation. Dans ses travaux Weierstrass
formalise la notion de limite et élimine les infinitesimaux. Après Weiers-
trass, il devint alors habituel de faire appel aux limites plutôt qu’aux
quantités infinitésimales pour le calcul. Cette approche formalisée par
Weierstrass devint connue comme le calcul standard. Le terme calcul
infinitésimal demeura utilisé et se répandit largement pour se référer à
l’approche de Weierstrass.≫ (cf. traduction de l’anglais de Wikipedia,
Infinitesimal Calculus)
2 Fonctions numériques d’une variable réelle

Avant d’aborder les fonctions numériques de plusieurs variables réelles, on
considère les fonctions numériques d’une seule variable réelle (voir Figure 6.1).
Définition 2.1.
Soit f : R → R une fonction numérique d’une variable réelle.
(i) La fonction f est dérivable à droite en x ∈ R si la limite
f (x + t) − f (x)
lim+ (2.1)
tց0 t
existe et est finie où limtց0+ signifie que t tend vers 0 par valeurs stricte-
ment positives. On l’écrira df (x; +1).
Principia Mathematica (Principes mathématiques de philosophie naturelle), souvent abrégé en
Principia (Principes), 1687 et 1726 (troisième édition).
9. Nova methodus pro maximis et minimis, itemque tangentibus, quae nec fractas nec ir-
rationales quantitates moratur, et singulare pro illis calculi genus (Nouvelle méthode pour les
maxima et minima, ainsi que les tangentes, qui ne bute ni sur les fractions ni sur les irration-
nelles, avec un mode original de calcul), dans Acta Eruditorum, 1684, un journal créé à Leipzig
deux ans plus tôt.
10. Augustin-Louis Cauchy (1789–1857).
11. Karl Theodor Wilhelm Weierstrass (1815–1897).
2. Fonctions numériques d’une variable réelle 201
La fonction f est continue à droite en x ∈ R si
lim f (x + t) = f (x) (2.2)

tց0+
(ii) La fonction f est dérivable à gauche 12 en x ∈ R si la limite

f (x − t) − f (x)
lim+ (2.3)
tց0 t
existe et est finie. On l’écrira df (x; −1).
La fonction f est continue à gauche en x ∈ R si
lim f (x − t) = f (x) (2.4)

tց0+
(iii) La fonction f est dérivable en x ∈ R si la limite

f (x + t) − f (x)
lim (2.5)
t
t→0
existe et est finie où limt→0 signifie que t ∈ R tend vers 0. On utilisera la
notation f ′ (x) de Lagrange, df /dx(x) de Leibniz ou f˙(x) de Newton
Les deux premières notions à droite et à gauche sont ce que l’on peut appeler des
semi-différentielles en x dans les directions +1 et −1, respectivement.
Les dérivées à droite et à gauche sont aussi des cas particuliers des différentielles de
Dini 13 .
Remarque 2.1.
Si f est dérivable à droite en x ∈ R, on a l’homogénéité positive :
déf f (x + αt) − f (x)
∀α ≥ 0, df (x; α) = lim = α df (x; +1), df (x; 0) = 0; (2.6)
tց0+ t
de même, si f est dérivable à gauche en x ∈ R, on a l’homogénéité positive :
déf f (x − αt) − f (x)
∀α ≥ 0, df (x; −α) = lim = α df (x; −1), df (x; 0) = 0. (2.7)
tց0+ t
On remarquera facilement que si f est dérivable en x, alors
f ′ (x) = df (x; +1) = −df (x; −1) (2.8)

déf f (x − αt) − f (x)
⇒ ∀α ≥ 0, df (x; −α) = lim = α df (x; −1) = −α f ′ (x)
t→0 t
et on a l’homogénéité
déf f (x + αt) − f (x)
∀α ∈ R, df (x; α) = lim = α df (x; +1) = α f ′ (x). (2.9)
t→0 t
12. Techniquement parlant, il s’agit de la dérivée définie en (i) dans la direction −1.
13. Ulisse Dini (1845–1918), U. Dini [1].
f (x) .
f (x) . f (x) .
x x x
f dérivable à droite f dérivable à gauche f dérivable à gauche
en x. en x. et à droite en x.
f (x) .
f (x) .
x x
f dérivable en x. f n’est dérivable ni à gauche
ni à droite en x.
Figure 6.1. Exemples de dérivées à droite et à gauche.
Donc, si f est dérivable en x ∈ R, l’homogénéité positive combinée avec la condition
df (x; −1) = −df (x; 1) (2.10)
entraı̂ne que l’application

f (x + tv) − f (x)
déf
v 7→ df (x; v) = lim+ : R→R (2.11)
tց0 t
est homogène et donc linéaire et continue
∀α, β ∈ R et ∀v, w ∈ R, df (x; αv + βw) = α df (x; v) + β df (x; w)
car la linéarité coı̈ncide avec l’homogénéité en dimension un.
2.1 Continuité et différentiabilité

Théorème 2.1. (i) Si f est dérivable à droite (resp. gauche) en un point
x ∈ R, alors f est continue à droite (resp. gauche) en x.
(ii) Si f est dérivable en x, alors f est continue en x.
Démonstration. Il suffit de démontrer la continuité à droite à partir de la dérivabilité
à droite. En effet, par définition de la dérivée à droite : pour tout ε > 0 il existe
δ(x) > 0 tel que
f (x + t) − f (x)
∀t, 0 < t < δ(x), − df (x; 1) < ε.
t
Ceci implique que
|f (x + t) − f (x)| < t (|df (x; +1)| + ε) .
La quantité c(x, ε) = |df (x; +1)| + ε > 0 ne dépend que de x et ε. Si on prend

′ ε
δ (x) = min δ(x), > 0,
c(x, ε)
alors
0 < t < δ ′ (x) entraı̂ne |f (x + t) − f (x)| < t c(ε, x) < ε
et, de là, la continuité de f à droite, puisque ε/c(x, ε) ≤ 1.
Remarque 2.2.
On rappelle que pour les fonctions dérivables en x, les opérations ponctuelles de
somme de deux fonctions, de multiplication par un réel, de multiplication et de
division par une fonction non-nulle sont dérivables en x. De plus, la composition
(f ◦ g)(x) = f (g(x)) est dérivable en x si f ′ (g(x)) et g ′ (x) existent et sa dérivée est
donnée par (f ◦ g)′ (x) = f ′ (g(x)) g ′ (x) (voir l’Exercice 7.1).
Exemple 2.1.
Soit la fonction définie par

x sin 1 , x 6= 0
déf
f (x) = x (2.12)
0, x = 0.
Elle est dérivable pour x 6= 0

1 1 1
f ′ (x) = sin − cos , x 6= 0.
x x x
Lorsque x = 0, on retourne à la définition et l’on considère le quotient différentiel
f (t) − f (0) 1
− 0 = sin , t 6= 0;
t t
qui ne possède pas de limite lorsque t → 0. Ainsi f est dérivable partout dans R
sauf en x = 0. Il n’y a pas non plus de dérivée à droite ou à gauche en x = 0.
En général la dérivée d’une fonction dérivable n’est pas continue comme le

montre l’exemple suivant.
Exemple 2.2.
Soit la fonction définie par
(
déf x2 sin x1 , x 6= 0
f (x) = (2.13)
0, x = 0.
Elle est dérivable pour x 6= 0

1 1
f ′ (x) = 2x sin − cos , x 6= 0.
x x
Lorsque x = 0, on retourne à la définition et l’on considère le quotient différentiel
f (t) − f (0) 1
− 0 = t sin − 0 ≤ |t|, t 6= 0;
t t
en laissant t → 0 on voit que f ′ (0) = 0. Ainsi f est dérivable partout dans R,

mais f ′ n’est pas une fonction continue puisque cos(1/t) ne tend pas vers une limite
lorsque t tend vers 0. Il n’y a pas non plus de limite à droite ou à gauche.
Cet exemple montre qu’une fonction dérivable en tout point peut avoir une
dérivée qui ne soit pas continue en certains points. Ceci ne veut cependant pas
dire que n’importe quelle fonction puisse être la dérivée d’une fonction continue et
dérivable en tout point. En effet la dérivée d’une fonction continue et dérivable en
tout point d’un intervalle ouvert possède une propriété importante dont jouissent
aussi les fonctions continues sur un intervalle : elles passent par tous les points
intermédiaires (§ 2.3, Théorème 2.5).
2.2 Théorème de la moyenne ou des accroissements finis

Avec la notion de dérivée, on récupère facilement la règle de Fermat de 1638.
Théorème 2.2 (Règle de Fermat). Soit f : [a, b] → R, a < b. Supposons que f

possède un maximum local au point x ∈ ]a, b[ , c’est-à-dire,
(
∃ un voisinage V (x) de x tel que V (x) ⊂ ]a, b[ et
(2.14)
∀y ∈ V (x), f (x) ≥ f (y).
Si f est dérivable en x, on a
f ′ (x) = 0. (2.15)
On obtient la même conclusion pour un minimum local.
Démonstration. Comme x est un point intérieur de [a, b], on peut choisir un δ > 0
tel que ] a, b [ ⊃ V (x) ⊃ Iδ = ] x − δ, x + δ [. On a donc
∀y ∈ Iδ , f (y) ≤ f (x).
Pour t, 0 < t < δ, on a f (x − t) ≤ f (x) ce qui entraı̂ne
f (x − t) − f (x)
≤0 ⇒ df (x; −1) ≤ 0
t
car f est dérivable en x ; de même f (x + t) ≤ f (x) entraı̂ne
f (x + t) − f (x)
≤0 ⇒ df (x; +1) ≤ 0.
t
Mais comme f est dérivable en x, on a 0 ≥ df (x; −1) = −df (x; +1) ≥ 0 et donc
f ′ (x) = df (x; +1) = 0.
Le théorème suivant est une forme généralisée du théorème de la moyenne ou

des accroissements finis impliquant deux fonctions.
Théorème 2.3. Si f et g sont deux fonctions continues sur [a, b] et dérivables sur
]a, b[ , alors il existe un point x ∈ ]a, b[ auquel
[f (b) − f (a)] g ′ (x) = [g(b) − g(a)] f ′ (x). (2.16)
Démonstration. On pose
h(t) = [f (b) − f (a)]g(t) − [g(b) − g(a)]f (t), a ≤ t ≤ b.
Alors h est continue dans [a, b], dérivable dans ] a, b [, et
h(a) = f (b)g(a) − f (a)g(b) = h(b).
Pour démontrer ce théorème, il suffit de montrer que h′ (x) = 0 pour un point

x ∈ ]a, b[ . Si h est constante ceci est vrai pour tout x ∈ ]a, b[ . Si h(t) > h(a) pour
un t ∈ ] a, b [, soit x le point de [a, b] pour lequel h atteint son maximum. Il existe
car f est continue sur l’intervalle compact [a, b]. Comme h(a) = h(b), le point x
appartient à l’intervalle ouvert ]a, b[ et h′ (x) = 0. Si h(t) < h(a) pour un t ∈ ]a, b[ ,
on répète le même raisonnement en choisissant pour x un point de [a, b] où h atteint
son minimum.
Le Théorème de la moyenne ou des accroissements finis est alors un corollaire

au théorème précédent.
Théorème 2.4 (de la moyenne). Si f est econtinue sur [a, b] et dérivable partout
dans ]a, b[ , il existe un point x ∈ ]a, b[ pour lequel
f (b) − f (a) = (b − a)f ′ (x). (2.17)
Démonstration. On prend g(x) = x dans le théorème précédent.

2.3 Propriété de la dérivée d’une fonction dérivable partout

On revient maintenant à la question soulevée dans le contexte de l’Exemple 2.2.
On sait qu’en général il n’y a pas continuité de la dérivée. On a la propriété sui-
vante connue sous le nom de Théorème des valeurs intermédiaires pour les fonctions
continues.
Théorème 2.5 (W. Rudin [1, Théorème. 5.12, p. 100]). Soit f : R → R une
fonction dérivable dans ]a0 , b0 [ .
(i) Soient a0 < a < b < b0 et λ un nombre tel que
f ′ (a) < λ < f ′ (b) (resp. f ′ (a) > λ > f ′ (b)). (2.18)
Alors il existe un point x ∈ ]a, b[ tel que f ′ (x) = λ.
(ii) La dérivée de f dans ]a0 , b0 [ ne peut avoir de discontinuités de la première
espèce.
Rappelons de la Définition 9.2 du Chapitre 4 que si une fonction f est disconti-
nue en un point x et que sa limite à droite f (x+ ) et sa limite à gauche f (x− ) existent
et ne sont pas égales, on dit que f possède une discontinuité de la première espèce.
Sinon on dit que la discontinuité de f est de la seconde espèce (voir l’Exemple 2.2).
Démonstration. On considère la fonction g(x) = f (x) − λ x. Comme f est dérivable
dans ]a0 , b0 [ , f est continue sur l’intervalle compact [a, b] et il existe un point
minimisant x ∈ [a, b] de g par rapport à [a, b]. Si a < x < b, alors, par la règle de
Fermat du Théorème 2.2, g ′ (x) = 0 et nécessairement f ′ (x) − λ = 0. On montre
maintenant que le minimum ne peut se produire en x = a ou x = b. Si x = a, alors
g(a + t) − g(a)
∀t, 0 < t ≤ b − a, g(a + t) − g(a) ≥ 0 ⇒ ≥0 ⇒ g ′ (a) ≥ 0.
t
Mais, comme g ′ (a) = f ′ (a) − λ et que f ′ (a) − λ < 0, on a une contradiction. De là
même façon, si le minimum se produit en x = b
g(b − t) − g(b)
∀t, 0 < t ≤ b − a, g(b − t) − g(b) ≥ 0 ⇒ ≥0 ⇒ −g ′ (b) ≥ 0.
t
Mais, comme g ′ (b) = f ′ (b) − λ et que f ′ (b) − λ > 0, on a une contradiction.
2.4 Théorème de Taylor

Lorsque f possède une dérivée f ′ dans un intervalle et que f ′ possède aussi
une dérivée dans le même intervalle on écrira cette seconde dérivée f (2) . De la même
façon on notera par f (n) la dérivée de f d’ordre n, n ≥ 1.
On remarque que pour que f (n) (x) existe en un point x, il est nécessaire que
(n−1)
f existe dans un voisinage de x et qu’elle soit dérivable (et donc continue) en
ce point. Puisque f (n−1) doit exister dans un voisinage de x, f (n−2) doit exister et
être dérivable dans ce voisinage et on peut ainsi remonter jusqu’à f . En particulier,
une fonction f pour laquelle f (n) existe en tout point de ] a, b [ est une fonction tel
que f et ses dérivée jusqu’à l’ordre n − 1 sont continues et dérivables dans ] a, b [.
Théorème 2.6 (Taylor 14 ). Soit f : ]a, b[ → R tel que f (n) existe dans ]a, b[ pour
un entier n ≥ 1. Étant donné x, a < x < b, on définit le polynôme de degré n − 1
n−1
X
déf f (k) (x)
Px (y) = (y − x)k , a < y < b. (2.19)
k!
k=0
Pour tout y, a < y < b, il existe θ, 0 < θ < 1, tel que

f (n) (x + θ (y − x))
f (y) = Px (y) + (y − x)n . (2.20)
n!
La formule (2.19) est valide que y soit d’un côté ou de l’autre de x.
Démonstration. Si y = x, il n’y a rien à démontrer puisque Px (x) = f (x). Si y 6= x,
la combinaison convexe x + θ (y − x), 0 ≤ θ ≤ 1, balaie l’intervalle [x, y] si x < y ou
[y, x] si x > y. On considère la fonction suivante paramétrée par M :
n−1
X
déf θk θn
g(θ) = f (x + θ(y − x)) − f (k) (x) (y − x)k − M (y − x)n ,
k! n!
k=0
pour 0 ≤ θ ≤ 1. On voit que g(0) = 0 et que

n−1
X f (k) (x) (y − x)n
g(1) = f (y) − (y − x)k − M
k! n!
k=0 (2.21)
(y − x)n
= f (y) − Px (y) − M .
n!
Comme y 6= x, on peut choisir M tel que g(1) = 0 dans (2.21).
La dérivée ℓ-ième de g, 1 ≤ ℓ ≤ n − 1, est donnée par
g (ℓ) (θ) =f (ℓ) (x + θ(y − x)) (y − x)ℓ
n−1
X θ(k−ℓ) θ(n−ℓ)
− f (k) (x) (y − x)k − M (y − x)n
(k − ℓ)! (n − ℓ)!
k=ℓ
⇒ g ′ (0) = 0, g (2) (0) = 0, ..., g (n−1) (0) = 0.

Comme la dérivée n-ième de θk , 0 ≤ k ≤ n − 1, est zéro, la dérivée n-ième de g est
h i
g (n) (θ) = f (n) (x + θ (y − x)) − M (y − x)n .
Il suffit alors de démontrer qu’il existe θn ∈ ]0, 1[ tel que g(1) = 0 = g (n) (θn ) pour
obtenir que M = f (n) (x+θn (y −x)) et, en substituant dans (2.21), la formule (2.20).
En effet, la fonction g est continue sur [0, 1] et dérivable sur [0, 1] et g(1) = g(0) = 0.
Par le Théorème 2.4, il existe θ1 ∈ ]0, 1[ tel que 0 = g(1)−g(0) = g ′ (θ1 ). De nouveau,
par le Théorème 2.4, il existe θ2 ∈ ]0, θ1 [ tel que 0 = g ′ (θ1 ) − g ′ (0) = θ1 g (2) (θ2 ) et
donc g (2) (θ2 ) = 0. Ainsi de suite jusqu’à la dernière étape : il existe θn ∈ ]0, θn−1 [ tel
que 0 = g (n−1) (θn−1 ) − g (n−1) (0) = θn−1 g (n) (θn ) et donc g (n) (θn ) = 0. Finalement,
g(1) = 0 entraı̂ne g (n) (θn ) = 0 et, comme y 6= x, M = f (n) (x + θn (y − x)).
14. Brook Taylor (1685–1731).
3 Fonctions de plusieurs variables réelles

Dans ce paragraphe, on procèdera de façon constructive ce qui ne respec-
tera pas la chronologique du dévelopement de la différentielle d’une fonction. On
y reviendra plus tard une fois que ces notions auront été introduites et que leurs
principales propriétés auront été étudiées.
Plusieurs noms reviendront dans ce contexte : Karl Weierstrass (1815–1897)
qui est selon toutes évidences le premier à avoir donné une définition correcte de la
différentielle d’une fonction de plusieurs variables, Otto Stolz (1842–1905), James
Pierpont (1866–1938) et William Henry Young (1863–1942) qui eurent des contacts
avec Weierstrass lorsqu’il donnait ses cours magistraux à Berlin, Jacques Hadamard
(1865–1963), Maurice Fréchet (1873–1973) et René Gateaux (1889–1914) ainsi que
Paul Lévy (1886–1971) qui assura la publication des travaux de Gateaux après sa
mort aux premiers moments de la première guerre mondiale (1914–1918).
3.1 Dérivée directionelle et différentielle au sens de Gateaux

3.1.1 Définitions et propriétés
Il n’y a pas de difficulté à étendre les définitions du paragraphe précédent à
des fonctions vectorielles d’un seule variable t 7→ h(t) : R → Rm , m ≥ 1. La dérivée
h′ (t) et les dérivées à droite dh(t; +1) et à gauche dh(t; −1) au point t sont définies
de la même façon, mais la convergence des quotients différentiels a lieu dans l’espace
Rm au lieu de R ou, de façon équivalente, composante par composante.
Il en va différemment d’une fonction numérique de plusieurs variables f : Rn →
m
R . À première vue, il semblerait naturel de se ramener à une fonction d’une seule
variable réelle de la façon suivante, À partir d’un point x ∈ Rn et d’une direction 15
v ∈ Rn , on peut considérer la nouvelle fonction numérique de la variable réelle t
déf
t 7→ g(t) = f (x + tv) : R → Rm (3.1)
et on se retrouve dans le cadre et les conditions du paragraphe 2. Les notions sui-

vantes pour des fonctionnelles, c’est-à-dire, des fonctions de fonctions plutôt que des
fonctions d’un nombre fini de variables, auraient été inspirées à René Gateaux 16 lors
de son passage chez V. Volterra 17 aux premiers moments du Calcul des variations.
15. On entend souvent par direction un vecteur v ∈ Rn de longueur un. Le terme direction
est utilisé ici dans un sens plus large. Il s’agit d’un vecteur v de Rn et v peut prendre la valeur 0.
16. René Eugène Gateaux (1889–1914). Dans son acte de naissance ainsi que dans ses textes,
lettres et ses publications avant sa mort (R. Gateaux [1, 2, 3, 4, 5]) son nom est orthographié
sans accent circonflexe (cf. L. Mazilak [1], M. Barbut, B. Locker, L. Mazilak et P. Priou-
ret [1], L. Mazilak et R. Tazzioli [1]). L’accent circonflexe est apparu dans ses trois publications
posthumes de 1919 à 1922 au Bulletin de la Société Mathématique de France probablement par
homonymie avec les gâteaux (pâtisserie) (cf. L. Mazilak ]2]). On a retrouvé dans les papiers de
Gateaux des notes qui furent confiées à Jacques Hadamard. Elles furent examinées par Paul Lévy
qui prêta son concours à leur publication dans le Bulletin de la Société Mathématique de France
(cf. R. Gateaux [6, 7, 8]). Ses travaux sur le Calcul fonctionnel méritèrent à Gateaux le prix
Francœur de l’Académie des Sciences en 1916. Paul Lévy (1886–1971) fit connaı̂tre les travaux de
Gateaux dans ses Leçons d’analyse fonctionnelle (1922).
17. Vito Volterra (1860–1940).
3. Fonctions de plusieurs variables réelles 209
Définition 3.1.
Soient f : Rn → Rm , x un point de Rn et v ∈ Rn une direction.
(i) f est dérivable au point x dans la direction v si la limite suivante existe
f (x + tv) − f (x)
lim . (3.2)
t→0 t
Lorsque la limite (3.2) existe, on la désignera par f ′ (x; v). Par définition
f ′ (x; 0) = 0 et on a l’homogénéité
∀α ∈ R, f ′ (x; αv) existe et f ′ (x; αv) = α f ′ (x; v).
(ii) f est directionnellement dérivable en x si f ′ (x; v) existe pour tout v ∈ Rn .

(iii) f est différentiable au sens de Gateaux au point x si f est directionnelle-
ment dérivable en x et que l’application
déf
v 7→ Df (x)v = f ′ (x; v) : Rn → Rm (3.3)
est linéaire. On dira aussi que f est Gateaux différentiable en x et on

appellera Df (x) l’application jacobienne 18 .
Remarque 3.1.
Attention. Dans plusieurs ouvrages on dit que f est Gateaux différentiable si elle
possède une dérivée directionnelle dans toutes les directions v. On retrouve effecti-
vement cette notion dans les articles posthumes de Gateaux. 19 Dans nos notes, ce
terme est réservé à la notion (iii) plus forte où nous imposons en plus la linéarité
par rapport à v.
3.1.2 Opérations algébriques et premiers exemples

On obtient les dérivées directionnelles de fonctions plus complexes à partir de
celles de fonctions simples. C’est la base de tout calcul différentiel. Il est facile de
vérifier les propriétés suivantes.
Théorème 3.1. Soient x ∈ Rn un point et v ∈ Rn une direction.
(i) Soient f, g : Rn → Rm tel que f ′ (x; v) et g ′ (x; v) existent. Alors
(f + g)′ (x; v) = f ′ (x; v) + g ′ (x; v), ∀α ∈ R, (αf )′ (x; v) = αf ′ (x; v), (3.4)
(f · g)′ (x; v) = f ′ (x; v) · g(x) + f (x) · g ′ (x; v), (3.5)
18. Carl Jacobi (1804–1851) frère du physicien Moritz Hermann von Jacobi. Il établit la théorie
des déterminants fonctionnels, appelés depuis jacobiens.
19. ≪. . .Nous allons emprunter au Calcul fonctionnel la notion de variation, qui nous rendra les
services que
h rend la différentielle
i totale dans la théorie des fonctions d’un nombre fini de variables.
d
δF (x) = dλ F (x + λ δx) (cf. R. Gateaux [7, page 83]). . . .≫
λ=0 h i
≪. . .Considérons U (z + λ t1 ). Supposons que
d
dλ
U (z + λ t1 ) existe quel que soit t1 . On
λ=0
l’appelle la variation première de U au point z : δU (z, t1 ). C’est une fonction de z et t1 , qu’on
suppose habituellement linéaire, en chaque point z par rapport à t1 . . . .(cf. R. Gateaux [6, page
11]).. . .≫
en définissant ponctuellement les opérations sur les fonctions

déf déf
∀x ∈ Rn , ∀α ∈ R, (f + g)(x) = f (x) + g(x), (αf )(x) = αf (x), (3.6)
déf
(f · g)(x) = f (x) · g(x), ∀x ∈ Rn . (3.7)
(ii) Soient f, g : Rn → R tel que f ′ (x; v) et g ′ (x; v) existent. Alors

(f g)′ (x; v) = f ′ (x; v) g(x) + f (x) g ′ (x; v) (3.8)
′ ′
f (x; v) g(x) − f (x) g (x; v)
(f /g)′ (x; v) = , g(x) 6= 0, (3.9)
g(x)2
en définissant ponctuellement les opérations sur les fonctions :
déf déf f (x)
∀x ∈ Rn , (f g)(x) = f (x) g(x), (f /g)(x) = , g(x) 6= 0. (3.10)
g(x)
Corollaire 1. Si, en plus des hypothèses du Théorème 3.1, les fonctions sont Ga-
teaux différentiables en x, alors
D(f + g)(x) = Df (x) + Dg(x), ∀α ∈ R, D(αf )(x) = αDf (x) (3.11)
⊤ ⊤
D(f · g)(x) = Df (x) g(x) + Dg(x) f (x) (3.12)
D(f g)(x) = Df (x) g(x) + f (x) Dg(x) (3.13)
Df (x) g(x) − f (x) Dg(x)
D(f /g)(x) = , g(x) 6= 0, (3.14)
g(x)2
où Df (x)⊤ : Rm → Rn et Dg(x)⊤ : Rm → Rn sont les applications linéaires
(matrices) transposées de Df (x) : Rn → Rm et Dg(x) : Rn → Rm .
Exemple 3.1.
Soit la fonction x 7→ fi (x) = xi : Rn → R, 1 ≤ i ≤ n. Alors, pour t 6= 0 et v ∈ Rn
fi (x + tv) − fi (x) (x + tv)i − xi
= = vi
t t
et l’application v 7→ fi′ (x; v) = vi : Rn → R est linéaire. La fonction fi est donc
Gateaux différentiable en tout point x ∈ Rn .
À partir de ce résultat, on peut considérer la fonction x 7→ fi2 (x) = |xi |2 :
n
R → R, 1 ≤ i ≤ n. Comme |xi |2 = xi xi = fi (x) fi (x), il vient de la partie (ii) du
théorème :
∀v ∈ Rn , (fi2 )′ (x; v) = 2 xi vi
et l’application v 7→ (fi2 )′ 2(x; v) = 2 xi vi : Rn → R est linéaire. La fonction fi2 est
donc Gateaux différentiable en tout point x ∈ Rn . P
n
Pour le carré de la norme x 7→ g(x) = kxk2 = i=1 |xi |2 : Rn → R, il vient de
la partie (ii) du théorème :
n
X
∀v ∈ Rn , g(x; v) = 2 xi vi = 2 x · v.
i=1
Maintenant, si l’on considère la fonction x 7→ gi (x) = |xi | : Rn → R, 1 ≤ i ≤ n.

Alors, pour t 6= 0 et v ∈ Rn
gi (x + tv) − gi (x) |(x + tv)i | − |xi | |xi + tvi | − |xi |
= = .
t t t
6 0, alors
Si xi =
gi (x + tv) − gi (x) |xi + tvi |2 − |xi |2 1 1 xi
= → 2 xi vi = vi
t t |xi + tvi | + |xi | 2 |xi | |xi |
et l’application v 7→ gi (x; v) = (xi /|xi |) vi : Rn → R est linéaire. La fonction gi est
donc Gateaux différentiable en tout point x ∈ Rn tel que xi 6= 0.
Cependant si xi = 0, alors le quotient différentiel
gi (x + tv) − gi (x) |xi + tvi | − |xi | |0 + tvi | − |0| |t|
= = = |vi |
t t t t
ne converge pas lorsque t tend vers 0. La fonction gi n’est pas directionnellement
différentiable aux points x ∈ Rn tel que xi = 0.
Le second exemple est celui d’une fonction continue et dérivable dans toutes
les directions mais pas Gateaux différentiable.
Exemple 3.2.
Soit la fonction

 x31
, si (x1 , x2 ) 6= (0, 0)
f (x1 , x2 ) = x21 + x22

0, si (x1 , x2 ) = (0, 0).
Pour x = (x1 , x2 ) 6= (0, 0), la fonction f est continue et Gateaux dérivable en x dans
toutes les directions v car elle est le quotient de deux polynômes et le dénominateur
est différent de zéro. Il suffit d’appliquer les règles du Théorèm 3.1.
On voit que f est continue en (0, 0) :
x31 x21
= |x1 | ≤ |x1 | ≤ kxk → 0 lorsque x = (x1 , x2 ) → (0, 0).
x21 + x22 x21 + x22
Pour la dérivée directionnelle en (0, 0), soient v = (v1 , v2 ) et t 6= 0. Par définition,
 

 1 (tv1 )3 
f (0 + tv) − f (0) 2 + (tv )2
, si (v1 , v2 ) 6= (0, 0)
= t (tv1 ) 2
t 
 0, 
si (v1 , v2 ) = (0, 0)
 

 (v1 )3 
2 2
, si (v1 , v2 ) 6= (0, 0)
= (v1 ) + (v2 ) = f (v1 , v2 )

 0, 

si (v1 , v2 ) = (0, 0)
et donc
∀v ∈ R2 , f ′ (0, 0; v1 , v2 ) = f (v1 , v2 ).
On voit que f n’est pas Gateaux différentiable car v 7→ f ′ (0; v) n’est pas linéaire.
2.5
z
4
0
-2.5
2
-5
0
y 4
2
-2
0
x
-2
-4
-4
Figure 6.2. Exemples 3.2 et 3.10.
3.1.3 Gateaux différentiabilité n’entraı̂ne pas continuité
L’exemple 3.2 est celui d’une fonction continue et dérivable dans toutes les
directions mais pas Gateaux différentiable.
Le second exemple est très riche et important. On le retrouvera plus tard. C’est
celui d’une fonction Gateaux différentiable en (0, 0) mais pas continue en (0, 0). En
comparant avec le premier exemple, on constate que ce n’est donc pas la linéarité
qui entraı̂ne la continuité de la fonction.
Exemple 3.3 (Figure 6.3).

On montre que la fonction f : R2 → R définie par

x6
déf , si (x, y) 6= (0, 0)
f (x, y) = (y − x2 )2 + x8

0, si (x, y) = (0, 0)
est Gateaux différentiable en x = (0, 0), mais elle n’est pas continue en (0, 0).
La fonction f est continue et dérivable en x = (x1 , x2 ) 6= (0, 0) dans toutes
les directions v car elle est le quotient de deux polynômes dont le dénominateur est
différent de zéro. Il suffit d’appliquer les règles du Théorèm 3.1.
On voit que f est discontinue en x = (0, 0) en approchant de (0, 0) par le
10
10
8
10
6
10
4
10
2
10 0
0.2
0 0.4
10
1 0.8 0.6
0.6 0.4 0.2 0 0.8
! 0.2 ! 0.4 ! 0.6 ! 0.8 1
!1
Figure 6.3. Exemple 3.3 (échelle logarithmique)
chemin (α, α2 ) lorsque α tend vers 0 :
α6 1
|f (α, α2 ) − f (0, 0)| = = 2 → +∞ lorsque α → 0.
α8 α
On calcule d’abord la dérivée directionnelle de f en (0, 0). Pour v = (v1 , v2 ) 6=
(0, 0), on considère deux cas : v2 = 0 et v2 6= 0. Si v2 = 0 et v1 6= 0 pour t 6= 0
f (tv1 , 0) − f (0, 0) 1 (tv1 )6 1 (tv1 )6

= 2 2 8
=
t t (0 − (tv1 ) ) + (tv1 ) t (tv1 )4 + (tv1 )8
v12
=t
1 + (tv1 )4
et lorsque t tend vers 0

f ′ ((0, 0); (v1 , v2 )) = 0.
Si 2 6= 0 pour t 6= 0
f (tv1 , tv2 ) − f (0, 0) 1 (tv1 )6 v16

= = t3
t 2 2
t (tv2 − (tv1 ) ) + (tv1 )8 (v2 − tv12 )2 + t6 v18
et lorsque t tend vers 0
f ′ ((0, 0); (v1 , v2 )) = 0 si v2 6= 0.
Donc
∀v = (v1 , v2 ) ∈ R2 , f ′ ((0, 0); (v1 , v2 )) = 0,

l’application (v1 , v2 ) 7→ f ′ ((0, 0); (v1 , v2 )) : R2 → R est linéaire, et f est différentia-

ble au sens de Gateaux.
Avec la différentielle de Gateaux, on perd donc la notion intuitive en dimension
un qu’une fonction différentiable en un point est continue en ce point.
3.1.4 Dérivées partielles, gradient, application et matrice jacobiennes

On introduit maintenant la notion de dérivée partielle comme cas particulier
de la dérivée directionnelle.
Définition 3.2.
Soient f : Rn → R et {ei : 1 ≤ i ≤ n}, (ei )j = δij , la base canonique orthonormale
de Rn . La fonction f possède des dérivées partielles en x si pour chaque i, f est
dérivable en x dans la direction ei , c’est-à-dire,
f (x + t ei ) − f (x)
∀i, 1 ≤ i ≤ n, lim existe.
t→0 t
On écrira la limite ∂i f (x) ou ∂f /∂xi (x). Par définition ∂i f (x) = f ′ (x; ei ) et la
fonction α 7→ f ′ (x; α ei ) : R → R est homogène.
′ n
Lorsque f est Gateaux différentiable en x, Pnl’application v 7→ f (x; v) : R → R
est linéaire. Donc, comme v = (v1 , . . . , vn ) = i=1 vi ei , par linéarité
X n Xn
′ ′
f (x; v) = f x; vi ei = vi f ′ (x; ei ) = g(x) · v,
i=1 i=1
en introduisant le vecteur
n
X
déf
g(x) = f ′ (x; ei ) ei ∈ Rn .
i=1
Ce vecteur est unique. En effet, s’il existe deux vecteurs g1 et g2 dans Rn tel que
∀v ∈ Rn , g1 · v = f ′ (x; v) = g2 · v,
alors pour tout v ∈ Rn on a (g1 − g2 ) · v = 0 et donc g1 = g2 .
Définition 3.3.
Soit une fonction f : Rn → R Gateaux différentiable en x ∈ Rn . On appelera
gradient de f en x l’unique vecteur ∇f (x) de Rn tel que
∀v ∈ Rn , ∇f (x) · v = f ′ (x; v). (3.15)
En particulier,
n
X
∇f (x) = ∂i f (x) ei ,
i=1
où ∂i f (x) = f ′ (x; ei ) est la dérivée partielle de f en x dans la direction ei .

Remarque 3.2.
On a aussi Df (x)v = f ′ (x; v) = ∇(x) · v. L’application jacobienne Df (x) est
équivalente à une matrice 1 × n ou vecteur ligne et la direction v à un vecteur
colonne n × 1.
L’exemple suivant montre que, même si les dérivées partielles existent, le gra-
dient peut ne pas exister et, a fortiori, la dérivée directionnelle f ′ (x; v) peut ne pas
exister dans certaines directions v.
Exemple 3.4 (Figure 6.4).

Soit la fonction f : R2 → R :
(
(xy)1/3 , si xy ≥ 0
f (x, y) =
−|xy|1/3 , si xy < 0.
Elle est clairement continue.
z
-4
0
-2
-2
0
4 y
2
2
0
x
-2
4
-4
Figure 6.4. Exemple 3.4.
On calcule la dérivée directionnelle en (0, 0) dans la direction v = (v1 , v2 ) 6=

(0, 0). Pour v1 v2 ≥ 0 et t 6= 0,
f (0 + tv) − f (0) (tv1 tv2 )1/3 |t|2/3 |t| 1

= = (v1 v2 )1/3 = (v1 v2 )1/3 ,
t t t t |t|1/3
puis pour v1 v2 < 0,
f (0 + tv) − f (0) |tv1 tv2 |1/3 |t|2/3 |t| 1

=− =− |v1 v2 |1/3 = − |v1 v2 |1/3 .
t t t t |t|1/3
On voit que ces quotients convergent si et seulement si v1 v2 = 0. Donc
f ′ ((0, 0); (v1 , v2 )) = 0 si v1 v2 = 0
et n’existe pas pour v1 v2 6= 0. Sous la condition v1 v2 = 0, on a plus
f (0 + tv) − f (0)
f ′ (0, v) = lim = 0.
t→0 t
En particulier, si l’on prend comme base orthonormale e1 = (1, 0) et e2 = (0, 1)
de R2 , on a les dérivées partielles
∂f ∂f
(0, 0) = f ′ ((0, 0); e1 ) = 0 et (0, 0) = f ′ ((0, 0); e2 ) = 0.
∂x1 ∂x2
L’exemple montre que pour une direction (v1 , v2 ), v1 v2 6= 0 la dérivée f ′ ((0, 0); v1 , v2 )
n’existe pas et n’est donc pas égale au produit scalaire

∂f ∂f
(0, 0), (0, 0) · (v1 v2 ) = 0.
∂x1 ∂x2
Dans le cas d’une fonction à valeurs vectorielles, on introduit les dérivées

partielles de chaque composante fi de la fonction f : Rn → Rm .
Définition 3.4.
Soient {enj : j = 1, . . . , n} et {em
i : i = 1, . . . , m} les bases canoniques orthonormales
respectives dans Rn et Rm , respectivement. Si f : Rn → Rm est Gateaux différen-
tiable en x, on peut associer à l’application (linéaire) jacobienne Df (x) : Rn → Rm
la matrice jacobienne m × n.
déf
Df (x)ij = em n
i · df (x; ej ) = ∂j fi (x), 1 ≤ i ≤ m, 1 ≤ j ≤ n.
Lorsque m = n, la valeur absolue du déterminant de la matrice Df (x) est appelée

jacobien de f en x.
3.2 Approche géométrique à la différentielle

La principale lacune de la différentielle de Gateaux est que, en général, elle
n’entraı̂ne pas la continuité de la fonction. On verra aussi plus tard que la différentielle
de la composition de deux fonctions Gateaux différentiables peut ne pas exister et
que l’on perd aussi la règle de composition des dérivées du calcul différentiel clas-
sique.
La notion de différentielle dans la littérature est en fait plus ancienne et plus

forte que celle de Gateaux. Par exemple, pour une fonction f (x, y) de deux va-
riables, on fait le raisonnement suivant sur l’incrément ou la variation ∆f (x, y) de
la fonction f à partir des variations ∆x et ∆y des variables x et y
∆f (x, y) ∆f (x, y)
∆f (x, y) = ∆x + ∆y.
∆x ∆y
En supposant que, lorsque ∆x et ∆y tendent vers zéro, les quotients
∆f (x, y) ∂f ∆f (x, y) ∂f
→ (x, y) et → (x, y)
∆x ∂x ∆y ∂y
convergent dans R, on écrit formellement la différentielle
∂f ∂f
df (x, y) = (x, y) dx + (x, y) dy (3.16)
∂x ∂y
ce qui sous-tend la notion de dérivée partielle dans les directions des axes des x et
des y.
Mais que signifie (3.16) pour des dx et des dy nuls à la limite ? Pour J. Ha-
damard 20 [2] en 1923, cette expression n’est qu’un symbole d’opérations :
≪Que signifie l’égalité (3.16) ? Que si x, y et dès lors g = f (x, y) sont
exprimés en fonction d’une variable auxiliaire quelconque t, on a, quelles

que soient ces expressions,
dg dg dx dg dy
= + . (3.17)
dt dx dt dy dt
Tel est le sens unique de l’égalité (3.16). L’égalité (3.17) ayant lieu
quelle que soit la variable indépendante en fonction de laquelle les deux
autres variables sont exprimées, on supprime la mention de t. L’avantage
précieux de la notation différentielle consiste précisément en la possibi-
lité de ne pas préciser quelle est la variable que l’on considère comme
indépendante.≫
Cette citation donne un sens précis à la notion de différentielle. En effet, si l’on
considère la fonction vectorielle
déf
t 7→ h(t) = (x(t), y(t)) : R → R2 (3.18)
de la variable auxiliaire réelle t, la fonction g est la composition de f et de h

déf
t 7→ g(t) = f (h(t)) = f (x(t), y(t)) : R → R .
La fonction vectorielle h(t) = (x(t), y(t)) définit un chemin ou une trajectoire dans
R2 en fonction de t. Pour obtenir la différentielle au point (x, y), on peut, sans perte
20. Jacques-Salomon Hadamard (1865–1963). Il obtint d’importants résultats sur les équations
aux dérivées partielles du domaine de la physique mathématique. Il fut aussi l’un des collaborateurs
à l’élaboration de la théorie moderne de l’analyse fonctionnelle.
de généralité, prendre h(0) = (x, y). On obtient ainsi un chemin (x(t), y(t)) dans
R2 qui passe par le point (x(0), y(0)) = (x, y) avec comme tangente (x′ (0), y ′ (0))
en ce point. La différentielle en (x, y) existe lorsque l’on peut trouver une fonction
linéaire 21 L(x, y) : R2 → R tel que g ′ (0) = L(x, y)(h′ (0)) pour tout chemin h qui
passe par (x, y). La fonction L(x, y) dépend de (x, y), mais est indépendante du
choix du chemin h. C’est ce que l’on appellera le point de vue géométrique. Il se
généralise immédiatement à des fonctions définies sur des variétés en choisissant des
chemins contenus dans celles-ci dont la tangente est tangente à la variété.
Il faut retenir de la citation de Hadamard au moins deux choses :
(a) l’identité (3.17) doit être vérifiée pour tous les chemins h(t) = (x(t), y(t))
et pas seulement le long de droites ;
(b) la différentielle doit être linéaire par rapport au vecteur tangent h′ (0) =
(x′ (0), y ′ (0)).
Enfin, en choisissant le chemin h(t) = (x + tv, y + tw) pour lequel h′ (0) = (v, w),
la différentielle au sens de Hadamard entraı̂ne l’existence de la différentielle au sens
de Gateaux.
La fonction de l’exemple suivant satisfait les points (a) et (b).
Exemple 3.5.
Soit la fonction f (x, y) = x2 + 2 y 2 . On vérifie facilement que
′
dg 2x x (0)
(0) = 2x x′ (0) + 4y y ′ (0) = · ′
dt 4y y (0)
pour tout chemin h(t) = (x(t), y(t)) donné par (3.18) satisfaisant h(0) = (x, y).
Il existe cependant des fonctions pour lesquelles il n’y a pas linéarité comme le
montre l’Exemple 3.2.
Exemple 3.6 (Exemple 3.2).

Soit la fonction
déf x3 déf
f (x, y) = , si (x, y) 6= (0, 0), f (0, 0) = 0. (3.19)
x2 + y 2
On a montré que la fonction f est continue en tout point de R2 .

Pour la différentielle, on considère le quotient suivant pour t 6= 0 et un chemin
21. Rappel. La fonction L(x, y) : R2 → R est linéaire par rapport au couple (v, w) si pour
tout α, β ∈ R et pour tout (v1 , w1 ), (v2 , w2 ) ∈ R2 ,
L(αv1 + βv2 , αw1 + βw2 ) = α L(v1 , w1 ) + β L(v2 , w2 ).

h(t) = (x(t), y(t)) passant par h(0) = (0, 0)

 

 1 x(t)3 
f (h(t)) − f (h(0)) , si (x(t), y(t)) 6= (0, 0)
= t x(t)2 + y(t)2
t 
 0, 
si (x(t), y(t)) = (0, 0)
 h i3 


x(t)−x(0) 


 t x(t) − x(0) y(t) − y(0) 


 h i 2 h i 2 , si , 6
= (0, 0)

x(t)−x(0) y(t)−y(0) t t
= t + t

 


 x(t) − x(0) y(t) − y(0) 


 0, si , = (0, 0)

t t

x(t) − x(0) y(t) − y(0)
=f ,
t t
 

 x′ (0)3 
, si (x (0), y (0)) 6= (0, 0)
′ ′
→ f (x′ (0), y ′ (0)) = x′ (0)2 + y ′ (0)2

 0, 
si (x′ (0), y ′ (0)) = (0, 0)
par continuité de f . On a donc pour tout chemin h de la forme (3.18) satisfaisant
h(0) = (0, 0)


 x′ (0)3
dg , si (x′ (0), y ′ (0)) 6= (0, 0),
(0) = x (0)2 + y ′ (0)2
′
dt 
 0, si (x′ (0), y ′ (0)) = (0, 0).
On voit qu’il n’y a pas linéarité par rapport à la direction (v, w). Ceci malgré le fait
que les dérivées partielles
∂f ∂f
(0, 0) = 1 et (0, 0) = 0
∂x ∂y
existent. On se serait attendu à obtenir l’identité (3.17)
     
∂f dx ∂f  
 (0, 0)  (0)   (0, 0) v
dg  ∂x   dt   ∂x    1 v v3
(0) =  · = · = · = v 6= 2
dt  ∂f   dy   ∂f  0 w v + w2
(0, 0) (0, 0) w
(0)
∂y dt ∂y
si w 6= 0 et v 6= 0. La linéarité n’est donc pas une conséquence du fait qu’il existe
une fonction G(x, y) : R2 → R tel que g ′ (0) = G(x, y)(h′ (0)) pour tout chemin h qui
passe par (x, y). Il faut l’imposer. Ce qui restreint la famille des fonctions f pour
lesquelles la différentielle G(x, y) existe.
Si l’on se limite à des chemins le long de droites passant par (x, y), on retrouve
la notion plus faible de dérivée directionnelle dans la direction (v, w) en (x, y) qui
s’obtient en posant
déf
t 7→ h(t) = (x + tv, y + tw) : R → R2 , h(0) = (x, y), h′ (0) = (v, w), (3.20)
ce qui donne t 7→ g(t) = f (h(t)) = f (x + tv, y + tw) : R → R qu’il suffit de dériver

par rapport à t en t = 0 puisque l’on a une fonction numérique d’une seule variable.
Lorsque f est Gateaux différentiable, l’équation (3.17) devient alors
 
∂f
 ∂x (h(0))
dg d(f ◦ h) ∂f ∂f   v
(0) = (0) = (h(0)) v + (h(0)) w =  · .
dt dt ∂x ∂y  ∂f  w
| {z } (h(0))
L(h(0)) (v,w) ∂y
Malheureusement, il ne sera pas suffisant de se limiter à des chemins le long de

droites passant par (x, y) et on verra plus loin l’exemple d’une fonction (Exemple
3.9) pour laquelle l’identité (3.17) est vérifée le long de droites mais pas le long de
tous les chemins.
Ces exemples illustrent bien que, lorsque que l’on travaille avec la notion de
différentielle en dimension supérieure à un, on n’obtient pas toujours l’équivalent
de la dérivée en dimension un et du gradient en dimension supérieure à un. Il est
d’usage de dire que la fonction du second exemple n’est pas différentiable en (x, y),
malgré qu’il existe une différentielle quel que soit le chemin menant au point (x, y).
Il va donc falloir revoir avec soin la notion de différentielle et déterminer jusqu’à
quel point elle peut être relaxée tout en préservant les éléments de base d’un bon
calcul différentiel.
3.3 Dérivée directionnelle et différentielle au sens de Hadamard

3.3.1 Formulation équivalente à l’approche de Hadamard
On formalise maintenant l’approche de Hadamard et on en donne une formu-
lation équivalente que l’on pourra plus facilement comparer aux notions de Gateaux
de la Définition 3.1.
Théorème 3.2. Soient f : Rn → Rm et x ∈ Rn . Les conditions suivantes sont

équivalentes :
(a) il existe une application g(x) : Rn → Rm tel que pour toute fonction h :
R → Rn pour laquelle h(0) = x et h′ (0) existent, (f ◦ h)′ (0) existe et
(f ◦ h)′ (0) = g(x)(h′ (0)); (3.21)
(b) il existe une application g(x) : Rn → Rm tel que pour tout v ∈ Rn et toute
suite (tn , wn ) → (0, v), tn 6= 0,
f (x + tn wn ) − f (x)
lim = g(x)(v). (3.22)
n→∞ tn
Remarque 3.3.
(i) Bien que l’on ait parlé de chemin ou de trajectoire, l’application h n’a pas besoin
d’être continue ou dérivable pour t 6= 0. Seul son comportement en t = 0 compte.
(ii) Par définition, l’application g(x) est homogène,

∀α ∈ R, g(x)(α v) = α g(x)(v),
mais pas nécessairement linéaire.
On a immédiatement le corollaire suivant.

Corollaire 1. Soient f : Rn → Rm et x ∈ Rn . Les conditions suivantes sont
équivalentes :
(a) il existe une application linéaire L(x) : Rn → Rm tel que pour toute fonc-
tion h : R → Rn pour laquelle h(0) = x et h′ (0) existent, alors (f ◦ h)′ (0)
existe et
(f ◦ h)′ (0) = L(x) h′ (0); (3.23)
(b) il existe une application linéaire L(x) : Rn → Rm tel que pour tout v ∈ Rn
et toute suite (tn , wn ) → (0, v), tn 6= 0,
f (x + tn wn ) − f (x)
lim = L(x) v. (3.24)
n→∞ tn
Démonstration du Théorème 3.2. (b) ⇒ (a). Soit h une fonction telle que h(0) = x
et h′ (0) existe. Alors pour toute suite {tn 6= 0} tendant vers 0 on a
déf h(tn ) − h(0)
wn = → h′ (0), ⇒ h(tn ) = x + tn wn .
tn
Comme la limite existe et est égale à g(x)(h′ (0)), on a pour toute suite {tn 6= 0}
tendant vers 0,
f (h(tn )) − f (h(0)) f (x + tn wn ) − f (x)
= → g(x)(h′ (0))
tn tn
et (f ◦ h)′ (0) = g(x)(h′ (0)).
(a) ⇒ (b). On voit immédiatement que f est directionnellement dérivable. En
effet, pour v ∈ Rn , on prend la fonction h(t) = x + tv qui vérifie bien h(0) = x et
h′ (0) = v et pour laquelle on a de la propriété (3.23) (f ◦ h)′ (0) = g(x)(h′ (0)) =
g(x)(v). Par définition de la dérivée (f ◦ h)′ (0) en t = 0, pour toute suite {tn },
tn 6= 0, tn → 0, on a
f (x + tn v) − f (x) f (h(tn )) − f (h(0))
= → (f ◦ h)′ (0) = g(x)(h′ (0))
tn tn
⇒ f ′ (x; v) = g(x)(v).
Pour obtenir plus, on procède par l’absurde. L’objectif est de construire une
fonction h qui donnera une contradiction. Supposons qu’il existe v et une suite
(tn , wn ) → (0, v), tn 6= 0, tel que la suite des quotients différentiels
déf f (x + tn wn ) − f (x)
qn =
tn
ne converge pas vers g(x)(v). Alors, il existe η > 0 tel que, pour tout k ≥ 1, il existe
nk ≥ k tel que |qnk − g(x)(v)| ≥ η. Pour simplifier la notation, on désignera par
(tn , wn ) la sous-suite (tnk , wnk ). On peut partitionner cette dernière suite en deux
suites :
{(t+ + − −
nk , wnk ) : tnk > 0} et {(tnk′ , wnk′ ) : tnk′ < 0}.
L’une d’entre elle contient un nombre infini d’éléments. Supposons, sans perte de
généralité que ce soit {(t+ +
nk , wnk ) : tnk > 0}. Encore pour simplifier la notation, on
écrira cette nouvelle sous-suite {(tn , wn )}. Elle jouit donc de la propriété :
∃η > 0 tel que ∀n ≥ 1, |qn − g(x)(v)| ≥ η.
On construit la nouvelle sous-suite (tnk , wnk ) suivante. Soit n1 le premier
n ≥ 1 tel que tn ≤ 1. Soit n2 le premier n > n1 tel que tn ≤ tn1 /2. À l’étape
k + 1, soit nk+1 le premier n > nk tel que tn ≤ tnk /2. Par construction, nk >
nk+1 and tnk+1 ≤ tnk /2 < tnk . La sous-suite {(tnk , xnk )} est telle que {tnk } soit
monotone strictement décroissante vers 0 et wnk → v. On peut donc supposer, sans
perte de généralité, que, pour la suite initiale {(tn , wn )}, la suite {tn } est monotone
strictement décroissante. Comme wn converge vers v, il existe une constante c tel
que kwn k ≤ c pour tout n et pour tout ε > 0, il existe N tel que
∀n > N, kwn − vk < ε et tn < ε/c.
On introduit maintenant la fonction h : R → Rn :

 x + tv,
 si t ≤ 0
déf
h(t) = x + t wn , si tn ≤ t < tn−1 , n ≥ 2,


x + tw1 , si t1 ≤ t
La fonction vectorielle h est continue en t = 0. En effet, elle est continue à gauche
puisque h(t) = x + tv → x = h(0) lorsque t < 0 tend vers 0. À droite pour
δ = tN +1 > 0 et 0 < t < δ, il existe n > N + 1 tel que tn ≤ t < tn−1 et donc
kh(t) − h(0)k = t kwn k ≤ tn−1 kwn k < tN +1 c < (ε/c) c = ε
et h est continue à droite en 0.
Pour la dérivée à droite, pour δ = tN +1 > 0 et 0 < t < δ, il existe n > N + 1
tel que tn ≤ t < tn−1 et
h(t) − h(0)
− v = kwn − vk < ε
t
et dh(0; +1) = v. Pour la dérivée à gauche on a trivialement dh(0; −1) = −v,
−dh(0; −1) = v = dh(0; +1) et en fait la dérivée existe et h′ (0) = v. Mais, par
hypothèse, pour une telle fonction h, on a l’existence de (f ◦ h)′ (0) et donc de
d(f ◦h)(0; +1) qui est égale à g(x)(v). En particulier, par construction de la fonction
h,
f (x + tn wn ) − f (x) f (h(tn )) − f (h(0))
qn = = → d(f ◦ h)(0; +1) = g(x)(v).
tn tn
Ceci contredit notre hypothèse initiale que qn 6→ g(x)(v).
On lit dans le résumé de l’article intitulé Sur la notion de différentielle de

M. Fréchet [5] en 1937
L’auteur montre que la différentielle totale de Stolz-Young 22 est
équivalente à la definition due à Hadamard (Corollaire au Theorem 3.2).
Par contre, quand on étend cette dernière aux fonctionnelles elle devient
plus générale que celle de l’auteur . . .
car elle s’applique à des espaces de fonctions (de dimension infinie) sans norme ou
même sans métrique. Dans le même article où apparaı̂t la citation, M. Fréchet [5,
p. 239] propose la definition suivante.
Définition 3.5 (Notion proposée par Fréchet en 1937).

La fonction f : Rn → Rm est différentiable au point x ∈ Rn s’il existe une fonction
g(x) : Rn → Rm telle que pour toute application h : R → Rn pour laquelle h(0) = x
et h′ (0) existent, on a
(f ◦ h)′ (0) = g(x)(h′ (0)) (3.25)
(c’est la condition (a) du Théorème 3.2).
Nous verrons que ces fonctions retiennent deux propriétés importantes des fonctions
Hadamard différentiables : elles sont continues en x (Théorème 3.3) et la règle de
dérivation en chaı̂ne des fonctions composées demeure valide (Théorème 3.5).
Malheureusement, cédant à la critique, il ne pousse pas cette nouvelle notion
plus loin.
Mais comme l’a fait observer M. Paul Lévy, une telle définition n’est
pas suffisante, car une fonction différentiable à ce sens peut perdre d’im-
portantes propriétés de la différentielle des fonctions simples et en par-
ticulier la propriété (3) (la linéarité !). Tel est, par exemple, le cas pour
la fonction
s
x2
f (x, y) = x pour (x, y) 6= (0, 0) avec f (0, 0) = 0. (3.26)
x + y2
2
(M. Fréchet [5, p. 239]).

En effet, on peut vérifier que
g((0, 0); (v, w)) = f (v, w)
et que g((0, 0) n’est pas linéaire en (v, w). Loin de discréditer la nouvelle notion, cet
exemple montre qu’il existe de telles fonctions.
3.3.2 Définitions
Les équivalences du Théorème 3.2 et de son corollaire offrent le choix entre
deux définitions de la différentielle et de la dérivée directionnelle au sens de Hada-
mard : la condition (a) qui fait appel à des chemins et la (b) à des suites.
22. Voir la Remarque 3.9 à la page 233.
Remarque 3.4.
Ces définitions pour Rn sont en fait beaucoup plus générales qu’il n’en paraı̂t.
Par exemple, la fonction pourrait être définie sur un sous-ensemble M de l’espace
vectoriel Rn muni d’un espace tangent de la forme
 
 ∃ 0 6= tn → 0 et M ∋ xn → x
déf
T x M = v ∈ Rn : xn − x
 tel que v = lim 
n→∞ tn
ce qui donne un sens aux suites xn = x + tn wn ∈ M . La différentielle d’une fonction
f : M → R serait alors une application g(x) : Tx M → R. Si l’espace tangent Tx M
est un sous-espace linéaire de Rn , on peut imposer que g(x) soit linéaire auquel cas
on obtiendrait un gradient tangentiel ∇M f (x) ∈ Tx M tel que g(x) v = ∇M f (x) · v
pour le produit scalaire dans le sous-espace linéaire Tx M . On peut penser à la sphère
S n−1 de rayon 1 dans Rn pour laquelle Tx S n−1 = Rn−1 .
De retour dans Rn , on choisit les définitions en termes de suites qui sont plus simples
à utiliser dans un espace vectoriel que celles qui font appel à des chemins.
Définition 3.6.
Soient f : Rn → Rm , x un point de Rn et v ∈ Rn une direction.
(i) f est dérivable au sens de Hadamard au point x dans la direction v si la
limite suivante existe
f (x + tw) − f (x)
lim dans Rm . (3.27)
t→0 t
w→v
′
Lorsque la limite (3.27) existe, on la désignera par fH (x; v). De la définition,
′ ′
on a fH (x; v) = f (x; v).
′
(ii) f est directionnellement dérivable au sens de Hadamard en x si fH (x; v)
n
existe pour tout v ∈ R .
(iii) f est différentiable au sens de Hadamard au point x si f est dérivable au
sens de Hadamard et l’application
déf
′
v 7→ Df (x)v = fH (x; v) : Rn → Rm (3.28)
est linéaire. On dira aussi que f est Hadamard différentiable en x.

′
Il est clair que si fH (x; v) existe, f ′ (x; v) existe et que fH ′
(x; v) = f ′ (x; v).
′ ′
Cependant, bien que f (x; 0) existe toujours et soit égal à 0, fH (x; 0) n’existe pas
toujours comme le montrera l’Exemple 3.9 (Figure 6.3).
La linéarité entraı̂ne la continuité de v 7→ f ′ (x; v). On peut aussi montrer
que si f est directionnellement dérivable au sens de Hadamard en x, alors cette
application est continue même si elle n’est pas linéaire (voir l’Exercice 7.4).
Remarque 3.5.
La Définition 3.1 (i) que la limite existe est équivalente à sa caractérisation par les
suites : il existe q ∈ R tel que pour toutes suites (tn , wn ) → (0, v), tn 6= 0,
f (x + tn wn ) − f (x)
→ q.
tn
Conformément à la définition de la limite, cela inclut les suites wn → v et la suite
constante wn = v puisque, comme tn 6= 0, on a toujours (tn , wn ) 6= (0, v).
Exemple 3.7. √
On considère le carré f (x) = kxk2 de la norme kxk = x · x de x dans Rn . Elle est
continue dans Rn . Pour tout (t, w) → (0, v), t 6= 0,
f (x + tw) − f (x) kx + twk2 − kxk2 (2x + tw) · tw
= = = (2x + tw) · w → 2x · v
t t t
′
par continuité du produit scalaire. Donc fH (x; v) existe pour tout x et tout v,
′
fH (x; v) = 2x · v,
′
et comme v 7→ fH (x; v) est linéaire, f est Hadamard différentiable et Df (x) = 2x.
La norme n(x) = kxk est aussi Hadamard différentiable en tout point x 6= 0.
Pour tout (t, w) → (0, v), t 6= 0,
n(x + tw) − n(x) kx + twk − kxk 1 kx + twk2 − kxk2
= =
t t kx + twk + kxk t
1 x
→ 2x · v = ·v
2 kxk kxk
et Dn(x) = x/kxk. La dérivée directionnelle n’existe cependant pas en x = 0 car
pour v 6= 0 le quotient différentiel
n(0 + tv) − n(0) k0 + tvk − k0k |t|
= = kvk
t t t
ne converge pas lorsque t tend vers 0 cat il oscille entre ±kvk.
Exemple 3.8.
Soit g : Rm → Rn une application linéaire : g(x) = Ax pour A ∈ L(Rm , Rn ). Alors
A(x + tw) − Ax A(tw)
∀t > 0, ∀w ∈ Rm , = = Aw → Av
t t
lorsque t > 0 → 0 et w → v et
Dg(x) = A ∈ L(Rm , Rn ).
Lorsque n = 1, g peut s’écrire g(x) = a · x pour un a ∈ Rm et Dg(x)v = a · v,

c’est-à-dire, en notation matricielle
     
v1 a1 v1
 .   .   . 
Dg(x)v = a1 . . . am  ..  =  ..  ·  ..  .
vm am vm
On utilisera les notations

 
a1
 
Dg(x) = a1 . . . am ∈ L(Rm , R) et ∇g(x) =  ...  ∈ Rm .
am
On revient maintenant sur certains des exemples précédents, On commence

par l’Exemple 3.3 de la fonction discontinue et différentiable au sens de Gateaux.
On montre qu’elle n’est pas dérivable au sens de Hadamard au point (0, 0) dans la
′
direction (0, 0), c’est-à-dire, fH (0, 0; 0, 0) n’existe pas, bien que la dérivée direction-
nelle f ′ (x; 0.0) existe et que f ′ (x; 0, 0) = 0 en tout x ∈ R2 .
Exemple 3.9 (Exemple 3.3, Figure 6.3).

On a montré que la fonction f : R2 → R définie par

 x6
déf , si (x, y) 6= (0, 0)
f (x, y) = (y − x2 )2 + x8

0, si (x, y) = (0, 0)
était Gateaux différentiable en x = (0, 0), mais qu’elle n’est pas continue en (0, 0).
On montre maintenant qu’elle ne possède pas de dérivée directionnelle au sens de
Hadamard en (0, 0) dans les directions (0, 0) et (1, 0).
Pour montrer que la dérivée directionnelle au sens de Hadamard n’existe pas
en (0, 0) dans la direction (0, 0), on choisit les suites suivantes :

1 1 1
tn = ց 0 et wn = , 3 → (0, 0) lorsque n → +∞.
n n n
En formant le quotient
déf f ((0, 0) + tn wn ) − f (0, 0)
qn = ,
tn
on peut vérifier que
( n12 )6 5
qn = 1 1 8 = n → +∞
(
n n 2 )
′
et fH f (0, 0; 0, 0) n’existe pas.
′
Pour montrer que fH f (0, 0; 1, 0) n’existe pas, on calcule le quotient différentiel
en utilisant la suite (wn , tn ) → (v, 0) suivante

1 1
wn = 1, , ∀n et tn = , ∀n
n n
f (tn wn ) − f (0, 0) 1 ( n1 )6 3
1 = 1 1 8 = n → +∞.
n (
n n )
Le dernière fonction est celle de l’Exemple 3.6 déjà considérée au paragraphe 3.2
où la fonction est continue et directionnellement dérivable, mais pas Gateaux diffé-
rentiable.
Exemple 3.10 (Exemple 3.6, Figure 6.2, page 212).

On a montré que la fonction
 3
 x , si (x, y) 6= (0, 0),
f (x, y) = x2 + y 2

0, si (x, y) = (0, 0)
est continue en (0, 0). On montre maintenant qu’elle est directionnellement dérivable
au sens de Hadamard. Pour w = (w1 , w2 ) → v = (v1 , v2 ) et t 6= 0
 

 1 (tw1 )3 
f (tw) − f (0) 2 2
, si (w1 , w2 ) 6= (0, 0)
= t (tw1 ) + (tw2 ) = f (w1 , w2 )
t 
 0, 

si (w1 , w2 ) = (0, 0)
et, par continuité de f , f (w1 , w2 ) → f (v1 , v2 ) et
′
∀v = (v1 , v2 ), fH (0, 0; v1 , v2 ) = f (v1 , v2 ).
f est directionnellement dérivable au sens de Hadamard, mais n’est pas Hadamard
′
différentiable car v 7→ fH (0; v) n’est pas linéaire.
3.3.3 Continuité des fonctions Hadamard directionnellement dérivables

En dimension n = 1, les différentielles de Hadamard et de Gateaux coı̈ncident
et correspondent à la notion usuelle de dérivée de la Définition 2.1 (iii) et la fonction
est continue par le Théorème 2.1.
L’Exemple 3.3 établit qu’en dimension n ≥ 2, une fonction différentiable au
sens de Gateaux n’est pas nécessairement continue. Ce n’est donc pas la linéarité de
la dérivée directionnelle qui engendre la continuité. L’exemple 3.10 montre qu’une
fonction qui est dérivable au sens de Hadamard dans toutes les directions, mais pas
Gateaux différentiable (pas linéaire en v) peut être continue. En fait, l’existence de
′
fH (x; 0) est suffisante pour avoir la continuité de f en x.
Théorème 3.3. Soit f : Rn → Rm , n ≥ 1, m ≥ 1. Si fH ′
(x; 0) existe en x, alors f
est continue en x. De plus, pour tout α ∈ (0, 1) et tout ε > 0,
kf (y) − f (x)kRm
∃δ > 0 tel que ∀y ∈ Bδ (x), < ε.
ky − xkαRn
Corollaire 1. Si f : Rn → Rm est Hadamard différentiable en x, alors f est
continue en x.
′ ′
Démonstration. Si fH (x; 0) existe, alors fH (x; 0) = f ′ (x; 0) = 0. Pour tout y ∈ V (x)
tel que y 6= x

α y−x
kf (y) − f (x)kRm f x + ky − xk ky−xk α − f (x)
α = α −0 .
ky − xkRn ky − xkRn
Rm
′
Comme fH (x; 0) = 0, lorsque y → x, t = ky − xkα
Rn → 0 et
y−x y−x
w= = ky − xk1−α → 0 lorsque y → x
ky − xkα
R n ky − xkRn

y−x
f x + ky − xkα ky−xk α − f (x)
Rn ′
⇒ lim α − fH (x; 0) = 0.
y→x ky − xkRn
Rm
Donc, pour tout ε > 0, il existe δ, 0 < δ < 1 tel que

α y−x
kf (y) − f (x)kR m
f x + ky − xk ky−xk α − f (x)
∀y ∈ Bδ (x), α = α
−0 <ε
ky − xkRn ky − xk
Rm
⇒ ∀y ∈ Bδ (x), kf (y) − f (x)kRm < ε ky − xkα
Rn < ε.
On a donc la continuité de f en x.
3.3.4 Opérations algébriques sur les dérivées directionnelles et les différentielles

Il est facile de vérifier les propriétés suivantes.
Théorème 3.4. Soient x ∈ Rn un point et v ∈ Rn une direction.
(i) Soient f, g : Rn → Rm tel que fH
′ ′
(x; v) et gH (x; v) existent. Alors
(f + g)′H (x; v) = fH
′ ′
(x; v) + gH (x; v) (3.29)
′ ′
∀α ∈ R, (αf )H (x; v) = αfH (x; v) (3.30)
(f · g)′H (x; v) = fH
′ ′
(x; v) · g(x) + f (x) · gH (x; v) (3.31)

déf
(f + g)(x) = f (x) + g(x), ∀x ∈ Rn (3.32)
déf
(αf )(x) = αf (x), ∀x ∈ Rn (3.33)
déf n
(f · g)(x) = f (x) · g(x), ∀x ∈ R . (3.34)
(ii) Soient f, g : Rn → R tel que fH

′ ′
(x; v) et gH (x; v) existent. Alors
(f g)′H (x; v) = fH
′ ′
(x; v) g(x) + f (x) gH (x; v) (3.35)
f ′ (x; v) g(x) − f (x) gH
′
(x; v)
(f /g)′H (x; v) = H 2
, g(x) 6= 0, (3.36)
g(x)

déf
(f g)(x) = f (x) g(x), ∀x ∈ Rn . (3.37)
déf f (x)
(f /g)(x) = , ∀x ∈ Rn tel que g(x) 6= 0. (3.38)
g(x)
Corollaire 1. Si, en plus des hypothèses du Théorème 3.4, les fonctions sont Ha-
damard différentiables, alors les fonctions suivantes sont Hadamard différentiables :
D(f + g)(x) = Df (x) + Dg(x) (3.39)

∀α ∈ R, D(αf )(x) = αDf (x) (3.40)
⊤ ⊤
D(f · g)(x) = Df (x) g(x) + Dg(x) f (x) (3.41)
D(f g)(x) = Df (x) g(x) + f (x) Dg(x) (3.42)
Df (x) g(x) − f (x) Dg(x)
D(f /g)(x) = , g(x) 6= 0, (3.43)
g(x)2
où Df (x)⊤ : Rm → Rn et Dg(x)⊤ : Rm → Rn sont les applications linéaires

(matrices) transposées de Df (x) : Rn → Rm et Dg(x) : Rn → Rm .
3.3.5 Dérivation et différentiation en chaı̂ne des fonctions composées

Une des opérations centrales de tout bon calcul différentiel est la règle de
calcul de la différentielle de la composition h de deux fonctions f : Rn → Rk et
g : Rm → Rn , k, m et n des entiers positifs,
g f n
Rm −→ Rn −→ Rk ∂hi X ∂fi ∂gℓ 1 ≤ i ≤ k,
(x) = (g(x)) (x),
déf
x 7→ h(x) = f (g(x)) : Rm → Rk , ∂xj ∂yℓ ∂xj 1 ≤ j ≤ m.
ℓ=1
Un résultat
P analogue demeure vrai pour les dérivées directionnelles : étant
donné v = m j=1 vj ej
Xm Xm X n X n Xm
∂hi ∂fi ∂gℓ ∂f ∂gk
(x) vj = (g(x)) (x) vj = (g(x)) (x) vj
j=1
∂xj j=1 ℓ=1
∂yℓ ∂xj ∂yℓ j=1
∂xj
ℓ=1
n n
!
X ∂fi X
′ ′ ′
hi (x; v) = (g(x)) gℓ (x; v) = fi g(x); ′
gℓ (x; v) eℓ = fi′ (g(x); g ′ (x; v))
∂yℓ
ℓ=1 ℓ=1
⇒ h′ (x; v) = f ′ (g(x); g ′ (x; v)) ,
où g = (g1 , . . . , gn ) et g ′ (x; v) = (g1′ (x; v), . . . , gn′ (x; v)).
Théorème 3.5. Soient n ≥ 1 et m ≥ 1 deux entiers, g : Rm → Rn et f : Rn → Rk

deux fonctions, x un point de Rm , et v une direction dans Rm . On considère la
composition (f ◦ g)(x) = f (g(x)). On fait les hypothèses suivantes :
a) g ′ (x; v) existe dans Rn
′
b) fH (g(x); g ′ (x; v)) existe dans R.
Alors,
(i) (f ◦ g)′ (x; v) existe et l’on a
(f ◦ g)′ (x; v) = fH
′
(g(x); g ′ (x; v)); (3.44)
′
(ii) si, en plus, gH (x; v) existe, alors (f ◦ g)′H (x; v) existe et l’on a
(f ◦ g)′H (x; v) = fH
′ ′
(g(x); gH (x; v)). (3.45)
Corollaire 1. Si, en plus, f est Hadamard différentiable en g(x) et g est Gateaux

(resp. Hadamard) différentiable en x, alors f ◦ g est Gateaux (resp. Hadamard)
différentiable en x et l’on a
D(f ◦ g)(x) = Df (g(x)) ◦ Dg(x). (3.46)
ou, sous forme matricielle, D(f ◦ g)(x) = Df (g(x)) Dg(x).
Remarque 3.6.
On peut considérer la composition d’un nombre fini de fonctions g1 ◦ g2 ◦ g3 qui
soient toutes dérivables au sens de Hadamard sauf la dernière qui n’a besoin que
d’être directionnellement dérivable, c’est-à-dire,
(g1 ◦ g2 ◦ g3 )′ (x; v) = (g1 )′H (g2 (g3 (x)); (g2 )′H (g3 (x); g3′ (x; v))).
Lorsqu’elles sont toutes Hadamard différentiables,
D(g1 ◦ g2 ◦ g3 )(x) = Dg1 ((g2 ◦ g3 )(x)) ◦ Dg2 (g3 (x)) ◦ Dg3 (x)
ou D(g1 ◦ g2 ◦ g3 )(x) = Dg1 ((g2 ◦ g3 )(x)) Dg2 (g3 (x)) Dg3 (x).
Remarque 3.7.
Si f : Rn → R est une fonction à valeurs réelles, on a
∀v ∈ Rm , ∇(f ◦ g)(x) · v = ∇f (g(x)) · Dg(x)v. (3.47)
On peut aussi écrire le résultat sous forme matricielle
∇(f ◦ g)(x) = [Dg(x)]⊤ ∇f (g(x)), (3.48)

| {z } | {z } | {z }
m×1 m×n n×1
où Dg(x) est la vmatrice jacobienne m × n de g : Rm → Rn
[Dg(x)]ij = ∂j gi (x), 1 ≤ i ≤ n, 1 ≤ j ≤ m, (3.49)
et ∇f (g(x)) est considéré comme un vecteur colonne ou une matrice n × 1. Si

∇f (g(x)) est considéré comme un vecteur ligne ou une matrice 1 × n, la formule
s’écrit
∇(f ◦ g)(x) = ∇f (g(x)) Dg(x).

| {z } | {z } | {z }
1×m 1×n n×m
Démonstration du Théorème 3.5. (i) Pour t 6= 0, on cherche la limite du quotient
déf 1
q(t) = [f (g(x + tv)) − f (g(x))].
t
On remarque que
g(x + tv) − g(x)

g(x + tv) = g(x) + t = g(x) + t v(t)
t
en définissant
déf g(x + tv) − g(x)
v(t) = .
t
On sait par l’hypothèse de l’existence de g ′ (x; v) que
v(t) → g ′ (x; v) lorsque t → 0.
En réécrivant
1
q(t) = [f (g(x) + t v(t)) − f (g(x))],
t
′
il vient par la définition et l’existence de fH (g(x); g ′ (x; v) que
′
lim q(t) = fH (g(x); g ′ (x; v)).
t→0
(ii) Pour t → 0, t 6= 0, et w → v, on cherche la limite du quotient différentiel
déf 1
q(t, w) = [f (g(x + tw)) − f (g(x))].
t
On remarque que l’on peut réécrire le terme g(x + tw) sous la forme
g(x + tw) − g(x)

g(x + tw) = g(x) + t = g(x) + t v(t, w)
t
en introduisant le vecteur
déf g(x + tw) − g(x)
v(t, w) = .
t
′
Comme par hypothèse gH (x; v) existe, on a
′
v(t, w) → gH (x; v) lorsque t → 0 et w → v.
En réécrivant le quotient différentiel

1
q(t, w) = [f (g(x) + t v(t, w)) − f (g(x))],
t
′ ′
il vient de l’hypothèse de l’existence de fH (g(x); gH (x; v)) et par définition de la
dérivée directionnelle au sens de Hadamard
′ ′
lim q(t, w) = fH (g(x); gH (x; v)).
t→0
w→v
Remarque 3.8.
′
Il est important de rappeler que fH (x; v) n’a pas besoin d’être linéaire en v comme
le montre la fonction de l’Exemple 3.10.
L’hypothèse que g ′ (x; v) et f ′ (g(x); g ′ (x; v)) existent n’est pas suffisante pour
démontrer le théorème. La démonstration utilise de fa¸con critique l’hypothèse plus
′
forte que fH (g(x); g ′ (x; v)) existe aussi. On donne maintenant l’exemple de la com-
position f ◦ g d’une fonction Gateaux différentiable f et d’une fonction infiniment
différentiable 23 g. La composition n’est pas Gateaux différentiable et pas même
simplement différentiable en 0 dans quelque direction v 6= 0.
Exemple 3.11.
Soient les fonctions
x6
f : R2 → R, f (x, y) = si (x, y) 6= (0, 0) et f (0, 0) = 0
(y − x2 )2 + x8

x
g : R → R2 , g(x) = 2 .
x
On a vu dans l’Exemple 3.3 que f était Gateaux différentiable en (0, 0) et que

0
∇f (0, 0) = .
0
On voit aussi que g est de classe C (∞) dans R et que la matrice jacobienne associée
est donnée par

1 1
Dg(x) = et Dg(0) = .
2x 0
La composition f (g(x)) de f et g

1
, si x 6= 0
h(x) = f (g(x)) = f (x, x2 ) = x2
0, si x = 0
donne une fonction réelle d’une variable réelle x qui n’est ni continue en 0 ni continue
en 0 à droite ou à gauche. Elle n’est donc pas différentiable ni même dérivable en
x = 0 dans les directions v 6= 0. En appliquant la règle de dérivation en chaı̂ne des
fonctions composées, il vient

′ ⊤
0
h (0) = [Dg(0)] ∇f (g(0)) = 1 0 = 0.
0
Le résultat donné par la règle de dérivation en chaı̂ne des fonctions composées est
faux. Ceci provient du fait que, la différentiabilité de f au sens de Gateaux n’est pas
suffisante. Il faudrait que f soit différentiable au sens de Hadamard en (0, 0).
23. Une fonction qui est dérivable et dont toutes les dérivées partielles de tout ordre sont
dérivables.
3.4 Différentielle de Fréchet

On donne maintenant la notion de différentielle que l’on retrouve habituelle-
ment dans les livres contemporains d’analyse. En dimension finie, elle est équivalente
à celle de différentielle au sens de Hadamard dont la caractérisation est plus simple
et qui se généralise aux espaces vectoriels topologiques de dimension infinie qui ne
possèdent pas de structure métrique.
Définition 3.7.
f : Rn → Rm est différentiable au sens de Fréchet 24 en x ∈ Rn s’il existe une
application linéaire L(x) : Rn → Rm tel que
f (x + v) − f (x) − L(x)v
lim = 0 dans Rm . (3.50)
v→0 kvk
On dira aussi que f est Fréchet différentiable en x. 25
Remarque 3.9.
Cette définition fut initiallement donnée par M. Fréchet [1] en 1911 dans le
contexte des fonctionnelles, c’est-à-dire, les fonctions de fonctions. Cependant, en
dimension finie, sa définition est équivalente à la notion antérieure de différentielle
totale que l’on trouve chez O. Stolz 26 en 1893, J. Pierpont 27 en 1905, et W. H.
Young 28 en 1908-1909 :
≪En fait, une définition équivalente avait été donnée en 1908 par
M. W.-H. Young [1, p. 157], [2, p. 21], qui avait, en outre, développé
explicitement les conséquences.≫ (M. Fréchet [2])
≪Mais je me suis aperçu qu’on trouve déjà cette définition dans Stolz,
Grundzüge der Differential und Integral-Rechnung, t. I, p. 133, et James

Pierpont, The theory of functions of real variables, t. I, p. 268. Mais c’est
W. H. Young qui en a véritablement montré le premier tous les avantages
dans son petit Livre : The fundamental theorems of Differential Calculus
et dans quelques Mémoires.≫ (M. Fréchet [3])
Selon V. M. Tihomirov [1], ≪les définitions correctes de dérivée et de différentielle
d’une fonction de plusieurs variables furent données par K. Weierstrass dans ses
cours pendant les années quatre-vingt (c’est-à-dire entre 1880 et son décès en 1897).
Ces cours furent publiés dans les années trente de notre siècle (20e). Les définitions
correctes de la dérivée dans le cas multidimensionnel apparaissent aussi au début du
siècle dans quelques manuels de cours allemands ou anglais (Stolz 1893, Pierpont
24. Maurice René Fréchet (1873–1973) apporta d’importantes contributions à l’analyse réelle
et fonda la théorie des espaces abstraits. Il écrivit sa thèse sous la supervision de Hadamard en
1906. Il introduisit le concept d’espace métrique et formula la notion abstraite de la compacité.
25. L’application v 7→ f (x)+ L(x)v peut aussi s’interpréter comme une approximation linéaire
(affine) de f (x + v) au point (x, f (x)) à léchelle infinitésimale.
26. Otto Stolz (1842–1905) (voir O. Stolz [1, p. 133]).
27. James Pierpont (1866–1938) (voir J. Pierpont [1, p. 268]).
28. William Henry Young (1863–1942) (voir W.-H. Young [1, p. 157], [2, p. 21]).
1905, Young 1908) sous l’influence de Weierstrass.≫ 29 Il ne donne pas de référence

plus précise, mais tous trois avaient eu des contacts avec Weierstrass au cours de
longs séjours en Allemagne.
Il est facile de voir qu’une fonction Fréchet différentiable en un point x est

Gateaux différentiable en x et que
Df (x)v = f ′ (x; v) = L(x)v, ∀v ∈ Rn .
En effet, le résultat est vrai pour v = 0 puisque f ′ (x; 0) = 0 = L(x)0. Pour v 6= 0

et t 6= 0
tv → 0 lorsque t → 0.
Comme f est Fréchet différentiable en x
f (x + tv) − f (x) − L(x)(tv)

lim = 0.
t→0 ktvk
Mais
f (x + tv) − f (x) − L(x)(tv) t 1 f (x + tv) − f (x) − L(x)(tv)
=
ktvk |t| kvk t
f (x + tv) − f (x) − L(x)(tv) 1 f (x + tv) − f (x)
⇒ = − L(x) v .
ktvk kvk t
Comme v 6= 0, on peut éliminer kvk ce qui donne
f (x + tv) − f (x)
lim − L(x)v = 0
t→0 t
et, de là, la dérivée f ′ (x; v) de f en x dans la direction v
f (x + tv) − f (x)
f ′ (x; v) = lim = L(x)v.
t→0 t
Puisque l’application L(x) est linéaire de Rn dans Rm , f est bien Gateaux diffé-
rentiable en x et par la Définition 3.3 de l’application jacobienne
∀v ∈ Rn , Df (x) · v = f ′ (x; v) = L(x)v.
L’exemple suivant montre qu’une fonction f Gateaux différentiable en x n’est

pas Fréchet différentiable en x, ni même continue en x.
29. De l’anglais : ≪the correct definitions of derivative and differential of a function of many
variables were given by K. Weierstrass in his lectures in the eighties of the 19th century. These
lectures were published in the thirties of our century (20th). The correct definitions of the derivative
in the multidimensional case appear also at the beginning of the century in some German and
English text-books (Scholz, Young) under the influence of Weierstrass.≫
Exemple 3.12 (Exemple 3.3 et Exemple 3.9, Figure 6.3).

On reprend l’Exemple 3.3 de la fonction f : R2 → R définie par

 x6
déf , si (x, y) 6= (0, 0)
f (x, y) = (y − x2 )2 + x8

0, si (x, y) = (0, 0).
On a déjà montré que f ′ ((0, 0); (v1 , v2 )) = 0 pour tout (v1 , v2 ), que f est Gateaux
différentiable en (0, 0) et que f est discontinue en (0, 0). On montre maintenant que
f n’est pas Fréchet différentiable en (0, 0). On choisit
v(α) = (α, α2 ), α 6= 0.
Lorsque α tend vers 0, v(α) tend vers (0, 0). On calcule le quotient de Fréchet
f (α, α2 ) − f (0, 0) − f ′ ((0, 0); (α, α2 ))

déf
q(α) =
k(α, α2 )k
1 1
= 3 → +∞ lorsque α → 0.
α (1 + α2 ) 21
La fonction f n’est donc pas Fréchet dérivable en (0, 0).
On donne maintenant l’équivalence de la différentielle au sens de Fréchet et

de celle au sens de Hadamard.
Théorème 3.6. Soient x ∈ Rn et f : Rn → Rm . Les conditions suivantes sont
équivalentes :
(i) f est Fréchet différentiable en x ;
(ii) f est Hadamard différentiable en x.
En dimension n = 1, les différentielles de Fréchet, de Hadamard et de Gateaux en
x coı̈ncident et correspondent à la notion de dérivée en x de la Définition 2.1 (iii).
Démonstration. (i) ⇒ (ii). On pose
déf f (x + h) − f (x) − L(x) h déf
Q(h) = si h 6= 0 et Q(0) = 0. (3.51)
khk
Puisque f est Fréchet différentiable en x, Q(h) → 0 = Q(0) lorsque h → 0 et il y a

continuité de Q en h = 0.
Pour (t, w) → (0, v), t 6= 0, on considère le quotient
déf f (x + tw) − f (x)

q(t, w) = .
t
déf
On a h(t, w) = tw → 0 puisque w → v et t → 0. Alors
|t|
q(t, w) = Q(h(t, w)) kwk + L(x) w → 0 kvk + L(x) v,
t
puisque kwk → kvk et L(x) w → L(x) v lorsque w → v. Donc
lim q(t, w) = L(x) v,

tց0+
w→v
′ ′
fH (x; v) existe et fH (x; v) = L(x) v est linéaire (et continue) par rapport à v. Par
définition f est Hadamard différentiable en x.
′
(ii) ⇒ (i). Comme f est Hadamard différentiable, fH (x; v) existe pour tout v
déf
′
et l’application v 7→ L(x)v = fH (x; v) est linéaire. Soit
déf
Q = lim sup kQ(h)k,
06=khk→0
où Q(h) est définie par (3.51) pour ce choix de L(x). Comme kQ(h)k ≥ 0, Q est
un nombre positif, nul ou +∞. Il existe donc une suite {hn }, 0 6= hn → 0, tel que
kQ(hn )k converge vers Q. Comme {h/khk : ∀h ∈ Rn , h 6= 0} est la sphère S de
rayon 1, S est compacte dans Rn et il existe une sous-suite {hnk } et v ∈ S tel que
déf hnk
wnk = → v ∈ S.
khnk k
On voit que pour h 6= 0

f x + khk h − f (x)
h khk h
Q(h) = Q khk = − L(x) .
khk khk khk
′ ′
Comme fH (x; v) existe et que L(x)wnk → L(x)v = fH (x; v), en prenant tnk = khnk k
qui tend vers 0, il vient
f (x + tnk wnk ) − f (x)

Q(hnk ) = − L(x) wnk
tnk
′ ′ ′
→ fH (x; v) − L(x) v = fH (x; v) − fH (x; v) = 0
⇒ kQ(hnk )k → 0 et Q = lim sup kQ(h)k = 0.
h→0
Comme kQ(h)k ≥ 0 et que la limsup Q est égale à zéro, la limsup est égale à la
limite. En particulier, la limite du quotient Q(h) existe et est 0 lorsque h tend vers
0. Par définition, f est donc Fréchet différentiable en x.
3.5 Fonctions lipschitziennes et différentiabilité

3.5.1 Définitions
On rappelle la Définition 7.1 du Chapitre 4.
Définition 3.8.
Soit f : Rn → Rm , n ≥ 1, m ≥ 1.
(i) f est lipschitzienne en x s’il existe c(x) > 0 et un voisinage V (x) de x tel
que
∀y, z ∈ V (x), kf (z) − f (y)kRm ≤ c(x) kz − ykRn .
(ii) f est lipschitzienne sur une partie U de Rn s’il existe c(U ) > 0 tel que
∀y, z ∈ U, kf (z) − f (y)kRm ≤ c(U ) kz − ykRn .
Exemple 3.13.
La norme f (x) = kxk est lipschitzienne dans Rn puisque
∀y, z ∈ Rn , |f (y) − f (z)| = |kyk − kzk| ≤ ky − zk,
avec une constante de Lipschitz c(Rn ) = 1. La fonction f (x) = kxk2 n’est pas
lipschizienne sur tout Rn , mais elle est lipschitzienne en tout point x ∈ Rn . En effet
pour tout r > 0,
∀y, z ∈ Br (x), |f (y)− f (z)| = kyk2 − kzk2 ≤ ky + zk ky − zk ≤ 2(r + kxk)ky − zk.
On choisit le voisinage Br (x) et la constante c(x) = 2(r + kxk).
3.5.2 Gateaux dérivabilité et Lipschitzité donnent Hadamard dérivabilité

Théorème 3.7. Soit f : Rn → Rm , n ≥ 1, m ≥ 1, une fonction lipschitzienne en
x ∈ Rn .
(i) Si f ′ (x; v) existe, alors fH
′ ′
(x; v) existe. En particulier, fH (x; 0) existe.
′ n
(ii) Si f (x; v) existe pour tout v ∈ R , alors
∀v, w ∈ Rn , ′
kfH ′
(x; v) − fH (x; w)kRm ≤ c(x) kv − wkRn , (3.52)
où c(x) est la constante de Lipschitz associée au voisinage V (x) de x de la
Définition 3.8 (i).
Remarque 3.10.
′
Ce théorème est presque la réciproque du Théorème 3.3 qui dit que si fH (x; v)
existe, alors f est continue en x.
Démonstration. (i) Soit {wn } une suite tendant vers v et t > 0. Alors il existe N
et t̄ > 0 tel que pour tout n > N et 0 < t < t̄ on ait x + twn ∈ V (x). On forme le
quotient différentiel
f (x + twn ) − f (x) f (x + twn ) − f (x + tv) f (x + tv) − f (x)
= + .
t t t
Par hypothèse, le second terme tend vers f ′ (x; v). Comme f est lipschitzienne en
x
∃c(x), ∀y, z ∈ V (x), kf (y) − f (z)kRm ≤ c(x)ky − zkRn
et on peut majorer la valeur absolue du premier terme
f (x + twn ) − f (x + tv)
≤ c(x) kwn − vkRn → 0 lorsque n → ∞.
t Rm
Comme la limite est la même pour toute suite wn → v, on en conclut que

′
fH (x; v) = f ′ (x; v), ∀v ∈ Rn .
Pour v = 0, on a toujours f ′ (x; 0) = 0. Par ce qui précède, fH

′
(x; 0) existe.
n
(ii) Pour tout v, w ∈ R et t > 0 suffisamment petit, x + tv et x + tw appar-
tiennent à V (x) et
f (x + tv) − f (x) f (x + tw) − f (x)

− ≤ c(x) kv − wkRn .
t t Rm
′ ′
Lorsque t tend vers zéro, il vient kfH (x; v) − fH (x; w)k = kf ′ (x; v) − f ′ (x; w)kRm ≤
c(x) kv − wkRn .
3.6 Théorème de la moyenne pour les fonctions vectorielles

On aura aussi besoin d’une version vectorielle du Théorème 2.4 de la moyenne
ou des accroissements finis. On commence par une fonction à valeurs réelles, puis
on adaptera le résultat pour une fonction à valeurs vectorielles.
déf
Théorème 3.8. Soient f : Rn → R et a, b ∈ Rn , b 6= a. Si la fonction t 7→ g(t) =
f (a + t (b − a)) est continue dans [0, 1] et dérivable dans ]0, 1[ , alors
∃θ ∈ ]0, 1[ tel que f (b) − f (a) = f ′ (a + θ (b − a); b − a). (3.53)
Démonstration. Il suffit de remarquer que pour tout t ∈ ]0, 1[
g ′ (t) = f ′ (a + t (b − a); b − a).
En effet, par définition de g ′ (t) en un point 0 < t < 1 : pour |s| assez petit
g(t + s) − g(t) f (a + (t + s) (b − a)) − f (a + t (b − a))

=
s s
f ((a + t (b − a)) + s (b − a)) − f (a + t (b − a))
=
s
→ f ′ (a + t (b − a); b − a) lorsque s → 0.
Pour compléter la démonstration, il suffit d’appliquer le Théorème 2.4 de la moyenne

à g(t) = f (a + t (b − a)) : il existe θ ∈ ]0, 1[ tel que g(1) = g(0) + g ′ (θ).
Dans le cas vectoriel, on a un θ pour chaque composante, mais pas un θ unique

pour toutes les composantes.
Théorème 3.9. Soit une application f : Rn → Rm , m ≥ 1, n ≥ 1, et deux points

a, b ∈ Rn , b 6= a. On suppose que f est continue en chaque point du segment fermé
{a + t (b − a) : 0 ≤ t ≤ 1}
et Gateaux différentiable en chaque point du segment ouvert
{a + t (b − a) : 0 < t < 1}.
Alors, il existe θ, 0 < θ < 1, tel que
kf (b) − f (a)kRm ≤ kb − akRn kDf (a + θ(b − a))kL(Rn ,Rm ) . (3.54)
Démonstration. On définit la fonction
déf
t 7→ ϕ(t) = [f (b) − f (a)] · f (a + t (b − a)) : [0, 1] → R .
Comme ϕ est continue sur [0, 1] et dérivable dans ]0, 1[
ϕ′ (t) = [f (b) − f (a)] · f ′ (a + t (b − a); b − a)
= [f (b) − f (a)] · Df (a + t (b − a)) [b − a].
Il existe θ ∈ ]0, 1[ tel que ϕ(1) − ϕ(0) = ϕ′ (θ) par le Théorème 2.4 de la moyenne.
En explicitant,
2
ϕ(1) − ϕ(0) = kf (b) − f (a)kRm
⇒ kf (b) − f (a)k2 = [f (b) − f (a)] · Df (a + θ (b − a)) [b − a]
≤ kf (b) − f (a)kRm kDf (a + θ(b − a))kL(Rn ,Rm ) kb − akRn
⇒ kf (b) − f (a)kRm ≤ kb − akRn kDf (a + θ(b − a))kL(Rn ,Rm ) .
De ce théorème, on déduit plusieurs résultats importants.

Théorème 3.10. Soit f : Rn → Rm une application Gateaux différentiable dans
un ouvert convexe U ⊂ Rn telle qu’il existe M ≥ 0 vérifiant
∀x ∈ U, kDf (x)kL(Rn ,Rm ) ≤ M. (3.55)
Alors
∀a, b ∈ U, kf (b) − f (a)kRm ≤ M kb − akRn , (3.56)
f possède un prolongement lipschitzien sur U de constante M et f est Fréchet

différentiable sur U .
Démonstration. On applique le Théorème 3.9. Pour toute paire a, b ∈ U
kf (b) − f (a)kRm ≤ kb − akRn kDf (a + θ(b − a))kL(Rn ,Rm ) ≤ M kb − akRn
puisque U est convexe entraı̂ne a+θ(b−a) ∈ U . La fonction f est donc lipschitzienne
sur U possède un prolongement lipschitzien sur U de constante M . De plus, comme
f est Gateaux différentiable et lipschitzienne sur U , elle est Fréchet différentiable
sur l’ouvert U par le Théorème 3.7 (i).
Remarque 3.11.
Le Théorème 3.10 semble contredire l’Exemple 3.3 d’une fonction Gateaux diffé-
rentiable f (x, y) au point (0, 0), mais discontinue en ce point. En effet la fonction
f (x, y) est Gateaux différentiable non seulement en (0, 0), mais aussi dans tout R2 .
Cependant, la fonction et son gradient ne sont bornées dans aucune boule Bδ (0, 0),
δ > 0, autour de (0, 0). 30 Il est facile de vérifier que pour (x, y) 6= (0, 0),
∂f 2 x6 (y − x2 ) ∂f (y − x2 )(3y − x2 ) − x8
=− , = 2x5 .
∂y [(y − x2 )2 + x8 ]2 ∂x [(y − x2 )2 + x8 ]2
Lorsque l’on prend y = x2 , x 6= 0,
∂f ∂f 2
(x, x2 ) = 0, (x, x2 ) = − 3
∂y ∂x x
et ∇f (x, x2 ) n’est pas borné lorsque x tend vers 0.
Corollaire 1. Soit f : Rn → Rm une application Gateaux différentiable sur un

ouvert connexe U de Rn . Si
∀x ∈ U, Df (x) = 0,
alors f est égale à un vecteur constant sur U .
Démonstration. Soit x0 ∈ U et U1 = {x ∈ U : f (x) = f (x0 )}. Par définition

U1 6= ∅. Soit x ∈ U1 . Comme U est ouvert, il existe r > 0 tel que Br (x) ⊂ U . On
peut alors appliquer le Théorème 3.10 avec M = 0 et l’ouvert convexe Br (x). Il
vient
∀y ∈ Br (x), f (y) = f (x) = f (x0 ).
D’où Br (x) ⊂ U1 . Ceci montre que U1 est une partie ouverte de Rn . On considère
maintenant l’ensemble complémentaire
U \U1 = {x ∈ U : f (x) 6= f (x0 )}.
Pour tout point x1 ∈ U \U1 , il existe r > 0 tel que Br (x1 ) ⊂ U et par le même
argument que précédemment f (x) = f (x1 ) 6= f (x0 ) pour tout x ∈ Br (x1 ). De là
Br (x1 ) ⊂ U \U1 et U \U1 est ouvert.
Si U \U1 6= ∅, alors U est l’union de deux ensembles ouverts non-vides et
disjoints U1 et U \U1 de l’espace euclidien Rn . Mais ceci est impossible puisque U
est sous-ensemble connexe de Rn . Donc U \U1 = ∅ et U = U1 .
Remarque 3.12.
H. Whitney [1] a donné l’exemple d’une partie convexe U ⊂ R2 et d’une fonction
f différentiable tel que ∇f (x, y) = 0 pour tout (x, y) ∈ U , mais f (x, y) n’est pas
constante dans U . Cet ensemble n’a pas de points intérieurs.
30. Voir aussi l’Exercice 7.7.
3.7 Fonctions de classes C (p) , p ≥ 0, et matrice hessienne

3.7.1 Classes C (0) et C (1)
Lorsque f est Gateaux (resp. Fréchet) différentiable en x, on a vu que le gra-
dient peut s’exprimer en fonction des dérivées partielles de f en x. La réciproque
n’est en général pas vraie car même l’existence de dérivées dans toutes les direc-
tions n’est pas suffisante pour assurer la différentiabilité au sens de Gateaux et
encore moins au sens de Fréchet. Cependant, lorsque l’on impose des conditions de
continuité sur les dérivées partielles, on peut montrer que la différentielle au sens de
Fréchet existe et que le gradient est complètement spécifié par les dérivées partielles.
L’essentiel des démonstrations de ce paragraphe est emprunté à W. Rudin [1].
Définition 3.9.
Soient f : Rn → R, U ⊂ Rn ouvert.
(i) f est de classe C (0) sur U si f est continue sur U . On écrira f ∈ C (0) (U ).
(ii) f est de classe C (1) sur U si les dérivées partielles ∂i f (x), 1 ≤ i ≤ n,
existent et sont continues sur U . On écrira f ∈ C (1) (U ). 31
Ces définitions et les résultats qui suivent s’étendent aux fonctions à valeurs vecto-
rielles f : U ⊂ Rn → Rm .
Théorème 3.11. Soient f : Rn → R et {ei }ni=1 la base orthonormale canonique.

(i) Si f possède des dérivées partielles ∂i f , i = 1, . . . , n, dans un voisinage
V (x) d’un point x qui sont continues en x, alors f est Fréchet différentiable
en x (et donc continue en x) et
Xn Xn
∀v ∈ Rn , L(x)v = ∂i f (x) ei vi , ∇f (x) = ∂i f (x) ei .
i=1 i=1
(ii) Si f possède des dérivées partielles ∂i f , i = 1, . . . , n, qui sont continues

sur un ouvert U de , Rn , alors f est Fréchet différentiable dans U (et donc
continue sur U ) et pour tout y ∈ U ,
Xn Xn
∀v ∈ Rn , L(y)v = ∂i f (y) vi , ∇f (y) = ∂i f (y) ei ,
i=1 i=1
et les applications
y 7→ ∇f (y) : U → Rn et (y, w) 7→ f ′ (y; w) : U × Rn → R (3.57)
sont continues.
Corollaire 1. Si f est de classe C (1) sur un ouvert U , alors f est Fréchet diffé-
rentiable sur U et donc de classe C (0) sur U . De plus ∇f est de classe C (0) sur U .
Réciproquement, si f est Fréchet différentiable sur U et si
x 7→ ∇f (x) : U → Rn (3.58)
31. Il ne faut pas confondre les espaces C (0) (U ) et C (1) (U ) avec les espaces de Banach C (0) (U )
et C (1) (U ) de fonctions uniformément continues et bornées sur U . Lorsque U n’est pas borné il
existe des métriques complètes sur C (0) (U ) et C (1) (U ) qui en font des espaces appelés espaces de
Fréchet.
est continue, alors f est de classe C (1) sur U .

Démonstration du Théorème 3.11. (i) Il suffit de démontrer que f est Fréchet dif-
férentiable en x. La continuité suit par le Théorème 3.3 et les autres propriétés
des discussions suivant les définitions des différentielles aux sens de Gateaux et
de Fréchet. Pour montrer que f est Fréchet différentiable, on démontre que f est
′
Hadamard directionnellement dérivable et que fH (x; v) est linéaire par rapport à v,
et on applique le Théorème 3.6.
Tout élément v = (v1 , . . . , vn ) de Rn peut s’écrire dans la base orthonormale,
n
X
v= vi ei .
i=1
Pour chaque y ∈ V (x), on définit l’application linéaire

n
X
déf
v 7→ L(y)v = ∂i f (y) vi : Rn → R.
i=1
Soit v ∈ Rn et les suites wk → v et tk → 0. Il existe N tel que
∀k > N, x + tk wk ∈ V (x).
Soient les points suivants
déf déf
x0k = x, xik = xi−1
k + tk (wk )i ei , 1 ≤ i ≤ n.
On veut montrer que le quotient différentiel moins L(x)v
déf f (x + tk wk ) − f (x)
qk = − L(x)v
tk
tend vers 0 lorsque k tend vers l’infini. On peut le réécrire sous la forme
n
X f (xi ) − f (xi−1 )
k k
qk = − ∂i f (x) vi .
i=1
tk
Puisque f est dérivable dans la direction ei pour tout point de V (x), la fonction
gi (α) = f (xi−1
k + α tk (wk )i ei ) est continue dans [0, 1] et différentiable dans ]0, 1[ .
Par le théorème de la moyenne (Théorème 3.8)
∃αik ∈ ] 0, 1 [ , f (xik ) − f (xi−1 ′ i−1

k ) = f (xk + αik tk (wk )i ei ; tk (wk )i ei )
= tk (wk )i ∂i f (xi−1
k + αik tk (wk )i ei )
par homogénéité et finalement
f (xik ) − f (xi−1
k )
= (wk − v)i ∂i f (xi−1
k + αik tk (wk )i ei ) + vi ∂i f (xi−1
k + αik tk (wk )i ei )
tk
f (xik ) − f (xi−1
k )
− ∂i f (x) vi = (wk − v)i ∂i f (xi−1k + αik tk (wk )i ei )
tk

+ vi ∂i f (xi−1
k + αik tk (wk )i ei ) − ∂i f (x) .
Mais, par construction, pour tout i
i−1
X
kxi−1
k + αik tk (wk )i ei − xk = (xjk − xj−1 i
k ) + αk tk (wk )i ei
j=1
 1/2
i−1
X Xi−1 
= tk (wk )j ej + αik tk (wk )i ei = |tk | |(wk )j |2 + |αik (wk )i |2
 
j=1 j=1
 1/2  1/2
Xi  Xn 
≤ |tk | |(wk )j |2 ≤ |tk | |(wk )j |2 = |tk | kwk k
   
j=1 j=1
qui tend vers zéro lorsque wk → v et tk ց 0 et puisque ∂i f (y) est continue en x,

∂i f (xki−1 + αik tk (wk )i ei ) → ∂i f (x), et qk tend vers zéro lorsque k tend vers l’infini.
On a donc montré que, pour tout v ∈ Rn , fH ′
(x; v) = L(x)v qui est linéaire en v
par définition de L(x). f est donc Hadamard (Fréchet) différentiable en x.
(ii) Les résultats dans U sont une conséquence des résultats de (i) en x. Il
ne reste qu’à démontrer la continuité des applications (3.57). Comme le gradient
∇f (y) a pour expression
Xn
∇f (y) = f ′ (y; ei ) ei ,
i=1
il est continu dans U comme la somme de n fonctions continues dans U par hy-
pothèse sur les dérivées partielles est Fréchet différentiable dans tout U , pour tout
y dans U ,
∀w ∈ Rn , f ′ (y; w) = ∇f (y) · w = L(y)w.
Soit (x, v) un point arbitraire de U × Rn et (y, w) un autre point de U × Rn . On
évalue
f ′ (y; w) − f ′ (x; v) = f ′ (y; w) − f ′ (x; w) + f ′ (x; w) − f ′ (x; v)
= [∇f (y) − ∇f (x)] · w + ∇f (x) · (w − v)
′ ′
⇒ |f (y; w) − f (x; v)| ≤ k∇f (y) − ∇f (x)k kwk + k∇f (x)k kw − vk.
Puisque x est fixe, il existe une constante c > 0 tel que k∇f (x)k ≤ c et pour tout
ε > 0 et tout w tel que kw − vk ≤ ε/(2c) on a
k∇f (x)k kw − vk ≤ ε/2 et kwk ≤ kvk + ε/(2c).
Mais, par continuité des n dérivées partielles dans U , il existe un δ(x) > 0 tel que
X
n 1/2
2 ε
ky − xk < δ(x) ⇒ |∂j f (y) − ∂j f (x)| ≤
j=1
2(kvk + ε/(2c))
⇒ k∇f (y) − ∇f (x)k kwk ≤ ε/2.
Finalement, pour tout ε > 0, il existe δ ′ = min{δ(x), ε/(2c)} tel que

ky − xk < δ ′ et kw − vk ≤ δ ′ ⇒ |f ′ (y; w) − f ′ (x; v)| ≤ ε
et donc la continuité lorsque (y, w) tend vers (x, v).
Remarque 3.13.
Les définitions et résultats précédents s’appliquent aussi à des fonctions à valeurs
vectorielles en procédant composante par composante.
Remarque 3.14.
Les opérations habituelles sont permises dans la classe des fonctions de classe C (1) .
Si f et g sont des fonctions de classe C (1) dans le même ouvert U , alors la somme
(f + g)(x) = f (x) + g(x) et la multiplication par un scalaire (α f )(x) = αf (x)
sont de classe C (1) dans U . De la même façon, le produit (f g)(x) = f (x)g(x) est de
classe C (1) puisque D(f g)(x) = f (x)Dg(x)+ g(x)Df (x). La composition g ◦ f d’une
fonction f : U ⊂ Rn → Rm et d’une fonction g : V ⊂ Rm → Rp , f (U ) ⊂ V , pour
deux ouverts U et V est de classe C (1) puisque D(g ◦ f )(x) = Dg(f (x)) ◦ Df (x).
3.7.2 Classe C (2) , matrice hessienne et classe C (p)

On définit les dérivées du second ordre de la même façon que les dérivée di-
rectionnelles du premier.
Définition 3.10.
Soient f : Rn → R, x ∈ Rn , et deux directions v et v dans Rn . On suppose que
f ′ (y; v) existe pour tout y dans un voisinage V (x) de x. On dit que f possède une
dérivée directionnelle du second ordre dans les directions (v, v) au point x si la limite
f ′ (x + t v; v) − f ′ (x; v)
lim
t→0 t
existe. Dans ce cas on écrira cette limite d2 f (x; v; v).
En général, l’ordre des directions (v, v) est important.

Théorème 3.12. Si f : Rn → R est Gateaux différentiable dans un voisinage V (x)
de x, et que ∇f (y) est Gateaux différentiable en x, alors l’application
(v, v) 7→ d2 f (x; v; v) : Rn × Rn → R (3.59)
est bilinéaire, c’est-à-dire
∀v ∈ Rn , v 7→ d2 f (x; v; v) : Rn → R est linéaire, (3.60)
n 2 n
∀v ∈ R , v 7→ d f (x; v; v) : R → R est linéaire. (3.61)
De plus, il existe une application linéaire unique Hf (x)
Hf (x) : Rn → Rn tel que ∀v, v ∈ Rn , d2 f (x; v; v) = Hf (x)v · v (3.62)
ou encore, sous forme compacte, Hf (x) = D(∇f (x)).
Toute paire de directions v = (v1 , . . . , vn ) et v = (v 1 , . . . , v n ) peut s’écrire

n
X n
X
v= vi ei , v= v i ei ,
i=1 i=1
en terme de la base orthonormale canonique {ei }ni=1 . Sous les hypothèses du Thé-
orème 3.12, l’application (v, v) 7→ d2 f (x; v; v) : Rn × Rn → R est bilinéaire. Donc
X n n
X X n Xn
2 2
d f (x; v; v) = d f x; vi ei ; v j ej = d2 f (x; ei ; ej )vi v j .
i=1 j=1 i=1 j=1
2
Les éléments d f (x; ei ; ej ) sont les éléments de la matrice associée à l’application
linéaire Hf (x) de Rn . À la lumière du théorème et de cette discussion, on peut
donner les définitions suivantes.
Définition 3.11.
On se place dans le cadre des hypothèses du Théorème 3.12.
(i) On appellera application hessienne 32 de f en x l’application linéaire Hf (x) :
Rn → Rn définie par (3.62).
(ii) La matrice hessienne de f en x est la matrice n × n formée des éléments
déf
Hf (x)ij = d2 f (x; ei ; ej ) = ∂j (∂i f (x))
pour la base orthonormale canonique {ei }ni=1 de Rn .
Par abus de notation, on utilisera la même notation Hf (x) pour l’application et la
matrice qui lui est associée.
Démonstration du Théorème 3.12. Par hypothèse, pour tout y ∈ V (x), f est Ga-
teaux différentiable en y et
f ′ (y; v) = ∇f (y) · v
et comme ∇f est Gateaux différentiable en x
(∇f )′ (x; v) = D(∇f )(x) v,
où D(∇f )(x) : Rn → Rn est l’application (linéaire) jacobienne de la fonction
vectorielle y 7→ ∇f (y).
Pour v et v dans Rn et t 6= 0, considérons le quotient
f ′ (x + tv; v) − f ′ (x; v) ∇f (x + tv) − ∇f (x)
= · v.
t t
Lorsque t → 0
∇f (x + tv) − ∇f (x)
→ D(∇f )(x) v
t
′ ′
f (x + tv; v) − f (x; v) ∇f (x + tv) − ∇f (x)
= · v → D(∇f )(x) v · v
t t
⇒ d2 f (x; v; v) = D(∇f )(x) v · v.
32. La matrice hessienne fut développée au XIXe siècle par Ludwig Otto Hesse (1811–1874)
et plus tard appelée hessienne d’après lui. Hesse utilisait le terme déterminant fonctionnel.
On a donc bien la bilinéarité et l’application Hf (x) coincide avec l’application

linéaire D(∇f )(x).
On insiste sur le fait que la définition de la matrice hessienne est compatible

avec la définition de la matrice jacobienne DF pour une fonction vectorielle F :
Rn → Rn . En effet,
déf ∂Fi
DF (x)ij = (x),
∂xj
où Fi est la i-ème composante de la fonction F . En prenant F = ∇f , il vient

∂ ∂f
D(∇f (x))ij = (x) = d2 f (x; ei ; ej ) = Hf (x)ij .
∂xj ∂xi
2
On utilisera aussi les notations ∂ji f (x).
Les dérivées secondes seront importantes pour caractériser la convexité de la
fonction et par là les points minimisants. En général, la matrice hessienne n’est pas
symétrique, mais elle le devient pour les fonctions de classe C (2) .
Théorème 3.13. Soient f : Rn → R et la base orthonormale canonique {ei }ni=1 .

(i) Si f possède des dérivées partielles premières ∂i f (y) et secondes ∂j (∂i f )(y)
pour tout y ∈ Br (x), r > 0, et que, pour chaque paire (i, j), l’application
y 7→ ∂j (∂i f (y)) est continue en x. (3.63)
Alors, ∂i f , 1 ≤ i ≤ n, et f sont Fréchet différentiables et continues en x,

et
∀i, j, ∂j (∂i f (x)) = ∂i (∂j f (x)) ou Hf (x)⊤ = Hf (x)..
(ii) Soit U un ouvert de Rn . Si f possède des dérivées partielles premières

∂i f (y) et secondes ∂j (∂i f )(y) pour tout y ∈ U , et que, pour chaque paire
(i, j), l’application
y 7→ ∂j (∂i f (y)) est continue sur U. (3.64)
Alors, ∂i f , 1 ≤ i ≤ n, et f sont Fréchet différentiables et continues sur U ,

et
∀y ∈ U, ∀i, j, ∂j (∂i f (y)) = ∂i (∂j f (y)) ou Hf (y)⊤ = Hf (y). (3.65)
Remarque 3.15.
En général, la matrice hessienne des dérivées secondes n’est pas symétrique si l’on
n’a pas la continuité (3.64). Voir l’Exercice 7.8 pour un contre-exemple à (3.65).
déf
Démonstration. (i) Pour chaque i, la fonction y 7→ hi (y) = ∂i f (y) possède des
dérivées partielles ∂j hi sur Br (x) qui sont continues en x. Les hypothèses du Théo-
rème 3.9 (i) sont donc vérifiées et hi est Fréchet différentiable et continue en x.
En conséquence, les dérivées partielles ∂i f sont continues en x. Toujours par le

Théorème 3.9 (ii), la fonction f est Fréchet différentiable et continue en x.
On définit
déf
Cs,t = f (x + sei + tej ) − f (x + sei ) − f (x + tej ) + f (x).
On donne deux expressions différentes de Cs,t . Pour s > 0 et t > 0 assez petits, x,
x + sei , x + sei + tej sont dans Br (x). Nous avons
déf
Cs,t = g(x + tej ) − g(x) où g(z) = f (z + sei ) − f (z).
Par le théorème de Taylor (Théorème 2.6) en faisant un développement d’ordre un,
il existe α1 ∈ ]0, 1[ tel que
Cs,t = g ′ (x + α1 tej ; tej ).
Par définition de g, cette identité peut se réécrire en fonction de f ′

Cs,t = f ′ (x + α1 tej + sei ; tej ) − f ′ (x + α1 tej ; tej ).
Une nouvelle application du théorème de Taylor (Théorème 2.6) donne pour un
α2 ∈ ]0, 1[
Cs,t = d2 f (x + α1 tej + α2 sei ; tej ; sei )
= s t d2 f (x + α1 tej + α2 sei ; ej ; ei )
en utilisant l’homogénéité positive. De façon analogue, en interchangeant les rôles
de s et de t, on obtiendra
∃α3 , α4 ∈ ] 0, 1 [ , Cs,t = s t d2 f (x + α3 tej + α4 sei ; ei ; ej ).
D’où
d2 f (x + α1 tej + α2 sei ; ej ; ei ) = d2 f (x + α3 tej + α4 sei ; ei ; ej ).
Lorsque s → 0 et t → 0, il vient, par continuité des dérivées partielles secondes en
x, d2 f (x; ej ; ei ) = d2 f (x; ei ; ej ).
déf
(ii) Pour chaque i, la fonction y 7→ hi (y) = ∂i f (y) possède des dérivées
partielles ∂j hi sur U qui sont continues dans U . Les hypothèses du Théorème 3.9
(ii) sont donc vérifiées et hi est Fréchet différentiable sur U et continue sur U .
En conséquence, les dérivées partielles ∂i f sont continues sur U . Toujours par le
Théorème 3.9 (ii), la fonction f est Fréchet différentiable et continue sur U .
Par le Théorème 3.11, pour tout y ∈ U , l’application v, w 7→ d2 f (y; v; w) est
bilinéaire et
X n n
X X n Xn
2 2
d f (y; v; w) = d f y; vi ei ; wj ej = vi wj d2 f (y; ei ; ej ).
i=1 j=1 i=1 j=1
Démontrer que d2 f (y; v; w) = d2 f (y; w; v) revient donc à démontrer que

d2 f (y; ei ; ej ) = d2 f (y; ej ; ei ).
Mais, de la partie (i), ceci est vrai pour tout y ∈ U .
Les dérivées partielles d’ordre supérieur à 2 sont définies de la même façon

∂ m f (x)
= dm f (x; ei1 ; . . . ; eim ). (3.66)
∂xim ··· ∂xi1
On utilisera aussi la notation ∂imm ···i1 f (x).
Définition 3.12.
Soient f : Rn → R et U un ouvert de Rn . La fonction f est de classe C (p) dans U si
toutes les dérivées partielles d’ordre p de f existent et sont continues dans U .
On peut montrer par les résultats précédents (cf. Corollaire 1 au Théorème 3.11)
que les fonctions de classe C (p) sont de classe C (p−1) et ainsi de suite.
3.8 Généralisation et perspectives : les semi-différentielles

Avant de clore la question de la définition de la dérivée directionnelle,
√ il est
utile de revenir sur l’Exemple 3.7 de la norme f (x) = kxk = x · x de Rn . Pour
x 6= 0, elle est Hadamard différentiable et
′ x
fH (0, v) = · v, (3.67)
kxk
mais pour x = 0 le quotient différentiel
k0 + t wk − k0k |t|
= kwk
t t
ne converge pas lorsque w → v et t → 0 car le terme |t|/t a des sous-suites qui
convergent vers 1 ou −1.
Si l’on modifie légèrement la définition des dérivées dans la direction v pour
les transformer en semi-différentielles de la forme
déf f (x + tv) − f (x) déf f (x + tw) − f (x)
df (x; v) = lim et dH f (x; v) = w→v
lim ,
tց0 t tց0
t
(3.68)
où t tend vers 0 par valeurs positives, alors la norme devient semi-différentiable en
0 dans les sens de Gateaux et de Hadamard puisque
k0 + t vk − k0k t
lim = lim kvk = kvk (3.69)
tց0 t tց0 t
k0 + t wk − k0k t
lim lim kwk = lim kwk = kvk.
= w→v (3.70)
w→v
tց0
t tց0
t w→v
Les notions de semi-différentielles sont à la fois plus intéressantes et plus

générales que celles de dérivées directionnelles tout en conservant les deux pro-
priétés importantes des fonctions différentiables : la continuité de la fonction et la
règle de dérivation en chaı̂ne des fonctions composées. Un exposé complet des semi-
différentielles dans le cadre de l’optimisation se trouve, par exemple, dans le récent
livre de M. C. Delfour [1, 2].
4. Fonctions convexes et optimisation 249
3.9 Tableau des notions de dérivabilité et de différentiabilité

Ce paragraphe résume les différentes notions de dérivée directionnelles et de
différentielles introduites dans ce chapitre. Les notions de base sont la dérivée di-
rectionnelle f ′ (x; v) et celle plus forte au sens de Hadamard fH ′
(x; v) qui jouent
un rôle central puisque les règles du calcul différentiel classique demeurent valides
pour cette famille de fonctions. Avec la linéarité en v, on obtient, respectivement,
les différentielles de Gateaux et de Hadamard et la notion de gradient.
déf f (x + tv) − f (x)

f ′ (x; v) = lim ∀v ∈ Rn , f ′ (x; v) existe et
t→0 t
v 7→ f ′ (x; v) : Rn → Rn est linéaire
f dérivable
f Gateaux différentiable en x
en x dans la direction v
′ déf f (x + tw) − f (x)

fH (x; v) = lim ∀v ∈ Rn , fH ′
(x; v) existe et
t→0 t
w→v
v 7→ fH (x; v) : Rn → Rn est linéaire
′
f Hadamard dérivable
f Hadamard différentiable en x
en x dans la direction v
On a une caractérisation géométrique en termes de chemins de la dérivabilité au

sens de Hadamard.
f Hadamard ∃ g(x, v) ∈ R tel que
dérivable ⇐⇒ ∀ h : R → Rn , h(0) = x et h′ (0) = v,
en x dans la direction v (f ◦ h)′ (0) existe et (f ◦ h)′ (0) = g(x, v)
Les notions de différentielles aux sens de Hadamard et de Fréchet coı̈ncident et on

a aussi une caractérisation géométrique en termes de chemins.
f Fréchet différentiable en x : ∃ L(x) : Rn → R linéaire

⇐⇒ f (x + v) − f (x) − L(x)v
f Hadamard tel que lim =0
v→0 kvk
différentiable
en x ∃ L(x) : Rn → R linéaire tel que
⇐⇒ ∀ h : R → Rn , h(0) = x et h′ (0) existe,
(f ◦ h)′ (0) existe et (f ◦ h)′ (0) = L(x) h′ (0)
4 Fonctions convexes et optimisation

4.1 Fonctions convexes
Définition 4.1. (i) Une partie U de Rn est convexe si
∀λ ∈ [0, 1], ∀x, y ∈ U, λx + (1 − λ)y ∈ U.
Par convention, ∅ est convexe.
(ii) Soit ∅ 6= U ⊂ Rn convexe. La fonction f : Rn → R est convexe sur U si
∀λ ∈ ]0, 1[ , ∀x, y ∈ U, f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y);
f : Rn → R est dite strictement convexe sur U si
∀λ ∈ ]0, 1[ , ∀x, y ∈ U, x 6= y, f (λx + (1 − λ)y) < λf (x) + (1 − λ)f (y).
(iii) Soit U , ∅ 6= U ⊂ Rn , convexe. La fonction f : Rn → R est concave (resp.

strictement concave) sur U si −f est convexe (resp. strictement convexe)
sur U (cf. Figure 6.5).
f (x) f (x)
x x
Fonction convexe Fonction concave
Figure 6.5. Fonction convexe et fonction concave
Théorème 4.1. Soit U ⊂ Rn .

(i) L’intérieur, int U , et l’adhérence, U , d’un convexe U sont convexes.
(ii) Soit {Uα }α∈A une famille de parties convexes de Rn , où l’ensemble A
des indices est arbitraire et pas nécessairement fini. Alors, ∩α∈A Uα est
convexe.
(iii) Soit U un convexe tel que int U 6= ∅. Alors int U = U .
Démonstration. (i) Si U = ∅, ∅ = ∅ est convexe par convention. Si x, y ∈ U , il

existe des suites {xn } ⊂ U et {yn } ⊂ U tel que xn → x et yn → y. Par convexité
de U , pour tout λ ∈ [0, 1],
U ∋ λxn + (1 − λ)yn → λx + (1 − λ)y.
Ainsi, λx + (1 − λ)y ∈ U et U est convexe.

Si int U = ∅, alors il est convexe par convention. Pour x, y ∈ int U , il existe
Bε (x) et Bη (y) tel que Bε (x) ⊂ U et Bη (y) ⊂ U et, pour tout λ ∈ [0, 1],
λx + (1 − λ)y ∈ λBε (x) + (1 − λ)Bη (y).

Mais,
λx + (1 − λ)y ∈ Bmin{ε,η} (λx + (1 − λ)y) ⊂ λBε (x) + (1 − λ)Bη (y) ⊂ U
et λx + (1 − λ)y ∈ int U .
(ii) Posons U = ∩α∈A Uα . Si U est vide, alors il est convexe par définition. Si
U n’est pas vide, on prend
x et y ∈ U = ∩α∈I Uα ⇒ ∀α ∈ A, x ∈ Uα , y ∈ Uα .
Pour tout λ ∈ [0, 1] et par convexité de Uα
∀α ∈ I, λx + (1 − λ)y ∈ Uα ⇒ λx + (1 − λ)y ∈ ∩α∈A Uα = U.
(iii) Comme int U 6= ∅, on prend un point x ∈ int U . Par convexité, pour tout
y ∈ ∂U , le segment [x, y] = {λx + (1 − λ)y : 0 ≤ λ ≤ 1} est dans U et [x, y[ =
{λx + (1 − λ)y : 0 < λ ≤ 1} ⊂ int U . Il existe donc une suite yn = x + (y − x)/(n + 1)
dans int U qui converge vers y, d’où le résultat.
4.2 Fonctions convexes directionnellement dérivables

Théorème 4.2. Soient U une partie convexe ouverte de Rn et f une fonction
dérivable dans toutes les directions en tout point de U .
(i) f est convexe sur U si et seulement si
∀x, y ∈ U, f (y) ≥ f (x) + f ′ (x; y − x). (4.1)
(ii) Si, en plus, f est Gateaux différentiable en tout point de U , alors f est
convexe sur U si et seulement si
∀x, y ∈ U, f (y) ≥ f (x) + ∇f (x) · (y − x). (4.2)
Démonstration. (i) (⇒) Pour tout λ ∈ ]0, 1[ ,
f (λy + (1 − λ)x) ≤ λf (y) + (1 − λ)f (x)

f (x + λ(y − x)) − f (x) ≤ λ(f (y) − f (x)).
En divisant par λ > 0 et en passant à la limite lorsque λ → 0, il vient
f ′ (x; y − x) ≤ f (y) − f (x).
(⇐) Réciproquement, on applique la condition de deux façons pour λ ∈ [0, 1] et

x, y ∈ U
f (x) ≥ f (x + λ(y − x)) + f ′ (x + λ(y − x); −λ(y − x))

f (y) ≥ f (x + λ(y − x)) + f ′ (x + λ(y − x); (1 − λ)(y − x)).
On multiplie la première inégalité par 1 − λ et la seconde par λ. On les additionne.

Comme U est convexe, x + λ(y − x) ∈ U , et, par homogénéité, f ′ (x + λ(y − x); −(y −
x)) = −f ′ (x + λ(y − x); y − x). Il vient
(1 − λ)f (x) + λf (y) ≥ f (x + λ(y − x))
et la convexité de f sur U .
(ii) Comme f est Gateaux différentiable, il y a un gradient et f ′ (x; v) =
∇f (x) · v. Il suffit alors de substituer dans la partie (i).
Théorème 4.3. Soient U une partie convexe ouverte de Rn et f une fonction

dérivable dans toutes les directions en tout point de U .
(i) f est strictement convexe sur U si et seulement si
∀x, y ∈ U, x 6= y, f (y) > f (x) + f ′ (x; y − x). (4.3)
(ii) Si, en plus, f est Gateaux différentiable en tout point de U , alors f est
strictement convexe sur U si et seulement si
∀x, y ∈ U, x 6= y, f (y) > f (x) + ∇f (x) · (y − x). (4.4)
Démonstration. (i) Si f est strictement convexe sur U on a (4.1) par le Théorè-

me 4.2. Donc pour x et y dans U tel que x 6= y et t ∈ ] 0, 1 [,
f ′ (x; t(y − x)) ≤ f (x + t(y − x)) − f (x).
Par homogénéité positive t f ′ (x; y − x) = f ′ (x; t(y − x)). Comme f est strictement
convexe,
f (x + t(y − x)) − f (x) =f ((1 − t)x + ty) − f (x)

< (1 − t)f (x) + tf (y) − f (x) = t [f (y) − f (x)]
⇒ tf ′ (x; (y − x)) < t [f (y) − f (x)].
En divisant par t on obtient (4.3). La démonstration de la réciproque est la même

que celle du Théorème 4.2 mais avec λ ∈ ]0, 1[ et x 6= y.
(ii) Comme f est Gateaux différentiable, le gradient existe et f ′ (x; v) = ∇f (x)·
v. Il suffit alors de substituer dans la partie (i).
Pour le théorème suivant, on rappelle la définition suivante.
Définition 4.2.
Une matrice symétrique A est définie positive (resp. semi-définie positive) si
∀x ∈ Rn , x 6= 0, (Ax) · x > 0 (resp. ∀x ∈ Rn , (Ax) · x ≥ 0).
On écrira A > 0 (resp. A ≥ 0).
Théorème 4.4. Soit f : U → R de classe C (2) dans un ouvert U de Rn .

(i) Si U est convexe, alors f est convexe sur U si et seulement si Hf (y) ≥ 0

en tout point y ∈ U .
(ii) S’il existe x ∈ U tel que Hf (x) > 0, alors il existe un voisinage convexe
V (x) de x tel que f soit strictement convexe sur V (x).
Remarque 4.1.
La réciproque de la partie (ii) du Théorème 4.4 n’est pas vraie. En effet, considérons
la fonction f (x) = x4 définie sur R. Sa dérivée seconde est donnée par f (2) (x) =
12x2 . Au point x = 0, f s’annule bien que f soit strictement convexe dans tout
voisinage de x = 0.
Démonstration du Théorème 4.4. On fera encore appel au Théorème de Taylor

(Théorème 2.6) appliqué à la fonction g(t) = f (x + t(y − x)). Pour tout x et y
dans U , il existe α ∈ ] 0, 1 [ tel que
1
f (y) = f (x) + ∇f (x) · (y − x) + Hf (x + α(y − x))(y − x) · (y − x).
2
(i) Si f est convexe sur U , on en conclut par le Théorème 4.2 que

1
0 ≤ f (y) − f (x) − ∇f (x) · (y − x) =Hf (x + α(y − x))(y − x) · (y − x).
2
Mais, comme U est ouvert, il existe r > 0 tel que Br (x) ⊂ U . Donc
Hf (x + αrb)b · b ≥ 0, ∀b ∈ B1 (0).
Comme f est de classe C (2) et que |αrb| < r, lorsque r tend vers 0,
Hf (x)b · b ≥ 0, ∀b ∈ B1 (0) ⇒ ∀v ∈ Rn , Hf (x)v · v ≥ 0,
et l’on a Hf (x) ≥ 0 pour tout x ∈ U . Réciproquement, pour tout x et y dans U ,
il existe α ∈ ]0, 1[ tel que
1
f (y) − f (x) − ∇f (x) · (y − x) = Hf (x + α(y − x))(y − x) · (y − x) ≥ 0
2
puisque x + α(y − x) ∈ U et que, par hypothèse, Hf (x + α(y − x)) ≥ 0. La fonction
f est donc convexe par le Théorème 4.2.
(ii) Si Hf (x) > 0 pour x ∈ U , alors par continuité, il existe r > 0 tel que
Br (x) ⊂ U et ∀y ∈ Br (x), Hf (y) > 0.
On utilise maintenant le théorème de Taylor (Théorème 2.6) dans Br (x). Alors
pour tout y et z dans Br (x), y 6= z, il existe α ∈ ]0, 1[ tel que
1
f (y) − f (z) − ∇f (z) · (y − z) = Hf (z + α(y − z))(y − z) · (y − z) > 0
2
puisque z + α(y − z) ∈ Br (x) et que, par hypothèse, Hf (z + α(y − z)) > 0. Donc
pour tout y et z dans Br (x), y 6= z,
f (y) − f (z) − ∇f (z) · (y − z) > 0
et, par le Théorème 4.3, f est strictement convexe sur Br (x).
4.3 Optimisation convexe : condition nécessaire et suffisante

Il est maintenant possible de traiter complètement le cas du minimum d’une
fonction objectif convexe Gateaux différentiable par rapport à un convexe. La condi-
tion nécessaire et suffisante sera ensuite spécialisée au cas des sous-espaces linéaire
et affine.
Théorème 4.5. Soient ∅ 6= U ⊂ Rn convexe et f : Rn → R une fonction convexe
et Gateaux différentiable dans U . Il existe un point minimisant de f dans U si et
seulement si
∃x ∈ U tel que ∀y ∈ U, ∇f (x) · (y − x) ≥ 0. (4.5)
Comme U est une partie convexe de Rn , la condition (4.5) signifie que U est
contenu dans le demi espace fermé défini par (cf. Figure 6.6)
{y ∈ Rn : ∇f (x) · (y − x) ≥ 0}.
Ensembles de niveau de f
x
1
2
∇f (x) 3
Figure 6.6. Tangence du convexe U à l’ensemble de niveau de f passant

par x ∈ U .
Démonstration. Si la condition (4.5) est vérifiée, alors on sait, par le Théorème 4.2,
que pour une fonction convexe Gateaux différentiable
∀y ∈ U, f (y) − f (x) ≥ ∇f (x) · (y − x) ≥ 0

⇒ ∀y ∈ U, f (y) ≥ f (x).
Le point x ∈ U minimise donc f par rapport à U . Réciproquement, s’il existe un

point x ∈ U qui minimise f par rapport à U , alors par convexité, pour tout y ∈ U
et t ∈ ]0, 1],
f (x + t(y − x)) − f (x)
f (x + t(y − x)) − f (x) ≥ 0 ⇒ ≥0 (4.6)
t
et comme f est Gateaux différentiable, en passant à la limite,
f (x + t(y − x)) − f (x)
∇f (x) · (y − x) = f ′ (x; y − x) = lim ≥0 (4.7)
tց0 t
ce qui complète la démonstration.
Corollaire 1. Sous les conditions du Théorème 4.5, on a les résultats suivants.
(i) Si U = S, un sous-espace linéaire, alors la condition (4.5) est équivalente
à :
∃x ∈ S tel que ∀y ∈ S, ∇f (x) · y = 0. (4.8)
En particulier, ∇f (x) ∈ S ⊥ .
(ii) Si U = A, un sous-espace affine, alors la condition (4.5) est équivalente
à :
∃x ∈ A tel que ∀y ∈ A, ∇f (x) · (y − x) = 0 (4.9)
ou, de façon équivalente,
∃x ∈ A tel que ∀y ∈ S, ∇f (x) · y = 0, (4.10)
où S est le sous-espace linéaire associé au sous-espace affine A. En parti-

culier, ∇f (x) ∈ S ⊥ (cf. Figure 6.7).
Remarque 4.2.
L’égalité (4.8) qui doit être vérifiée pour chaque y ∈ S est le prototype d’une
équation variationnelle qui implique ici que ∇f (x) ∈ S ⊥ et pas nécessairement
l’équation ∇f (x) = 0. Une équation variationnelle est donc une forme plus faible
d’équation.
Démonstration. (i) Si U = S, un sous-espace linéaire, alors pour tout y ∈ S, x ± y ∈

S. En substituant dans (4.5), il vient
∀y ∈ S, ±∇f (x) · y ≥ 0 ⇒ ∇f (x) · y = 0.
Réciproquement, on a
∇f (x) · x = 0 et ∀y ∈ S, ∇f (x) · y = 0 ⇒ ∀y ∈ S, ∇f (x) · (y − x) = 0 ≥ 0.
(ii) Comme U = A, un sous-espace affine, pour tout y ∈ A et α ∈ R, αy +

(1 − α)x ∈ A et
α∇f (x) · (y − x) = ∇f (x) · (αy + (1 − α)x − x) ≥ 0

Ensembles de niveau de f
x
1
U = A ou S 2
3
∇f (x)
Figure 6.7. Tangence du sous-espace affine A ou linéaire S à un ensemble

de niveau de f .
et ceci entraı̂ne ∇f (x)·(y − x) = 0 pour tout y ∈ A. Puisque A est affine, S = A− x

est un sous-espace linéaire par le Théorème 9.4 du Chapitre 3 et pour tout s ∈ S,
∇f (x) · s = 0. Donc, ∇f (x) ∈ S ⊥ . Réciproquement, S = A − x et pour tout y ∈ A,
∇f (x) · (y − x) = 0 ≥ 0.
Remarque 4.3.
Lorsque U est donné par
{x ∈ Rn : gj (x) ≤ 0, 1 ≤ j ≤ m}
pour des fonctions gj : Rn → R, 1 ≤ j ≤ m, convexes (et continues), alors U est

convexe (et fermé). De plus, si la fonction objectif f satisfait les hypothèses du
Théorème 4.5, alors la condition (4.5) est nécessaire et suffisante.
4.4 Optimisation différentiable sans contraintes : conditions

nécessaires
Par sans contraintes on entend le fait que les points minimisants se trouvent
dans l’intérieur de U , c’est-à-dire, que les contraintes imposées par U sont inactives.
Dans ces cas, seules intervienent les propriétés locales de la fonction et de ses dérivées
et l’on récupère la règle de Fermat qui dit que le gradient de f est zéro aux points de
U correspondant à des infima locaux. Le signe de la matrice hessienne complètera
la caractérisation de l’extremum en précisant par exemple s’il s’agit d’un minimum,
d’un maximum, ou d’autre chose.
Ce paragraphe donne les principales caractérisations des points réalisant un
minimum à l’aide du gradient et de la matrice hessienne. On considère une fonction
numérique f : Rn → R dont on cherche l’infimum par rapport à un ouvert U ⊂ Rn .
On pourra déduire les résultats pour le problème de maximisation en remplaçant f
par −f et en considérant l’infimum inf −f (U ).
Définition 4.3.
Soit U , ∅ 6= U ⊂ Rn .
(i) On dit que f : Rn → R a un minimum global dans U si
∃x ∈ U tel que ∀y ∈ U, f (x) ≤ f (y) (4.11)
(ii) On dit que f : Rn → R a un minimum local dans U s’il existe x ∈ U et un

voisinage V (x) de x tel que
∀y ∈ U ∩ V (x), f (x) ≤ f (y), (4.12)
c’est-à-dire, x est un minimum global dans U ∩ V (x).
Le théorème suivant donne des conditions pour l’existence d’un minimum local.
Elles deviennent nécessaires et suffisantes dans le cas quadratique.
Théorème 4.6. Soit f : Rn → R de classe C (2) dans une ouvert non vide U ⊂ Rn .
(i) Si f a un minimum local dans U , alors
∃x ∈ U, ∇f (x) = 0 et Hf (x) ≥ 0. (4.13)
(ii) Si
∃x ∈ U tel que ∇f (x) = 0
et s’il existe un voisinage convexe V (x) ⊂ U de x tel que
∀y ∈ V (x), Hf (y) ≥ 0, (4.14)
alors x est un minimum de f global dans V (x) et local dans U .

(iii) Si
∃x ∈ U, ∇f (x) = 0 et Hf (x) > 0, (4.15)
alors x est un minimum local de f dans U et il existe un voisinage V (x)

de x où x est l’unique minimum global de f .
Démonstration. (i) Si x est un minimum local de f dans U , alors il existe r > 0 tel
que
Br (x) ⊂ U et ∀y ∈ Br (x), f (y) ≥ f (x).
Donc, pour tout y dans Br (x) et t ∈ ]0, 1[ , x + t(y − x) ∈ Br (x) et
f (x + t(y − x)) ≥ f (x). (4.16)
Soit la fonction g(t) = f (x + t(y − x)). Alors pour y ∈ Br (x), |t| < 1 et |s| < 1, les
points x + s(y − x) et x + t(y − x) appartiennent à Br (x) et pour s 6= t,
g(s) − g(t) f (x + s(y − x)) − f (x + t(y − x))
=
s−t s−t
f (x + t(y − x) + (s − t)(y − x)) − f (x + t(y − x))
=
s−t
et, comme f est de classe C (1) dans U , la dérivée directionnelle de f en x + t(y − x)

dans la direction y − x existe et
g(s) − g(t)
g ′ (t) = lim
(s−t)→0 s−t
s6=t
f (x + t(y − x) + (s − t)(y − x)) − f (x + t(y − x))
= lim
(s−t)→0 s−t
s6=t
′
= f (x + t(y − x); y − x) = ∇f (x + t(y − x)) · (y − x).
Comme f est de classe C (2) , on obtient par le même processus que

g (2) (t) = d2 f (x + t(y − x); y − x; y − x) = Hf (x + t(y − x))(y − x) · (y − x).
Donc, de (4.16) pour t > 0,
g(t) − g(0) f (x + t(y − x)) − f (x)
= ≥0
t t
g(t) − g(0)
⇒ g ′ (0) = lim ≥ 0 ⇒ f ′ (x; y − x) = ∇f (x) · (y − x) ≥ 0
tց0 t
et donc
∀y ∈ Br (x), ∇f (x) · (y − x) ≥ 0.
Pour tout v ∈ Rn , v 6= 0, et
r v r
y = x± ∈ Br (x) ⇒ ± ∇f (x) · v ≥ 0 ⇒ ∀v ∈ Rn , ∇f (x) · v = 0
2 |v| 2|v|
et donc ∇f (x) = 0. Par le théorème de Taylor (Théorème 2.6), pour tout y ∈ Br (x),
il existe α ∈ ]0, 1[ tel que
1
g(1) = g(0) + g ′ (0) + g (2) (α).
2
Mais on a vu que
g (2) (α) = d2 f (x + α(y − x); y − x; y − x) = Hf (x + α(y − x))(y − x) · (y − x).
Il vient alors
1
2
Mais comme f (y) ≥ f (x) et ∇f (x) = 0, il reste
∀y ∈ Br (x), Hf (x + α(y − x)) (y − x) · (y − x) ≥ 0.
En prenant v 6= 0 dans Rn et y = x + r v/(2|v|),

r v v v
∀0 6= v ∈ Rn , Hf x + α · ≥0
2 |v| |v| |v|

r v
⇒ ∀v ∈ Rn , Hf x + α v · v ≥ 0.
2 |v|
Par continuité de Hf en x, en faisant tendre r vers 0, on obtient, pour tout v ∈ Rn ,

Hf (x) v · v ≥ 0 et la matrice hessienne Hf (x) est semi-définie positive.
(ii) Il suffit d’utiliser le théorème de Taylor (Théorème 2.6 comme dans la
partie (i). Pour tout y ∈ V (x), il existe α ∈ ]0, 1[ tel que
1
2
Mais ∇f (x) = 0 et comme V (x) est convexe, x+α(y −x) ∈ V (x) et, par hypothèse,
Hf (x + α(y − x)) ≥ 0 est semi-définie positive. Ceci entraı̂ne
f (y) ≥ f (x), ∀y ∈ V (x) ⊂ U.
Le point x ∈ U est donc un minimum de f global dans V (x) et local dans U .

(iii) En effet si Hf (x) > 0, alors comme f est de classe C (2) la matrice hes-
sienne Hf est continue et il existe une boule Br (x) ⊂ U tel que
∀y ∈ Br (x), Hf (y) > 0.
Comme ∇f (x) = 0 et que (4.14) est vérifiée dans Br (x), x est un minimum global
dans Br (x). De plus, pour tout y ∈ Br (x), y 6= x, il existe α ∈ ]0, 1[ tel que
1
f (y) = f (x) + ∇f (x) · (y − x) + Hf (x + α(y − x))(y − x) · (y − x)
2
⇒ ∀y ∈ Br (x) tel que y 6= x, f (y) > f (x).
Il y a donc bien unicité dans Br (x).
Les conditions du Théorème 4.6 deviennent nécessaires et suffisantes pour des

fonctions quadratiques.
Théorème 4.7. Soit f une fonction quadratique
déf 1
f (x) = Ax · x + b · x + c (4.17)
2
pour une matrice n × n symétrique A, b ∈ Rn et c ∈ R.
(i) f possède un minimum par rapport à Rn si et seulement si
∃x ∈ Rn tel que ∇f (x) = Ax + b = 0 et A ≥ 0. (4.18)
(ii) Il existe une solution minimisante unique de f dans Rn si et seulement si

A > 0.
Démonstration. (i) La condition est nécessaire par le Théorème 4.6 (i) et suffisante
par le Théorème 4.6 (ii) puisque Hf (y) = A = Hf (x) ≥ 0 dans V (x) = Rn .
(ii) On sait déjà de la partie (ii) qu’il existe x∗ minimisant si et seulement
si Ax∗ + b = 0 et A ≥ 0. Si A > 0, alors A ≥ 0, A est inversible et pour tout b
l’équation Ax∗ + b = 0 a pour unique solution x∗ = −A−1 b. Réciproquement, par

le théorème de Taylor (Théorème 2.6 en tenant compte du fait que Hf (x) = A,
1
f (x) − f (x∗ ) = ∇f (x∗ ) · (x − x∗ ) + A(x − x∗ ) · (x − x∗ ).
2
Si x∗ est l’unique point minimisant, ∇f (x∗ ) = 0 et
1
∀x 6= x∗ , 0 < f (x) − f (x∗ ) = ∇f (x∗ ) · (x − x∗ ) + A(x − x∗ ) · (x − x∗ )
2
1
= A(x − x∗ ) · (x − x∗ ).
2
En prenant x = x∗ + y, y 6= 0, il vient
1
∀y 6= 0, 0 < f (x∗ + y) − f (x∗ ) = Ay · y ⇒ A > 0.
2
5 Théorèmes de la fonction inverse, de la fonction

implicite et du rang
5.1 Théorème de la fonction inverse
Soit g : Rn → Rm une application arbitraire. Alors, si y ∈ Rm , on peut se
proposer de chercher l’ensemble des x ∈ Rn tels que
g(x) = y, (5.1)
c’est-à-dire, l’image réciproque g −1 {y}. Cela s’appelle aussi résoudre l’équation
(5.1). Si l’on considère maintenant (5.1) quelque soit la donnée y, il se peut que pour
chaque y l’équation (5.1) admette une solution et une seule. Dans ce cas l’équation
(5.1) définit x comme une fonction h(y) de y. Cette fonction est appelée la fonction
implicite définie par l’équation (5.1). Elle est caractérisée par la propriété
g(h(y)) = y. (5.2)
Naturellement, il est bien rare que d’aussi bonnes conditions soient réalisées.
Il arrivera souvent que, pour certaines valeurs de y, il n’y ait pas de solution en x,
et que, pour d’autres valeurs de y, il y ait plusieurs solutions en x, voire une infinité.
Le cas particulier que nous nous proposons d’étudier est le suivant : on suppose que
l’on ait une solution particulière de l’équation (5.1) x = x0 , y = y0 = g(x0 ). On
se propose de savoir si, pour les points suffisamment voisins du point y0 , l’équation
ne possèderait pas une solution et une seule en x, pourvu que l’on astreigne cette
solution x à être suffisamment voisine de x0 . Lorsqu’il en sera ainsi, on aura bien
implicitement défini une application inverse x = h(y) à partir de l’équation, tout
au moins dans un voisinage de (x0 , y0 ). L’interprétation géométrique est simple.
L’équation
g(x) − y = 0
5. Théorèmes de la fonction inverse, de la fonction implicite et du rang 261
définit une variété de Rn × Rm , et nous nous proposons d’exprimer cette “courbe”

sous la forme résolue habituelle en calculant x en fonction de y, au moins au voisi-
nage du point (x0 , y0 ).
Théorème 5.1 (Théorème de la fonction inverse). Soient f : Rn → Rn une appli-
cation de classe C (1) dans un ouvert O de Rn et a ∈ O tel que Df (a) soit inversible.
(i) Il existe des ouverts U et V dans Rn tels que
a ∈ U ⊂ O, f (a) ∈ V et f : U → V soit bijective. (5.3)
(ii) L’application réciproque (ou inverse) f −1 : V → U (qui existe selon (i)),

f −1 (f (x)) = x, x ∈ U, (5.4)
est de classe C (1) sur V et Df −1 (y) = [Df (f −1 (y))]−1 ou sous forme

condensée
Df −1 = [Df ◦ f −1 ]−1 sur V.
Remarque 5.1.
On peut aussi montrer que, sous les hypothèses du Théorème 5.1, f −1 est de classe
C (k) , k ≥ 2, si f est de classe C (k) .
Démonstration. (i) Dans un premier temps, on cherche une boule centrée en a

de rayon assez petit pour qu’elle soit contenue dans O et que la restriction de
l’application f à cette boule soit injective. On montre ensuite que l’image de cette
boule par f est un ouvert.
On pose b = f (a) et A = Df (a). Puisque A ∈ GL(n), on peut prendre α > 0
tel que
2α kA−1 kL(Rn ) = 1 (5.5)
(voir le Théorème 7.1 (i) du Chapitre 5). Comme f est de classe C (1) dans l’ouvert
O et que a ∈ O, il existe r > 0 assez petit pour que
Br (a) ⊂ O et ∀x ∈ Br (a), kDf (x) − Df (a)kL(Rn ) < α. (5.6)
À chaque y ∈ Rn , on associe la fonction

déf
x 7→ ϕy (x) = x + A−1 (y − f (x)) : Br (a) → Rn . (5.7)
Par défintion ϕy ∈ C (1) (Br (a)) et pour tout x ∈ Br (a)

Dϕy (x) = I − A−1 Df (x) = A−1 [A − Df (x)]
α 1
⇒ ||Dϕy (x)kL(Rn ) ≤ kA−1 kL(Rn ) kA − Df (x)kL(Rn ) < = .
2α 2
Par le Théorème 3.10
1
∀x1 , x2 ∈ Br (a), kϕy (x1 ) − ϕy (x2 )kRn ≤ kx1 − x2 kRn
2
et ϕy est lipschitzienne dans Br (a). Cette dernière propriété s’étend à Br (a) par le
Théorème 7.2 du Chapitre 4. On en déduit que f est injective sur Br (a). En effet,
s’il existe x1 , x2 ∈ Br (a) tel que f (x1 ) = f (x2 ), alors on a
ϕy (x1 ) − ϕy (x2 ) = x1 + A−1 (y − f (x1 )) − [x2 + A−1 (y − f (x2 ))] = x1 − x2

1
⇒ kx1 − x2 kRn = kϕy (x1 ) − ϕy f (x2 )kRn ≤ kx1 − x2 kRn
2
et nécessairement x1 = x2 . On a donc bien une bijection
déf déf
f : U = Br (a) → V = f (Br (a)). (5.8)
Puisque b = f (a) ∈ f (Br (a)), il ne reste plus qu’à montrer que V est ouvert.
Pour établir que V = f (Br (a)) est ouvert, on va montrer que tout point
y0 ∈ V est un point intérieur de V . Comme f est bijective, il existe x0 ∈ Br (a) tel
que f (x0 ) = y0 et il existe ρ > 0 tel que Bρ (x0 ) ⊂ Br (a).
On montre maintenant que Bαρ (y0 ) ⊂ V . Soient y ∈ Bαρ (y0 ) et la restriction
de l’application ϕy : Bρ (x0 ) ⊂ Br (a) → Rn . On a alors
ρ
kϕy (x0 ) − x0 kRn = kA−1 (y − f (x0 ))kRn = kA−1 (y − y0 )kRn < kA−1 kL(Rn ) αρ = .
2
Pour tout x ∈ Bρ (x0 ) ⊂ Br (a),
1 ρ
kϕy (x) − x0 kRn ≤ kϕy (x) − ϕy (x0 )kRn + kϕy (x0 ) − x0 kRn < kx − x0 kRn + < ρ
2 2
et ϕy (x) ∈ Bρ (x0 ). Donc ϕy (Bρ (x0 )) ⊂ Bρ (x0 ) ⊂ Bρ (x0 ) et
1
∀x1 , x2 ∈ Bρ (x0 ), kϕy (x1 ) − ϕy (x2 )kRn ≤ kx1 − x2 kRn .
2
Comme Bρ (x0 ) est un espace métrique complet et que ϕy est contractante, elle
possède un point fixe unique
x ∈ Bρ (x0 ), ϕy (x) = x,
par le Théorème 8.1 du Chapitre 4. Mais, par définition de ϕy , on voit que x = ϕy (x)
entraı̂ne y = f (x) ∈ f (Bρ (x0 )). Finalement
Bαρ (y0 ) ⊂ f (Bρ (x0 )) ⊂ f (Br (a)) = V
et tout point y0 ∈ V est un point intérieur de V . Ce qui conclut la démonstration

que V est ouvert.
(ii) On montre maintenant que f −1 est Fréchet différentiable et, a fortiori
continue, en b = f (a). Comme V = f (Br (a)) est ouvert, il existe β > 0 tel que
Bβ (b) ⊂ f (Br (a)). Pour v ∈ Bβ (0), v 6= 0, b + v ∈ f (Br (a)). On pose
déf
h = f −1 (b + v) − f −1 (b) 6= 0 ⇒ v = f (a + h) − f (a).
Avec cette définition, on obtient

f (a + h) − f (a) − Df (a)h = v − Df (a)h

= v − Df (a) f −1 (b + v) − f −1 (b)

= −Df (a) f −1 (b + v) − f −1 (b) − Df (a)−1 v
f −1 (b + v) − f −1 (b) − Df (a)−1 v khk f (a + h) − f (a) − Df (a)h
⇒ =− Df (a)−1 .
kvk kvk khk
On obtient finalement l’inégalité
kf −1 (b + v) − f −1 (b) − Df (a)−1 vk khk −1 kf (a + h) − f (a) − Df (a)hk
≤ kA k .
kvk kvk khk
Pour passer à la limite lorsque v → 0, il faut contrôller le quotient kvk/khk. On a
ϕb+v (a + h) − ϕb+v (a) = a + h + A−1 (b + v − f (a + h)) − a + A−1 (b + v − f (a))
= h − A−1 (f (a + h) − f (a)) = h − A−1 v
1 1 1
⇒ khk ≥ khk − kA−1 k kvk ⇒ kvk = kA−1 k kvk ≥ khk
2 2α 2
et khk ≤ kvk/α. À l’aide de cette dernière inégalité, h → 0 lorsque v → 0 et
kf −1 (b + v) − f −1 (b) − Df (a)−1 vk khk −1 kf (a + h) − f (a) − Df (a)hk
≤ kA k
kvk kvk khk
1 1 kf (a + h) − f (a) − Df (a)hk
≤ → 0.
α 2α khk
−1
Donc, f −1 est Fréchet différentiable en b et Df −1 (b) = Df (a)−1 = Df (f −1 (b)) .
(iii) On a démontré en (ii) qu’en tout point a ∈ O tel que Df (a) est inversible,
f −1 est Fréchet différentiable et, a fortiori continu, en b = f (a) et Df −1 (b) =
−1
Df (f −1 (b)) . De (5.5) et (5.6), pour tout x ∈ Br (a),
2αkA−1 kL(Rn ) = 1 et kDf (x) − Ak < α
1
⇒ kDf (x) − AkL(Rn ) kA−1 kL(Rn ) < < 1.
2
Par le Théorème 7.1 (i) du Chapitre 5, comme Df (x) ∈ L(Rn ) et A ∈ GL(n),
Df (x) ∈ GL(n) et, a fortiori, Df (x) est inversible pour tout x ∈ Br (a). Donc,
pour tout y ∈ V = f (Br (a)), f −1 est Fréchet différentiable en y et Df −1 (y) =
−1
Df (f −1 (y)) . L’application inverse f −1 est donc continue sur V .
Comme x 7→ Df (x) est continue et que l’application A 7→ A−1 : GL(n) →
GL(n) est continue par le Théorème 7.1 (ii) du Chapitre 5, l’application x 7→
Df (x) 7→ Df (x)−1 : U = Br (a) → L(Rn ) est continue. Il s’ensuit que l’application
résultant des trois applications continues
y 7→ f −1 (y) 7→ Df (f −1 (y)) 7→ Df −1 (y) = [Df (f −1 (y))]−1 : V → L(Rn )
| {z }
y7→Df −1 (y)
est continue sur V et que f −1 est de classe C (1) sur V .

5.2 Théorème de la fonction implicite

Étant donnée la fonction de deux variables
f (x, y) = x2 + y 2 − 1,
on cherche les points x ∈ R tel que f (x, y) = 0. Si |y| > 1, il n’y a pas de solution ;
si |y| = 1, il n’y a une solution x = 0 ; si |y| < 1, il n’y a deux solutions. Ceci induit
une fonction multivoque
( )
déf 0, si |y| = 1
y 7→ g(y) = p : [−1, 1] → P([−1, 1]).
± 1 − y2, si |y| < 1
Si le couple (a, b) est une solution de f (a, b) = 0 telle que ∂f /∂x(a, b) = 2a 6= 0,

alors |b| < 1 et il existe un voisinage V (a, b) de (a, b) assez petit pour que l’équation
f (x, y) = 0 dans V (a, b)
possède une solution unique x pour chaque y tel que (x, y) ∈ V (a, b). L’application
multivoque g devient alors univoque d’où la terminologie application implicite.
Dans un premier temps, on considère une fonction linéaire A : Rn+m → Rn
puis ensuite une fonction vectorielle f : Rn+m → Rn de classe C (1) dans un ouvert
O ⊂ Rn+m . Dans ce contexte, il est important de préciser la notation qui sera
utilisée.
Notation 5.1. (i) Si x = (x1 , . . . , xn ) ∈ Rn et y = (y1 , . . . , ym ) ∈ Rm , on

notera par (x, y) le point
déf
(x, y) = (x1 , . . . , xn , y1 , . . . , ym ) ∈ Rn+m .
Le premier élément de (x, y) sera toujours dans Rn et le second dans Rm .

(ii) On adoptera aussi la décomposition suivante d’un application linéaire A ∈
L(Rn+m , Rn ) en la somme de deux applications linéaires Ax ∈ L(Rn , Rn )
et Ay ∈ L(Rm , Rn ) :
déf déf
h 7→ Ax h = A(h, 0) : Rn → Rn et k 7→ Ay k = A(0, k) : Rm → Rn (5.9)
⇒ A(h, k) = Ax h + Ay k ou A = [Ax Ay ]. (5.10)
Théorème 5.2. Soit A ∈ L(Rn+m , Rn ) telle que Ax soit inversible. Alors, pour
tout k ∈ Rm , il existe une solution unique h ∈ Rn à l’équation A(h, k) = 0 ce qui
définit implicitement la fonction solution
déf m n
k 7→ g(k) = −A−1
x Ay k : R → R (5.11)
qui appartient à L(Rm , Rn ).

Démonstration. De la décomposition de A, l’équation A(h, k) = 0 est équivalente à
Ax h + Ay k = 0 ⇒ h = −A−1
x Ay k
puisque Ax est inversible.

Théorème 5.3 (Théorème de la fonction implicite). Soit f : Rn+m → Rn une
application de classe C (1) dans un ouvert O ⊂ Rn+m tel qu’il existe (a, b) ∈ O
vérifiant f (a, b) = 0. On suppose que l’application linéaire
h 7→ Df (a, b)(h, 0) : Rn → Rn
est inversible.
(i) Il existe des ouverts U ⊂ Rn+m et V ⊂ Rm tel que (a, b) ∈ U et b ∈ V
vérifiant :
∀y ∈ V, ∃x ∈ Rn unique tel que (x, y) ∈ U et f (x, y) = 0. (5.12)
Ceci induit l’ application implicite y 7→ g(y) = x : V → Rn .

(ii) L’application g vérifie g(b) = a et
∀y ∈ V, (g(y), y) ∈ U et f (g(y), y) = 0. (5.13)
Elle est de classe C (1) sur V , et

−1
∀y ∈ V, Dg(y) = − [Df (g(y), y)x ] Df (g(y), y)y , (5.14)
où [Df (g(y), y)x Df (g(y), y)y ] est la décomposition de Df (g(y), y) selon la
notation 5.1.
Démonstration. On pose A = Df (a, b) avec la notation A = [Ax Ay ], où en fait
Ax = Dx f (a, b) et Ay = Dy f (a, b). On se ramene au théorème précédent en intro-
duisant l’application
déf
(x, y) 7→ F (x, y) = (f (x, y), y) : Rn+m → Rn+m (5.15)
pour laquelle F (a, b) = (0, b). Elle est, comme f , de classe C (1) sur O et

Df (x, y)x Df (x, y)y
DF (x, y) = ,
0 Im
où Im est la transformation identité sur Rm . Il faut montrer que DF (a, b) est in-
versible :

Df (a, b)x Df (a, b)y Ax Ay
DF (a, b) = = ∈ GL(n + m).
0 Im 0 Im
Cela revient à montrer que DF (a, b) est injective :

Ax Ay h 0 Ax h + Ay k = 0 h = −A−1
x Ay k = 0
= ⇒ ⇒
0 Im k 0 k=0 k = 0.
On peut donc invoquer le Théorème 5.1. Il existe deux ouverts U et U ′ dans Rn+m
tels que (a, b) ∈ U et (0, b) = (f (a, b), b) ∈ U ′ pour lesquels F : U → U ′ = F (U ) est
une bijection. Soit
déf
V = {y ∈ Rm : (0, y) ∈ U ′ }
qui est ouvert et contient b puisque U ′ est ouvert et contient (0, b). Donc, pour
tout y ∈ V , il existe x ∈ Rn tel que (x, y) ∈ U et F (x, y) = (0, y), c’est-à-dire,
f (x, y) = 0 et y = y. Ce point x est unique, car s’il existait un autre x′ ∈ Rn avec
ces propriétés, on aurait F (x, y) = F (x′ , y) et, comme F est injective, x = x′ . On a
donc implicitement construit l’application
déf
y 7→ g(y) = x : V → Rn tel que f (g(y), y) = 0 sur V. (5.16)
Toujours du Théorème 5.1, l’application inverse
(g(y), y) = F −1 (0, y)
est de classe C (1) sur U ′ = F (U ). L’application g est donc aussi de classe C (1) sur
V . Comme F est bijective, F (g(b), b) = (0, b) = F (a, b) entraı̂ne g(b) = a. Enfin,
en faisant appel à la règle de différentiation de la composition, la différentielle de
l’équation F (g(y), y) = (0, y) par rapport à y donne

Dg(y) Df (g(y), y)x Df (g(y), y)y Dg(y)
DF (g(y), y) =
Im 0 Im Im
⇒ Df (g(y), y)x Dg(y) + Dyf (g(y), y)= 0
⇒ Dg(y) = − [Df (g(y), y)x ]−1 Df (g(y), y)y .
En particulier, Dg(b) = −A−1

x Ay comme dans le cas linéaire.
5.3 Théorèmes du rang et des multiplicateurs de Lagrange

Il existe plusieurs versions du théorème du rang (cf. W. Rudin [1], A. Dont-
chev et R. T. Rockafellar [1]). Nous en donnons une version simple qui convient
à l’optimisaton différentiable en présence de contraintes de type égalité, c-à-d., le
théorème des multiplicateurs de Lagrange.
On rappelle qu’une application f : Rn → Rm peut s’écrire sous la forme
m
X
déf n m
x 7→ f (x) = (f1 (x), . . . , fm (x)) = fi (x) em
j :R →R ,
i=1
où fi : Rn → R, 1 ≤ i ≤ m, sont les composantes de f et {em

i : 1 ≤ i ≤ m} est la
base canonique orthonormale dans Rm . Lorsque f est Fréchet différentiable en x,
l’application
v 7→ Df (x)v : Rn → Rm
est linéaire. En introduisant la base orthonormale canonique {enj : 1 ≤ j ≤ n} de

Rn , on a la dérivée partielle par rapport à la j-ème composante de x de la i-ème
composante de f
∂j fi (x) = em n
i · Df (x)ej , 1 ≤ i ≤ m, 1 ≤ j ≤ n.
On utilisera aussi la notation ∂fi /∂xj (x). On pourra vérifier que

 
m
X n
X n
X Xm
v= vj em
j 7→ Df (x)v = [Df (x)v]i em
i =  ∂j fi (x) vj  em
i . (5.17)
j=1 i=1 i=1 j=1
On associe à Df (x) la matrice jacobienne [Df (x)] des dérivées partielles premières
des composantes de f :
 
∂f1 ∂f1
(x) ... ... (x)
 ∂x1 ∂xn 
 
 ∂f2 .. ∂f2 
déf  (x) . (x) 
[Df (x)]ij = [Df (x)ej ]i , c-à-d., [Df (x)] = 
n ∂x
 1.
∂xn  . (5.18)

 .. .. .. 
 . . 
 ∂f ∂fm 
m
(x) ... ... (x)
∂x1 ∂xn
C’est une matrice m × n. On utilisera la même notation Df (x) pour l’application

jacobienne dans L(Rn , Rm ) et la matrice jacobienne [Df (x)] de dimension m×n qui
lui est associée. On rappelle que l’on peut associer à l’application linéaire Df (x0 ) ∈
L(Rn , Rm ) l’application transposée Df (x0 )⊤ ∈ L(Rm , Rn ) pour laquelle
∀h ∈ Rn , ∀α ∈ Rm , Df (x)h · α = h · Df (x)⊤ α
ce qui permet d’exprimer Df (x)⊤ en termes des gradients des composantes de f :

m
X
α = (α1 , . . . , αm ) 7→ Df (x)⊤ α = αj ∇fj (x) : Rm → Rn . (5.19)
j=1
Définition 5.1.
Lorsque f : Rn → Rm est Gateaux différentiable en un point x0 , on dira que x0 est
un point régulier de f si l’application Df (x0 ) : Rn → Rm est surjective 33 (ou, de
façon équivalente, si la matrice jacobienne est de rang maximum m). Sinon, on dit
que x0 est un point singulier de f .
Remarque 5.2.
Pour que f : Rn → Rm ait des points réguliers, il est nécessaire que n ≥ m. Dans le
cas m = 1, un point x0 sera régulier si et seulement si le gradient ∇f (x0 ) 6= 0.
33. On dit aussi que f est une submersion au point x0 .
Remarque 5.3.
Lorsque f est un point régulier de f , Df (x) est surjective et donc Df (x)⊤ est
injective. De là, la composée Df (x)Df (x)⊤ ∈ L(Rm , Rm ) est inversible puisque
Df (x)Df (x)⊤ α = 0 ⇒ 0 = α · Df (x)Df (x)⊤ α = kDf (x)⊤ αk2

⇒ Df (x)⊤ α = 0 ⇒ α = 0.
La matrice associée à Df (x)Df (x)⊤ est non seulement inversible mais aussi définie
positive.
Théorème 5.4 (Théorème du rang). Soit f : Rn → Rm , n ≥ m, une fonction de

classe C (1) dans un voisinage d’un point régulier x0 (c.-à-d., Df (x0 ) ∈ L(Rn , Rm )
est surjective). Alors pour tout h ∈ Rn , il existe t0 > 0 et une fonction x : ]−t0 , t0 [ →
Rn de classe C (1) tel que
(
x(0) = x0
et f (x(t)) = f (x0 ) + tDf (x0 )h, −t0 < t < t0 . (5.20)
x′ (0) = h
Démonstration. On se ramène au Théorème 5.3 en introduisant pour α ∈ Rm et

t ∈ R la fonction γ : Rm × R → Rm définie par
déf
γ(α, t) = f x0 + Df (x0 )⊤ α + th − f (x0 ) − Df (x0 )(th), (5.21)
où Df (x0 )⊤ α est donnée par (5.19). Par construction, γ(0, 0) = 0 et
Dα γ(α, t) = Df (x0 + Df (x0 )⊤ α + th)Df (x0 )⊤ , Dα γ(0, 0) = Df (x0 )Df (x0 )⊤ ,

Dt γ(α, t) = Df (x0 + Df (x0 )⊤ α + th) h − Df (x0 ) h.
Comme Df (x0 ) est surjective, la matrice Df (x0 ) Df (x0 )⊤ est définie positive et
donc inversible.
Pour compléter la définition de γ, il faut s’assurer prendre des paires (α, t)
suffisamment proches de (0, 0) pour que x0 + Df (x0 )⊤ α + th soit dans le voisinage
V (x0 ) de x0 où f est définie. Il existe r > 0 tel que B2r (x0 ) ⊂ V (x0 ). On peut alors
prendre
déf déf r déf r
(α, t) ∈ O = Bρ (0) × (−δ, δ), ρ = , δ = ,
kDf (x0 ) Df (x0 )⊤ k1/2 khk + 1
puisque Df (x0 ) Df (x0 )⊤ 6= 0.

On est donc dans les conditions du Théorème 5.3 : il existe des ouverts U ⊂ O
et V ⊂ (−δ, δ) tel que (0, 0) ∈ U et 0 ∈ V vérifiant :
∀t ∈ V, ∃x = g(t) ∈ Rm unique tel que (g(t), t) ∈ U et γ(g(t), t) = 0. (5.22)
L’application implicite g : V → Rm est de classe C (1) sur V , g(0) = 0 et

−1
g ′ (t) = Dg(t) = − [Dγ(g(t), t)α ] Dγ(g(t), t)t . (5.23)
Donc, en explicitant

0 = γ(g(t), t) = f x0 + Df (x0 )⊤ g(t) + th − f (x0 ) − Df (x0 )(th),
g ′ (0) = −[Df (x0 ) Df (x0 )⊤ ]−1 (Df (x0 ) h − Df (x0 ) h) = 0.
On pose
déf déf
x(t) = x0 + Df (x0 )⊤ g(t) + th ⇒ x(0) = x0 + Df (x0 )⊤ g(0) = x0 .
Comme g(0) = 0 et g ′ (0) = 0, il vient

déf déf
x′ (t) = Df (x0 )⊤ g ′ (t) + h ⇒ x′ (0) = Df (x0 )⊤ g ′ (0) + h = h
0 = f (x(t)) − f (x0 ) − t Df (x0 )h.
Enfin, comme V est un voisinage de 0, il existe t0 > 0 tel que (−t0 , t0 ) ⊂ V . Donc,
comme g ∈ C (1) (V ), x ∈ C (1) ((−t0 , t0 )).
Comme application directe du dernier théorème, on considère la minimisation
d’une fonction f : Rn → R par rapport à m contraintes de type égalité de la forme
déf
U = {x ∈ Rn : gj (x) = 0, 1 ≤ j ≤ m} = {x ∈ Rn : g(x) = 0} (5.24)
pour une fonction vectorielle g = (g1 , . . . , gm ) : Rn → Rm . On cherche à caractériser
un minimum local
∃x ∈ U et ∃V (x) tel que ∀y ∈ U ∩ V (x), f (y) ≥ f (x).
Afin d’obtenir une condition nécessaire d’optimalité pour un U arbitraire, on
aura besoin d’une approximation locale de U en un point x ∈ U . Elle prendra la
forme d’un ensemble de demi-tangentes à U aux points de la frontière de U . En
effet, soit U un ensemble connexe et x ∈ U un point localement minimisant de f
par rapport à U : il existe un voisinage V (x) de x tel que f (y) ≥ f (x) pour tout
y ∈ U ∩ V (x). Chaque chemin ou trajectoire t 7→ h(t) : [0, t0 ) → Rn contenu dans
U ∩ V (x) se terminant en h(0) = x sera tel que f (h(t)) ≥ f (h(0)) = f (x). Si f est
Fréchet différentiable en h(0) = x et si le chemin est dérivable à droite en t = 0+ ,
c’est-à-dire, dh(0; +1) existe, alors
f (h(t)) − f (h(0))
0 ≤ lim = d(f ◦ h)(0; +1) = ∇f (x) · dh(0; +1)
tց0 t t=0+
par la règle de composition des différentielles des fonction composées. Le produit

scalaire du gradient de f avec la demi-tangente dh(0; +1) en t = 0+ à tous les
chemins h dans U ∩ V (x) est donc positif. La taille de la vitesse le long du che-
min peut être augmentée ou diminuée en introduisant la nouvelle paramétrisation
hλ (t) = h(λt) du chemin pour un λ > 0. On obtient alors dhλ (0; +1) = λdh(0; +1)
et ainsi toute la demi-droite tangente au chemin h au point x. Ceci engendre un cône
de demi-tangentes en x à l’ensemble U . La définition suivante étend cette notion de
cône tangent à des ensembles U arbitraires (pas nécessairement connexes).
demi-tangente . x
dh(0; +1)
TU (x)
chemin h(t)
Figure 6.8. Demi-tangente dh(0; +1) au chemin h(t) dans U au point h(0) = x.
Définition 5.2.
Soient U ⊂ Rn et x ∈ U .
(i) On dit que h ∈ Rn est une direction admissible pour U en x (ou demi-
tangente en x à U ) s’il existe une suite {tn > 0}, tn ց 0 lorsque n → ∞,
pour laquelle
xn − x
∀n, ∃xn ∈ U tel que lim = h. (5.25)
n→∞ tn
(ii) TU (x) désignera l’ensemble 34 35 36 des directions admissibles de U en x.
Remarque 5.4.
S’il existe une fonction t 7→ x(t) : [0, t0 ) → U , t0 > 0, tel que x(0) = x et dx(0; +1) =
h, alors h ∈ TU (x). En effet, par hypothèse,
x(t) − x
lim = h. (5.26)
tց0 t
Il suffit de prendre les suites tn = t0 /(2n) et xn = x(t0 /(2n)).
Théorème 5.5. Soient ∅ = 6 U ⊂ Rn , f : Rn → R, et x ∈ U un minimisant local

de f par rapport à U . Si f est Fréchet différentiable en x, alors
∀h ∈ TU (x), ∇f (x) · h ≥ 0. (5.27)

34. TU (x) semble avoir été introduit indépendamment en 1930 par G. Bouligand [1] et
F. Severi [1] dans le même volume 9 des Annales de la Société Polonaise de Mathématiques
(Krakóv) fondées en 1921 par Stanislaw Zaremba. Bouligand l’appelle cône contingent du latin
contingere qui signifie toucher de tous les côtés. Chez Bouligand une direction admissible est
appelée une demi-tangente et chez M. R. Hestenes [1, p. 264] une tangente séquentielle. TU (x)
intervient dans plusieurs contextes comme celui de la géométrie où il est l’espace tangent en x à
U ou en théorie de la viabilité pour les équations différentielles ordinaires (cf. M. Nagumo [1].
35. Georges Louis Bouligand (1889–1979).
36. Francesco Severi (1879–1961).
Démonstration. Soit h ∈ TU (x) et {xn } ⊂ U et {tn > 0} les suites tel que (xn −
x)/tn → h. Comme xn → x, il existe N tel que
∀n > N, f (xn ) − f (x) ≥ 0.
Comme tn > 0,
f (xn ) − f (x) f (x + tn xntn−x ) − f (x)

0≤ =
tn tn
et comme f est Fréchet différentiable en x, en passant à la limite
f (x + tn xntn−x ) − f (x)
0≤ → ∇f (x) · h.
tn
Il reste à caractériser TU (x) pour U donné par (5.24). L’objectif est de démontrer
que pour des gj de classe C (1) dans un voisinage de x et une hypothèse sur la ma-
trice jacobienne de la fonction vectorielle g = (g1 , . . . , gm ) : Rn → Rm en un point
x0 ∈ U ,
TU (x0 ) = {h ∈ Rn : ∇gj (x0 ) · h = 0, 1 ≤ j ≤ m} = Ker Dg(x0 ). (5.28)
De là, comme Ker Dg(x0 ) est un sous-espace linéaire, l’inégalité ∇f (x0 ) · h ≥ 0 pour
h ∈ Ker Dg(x0 ) devient
∇f (x0 ) · h = 0, ∀h ∈ Ker Dg(x0 )
⇒ ∇f (x0 ) ∈ [Ker Dg(x0 )]⊥ = Im Dg(x0 )⊤
⇒ ∃λ ∈ Rm tel que ∇f (x0 ) + Dg(x0 )⊤ λ = 0
m
X
⇒ ∃λ = (λ1 , . . . , λm ) tel que ∇f (x0 ) + λj ∇gj (x0 ) = 0.
j=1
L’élément central de la démonstration de ce résultat est donc l’identité (5.28)

que l’on cherchera à établir sous des hypothèses raisonnables. On peut démontrer
facilement le résultat dans un sens.
Lemme 5.1. Soit x0 ∈ Rn , les fonctions gj : Rn → R, 1 ≤ j ≤ m, et
déf
U0 = {x ∈ Rn : gj (x) = gj (x0 ), 1 ≤ j ≤ m} .
Si les gj sont Fréchet différentiables en x0 , alors
TU0 (x0 ) ⊂ {h ∈ Rn : ∇gj (x0 ) · h = 0, 1 ≤ j ≤ m} = Ker g(x0 ). (5.29)
Démonstration. Par définition d’une direction admissible h de U0 en x0 , il existe
une suite {tn > 0}, tn ց 0 lorsque n → ∞, pour laquelle
xn − x0
∀n, ∃xn ∈ U0 , et lim = h.
n→∞ tn
Comme xn ∈ U0 , gj (xn ) = gj (x0 ), 1 ≤ j ≤ m, on peut écrire

gj (xn ) − gj (x0 ) gj (xn ) − gj (x0 )
∇gj (x0 ) · h = − − ∇gj (x0 ) · h
tn tn
 
gj x0 + tn xnt−x 0
− g j (x0 )
= − − ∇gj (x0 ) · h .
n
tn
Puisque (xn − x0 )/tn → h et que gj est Hadamard différentiable en x0 , le membre

de droite tend vers zéro et ∇gj (x0 ) · h = 0. On a donc bien (5.29).
Nous allons maintenant utiliser le Théorème 5.4 pour compléter le Lemme 5.1
Lemme 5.2. Soient x0 ∈ Rn , gj : Rn → R, 1 ≤ j ≤ m, des fonctions de classe
C (1) dans un voisinage de x0 et l’ensemble
déf
U0 = {x ∈ Rn : gj (x) = gj (x0 ), 1 ≤ j ≤ m} .
(i) Si x0 est un point régulier pour g, alors
TU0 (x0 ) = {h : ∇gj (x0 ) · h = 0, 1 ≤ j ≤ m} = Ker Dg(x0 ). (5.30)
(ii) Lorsque x0 est un point singulier de g, il existe λ = (λ1 , . . . , λm ) 6=

(0, . . . , 0) tel que
m
X
Dg(x0 )⊤ λ = λj ∇gj (x0 ) = 0. (5.31)
j=1
Démonstration. (i) Par le Lemme 5.1, TU0 (x0 ) ⊂ Ker Dg(x0 ). On montre mainte-
nant que tout h ∈ Ker Dg(x0 ) est une direction admissible. Comme x0 est un point
régulier, on a par le Théorème 5.4,
∃t0 > 0, ∃x : ] − t0 , t0 [ → Rn de classe C (1) tel que
x(0) = x0 , x′ (0) = h et g(x(t)) = g(x0 ) + tDg(x0 )h, −t0 < t < t0 .
Donc, si h ∈ Ker Dg(x0 ), alors Dg(x0 )h = 0,
∀t ∈ ] − t0 , t0 [ , g(x(t)) = g(x0 ) ⇒ x(t) ∈ U0
et
x(t) − x(0)
lim = x′ (0) = h.
t→0 t
Par définition d’un élément de TU0 (x0 ), h ∈ TU0 (x0 ) et Ker Dg(x0 ) ⊂ TU0 (x0 ).
(ii) Lorsque x0 est un point singulier pour g, l’application Dg(x0 ) n’est pas
surjective et il existe λ = (λ1 , . . . , λm ) 6= (0, . . . , 0) tel que
m
X
∀h ∈ Rn , (λ1 , . . . , λm ) · Dg(x0 )h = 0 ⇒ λj ∇gj (x0 ) = 0,
j=1
ou de façon équivalente Dg(x0 )⊤ λ = 0.

On donne maintenant plusieurs formes du théorème. 37
Théorème 5.6 (des multiplicateurs de Lagrange). Soient la fonction objectif f :

Rn → R et l’ensemble de contraintes
déf
U = {x ∈ Rn : gj (x) = 0, 1 ≤ j ≤ m} (5.32)
défini par des fonctions gj : Rn → R, 1 ≤ j ≤ m. On suppose que

a) f possède un minimum local au point x0 ∈ U par rapport à U ,
b) f est Fréchet différentiable au point x0 ,
c) gj : Rn → R, 1 ≤ j ≤ m, sont de classe C (1) dans un voisinage de x0 .
Alors, on a les propriétés suivantes.
(i) Si x0 est un point régulier de g, alors il existe λ ∈ Rm tel que
∇f (x0 ) + Dg(x0 )⊤ λ = 0 et g(x0 ) = 0. (5.33)
(ii) Si x0 est un point singulier de g, alors il existe 0 6= λ ∈ Rm tel que
Dg(x0 )⊤ λ = 0 et g(x0 ) = 0. (5.34)
(iii) Il existe (λ0 , (λ1 , . . . , λm )) ∈ R × Rm , pas tous nuls, tel que
λ0 ∇f (x0 ) + Dg(x0 )⊤ λ = 0 et g(x0 ) = 0. (5.35)
(iv) Il existe (λ0 , (λ1 , . . . , λm )) ∈ R × Rm ,, pas tous nuls, tel que

m
X
λ0 ∇f (x0 ) + λj ∇gj (x0 ) = 0 et gj (x0 ) = 0, 1 ≤ j ≤ m, (5.36)
j=1
ou, de façon équivalente,
∂L ∂L
(x0 , λ) = 0, 1 ≤ i ≤ n, et (x0 , λ) = 0, 1 ≤ j ≤ m, (5.37)
∂xi ∂λj
en introduisant le lagrangien
m
X
déf
L(x, λ) = λ0 f (x) + λj gj (x) (5.38)
j=1
pour x ∈ Rn et λ = (λ0 , λ1 , . . . , λm ) ∈ R × Rm .
37. Lagrange contribua considérablement à la théorie, et Legendre (Sur la manière de dis-
tinguer les maxima des minima dans le calcul des variations) en 1786 jeta les bases de la
détermination des maxima et minima. Dans son traité innovateur Mécanique analytique (J. L. La-
grange [1]) en 1788, Lagrange résuma tous les travaux faits dans le domaine de la mécanique
classique depuis Newton. C’est dans ce livre que Lagrange expose clairement la règle des multipli-
cateurs dans sa forme contemporaine.
(v) Les conditions des parties (i)-(iv) seront aussi vérifiées pour tout point x0
de U qui réalise un maximum local de f par rapport à U .
Remarque 5.5.
Comme l’indique la partie (v) du Théorème 5.6, son application donnera non seule-
ment les minima locaux, mais aussi les maxima locaux. Il faudra faire le tri et ne
retenir que les minima ou les maxima selon le problème envisagé.
Démonstration. (i) Par le Théorème 5.5, lorsque f est Fréchet différentiable dans
un voisinage d’un point x0 réalisant un minimum local, on a
∇f (x0 ) · h ≥ 0, ∀h ∈ TU (x0 ). (5.39)
Comme x0 ∈ U est un point régulier de g = (g1 , . . . , gm ), alors g(x0 ) = 0, et il vient,

par l’identité (5.30) du Lemme 5.2 (i), TU (x0 ) = Ker Dg(x0 ). Comme Ker Dg(x0 )
est un sous-espace linŕaire,
±∇f (x0 ) · h = ∇f (x0 ) · (±)h ≥ 0, ∀h ∈ Ker Dg(x0 ) (5.40)

⊥
⇒ ∇f (x0 ) · h = 0, ∀h ∈ Ker Dg(x0 ) ⇒ ∇f (x0 ) ∈ [Ker Dg(x0 )] (5.41)
Enfin, comme [Ker Dg(x0 )]⊥ = Im Dg(x0 )⊤ , il existe α ∈ Rm tel que
∇f (x0 ) − Dg(x0 )⊤ α = 0.
En prenant λ = −α, on obtient la première identité de (5.33). Comme x0 ∈ U ,

g(x0 ) = 0, et on obtient la seconde d’identité de (5.33). (ii) Lorsque x0 est un
point singulier pour g, on sait par le Lemme 5.2 (ii) qu’il existe λ = (λ1 , . . . , λm ) 6=
(0, . . . , 0) tel que
Dg(x0 )⊤ λ = 0.
(iii) On combine (i) en prenant λ0 = 1 dans les identitiés (5.35) et (ii) en

prenant λ0 = 0 dans les identitiés (5.35).
(iv) On explicite les identités (5.35) de la partie (iii) en utilisant l’expression
explicite de Dg(x0 )⊤ :
m
X
m ⊤
∀λ = (λ1 , . . . , λm ) ∈ R , Dg(x0 ) λ = λj ∇gj (x0 ).
j=1
(v) Si x0 ∈ U réalise un maximum local de f , il suffit de remplacer f par −f

pour se ramener au cas du minimum local. Par exemple pour la partie (iii), il existe
λ0 ≥ 0 et (λ1 , . . . , λm ) ∈ Rm , pas tous nuls, tel que
m
X
−λ0 ∇f (x0 ) + λj ∇gj (x0 ) = 0 et gj (x0 ) = 0, 1 ≤ j ≤ m. (5.42)
j=1
6. ◮ Déterminants et formules de changement de variable 275
En multipliant par −1,
m
X
λ0 ∇f (x0 ) + (−λj )∇gj (x0 ) = 0 et gj (x0 ) = 0, 1 ≤ j ≤ m. (5.43)
j=1
La condition de la partie (i) (pour un minimisant local) est donc vérifée avec λ′0 = λ0
et λ′j = −λj ∈ R, 1 ≤ j ≤ m, pour un maximisant local.
6 ◮ Déterminants et formules de changement de

variable
Dans son sens originel, le déterminant ≪détermine≫ l’existence et l’unicité de
la solution d’un système d’équations linéaires. Les déterminants furent introduits
en Occident à partir du XVIe siècle, soit bien avant les matrices, qui n’apparaissent
qu’au XIXe siècle. Il convient de rappeler que les Chinois furent les premiers à
utiliser des tableaux de nombres et à appliquer un algorithme maintenant connu
sous le nom de procédé d’élimination de Gauss-Jordan.
Une interprétation géométrique peut aussi être donnée au déterminant d’une
matrice carrée n×n à coefficients réels : sa valeur absolue donne le facteur par lequel
la surface (n = 2) ou le volume (n = 3) est multiplié suite à une transformation
de Rn par une application linéaire, alors que son signe indique si la transformation
préserve l’orientation. Ainsi une matrice 2 × 2 de déterminant −2, lorsqu’appliquée
à une région du plan d’aire finie, transformera cette région en une d’aire double tout
en changeant son orientation. Le déterminant apparait donc naturellement dans la
formule de changement de variables T : Rn → Rn de l’intégrale sur Rn sous la
forme de la valeur absolue du déterminant de la matrice jacobienne associée à la
transformation T .
Il y a plusieurs façons de développer la théorie des déterminants. Les unes sont
très élégantes d’autres moins. Que ce soit une approche combinatoire ou géométrique,
en faire un dévelopement complet avec toutes les connections et équivalences se-
rait trop lourd dans le cadre de ce cours. On en donnera donc que les principaux
résultats. On renvoie le lecteur à des traités d’algèbre comme, par exemple, ceux de
S. Lang [1] ou I. N. Herstein [1].
Le déterminant d’une matrice A de dimension n × n peut être défini par la
formule de Leibniz ou par la formule de Laplace.
6.1 Formule de Leibniz

Cette première formule et le dévelopement qui lui est associé plairont sûrement
aux amateurs de combinatoire.
Définition 6.1.
Soit un entier n ≥ 1.
(i) À chaque application τ : {1, . . . , n} → {1, . . . , n}, on associe sa signature

déf
Y
sgn (τ ) = signe (τ (j) − τ (i)) ,
1≤i<j≤n
où signe (x) est la fonction signe égale à −1, 0 ou +1 selon que x < 0,
x = 0 ou x > 0. On écrira aussi τ comme une suite (τ1 , . . . , τn ))
(ii) On appelera permutation de l’ensemble {1, . . . , n} une bijection
σ : {1, . . . , n} → {1, . . . , n} (6.1)
(on écrira aussi σ comme une suite (σ1 , . . . , σn )). On dénotera par Sn
l’ensemble de toutes les permutations de {1, . . . , n}. Sn est appelé le groupe
symétrique à n éléments 38
(ii) Une transposition est une permutation qui ne change que deux éléments.
(ii) On dit que la paire (i, j), 1 ≤ i < j ≤ n, est en inversion pour σ lorsque
σi > σj .
(iii) Une permutation σ est dite paire quand elle présente un nombre pair d’in-
versions (sgn (σ) = +1), impaire sinon (sgn (σ) = −1).
Remarque 6.1.
Par définition, sgn (τ ) 6= 0 si et seulement si τ ∈ Sn .
Exemple 6.1.
Pour n = 4, σ = (2, 4, 1, 3) est une permutation de (1, 2, 3, 4) avec σ1 = 2, σ2 = 4,
σ3 = 1, et σ4 = 3 ou sous la forme d’une matrice
i 1 2 3 4
σi 2 4 1 3
Il y a trois inversions (1, 3), (2, 3), (2, 4)

1 2 3 4 1 2 3 4 1 2 3 4
.
2 4 1 3 2 4 1 3 2 4 1 3
C’est une permutation impaire et la signature de σ est −1. S4 a 24 éléments.
Exemple 6.2.
Pour n = 4, σ = (1, 4, 3, 2), σ1 = 1, σ2 = 4, σ3 = 3, et σ4 = 2, ou

1 2 3 4
1 4 3 2
est une transposition de (1, 2, 3, 4) qui interchange 2 et 4. On peut montrer qu’une

transposition est toujours impaire.
38. Soit E un ensemble. On appelle groupe symétrique de E l’ensemble des applications bi-
jectives de E sur E muni de la composition d’applications (◦). On le note S(E) ou S(E). Le cas
E = {1, . . . , n} est un cas particulier pour lequel card Sn = n!.
Définition 6.2.
Étant donnée une matrice A de dimension n × n dont les entrées sont notées {ai,j },
X n
Y X
déf
dét (A) = sgn (σ) ai,σi = sgn (σ) a1,σ1 . . . an,σn (6.2)
σ∈Sn i=1 σ∈Sn
est applelé déterminant de A.
Exemple 6.3.
Le déterminant d’une matrice A de dimension 2 × 2 est
X 2
Y 2
Y 2
Y
sgn (σ) ai,σi = sgn ([1, 2]) ai,[1,2]i + sgn ([2, 1]) ai,[2,1]i
σ∈S2 i=1 i=1 i=1
2
Y 2
Y
= ai,[1,2]i − ai,[2,1]i = a1,1 a2,2 − a1,2 a2,1
i=1 i=1
Exemple 6.4.
Le déterminant d’une matrice A de dimension 3 × 3 est
X 3
Y
sgn (σ) ai,σi
σ∈S3 i=1
3
Y 3
Y
= sgn ([1, 2, 3]) ai,[1,2,3]i + sgn ([1, 3, 2]) ai,[1,3,2]i
i=1 i=1
3
Y 3
Y
+ sgn ([2, 1, 3]) ai,[2,1,3]i + sgn ([2, 3, 1]) ai,[2,3,1]i
i=1 i=1
Y3 Y3
+ sgn ([3, 1, 2]) ai,[3,1,2]i + sgn ([3, 2, 1]) ai,[3,2,1]i
i=1 i=1
3
Y 3
Y 3
Y
= ai,[1,2,3]i − ai,[1,3,2]i − ai,[2,1,3]i
i=1 i=1 i=1
3
Y 3
Y n
Y
+ ai,[2,3,1]i + ai,[3,1,2]i − ai,[3,2,1]i
i=1 i=1 i=1
= a1,1 a2,2 a3,3 − a1,1 a2,3 a3,2 − a1,2 a2,1 a3,3
+ a1,2 a2,3 a3,1 + a1,3 a2,1 a3,2 − a1,3 a2,2 a3,1
= a1,1 [a2,2 a3,3 − a2,3 a3,2 ] − a1,2 [a2,1 a3,3 − a2,3 a3,1 ] + a1,3 [a2,1 a3,2 − a2,2 a3,1 ].
Définition 6.3. (i) Une application

(a1 , . . . , an ) 7→ f (a1 , . . . , an ) : Rn × · · · × Rn → R (6.3)
| {z }
n fois
est multilinéaire si elle est linéaire par rapport à chaque vecteur ai (les
autres restant fixes).
(ii) Une application multilinéaire est alternée si f (a1 , . . . , an ) = 0 lorsqu’il
existe un indice i, 1 ≤ i ≤ n − 1, tel que ai = ai+1 .
Théorème 6.1. Soit f une application multilinéaire alternée.

(i) Changer l’ordre de deux vecteurs consécutifs, change le signe de f : par
exemple pour i < j
f (. . . , ai , ai+1 , . . . ) = −f (. . . , ai+1 , ai , . . . ). (6.4)
(ii) Ajouter un multiple α aj , α ∈ R, du vecteur ai en position j, i 6= j, au
vecteur ai en position i ne change pas f :
f (. . . , ai + α aj , . . . , aj , . . . ) = f (. . . , ai , . . . , aj , . . . ). (6.5)
| {z }
i-ème terme
(iii) Soit une suite (v1 , . . . , vn ) de Rn , une matrice B de dimension n × n et la

nouvelle suite (w1 , . . . , wn ) :
n
X
déf
wj = bj,i vi , 1 ≤ j ≤ n. (6.6)
i=1
Alors,
X
f (w1 , . . . , wn ) = b1,σ1 . . . bn,σn f (vσ1 , . . . , vσn )
σ∈Sn
X
= sgn (σ) b1,σ1 . . . bn,σn f (v1 , . . . , vn ) (6.7)
σ∈Sn
= dét (B) f (v1 , . . . , vn ).

(iv) Soit A = {ai,j } et B = {bi,j } deux matrices de dimension n × n. On leur
associe les suites de vecteurs (v1 , . . . , vn ) et (w1 , . . . , wn ) de Rn suivantes
n
X n
X
déf déf
wj = bj,i vi , 1 ≤ j ≤ n, vj = aj,i ei , 1 ≤ j ≤ n. (6.8)
i=1 i=1
Alors, pour toute forme multilinéaire alternée f ,

n
X
wj = (AB)j,i ei , f (w1 , . . . , wn ) = dét (AB) f (e1 , . . . , en ) (6.9)
i=1
f (w1 , . . . , wn ) = dét (B) f (v1 , . . . , vn ) = dét (B) dét (A) f (e1 , . . . , en ) (6.10)
dét (AB) f (e1 , . . . , en ) = dét (BA) f (e1 , . . . , en ). (6.11)
Démonstration. (i) Par définition d’une application multilinéaire alternée,
0 = f (. . . , ai + ai+1 , ai+1 + ai , . . . )
| {z } | {z }
terme i terme i+1
= f (. . . , ai , ai+1 , . . . ) + f (. . . , ai+1 , ai , . . . ).
|{z} |{z} |{z} |{z}
terme i terme i+1 terme i terme i+1
(ii) Par linéarité par rapport au i-ème vecteur
f (. . . , ai + α aj , . . . , aj , . . . ) = f (. . . , ai , . . . , aj , . . . ) + α f (. . . , aj , . . . , aj , . . . )
= f (. . . , ai , . . . , aj , . . . )
puisque, de la partie (i), on peut ramener dans f (. . . , aj , . . . , aj , . . . ) le second terme

qui contient aj à côté du premier f (. . . , aj , , aj , . . . ) à un signe près et que ce terme
est nul pour une application multilinéaire alternée.
(iii) En substituant et en développant par multilinéarité
n
X n
X n
X
f (w1 , . . . , wn ) = f ( b1,j1 vj1 , b2,j2 vj2 , . . . , bn,jn vjn )
j1 =1 j2 =1 jn =1
n
X X n Xn
= b1,j1 f (vj1 , b2,j2 vj2 , . . . , bn,jn vjn ) (6.12)
j1 =1 j2 =1 jn =1
X n n
X
= ... b1,j1 . . . bn,jn f (vj1 , . . . , vjn ).
j1 =1 jn =1
Comme l’application multilinéaire est alternée, f (vj1 , . . . , vjn ) = 0 sauf dans le cas
où il existe σ ∈ Sn telle que σi = ji , 1 ≤ i ≤ n. On peut donc remplacer les n
sommes par une somme sur σ ∈ Sn
X
f (w1 , . . . , wn ) = b1,σ1 . . . bn,σn f (vσ1 , . . . , vσn )
σ∈Sn
X
= sgn (σ) b1,σ1 . . . bn,σn f (v1 , . . . , vn ) (6.13)
σ∈Sn
= dét (B) f (v1 , . . . , vn ),
puisque, par définition de sgn (σ), on a
f (vσ1 , . . . , vσn ) = sgn (σ) f (v1 , . . . , vn ). (6.14)
(iv) Par définition,

n n n n
" n # n
X X X X X X
wj = bj.i vi = bj,i ai,ℓ eℓ = bj,i ai,ℓ eℓ = (BA)j,ℓ eℓ
i=1 i=1 ℓ=1 ℓ=1 i=1 ℓ=1
⇒ f (w1 , . . . , wn ) = dét (BA) f (e1 , . . . , en )
de la partie (iii). On applique ensuite encore deux fois les résultats de la partie (iii) :
f (w1 , . . . , wn ) = dét (B) f (v1 , . . . , vn ) = dét (B) dét (A) f (e1 , . . . , en ).
Les autres propriétés découlent de ces dernières.

Théorème 6.2. (i) Si In est la matrice identité et A une matrice n×n, alors
dét In = 1 et dét (A⊤ ) = dét (A). (6.15)
(ii) L’application
déf
(a1 , . . . , an ) 7→ dét (a1 , . . . , an ) = dét ([a1 . . . an ]) : Rn × · · · × Rn → R,
| {z }
n fois
(6.16)
où [a1 . . . an ] est la matrice formée des n éléments ai rangés sous forme
de vecteurs colonnes, est multilinéaire. De plus, comme dét ([a1 . . . an ]) =
dét ([a1 . . . an ]⊤ ), il est équivalent de former la matrice à partir des n
éléments ai rangés sous forme de vecteurs lignes
 ⊤ 
a1
 .. 
dét (a1 , . . . , an ) = dét ([a1 . . . an ]) = dét  .  .
a⊤
n
(iii) dét (a1 , . . . , an ) change de signe si l’on permute deux de ses vecteurs consécutifs.
(iv) dét (a1 , . . . , an ) est nul si deux de ses vecteurs sont égaux.
Démonstration. (i) Si A = In , alors aii = 1 et aij = 0, i 6= j. Comme la seule
permutation pour laquelle le produit des ai,σi est non nul est la permutation identité
σi = i pour laquelle sgn (σ) = 1 et a1,σ1 . . . an,σn = a1,1 . . . an,n = 1. Il vient donc
dét (In ) = 1. Par définition,
X X
dét (A) = sgn (σ) a1,σ1 . . . an,σn , dét (A⊤ ) = sgn (σ) aσ1 ,1 . . . aσn ,n .
σ∈Sn σ∈Sn
(6.17)
Dans un produit aσ1 ,1 . . . aσn ,n , chaque entier i, 1 ≤ i ≤ n, apparait préciment une

fois parmi les entiers σ1 , . . . , σn . On peut donc réécrire ce produit sous la forme
a1,σ−1 . . . an,σn−1 .
1
−1
Puisque sgn (σ ) = sgn (σ), on obtient
X X
dét (A⊤ ) = sgn (σ −1 ) a1,σ−1 . . . an,σn−1 = sgn (σ) a1,σ1 . . . an,σn = dét (A)
1
σ∈Sn σ∈Sn
car, comme la sommation est par rapport à toutes les permutations σ ∈ Sn , elle
l’est aussi par rapport à toutes les permutations σ −1 ∈ Sn .
(ii) Chacun des n! termes de la sommation de l’expression (6.2)

X
dét ([a1 . . . an ]) = sgn (σ) a1,σ1 . . . an,σn (6.18)
σ∈Sn
contient exactement un élément de chaque colonne ai , d’où la linéarité.

(iii) Cette propriété se déduit du fait que changer l’ordre de deux de vecteurs
consécutifs revient à une inversion de deux termes consécutifs de chaque permuta-
tion σ ce qui produit un signe moins.
(iv) Si deux vecteurs colonnes sont égaux, on peut à un signe près supposer
que ces deux vecteurs colonnes égaux sont conécutifs. De (iii) en changeant l’orde
de ces deux vecteurs colonnes égaux, il vient trivialement
dét (. . . , ai , ai , . . . ) = −dét (. . . , ai , ai , . . . )
ce qui bien entendu donne zéro.
On peut maintenant compléter les propriétés du déterminant.
Théorème 6.3. Soit {ei } la base orthonormale canonique de Rn .
(i) Le déterminant
(a1 , . . . , an ) 7→ dét (a1 , . . . , an ) : Rn × · · · × Rn → R (6.19)
| {z }
n fois
est l’unique application multilinéaire alternée f telle que

f (e1 , . . . , en ) = 1. (6.20)
(ii) Pour toutes matrices A et B de dimension n × n

det(AB) = dét (A) dét (B) = dét (BA) (6.21)
et, si A est inversible, dét (A) 6= 0 et
1
dét (A−1 ) = .
dét (A)
(iii) (Règle de Cramer) Si A est inversible, pour tout b ∈ Rn , il existe x =
(x1 , . . . , xn ) ∈ Rn tel que Ax = b et
dét (a1 , . . . , ai−1 , b, ai+1 , . . . , an )
xi =
dét (A)
X n 1 ≤ i ≤ n. (6.22)
1
= dét (a1 , . . . , ai−1 , ej , ai+1 , . . . , an ) bj ,
dét (A) j=1
(iv) Les vecteurs {ai } de Rn sont linéairement dépendants si et seulement si

dét (a1 , . . . , an ) = 0.
En particulier, une matrice A de dimension n × n est inversible si et seule-
ment si dét (A) 6= 0.
Démonstration du Théorème 6.3. (i) On a montré au Théorème 6.2 que dét (A)
avait les propriétés désirées. L’unicité est maintenant la conséquence du Théorème
6.1 (iii).
(ii) Conséquence du Théorème 6.1 (iv) avec f (e1 , . . . , en ) = 1.
(iii) En utilisant les vecteurs colonnes a1 , . . . , an de A, l’équation Ax = b
devient
dét (a1 , . . . , ai−1 , b, ai+1 , . . . , an )

n X n
X
xj aj = b ⇒ = xj dét (a1 , . . . , ai−1 , aj , ai+1 , . . . , an )
j=1 j=1
= xi dét (a1 , . . . , ai−1 , ai , ai+1 , . . . , an ) = xi dét (A).
(iv) Si les vecteurs a1 , . . . , an sont linéairement dépendants, alors il existe

x = (x1 , . . . , xn ) ∈ Rn non nul tel que
n
X
xi ai = 0.
i=1
Si xj 6= 0, alors
X
aj = − xi ai ⇒ dét (a1 , . . . , an ) = 0.
1≤i≤n
i6=j
Réciproquement, si les vecteurs a1 , . . . , an sont linéairement indépendants, alors la

base orthonormale peut s’exprimer en fonction de ceux-ci
e1 = b11 a1 + · · · + b1n an
...
en = bn1 a1 + · · · + bnn an
Du Théorème 6.1 (iii)
1 = dét (e1 , . . . , en ) = dét (B) dét (a1 , . . . , an ) ⇒ dét (a1 , . . . , an ) 6= 0.
6.2 Formule de Laplace ou formule de récurrence

On peut aussi calculer le déterminant d’une matrice de dimension n à l’aide
de n déterminants de matrices de dimension n − 1 obtenues en enlevant à la matrice
de départ une ligne et une colonne. Si A est la matrice, pour tout i et j, on note
Ai,j la matrice obtenue en lui enlevant sa i-ème ligne et sa j-ème colonne :

 
a1,1 ... a1,j−1 a1,j+1 ... a1,n
 .. .. .. .. .. .. 
 . . . . . . 
 
a
déf  i−1,1 . . . a i−1,j−1 a i−1,j+1 . . . a 
i−1,n 
Ai,j =  .
a
 i+1,1 . . . a i+1,j−1 a i+1,j+1 . . . a i+1,n 
 . .. .. .. .. .. 
 .. . . . . . 
an,1 ... an,j−1 an,j+1 ... an,n
On a vu que si a1 , . . . , an sont les vecteurs colonnes de la matrice A
X
dét (a1 , . . . , an ) = sgn (σ) a1,σ1 . . . an,σn . (6.23)
σ∈Sn
Si on substitue pour aj sa représentation dans la base {ei }

n
X
aj = ai,j ei ,
i=1
il vient
dét (a1 , . . . , aj−1 , aj , aj+1 , . . . , an )
X n
= ai,j dét (a1 , . . . , aj−1 , ei , aj+1 , . . . , an )
i=1
n
X X
= ai,j sgn (σ) a1,σ1 . . . aj−1,σj−1 (ei )σj aj+1,σj+1 . . . an,σn
i=1 σ∈Sn
Xn X Y
= ai,j sgn (σ) aℓ,σℓ .
i=1 σ∈Sn 1≤ℓ≤n
σj =i ℓ6=j
σℓ 6=i
Pour chaque (i, j), les produits qui apparaissent dans le terme
X Y
sgn (σ) aℓ,σℓ
σ∈Sn 1≤ℓ≤n
σj =i ℓ6=j
σℓ 6=i
correspondent aux termes du déterminant de dét (Aj,i ) et seulement à ceux là

puisque la ligne j et la collonne i sont éliminées. Il ne reste plus qu’à vérifier que
les termes de la somme ont les bons signes.
Lemme 6.1. Pour toute paire (i, j),
X Y
dét (a1 , . . . , aj−1 , ei , aj+1 , . . . , an ) = sgn (σ) aℓ,σℓ
σ∈Sn 1≤ℓ≤n
σj =i ℓ6=j
σℓ 6=i
= (−1)i+j dét (Aj,i ) = (−1)i+j dét (Ai,j ).

Démonstration. Pour i = j = 1, on fait la somme par rapport à toutes les permu-

tations telles que σ1 = 1 ce qui revient à faire la somme par rapport à toutes les
permutations τ de {2, . . . , n}. Donc, sgn (σ) = sgn (τ ) et
X Y
sgn (σ) aℓ,σℓ = dét (A1,1 ).
σ∈Sn 1≤ℓ≤n
σ1 =1 ℓ6=1
σℓ 6=1
Pour (i, j), on fait remonter la ligne j de la matrice A en position 1 ce qui change le
signe de sgn (σ) par le facteur (−1)j−1 ; on déplace ensuite la colonne i de la matrice
résultante en position 1 ce qui change le signe de sgn (σ) par le facteur (−1)i−1 . On
obtient donc une nouvelle matrice A′ telle que a′1,1 = ai,j et comme les lignes et
colonnes restantes sont restées dans le même ordre on obtient la matrice Aj,i une
fois que la première ligne et la première colonne ont été envlevées. Enfin,
X Y X Y
sgn (σ) aℓ,σℓ = sgn (τ ) (−1)i−1+j−1 a′ℓ,τℓ .
σ∈Sn 1≤ℓ≤n τ ∈Sn 1≤ℓ≤n
σj =i ℓ6=i τ1 =1 ℓ6=1
σℓ 6=1 τℓ 6=1
De nouveau, comme on fait la somme par rapport à toutes les permutations telles
que τ1 = 1 cela revient à faire la somme par rapport à toutes les permutations τ ′
de {2, . . . , n} et
X Y X Y
sgn (σ) aℓ,σℓ = (−1)i+j sgn (τ ) (Aj,i )ℓ,τℓ
σ∈Sn 1≤ℓ≤n τ ∈Sn 1≤ℓ≤n
σj =i ℓ6=i τ1 =1 ℓ6=1
σℓ 6=1 τℓ 6=1
= (−1)i+j dét (Aj,i ).
Ce lemme mène à la formule de Laplace qui est itérative dans le sens que, une
fois connu la formule du déterminant des matrices de taille (n − 1) × (n − 1), on
obtient celle des matrices de taille n × n.
Théorème 6.4 (Formule de Laplace). On peut développer le calcul du déterminant
de A suivant une ligne ou une colonne d’une matrice A de dimension n × n :
(i) formule de développement par rapport à la colonne j
n
X
dét A = ai,j (−1)i+j dét (Ai,j );
i=1
(ii) formule de développement par rapport à la ligne i

n
X
dét (A) = ai,j (−1)i+j dét (Ai,j ).
j=1
Pour bien s’en convaincre. on peut vérifier que la formule de Laplace donne
bien le même résultat que la formule de Leibniz pour n = 3 dans l’Exemple 6.4 :
 
a11 a12 a13
dét a21 a22 a23 
a31 a32 a33

a a23
= a11 (−1)1+1 dét 22
a32 a33

1+2 a21 a23 1+3 a21 a22
+ a12 (−1) dét + a13 (−1) dét .
a31 a33 a31 a32
6.3 Comatrice ou matrice des cofacteurs et calcul de l’inverse

On introduit encore quelques définitions et notations.
Définition 6.4.
Le terme
déf
[M (A)]ij = dét (Ai,j ) (6.24)
est appelé le mineur de ai,j et le terme
déf
[Cof (A)]ij = (−1)i+j dét (Ai,j ) (6.25)
est appelé le cofacteur de ai,j . La matrice Cof (A) de dimension n × n est appelée
matrice des cofacteurs ou comatrice et est aussi dénotée com A.
Les formules du Théorème 6.4 portent le nom de développement suivant une ligne
(ou une colonne), méthode de Laplace ou méthode des cofacteurs ou des mineurs.
Avec ces définitions, il vient
A (Cof A)⊤ = (Cof A)⊤ A = (dét A) In . (6.26)
La matrice transposée de la comatrice est appelée matrice complémentaire de A.

Notamment, si A est inversible, l’inverse de A est un multiple de la matrice com-
plémentaire. Cette approche offre une formule de la matrice inverse ne nécessitant
que des calculs de déterminants.
Théorème 6.5. Soit A une matrice de dimension n × n.

(i) dét A⊤ = dét A et Cof A⊤ = (Cof A)⊤ .
(ii) dét A 6= 0 si et seulement si A est inversible. Dans ce cas
1 1
A−1 = Cof A⊤ = (Cof A)⊤ . (6.27)
dét A dét A
(iii) Cof (AB) = Cof (A) Cof (B).

6.4 Aire, volume et leur généralisation en dimension n > 3

Soient A une matrice de dimension n × n et {ei : i = 1, 2, . . . , n} la base ortho-
normale canonique de Rn . On représente les {ei } sous forme de vecteurs colonnes :
     
1 0 0
0 1 0
     
     
~e1 = 0 , ~e2 = 0 , . . . , ~en =  ...  . (6.28)
 ..   ..   
. . 0
0 0 1
La matrice identité I de dimension n × n est obtenue à partir de ces vecteurs :

I = ~e1 . . . ~en . (6.29)
Soient ~a1 , . . . , ~an les n vecteurs colonnes suivants
~ai = A ~ei , 1 ≤ i ≤ n, (6.30)
qui correspondent aux n colonnes de A, c’est-à-dire,

A = AI = A ~e1 . . . ~en = A~e1 . . . A~en = ~a1 . . .~an . (6.31)
L’ensemble convexe
( n
)
déf
X
C = αi ~ei : 0 ≤ αi ≤ 1
1=1
est l’hypercube dans Rn dont la longueur des arêtes est 1 et dont le volume est 1.
L’hypercube C est transformé par A en un hyper-parallélépipède
( n )
déf
X
AC = αi ~ai : 0 ≤ αi ≤ 1, 1 ≤ i ≤ n . (6.32)
1=1
On veut montrer que

Théorème 6.6. Soit A une matrice de dimension n × n, n ≥ 1, un entier. Alors,
le volume n-dimensionnel Vol(AC) de l’hyper-parallélépipède AC est égal à |détA|.
On aura besoin du lemme suivant.
Lemme 6.2. Soit a ∈ Rn et S un sous-espace linéaire de Rn . Il existe un point
unique â ∈ S tel que
déf
ka − âk = dS (a) = inf ka − sk (6.33)
s∈S
qui est complètement caractérisé par l’équation

∃â ∈ S, ∀s ∈ S, (a − â) · s = 0. (6.34)
n
L’application a →7 πS (a) = â : R → S est la projection de a sur S et le vecteur
b = a − â ∈ S ⊥ est orthogonal à S.
Démonstration du Lemme 6.2. (i) Existence et unicité. Comme la fonction x 7→

déf
f (x) = ka−xk : Rn → R est bornée inféreurement par 0, l’infimum m = inf s∈S ka−
sk sur S est un nombre positif ou nul. Le sous-ensemble S1 = {x ∈ S : ka − xk ≤
m + 1} est non vide et compact et m = inf s∈S ka − sk = inf s∈S1 ka − sk. Comme
l’image f (S1 )du compact S1 par la fonction continue f est compacte, m ∈ f (S1 ) et
il existe â ∈ S1 ⊂ S tel que m = f (â). Pour l’unicité, on utilise l’identité
kx + yk2 + kx − yk2 = 2(kxk2 + kyk2 )
de l’Exercice 10.3 du Chapitre 3. En effet, soient deux solutions minimisantes â1 et

â2 dans S :
ka − â1 k = m = ka − â2 k.
Le point (â2 + â1 )/2 ∈ S et en prenant x = a − â1 et y == a − â2
ka − â1 + a − â2 k2 + kâ1 − â2 k2 = 2(ka − â1 |2 + ka − â1 k2 ) = 4 m2

2
â1 + â2
4 m2 ≤ 4 a − = ka − â1 + a − â2 k2 + kâ1 − â2 k2 = 4 m2
2
ce qui entraı̂ne â1 = â2 et donc l’unicité.

(ii) Caractérisation. Par le Corollaire 1 au Théorème 4.5, il existe un point
minimisant si et seulement si la condition (6.34) est vérifiée.
Démonstration du Théorème 6.6. (i) Si les vecteurs ~a1 , . . . , ~an sont linéairement
dépendants, alors AC se trouve dans le sous-espace linéaire Lin (~a1 , . . . , ~an ) de di-
mension inférieure ou égale à n − 1. Le volume n-dimensionnel (n-volume) de AC
est donc 0 et le déterminant de la matrice A est aussi zéro car une de ses colonnes
est la combinaison linéaire des autres colonnes. Il est donc suffisant de démontrer le
théorème pour une famille de n vecteurs ~a1 , . . . , ~an linéairement indépendants (et
donc non nuls) dans Rn .
(ii) Pour le vecteur ~a1 , le 1-volume Vol(~a1 ) = k~a1 k, la longueur du vecteur ~a1 .
On pose ~b1 = ~a1 .
Pour deux vecteurs {~a1 , ~a2 }, le 2-volume Vol(~a1 , ~a2 ) = k~a1 k dLin (~a1 ) (~a2 ). Comme
Lin (~a1 ) = {α~a1 : α ∈ R} = Lin (~b1 ), la projection πLin (~b1 ) (~a2 ) = α̂1 ~b1 est ca-
ractérisée par
~a2 · ~b1 déf ~a2 · ~b1 ~

(~a2 − α̂1 ~b1 ) · ~b1 = 0 ⇒ α̂1 = ⇒ ~b2 = ~a2 − b1 .
k~b1 k2 k~b1 k2
Comme les ~ai sont linéairement indépendants, ~b2 6= 0, ~b2 · ~b1 = 0 et Vol(~a1 , ~a2 ) =
k~b1 k k~b2 k.
On considère trois vecteurs {~a1 , ~a2 , ~a3 }. Puisque Lin (~a1 , ~a2 ) = Lin (~b1 , ~b2 ) =
{α1~b1 + α2~b2 : αi ∈ R}, le 3-volume Vol(~a1 , ~a2 , ~a3 ) = Vol(~a1 , ~a2 ) dLin (~b1 ,~b2 ) (~a3 ). La
projection πLin (~b1 ,~b2 ) (~a3 ) = α̂1 ~b1 + α̂2 ~b2 est caractérisée par
~a3 · ~bi
(~a3 − α̂1 ~b1 − α̂2 ~b2 ) · ~bi = 0, i = 1, 2, ⇒ α̂i = , i = 1, 2,
k~bi k2
déf ~a3 · ~b1 ~ ~a3 · ~b2 ~
⇒ ~b3 = ~a3 − b1 − b2 .
k~b1 k2 k~b2 k2
Comme les ~ai sont linéairement indépendants, ~b3 6= 0 et ~b3 · ~bi = 0, i = 1.2.
À l’étape i ≥ 3, on construit le vecteur
i−1
X i
Y
~bi déf ~ai · ~bj ~bj , ~bi 6= 0, ~bi · ~bj = 0, 1 ≤ j ≤ i − 1,
= ~ai − Vol(~a1 , . . . , ~ai ) = k~bj k
j=1 k~bj k2 j=1
n
Y
Vol(AC) = Vol(~a1 , . . . , ~an ) = k~bj k.
j=1
Dans le processus de construction d’un ensemble de vecteurs orthogonaux

{~bi }, le déterminant de A n’a pas changé car, à chaque étape, on retranchait une
combinaison linéaire de colonnes de A de la colonne i, c’est-à-dire,
dét A = dét [~a1 . . . ~an ] = dét [~b1 . . . ~bn ]. (6.35)
D’autre part, pour la matrice B = [~b1 . . . ~bn ], la matrice B ⊤ B est diagonale puisque
(B ⊤ B)ij = ~bi · ~bj et que les vecteurs ~bi sont orthogonaux entre eux. Il vient donc
n
Y
B ⊤ B = diag{kb1 k2 , . . . , |bn k2 } ⇒ dét (B ⊤ B) = dét B ⊤ dét B = k~bj k2
j=1
 2
n
Y n
Y
⇒ |dét B| = 2
k~bj k ⇒ |dét A| = |dét B| = k~bj k = Vol(AC)
j=1 j=1
ce qui conclut la démonstration.
6.5 Formule de changement de variable pour l’intégrale de

volume
C’est cette propriété du déterminant qui mène à la formule de changement de
variables x 7→ x′ = T (x) : Rn → Rn dans l’intégrale sur Rn puisque localement, en
chaque point x, on aura
dx′ = |dét DT (x)| dx,
où apparaı̂t la valeur absolue du déterminant de la matrice jacobienne DT (x)

au point x qui est une approximation linéaire locale de la transformation T . Par
exemple, pour un domaine ouvert borné Ω dans Rn , cela donnera la formule

Z Z
f dx′ = f ◦ T |dét DT | dx (6.36)
T (Ω) Ω
Z Z
′ ′
f (x ) dx = f (T (x)) |dét DT (x)| dx, (6.37)
T (Ω) Ω
où T transforme le domaine Ω en un domaine Ω′ = T (Ω) et f : T (Ω) → Rn est une

fonction intégrable dans un sens approprié. En géométrie
déf
ωT (x) = |dét DT (x)| (6.38)
est appelée densité canonique (voir, par exemple, M. Berger et B. Gostiaux [1]).
Enfin, attention, il y a des hypothèses à vérifier sur T et f . En particulier, dét DT
ne doit pas changer de signe sur Ω.
6.6 Intégrale de ligne, de surface et de sous-variétés de

dimension supérieure
Un façon de définir une courbe dans le plan est d’introduite une application
continue T : R → R2 qui transformera l’intervalle [0, 1] en une courbe planaire
déf
C = {T (x) : 0 ≤ x ≤ 1} ⊂ R2 .
On dit que la courbe est simple si T est injective, c’est-à-dire, la courbe ne s’inter-
secte pas avec elle-même. Lorsque T est linéaire

a1 a
x 7→ T (x) = x : R → R , DT (x) = 1 ∈ L(R, R2 ),
2
(6.39)
a2 a2
pour un vecteur

a
~a = 1 ∈ R2 .
a2
Lorsque ~a n’est pas nul, la courbe est simple et correspond au vecteur partant de
l’origine dans R2 et se terminant au point ~a. Sa longueur est donc
s s q
q a1
a1
a21 + a22 = a1 a2 = dét a1 a2 = dét (DT (x)⊤ DT (x)).
a2 a2
On obtient ainsi une formule de changement de variable de la forme

Z Z 1 q
′ ′
f (x ) dx = f (T (x)) |dét [DT (x)⊤ DT (x)]| dx
C=T ([0,1]) 0
pour une fonction f : C → R où l’on a donné un sens à l’intégrale le long de la

courbe simple C dans le plan paramétrisée par T . Cette formule demeure valide
pour une application T différentiable et injective. Dans ce cas la densité canonique

de M. Berger et B. Gostiaux [1] devient
q
déf
ωT (x) = |dét [DT (x)⊤ DT (x)]| (6.40)
qui se reduit à |dét DT (x)| si T : Rn → Rn car |dét [DT (x)]| = |dét [DT (x)⊤ ]|.
Elle demeure vraie pour des courbes simples non-planaires dans Rn , n ≥ 3, en
introduisant une application différentiable et injective T : R → Rn .
On peut passer des courbes aux surfaces dans R3 ou en dimensions supérieures
en introduisant une application continue T : R2 → Rn , n ≥ 3, qui transformera le
carré [0, 1] × [0, 1] en une surface
déf
S = {T (x) : x ∈ [0, 1] × [0, 1]} ⊂ Rn .
Lorsque T est linéaire
   
a11 a12 a11 a12

x 7→ T (x) =  ... ..  x1 : R2 → Rn ,  ..
DT (x) =  . ..  ∈ L(R2 , Rn ),
.  x2 . 
an1 an2 an1 an2
pour une matrice n × 2
 
a11 a12
 ..  .
A =  ... . 
an1 an2
On obtient alors un parallélépipède P dans Rn généré par les deux vecteurs
   
a11 a12
   
~a1 =  ...  ~a2 =  ...  .
an1 an2
L’aire de P est alors donnée par la formule
r q
⊤
aire (P ) = dét ~a1 ~a2 ~a1 ~a2 = |dét (A⊤ A)|,
où A⊤ A est une matrice de dimension 2 × 2 et la densité canonique est

q
déf
ωT (x) = |dét [DT (x)⊤ DT (x)]|. (6.41)
On peut continuer ainsi et considérer une application injective différentiable

T : Rn → Rm , n ≤ m, et un domaine ouvert borné Ω dans Rn . On aura de nouveau
la formule de changement de variables
Z Z q
f (x′ ) dx′ = f (T (x)) |dét [DT (x)⊤ DT (x)]| dx
T (Ω) Ω
pour l’intégration d’une fonction f : T (Ω) → R sur la variété T (Ω) de dimension n

dans l’espace Rm , m ≥ n.
7. Exercices 291
7 Exercices
Exercice 7.1.
déf
Soient deux fonctions f, g : R → R et leur composition x 7→ (f ◦ g)(x) = f (g(x)) :
R → R. Montrer que si f (g(x)) et g (x) existent au point x alors la dérivée (f ◦g)′ (x)
′ ′
existe et est donnée par
(f ◦ g)′ (x) = f ′ (g(x)) g ′ (x).
Exercice 7.2.
Soit f : [a, b] → R telle que f ′ (x) existe et soit uniformément continue sur ]a, b[ .
Montrer que, pour tout ε > 0, il existe δ > 0 tel que
f (y) − f (x)
∀x, y ∈ ]a, b[ , 0 < |y − x| < δ, − f ′ (x) < ε.
y−x
On dit que f est uniformément dérivable sur ]a, b[ .
0.5
0.25
z
4
0
-0.25
2
-0.5
0
y 4
2
-2
0
x
-2
-4
-4
Figure 6.9. Fonction de l’Exercice 7.3.
Exercice 7.3.
Montrer que la fonction numérique (voir Figure 6.9)
 2
 xy , si x 6= 0
déf
f (x, y) = x2 + y 4

0, si x = 0
est dérivable en (x, y) = (0, 0) dans toutes les directions v = (v1 , v2 ), mais qu’elle
n’est ni différentiable au sens de Gateaux ni continue au point (x, y) = (0, 0).
Remarquer que l’on a les propriétés suivantes
x<0 ⇒ f (x, y) ≤ 0 et x>0 ⇒ f (x, y) ≥ 0

f (−x, y) = −f (x, y) et f (x, −y) = f (x, y).
Exercice 7.4.
Montrer que si f : Rn → Rm est directionnellement dérivable au sens de Hadamard
en x, alors l’application
v 7→ dH f (x, v) : Rn → Rm (7.1)
est homogène et continue.
Exercice 7.5.
Soient f, g : Rn → Rm deux applications Fréchet différentiables sur Rn et la nouvelle
application
déf
x 7→ h(x) = f (x) · g(x) : Rn → R . (7.2)
Démontrer que h est Fréchet différentiable et que
Dh(x) = Df (x)⊤ g(x) + Dg(x)⊤ f (x) (7.3)
ou, si ∇h(x) est interprété comme un vecteur colonne (ou matrice n × 1) et f (x) et
g(x) comme des vecteurs colonnes (ou matrice m × 1),
∇h(x) = g(x)⊤ Df (x) + f (x)⊤ Dg(x), (7.4)
où Df (x) et Dg(x) sont des matrices m × n.
Exercice 7.6.
Soit f : Rn → Rm une application Fréchet différentiable telle que kf (x)kRm = 1
pour la norme euclidienne. Montrer que
Df (x)⊤ f (x) = 0.
Y-a-t-il une interprétation géométrique de cette identité ?
Exercice 7.7.
Soit f : Rn → R admettant des dérivées partielles d’ordre un bornées dans un
ouvert U de Rn .
(i) Montrer que f est continue sur U et lipschizienne en chaque point de U .
Indication. S’inspirer de la démonstration du Théorème 3.11.
(ii) Est-ce que, en général, f est Gateaux différentiable en tout point de U ?
7. Exercices 293

On considère la fonction
 2 2 
 xy (x − y ) , si (x, y) 6= (0, 0)
déf
(x, y) 7→ f (x, y) = x2 + y 2 : R2 → R . (7.5)
 
0, si (x, y) = (0, 0)
Montrer que
(i) f , ∂x f et ∂y f existent et sont continues sur R2 ;
2
(ii) ∂xy 2
f = ∂x (∂y f ) et ∂yx f = ∂y (∂x f ) existent dans R2 et sont continues sauf
en (0, 0) ;
2 2
(iii) ∂xy f (0, 0) = 1 et ∂yx f (0, 0) = −1.
Rappel. La notation (3.66) :

2 ∂ ∂f
∂ji f (x) = (x) = d2 f (x; ei ; ej ) = Hf (x)ij .
∂xj ∂xi
Exercice 7.9.
Soit l’application linéaire A : Rn → Rn (ou une matrice n × n) et b ∈ Rn (ou un
n-vecteur). On construit la fonction
déf 1
f (x) = (Ax) · x + b · x, x ∈ Rn .
2
(i) Calculer f ′ (x; v) (ou le gradient de f ) et d2 f (x; v; w) (ou la hessienne de
f ).
(ii) Donner des conditions nécessaires et suffisantes sur A et b pour que f soit
convexe dans tout Rn .
(iii) Donner des conditions nécessaires et suffisantes sur A et b pour que f soit
strictement convexe dans tout Rn .
(iv) Est-ce que les fonctions f associées aux matrices et vecteurs

3 1 −2 2 4 1
(a) A = ,b= , et (b) A = ,b= ,
−1 2 1 4 1 1
sont convexes ?
Exercice 7.10.
Soient f (x) = kxkn , n ≥ 1, et kxk la norme euclidienne de x ∈ Rk , k ≥ 1.
(i) Déterminer les n ≥ 1 pour lesquels f est Hadamard (Fréchet) différentiable
en tout point de Rk .
(ii) Déterminer les n ≥ 1 pour lesquels Hf (x) existe en tout point de Rk
(iii) Déterminer les valeurs de n ≥ 1 pour lesquelles f est convexe dans Rk .
Exercice 7.11.
Montrer que la fonction f (x) = sin x+(1+x)2 est convexe dans l’intervalle [0, 1].
Exercice 7.12.
On dit que C ⊂ Rn est un cône de sommet 0 si
∀x ∈ C, ∀λ > 0, λx ∈ C. (7.6)
(i) Soit f : Rn → R une fonction convexe Gateaux différentiable en tout point
d’un cône convexe C. Montrer que argminf (C) 6= ∅ si et seulement si
∃x ∈ C, ∇f (x) · x = 0 et ∀y ∈ C, ∇f (x) · y ≥ 0. (7.7)
(ii) Trouver le ou les points minimisants pour

C = {(x1 , x2 ) : x1 ≥ 0 et x2 ≥ 0} et f (x1 , x2 ) = (x1 + 1)2 + (x2 − 1)2 .
Exercice 7.13.
Pour ε > 0, une matrice m × n et un vecteur c ∈ Rm on considère le problème :
déf
inf f (x) + εkxk2Rn , f (x) = kAx − ck2Rm . (7.8)
x∈Rn
(i) Montrer que f est convexe sur Rn ,

(ii) Donner les conditions nécessaires et suffisantes pour l’existence d’une so-
lution au problème (7.8) et montrer qu’il y a toujours existence et unicité
lorsque ε > 0.
(iii) Donner les conditions nécessaires et suffisantes pour l’existence d’une so-
lution au problème (7.8) pour ε = 0. Sont-elles toujours vérifées ?
Exercice 7.14.
Soit B une matrice n × n symétrique et définie positive. On associe à B la fonction
déf Bx · x
f (x) = , x 6= 0, (7.9)
kxk2
où kxk est la norme euclidienne dans Rn .
(i) Montrer qu’il existe x∗ ∈ Rn tel que kx∗ k = 1 et
Bx · x
f (x∗ ) = inf . (7.10)
06=x∈Rn kxk2
(ii) Montrer qu’il existe une constante β > 0 tel que

∀x ∈ Rn , Bx · x ≥ β kxk2 . (7.11)
(iii) Montrer que f est Hadamard/Fréchet différentiable en x 6= 0 et donner

l’expression de son gradient. En déduire que la plus petite constante β
vérifiant (7.11) est la plus petite valeur propre de la matrice B.
7. Exercices 295
Exercice 7.15.
Soient A et B deux matrices symétriques n× n. On suppose B définie positive. Pour
x ∈ Rn , x 6= 0, on définit la fonction
déf Ax · x
f (x) = . (7.12)
Bx · x
déf
(i) Montrer que l’ensemble U = {x ∈ Rn : Bx · x = 1} est non-vide et
compact.
(ii) Montrer qu’il existe x̂ ∈ Rn tel que B x̂ · x̂ = 1 et
Ax · x
f (x̂) = inf . (7.13)
06=x∈Rn Bx · x
(iii) Calculer ∇f (x) pour x 6= 0 et caractériser x̂. Montrer que pour tout λ tel
que dét (A − λB) = 0, on a f (x̂) ≤ λ.
Annexe A. Corrigés des exercices 297
Annexe A. Corrigés des exercices
1 Exercices du Chapitre 1
Exercice 5.1
Montrer que si r ∈ Q et s ∈ R \ Q, alors r + s ∈ R \ Q et rs ∈ R \ Q i ∪ {0}.
Solution. (i) (addition.) Par l’absurde. On suppose que r + s ∈ Q. Ce qui donne
s = (r + s) − r ∈ Q ce qui contredit le fait que s ∈ R \ Q.
(ii) (produit.) Si r = 0, alors rs = 0. Si 0 6= r ∈ Q, alors
rs
s= ∈Q
r
comme quotient de deux rationnels ce qui contredit le fait que s ∈ R \ Q.
Exercice 5.2
Soit A, ∅ 6= A ⊂ R et
déf
−A = {−a : a ∈ A} .
Montrer que inf A = − sup(−A).

Solution. Soit b0 = inf A. Par définition de l’infimum, b0 est une borne inférieure
de A et
∀a ∈ A, b0 ≤ a ⇒ ∀a ∈ A, −a ≤ −b0
et −b0 est une borne supérieure de −A. Donc c0 = sup (−A) ∈ R et c0 ≤ −b0 . Ceci
entraı̂ne
∀a ∈ A, −a ≤ c0 ≤ −b0
⇒ ∀a ∈ A, b0 ≤ −c0 ≤ a
et −c0 est une borne inférieure de A. Mais comme b0 est la plus grande borne
supéreure de A, on a b0 ≥ −c0 et finalement b0 = −c0 . Par définition de b0 et c0 ,
inf A = b0 = −c0 = − sup (−A).
Exercice 5.1
Montrer qu’il est impossible de définir sur l’ensemble des nombres complexes
C un ordre total qui lui confère une structure de corps ordonné. (Indication : −1
est un carré.
298 Annexe A. Corrigés des exercices
Solution. S’il y a un ordre total sur C qui en fasse un corps ordonné, alors de la
Proposition 3.4 (d), on a 1 > 0 et pour tout x ∈ C, x 6= 0, on a x2 > 0. Comme
i 6= 0 on a ou bien i > 0 ou −i > 0 ce qui donne −1 = i2 > 0 et −1 = (−i)2 > 0.
On obtient donc une contradiction dans chaque cas.
Exercice 5.2
Démontrer les résultats suivants.
(i) L’ensemble des irrationnels R \ Q n’est pas dénombrable.
Démonstration. (i) On a déjà démontré que R n’est pas dénombrable (Théorème
2.5 du Chapitre 2) et que Q est dénombrable (Exemple 2.3). On peut partionner R
en deux ensembles disjoints
R = Q ∪(R \ Q), Q ∩(R \ Q = ∅.
Comme Q est dénombrable, il existe une bijection f : Q → N. Si R \ Q était

dénombrable, alord il existerait une bijection g : R \ Q et N. Ceci nous permet-
trait de construire la bijection suivante
( )
déf (0, f (x)), si x ∈ Q
x 7→ F (x) = : R → {0, 1} × N
(1, g(x)), si x ∈ R \ Q
( −1 )
−1 déf f (y), si i = 0
(i, y) 7→ F (i, y) = : {0, 1} × N → R .
g −1 (y)), si i = 1
Comme {0, 1} × N est dénombrable en tant que sous-ensemble infini de N × N (cf.

Théorème 2.3), on en concluerait que R est dénpmbrable ce qui contredit le fait
qu’il ne l’est pas. Donc R \ Q n’est pas dénombrable.
(ii) Il suffit de prendre un polynôme de degré un de la forme f (x) = α x + β
et d’imposer les conditions suivantes en f (a) = c et f (b) = d pour déterminer les
deux constantes :
d−c
αa + β = c et α b + β = d ⇒ f (x) = c + (x − a)
b−a
b−a
⇒ f −1 (y) = a + (y − c).
d−c
Comme f est une bijection entre ]a, b[ et ]c, d[ , les deux intervalles ont le même
cardinal.
(iii) On choisit la bijection

déf 1 x 2y − 1
f (x) = 1+ : R → ]0, 1[ d’inverse f −1 (y) = .
2 1 + |x| 1 − |2y − 1|
3. Exercices du Chapitre 3 299
Exercice 10.1
Soient x, y ∈ Rk . Établir que
kx + yk2 + kx − yk2 = 2 kxk2 + 2 kyk2.
Interpréter géométriquement ce résultat.
Solution. Par définition de la norme

√
kxk = x · x.
Ceci donne donc
kx + yk2 + kx − yk2 = (x + y) · (x + y) + (x − y) · (x − y)
= x · x + y · y + 2x · y + x · x + y · y − 2x · y
= 2 x · x + 2 y · y = 2 kxk2 + 2 kyk2.
La somme des carrés des côtés d’un parallèlogramme est égale à la somme des carrés
de ses deux diagonales.
Exercice 10.2
Soit x ∈ Rk , k ≥ 2. Démontrer qu’il existe y ∈ Rk , y 6= 0, tel que x · y = 0.
Solution. Si x = 0 on peut prendre n’importe quel y 6= 0. Si x = (x1 , . . . , xk ) 6= 0,

il existe i tel que xi 6= 0. On considère deux cas :
k
X k
X
x2j = 0 et x2j > 0.
j=1 j=1
j6=i j6=i
Dans le premier cas xj = 0 pour j 6= i et on prend
yi = 0 et yj = 1 pour j 6= i;
dans le second cas, on prend
k
1 X 2
yj = xj pour j 6= i et yi = − x .
xi j=1 j
j6=i
Exercice 10.3
Soit R+ = {x ∈ R : x ≥ 0}.
(i) Montrer que, pour tout espace métrique (X, d) et pour toute constante
α > 0, la fonction
déf
(x, y) 7→ (αd)(x, y) = α d(x, y)

(ii) Si d1 et d2 sont deux métriques sur X, montrer que la fonction
déf
(x, y) 7→ (d! + d2 )(x, y) = d1 (x, y) + d2 (x, y)

(iii) Montrer que, pour tout espace métrique (X, d), la fonction
déf d(x, y)
(x, y) 7→ d(x, y) =
1 + d(x, y)

tout entier n ≥ 1
∀x, y ∈ X, dn (x, y) = dn (y, x) (3.1)

x=y ⇒ dn (x, y) = 0 (3.3)
et, en plus,
d1 (x, y) = 0 ⇒ x = y. (3.4)

X∞
déf 1 dn (x, y)
(x, y) 7→ d∞ (x, y) = n 1 + d (x, y)
n=1
2 n
est bien définie et qu’elle est une métrique sur X.

Solution. On doit dans chaque cas vérifier les trois axiomes de la Définition 2.1 :
une métrique dans un ensemble X est une fonction
déf
(x, y) 7→ d(x, y) : X × X → R+ , R+ = {x ∈ R : x ≥ 0}
qui satisfait les trois axiomes suivants :

(M1) d(x, y) = 0 ⇐⇒ x = y;
(M2) d(x, y) = d(y, x) ;
(M3) d(x, y) ≤ d(x, z) + d(z, y).

(i) Pour α > 0, α d : X × X → R+ et
(M1) α d(x, y) = 0 ⇐⇒ d(x, y) = 0 ⇐⇒ x = y ;
(M2) α d(x, y) = α d(y, x) ;
(M3) α d(x, y) ≤ α d(x, z) + α d(z, y).
(ii) Par définition des métriques d1 et d2 , d1 + d2 : X × X → R+ et
(M1) (d1 + d2 )(x, y) = 0 ⇐⇒ d1 (x, y) = 0 et d2 (x, y) = 0 ⇐⇒ x = y ;
(M2) d1 (x, y) + d2 (x, y) = d1 (y, x) + d2 (y, x) ;
(M3) d1 (x, y) ≤ d1 (x, z) + d1 (z, y) et d2 (x, y) ≤ d2 (x, z) + d2 (z, y) entraı̂ne
d1 (x, y) + d2 (x, y) ≤ d1 (x, z) + d2 (x, z) + d1 (z, y) + +d2 (z, y)) .
(iii) Par définition, d : X × X → R+ et
(M1) d(x, y) = 0 ⇐⇒ d(x, y) = 0 ⇐⇒ x = y ;
Pour (M2)
d(x, y) d(y, x)
d(x, y) = = = d(y, x)
1 + d(x, y) 1 + d(y, x)
Pour (M3), on réécrit
d(x, y) 1
d(x, y) = =1−
1 + d(x, y) 1 + d(x, y)
Maintenant, puisque d(x, y) ≤ d(x, z) + d(z, y), il vient
1 + d(x, y) ≤ 1 + d(x, z) + d(z, y)
1 1 1
≥ ≥
1 + d(x, y) 1 + d(x, z) + d(z, y) 1 + d(x, z) + d(z, y) + d(x, z) d(z, y)
1
= .
(1 + d(x, z)) (1 + d(z, y))
Donc
d(x, y) 1 1
=1− ≤1 −
1 + d(x, y) 1 + d(x, y) (1 + d(x, z)) (1 + d(z, y))
d(x, z) + d(z, y) + d(x, z) d(z, y)
=
(1 + d(x, z)) (1 + d(z, y))
d(x, z) + d(z, y) + 2 d(x, z) d(z, y)
≤
(1 + d(x, z)) (1 + d(z, y))
d(x, z) d(z, y)
= + .
1 + d(x, z) 1 + d(z, y)
(iv) Pour (M1), si x = y alors pour chaque n ≥ 0, dn (x, y) = 0 et
X∞
1 dn (x, y)
d∞ (x, y) = n 1 + d (x, y)
= 0.
n=1
2 n
Réciproquement, si d∞ (x, y) = 0, alors pour chaque n ≥ 0, dn (x, y) = 0. En parti-

culier, d0 (x, y) = 0 et, par hypothèse sur d0 , x = y.
Comme chaque dn vérifie (M2), alors, par définition de d∞ , d∞ vérifie (M2).
Enfin (M3) est une conéquence directe de la partie (iii).
Exercice 10.4 (page 102)

Soient (Xi , di ), 1 ≤ i ≤ n, des espaces métriques et
déf
X1 × · · · × Xn = {(x1 , . . . , xn ) : xi ∈ Xi } (3.5)
l’espace produit des Xi . Alors la fonction

déf
1≤i≤n (3.6)
: (X1 × · · · × Xn ) × (X1 × · · · × Xn ) → R+
est une métrique sur X1 × · · · × Xn . De la même façon, pour tout p, 1 ≤ p < ∞, la

fonction
( n )1/p
déf
X
p
dp (x, y) = di (xi , yi ) (3.7)
i=1
est une métrique sur X1 × · · · × Xn .

Solution. À compléter en suivant la démonstration du Théorème 1.2 page 51.
Exercice 10.5
Soit E un espace vectoriel normé au sens des Définitions 1.1 et 1.4 du Chapitre
2. Montrer que
déf
d(x, y) = kx − yk

Solution. À partir des propriétés de la norme (Définition 1.4 page 50).
Exercice 10.6 (page 103)

Soient A1 , A2 , . . . des sous-ensembles d’un espace métrique. On pose
Bn = ∪ni=1 Ai et B = ∪∞
i=1 Ai .
Démontrer que
∀n ≥ 1, Bn = ∪ni=1 Ai et B ⊃ ∪∞
i=1 Ai .
Donner un exemple où l’inclusion est stricte.

Solution. (i) On a clairement Ai ⊂ Ai et donc
Bn = ∪ni=1 Ai ⊂ ∪ni=1 Ai ⇒ Bn ⊂ ∪ni=1 Ai .
Dans l’autre sens,
Ai ⊂ ∪ni=1 Ai ⇒ Ai ⊂ ∪ni=1 Ai = Bn ⇒ ∪ni=1 Ai ⊂ Bn .
(ii) On reprend le dernier argument avec n = ∞ :
Ai ⊂ ∪∞
i=1 Ai ⇒ Ai ⊂ ∪∞
i=1 Ai = B ⇒ ∪∞
i=1 Ai ⊂ B.
En général, on n’a pas l’égalité. Il suffit de considérer l’exemple
∀i ≥ 1, Ai = {1/i} ⇒ B = {1/i : i ≥ 1} et B = B ∪ {0}
ce qui donne Ai = Ai et
∪∞
i=1 Ai = B $ B ∪ {0} = B.
Exercice 10.7
Donner un exemple d’un ensemble borné de R ayant exactement trois points
d’accumulation.
Solution. L’ensemble

1 1 1
: n ≥1 ∪ 1+ : n ≥ 1 ∪ 2+ : n ≥ 1
n n n
a pour points d’accumulation exactement 0,1 et 2.
Exercice 10.8
On désigne par E ′ l’ensemble des points d’accumulation d’un sous-ensemble
d’un espace métrique (X, d). Établir que E ′ est fermé et que E et E ont les mêmes
points d’accumulation. E et E ′ ont-ils toujours les mêmes points d’accumulation ?
Solution. Soit (X, d) l’espace métrique sousjacent et E ⊂ X.
(i) (E ′ )′ ⊂ E ′ . Pour montrer que E ′ est fermé dans (X, d), il suffit d’établir
que (E ′ )′ ⊂ E ′ , c’est-à-dire, tout point d’accumulation x′ ∈ X de E ′ est un point
d’accumulation de E ce qui revient à démontrer que
∀r > 0, Br′ (x′ ) ∩ E 6= ∅.
On fixe r > 0. Par définition du point d’accumulation x′ ∈ (E ′ )′ ,

′
Br/2 (x′ ) ∩ E ′ 6= ∅.
Il existe donc x′1 ∈ E ′ , x′1 6= x′ , tel que d(x′1 , x′ ) < r/2. Comme x′1 ∈ E ′ ,
′ ′
Bd(x ′ ,x′ )/3 (x1 ) ∩ E 6= ∅
1
et il existe x1 ∈ E, x1 6= x′1 , tel que d(x′1 , x1 ) < d(x′1 , x′ )/3. Donc, par l’inégalité du
triangle,
d(x′1 , x′ )
d(x1 , x′ ) ≤ d(x′1 , x′1 ) + d(x′1 , x′ ) < + d(x′1 , x′ ) < r ⇒ x1 ∈ Br (x′ ) ∩ E
3
d(x′1 , x′ )
d(x1 , x′ ) ≥ d(x′1 , x′ ) − d(x′1 x1 ) > d(x′1 , x′ ) − > 0 ⇒ x1 6= x′
3
⇒ Br′ (x′ ) ∩ E ⊃ {x1 } 6= ∅.
Comme ceci est vrai pour tout r > 0, x′ ∈ E ′ et (E ′ )′ ⊂ E ′ . Comme E ′ contient

tous ses points d’accumulation, il est fermé.
(ii) E ′ = (E)′ . Comme E ⊂ E, si x′ ∈ E ′ , alors, par définition,
∀r > 0, Br′ (x′ ) ∩ E 6= ∅ ⇒ ∀r > 0, Br′ (x′ ) ∩ E 6= ∅
et E ′ ⊂ (E)′ .
Dans l’autre sens, on veut montrer que pour x′ ∈ (E)′ , on a x′ ∈ E ′ , c-à-d.,
∀r > 0, Br′ (x′ ) ∩ E 6= ∅. (3.8)
′
On fixe r > 0. Comme Br/2 (x′ ) ∩ E 6= ∅, soit x̄ ∈ Br/2
′
(x′ ) ∩ E. Comme x̄ ∈ E est
′
un point d’adhérence de E et que d(x̄, x ) > 0, il vient
Bd(x̄,x′ )/3 (x̄) ∩ E 6= ∅.
Soit un point y ∈ Bd(x̄,x′ )/3 (x̄) ∩ E. Par l’inégalité du triangle
d(x̄, x′ ) r r
d(y, x′ ) ≤ d(y, x̄) + d(x̄, x′ ) < + d(x̄, x′ ) < + < r
3 6 2
d(x̄, x′ ) 2
d(y, x′ ) ≥ d(x̄, x′ ) − d(y, x̄) > d(x̄, x′ ) − = d(x̄, x′ ) > 0
3 3
⇒ y ∈ Br (x′ ) ∩ E ⇒ x′ ∈ E ′
puisque, pour tout r > 0, Br (x′ ) ∩ E 6= ∅.

(iii) (E ′ )′ = E ′ ? De la partie (i), on sait que (E ′ )′ ⊂ E ′ . Cependant, en
général, l’égalité n’est pas vérifiée. On considère, par exemple, l’ensemble

1 1 1
E= : n ≥1 ∪ 1+ : n ≥ 1 ∪ 2+ : n ≥ 1
n n n
qui a pour points d’accumulation exactement E ′ = {0, 1, 2}. Comme E ′ n’a que
des points isolés, (E ′ )′ = ∅. Donc, en général, (E ′ )′ $ E ′ .
Exercice 10.9
Tout point d’un ensemble fermé E ⊂ R2 est-il point d’accumulation de E ?
Reprendre le problème en supposant E ouvert.
Solution. (i) Tout point d’un ensemble fermé n’est pas un point d’accumulation. Il
suffit de prendre E = {0} dans R.
(ii) Cependant, pour tout point x d’un ensemble ouvert E, il existe r > 0 tel
que Br (x) ⊂ E et pour tout ρ, 0 < ρ ≤ r, Bρ (x) ⊂ E, Donc
∀ρ, 0 < ρ ≤ r, Bρ′ (x) ∩ E = Bρ′ (x) 6= ∅

⇒ ∀ρ > 0, Bρ′ (x) ∩ E 6= ∅
et x ∈ E ′ . Pour un ouvert E, on a donc E ⊂ E ′ .
Exercice 10.10
Soit (X, d) un espace métrique et E un sous-ensemble de X. Montrer que
(a) ∁ int E = ∁E.
(b) Est-ce que E et int E ont le même intérieur ?
(c) Est-ce que E et int E ont la même adhérence ?
Solution. (a) ∁ int E = ∁E. Comme int E ⊂ E, on a ∁E ⊂ ∁ int E. De plus, comme

int E est ouvert, ∁ int E est fermé et
∁E ⊂ ∁ int E.
Dans l’autre sens, on montre que ∁∁E ⊂ int E ce qui implique ∁ int E ⊂ ∁E. Comme
∁∁E est ouvert, pour tout x ∈ ∁∁E, il existe r > 0 tel que
Br (x) ⊂ ∁∁E ⇒ Br (x) ∩ ∁E = ∅ ⇒ Br (x) ∩ ∁E = ∅ ⇒ Br (x) ⊂ E
et x ∈ int E.
(b) Est-ce que E et int E ont le même intérieur ? Oui car, par le Théorème 3.1
(ii) et (iii) du Chapitre 3, int E est ouvert et, si E est ouvert, alors E = int E. On
a donc int (int E) = int E.
(c) Est-ce que E et int E ont la même adhérence ? Par définition, int E ⊂ E
entraı̂ne int E ⊂ E. En général, on n’a pas l’égalité. Par exemple,
déf
E = {0} ∪ [1, 2], E = E, int E = ]1, 2[ , int E = [1, 2].
Donc, int E = [1, 2] $ {0} ∪ [1, 2], = E.

Exercice 10.11
Donner un exemple d’un recouvrement ouvert de l’intervalle ]0, 1[ dont on ne
peut extraire de sous-recouvrement fini.
Solution. On prend

déf 1 déf 1 1
Gn = ,1 , n≥1 ou Gn = ,1 − , n ≥ 1.
n n n
Exercice 10.12
(
1, si x 6= y
d(x, y) =
0, si x = y.
Montrer que d est une métrique sur X. Quels en sont les ouverts ? les fermés ? les
compacts ?
Solution. (i) d est une métrique. On voit que d : X × X → R+ . Par définition

d(x, y) = 0 si et seulement si x = y et (M1) est vérifié. L’axiome (M2) de symétrie
l’est aussi par définition. Pour l’axiome (M3), si x = y, alors d(x, y) = 0 ≤ d(x, z) +
d(z, y) pour tout z ∈ X. Si x 6= y, alors pour tout z ∈ X, ou bien x 6= z et d(x, z) = 1
ou bien y 6= z et d(y, z) = 1 :
d(x, y) = 1 ≤ d(x, z) + d(y, z).
(ii) Soit x ∈ X. En prenant r = 1/2, il vient B1/2 (x) = {x}. Par définition
tout singleton {x} de X est un ouvert. Comme les unions arbitraires d’ouverts sont
ouvertes, alors tout sous-ensemble de X est ouvert.
De même, pour tout sous-ensemble E de X, ∁E est un ouvert ce qui entraı̂ne
E = ∁(∁E) est fermé.
Pour un compact K ⊂ X, pour tout recouvrement ouvert Gα de K, il existe
un sous-recouvrement fini :
K ⊂ ∪ni=1 Gαi .
En particulier, la famille {Gx : x ∈ X}, Gx = {x}, est un recouvrement ouvert de

K. Donc
K ⊂ ∪ni=1 Gxi = {x1 , . . . , xn }
et K ne contient qu’un nombre fini de point. Réciproquement si K est fini, il a la

propriété et K est compact. On en conclut que tous les singletons sont ouvert, fermé
et compact.
Exercice 10.13
On considère l’ensemble à deux éléments {0, 1} dans R équipé d’une métrique
arbitraire d (il en existe au moins une : d(x, y) = |x − y|).
(i) Énumérer tous les ouverts de ({0, 1}, d). Justifier.
(ii) Énumérer tous les compacts de ({0, 1}, d). Justifier.
(iii) Est-ce que ({0, 1}, d) est complet ? Justifier.
(iv) Énumérer tous les fermés de X = {0, 1, 2} pour une métrique arbitraire
dX sur X. Justifier.
Démonstration. (i) Les ensembles ∅ et X sont ouverts. Par définition de la métrique,

d(1, 0) > 0. Les ensembles {0} et {1} sont des ouverts. En effet, la boule Bd(1,0)/2 (0) =
{0} et trivialement Bd(1,0)/2 (0) ⊂ {0}. De même pour {1}.
(ii) Comme tous les sous-ensembles de X n’ont qu’un nombre fini d’éléments,
ils sont recouvrables par un sous-recouvrement fini de n’importe quel recouvrement
ouvert. Donc ils sont tous compacts et fermés.
(iii) Comme X est compact, il est complet.
(iv) Tous les sous-ensembles de X n’ont qu’un nombre fini d’éléments, ils sont
recouvrables par un sous-recouvrement fini de n’importe quel recouvrement ouvert.
Donc ils sont tous compacts et fermés.
Exercice 10.14
Soit {xn } une suite de Cauchy d’une espace métrique (X, d) ayant une valeur
d’adhérence x ∈ X. Montrer que xn → x.
Solution. Soit {xnk } la sous-suite telle que xnk → x. Par l’inégalité du triangle
d(xn , x) ≤ d(xn , xnk ) + d(xnk , x). (3.9)
Pour ε > 0, il existe N tel que

ε
∀m, n > N, d(xm , xn ) <
2
et il existe K > N tel que
ε
∀k > K, d(xnk , x) < .
2
Comme, par définition d’une sous-suite,
n1 < n2 < n3 < · · · < nk < nk+1 < . . . ,
nk ≥ k et lim nk = +∞, on a pour k > K et n > N

k→∞
ε
nk ≥ k > K > N ⇒ d(xn , xnk ) < .
2
Par l’inégalité du triangle (3.9)

ε ε
d(xn , x) ≤ d(xn , xnk ) + d(xnk , x) < + (3.10)
2 2
⇒ ∀n > N, d(xn , x) < ε (3.11)
et toute la suite converge vers x.
Exercice 10.15
Soit X = R muni de la métrique d(x, y) = |x − y|.
déf x
x 7→ ϕ(x) = : R → ] − 1, 1[ (3.12)
1 + |x|
est une bijection.
(ii) Vérifier que
déf x y
dϕ (x, y) = d(ϕ(x), ϕ(y)) = − (3.13)
1 + |x| 1 + |y|
est une métrique sur R.
(iii) Vérifier que la suite {n}, n ≥ 1, est dϕ -Cauchy, mais pas d-Cauchy.
Démonstration. (i) La fonction ϕ est bien définie. Pour x, y ∈ R tel que ϕ(x) = ϕ(y),
on a
x y
=
1 + |x| 1 + |y|
ce qui veut dire que x et y ont le même signe. Si x ≥ 0
x y
= ⇒ x = y;
1+x 1+y
si x < 0
x y
= ⇒ x = y.
1−x 1−y
La fonction ϕ est injective. Pour la surjectivité, on se donne y ∈ ] − 1, 1[ et on
cherche s ∈ R tel que x/(1 + |x|) = y. On voit que x doit être du même signe que
y. Il y a de nouveau deux cas. Si x ≥ 0
x y y
=y ⇒ x= = ;
1+x 1−y 1 − |y|
si x < 0
x y y
=y ⇒ x= = .
1−x 1+y 1 − |y|
La fonction inverse
y
ϕ−1 (y) =
1 − |y|
est donc bien définie et ϕ est bijective.
(ii) Par définition, dϕ (x, y) = d(ϕ(x), ϕ(y)) ≥ 0 puisque d est une métrique.
Comme ϕ est une bijection, on a M1
dϕ (x, y) = d(ϕ(x), ϕ(y)) = 0 ⇐⇒ ϕ(x) = ϕ(y) ⇐⇒ x = y.
Pour M2
dϕ (x, y) = d(ϕ(x), ϕ(y)) = d(ϕ(y), ϕ(x)) = dϕ (y, x).
Pour M3
d(ϕ(x), ϕ(z)) ≤ d(ϕ(x), ϕ(y)) + d(ϕ(y), ϕ(z))

⇒ dϕ (x, z) ≤ dϕ (x, y) + dϕ (y, z).
(iii) On considère la suite d’entiers naturels {n} pour laquelle
n+m n m 1
dϕ (n + m, n) = − = < .
1+n+m 1+n (1 + n + m)(1 + n) 1+n
Pour ε > 0, soit N un entier naturel plus grand que 1/ε − 1, Alors, pour tout n > N
et tout m ≥ 1
1 1
dϕ (n + m, n) < < <ε
1+n 1+N
et {n} est dϕ -Cauchy.
Exercice 10.16
Soient (X, d) un espace métrique complet et {En } une suite décroissante de
fermés bornés non-vides tel que
lim diam (En ) = 0.

n→∞
Montrer que ∩∞
n=1 En est un singleton.
Solution. Comme limn→∞ diam (En ) = 0, il existe une sous-suite {Enk } telle que
1
∀k ≥ 1, diam (Enk ) < .
2k
Pour chaque k on choisit un point xk ∈ Enk . Comme Enk+1 ⊂ Enk , on a
1
∀k ≥ 1, d(xk+1 , xk ) ≤ diam (Enk ) < .
2k
La suite {xk } est Cauchy : pour tout k ≥ 1 et tout m ≥ 1

m−1
X 1 1
d(xk+m , xk ) ≤ ≤ k−1 .
i=0
2k+i 2
Comme X est complet, il existe x ∈ X tel que xk → x. Étant donné que nk ≤ k, on

a Enk ⊂ Ek et la suite {xk } se retrouve donc dans chaque Ek à partir d’un certain
rang et comme chaque Ek est fermé, x ∈ Ek . Donc
déf
x ∈ E = ∩∞
n=1 En .
Si E n’est pas un singleton, alors diam E > 0 et comme E ⊂ En
∀n ≥ 1, diam En ≥ diam E > 0,
ce qui contredirait l’hypothèse que diam En → 0.
Exercice 10.17
On dit qu’un espace métrique est séparable s’il contient un sous-espace dé-
nombrable et dense. Montrer que Rk est séparable.
Solution. Il suffit de prendre le sous-espace Qk . Comme Q est dénombrable, Qk est
dénombrable par le Théorème 2.3 du Chapitre 2. De la même façon, comme Q est
dense dans R, Qk est dense dans Rk .
Exercice 10.18
On dit qu’une famille d’ouverts {Oα } est une base de X si tout ouvert de X
est la réunion d’ouverts de cette famille. Montrer qu’un espace métrique séparable
posssède une base dénombrable.
Solution. Soit S le sous-espace dénombrable dense de (X, d). On associe à chaque
s ∈ S la famille de boules ouvertes
déf
{Bq (s) : 0 < q ∈ Q} et B = {Bq (s) : 0 < q ∈ Q et s ∈ S} (3.14)
Comme il y a bijection
déf
(s, q) 7→ Bq (s) : S × Q+ , Q+ , = {q ∈ Q : q > 0
la famille d’ouverts B = {Bq (s)} est dénombrable.

Si O est un ouvert de (X, d), alors pour tout point x ∈ O, il existe r ∈ R+
tel que Br (x) ⊂ O. Par densité de S, il existe sx ∈ S tel que d(x, sx ) < r/3. Donc
Br/2 (sx ) ⊂ Br (x) ⊂ O et x ∈ Br/2 (sx ) puisque
r r
∀z ∈ Br/2 (sx ), d(x, z) ≤ d(x, sx ) + d(sx , z) < + <r
2 3
r r
d(x, sx ) < < ⇒ x ∈ Br/2 (sx ) ⊂ Br (x) ⊂ O.
3 2
Enfin, par densité de Q dans R, il existe qr ∈ Q+ tel que r/3 < qr < r/2. On a donc
r r r
∀z ∈ Bqr (sx ), d(x, z) ≤ d(x, sx ) + d(sx , z) < + qr < + < r
3 3 2
r
d(x, sx ) < < qr ⇒ x ∈ Bqr (sx ) ⊂ Br (x) ⊂ O.
3
On a montré que, pour chaque x ∈ O, il existe sx ∈ S et qx ∈ Q+ tel que
x ∈ Bqx (sx ) ⊂ Br (x) ⊂ O
⇒ O⊂∪ s∈S et ∃q∈Q+ Bq (s) ⊂ O.
tel que Bq (s)⊂O
La famille B est donc bien une base séparable de (X, d).
Exercice 10.19
Soit un espace métrique (X, d) dans lequel tout sous-ensemble infini possède
au moins un point d’accumulation. Démontrer que X est séparable. Indication :
Soit r > 0 et x1 ∈ X ; ayant déterminé x1 . . . . , xj ∈ X, choisir, s’il existe, un point
xj+1 tel que d(xj , xj+1 ) ≥ r pour tout i = 1, . . . , j. Montrer que cette construction
s’arrête au bout d’un nombre fini de boules ouvertes de rayon r. Prendre r = 1/n
(n = 1, 2, 3, . . . ) et considérer les centres des boules correspondantes.
Solution. Soit r > 0 et x1 ∈ X ; ayant déterminé x1 . . . . , xj ∈ X, choisir, s’il existe,
un point xj+1 tel que d(xj , xj+1 ) ≥ r pour tout i = 1, . . . , j.
Si la construction ne s’arrète pas après un nombre fini d’étapes, on obtient
une suite infinie de points distincts S = {xi : i ∈ N}. Par hypothèse, cet ensemble
possède au moins un point d’accumulation x ∈ X :
∀ρ > 0, Bρ′ (x) ∩ S 6= ∅.
Pour ρ = r/4, Bρ′ (x) ∩ S contient une infinité de points de S et
r
∀s ∈ Bρ′ (x) ∩ S, d(s, x) < .
4
Donc pour tous points s1 et s2 de Bρ′ (x) ∩ S, s1 6= s2 ,
r r r
d(s1 , s2 ) ≤ d(s1 , x) + d(s2 , x) < + = < r
4 4 2
ce qui contredit le fait que par construction tous les points de S sont distants d’au
moinst r.
Pour r = 1, soit x1,1 , . . . , x1,N1 } la suite finie associée ; pour r = 1/2, soit
x2,1 , . . . , x2,N2 } la suite finie associée ; pour r = 1/n, soit xn,1 , . . . , xn,Nn } la suite
finie associée. L’union E de toutes ces suites est au plus dénombrable.
Cet ensemble est dense dans X. En effet, supposons qu’il existe x ∈ X et ε > 0
tel que pour tout xn,jn ∈ S, d(x, xn,jn ) ≥ ε. Soit n ∈ N tel que 1/n < ε. Donc,
1
∀jn , 1 ≤ jn ≤ Nn , d(x, xn,jn ) ≥ ε >
n
et ceci contredit la construction des points xn,jn pour r = 1/n car on pourrait y
ajouter x qui est à une distance plus grande que 1/n de tous les autres.
Exercice 10.20
Démontrer que tout espace métrique compact K a une base dénombrable et
qu’il est donc séparable. Indication : pour tout entier n > 0, il existe un nombre
fini de boules ouvertes de rayon 1/n recouvrant K.
Solution. Si K ne possède qu’un nombre fini de points {x1 , x2 , . . . , xn }, ils sont

isolés et l’on peut associer à chacun d’entre eux la boule ouverte de rayon
déf
ri = inf d(xj , xi ) > 0.
1≤j≤
j6=i
Si K possède un nombre de points infini, alors comme K est compact, il contient

un point d’accumulation par le Théorème 7.3 du Chapitre 3 et on peut appliquer
les résultats de l’Exercice 10.19.
Exercice 10.1
Soit f : X → Y . Alors l’application induite f −1 : P(Y ) → P(X) préserve les
opérations élémentaires suivantes :
(1) f −1 (∪α Bα ) = ∪α f −1 (Bα ).
(2) f −1 (∩α Bα ) = ∩α f −1 (Bα ).
(3) f −1 (B1 \B2 ) = f −1 (B1 )\f −1 (B2 ).
Démonstration. (1) Bα ⊂ ∪α Bα implies
f −1 (Bα ) ⊂ f −1 (∪α Bα ) ⇒ ∪α f −1 (Bα ) ⊂ f −1 (∪α Bα ).
Si x ∈ f −1 (∪α Bα ), alors f (x) ∈ ∪α Bα et il existe α tel que f (x) ∈ Bα . Donc,

x ∈ f −1 (Bα ) et x ∈ ∪α f −1 (Bα ). Même type d’argument pour (2).
Pour (3), on peut faire le raisonnement suivant en utilisant (2) :
B1 \B2 = B1 ∩ (Y \B1 ) ⇒ f −1 (B1 \B2 ) = f −1 (B1 ) ∩ f −1 (Y \B2 )

f −1 (Y \B2 ) = {x ∈ X : f (x) ∈ Y \B2 }
= {x ∈ X : f (x) ∈ / f −1 (B2 )}
/ B2 } = {x ∈ X : x ∈
= X\f −1 (B2 ).
On obtient donc
f −1 (B1 \B2 ) = f −1 (B1 ) ∩ f −1 (Y \B2 )

= f −1 (B1 ) ∩ (X\f −1 (B2 )) = f −1 (B1 )\f −1 (B2 )
puisque f −1 (B1 ) ⊂ X.
Exercice 10.2
Soit f : X → Y . Alors l’application induite f : P(X) → P(Y ) préserve les
opérations suivantes :
(1) f (∪α Bα ) = ∪α f (Bα ).
(2) f (∩α Bα ) ⊂ ∩α f (Bα ).
Démonstration. Même type d’argument que pour l’Exercice 10.1.
Exercice 10.3
Soit f : X → Y . Alors
(1) pour chaque A ⊂ X, f −1 [f (A)] ⊃ A.
(2) pour chaque A ⊂ X et B ⊂ Y ,

f A ∩ f −1 (B) = f (A) ∩ B (4.1)
et, en particulier,

f f −1 (B) = f (X) ∩ B. (4.2)
Démonstration. (1) Par définition,
f −1 (f (A)) = {x ∈ X : f (x) ∈ f (A)} ⊃ {x ∈ A : f (x) ∈ f (A)} = A.
(2) Par définition,
A ∩ f −1 (B) = A ∩ {x ∈ X : f (x) ∈ B} = {x ∈ A : f (x) ∈ B}
⇒ f (A ∩ f −1 (B)) = {f (x) : x ∈ A et f (x) ∈ B} = f (A) ∩ B.
Enfin, on applique la formule avec A = X.
Exercice 10.4
Soit f : X → Y et g : Y → Z. Alors (g ◦ f )−1 = f −1 ◦ g −1 .
Démonstration. Comme chaque application inverse induite est bien définie
f −1 : P(Y ) → P(X) et g −1 : P(Z) → P(Y ),
la composition g −1 ◦ f −1 : P(Z) → P(X) est bien définie. De même la composition
des applications induites est bien définie
f : P(X) → P(Y ) et g : P(Y ) → P(Z) ⇒ f ◦ g : P(X) → P(Z).
Pour C ∈ P(Z)
(g ◦ f )−1 (C) = {x ∈ X : g(f (x)) ∈ C}
= {x ∈ X : f (x)) ∈ g −1 (C)}
= f −1 (g −1 (C)) = (f −1 ◦ g −1 )(C)).
Donc (g ◦ f )−1 = f −1 ◦ g −1 .
Exercice 10.5
(i) Soit un ensemble arbitraire X et soit {Aα } un recouvrement de X par des
sous-ensembles de X.
(ii) Soit Y un autre ensemble et une famille fα : Aα → Y d’applications tel
que
Alors, il existe une application unique f : X → Y qui est un prolongement de

chaque fα :
∀α, f |A α = f α .
Démonstration. Soit x ∈ X. Comme {Aα } est un recouvrement de X, on pose

déf
f (x) = fα (x)
pour un α tel que x ∈ Aα . La fonction f est bien définie car s’il existe un β 6= α tel
que x ∈ Aβ , alors, par hypothèse, f (x) = fα (x) = fβ (x). L’application f est unique
car s’il y en avait une seconde f ′ , on aurait
f ′ | A α = f α = f |A α ⇒ f ′ = f sur X = ∪Aα .
Exercice 10.6
Soit f : X → Y et g : Y → X tel que g ◦ f = IX où IX est la fonction identité
sur X. Alors f est injective et g est surjective.
Démonstration. L’application f est injective puisque, pour tous x, x′ ∈ X,
f (x) = f (x′ ) ⇒ x = g(f (x)) = g(f (x′ )) = x′ .
L’application g est surjective puisque, pour tout z ∈ X,
z = g(f (z)),
c-à-d., il existe f (z) ∈ Y tel que z = g(f (z)).
Exercice 10.7
Soit f : (X, dX ) → R une application continue. Montrer que
déf
f −1 {0} = {x ∈ X : f (x) = 0} (4.3)
est fermé dans (X, d).

Démonstration. Comme l’ensemble {0} est fermé dans R, son image inverse pour
une fonction continue est fermée par le Théorème 3.3.
Exercice 10.8
Soient f, g : (X, dX ) → (Y, dY ) deux applications continues entre deux espaces
métriques et E un sous-ensemble dense dans (X, d). Montrer que
(i) f (E) est dense dans (f (X), dY ) ;
(ii) f = g sur E entraı̂ne f = g sur X.
Démonstration. (i) De la Définition 6.6 du Chapitre 3, E ⊂ X est dense dans X si

tout point de X est un point d’adhérence de E (ou encore E = X). Par le Théorème
3.3 du Chapitre 4, pour une fonction continue on a
f (E) ⊂ f (X) = f (E) ⊂ f (E).
Comme f (E) est fermé, f (X) = f (E) et f (E) est dense dans f (X).
(ii) Soit x ∈ X. Par densité de E dans X, il existe une suite {xn } dans E qui
dX -converge vers x. Par continuité de f , f (xn ) → f (x) dans (Y, dY ). Comme f = g
sur E, g(xn ) = f (xn ) et, par continuité de g, g(xn ) → g(x). Par unicité de la limite
dans (Y, dY ), f (x) = g(x).
Exercice 10.9
(i) On se donne la fonction f : R2 → R
 
xy 2
déf , si (x, y) 6= (0, 0)
f (x, y) = x2 + y 4
 
0, si (x, y) = (0, 0)
Montrer que f est bornée sur R2 et n’est pas continue en (0, 0), mais que
sa restriction à toute droite passant par (0, 0) est continue.
(ii) On se donne la fonction g : R2 → R
 
 xy 2
déf , si (x, y) 6= (0, 0)
g(x, y) = x2 + y 6
 
0, si (x, y) = (0, 0)
Montrer que g n’est bornée sur aucun voisinage de (0, 0) et n’est pas conti-
nue en (0, 0), mais que sa restriction à toute droite passant par (0, 0) est
continue.
Démonstration. (i) Pour (x, y) 6= (0, 0), on a
xy 2 1 xy 2 1
0 ≤ (x ± y 2 )2 = x2 + y 4 ± 2 x y 2 ⇒ ∓ 2 4
≤ ⇒ 2 4
≤ .
x +y 2 x +y 2
Comme f (0, 0) = 0, on a |f (x, y)| ≤ 1/2 sur R2 .

Si l’on se donne la droite D = {t (v, w) : t ∈ R passant par (0, 0) de direction

(v, w), on a pour t 6= 0
 
2

 (tv) (tw) , 
si (v, w) 6= (0, 0)
f (tv, tw) − f (0, 0) = (tv)2 + (tw)4

 0, 
si (v, w) = (0, 0)
 
 v w2
, si (v, w) 6= (0, 0)
=t v 2 + t2 w 4 .
 
0, si (v, w) = (0, 0)
Si w = 0 ou v = 0, cette différence est 0, f (tv, tw) = f (0, 0) et pour toute suite

tn → 0, tn =
6 0, f (tn v, tn w) → f (0, 0). Si v 6= 0 et w 6= 0, alors
v w2 w2
t →0 = 0.
v2 2
+t w 4 v
On a donc bien la continuité en (0, 0) le long de droites passant par (0, 0).
Pour montrer que f est discontinue en (0, 0), on suit le chemin x = y 2 ce qui
donne
 4 
 y 1
= , si y 6= 0
f (y 2 , y) = y 4 + y 4 2 .
 
0, si y = 0
Donc, pour la suite (xn , yn ) = (1/n2 , 1/n) → (0, 0),
1
f (1/n2 , 1/n)) = 6→ 0 = f (0, 0).
2
(ii) Pour montrer que que f n’est pas continue en (0, 0), on suit le chemin
x = y 2 ce qui donne
 
 y4 1
2 4 6
= , si y 6= 0
g(y , y) = y + y 1 + y2
 
0, si y = 0
⇒ g(y 2 , y) → 1 6= 0 = f (0, 0) lorsque y → 0.
Pour la bornitude, on prend le chemin x = y 3 ce qui donne

 
 y5 1 
= , si y 6
= 0
g(y 3 , y) = y 6 + y 6 2y
 
0, si y = 0
n
⇒ g((1/n)3 , 1/n) = → +∞ = 6 0 = f (0, 0) lorsque n → ∞.
2
g n’est donc bornée dans aucun voisinage de (0, 0).
Enfin le long de la droite D = {t (v, w) : t ∈ R passant par (0, 0) de direction

(v, w), on a pour t 6= 0
 

 tv (tw)2 
, si (v, w) 6= (0, 0)
g(tv, tw) − g(0, 0) = (tv)2 + (tw)6

 0, 
si (v, w) = (0, 0)
 
 v w2
, si (v, w) 6= (0, 0)
=t v 2 + t4 w 6 ,
 
0, si (v, w) = (0, 0)
En examinant chaque cas, il vient g(tv, tw) → g(0, 0) lorsque t → 0, t 6= 0.
Exercice 10.10
Démontrer que l’on peut remplacer la définition de la continuité uniforme sur
X par : pour tout ε > 0, il existe δ > 0 tel que
∀E ⊂ X tel que diam (E) < δ, diam f (E) < ε. (4.4)
Démonstration. De la Définition 6.1, une fonction f : (X, dX ) → (Y, dY ) entre deux

espaces métriques est uniformément continue sur X si, pour tout ε > 0, il existe
δ > 0 tel que
∀x, x′ ∈ X pour lesquels dX (x′ , x) < δ, dY (f (x′ ), f (x)) < ε.
Pour tout E ⊂ X tel que diam (E) < δ, on a, par définition du diamètre,
diam (E) = sup{dX (x′ , x) : x, x′ ∈ E} < δ ⇒ ∀x, x′ ∈ E, dX (x, x′ ) < δ

′
⇒ dY (f (x), f (x )) < ε ⇒ diam f (E) = sup{dY (f (x′ ), f (x)) : x, x′ ∈ E} < ε.
Dans l’autre sens, on part de (4.4). On a
X = ∪x∈X Bδ/2 (x) et diam Bδ/2 (x) < δ.
Donc
∀x′ ∈ X tel que dX (x′ , x) < δ/2, diam f (E) < ε

⇒ dY (f (x′ ), f (x)) ≤ diam f (E) < ε.
Mais ceci est vrai pour tout x ∈ X :
∀x, ∀x′ ∈ X tel que dX (x′ , x) < δ/2, dY (f (x′ ), f (x)) < ε
et f est uniformément continue sur X.

Exercice 10.11
Démontrer.
(i) La composition g◦f de deux fonctions f : (X, dX ) → (Y, dY ) uniformément
continue sur E ⊂ X et g : (Y, dY ) → (Z, dZ ) uniformément continue sur
f (E) ⊂ Y est uniformément continue sur X
(ii) La composition g ◦ f de deux fonctions f : (X, dX ) → (Y, dY ) lipschit-
zienne en x ∈ X et g : (Y, dY ) → (Z, dZ ) lipschitzienne en f (x) ∈ Y est
lipschitzienne en x ∈ X.
Démonstration. (i) Par hypothèse, pour tout ε > 0 il existe η > 0 tel que
∀y, y ′ ∈ f (E), dY (y, y ′ ) < η, dZ (g(y), g(y ′ )) < ε

et il existe δ > 0 tel que
∀x, x′ ∈ E, dX (x, x′ ) < δ, dY (f (x), f (x′ )) < η ⇒ dZ (g(f (x)), g(f (x′ ))) < ε.
(ii) Par définition, il existe c(f (x)) et r(f (x)) > 0 tel que
∀y,1 y2 ∈ Br(f (x)) (f (x)), dZ (g(y1 ), g(y2 )) ≤ c(f (x)) dY (y1 , y2 )
et il existe c(x) et r(x) > 0 tel que

∀x1 , x2 ∈ Br(x) (x), dY (f (x1 ), f (x2 )) ≤ c(x) dX (x1 , x2 ).
On réduit le rayon de Br(x) (x) ⊂ X pour que son image tombe dans la boule
Br(f (x)) (f (x)) ⊂ Y . On choisit le rayon ρ(x) = min{r(x), r(f (x))/c(x)}
∀x1 , x2 ∈ Bρ(x) (x), dY (f (xi ), f (x)) ≤ c(x) dX (xi , x)

< min{r(x) c(x), r(f (x))} ≤ r(f (x))
⇒ f (xi ) ∈ Br(f (x)) (f (x)), i = 1, 2
⇒ dZ (g(f (x1 )), g(f (x2 ))) ≤ c(f (x)) dY (f (x1 ), f (x2 )).
⇒ dZ (g(f (x1 )), g(f (x2 ))) ≤ c(f (x)) dY (f (x1 ), f (x2 )) ≤ c(f (x)) c(x) dX (x1 , x2 )
et g◦f est lipschitzienne en x pour la boule Bρ(x) (x) et la constante c(f (x)) c(x).
Exercice 10.12
On dit qu’une application f : (X, dX ) → (Y, dY ) est ouverte si l’image f (O)
de tout ouvert O dans X est ouverte dans Y . Montrer qu’une application f : R → R
continue et ouverte est monotone.
Démonstration. On montre d’abord que f est injective. Soit x1 et x2 tel que f (x1 ) =
f (x2 ). Supposons sans perte de généralité que x1 < x2 . Comme [x1 , x2 ] est compact
et que f est continue
∃a ∈ [x1 , x2 ] tel que f (a) = inf f ([x1 , x2 ])
∃b ∈ [x1 , x2 ] tel que f (b) = sup f ([x1 , x2 ]).
Si f (a) < f (x1 ), alors x1 < a < x2 et f (a) ∈ f ((x1 , x2 )). Comme f est ouverte,
l’image f ((x1 , x2 )) est ouverte et il existe r > 0 tel que Br (f (a)) ⊂ f ((x1 , x2 )) ce
qui signifierait qu’il existe z ∈ (x1 , x2 ) tel que f (z) = f (a) − r/2 ce qui contredirait
la minimalité de f (a). Donc f (x1 ) = f (a). Par le même argument appliqué au sup, il
vient f (x1 ) = f (b). La fonction f est donc constante et égale à f (x1 ) sur l’intervalle
(x1 , x2 ). Mais ceci contredit le fait que f est ouverte car f ((x1 , x2 )) = {f (x1 )} serait
fermée. f est donc injective.
Soit x1 < x2 . Comme f est injective f (x1 ) 6= f (x2 ). Supposons que f (x1 ) <
f (x2 ). On démontre d’abord que f est strictement croissante sur [x1 , x2 ]. Par le
raisonnement pécédent on a
f (x1 ) = inf f ([x1 , x2 ]) et f (x2 ) = sup f ([x1 , x2 ]).
Soient deux points x, y tel que x1 ≤ x < y ≤ x2 . On veut démontrer que f (x) <
f (y). Par injectivité de f , f (x) 6= f (y). Supposons que f (x) > f (y). Par injectivité
de f , ceci implique que f (x1 ) < f (y) < f (x) < f (x2 ) et x1 < x < y < x2 . Par le
théorème des valeurs intermédiaires, il existe z ∈ (y, x2 ) tel que f (z) = f (x) ce qui
contredit le fait que f est injective.
Il reste à démontrer que f est croissante sur R. Il suffit de démontrer qu’elle
est strictement croissante sur tout intervalle [a, b] tel que a < x1 < x2 < b. Ceci
découle des inégalités suivantes :
inf f ([a, b]) ≤ inf f ([x1 , x2 ]) = f (x1 ) < f (x2 ) = sup f ([x1 , x2 ]) ≤ sup f ([a, b]).
Par le même raisonnement que sur [x1 , x2 ], on démontre que f (a) = inf f ([a, b]) et
que f (b) = sup f ([a, b]). De là, f est strictement croissante sur [a, b].
Si l’on avait supposé que f (x1 ) > f (x2 ), on aurait obtenu que f est décroissante
sur R. Dans les deux cas f est monotone sur R.
Exercice 10.13
Soient deux espaces métriques (X, dX ) et (Y, dY ) et leur produit
déf
X × Y = {(x, y) : x ∈ X et y ∈ Y } . (4.5)
(i) Montrer que

déf
((x, y), (x′ , y ′ )) 7→ dX×Y ((x, y), (x′ , y ′ )) = dX (x, x′ ) + dY (y, y ′ )
(4.6)
: (X × Y ) × (X × Y ) → R+
définit une métrique sur X × Y .

(ii) Montrer que la projection sur X
déf
(x, y) 7→ pX (x, y) = x : (X × Y, dX×Y ) → (X, dX )
est lipschitzienne sur X × Y .

Démonstration. (i) Voir l’Exercice 10.4 du Chapitre 3.

(ii) En effet,
dX (pX (x, y), pX (x′ , y ′ ))

= dX (x, x′ ) ≤ dX (x, x′ ) + dY (y, y ′ ) = dX×Y ((x, y), (x′ , y ′ )).
La projection est donc lipschitzienne de constante 1.
Exercice 10.14
On dénote par dn (y, x) = ky − xkRn la métrique euclidienne sur Rn , n ≥ 1 un
entier. Soit le pole nord p = (0, 0, 1) ∈ R3 de la sphère de rayon un
q
déf déf
S (2) = x = (x1 , x2 , x3 ) : kxkR3 = x21 + x22 + x23 = 1 ⊂ R3 .

déf x1 x2
x = (x1 , x2 , x3 ) 7→ ϕ(x) = , : S (2) \{p} → R2 (4.7)
1 − x3 1 − x3
est une bijection et donner l’expression de l’application inverse ϕ−1 .

(ii) Montrer que ϕ : (S (2) \{p}, d3 ) → (R2 , d2 ) est un homéomorphisme. (On
peut supposer que toute fonction polynômiale est continue et utiliser les
théorèmes sur le produit et le quotient d’applications continues.)
déf
(x, y) 7→ ρ(x, y) = d3 (ϕ−1 (x), ϕ−1 (y)) : R2 × R2 → R+ (4.8)
est une métrique sur R2 .

(iv) Montrer que l’application ϕ : (S (2) \{p}, d3) → (R2 , ρ) est une isométrie et
c2 , ρ̂) de (R2 , ρ).
donc une isométrie de (S (2) \{p}, d ) dans le complété (R
3
c2 , ρ̂) de (R2 , ρ) est compact.
(v) Montrer que le complété (R
Solution. (i) En effet, ϕ est injective car pour ϕ(x) = ϕ(x′ ) tel que x21 + x22 + x23 =
1 = (x′1 )2 + (x′2 )2 + (x′3 )2 , on a
x1 x′1 x2 x′2
= et = (4.9)
1 − x3 1 − x′3 1 − x3 1 − x′3
2 2 2 2
1 − x23 x1 x2 x′1 x′2 1 − (x′3 )2
2 = 1 − x3
+
1 − x3
=
1 − x3′ +
1 − x3′ = 2
(1 − x3 ) (1 − x′3 )
1 + x3 1 − x23 1 − (x′3 )2 1 + x′3
⇒ = 2 = 2 =
1 − x3 (1 − x3 ) (1 − x′3 ) 1 − x′3
⇒ (1 + x3 ) (1 − x′3 ) = (1 + x′3 ) (1 − x3 ) (4.10)
⇒ 1 + x3 − x′3 − x3 x′3 =1+ x′3 − x3 − x3 x′3 ⇒ x′3 = x3 .
Enfin, de (4.9), il vient x′2 = x2 et x′1 = x1 .

L’application ϕ est aussi surjective. Soit y = (y1 , y2 ) ∈ R2 . On cherche x =
(x1 , x2 , x3 ) tel que
x1 x2
= y1 = y2 et x21 + x22 + x23 = 1
1 − x3 1 − x3
2 2
1 + x3 1 − x23 x1 x2
= = + = y12 + y22
1 − x3 (1 − x3 )2 1 − x3 1 − x3
y12 + y22 − 1 2
⇒ x3 = et 1 − x3 = 2
y12 + y22 + 1 y1 + y22 + 1
2 y1 2 y2
⇒ x1 = 2 2 et x2 = 2 .
y1 + y2 + 1 y1 + y22 + 1
On remarque aussi que x = (x1 , x2 , x3 ) 6= (0, 0, 1) = p puisque cela donnerait
y1 = y2 = 0 et la contradiction −1 = +1.
La fonction inverse est donc

−1 2 y1 2 y2 y12 + y22 − 1
(y1 , y2 ) 7→ ϕ (y1 , y2 ) = , ,
y12 + y22 + 1 y12 + y22 + 1 y12 + y22 + 1 (4.11)
: (R2 , d2 ) → (S (2) \{p}, d3 )
(ii) Les applications ϕ et ϕ−1 sont continues comme quotients de polynômes

puisque les dénominateurs sont différents de 0 : ϕ est donc un homéomorphisme.
(iii) On vérifie les trois axiomes d’une métrique. Pour (M1), si x = y, alors
ρ(x, y) = d3 (ϕ−1 (x), ϕ−1 (y)) = 0. Réciproquement, si ρ(x, y) = 0, on a (ϕ−1 (x) =
ϕ−1 (y) et x = y. Pour (M2), comme d3 est une métrique,
ρ(x, y) = d3 (ϕ−1 (x), ϕ−1 (y)) = d3 (ϕ−1 (y), ϕ−1 (x)) = ρ(y, x).
Pour (M3) et x, y, z
d3 (ϕ−1 (x), ϕ−1 (z)) ≤ d3 (ϕ−1 (x), ϕ−1 (y)) + d3 (ϕ−1 (y), ϕ−1 (z))
⇒ ρ(x, z) ≤ ρ(x, y) + ρ(y, z).
(iv) Avec la nouvelle métrique, la fonction ϕ : (S (2) \{p}, d3 ) → (R2 , ρ) est

toujours une bijection. Par définition, ρ, il vient pour tout x, y dans (S (2) \{p}
ρ(ϕ(x), ϕ(x)) = d3 (ϕ−1 (ϕ(x)), ϕ−1 (ϕ(y))) = d3 (x, y)
ce qui caractérise bien une isométrie.

c2 , ρ̂) le complété de (R2 , ρ) et i : (R2 , ρ) → (R
Soit (R c2 , ρ̂) l’injection isométrique
c2 , ρ̂) (cf. Théorème 6.5 du Chapitre 3). La composition i ◦ ϕ
dense de (R2 , ρ) dans (R
ϕ i c2 , ρ̂)
(S (2) \{p}, d3 ) −→ (R2 , ρ) −→ (R
est donc aussi une isométrie qui possède un prolongement uniformément continu ϕ b
à l’adhérence (S (2) \{p}, d3 ) qui est égale à S (2) (Théorème 6.3 du Chapitre 4).
Soit j : (S (2) \{p}, d3 ) → (S (2) , d3 ) l’injection de (S (2) \{p}, d3) dans son
adhérence (S (2) \{p}, d3 ) qui est égale à S (2) . La composition j ◦ ϕ−1
ϕ−1 j
(R2 , ρ) −→ (S (2) \{p}, d3) −→ S (2)
est donc aussi une isométrie qui possède un prolongement uniformément continu ψb
c2 , ρ̂) (Théorème 6.3 du Chapitre 4).
au complété (R
Les compositions ϕ c2 , ρ̂) → (R
b ◦ ψb : (R c2 , ρ̂) et ψb ◦ ϕb : S (2) → S (2) coincı̈dent
2 (2)
avec l’identité sur les sous-ensembles denses R et S \{p}. Par l’Exercice 10.8,
elles sont donc égales à l’identité et ϕ b est une bijection. Son inverse et elle sont
uniformément continues. En fait, comme ρ̂(x, y) = ρ(x, y) = d3 (ϕ−1 (x), ϕ−1 (y)),
sur R2 , il vient ρ̂(x, y) = d3 (ϕb−1 (x), ϕb−1 (y)) par densité et ϕ b est une isométrie.
(v) Comme ϕ̂ : S (2) c2
→ (R , ρ̂) est un homéomorphisme, elle est continue.
Enfin, comme la sphère S (2) est compacte dans (R3 , d3 ), son image par ϕ̂ :
c2 = ϕ(S
R b (2) )
c2 , ρ̂) (cf. Théorème 4.1 du Chapitre 4).

est compacte dans (R
Exercice 8.1
Soit {fn } une suite de fonctions dans C 0 (K), K ⊂ Rn compact. Montrer que
si {fn } est uniformément équicontinue et que pour chaque x ∈ K, la suite {fn (x)}
dans R converge vers une fonction f : K → R,
fn (x) → f (x),
alors {fn } converge uniformément vers f . (Une famille de fonctions {fα }, fα : K →

R, est uniformément équicontinue si, pour chaque ε > 0, il existe δ > 0 tel que
∀α, ∀y, ky − xk < δ, |fα (y) − fα (x)| < ε.)
Solution. (i) On montre d’abord que f est uniformément continue sur K. Par hy-
pothèse la famille {fn } est uniformément équicontinue sur K si
∀ε > 0, ∃δ > 0, ∀n ≥ 1, ∀x, y ∈ K tel que kx − yk < δ, |fn (x) − fn (y)| < ε/3.
Pour x, y ∈ K tel que kx − yk < δ et tout n ≥ 1, on a
|f (x) − f (y)| ≤ |f (x) − fn (x)| + |fn (x) − fn (y)| + |f (y) − fn (y)|

≤ |f (x) − fn (x)| + ε/3 + |f (y) − fn (y)|.
Comme fn converge simplement vers f , il existe Nx et Ny tels que
∀n > Nx , |f (x) − fn (x)| < ε/3 et ∀n > Ny , |f (y) − fn (y)| < ε/3.
Donc, pour tous x, y ∈ K tel que kx − yk < δ et tout n ≥ max{Nx , Ny }, on a
|f (x) − f (y)| < ε/3 + ε/3 + ε/3 = ε

⇒ ∀x, y ∈ K tel que kx − yk < δ, |f (x) − f (y)| < ε
et f est uniformément continue sur K.

(ii) Pour la convergence uniforme de {fn } vers f sur K, on part de la continuité
uniforme de f sur K :
∀ε > 0, ∃δ > 0, ∀x, y ∈ K tel que kx − yk < δ, |f (x) − f (y)| < ε/3
et on veut montrer qu’il existe N tel que
∀n > N, ∀x ∈ K, |fn (x) − f (x)| < ε.
La famille de boules ouvertes {Bδ (x) : x ∈ K} est un recouvrement ouvert de

K. Comme K est compact, il existe une suite finie x1 , . . . , xm dans K tel que K ⊂
∪m
i=1 Bδ (xi ). Comme, il y a convergence simple, fn (xi ) → f (xi ) et il existe Ni tel que
pour tout n > Ni , |fn (xi ) − f (xi )| < ε/3. Donc, pour n > N = max{N1 , . . . , Nm }
∀n > N, ∀i, |fn (xi ) − f (xi )| < ε/3. (5.1)
Par équicontinuité uniforme de la famille {fn } sur K et continuité uniforme de f

sur K
kx − xi k < δ ⇒ ∀n ≥ 1, |fn (x) − fn (xi )| < ε/3
(5.2)
et |f (x) − f (xi )| < ε/3.
Enfin, en utilisant (5.2), pour chaque x ∈ K, il existe i tel que kx − xi k < δ et on a

pour le premier et le troisième terme
|fn (x) − f (x)| ≤ |fn (x) − fn (xi )| + |fn (xi ) − f (xi )| + |f (xi ) − f (x)|
< ε/3 + |fn (xi ) − f (xi )| + ε/3
par équicontinuité uniforme de la famille {fn } sur K et continuité uniforme de f

sur K. Enfin, de (5.1), on a pour le second terme
∀n > N, ∀x ∈ K |fn (x) − f (x)| < ε/3 + |fn (xi ) − f (xi )| + ε/3
< ε/3 + ε/3 + ε/3 = ε.
Par définition, {fn } converge uniformément vers f sur K.
Exercice 8.2
Soit (X, d) un espace métrique compact, l’ensemble
déf
X = {A : ∅ 6= A ⊂ X et A fermé}
déf
et ∀A ∈ X , ∀x ∈ X, dA (x) = inf d(a, x).
a∈A
(i) Montrer que les fonctions x 7→ dA (x) : X → R+ et

déf
(A, B) 7→ ρX (A, B) = sup |dA (x) − dB (x)| : X × X → R+
x∈X
sont bien définies.

(ii) Montrer que pour tout A ∈ X , d−1
A {0} = A.
(iii) Montrer que ρX est une métrique sur X .
(iv) Montrer que (X , ρX ) est un espace métrique complet.
Solution. (i) Pour x ∈ X, on a
∀a ∈ A, d(a, x) ≥ 0
et le sous-ensemble {d(a, x) : a ∈ A} de R est borné inférieurement par 0. Donc

déf
0 ≤ dA (x) = inf{d(a, x) : a ∈ A} ∈ R
est l’application dA : X → R+ est bien définie.

Les sous-ensembles fermés A et B du compact X sont des compacts. Comme
les applications dA et dB sont lipschitziennes, elles sont continues et leur images
dA (X) et dB (X) sont compactes et donc bornées. En particulier,
sup dA (x) ≤ MA et sup dB (x) ≤ MB

x∈X x∈X
⇒ ∀x ∈ X, 0 ≤ |dA (x) − dB (x)| ≤ dA (x) + dB (x)
≤ sup dA (x) + sup dB (x) ≤ MA + MB .
x∈X x∈X
Comme |dA (x) − dB (x)| est borné supérieurement

déf
0 ≤ ρX (A, B) = sup |dA (x) − dB (x)| ∈ R
x∈X
et l’application ρX : X × X → R+ est bien définie.

(ii) Par définition, d−1 −1
A {0} = {x ∈ X : dA (x) = 0}. En particulier A ⊂ dA {0}.
Par définition de l’infimum, pour tout n ≥ 1, il existe an ∈ A tel que
1
dA (x) ≤ d(an , x) < dA (x) + .
n
La suite {an } ⊂ A est donc d-Cauchy dans X. Comme X est compact, X est
complet et il existe y ∈ X tel que an → y. Pour tout r > 0, il existe N tel que
∀n > N, d(an , y) < r ⇒ Br (y) ∩ A 6= ∅ ⇒ y ∈ A.

−1
On a démontré que A ⊂ dA {0} ⊂ A. Comme A est fermé, A = A et d−1
A {0} = A =
A.
(iii) Pour montrer que ρX est une métrique, on doit vérifier les trois axiomes.
Pour (M1). Si A = B, alors dA = dB et ρX (A, B) = 0. Si ρX (A, B) = 0, alors
∀x ∈ X, dA (x) = dB (x).
En utilisant le fait que d−1 −1

A {0} = A et dB {0} = B, il vient
( −1
)
∀a ∈ A, dB (x) = 0 ⇒ A ⊂ dB {0} = B
⇒ A = B.
∀b ∈ B, dA (x) = 0 ⇒ B ⊂ d−1
A {0} = A
Pour (M2)
ρX (A, B) = sup |dA (x) − dB (x)| = sup |dB (x) − dA (x)| = ρX (B, A).
x∈X x∈X
Pour (M3) et A, B, C dans X ,
|dC (x) − dA (x)| ≤ |dC (x) − dB (x)| + |dB (x) − dA (x)|

⇒ |dC (x) − dA (x)| ≤ sup |dC (x) − dB (x)| + sup |dB (x) − dA (x)|
x∈X x∈X
⇒ sup |dC (x) − dA (x)| ≤ sup |dC (x) − dB (x)| + sup |dB (x) − dA (x)| .
x∈X x∈X x∈X
(iv) Soit une suite de Cauchy {dAn } pour des fermés An , ∅ 6= An ⊂ X.

Comme X est compact, C 0 (X) est un espace de Banach par le Théorème 2.3 (iv).
Il existe donc f ∈ C 0 (X) tel que dAn → f . On veut démontrer qu’il existe un fermé
A, ∅ 6= A ⊂ X tel que f = dA . On prend comme fermé
déf
A = {x ∈ X : f (x) = 0}.
On fixe x ∈ X. Alors, comme An est compact non-vide
∀n, ∃an ∈ An , d(an , x) = inf d(z, x) = dAn (x)

z∈An
⇒ lim d(an , x) = lim dAn (x) = f (x).

n→∞ n→∞
Donc la suite {an } ⊂ X est bornée. Par compacité de X, il existe une sous-suite,
encore indicée par n, qui converge vers un point y ∈ X :
an → y ⇒ d(y, x) = f (x).
En particulier, f (y) = 0, puisque dans l’inégalité
f (y) ≤ [f (y) − dAn (y)] + [dAn (y) − dAn (an )] + dAn (an ),
| {z } | {z }
≤ d(y,an ) =0
le dernier terme est zéro et dAn est Lipschitz continue de constante 1. En passant à
la limite
|f (y)| ≤ |f (y) − dAn (y)| + d(y, an ) → 0 ⇒ f (y) = 0 ⇒ y ∈ A.

Par définition of A, A n’est donc pas vide. Donc,
∀x ∈ X, ∃y ∈ A tel que f (x) = d(y, x) ≥ inf d(z, x) = dA (x)

z∈A
⇒ ∀x ∈ X, f (x) ≥ dA (x).
On démontre maintenant l’inégalité dans l’autre sens. Soit x ∈ X et le y ∈ A

tel que f (x) = d(y, x) :
|f (x) − f (y)| ≤ |f (x) − dAn (x)| + |dAn (x) − dAn (y)| + |dAn (y) − f (y)|,
| {z } | {z } | {z }
→0 ≤ d(x,y) →0
puisque dAn est Lipschitz de constante un. Enfin, le premier et troisième termes
tendent vers 0 par convergence uniforme. Comme f (y) = 0, il vient
f (x) ≤ f (y) + d(x, y) = d(x, y) ≥ inf d(x, a) = dA (x)

a∈A
⇒ ∀x ∈ X, f (x) ≤ dA (x).
Comme la fonction limite f est égale à dA pour un A, ∅ 6= A ⊂ X, X est bien

complet.
Exercice 8.3
Soit Ω un sous-ensemble ouvert non-vide de Rn . Montrer qu’il existe une suite
croissante de compacts non vides Kk tel que Ω = ∪k≥1 Kk et, pour tout compact
K ⊂ Ω, il existe k ≥ 1 tel que K ⊂ Kk .
Solution. (i) Si ∂Ω = ∅, alors, comme Ω est ouvert, ∁Ω = ∁Ω et
∅ = Ω ∩ ∁Ω = Ω ∩ ∁Ω ⇒ Ω⊂Ω⊂Ω ⇒ Ω = Ω.
Ω est donc un sous-ensemble non-vide à la fois fermé et ouvert de l’espace connexe

Rn . Ce n’est possible que si Ω = Rn . Dans ce cas on prend la suite de compacts
déf
∀k ≥ 1, Kk = {x ∈ Rn : kxk ≤ k}
qui satisfait toutes les conditions.

(ii) Si ∂Ω 6= ∅, alors Ω ∩ ∁Ω 6= ∅, ∁Ω et Ω ne sont pas vides et ∁Ω est fermé.
La fonction distance d∁Ω (x) de x à ∁Ω est bien définie. On prend
déf
∀k ≥ 1, Kk = {x ∈ Rn : kxk ≤ k et d∁Ω (x) ≥ 1/k} .
Comme la norme et la fonction distance sont des fonctions continues, Kk est fermé.
Par définition, Kk est contenu dans la boule compacte Bk (0) de Rn . Les ensembles
Kk sont donc compacts comme sous-ensembles fermés de compacts. Enfin, pour
tout k ≥ 1,
∀x ∈ Kk , d∁Ω (x) ≥ 1/k > 0 / ∁Ω

⇒ x∈ ⇒ x∈Ω ⇒ Kk ⊂ Ω.
La suite est croissante. Soit k ′ ≥ k ≥ 1 et x ∈ Kk . Alors kxk ≤ k ≤ k ′ , d∁Ω (x) ≥

1/k ≥ 1/k ′ et Kk ⊂ Kk′ .
Enfin, soit K ⊂ Ω un compact. Comme la norme et la fonction distance sont
des fonctions continues sur le compact K :
∃xM ∈ K tel que kxM k = sup kx|| et ∃xm ∈ K tel que d∁Ω (xm ) = inf d∁Ω (x)
x∈K x∈K
et, comme xm ∈ K ⊂ Ω, d∁Ω (xm ) > 0. Il suffit enfin de prendre un entier k ≥

max{1, kxM k, 1/d∁Ω (xm )} ce qui entraı̂ne K ⊂ Kk .
Exercice 8.4
Soit Ω un ouvert non-vide de Rn et
déf
C(Ω) = {f : Ω → R |f continue sur Ω}
l’espace des fonctions continues sur Ω, où Ω n’est pas nécessairement borné. Soit
{Kk } la famille des sous-ensembles compacts construite dans l’Exercice 8.3 et pour
tout f ∈ C(Ω) et k ≥ 1 on pose
déf
qk (f ) = sup |f (x)|.
x∈Kk

∞
X
d(f, g) =
2k 1 + qk (f − g)
k=1
est une métrique sur C(Ω).

Solution. On vérifie les trois propriétés d’une métrique. Pour (M1), si f = g, alors
pour tout k, qk (f − g) = 0 et d(f, g) = 0. Dans l’autre sens, d(f, g) = 0 entraı̂ne
qk (f ) = supx∈Kk |f (x)| = 0 et f = g sur ∪k≥1 Kk = Ω. (M2) est vérifiée par
définition. Pour (M3) il suffit de reprendre la démonstration de l’Exercice 10.3 (iii)
et (iv) du Chapitre 3. Par définition, qk (f − g) = supx∈Kk |f (x) − g(x)| et
qk (f − g) 1
=1− .
1 + qk (f − g) 1 + qk (f − g)
Maintenant, puisque qk (f − g) ≤ qk (f − h) + qk (h − g), il vient
1 + qk (f − g) ≤ 1 + qk (f − h)) + qk (h − g)
1 1
≥
1 + qk (f − g) 1 + qk (f − h) + qk (h − g)
1
≥
1 + qk (f − h) + qk (h − g) + qk (f − h) qk (h − g)
1
= .
(1 + qk (f − h)) (1 + qk (h − g))
Donc
qk (f − g) 1
=1 −
1 + qk (f − g) 1 + qk (f − g)
1
≤ 1−
(1 + qk (f − h)) (1 + qk (h − g))
qk (f − h) + qk (h − g) + qk (f − h) qk (h − g)
=
(1 + qk (f − h)) (1 + qk (h − g))
qk (f − h) + qk (h − g) + 2 qk (f − h) qk (h − g)
≤
(1 + qk (f − h)) (1 + qk (h − g))
qk (f − h) qk (h − g)
= + .
1 + qk (f − h)) 1 + qk (h − g)
Finalement on somme des deux côtés

∞
X ∞
X ∞
X
1 qk (f − g) 1 qk (f − h) 1 qk (h − g)
≤ +
2k 1 + qk (f − g) 2k 1 + qk (f − h)) 2k 1 + qk (h − g)
k=1 k=1 k=1
et d(f, g) ≤ d(f, h) + d(h, g).
Exercice 8.5
(i) Montrer que si A ∈ L(Rn ) est inversible, alors A−1 ∈ L(Rn ).
(ii) Montrer que si A ∈ L(Rn , Rm ) est injective, alors A⊤ A ∈ L(Rn ) est inver-
sible, où A⊤ ∈ L(Rm , Rn ) est l’application transposée de A.
(iii) Montrer que pour A ∈ L(Rn , Rm ), Ker A et Im A sont des sous-espaces
linéaires (espaces vectoriels).
Solution. (i) Soient α, β ∈ R et y1 , y2 ∈ Rn . Comme A est inversible, il existe

x1 , x2 ∈ Rn tel que yi = Axi . On montre que A−1 est linéaire
α x1 + β x2 = A−1 (A(α x1 + β x2 )) = A−1 (α A(x1 ) + β A(x2 )))

⇒ α A−1 y1 + β A−1 y2 = A−1 (α y1 + β y2 ).
Comme on est dans Rn , la linéarité entraı̂ne la continuité et A−1 ∈ L(Rn ).

(ii) Par définition, A⊤ A ∈ L(Rn ) et l’inversibilité est équivalente à l’injectivité,
c’est-à-dire, A⊤ Ax = 0 entraı̂ne x = 0. En effet,
A⊤ Ax = 0 ⇒ 0 = (A⊤ Ax) · x = Ax · Ax = kAxk2 = 0 ⇒ x=0
puisque A est injective.

(iii) Ker A = {x ∈ Rn : Ax = 0} est fermé comme image inverse du fermé {0}.
Il est linéaire car pour tout α, β ∈ R et x, y ∈ Ker A,
A(αx + βy) = α Ax + β Ay = α 0 + β 0 = 0.
Im A = {Ax : x ∈ Rn } est un sous-espace linéaire puisque tout α, β ∈ R et x, y ∈ Rn
α Ax + β Ay = A(αx + βy) ∈ Im A.
Soit y ∈ (Im A)′ un point d’accumulation de Im A. Il existe donc une suite {yk =
Axk } dans Im A tel que yk 6= y et yk → y dans Rm . On a aussi vu que Im A =
[Ker A⊤ ]⊥ , Donc, pour tout z ∈ Ker A⊤
0 = yk · z → y · z ⇒ ∀z ∈ Ker A⊤ , y · A⊤ z = 0
⇒ y ∈ [Ker A⊤ ]⊥ = Im A.
et Im A est fermée.
Exercice 8.6
(i) Trouver et caractériser tous les A ∈ GL(n) tels que
∀x, y ∈ Rn , kAx − Ayk = kx − yk (5.3)
pour la norme euclidienne kxk sur Rn .

(ii) Est ce que l’ensemble
{A ∈ GL(n) : kAx − Ayk = kx − yk ∀x, y ∈ Rn } (5.4)
forme un groupe ?
Solution. (i) Pour tout x ∈ Rn , on a
kAxk = kAx − A0k = kx − 0k = kxk

n
⇒ ∀x ∈ R , kAxk2 = kxk2 ⇒ ∀x ∈ Rn , Ax · Ax = x · x.
En particulier,
4 Ax · Ay = A(x + y) · A(x + y) − A(x − y) · A(x − y)

= (x + y) · (x + y) − (x − y) · (x − y) = 4 x · y
⇒ ∀x, y ∈ Rn , A⊤ Ax · y = x · y ⇒ ∀x ∈ Rn , A⊤ Ax = x ⇒ A⊤ A = I.
Comme A est inversible, A−1 A = I et, de ce qui pécède, A−1 A = I = A⊤ A ce qui

donne A−1 = A⊤ et AA⊤ = I.
(ii) On introduit la définition suivante
déf
O(N)(n) = A ∈ Gl(n) : A⊤ A = I = AA⊤ .
On a montré en (i) que tout A ∈ GL(n) vérifant la propriété (8.1), on a A ∈

O(N)(n). Dans l’autre sens si A ∈ O(N)(n), alors
∀x, y ∈ Rn , AA⊤ (x − y) = x − y
⇒ kA(x − y)k2 = A⊤ A(x − y) · (x − y) = x − y · (x − y) = kx − yk2
et la propriété (8.1) kA(x − y)k = kx − yk. On montre maintenant que O(N)(n) est
un groupe pour la composition. Pour A, B ∈ O(N)(n), (AB)⊤ AB = B ⊤ A⊤ AB =
B ⊤ B = I et (BA)⊤ BA = A⊤ B ⊤ BA = A⊤ A = I. Donc A ◦ Bin O(N)(n). L’iden-
tité appartient à AB ∈ O(N)(n). Pour l’inverse, on a vu dans la partie (i) que
A−1 = A⊤ et donc (A−1 )⊤ = (A⊤ )⊤ = A. Donc
(A−1 )⊤ A−1 = A A−1 = I et A−1 (A−1 )⊤ = A−1 A = I.
O(N)(n) est donc bien un sous-groupe de GL(n). C’est le groupe des isométries
linéaires de Rn : les transformations qui prérvent la distance dans Rn . De plus, par
continuité de la composition, O(N)(n) est un sous-groupe fermé de GL(n).
Exercice 8.7
Soit X = R \{0} et la fonction
déf 1 1
x, y 7→ d(x, y) = |x − y| + − .
x y
Montrer que (X, d) est un espace métrique complet.
Solution. Par définition de d, d(x, y) = 0 ⇐⇒ x = y et d(x, y) = d(y, x). Pour
x, y, z ∈ X
1 1 1 1 1 1
|x − y| + − ≤ |x − z| + |z − y| + − + −
x y x z z y
1 1 1 1
≤ |x − z| + − + |z − y| + − .
x z z y
Soir {xn } une suite de Cauchy dans X. Pour tout ε > 0, il existe N tel que pour
tout m, n > N
1 1
|xn − xm | + − < ε.
xn xm
Les suites {xn } et {1/xn } sont donc Cauchy dans R. Comme R est complet, il existe
x, y ∈ R tel que
1 1 1
xn → x et →y ⇒ 1 = xn → xy ⇒ x 6= 0 et y =
xn xn x
et x ∈ X.
Exercice 8.8
On considère l’ensemble P(X) des sous-ensembles d’un ensemble arbitraire X
y compris l’ensemble vide ∅ muni de l’opération différence symétrique △
déf
A △ B = [A\B] ∪ [B\A] .
Montrer que (P(X), △) vérifie les propriétés d’un groupe abélien :

A ∈ P(X) ;
(iv) chaque A ∈ P(X) possède un inverse puisque A △ A = ∅ (ici A est son
propre inverse, c’est-à-dire, A−1 = A) ;
(v) (commutativité) A △ B = B △ A ;
(vi) pour A, B, C ∈ P(X), (A △ B) ∩ C = (A ∩ C) △ (B ∩ C).
Solution. On écrira ∁A pour X\A. (i) Par définition.
(ii) On observe d’abord que, pour A, B ∈ P(X),
∁(A △ B) = ∁A △ B = ∁B △ A.
En effet,
∁(A △ B) = ∁([A ∩ ∁B] ∪ [B ∩ ∁A])
= ∁[A ∩ ∁B] ∩ ∁[B ∩ ∁A]
= (∁A ∪ B]) ∩ (∁B ∪ A]) = (∁A ∩ ∁B) ∪ (A ∩ B) = ∁A △ B
Soient A, B, C ∈ P(X). On écrira ∁A pour X\A. On a
(A △ B) △ C = [(A △ B) ∩ ∁C] ∪ [C ∩ ∁(A △ B)]

= [ [A ∩ ∁B] ∪ [B ∩ ∁A] ∩ ∁C] ∪ [C ∩ [∁A ∩ ∁B] ∪ [B ∩ A] ]
= [A ∩ ∁B ∩ ∁C] ∪ [B ∩ ∁A ∩ ∁C] ∪ [C ∩ ∁A ∩ ∁B] ∪ [C ∩ B ∩ A]

= A ∩ [∁B ∩ ∁C] ∪ [C ∩ B] ∪ ∁A ∩ [B ∩ ∁C] ∪ [C ∩ ∁B]

= A ∩ ∁(B △ C) ∪ ∁A ∩ (B △ C) = A △ (B △ C) .
(iii) Par définition, A △ ∅ = [A ∩ ∁∅] ∪ [∅ ∩ ∁A] = A ∩ X = A.
(iv) Par définition, A △ A = [A ∩ ∁A] ∪ [A ∩ ∁A] = ∅.
(v) Par définition, A △ B = [A ∩ ∁B] ∪ [B ∩ ∁A] = [B ∩ ∁A] ∪ [A ∩ ∁B] = B △ A.
(vi) (distributivité) Par définition,

(A △ B) ∩ C = [A ∩ ∁B] ∪ [B ∩ ∁A] ∩ C
= [A ∩ ∁B ∩ C] ∪ [B ∩ ∁A ∩ C]
= [(A ∩ C) ∩ ∁B] ∪ [(B ∩ C) ∩ ∁A]
= [(A ∩ C) ∩ (∁B ∪ ∁C)] ∪ [(B ∩ C) ∩ (∁A ∪ ∁C)]
= [(A ∩ C) ∩ ∁(B ∩ C)] ∪ [(B ∩ C) ∩ ∁(A ∩ C)]
= (A ∩ C) △ (B ∩ C).
Exercice 8.9
Soit X un ensemble arbitraire et P(X) l’ensemble de tous les sous-ensembles
de X incluant ∅. Soit l’ensemble
déf
{0, 1}X = {toutes les applications f : X → {0, 1}}
de toutes les applications définies sur X à valeurs dans l’ensemble à deux éléments
{0, 1}. On associe à chaque A ∈ P(X) la fonction caractéristique
(
déf 1, si x ∈ A
χA (x) =
0, si x ∈ X\A.
A 7→ χA : P(X) → {0, 1}X
est bien définie et bijective.

(ii) Montrer que {0, 1}X est un groupe abélien pour l’opération
déf
(f1 △ f2 )(x) = |f1 (x) − f2 (x)| (5.5)
et en déduire que
(χA △ χB )(x) = |χA (x) − χB (x)| = χA△B (x). (5.6)
pour la différence symétrique entre A et B dans P(X)

déf
A △ B = [A\B] ∪ [B\A]. (5.7)

déf
d(f, g) = sup |f (x) − g(x)| (5.8)
x∈X
définit une métrique sur {0, 1}X et que ({0, 1}X , d) est complet.
(iv) Montrer que (P(X), ρ) est un espace métrique complet pour la métrique
déf
ρ(A, B) = sup |χA (x) − χB (x)| .
x∈X
(v) En supposant démontré que P(X) est un groupe abélien pour l’opération
binaire différence symétrique (5.7) (voir la section 7.1 du Chapitre 5), mon-
trer que △ est continue par rapport à la métrique ρ.
Solution. (i) L’application A 7→ χA : P(X) → {0, 1}X est clairement bien définie.
Elle est injective. En effet, si χA = χB , alors pour tout x ∈ A, χB (x) = 1 et A ⊂ B
et, réciproquement, pour tout x ∈ B, χA (x) = 1 et B ⊂ A, d’où A = B. Elle est
surjective puisque que pour tout f ∈ {0, 1}X , on a, pour A = f −1 {1} ∈ P(X),
f −1 {0} = X\A et χA = f .
(ii) L’ensemble {0, 1}X est un groupe pour l’opération (5.5). En effet, la valeur
absolue |f1 (x) − f2 (x)| de deux fonctions ne prenant que les valeurs 0 ou 1 est égale
à 0 ou 1. Donc, f1 △ f2 ∈ {0, 1}X et, par définition, f1 △ f2 = f2 △ f1 . L’élément
neutre est la fonction f = 0 et l’inverse de f est f car f △ 0 = 0 = 0 △ f . C’est
donc bien un groupe.
Pour A, B ∈ P(X),
(
1, si x ∈ [A\B] ∪ [B\A]
|χA (x) − χB (x)| =
0, si x ∈ [A ∩ B] ∪ [X\B ∩ X\A].
Mais [X\B ∩ X\A] = X\(A ∪ B) et A ∩ B = X\[X\A ∪ X\B] et
X\(A ∪ B) ∪ X\(X\A ∪ X\B) = X\[(A ∪ B) ∩ (X\A ∪ X\B)] = X\(A\B ∪ B\A)

⇒ (χA △ χB )(x) = |χA (x) − χB (x)| = χA△B (x).
qui correspond à prendre la différence symétrique (5.7) de A et de B dans P(X).

(iii) La fonction (5.8) est bien définie. C’est une métrique. Pour (M1), f = g
donne d(f, g) = 0 et si d(f, g) = 0, alors pour tout x ∈ X, |f (x) − g(x)| = 0 et
f = g. (M2) est vérifiée car d est symétrique par définition. Enfin, on a l’inégalité
du triangle (M3) car ponctuellement pour f, g, h ∈ {0, 1}X
|f (x) − h(x)| ≤ |f (x) − g(x)| + |g(x) − h(x)|

≤ sup |f (x) − g(x)| + sup |g(x) − h(x)|.
x∈X x∈X
L’espace {0, 1}X est complet. Soit {fn } une suite d-Cauchy :
∀ε > 0, ∃N tel que ∀n, m > N, d(fn , fm ) < ε.
En raison de la métrique du supremum, pour chaque x ∈ X la suite {fn (x)} est

Cauchy dans R et il existe f (x) ∈ R tel que fn (x) → f (x). Pour avoir la complétude,
il faut montrer que f (x) ∈ {0, 1}. Soit S = ∪∞ n=1 {fn (x)} l’ensemble des éléments
de la suite {fn (x)}. S est fini car S ⊂ {0, 1}. En particulier, il existe s ∈ S et une
sous-suite fnk (x) = s telle que fnk (x) → s, c’est-à-dire,
∃s ∈ S, ∀k ≥ 1, ∃nk ≥ k tel que fnk (x) = s.
Sinon,
∃N0 , ∀n ≥ N0 , fn (x) 6= 0 et ∃N1 , ∀n ≥ N1 , fn (x) 6= 1

⇒ ∀s ∈ S, ∀n ≥ max{N0 , N1 }, fn (x) 6= s
⇒ ∀n ≥ max{N0 , N1 }, ∀s ∈ S, fn (x) 6= s.
Ceci voudrait dire que la suite {fn (x)} est finie ce qui est une contradiction. Comme
toute sous-suite de la suite initiale {fn (x)} converge vers la même limite on en
conclut que f (x) ∈ {0, 1}. La fonction limite f appartient donc à {0, 1}X qui est
complet.
(iv) En utilisant la bijection (5.6) et le fait que {0, 1}X soit complet, on peut
maintenant définir la métrique ρ(A, B) = d(χA , χB ) sur P(X) via les fonctions
caractéristiques puisque de la partie (i)
{0, 1}X = {χA : A ∈ P(X)} .

Le groupe (P(X), ρ) est donc un espace métrique complet.

Enfin, pour la continuité au point (A, B), on prend un autre point (C, D)
ρ(C △ D, A △ B)
= sup |χC△D (x) − χA△B (x)|
x∈X
≤ sup ||χC (x) − χD (x)| − |χA (x) − χB (x)||
x∈X
≤ sup |(χC (x) − χD (x)) − (χA (x) − χB (x))|
x∈X
≤ sup |(χC (x) − χA (x)) − (χD (x) − χB (x))|
x∈X
≤ sup |χC (x) − χA (x)| + sup |χD (x) − χB (x)| = ρ(C, A) + ρ(D, B).
x∈X x∈X
La fonction est donc non seulement ρ-continue en (A, B), mais aussi lipschitzienne
sur P(X).
Exercice 8.10
Soit (X, d) un espace métrique compact et C 0 (X; Rk ) pour k ≥ 1 muni de la
norme
k
!1/2
déf
X
2
kf kC 0 = sup kf (x)k, kyk = |yi | . (5.9)
x∈X i=1
Démontrer les énoncés suivants.

(i) Si S est un sous-ensemble compact de C 0 (X; Rk ), alors S est fermé,
(a) S est uniformément équicontinu et
(b) S est uniformément borné, c’est-à-dire, ∃M > 0, ∀f ∈ S, ∀x ∈
X, kf (x)k ≤ M .
(ii) Réciproquement, si S est un sous-ensemble de C 0 (X; Rk ) vérifiant (a) et
(b), alors l’adhérence S de S est compacte dans C 0 (X; Rk ).
Solution. (i) Si S est compact, il est fermé.
(a) (S est équicontinue). Pour ε > 0, la famille de boules ouvertes {Bε (f ) :
f ∈ S} est un recouvrement ouvert du compact S. Il existe donc f1 , . . . , fm ∈ S tel
que
S ⊂ ∪m
i=1 Bε (fi ).
Donc, pour tout f ∈ S, il existe i tel que

sup kf (x) − fi (x)k < ε/3. (5.10)
x∈X
Comme les éléments f de C 0 (X; Rk ) sont uniformément continus,

∀i, ∃δi > 0, ∀x, y ∈ X, d(x, y) < δ, kfi (y) − fi (x)k < ε/3.
On prend δ = min{δ1 , . . . , δm } > 0 et x, y ∈ X tel que d(x, y) < δ
kf (y) − f (x)k ≤ kf (y) − fi (y)k + kfi (y) − fi (x)k + kfi (x) − f (x)k
| {z } | {z } | {z }
ε/3 ε/3 ε/3
⇒ ∀x, y ∈ X, d(x, y) < δ, ∀f ∈ S, kf (y) − f (x)k < ε.
(b) Comme S est compact dans C 0 (X; Rk ), il est fermé et borné. Il existe donc
M > 0 tel que
∀f ∈ S, sup kf (x)k = kf kC 0 ≤ M.
x∈X
(ii) On montre maintenant la réciproque. Étant donné la famille S qui vérifie (a) et
(b), il faut montrer la compacité séquentielle de S : pour toute suite {fn } ⊂ S, il
existe f ∈ S et une sous-suite {fnk } tel que fnk → f dans C 0 (X; Rk ), c’est-à-dire,
uniformément dans X.
Par uniforme équicontinuité de S,
∀ε > 0, ∃δ > 0, ∀n, ∀x, y ∈ X, d(y, x) < δ, kfn (x) − fn (y)k < ε/3.
Par compacité de X, il peut être couvert par un nombre fini de boules Bδ (xj ),
x1 , . . . , xℓ ∈ X. Comme, pour chaque j et n, la suite {fn (xj )} est bornée, il existe
une sous-suite {fnk } de {fn } que l’on écrira {fn } et il existe N tel que
∀j, 1 ≤ j ≤ ℓ, ∀n, m > N, kfn (xj ) − fm (xj )k < ε/3.
Cette sous-suite est Cauchy dans C 0 (X; Rk ). En effet, pour tout x ∈ X, il existe xj
tel que d(x, xj ) < δ et pour tous m, n > N
kfm (x) − fn (x)k ≤ kfm (x) − fm (xj )k + kfm (xj ) − fn (xj )k + kfn (xj ) − fn (x)k
< ε/3 + ε/3 + ε/3 = ε.
Comme les fonctions de la sous-suite {fn } sont uniformément continues, il existe f ∈

C 0 (X; Rk ) tel que fn converge uniformément vers f et ce f appartient à l’adhérence
S de S. Donc, S est compact dans C 0 (X; Rk ).
Exercice 7.1
Soit t 6= 0 et la fonction

 f (g(x + t)) − f (g(x)) , si g(x + t) − g(x) 6= 0
déf
q(t) = g(x + t) − g(x) (6.1)
 ′
f (g(x)), si g(x + t) − g(x) = 0.
Comme f ′ (g(x)) existe,
f (g(x) + θ) − f (g(x))
∀ε > 0, ∃η tel que ∀0 < |θ| < η, − f ′ (g(x)) < ε.
θ
Comme g ′ (x) existe, g est continue en x et
∃δ > 0 tel que ∀0 < |t| < δ, |g(x + t) − g(x)| < η.
Donc, pour 0 < |t| < δ,

( )
ε, si g(x + t) − g(x) 6= 0
|q(t) − f ′ (g(x))| ≤ ≤ε
0, si g(x + t) − g(x) = 0
⇒ lim q(t) = f ′ (g(x)).
t→0
Finalement,
f (g(x + t)) − f (g(x))

 t

 f (g(x + t)) − f (g(x)) g(x + t) − g(x)
 si g(x + t) 6= g(x)
g(x + t) − g(x) t
=

 g(x + t) − g(x)
 f ′ (g(x)) si g(x + t) = g(x)
t
g(x + t) − g(x)
= q(t) → f ′ (g(x)) g ′ (x)
t
lorsque t → 0 puisque q(t) → f ′ (g(x)) et g(x+t)−g(x)

t → g ′ (x). On obtient donc à la
′
fois l’existence de (f ◦ g) (x) et son expression.
Exercice 7.2
Soit f : [a, b] → R telle que f ′ (x) existe et soit uniformément continue sur
]a, b[ . Montrer que, pour tout ε > 0, il existe δ > 0 tel que
f (y) − f (x)
∀x, y ∈ ]a, b[ , 0 < |y − x| < δ, − f ′ (x) < ε.
y−x
On dit que f est uniformément dérivable sur ]a, b[ .
Solution. Pour tous x, y ∈ [a, b], par le Théorème 2.3 de la moyenne du Chapitre 6,
∃θ ∈ ]0, 1[ tel que f (y) − f (x) = (y − x) f ′ (x + θ(y − x))
et pour x 6= y
f (y) − f (x)
− f ′ (x) = |f ′ (x + θ(y − x)) − f ′ (x)| .
y−x
Comme f ′ est uniformément continue sur ]a, b[ , pour tout ε > 0, tel que
∃δ > 0 tel que ∀z, x ∈ ]a, b[ , |z − x| < δ, |f ′ (z) − f ′ (x)| < ε.
Il vient donc pour tous y, x ∈ ]a, b[ tel que |y − x| < δ,
|x + θ(y − x) − x| = θ |y − x| < |y − x| < δ

f (y) − f (x)
⇒ − f ′ (x) = |f ′ (x + θ(y − x)) − f ′ (x)| < ε.
y−x
Exercice 7.3
Montrer que la fonction numérique (voir Figure 6.9)
 2
 xy , 6 0
si x =
déf
f (x, y) = x + y 42

0, si x = 0
est dérivable en (x, y) = (0, 0) dans toutes les directions v = (v1 , v2 ), mais qu’elle
n’est ni différentiable au sens de Gateaux ni continue au point (x, y) = (0, 0).
Remarquer que l’on a les propriétés suivantes
x<0 ⇒ f (x, y) ≤ 0 et x>0 ⇒ f (x, y) ≥ 0

f (−x, y) = −f (x, y) et f (x, −y) = f (x, y).
Solution. Par définition,
x1 x22
f (x1 , x2 ) = si x1 6= 0, f (0, x2 ) = 0
x21 + x42
et pour tout t 6= 0, le quotient différentiel est donné par

 

 1 tv1 (tv2 )2 
f (tv) − f (0) 2 4
, si v1 6= 0
q(t) = = t (tv1 ) + (tv2 )
t 
 0, 
si v1 = 0
   2 
2

 v1 v2 , si v 6= 0    v2 , si v = 
1 1 6 0
= v12 + t2 v24 → v1

 0,   
si v1 = 0. 0, si v1 = 0.
 2 
 v2 , si v 6= 0 
1
⇒ f ′ (x; v) = v1
 
0, si v1 = 0.
La fonction f est dérivable en x = 0 dans toutes les directions. Elle n’est cependant
pas Gateaux différentiable en 0 puisque pour v1 6= 0,
(v1 , v2 ) 7→ f ′ (0, v) = v22 / v1

n’est pas linéaire.

Pour montrer que f est discontinue en x = 0, il suffit de suivre le chemin
x1 = x22 , x2 6= 0, lorsque x2 tend vers 0. En effet
x42 1
f (x22 , x2 ) = 4 4 = 6= 0 = f (0, 0).
x2 + x2 2
Exercice 7.4
On a déjà vu que par définition, l’application v 7→ dH f (x, v) : Rn → Rm est
homogène. Toujours par définition de dH f (x; v), pour tout ε > 0, il existe δ > 0 tel
que
f (x + tw) − f (x)
∀t, 0 < t < δ, ∀w, kw − vkRn < δ, − dH f (x; v) < ε.
t Rm
On peut donc passer à la limite lorsque t ց 0 pour obtenir df (x; w)

f (x + tw) − f (x)
∀w, kw − vkRn < δ, lim − dH f (x; v) <ε
tց0 t Rm
⇒ ∀w, kw − vkRn < δ, kdf (x; w) − dH f (x; v)kRm < ε.
Comme df (x; w) = dH f (x; w), on a la continuité en tout point v ∈ Rn .
Exercice 7.5
Soient f, g : Rn → Rm deux applications Fréchet différentiables sur Rn et la
nouvelle application
déf
x 7→ h(x) = f (x) · g(x) : Rn → R . (6.2)
Démontrer que h est Fréchet différentiable et que
Dh(x) = Df (x)⊤ g(x) + Dg(x)⊤ f (x) (6.3)
ou, si ∇h(x) est interprété comme un vecteur colonne (ou matrice n × 1) et f (x) et
g(x) comme des vecteurs colonnes (ou matrice m × 1),
∇h(x) = g(x)⊤ Df (x) + f (x)⊤ Dg(x), (6.4)
où Df (x) et Dg(x) sont des matrices m × n.
Solution. On démontre que h est Hadamard différentiable. Pour t → 0, t 6= 0, et
w → v, on a
h(x + tw) − h(x) f (x + tw) − f (x) g(x + tw) − g(x)
= · g(x + tw) + f (x) ·
t t t
Comme f et g sont Hadamard différentiables et continues, il vient
h′H (x; v) = fH
′ ′
(x; v) · g(x) + f (x) · gH (x; v)

= Df (x)v · g(x) + f (x) · Dg(x)v = Df (x)⊤ g(x) + Dg(x)⊤ f (x) · v
et, comme cette application est linéaire par rapport à v, h est Hadamard et donc
Fréchet différentiable et Dh(x) = Df (x)⊤ g(x) + Dg(x)⊤ f (x).
Exercice 7.6
Soit f : Rn → Rm une application Fréchet différentiable telle que, pour tout
x, kf (x)kRm = 1. Montrer que
Df (x)⊤ f (x) = 0.
Y-a-t-il une interprétation géométrique de cette identité ?

Solution. On est dans le cadre de l’Exercice 7.5 avec f = g et, en plus, la condition
f (x) · f (x) = kf (x)k2 = 1. Il vient
Df (x)⊤ f (x) + Df (x)⊤ f (x) = 0 ⇒ Df (x)⊤ f (x) = 0.
Exercice 7.7
Soit f : Rn → R admettant des dérivées partielles d’ordre un bornées dans un
ouvert U de Rn .
(i) Montrer que f est continue sur U et lipschizienne en chaque point de U .
Indication. S’inspirer de la démonstration du Théorème 3.11 du Chapitre
6 des notes.
(ii) Est-ce que, en général, f est Gateaux différentiable en tout point de U ?
Démonstration. (i) Soit M la constante tel que
∀y ∈ U, ∀i, 1 ≤ i ≤ n, |∂i f (y)| < M. (6.5)
Soit x ∈ U . Comme U est ouvert, il existe une boule B3r (x), r > 0, telle que
B3r (x) ⊂ U . Soient deux points y, z ∈ Br (x). On leur associe les points suivants
déf déf
x0 = z, xi = xi−1 + (y − z)i ei , 1 ≤ i ≤ n,
où (y − z)i est la ieme composante du vecteur y − z ∈ Rn .
On considère la différence
f (y) − f (z)
que l’on peut réécrire sous la forme
n
X
f (y) − f (z) = f (xi ) − f (xi−1 ).
i=1
Pour chaque i, la fonction f varie le long d’une ligne de direction ei passant par les
points xi−1 et xi où la dérivée partielle ∂i f existe. Puisque f est dérivable dans la
direction ei en tout point de B3r (x), la fonction gi (α) = f (xi−1 + α (y − z)i ei ) est
continue sur [0, 1] et dérivable sur ]0, 1[ . Par le théorème de la moyenne (Théorème
3.8, Chapitre 6) et par homogénéité positive
∃αi ∈ ]0, 1[ , f (xi ) − f (xi−1 ) = f ′ (xi−1 + αi (y − z)i ei ; (y − z)i ei )

(6.6)
= (y − z)i ∂i f (xi−1 + αi (y − z)i ei ).
Par construction, pour tout i

kxi−1 + αi (y − z)i ei − xkRn ≤ kxi−1 + αi (y − z)i ei − zkRn + kz − xkRn
et
kxi−1 + αi (y − z)i ei − zkRn
i−1
X
= (xj − xj−1 ) + αi (y − z)i ei
j=1
Rn
v
i−1 u i−1
X uX
= (y − z)j ej + αi (y − z)i ei =t |(y − z)j |2 + |αi (y − z)i |2
j=1 n j=1
R
v v
u i u n
uX uX
≤ t |(y − z)j |2 ≤ t |(y − z)j |2 = ky − zkRn
j=1 j=1
≤ ky − xkRn + kz − xkRn < 2r.

Donc, pour tout i,
kxi−1 + αi (y − z)i ei − xkRn ≤ kxi−1 + αi (y − z)i ei − zkRn + kz − xkRn
< 2r + r = 3r
⇒ ∀i, ∂i f (xi−1 + αik (y − x)i ei ) ≤ M.
De l’identité (6.6)
f (xi ) − f (xi−1 ) ≤ ∂i f (xi−1 + αik (y − x)i ei ) |(y − x)i | ≤ M |(y − x)i | .
Finalement, par l’inégalité du triangle,
n
X n
X
|f (y) − f (z)| ≤ f (xi ) − f (xi−1 ) ≤ M |(y − z)i |
i=1 i=1
v
u n
√ uX √
≤ 2M t
2
|(y − z)i | = 2 M ky − zkRn .
i=1
On a montré que, pour chaque x ∈ U , il existe r > 0 tel que

√
∀y, z ∈ Br (x), |f (y) − f (z)| ≤ 2 M ky − zkRn .
Par définition, f est lipschitzienne en chaque point x ∈ U et donc continue sur U .
Cependant, f n’est pas nécessairement lipschitzienne sur tout U .
(ii) En général, f n’est pas Gateaux différentiable. Considérons la fonction f
de l’Exemple 3.2 et 3.6 du Chapitre 6
 3
 x si (x, y) 6= (0, 0)
f (x, y) = x2 + y 2

0, si (x, y) = (0, 0).
On a vu que f est continue en (0, 0) et Hadamard dérivable dans toutes les directions
 
3

 v1 , 
2 ′ 2 + v2 si (v1 , v2 ) 6= (0, 0)
∀v ∈ R , fH (0; v) = v 1 2 = f (v1 , v2 ).

 0, 
si (v1 , v2 ) = (0, 0)
′
Cependant, f n’est pas Gateaux différentiable car v 7→ fH (0; v) n’est pas linéaire.
Les dérivées partielles existent et sont bornées dans tout R2 . En effet,
∂x f (0, 0) = 1 et ∂y f (0, 0) = 0.
Pour (x, y) 6= (0, 0),
x4 + 3 x2 y 2 yx3
∂x f (x, y) = et ∂y f (x, y) = −
(x2 + y 2 )2 (x2 + y 2 )2
et l’on a les majorations suivantes
2
x4 + 3 x2 y 2 x4 + 3 x2 y 2 x2 3 2 x2 y 2 3 5
2 2 2
= 2 2 2
≤ 2 2
+ 2 2 2
≤1+ =
(x + y ) (x + y ) x +y 2 (x + y ) 2 2
3 2
yx x 1 2yx 1 1
− 2 = 2 ≤1 = .
(x + y 2 )2 x + y 2 2 x2 + y 2 2 2
Les dérivées partielles existent et sont bornées dans U = R2 , mais f n’est pas
Gateaux différentiable en (0, 0).
Exercice 7.8
On considère la fonction f : R2 → R suivante
 2 2
 xy (x − y ) , si (x, y) 6= (0, 0)
déf 2 2
f (x, y) = x +y (6.7)

0, si (x, y) = (0, 0).
Montrer que
(i) f , ∂x f et ∂y f existent et sont continues sur R2 ;
2
(ii) ∂xy 2
f = ∂x (∂y f ) et ∂yx f = ∂y (∂x f ) existent dans R2 et sont continues sauf
en (0, 0) ;
2 2
(iii) ∂xy f (0, 0) = 1 et ∂yx f (0, 0) = −1.
Rappel de la notation (3.66) du Chapitre 6 :

2 ∂ ∂f
∂ji f (x) = (x) = d2 f (x; ei ; ej ) = Hf (x)ij .
∂xj ∂xi
Démonstration. (i) f est continue sur R2 . En (0, 0), on a l’estimé

xy (x2 − y 2 ) x2 + y 2
|f (x, y) − f (0, 0)| = 2 2
≤ |xy| 2 = |x| |y|.
x +y x + y2
√
Pour ε > 0, on prend δ = ε:
√ √
∀(x, y) ∈ Bδ (0, 0), |f (x, y) − f (0, 0)| < ε ε = ε.
Pour (x̂, ŷ) 6= (0, 0)), k(x̂, ŷ)k > 0. On prend r = k(x̂, ŷ)k/2 : pour tout (x, y) ∈
Br (x̂, ŷ)
1 3
k(x̂, ŷ)k ≤ k(x, y)k ≤ k(x̂, ŷ)k
2 2
et le dénominateur ne s’annule pas. La fonction f est donc continue en (x̂, ŷ) en
tant que quotient de deux fonctions polynômiales.
Dérivées partielles d’ordre un. En un point (x̂, ŷ) 6= (0, 0)), il existe t̄ > 0 tel
que (x̂, ŷ) + t ei ∈ Br (x̂, ŷ) et (x̂, ŷ) + t ei 6= (0, 0)) pour tout t, 0 ≤ t ≤ t̄. On calcule
d d (x̂ + t)2 − ŷ 2
∂x f ((x̂, ŷ)) = f (x̂ + t, ŷ) = (x̂ + t) ŷ
dt t=0 dt (x̂ + t)2 + ŷ 2 t=0
x̂2 − ŷ 2 4 x̂2 ŷ 2 x̂4 − ŷ 4 + 4 x̂2 ŷ 2
= ŷ 2 + ŷ = ŷ .
x̂ + ŷ 2 (x̂2 + ŷ 2 )2 (x̂2 + ŷ 2 )2
Comme f (x, y) = −f (y, x), on obtient de ce premier calcul
ŷ 4 − x̂4 + 4 x̂2 ŷ 2
∂y f ((x̂, ŷ)) = −∂x f ((ŷ, x̂)) = −x̂ .
(x̂2 + ŷ 2 )2
Comme le dénominateur est différent de 0 dans la boule Br (x̂, ŷ), ces expressions
sont continues en (x̂, ŷ). Il reste maintenant le point (0, 0) autour duquel f (t, 0) =
0 = f (0, t), t 6= 0. Donc
∂x f ((0, 0)) = ∂y f ((0, 0)) = 0.
Pour la continuité en (0, 0)
x4 − y 4 + 4 x2 y 2
|∂x f ((x, y)) − ∂x f ((0, 0))| = y −0
(x2 + y 2 )2

x4 y4 4 x2 y 2
≤ |y| + +
(x2 + y 2 )2 (x2 + y 2 )2 (x2 + y 2 )2
≤ |y| (1 + 1 + 2)
et
y 4 − x4 + 4 x2 y 2
|∂y f ((x, y)) − ∂y f ((0, 0))| = −x − 0 ≤ |x| (1 + 1 + 2) .
(x2 + y 2 )2
Il y a donc bien continuité en (0, 0). On en conclut par le Théorème 3.11 du Chapitre
6 que f est Fréchet différentiable partout dans R2 .
(ii) Dérivées partielles croisées d’ordre 2. On a obtenu les expressions suivantes

4 4 2 2

y x −y +4x y , si (x, y) 6= (0, 0)
∂x f (x, y) = (x2 + y 2 )2

 0, si (x, y) = (0, 0)

4 4 2 2

 −x y −x +4x y ,
2 2 2
si (x, y) 6= (0, 0)
∂y f (x, y) = (x + y )

 0, si (x, y) = (0, 0).
Comme il s’agit de quotients de polynômes ∂y (∂x f (x, y)) et ∂y (∂x f (x, y)) existent et
sont continues sur R2 \(0, 0). Par le Théorème 3.13 du Chapitre 6, ∂y (∂x f (x, y)) =
∂y (∂x f (x, y)). On calcule maintenant les dérivées partielles croisées au point (0, 0).
On forme le quotient différentiel pour t 6= 0

∂x f (0, t) − ∂x f (0, 0) 1 −t4
= t 2 2 − 0 = −1 ⇒ ∂y (∂x f (0, 0)) = −1
t t (t )
∂y f (t, 0) − ∂y f (0, 0) 1 t4
= t 2 2 = +1 ⇒ ∂x (∂y f (0, 0)) = +1.
t t (t )
On observe que pour tous (x, y) ∈ R2 , on a ∂y (∂x f (x, y)) = −∂x (∂y f (y, x)).
Si les dérivées secondes étaient continues en (0, 0), on aurait ∂y (∂x f (0, 0)) =
∂y (∂x f (0, 0)). Comme ce n’est pas le cas, au moins une des deux (et en fait les deux)
dérivées secondes n’est pas continue en (0, 0).
On calcule les dérivées partielles croisées pour (x, y) 6= (0, 0)
∂y (∂x f (x, y))

x4 − y 4 + 4 x2 y 2
=
(x2 + y 2 )2
(−4y 3 + 8 x2 y) (x2 + y 2 )2 (x4 − y 4 + 4 x2 y 2 ) 4y (x2 + y 2 )
+y − y
(x2 + y 2 )4 (x2 + y 2 )4
4 4 2 2 2 2
(x − y + 4 x y ) (x + y )
=
(x2 + y 2 )3
4y [(−y 2 + 2 x2 ) (x2 + y 2 ) − (x4 − y 4 + 4 x2 y 2 )]
2
+
(x2 + y 2 )3
(x − y + 4 x y ) x + (x4 − y 4 + 4 x2 y 2 ) y 2
4 4 2 2 2
=
(x2 + y 2 )3
4y [−y x + 2 x4 − y 4 + 2 x2 y 2 − x4 + y 4 − 4 x2 y 2 )]
2 2 2
+
(x2 + y 2 )3
(x − y x + 4 x y ) + (x4 y 2 − y 6 + 4 x2 y 4 )
6 4 2 4 2
=
(x2 + y 2 )3
−4y x + 8 x y − 4 y 6 + 8 x2 y 4 − 4 x4 y 2 + 4 y 6 − 16 x2 y 4
4 2 4 2
+
(x2 + y 2 )3
6 6 2 4 4 2
x −y −9x y +9x y
= .
(x2 + y 2 )3
Enfin
x6 − y 6 − 9 x2 y 4 + 9 x4 y 2
∂y (∂x f (x, y)) − ∂y (∂x f (0, 0)) = − (−1)
(x2 + y 2 )3
x6 − y 6 − 9 x2 y 4 + 9 x4 y 2 + (x2 + y 2 )3
=
(x2 + y 2 )3
2 x2 x4 − 3 y 4 + 6 x2 y 2
= 2 .
x + y2 (x2 + y 2 )2
Si on prend deux chemins différents, (0, y) → (0, 0) et (x, 0) → (0, 0), on obtient
deux limites différentes
2 02 04 − 3 y 4 + 6 02 y 2
∀y 6= 0, =0
02 + y 2 (02 + y 2 )2
2 x2 x4 − 3 04 + 6 x2 02
∀x 6= 0, =2
x2 + 02 (x2 + 02 )2
et il n’y a pas continuité en (0, 0).

Exercice 7.9
Soit l’application linéaire A : Rn → Rn (ou une matrice n × n) et b ∈ Rn (ou
un n-vecteur). On construit la fonction
déf 1
f (x) = (Ax) · x + b · x, x ∈ Rn .
2
(i) Calculer f ′ (x; v) (ou le gradient de f ) et d2 f (x; v; w) (ou la hessienne de
f ).
(ii) Donner des conditions nécessaires et suffisantes sur A et b pour que f soit
convexe dans tout Rn .
(iii) Donner des conditions nécessaires et suffisantes sur A et b pour que f soit
strictement convexe dans tout Rn .
(iv) Est-ce que les fonctions f associées aux matrices et vecteurs

3 1 −2 2 4 1
(a) A = ,b= , et (b) A = ,b= ,
−1 2 1 4 1 1
sont convexes ?
Démonstration. (i) Pour t 6= 0 et w → v

f (x + tw) − f (x) 1 1 1
= A(x + tw) · (x + tw) − Ax · x + b · tw
t t 2 2
1
= (Ax · w + Aw · x + t Aw · w) + b · w
2

′ 1 A + A⊤
⇒ fH (x; v) = (Ax · v + Av · x) + b · v = x + b · v.
2 2
f est Hadamard et donc Fréchet différentiable. Pour les dérivées secondes, avec
t 6= 0 et w → v,
′ ′
fH (x + t w; v) − fH (x; v)
t

1 A + A⊤ A + A⊤
= (x + t w + b) · v − x+b ·v
t 2 2

A + A⊤ A + A⊤
= w ·v → v ·v
2 2

A + A⊤ A + A⊤
⇒ d2 f (x; v; v) = v · v ⇒ Hf (x) = .
2 2
(ii) Première démonstration. Du Théorème 4.4 (i) du Chapitre 6, f est convexe

sur Rn si et seulement si Hf (x) ≥ 0 pour tout x ∈ Rn ce qui est équivalent à
A + A⊤ A + A⊤
≥ 0, c’est-à-dire, semi-définie positive.
2 2
Deuxière démonstration. On remarque d’abord que la matrice A peut être

remplacée par sa symétrisée (A + A⊤ )/2 sans changer la fonction f . On peut donc
supposer que A est symétrique pour les besoins de la démonstration.
Par définition, f est convexe si pour tout λ ∈ [0, 1] et tout x et y dans Rn ,
f (λx + (1 − λ)y) − λf (x) − (1 − λ)f (y) ≤ 0.
Comme le terme b·x est linéaire en x, il disparaı̂t et la condition sur f est équivalente
à la condition suivante sur A :
f (λx + (1 − λ)y) − λf (x) − (1 − λ)f (y)
= A(λx + (1 − λ)y) · (λx + (1 − λ)y) − λ(Ax) · x − (1 − λ)(Ay) · y

= (λ2 − λ)Ax · x + (1 − λ)2 − (1 − λ) Ay · y + 2λ(1 − λ)Ax · y
= − λ(1 − λ) [Ax · x + Ay · y − 2Ax · y] = −λ(1 − λ)A(x − y) · (x − y) ≤ 0.
Comme l’inéquation
−λ(1 − λ)A(x − y) · (x − y) ≤ 0
doit être vérifiée pour tout λ ∈ [0, 1] et tout x, y ∈ Rn , en prenant λ = 1/2 et y = 0,

il vient
∀x ∈ Rn , Ax · x ≥ 0
et A ≥ 0 est semi-définie positive. Il n’y a donc pas de condition sur le terme linéaire
b · x. Réciproquement, si A ≥ 0 est semi-définie positive, alors, du calcul précédent
f (λx + (1 − λ)y) − λf (x) − (1 − λ)f (y) = −λ(1 − λ)A(x − y) · (x − y) ≤ 0
et f est convexe.
(iii) Première démonstration. Par le Théorème 4.4 (i) du Chapitre 6, si Hf (x) =
(A + A⊤ )/2 est définie positive, alors f est strictement convexe dans un voisinage
de x. Comme la matrice hessienne est constante, on peut prendre tout Rn comme
voisinage et f est strictement convexe sur Rn .
Deuxière démonstration. On reprend le calcul de la partie (ii) : pour tous
λ ∈ [0, 1] et x, y ∈ Rn ,
f (λx + (1 − λ)y) − λf (x) − (1 − λ)f (y) = −λ(1 − λ)A(x − y) · (x − y).
Par définition, f est strictement convexe sur Rn si pour tous λ ∈ ]0, 1[ et x, y ∈ Rn ,

x 6= y, f (λx + (1 − λ)y) − λf (x) − (1 − λ)f (y) < 0, ce qui est équivalent à
λ(1 − λ)A(x − y) · (x − y) > 0.
En prenant v 6= 0, y = x + v 6= x et λ = 1/2, il vient
∀v 6= 0, Av · v > 0
et (A + A⊤)/2 > 0 est définie positive. Dans l’autre sens, comme λ > 0, (1 − λ > 0
et y 6= x,
f (λx + (1 − λ)y) − λf (x) − (1 − λ)f (y) = −λ(1 − λ)A(x − y) · (x − y) < 0
et f est strictement convexe sur Rn .

(iv) Pour déterminer la convexité de f , on considére la symétrisée de A :

3 1 A + A⊤ 3 0
A= , = >0
−1 2 2 0 2
et f est convexe et même strictement convexe. Pour le second cas, comme la matrice
symétrisée

2 4 A + A⊤ 2 4
A= , =
4 1 2 4 1
n’est pas diagonale, on considère la forme quadratique
A + A⊤
v · v = 2v12 + 8v1 v2 + v22
2
= (v2 + 4v1 )2 − 16v12 + 2v12
= (v2 + 4v1 )2 − 14v12 .
Pour v2 +4v1 = 0 et v1 6= 0, (A+A⊤ )/2 0, (il suffit de prendre v1 = 1 et v2 = −4).

La fonction f associée n’est donc pas convexe.
Exercice 7.10
Soient f (x) = kxkn , n ≥ 1, et kxk la norme euclidienne de x ∈ Rk , k ≥ 1.
(i) Déterminer les n ≥ 1 pour lesquels f est Hadamard (Fréchet) différentiable
en tout point de Rk .
(ii) Déterminer les n ≥ 1 pour lesquels Hf (x) existe en tout point de Rk
(iii) Déterminer les valeurs de n ≥ 1 pour lesquelles f est convexe dans Rk .
Solution. (i) On observe d’abord que pour n = 2, f (x) = x · x et t → 0, t 6= 0, et

w→v
kx + twk2 − kxk2
= (2x + tw) · w → 2 x · v ⇒ ∇f (x) = 2x
t
et f est Hadamard et a fortiori Fréchet différentiable sur tout Rn .
On considère maintenant le cas n = 1 pour x 6= 0. Soit t → 0, t 6= 0, et w → v :
kx + twk − kxk 1 kx + twk2 − kxk2

= .
t kx + twk + kxk t
Le premier terme tend vers 1/(2kxk). Quant au second terme

kx + twk2 − kxk2
→ 2 x · v,
t
ce qui donne finalement
1 x x
f ′ (x; v) = 2x·v = ·v ⇒ ∇f (x) =
2kxk kxk kxk
et f est Hadamard, et donc Fréchet, différentiable dans Rk \{0}.

Pour n > 1, on fait appel à la règle de dérivée de la composition des applica-
tions x 7→ kxk : Rn → R et y 7→ y n : R → R, ce qui donne directement
x x
f ′ (x; v) = n kxkn−1 ·v ⇒ ∇f (x) = n kxkn−1 (6.8)
kxk kxk
et f est Hadamard, et donc Fréchet, différentiable dans Rk \{0}.

(ii) Si l’on veut déterminer la convexité à l’aide des dérivées secondes, on
continue. Pour n = 1, x 6= 0, f ′ (x; v) = x · v/kxk. Pour t → 0, t 6= 0, et w → v

′ ′ x + tw x x + tw x
f (x + tw; v) − f (x; v) = ·v− ·v = − ·v
kx + twk kxk kx + twk kxk

kxk (x + tw) − kx + twk x
= ·v
kx + twk kxk

kxk (tw) + (kxk − kx + twk) x
= ·v
kx + twk kxk
Donc

f ′ (x + tw; v) − f ′ (x; v) kxk (tw) + (kxk − kx + twk) x
= ·v
t t kx + twk kxk

w kx + twk − kxk 1 x
= − ·v
kx + twk t kx + twk kxk

v x 1 x
→ − ·v ·v
kxk kxk kxk kxk

1 x x
= v·v− ·v ·v
kxk kxk kxk

2 1 x x
⇒ d f (x; v; v) = v·v− ·v ·v .
kxk kxk kxk
Le hessien est donc bien bilinéaire et continue sur Rk \{0}.

Pour n ≥ 2, on peut utiliser la formule (6.8) du gradient et la règle de
dérivation du produit de deux fonctions
x
n kxkn−1 et · v.
kxk
On a

x x 1 x x
n (n − 1) kxkn−2 ·v · v + n kxkn−1 v·v− ·v ·v
kxk kxk kxk kxk kxk

x x x x
= n kxkn−2 (n − 1) ·v ·v+v·v− ·v ·v
kxk kxk kxk kxk

x x
= n kxkn−2 (n − 2) ·v ·v+v·v
kxk kxk

x x
d2 f (x; v; v) = n kxkn−2 (n − 2) ·v ·v+v·v .
kxk kxk
Le hessien est donc bien bilinéaire et continue sur Rk \{0}.

Il peut cependant y avoir un problème en x = 0 : en effet le quotient
f (tw) − f (0) ktwkn |t| n−1

q(t) = = = |t| kwk.
t t t
Pour n ≥ 2,
lim q(t) = 0 et f ′ (0; v) = 0.
t→0
Donc, pour n ≥ 2, f est Hadamard différentiable partout dans R , et
∇f (x) = n |x|n−2 x, ∀x ∈ Rk .
Pour n = 1, la limite n’existe pas lorsque t → 0 puisque l’on peut tendre vers
des limites différentes par valeurs t > 0 ou t < 0 :
lim q(t) = +kvk, lim q(t) = −kvk.

t>0 t<0
t→0 t→0
Donc pour n = 1, f n’est pas dérivable en 0 pour les directions v 6= 0.

Pour n ≥ 2, on a f ′ (0; v) = 0 et donc pour t → 0 et w → v
f ′ (tw; v) − f ′ (0; v) 1 tw
= n ktwkn−1 ·v
t t ktwk
= n ktwkn−2 w · v
= |t|n−2 n kwkn−2 w · v
(
2 v · v, si n = 2
⇒ d2 f (0; v; v) =
0, si n > 2.
Le hessien est donc bien bilinéaire et continue en 0 et donc sur Rk . où il est donné
par la formule

x x
d2 f (x; v; v) = n kxkn−2 (n − 2) ·v ·v+v·v .
kxk kxk
(iii) Pour n = 1, f (x) = kxk. Comme nous n’avons pas de dérivabilité, on

utilise la définition d’une fonction convexe
∀x, y ∈ R, ∀λ ∈ [0, 1], kλx + (1 − λ)yk ≤ |λxk + k(1 − λ)yk = λkxk + (1 − λ)kyk.
Pour n = 2,
df
f (x) = kxk2 , (x) = 2x et d2 f (x; v; v) = 2 kvk2 ≥ 0, ∀v ∈ Rk .
dx
f est de classe C (2) et la dérivée seconde est positive. Elle est donc convexe.
Pour n ≥ 3, on a
" #
2
x
d2 f (x; v; v) = n kxkn−2 (n − 2) · v + kvk2 ≥ 0, ∀v ∈ Rk .
kxk
Pour n ≥ 2, la fonction f est de classe C (2) dans R et comme la hessienne est

semi-définie positive, f est convexe dans Rk .
Exercice 7.11
Montrer que la fonction f (x) = sin x + (1 + x)2 est convexe dans l’intervalle
[0, 1].
Solution. C’est une fonction de classe C (2) dans R et pour tout x ∈ R,
df d2 f
(x) = cos x + 2(1 + x) et (x) = − sin x + 2 ≥ 1.
dx dx2
Elle est donc convexe sur tout R et sa restriction à [0, 1] est aussi convexe.
Exercice 7.12
On dit que C ⊂ Rn est un cône de sommet 0 si
∀x ∈ C, ∀λ > 0, λx ∈ C. (6.9)
(i) Soit f : Rn → R une fonction convexe Gateaux différentiable en tout point

d’un cône convexe C. Montrer que argminf (C) 6= ∅ si et seulement si
∃x ∈ C, ∇f (x) · x = 0 et ∀y ∈ C, ∇f (x) · y ≥ 0. (6.10)
(ii) Trouver le ou les points minimisants pour
C = {(x1 , x2 ) : x1 ≥ 0 et x2 ≥ 0} et f (x1 , x2 ) = (x1 + 1)2 + (x2 − 1)2 .
Solution. On sait qu’une condition nécessaire et suffisante est
∃x ∈ C, ∀y ∈ C, ∇f (x) · (y − x) ≥ 0.
En prenant y = 2x et y = x/2, il vient

1
∇f (x) · (2x − x) ≥ 0 et ∇f (x) · x − x ≥ 0 ⇒ ∇f (x) · x = 0
2
⇒ ∀y ∈ C, ∇f (x) · y = ∇f (x) · (y − x) + ∇f (x) · x ≥ 0 + 0 = 0.
Réciproquement, si 6.10 est vérifiée, alors
∀y ∈ C, ∇f (x) · (y − x) = ∇f (x) · y − ∇f (x) · x ≥ 0 − 0 = 0.
(ii) On applique la partie (i) f est strictement convexe car sa matrice hessienne
est définie positive

x +1 1 0
∇f (x) = 2 1 Hf (x) = > 0.
x2 − 1 0 1
La solution sera donc unique. Des conditions (6.10)
x1 ≥ 0, x2 ≥ 0, 2(x1 + 1) x1 + 2(x2 − 1) x2 = 0
2(x1 + 1) y1 + 2(x2 − 1) y2 ≥ 0, ∀y1 ≥ 0, y2 ≥ 0.
En faisant y1 = 0 puis y2 = 0, il vient
∀y1 ≥ 0, 2(x1 + 1) y1 ≥ 0, ∀y2 ≥ 0, 2(x2 − 1) y2 ≥ 0

⇒ x1 + 1 ≥ 0, x2 − 1 ≥ 0
( )
x1 + 1 ≥ 0, x1 ≥ 0, x2 − 1 ≥ 0, x2 ≥ 0
⇒
(x1 + 1) x1 = 0, (x2 − 1) x2 = 0.
Il y a 4 solutions possible : x2 = 0 viole la condition x2 − 1 ≥ 0 et x1 = −1 viole la

condition x1 ≥ 0. Donc (x1 , x2 ) = (0, 1).
Exercice 7.13
Pour ε > 0, une matrice m × n et un vecteur c ∈ Rm on considère le problème
suivant :
déf
inf f (x) + εkxk2Rn , f (x) = kAx − ck2Rm . (6.11)
x∈Rn
(i) Montrer que f est convexe sur Rn ,

(ii) Donner les conditions nécessaires et suffisantes pour l’existence d’une so-
lution au problème (6.11) et montrer qu’il y a toujours existence et unicité
lorsque ε > 0.
(iii) Donner les conditions nécessaires et suffisantes pour l’existence d’une so-
lution au problème (6.11) pour ε = 0. Sont-elles toujours vérifées ?
Solution. (i) Soit fε (x) = f (x) + εkxk2 . Une condition nécessaire et suffisante pour
la convexité est Hfε (y) ≥ 0 sur Rn :

fε′ (x; v) = 2(Ax − c) · Av + 2ε x · v = 2 [A⊤ A + εI]x − A⊤ c · v

∇fε (x) = 2 [A⊤ A + εI]x − A⊤ c , Hfε (x) = 2 [A⊤ A + εI].
On vérifie que Hfε (x) est définie positive. Elle est symétrique. Pour 0 6= v ∈ Rn ,
[A⊤ A + εI]v · v = kAvk2 + ε kvk2 ≥ ε kvk2 > 0.
Comme [A⊤ A + εI] est inversible, il existe un x ∈ Rn unique tel que
[A⊤ A + εI]x = A⊤ c ⇒ x = [A⊤ A + εI]−1 A⊤ c

⇒ ∇fε (x) = 2 [A⊤ A + εI]x − A⊤ c = 0.
Par Taylor le développement est exact et pour tout y 6= x

1
fε (y) − fε (x) = ∇fε (x) + [A⊤ A + εI](y − x) · (y − x) > 0
| {z } 2 | {z }
=0 >0
et x est l’unique point minimisant sur Rn .

(iii) Si ε = 0, on n’a pas néxessairement l’inversibilité de A⊤ A qui reste quand
même au moins semi-définie positive. Dans ce cas la condition nécessaire et suffisante
devient
∃x ∈ Rn tel que ∇f (x) = 0 et A⊤ A ≥ 0
Comme on sait déjà que A⊤ A ≥ 0, il reste la condition nécessaire et suffisante

suivante
∃x ∈ Rn tel que A⊤ A x = A⊤ c.
Pour avoir l’existence nous allons utiliser la partie (ii). Pour tout εn = 1/n, il existe
un point unique xn tel que
1 1
A⊤ Axn + xn = A⊤ c, kAxn k2 + kxn k2 = Axn · c ≤ kAxn k kck
n n
1 √
⇒ kAxn k ≤ kck, kxn k2 ≤ kAxn k kck ≤ kck2 , kxn k ≤ nkck.
n
Comme la suite {Axn } est bornée, il existe y ∈ Rm et une sous-suite {Axnk } tel
que Axnk → y. et y ∈ Im A = Im A car c’est un sous-espace linéaire (donc fermé).
Il existe donc x tel que Ax = y Finalement, en passant à la limite
1 xn
A⊤ Axnk + √ √ k = A⊤ c → A⊤ Ax = A⊤ c
| {z } nk nk
→Ax | {z }
xn
√ k ≤kck
nk
et il y a bien toujours existence d’une solution dans le cas ε = 0.

Exercice 7.14
Soit B une matrice n × n symétrique et définie positive. On associe à B la
fonction
déf Bx · x
f (x) = , x 6= 0, (6.12)
kxk2
où kxk est la norme euclidienne dans Rn .

(i) Montrer qu’il existe x∗ ∈ Rn tel que kx∗ k = 1 et
Bx · x
f (x∗ ) = inf . (6.13)
06=x∈Rn kxk2
(ii) Montrer qu’il existe une constante β > 0 tel que
∀x ∈ Rn , Bx · x ≥ β kxk2 . (6.14)
(iii) Montrer que f est Hadamard/Fréchet différentiable en x 6= 0 et donner

l’expression de son gradient. En déduire que la plus petite constante β
vérifiant (6.14) est la plus petite valeur propre de la matrice B.
Solution. (i) Pour x 6= 0, on observe que

x x
f (x) = B · ⇒ inf f (x) = inf Bx · x.
kxk kxk 06=x∈Rn x∈Rn , kxk=1
Comme S = {x ∈ Rn : kxk = 1} est non-vide et compact et que la fonction

x 7→ Bx · x : Rn → R est continue, il existe un x∗ ∈ S qui minimise f et un x∗ ∈ S
qui maximise f .
(ii) Comme x∗ ∈ S et que B est définie positive, Bx∗ · x∗ > 0 et
Bx · x| déf
∀x 6= 0, 2
≥ β = Bx∗ · x∗ > 0 ⇒ ∀x ∈ Rn , Bx · x ≥ β kxk2 .
kxk
(iii) La fonction f est le quotient de deux fonctions polynômiales qui sont

Hadamard diférentiables. Par les règles de calcul au point x dans la direction v, on
a pour le numérateur 2 Bx · v et pour le dénominateur 2 x · v ce qui donne
2 Bx · v kxk2 − 2 x · v Bx · x 2
fh′ (x; v) = 4
= [B − f (x) I] · v,
kxk kxk2
2
⇒ ∇f (x) = [B − f (x) I] x,
kxk2
où I est la matrice identité dans Rn . Au point x∗ on a nécessairement

2
0 = ∇f (x∗ ) = [B − f (x∗ ) I] x∗ , kx∗ k = 1.
kxk2
La matrice B − f (x∗ ) I n’est donc pas injective et dét [[B − f (x∗ ) I] = 0. On en

conclut que f (x∗ ) > 0 est une valeur propre de la matrice B. Si λ est une autre
valeur propred de B, alors dét (B − λI) = 0, la matrice B − λI n’est pas injective
et il existe xλ 6= 0 tel que (B − λI) xλ = 0 ce qui implique
Bxλ · xλ
λ= ≥ f (x∗ )
kxλ k2
par définition du minimum. La valeur propre f (x∗ ) est donc la plus petite.
Exercice 7.15
Soient A et B deux matrices symétriques n× n. On suppose B définie positive.
Pour x ∈ Rn , x 6= 0, on définit la fonction
déf Ax · x
f (x) = . (6.15)
Bx · x
déf
(i) Montrer que l’ensemble U = {x ∈ Rn : Bx · x = 1} est non-vide et
compact.
(ii) Montrer qu’il existe x̂ ∈ Rn tel que B x̂ · x̂ = 1 et
Ax · x
f (x̂) = inf . (6.16)
06=x∈Rn Bx · x
(iii) Calculer ∇f (x) pour x 6= 0 et caractériser x̂. Montrer que pour tout λ tel
que dét (A − λB) = 0, on a f (x̂) ≤ λ.
Solution. (i) Pour tout 0 6= z ∈ Rn , Bz · z > 0 puisque B est définie positive. On
associe à z le point
z z z Bz · z
x= √ ⇒ Bx · x = B √ ·√ = =1 ⇒ x ∈ U.
Bz · z Bz · z Bz · z Bz · z
L’ensemble U n’est donc pas vide et comme x 7→ Bx · x est continue, l’image inverse
de 1 qui est U est fermée. Enfin, de l’exercice 7.14, il existe β > 0 tel que
1
1 = Bx · x ≥ βkxk2 ⇒ kxk ≤ √
β
et U est borné. Donc U est compact non-vide.
(ii) Étant donné 0 ≤ x ∈ Rn , Bx · x > 0 puisque B est définie positive et
Ax · x x x
f (x) = = A√ ·√ ⇒ inf f (x) = inf Ax · x.
Bx · x Bx · x Bx · x 06=x∈Rn x∈U
Comme la fonction Ax · x ≥ 0 est continue et que U est compact, il existe x̂ ∈ U tel

que
f (x̂) = inf Ax · x = inf f (x) et B x̂ · x̂ = 1.

x∈U 06=x∈Rn
(iii) Même technique que pour l’exercice 7.14. On obtient

2
∇f (x) = [A − f (x) B] x
Bx · x
et
2
∇f (x̂) = [A − f (x̂) B] x̂ = 0 ⇒ dét [A − f (x̂) B] = 0
B x̂ · x̂
et f (x̂) est une valeur propre généralisée de la paire (A, B).
Éléments de bibliographie
R. A. Adams et J. J. F. Fournier
[1], Sobolev spaces, Second Edition, Academic Press, Elsevier Science, Amsterdam,
Boston, Heidelberg, London, New York, 2003.
E. Asplund et L. Bungart
[1], A first cource in integration, Holt, Rinehart and Winston, New York, Chicago,
San Francisco, Toronto, London, 1966.
J. P. Aubin et A. Cellina
[1], Set-Valued Maps And Viability Theory, Grundl. der Math. Wiss., vol. 264,
Springer - Verlag, Berlin, 1984.
J. P. Aubin et H. Frankowska
[1], Set-Valued Analysis, Birkhäuser, Basel, 1990.
R. Azencott
[1], Random and deterministic deformations applied to shape recognition, Cortona
workshop, Italy 1994.
[2], Geodesics in diffeomorphisms groups : Deformation distance between shapes,
Int. Conf. Stoch. Structures and Monte-Carlo Optim., Cortona, Italy, 1994.
M. Barbut, B. Locker, L. Mazilak et P. Priouret
[1], Cinquante ans de correspondance mathématique en 107 lettres, Paul Lévy -
Maurice Fréchet, Birkhäuser, Boston, 1990.
C. Berge
[1], Espaces topologiques, fonctions multivoques, Collection Universitaire de Math-
matiques, Vol. III, Dunod, Paris 1959.
M. Berger et B. Gostiaux
[1], Géométrie différentielle : variétés, courbes et surfaces, 2e édition Presses uni-
versitaires de France, Paris 1992.
G. Bouligand
[1], Sur les surfaces dépourvues de points hyperlimités, Ann. Soc. Polon. Math. 9
(1930), 32–41.
[2], Introduction à la géométrie infinitésimale directe, Gauthier-Villars, Paris, 1932.
D. Burton
[1], The History of Mathematics : An introduction, 3e édition, McGraw-Hill, New
York, 1997.
G. Cantor
357
358 Éléments de bibliographie
[1], Über die Ausdehnung eines Satzes aus der Theorie der trigonometrischen Rei-
hen, Math. Annalen 5 (1872), 123–132.
[2], Über eine Eigenschaft des Inbegriffes aller reellen algebraischen Zahlen, Journal
für die reine und angwandte Mathematik, 77 (1874), 258–262.
C. Cassidy et M. L. Lavertu
[1], Introduction à l’analyse : fonction d’une variable réelle, Les Presses de l’Uni-
versité Laval, Sainte-Foy, Canada, 1994.
R. Dedekind
[1], Stetigkeit und irrational Zahlen, Friedrich Vieweg und Sohn, Braunschweig
1872. Traduction anglaise par W. W. Beman Essays on the Theory of Numbers,
I. Continuity and Irrational Numbers, The Open Court Publishing Co., Chicago
1901. Aussi Dover Publications, New York 1963.
M. C. Delfour
[1], Introduction à l’optimisation et au calcul semi-différentiel, Collection Sciences
Sup., Mathématiques appliquées pour le Master/SMAI, Dunod, Paris 2012.
[2], Introduction to optimization and semidiferential calculus, SIAM-MOS series,
Society for Industrial and Applied Mathematics, Philadelphia, USA, 2012.
M. C. Delfour et J.-P. Zolésio
[1], Shapes and geometries : Metrics, analysis, differential calculus and optimiza-
tion, SIAM series on Advances in Design and Control, SIAM, Philadelphia, PA 2011,
second edition.
U. Dini
[1], Fondamenti per la teorica delle funzioni di variabili reali, T. Nistri, Pisa 1878
[Fondements de la théorie des fonctions d’une variable réelle] (traduction allemande :
Grundlagen für eine Theorie der Funktionen einer veränderlichen reellen Grösse,
Teubner, 1892).
A. Dontchev et R. T. Rockafellar
[1], Implicit functions and solution mappings. A view from variational analysis,
Springer Monographs in Mathematics, Springer, Dordrecht, 2009.
J. Dugundji
[1], Topology, Allyn and Bacon, Boston, 1966.
R. Engelking
[1], General topology, Heldermann Verlag, Berlin, 1989.
L. Euler
[1], Methodus inveniendi lineas curvas maximi minimive proprietate gaudentes, sive
solutio problematis isoperimetrici latissimo sensu accepti, 1744 [Une méthode pour
trouver des lignes courbes jouissant de propriétés de maximum ou de minimum, ou
la solution de problèmes isopérimétrique dans le sens le plus large], Opera Omnia :
Series 1, Volume 24 (1952), 1–308.
P. de Fermat
[1], Methodus ad disquirendam Maximam et Minimam, Varia opera mathematica,
1679 (D’abord consigné dans une lettre à Mersenne en 1638, la première version
imprimée de la méthode se retrouve dans le cinquième volume de Supplementum
Cursus Mathematici (1642) écrit par Herigone, et ce n’est qu’en 1979 qu’elle ap-
paraı̂t dans Varia opera mathematica.). Version électronique du manuscrit en latin :
http ://fr.wikisource.org/wiki/Œuvres de Fermat - Livre I - Maxima et Minima.
[2], De tangentibus linearum curvarum, Varia opera mathematica, 1679.

M. Fréchet
[1], Sur la notion de différentielle, Comptes rendus de l’Académie des Sciences, t.
CLII (1911), 845–847.
[2], Sur la notion de différentielle, Comptes rendus de l’Académie des Sciences, t.
CLII (1911), 1050–1051.
[3], Sur la notion de différentielle totale, Nouv. Ann. Math. 12 (1912), 385–403 et
433–449.
[4], La notion de différentielle dans l’Analyse générale, Ann. Éc. Norm., XLII
(1925), 293–323.
[5], Sur la notion de différentielle, Journal de Mathématiques Pures et Appliquées
16 (1937), 233–250.
R. Gateaux
[1], Sur la représentation des fonctionnelles continues, Rend. Acc. Linc., 22-2
(1913), 646–648.
[2], Sur les fonctionnelles continues et les fonctionnelles analytiques, Comptes ren-
dus de l’académie des sciences (Paris) 157 (1913), 325–327.
[3], Sur la représentation des fonctionnelles continues, Rend. Acc. Linc., 23-1
(1914), 310–315.
[4], Sur les fonctionnelles d’ordre entier d’approximation, Rend. Acc. Linc., 23-1
(1914), 405–408.
[5], Représentation d’une fonctionnelle continue, satisfaisant à la condition du cycle
fermé, Rend. Acc. Linc., 23-1 (1914), 481–486.
[6], Sur la notion d’intégrale dans le domaine fonctionnel et sur la théorie du po-
tentiel, Bulletin de la Société Mathématique de France 47 (1919), 47–67 (suivi d’une
note de P. Lévy 67–70).
[7], Fonctions d’une infinité de variables indépendantes, Bulletin de la Société
Mathématique de France 47 (1919), 70–96.
[8], Sur diverses questions du calcul fonctionnel, Bulletin de la Société
Mathématique de France 50 (1922), 1–37.
M. Gromov
[1], Metric structures for Riemannian and non-Riemannian spaces, Prog. Math.,
152, Birkhäuser Boston Inc., Boston, 1999.
J. Hadamard
[1], Leçons sur le calcul des variations, vol. I, Hermann, Paris, 1910.
[2], La notion de différentielle dans l’enseignement, Scripta Univ. Ab. Bib., Hiero-
solymitanarum, Jerusalem, 1923. Réimprimé dans la “Mathematical Gazette” 19,
no. 236 (1935), 341–342.
W. R. Hamilton
[1], On quaternions, or on a new system of imaginaries in algebra, Philosophical
Magazine 25 (1844), no. 3, 489–495.
G. H. Hardy
[1], A course of Pure Mathematics, Cambride University Press, Cambridge, 1921.
F. Hausdorff
[1], Über halbstetige Funktionen und deren Verallgemeinerung, Math. Zeitschr. 5

(1919), 292–309.
[2], Grundzüge der Meugenlehre, Walter de Gruyter, Leipzig, 1927 ; édition initiale
Leipzig, 1914 (traduction de l’allemand 3e édition (1937) en anglais par J. R. Au-
mann et al., Set theory, Chelsea Pub. Co., New York, 1957).
I. N. Herstein
[1], Topics in algebra, Blaisdell Publishing Company, Waltham Mass, Toronto, Lon-
don 1964.
M. R. Hestenes
[1], Optimization theory, the finite dimensional case, J. Wiley-Interscience, New
York, 1975.
M. D. Kirszbraun
[1], Über die zusammenziehende und Lipschitzsche Transformationen, Fund. Math.
22 (1934), 77–108.
J. Labelle et A. Mercier
[1], Introduction à l’analyse réelle, Modulo Éditeur, Mont-Royal, Canada, 1993.
J. L. Lagrange
[1], Mécanique analytique, Courcier, Paris, 1788. (reissued by Cambridge University
Press, 2009.
E. G. H. Landau
[1], Foundations of Analysis, Chelsea Publishing Company, New York, 1951.
S. Lang
[1], Algebra, Addison-Westley Publishing Company, Reading, Mass.1965.
A.-M. Legendre
[1], Sur la manière de distinguer les Maxima des Minima dans le Calcul des Varia-
tions, dans “Histoire de l’Académie Royale des Sciences”, Année 1786, Mémoires de
Mathématiques et de Physique, Paris, 1786, pp. 7–37.
G. W. Leibniz
[1], Nova methodus pro maximis et minimis, itemque tangentibus, quae nec fractas
nec irrationales quantitates moratur, et singulare pro illis calculi genus, Acta Erudi-
torum, 1684 [Nouvelle méthode pour les maxima et minima, ainsi que les tangentes,
qui ne bute ni sur les fractions ni sur les irrationnelles, avec un mode original de
calcul].
L. Mazilak
[1], The ghosts of the Ecole Normale. Life, death and destiny of René Gateaux,
submitted to Historia Mathematica (Les fantômes de l’École Normale. Vie, mort et
destin de René Gateaux, Université Pierre et Marie Curie Paris, France, 2007).
[2], Communication privée.
L. Mazilak et R. Tazzioli
[1], Mathematicians at war. Volterra and his French colleagues in World War I,
Archimedes : New Studies in the History and Philosophy of Science and Technology,
22. Springer, New York, 2009.
F. Mémoli
[1], On the use of Gromov-Hausdorff distances for shape comparison in “Procee-

dings of PBG 2007,” Prague, Czech Republic, 2007.
F. Mémoli et G. Sapiro
[1], A theoretical and computational framework for isometry invariant recognition
of point cloud data, Found. Comput. Math. (3) 5 (2005), 313–347.
K. Menger
[1], Untersuchungen über allgemeine, Math. Annalen 100 (1928) 75–163.
A. D. Michal
[1], Differential calculus in linear topological spaces, PYOC. Nat. Acad. Sci. U.S.A.
24 (1938), 340–342.
A. M. Micheletti
[1], Metrica per famiglie di domini limitati e proprietà generiche degli autovalori,
Ann. Scuola Norm. Sup. Pisa (3) 26 (1972), 683–694.
M. Nagumo
[1], Über die Loge der Integralkurven gewöhnlicher Differentialgleichungen, (en al-
lemand) Proc. Phys. Math. Soc. Japan 24 (1942), 551–559.
I. Newton
[1], Method of fluxions and infinite series, Heney Woodfall, London, 1736 (written
in 1671).
[2], Philosophiae Naturalis Principia Mathematica, 1687 and 1726 (third edition)
[Mathematical Principles of Natural Philosophy].
J. Pierpont
[1], The theory of functions of real variables, Vol. I, Ginn and Company, Boston,
New York, Chicago, London, Atlanta, Dallas, Columbus, San Francisco, 1905.
[2], The theory of functions of real variables, Vol. II, Ginn and Company, Boston,
New York, Chicago, London, 1912.
D. Pompéiu
[1], Sur la continuité des variables complexes, Ann. Fac. Sci. de Toulouse Sci. Math.
Sci. Phys. (2) 7 (1905), 265–315.
W. Rudin
[1], Principes d’analyse mathématique, Édiscience, Paris 1995 et Dunod, Paris 2006
[traduction de l’anglais, Principles of mathematical analysis, McGraw–Hill, New
York, 1958, 1964, 1976.
J. T. Schwartz
[1], Nonlinear functional analysis, Gordon and Breach Science, New York : 1969.
F. Severi
[1], Su alcune questioni di topologia infinitesimale, Ann. Polon. Soc. Math. 9 (1930),
97–108.
O. Stolz
[1], Grundzüge der Differential und Integralrechnung, I, B. G. Teubner, Leipzig,
1893 (The Cornell University Library Collections).
V. M. Tihomirov
[1], Elements of the theory of extrema, Econometric Institute, Erasmus University
Rotterdam, 1997.
H. Tietze
[1], Über Funktionen die auf einer abgeschlossenen Menge stetig sind, Journal für
die reine und angewandte Mathematik 145 (1915), 9–14.
A. Trouvé
[1], Action de groupe de dimension infinie et reconnaissance de formes, C. R. Acad.
Sci. Paris Sér. I Math. (8) 321 (1995), 1031–1034.
[2], An approach of pattern recognition through infinite dimensional group actions,
Rapport de recherche du LMENS, France, 1995.
[3], Diffeomorphisms groups and pattern matching in image analysis, Int. J. Com-
put. Vis. (3) 28 (1998), 213–221.
F. A. Valentine
[1], On the extension of a vector function so as to preserve a Lipschitz condition.
Bulletin of the American Mathematical Society 49 (1943), 100–108.
[2], A Lipschitz Condition Preserving Extension for a Vector Function. American
Journal of Mathematics 67 (1) (1945), 83–93.
[3], Convex sets, McGraw-Hill, New York, 1964.
J.-L. Verley
[1], Espaces métriques, dans Dictionnaire des mathématiques ; algèbre, analyse,
géométrie, Albin Michel, 2003.
K. Weierstrass
[1], Mathematische Werke. Rester Band. Abhandlungen I. Mayer & Müller, Berlin
1894 ; Zweiter Band. Abhandlungen II. Mayer & Müller, Berlin 1895 ; Dritter Band.
Abhandlungen III. Mayer & Müller, Berlin 1903.
[2], Mathematische Werke. Vierter Band. Vorlesungen über die Theorie der Abel-
schen Transcendenten. Mayer & Müller, Berlin 1902.
[3], Mathematische Werke. Siebenter Band. Vorlesungen über Variationsrechnung.
Akademische Verlagsgesellschaft M. B. H., Leipzig, 1927.
H. Whitney
[1], A function that is not constant on a connected set of critical points, Duke Math.
J. 1, no. 4 (1935), 514–517.
W.-H. Young
[1], On differentials, Proc. London Mathematical Society, series 2, 7 (1909), 157.
[2], The fundamental theorems of Differential Calculus, University Press, Cam-
bridge, 1910.

Amat 2100

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Amat 2100

Transféré par

Droits d'auteur :

Formats disponibles

Recueil de notes

pour le cours MAT 2100 : Analyse 3

Montréal, le 15 avril 2017

1 Des entiers naturels aux réels 1

2 Quelques notions ensemblistes et algébriques 23

4 Nombres complexes et hypercomplexes . . . . . . . . . . . . . . . . . 40

3 Topologie et suites dans les espaces métriques 47

4 Fonctions, limites et continuités 107

6 Fonctions uniformément continues . . . . . . . . . . . . . . . . . . . 138

5 Espaces vectoriels, convergences et applications linéaires 155

6 Dérivée, dérivées directionnelles et différentielles 199

3.1.4 Dérivées partielles, gradient, application et matrice

Annexe A. Corrigés des exercices 297

3 Exercices du Chapitre 3 . . . . . . . . . . . . . . . . . . . . . . . . . 299

Éléments de bibliographie 357

1.1 Richard Dedekind (1831-1916). . . . . . . . . . . . . . . . . . . . . . 7

2.1 Georg Cantor (1845–1918). . . . . . . . . . . . . . . . . . . . . . . . 27

3.1 Maurice René Fréchet (1878–1973). . . . . . . . . . . . . . . . . . . . 55

4.1 Exemples de fonctions f . Pour E = R, la limite y de f (x) en a existe

6.1 Exemples de dérivées à droite et à gauche. . . . . . . . . . . . . . . . 202

6.7 Tangence du sous-espace affine A ou linéaire S à un ensemble de

de l’obtention des gros théorèmes de la fonction inverse, de la fonction implicite et

Montréal, le 1 janvier 2017

1 Nombres entiers naturels N (+, ·, <)

sur lequel on définit une addition et une multiplication.

qui a comme propriétés :

P1 (commutativité) x+y = y+x

qui a comme propriétés :

P1 (commutativité) x·y =y·x

Enfin, on a une propriété de la multiplication par rapport à l’addition :

On a aussi les deux relations d’ordre (< et ≤) suivantes :

- Première relation d’ordre (strict) sur N (<)

x<y si il existe n ∈ N tel que y = x + n

qui est transitive, c’est-à-dire si p < q et q < r, alors p < r.

qui est aussi transitive, c’est-à-dire si p ≤ q et q ≤ r, alors p ≤ r.

2 Nombres entiers Z (+, ·, <)

P4 (élément neutre additif)

- existence d’un inverse pour l’addition :

P5 (existence d’un inverse additif)

On peut alors définir l’opération − : Z × Z → Z

On a ainsi construit les nombres entiers

Les définitions d’ordre demeurent les mêmes.

x<y si il existe n ∈ N tel que y = x + n

- Seconde relation d’ordre sur Z (≤) :

On résume les propriétés sur Z.

3 Nombres rationnels Q (+, ·, <)

pour toute paire d’entiers p et q dans Z. Il suffit de prendre par exemple q = 2 et

et on obtient ainsi l’ensemble des nombres rationnels

qui par définition contient les ééments de Z de la forme [p/1], p ∈ Z. Il y a donc

On peut maintenant procéder de la façon suivante :

qui est toujours transitive, c’est-à-dire,

On résume les propriétés sur Q.

La relation d’ordre < possède la propriété que pour tout x et y dans Q, on a

Elle demeure transitive, c’est-à-dire,

x < y et y < z ⇒ x < z.

Enfin, on peut définir l’opération de division ÷ : Z × Z \{0} → Q

4 Nombres réels R(+, ·, <)

Démonstration. On prend c = (a + b)/2 qui appartient bien à Q. Alors, il est facile

Il n’y a pas de trous dans l’ensemble Q, mais plutôt des fissures.

Théorème 4.2. Il n’existe pas de x ∈ Q tel que x2 = 2 ou de façon équivalente

Démonstration. On note d’abord que si m ∈ Z est pair, alors m2 est pair. Si m ∈ Z

Ceci met en lumière le phénomène suivant.

Démonstration. (i) Soient Q+ = {x ∈ Q : x ≥ 0} et A = {p ∈ Q+ : p2 ≤ 2}. Du