Académique Documents
Professionnel Documents
Culture Documents
M. C. Delfour
Département de mathématiques et de statistique
Université de Montréal
C.P. 6128, succ. Centre-ville
Montréal, Canada H3C 3J7
delfour@dms.umontreal.ca
http://www.dms.umontreal.ca/˜delfour/
Version 9.0
Préface xi
Orientation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi
iii
iv Table des matières
ix
x Table des figures
Orientation
Ce recueil de notes de cours s’appuie principalement sur les chapitres 1, 2, 4,
7 et 9 du livre de W. Rudin [1] qui est un grand classique dans le domaine en
Amérique du Nord. On présume que les notions fondamentales en dimension un
(topologie, suites, séries, dérivées, intégrale de Riemann, etc.) ont été acquises dans
un premier cours d’analyse (par exemple, MAT 1000). Il n’est pas possible dans le
cadre d’un cours d’une session d’inclure l’intégrale de Lebesgue.
La partie sur les espaces métriques est considérablement augmentée pour aller
au delà des principales définitions et résultats et en entrevoir les applications et les
retombées. C’est le cadre le plus général dans lequel tout peut se faire via la notion
de suite sans imposer de structure algébrique. La notion de métrique déjà très
présente en géométrie se retrouve de nos jours un peu partout comme, par exemple,
en intelligence artificielle, en théorie du codage (métrique de Hamming), en théorie
des graphes, en analyse des données, en statistique et en imagerie. On a choisi
de donner un traitement exhaustif de la compacité, de la compacité séquentielle,
du complété et de la complétude. On fleurte un peu avec la topologie générale et
l’analyse fonctionnelle.
Un des objectifs importants est d’appuyer les notions abstraites par des cons-
tructions et des exemples concrets d’espaces métriques. La partie sur la continuité
et la convergence uniforme donnent l’occasion de construire les premiers espaces
métriques de fonctions. À l’aide de la fonction caractéristique et de la fonction
distance on construit aussi des métriques sur l’ensemble des sous-ensembles d’un
ensemble arbitraire. On retrouve entre autres la métrique de Pompéiu-Hausdorff.
On donne aussi deux exemples de métriques complètes sur le groupe général linéaire
dont l’une est invariante à droite.
La partie sur la différentiabilité a été considérablement développée pour bien
mettre en lumière le passage de la notion de dérivée en dimension un à celle
de différentielle à partir de la dimension deux. Ces notions se prolongent quasi-
intégralement aux espaces vectoriels de dimension infinie menant naturellement au
Calcul des variations et de ses rejetons, mais aussi au calcul différentiel sur des sous-
variétés régulières de l’espace euclidien. On ne peut malheureusement dans le cadre
d’un cours d’une session aller au delà de quelques applications en optimisation et
xi
xii Préface
Michel Delfour
déf
N = {1, 2, 3, . . .}
∀x, y ∈ N, x+y ∈N
La multiplication · : N × N → N
∀x, y ∈ N, x·y ∈N
P3 (distributivité) x · (y + z) = x · y + x · z.
1
2 Chapitre 1. Des entiers naturels aux réels
x≤y si x = y ou x < y
a + x = b,
on enrichie les entiers naturels en introduisant les notions d’élément neutre et d’in-
verse additifs :
- existence de l’élément neutre 0 pour l’addition :
x≤y si x = y ou x < y
3. Nombres rationnels Q (+, ·, <) 3
q·x =p (3.1)
(p, q).
a) si p = 0, on écrit 0/1
b) si p 6= 0,
i) on choisit d’abord le signe + ou −
ii) on se ramène à p/q, pour p, q ∈ N
iii) on simplifie la fraction autant que possible en divisant p et q par leur
plus grand commun facteur (diviseur) (p, q).
Ce représentant unique est appelé forme réduite.
La structure (+, ·, <) sur Q subsiste. On peut vérifier que l’addition, la mul-
tiplication et les relations d’ordre sont bien définies :
- l’addition
déf
[p1 /q1 ] + [p2 /q2 ] = [(p1 · q2 + p2 · q1 )/q1 q2 ],
- la multiplication
déf
[p1 /q1 ] · [p2 /q2 ] = [p1 · p2 /q1 · q2 ],
- la relation d’ordre
(
p1 · q2 − p2 · q1 < 0 lorsque q1 · q2 > 0
[p1 /q1 ] < [p2 /q2 ] si
p1 · q2 − p2 · q1 > 0 lorsque q1 · q2 < 0
P1 (commutativité) x + y = y + x et x · y = y · x
(
(x + y) + z = x + (y + z)
P2 (associativité)
et (x · y) · z = x · (y · z)
P3 (distributivité) x · (y + z) = x · y + x · z
(
(additif) ∃ 0 ∈ Q tel que ∀x ∈ Q, 0 + x = x
P4 (éléments neutres)
(multiplicatif) ∃ 1 ∈ Q tel que ∀x ∈ Q, x · 1 = x
(additif) ∀x ∈ Q, ∃ − x ∈ Q tel que x + (−x) = 0
P5 (existence d’inverses) (multiplicatif) ∀x ∈ Q, x 6= 0, ∃x−1 ∈ Q
tel que x · x−1 = 1
a) ∀x, y ∈ Q tel que x > 0 et y > 0, on a
x + y > 0 et x · y > 0
P6 (relation d’ordre)
b) ∀x ∈ Q, une seule propriété est vraie :
x > 0, x = 0, ou 0 > x.
4. Nombres réels R(+, ·, <) 5
x = y, x < y, ou x < y.
déf
∀x, y ∈ Z, y 6= 0, x ÷ y = [x/y].
Théorème 4.1. Soient a et b dans Q tel que a < b. Alors il existe c ∈ Q tel que
a < c < b.
Comme il n’y a pas de trous entre deux nombres rationnels distincts, ce premier
résultat inciterait à croire que Q formerait un continuum. Ce n’est cependant pas le
cas et c’est ce qui va motiver √ la construction du continuum des nombres réels. En
effet, on verra plus loin que 2 peut être approché par en dessus et par en dessous
par des rationnels sans jamais l’atteindre :
√
1< 2<2
√
1.4 < 2 < 1.5
√
1.41 < 2 < 1.42
...
√
1.414 213 562 4 < 2 < 1.414 213 562 5
∀x ∈ Q, x2 6= 2.
6 Chapitre 1. Des entiers naturels aux réels
m2 = (2k + 1)2 = 4 · (k 2 + k) + 1
est impair. Ceci implique que m ∈ Z est impair (resp. pair) si et seulement si m2
est impair (resp. pair).
On raisonne par l’absurde. Supposons qu’il existe x ∈ Q tel que x2 = 2. Alors
x est de la forme m/n pour m et n dans Z, n 6= 0. On prend maintenant x sous sa
forme réduite m/n où le plus grand commun diviseur (m, n) de m et n est 1. On
obtient alors m2 = 2 · n2 ce qui entraı̂ne que m est pair.
Il existe donc r ∈ Z tel que m = 2r. De l’équation (m/n)2 = 2, il vient
4 r 2 = 2 n2 ⇒ 2 r 2 = n2
et on en conclut que n2 et a fortiori n sont pair. Comme m est aussi pair, le plus
grand commun diviseur (m, n) ≥ 2 et cela contredit le choix initial d’une forme
réduite pour x = m/n telle que (m, n) = 1.
Théorème 4.3. (i) Il n’existe pas de plus grand nombre rationnel positif de
carré inférieur ou égal à 2.
(ii) Il n’existe pas de plus petit nombre rationnel positif de carré supérieur ou
égal à 2.
√ √
En particulier, pour tout r ∈ Q tel que r2 ≤ 2, on a − 2 < r < 2.
∀p ∈ B = {p ∈ Q+ : p2 > 2}, p ≥ m.
1. R. Dedekind [1].
8 Chapitre 1. Des entiers naturels aux réels
Définition 4.1.
Un ensemble α de nombres rationnels est appelé une coupure si
i) α contient au moins un rationnel mais pas tous les rationnels, c’est-à-dire,
∅ 6= α $ Q,
ii) si on a p ∈ α et q ∈ Q tel que q < p, alors q ∈ α,
iii) α ne contient pas de plus grand rationnel.
On notera par R l’ensemble de toutes les coupures de Q.
Définition 4.2.
On dira que la coupure {p ∈ Q : p < r} associée à r ∈ Q est une coupure rationnelle
et on la notera r∗ .
Définition 4.3.
Soient α et β deux coupures.
4. Nombres réels R(+, ·, <) 9
∃p ∈ Q tel que p ∈ β et p ∈
/ α.
Définition 4.4.
Soient α et β deux coupures de Q.
i) L’addition est définie comme l’addition des deux ensembles
déf
α + β = {s + t : s ∈ α et t ∈ β} .
Définition 4.5.
Soient α et β deux coupures de Q.
i) La multiplication de deux coupures α ≥ 0∗ et β ≥ 0∗ est définie comme
déf
α·β = s · t : s ∈ α ∩ Q+ et t ∈ β ∩ Q+ ∪ (Q \ Q+ ).
On peut alors démontrer que l’on a conservé toutes les propriétés sur Q.
P1 (commutativité) x + y = y + x et x · y = y · x
(
(x + y) + z = x + (y + z)
P2 (associativité)
et (x · y) · z = x · (y · z)
P3 (distributivité) x · (y + z) = x · y + x · z
(
(additif) ∃0∗ tel que ∀x ∈ R, 0∗ + x = x
P4 (éléments neutres)
(multiplicatif) ∃1∗ tel que ∀x ∈ R, x · 1∗ = x
∗
(additif) ∀x ∈ R, ∃ − x tel que x + (−x) = 0
P5 (existence d’inverses) (multiplicatif) ∀x ∈ R, x 6= 0∗ , ∃x−1 ∈ R
tel que x · x−1 = 1∗
a) ∀x, y ∈ R tel que x > 0∗ et y > 0∗ on a
x + y > 0∗ et x · y > 0∗
P6 (relation d’ordre)
b) ∀x ∈ R une seule propriété est vraie :
x > 0∗ , x = 0∗ , ou 0∗ > x.
On a la propriété suivante.
Théorème 4.6. Si α et β sont deux coupures tel que α ≤ β, alors α ⊂ β.
Démonstration. Si α ≤ β, ou bien α = β et il n’y a rien à démontrer ou bien
∃p ∈ Q tel que p ∈
/ α et p ∈ β.
Dans le second cas, on raisonne par l’absurde. S’il existe p ∈ α tel que p ∈/ β, alors,
par définition de <, on aurait la contradiction β < α par la propriété P6 b).
∀α ∈ A, α ≤ γ et ∀β ∈ B, γ ≤ β.
Définition 4.6.
Soit E ⊂ R.
a) On dit que E est borné supérieurement si
∃M ∈ R tel que ∀x ∈ E, x ≤ M.
∃m ∈ R tel que ∀x ∈ E, m ≤ x.
Par définition, aucun élément de A n’est une borne supérieure de E et tous les
éléments de B sont des bornes supérieures de E. Pour montrer que sup E ∈ R, il
suffit de montrer que B possède un plus petit élément.
On voit que les hypothèses a) et b) du Théorème de complétude de Dedekind
sont vérifiées. Il reste à vérifier
c) A 6= ∅ et B 6= ∅
d) si α ∈ A et β ∈ B, alors α < β.
Comme E 6= ∅, prenons x ∈ E. Alors A 6= ∅ car il contient tous les α ∈ R tel que
α < x. D’autre part, puisque E est borné supérieurement, il existe y ∈ R tel que
x ≤ y pour tout x ∈ E. Par définition, y ∈ B, B 6= ∅, et c) est vérifiée.
Enfin, si α ∈ A, il existe x0 ∈ E tel que α < x0 . Si β ∈ B, il n’existe pas de
x ∈ E tel que β < x. Donc pour tout x ∈ E, on a β ≥ x. Finalement, α < x0 ≤ β,
α < β, et d) est vérifiée. Les hypothèses a), b), c), et d) sont donc vérifiées.
Par le Théorème de complétude de Dedekind, il existe un et un seul γ ∈ R tel
que
∀α ∈ A, α ≤ γ et ∀β ∈ B, γ ≤ β.
De là, γ est une borne supérieure de A, et, ou bien γ ∈ A ou bien γ ∈ B. Par
définition, aucun élément de A n’est une borne supérieure de E et tous les éléments
de B sont des bornes supérieures de E.
On montre enfin que γ ∈ / A ce qui entraı̂ne que γ ∈ B est la plus petite borne
supérieure de E. Si γ ∈ A, alors il existerait x ∈ E tel que γ < x. On pourrait alors
choisir α ∈ R tel que γ < α < x. Comme α < x, on aurait par définition α ∈ A et
γ ne serait pas une borne supérieure de A. Donc γ ∈ B.
Démonstration de P7*. Par hypothèse, il existe une borne b ∈ R tel que pour tout
x ∈ E, on a b ≤ x. Donc pour tout x ∈ E, on a −x ≤ −b et −b est une borne
déf
supérieure de l’ensemble −E = {−x : x ∈ E}. Par la propriété P7 de complétude,
il existe une plus petite borne supérieure
b0 = sup −E ∈ R
de −E et b0 ≤ −b. On a donc
∀x ∈ E, −x ≤ b0 ⇒ ∀x ∈ E, −b0 ≤ x
et −b0 est une borne inférieure de E. Mais on a montré que pour toute borne
inférieure b de E, on a b0 ≤ −b ou de façon équivalente b ≤ −b0 . Donc −b0 est la
plus grande borne inférieure de E et inf E = −b0 ∈ R.
∅ 6= α $ Q,
Définition 4.8.
Un ensemble α ⊂ Q de nombres rationnels est appelé une coupure étendue si
ii) si on a p ∈ α et q ∈ Q tel que q < p, alors q ∈ α,
iii) α ne contient pas de plus grand rationnel.
On notera par R l’ensemble de toutes les coupures étendues de Q.
Avec cette nouvelle définition Q et ∅ sont des coupures étendues que l’on notera
déf déf
−∞ = ∅ et + ∞ = Q.
R = R ∪{±∞}
∃M ∈ R tel que ∀x ∈ E, x ≤ M.
∃m ∈ R tel que ∀x ∈ E, m ≤ x.
déf
3) Soit E = {p : p > 0}. Alors 0 est une borne inférieure de E et E n’est pas
borné supérieurement.
déf
4) Soit E = {p : p2 < 2}. Alors −2 est une borne inférieure de E et 3/2 une
borne supérieure.
Remarque 4.1.
Si E 6= ∅, alors −∞ ≤ inf E ≤ sup E ≤ +∞. Si E = ∅, alors par convention on
posera inf ∅ = +∞ et sup ∅ = −∞.
Exemple 4.2.
déf
Soit E = {1, 2, 3}. Alors inf E = 1 ∈ E et sup E = 3 ∈ E.
ii’) pour tout m tel que b0 < m, il existe x0 ∈ E tel que b0 ≤ x0 < m.
Exemple 4.3.
Par exemple si b0 = sup E est finie et b0 ∈
/ E, on construit pour chaque n ∈ N, xn ∈
E tel que b0 ≥ xn > b0 −1/n. Cette suite comporte un nombre infini d’éléments.
déf b0 + 2
x = ⇒ 0 ≤ b0 < |x < 2 ⇒ x2 < 4}
{z ⇒ x∈E
2
puisque x≥0
Définition 4.11.
La valeur absolue de x ∈ R que l’on désigne par |x| est définie par
(
déf x, si x ≥ 0
|x| =
−x, si x < 0.
Si on suppose que
1) ∃ n tel que an 6= bn et
2) ni l’un ni l’autre ne se termine par une suite infinie de 9
On multiplie chaque nombre par 10n−1 et on enlève sa partie entière. Comme an >
bn , on a an ≥ bn + 1 et Il vient
d’où x > y.
20 Chapitre 1. Des entiers naturels aux réels
Définition 4.12.
Un développement décimal de la forme
n0 , a1 a2 . . . an b 1 b 2 . . . b m b 1 b 2 . . . b m . . .
| {z } | {z } | {z }
n≥0 m≥1 m≥1
Exemple 4.5.
Le rationnel 1/7 est périodique pur avec n = 0 et
1
= 0, 142857 | {z } . . . = 0, 142857
| {z } 142857
7
m=6 m=6
x = n0 , a1 a2 . . . an b 1 b 2 . . . b m b 1 b 2 . . . b m . . .
| {z } | {z } | {z }
n≥0 m≥1 m≥1
4. Nombres réels R(+, ·, <) 21
On a
10n x = n0 a1 a2 . . . an , b 1 b 2 . . . b m b 1 b 2 . . . b m . . .
| {z } | {z } | {z }
n≥0 m≥1 m≥1
n+m
10 x = n0 a1 a2 . . . an b 1 b 2 . . . b m , b 1 b 2 . . . b m b 1 b 2 . . . b m . . .
| {z } | {z } | {z } | {z }
n≥0 m≥1 m≥1 m≥1
D’où
déf
(10n+m − 10n )x = N0 = n0 a1 a2 . . . an b1 b2 . . . bm − n0 a1 a2 . . . an ∈ N ∪{0}
N0
⇒ x= n m ∈ Q.
10 (10 − 1)
0 ≤ p − n0 q = q · {0, k1 k2 k3 . . .} < q.
| {z }
∈N ∪{0}
On poursuit ainsi en multipliant successivement par 102 , 103 , etc. On obtient ainsi
(par exemple, par induction mathématique) :
Comme {0, 1, . . . , q − 1} est fini, Il existe un couple (i, j), 1 ≤ i < j, tel que
puisque
5 Exercices
Exercice 5.1 (W. Rudin [1, exercice 1, p. 21]).
Montrer que si r ∈ Q et s ∈ R \ Q, alors r + s ∈ R \ Q et rs ∈ R \ Q ∪{0}.
Définition 1.1. (i) Une relation ou graphe fonctionnel est un triplet (E, F, Y )
tel que
F ⊂ E × Y.
Le domaine 1 de F est
déf
X = {x ∈ E : ∃y ∈ Y tel que (x, y) ∈ F }
et l’image de x ∈ X
déf
Im (x) = {y ∈ Y : tel que (x, y) ∈ F }.
(ii) On associe à chaque x ∈ X le sous-ensemble unique Im (x) de Y
déf
x 7→ f (x) = Im (x) : X → P(Y ),
où P(Y ) dénote l’ensemble des sous-ensembles de Y . On appellera f l’ap-
plication multivoque 2 associée au triplet (E, F, Y ) parce qu’elle fait corres-
pondre à chaque point du domaine X plusieurs points de Y .
1. La notation usuelle est DF plutôt que X.
2. Set-valued analysis ou multivalued analysis en anglais. La pratique de permette à une
fonction en mathématiques de signifier aussi une fonction multivoque a été oubliée dans la
première moitié du XXe s‘ecle. On peut en apprécier l’évolution dans les différentes versions de
G. H. Hardy [1] commençant en 1921. Cette théorie fut systématiquement développée pour la
première fois C. Berge [1] en 1959. On en palpe les retombées avec les équations différentielles
multivoques et la théorie de la viabilité dans J. P. Aubin et A. Cellina [1] en 1984. Cette analyse
devient aussi centrale en théorie de l’optimisation avec l’introduction de la notion de sous-gradient
en analyse convexe. On peut trouver un traitement fort complet de l’analyse multivoque dans
J. P. Aubin et H. Frankowska [1].
23
24 Chapitre 2. Quelques notions ensemblistes et algébriques
x 7→ f (x) : X → Y. (1.4)
x 7→ f (x).
∈X ∈Y
(notée f : X → Y ),
Définition 1.3.
Soit f : X → Y une application.
(i) f est injective si
f −1 : Y → X
Le terme fonction est souvent utilisé pour les applications à valeurs numériques,
réelles ou complexes, c’est-à-dire lorsque l’ensemble d’arrivée est R ou C. On parle
alors de fonction réelle ou de fonction complexe.
La notion de fonction en tant que correspondance entre deux types d’objet
est relativement ancienne. Mais le terme n’apparait qu’à la fin du XVIIe siècle
sous la plume de Leibniz en 1694, il s’agit alors de fonction associée à une courbe
géométrique : Leibniz dit ainsi que l’abscisse, l’ordonnée ou le rayon de courbure
d’une courbe en un point M est une fonction du point M .
À la même époque, Newton parle de fluente pour des quantités dépendant
d’une variable qu’il appelle le temps (tout en précisant que le rôle joué par le temps,
peut l’être par une autre quantité).
La notation sous la forme f ne s’est pas mise en place tout de suite. Jean Ber-
noulli propose d’appeler X la fonction de x, Leibniz invente une notation permettant
de travailler sur plusieurs fonctions différentes : x|1 et x|2 sont ainsi deux fonctions
dépendant de x. La notation f x apparait chez Euler en 1734. Les fonctions sont
alors toujours à valeurs numériques (réelles ou complexes) et possèdent en outre
des propriétés restrictives (liées à une équation algébrique, continuité eulérienne,
développable en série entière...).
En pratique, la communauté mathématique dans son ensemble continue à uti-
liser ces deux termes dans leur sens historique, le terme fonction étant utilisé comme
synonyme du terme application dans le cas particulier où l’ensemble d’arrivée est
R ou C (l’ensemble de départ étant systématiquement pris égal au domaine de
définition).
Définition 1.4. (i) Une relation binaire R dans un ensemble A est un sous-
ensemble R de A × A. La notation a R b signifiera que (a, b) ∈ R.
(ii) Une relation binaire R dans A est appelée une relation d’équivalence si :
(1) (réflexivité) ∀a ∈ A, a R a ;
(2) (symétrie) aRb ⇒ bRa;
(3) (transitivité) a R b et b R c ⇒ a R c.
Pour une relation d’équivalence R on dira que a et b sont équivalents si
a R b.
(iii) Soit R une relation d’équivalence dans A. Le sous-ensemble
déf
Ra = {b ∈ A : b R a} (1.5)
Exemple 1.1.
Les relations binaires suivantes sont des relations d’équivalence :
- ≪ est égal à≫ pour les nombres réels ;
- ≪ a la même date de naissance que≫ sur l’ensemble des humains ;
- ≪ est semblable à≫ sur l’ensemble des triangles ;
- ≪ x = y mod n ≫ sur les nombres entiers ;
- ≪ a la même valeur absolue que ≫ pour les nombres réels ;
- ≪ a le même cosinus que ≫ pour l’ensemble des angles.
x R a et a R b ⇒ x R b
2. Cardinal et dénombrabilité 27
ce qui montre que Ra ⊂ Rb. Dans l’autre sens, comme R est symétrique, b R a
et, par le même raisonnement x R b ⇒ x R a par transitivité, ce qui démontre que
Rb ⊂ Ra.
(iii) On suppose que Ra ∩ Rb 6= ∅. En choisissant ξ ∈ Ra ∩ Rb, il vient
ξ R a et ξ R b. Donc par symétrie et transitivité a R b en contradiction avec notre
hypothèse.
Théorème 1.1. Soit R une relation d’équivalence dans A. La collection des classes
d’équivalence distinctes de A partitionne A en sous-ensembles mutuellement dis-
joints, appelés classes de R-équivalence, tel que pour toute paire a, b ∈ A
∃α tel que a ∈ Aα et b ∈ Aα ⇐⇒ a R b.
2 Cardinal et dénombrabilité
2.1 Définitions et exemples
En mathématiques, les nombres cardinaux, sont une généralisation des entiers
naturels N, utilisés pour mesurer la cardinalité (taille) des ensembles. La cardinalité
d’un ensemble fini est un entier naturel, le nombre d’éléments dans l’ensemble. Les
nombres cardinaux transfinis décrivent les tailles des ensembles infinis. La cardi-
nalité est définie en terme de bijections. Deux ensembles ont le même cardinal s’il
existe une bijection entre eux. Dans le cas des ensembles finis, ceci coı̈ncide avec
la notion intuitive de taille. Dans le cas des ensembles infinis, le comportement est
plus complexe.
Définition 2.1. (i) On dira que deux ensembles A et B ont le même cardinal 3
ou sont équipotents s’il existe une bijection entre A et B.
(ii) A est fini s’il est vide ou s’il existe n ∈ N tel que A soit équipotent à
{1, 2, . . . , n}. Sinon, on dira que A est infini.
(iii) A est dénombrable s’il a le même cardinal que N.
(iv) A est au plus dénombrable s’il est fini ou dénombrable.
(v) A est non-dénombrable s’il n’est ni fini ni dénombrable.
Si A et B sont finis, cela revient à dire qu’ils ont le même nombre d’éléments.
L’avantage c’est que maintenant on va pouvoir aussi comparer des ensembles infinis.
Exemple 2.1.
(i) N et 2 N (nombres pairs) ont le même cardinal. Il suffit de choisir la bijection
déf
x 7→ f (x) = 2x : N → 2 N, x 7→ f −1 (x) = x/2 : 2 N → N .
premier élément, puis un autre, etc, et de façon à ne pas en oublier et à ne pas faire
de répétitions :
1 2 3 4 5 ....
l l l l l l
f (1) = 0 f (2) = 1 f (3) = −1 f (4) = 2 f (5) = −2 . . . .
On forme ainsi une suite ordonnée a1 , a2 , a3 , . . ..
Exemple 2.2.
N × N est dénombrable. Le processus ci-dessous énumère en fait toutes les paires de
(p, q) ∈ N × N. On compose le tableau suivant et on le parcourt dans le sens des
flèches.
(1, 1) → (2, 1) (3, 1) → (4, 1) (5, 1) → (6, 1) (7, 1) . . .
ւ ր ւ ր ւ ր
(1, 2) (2, 2) (3, 2) (4, 2) (5, 2) (6, 2) (7, 2) . . .
↓ ր ւ ր ւ ր ւ
(1, 3) (2, 3) (3, 3) (4, 3) (5, 3) (6, 3) (7, 3) . . .
ւ ր ւ ր ւ ր
(1, 4) (2, 4) (3, 4) (4, 4) (5, 4) (6, 4) (7, 4) . . .
↓ ր ւ ր ւ ր ւ
(1, 5) (2, 5) (3, 5) (4, 5) (5, 5) (6, 5) (7, 5) . . .
ւ ր ւ ր ւ ր
(1, 6) (2, 6) (3, 6) (4, 6) (5, 6) (6, 6) (7, 6) . . .
↓ ր ւ ր ւ ր ւ
.. .. .. .. .. .. ..
. . . . . . .
Exemple 2.3.
Q est dénombrable. On commence d’abord par énumérer Q+ , les rationnels positifs.
1/1 → 2/1 3/1 → 4/1 5/1 → 6/1 7/1 . . .
ւ ր ւ ր ւ ր
1/2 2/2 3/2 4/2 5/2 6/2 7/2 . . .
↓ ր ւ ր ւ ր ւ
1/3 2/3 3/3 4/3 5/3 6/3 7/3 . . .
ւ ր ւ ր ւ ր
1/4 2/4 3/4 4/4 5/4 6/4 7/4 . . .
↓ ր ւ ր ւ ր ւ
1/5 2/5 3/5 4/5 5/5 6/5 7/5 . . .
ւ ր ւ ր ւ ր
1/6 2/6 3/6 4/6 5/6 6/6 7/6 . . .
↓ ր ւ ր ւ ր ւ
.. .. .. .. .. .. ..
. . . . . . .
Le processus ci-dessus énumère toutes les paires de (p, q) ∈ N × N. Si chaque paire
représente un rationnel p/q, il y a donc des répétitions.
30 Chapitre 2. Quelques notions ensemblistes et algébriques
Exemple 2.4.
Si chaque paire représente un rationnel p/q, il y a donc des répétitions. Il suffit donc
de sauter un nombre déjà rencontré.
Exemple 2.5.
On peut ensuite énumérer Q− de la même manière, puis ensuite combiner Q+ , Q−
et {0} comme suit
Remarque 2.1.
Donc, aucun ensemble non-dénombrable ne peut être contenu dans un ensemble
dénombrable.
2. Cardinal et dénombrabilité 31
Définition 2.2.
Soit E un ensemble arbitraire. Si, à chaque élément α d’un ensemble quelconque A,
on associe un sous-ensemble Eα de E, on dit que l’on a défini une collection ou une
famille {Eα : α ∈ A} de sous-ensembles de E, que l’on écrira simplement {Eα }.
E1 E2 E3 E4 E5 E6 E7 ...
dont la nième colonne est constituée des éléments de la suite {xn,k } associée à En .
En suivant les flèches, les éléments du tableau sont rangés en une suite où chaque
élément de l’union apparait au moins une fois. On en déduit que E est au plus
dénombrable. Enfin, comme E1 ⊂ E et que E1 est dénombrable, E est dénombrable.
32 Chapitre 2. Quelques notions ensemblistes et algébriques
An peut alors être identifié à la réunion ∪a∈A An−1 qui est une réunion dénombrable
d’ensembles dénombrables. An est alors dénombrable par le Théorème 2.2.
En passant des suites finies au suite infinies, le Théorème 2.3 n’est plus vrai.
Théorème 2.4. Soit A = {0, 1} et l’ensemble
déf
E = {(a1 , a2 , . . . ) : ai ∈ A} (c’est-à-dire, E = A × A × . . . ) (2.2)
Exemple 2.6 (Exercice 5.2). (i) L’ensemble des irrationnels R \ Q n’est pas
dénombrable.
(ii) Le segment ]a, b[ et le segment ]c, d[ ont le même cardinal.
(iii) Le segment ]0, 1[ et R ont le même cardinal.
0, 1, 2, 3, · · · , n, · · · ; ℵ0 , ℵ1 , ℵ2 , · · · , ℵα , · · · .
La suite commence avec les entiers naturels (cardinaux finis), qui sont suivis par les
nombres aleph (les cardinaux infinis d’ensembles bien ordonnés). Les nombres aleph
sont indicés par des (nombres) ordinaux. Sous l’hypothèse de l’axiome du choix,
”Étant donné un ensemble X d’ensembles non vides, il existe une
fonction définie sur X, appelée fonction de choix, qui à chacun d’entre
eux associe un de ses éléments”,
la suite des nombres transfinis inclut tous les nombres cardinaux. Si l’on rejette
cette hypothèse, la situation devient plus compliquée, avec des nombres cardinaux
infinis qui ne sont pas des alephs. La cardinalité est étudiée en elle-même comme
une partie de la théorie des ensembles.
P7 (complétude)
∀E, ∅ 6= E ⊂ R, borné supérieurement, on a sup E ∈ R.
4. Le vocabulaire actuel vient de R. Dedekind qui définit un corps (Körper en allemand,
c’est la raison pour laquelle un corps quelconque est souvent nommé K) comme un sous-ensemble
de nombres réels ou complexes stable par addition, soustraction, multiplication et division.
36 Chapitre 2. Quelques notions ensemblistes et algébriques
Proposition 3.1. Dans tout corps, l’addition vérifie les quatre propriétés sui-
vantes :
(a) x + y = x + z ⇒ y=z
(b) x + y = x ⇒ y=0
(c) x + y = 0 ⇒ y = −x
(d) −(−x) = x.
Proposition 3.2. Dans tout corps, la multiplication vérifie les quatre propriétés
suivantes :
(a) x 6= 0 et xy = xz ⇒ y=z
(b) x 6= 0 et xy = x ⇒ y=1
(c) x 6= 0 et xy = 1 ⇒ y = x−1
(d) x 6= 0 et (x−1 )−1 = x.
Proposition 3.3. Dans tout corps, on a les quatre propriétés suivantes : pour tout
x, y ∈ K
(a) 0 x = 0
(b) x 6= 0 et y 6= 0 ⇒ xy 6= 0
(c) (−x)y = −(xy) = x(−y)
(d) (−x)(−y) = xy.
Définition 3.2.
Soit E un ensemble.
(i) Un ordre sur E est une relation, notée ≤, ayant les propriétés suivantes.
(a) ∀x ∈ E, x ≤ x.
(b) ∀x, y ∈ E, x ≤ y et y ≤ x ⇒ x = y.
(c) ∀x, y, z ∈ E, x ≤ y et y ≤ z ⇒ x ≤ z.
(ii) On a un ordre total si, en outre, on a la propriété supplémentaire :
(d) ∀x, y ∈ E, x ≤ y ou y ≤ x.
(iii) On dira que x est strictement inférieur à y et on écrira x < y si x ≤ y et
x 6= y.
Définition 3.3.
Un ensemble ordonné est un ensemble sur lequel un ordre a été défini.
Exemple 3.1.
Soit Rk l’ensemble des suites finies x = (x1 , . . . , xk ) et pour x et y dans Rk l’ordre
x≤y si ∀i, 1 ≤ i ≤ k, xi ≤ yi .
C’est un ordre mais pas un ordre total.
Exemple 3.2.
La relation A ⊂ B sur l’ensemble des sous-ensembles de N est un ordre mais pas un
ordre total car pour A = {1, 2, 3} et B = {5, 6, 7}, on n’a ni A ⊂ B ni B ⊂ A.
Définition 3.4.
Soit E un ensemble ordonné et A, ∅ 6= A ⊂ E.
(i) On dit que A est borné supérieurement (majoré) dans E si
∃α ∈ E tel que ∀x ∈ A, x ≤ α
et que α est une borne supérieure (majorant) de A dans E.
(ii) On dit que A est borné inférieurement (minoré) dans E si
∃β ∈ E tel que ∀x ∈ A, x ≥ β
et que β est une borne inférieure (minorant) de A dans E.
Définition 3.6.
Soit E un ensemble ordonné.
(i) E a la propriété de la borne supérieure si
∀A, ∅ 6= A ⊂ E, bornée supérieurement (majorée), sup A ∈ E. (3.1)
déf
M = {y ∈ E : ∀x ∈ A, y ≤ x} ⇒ ∀x ∈ A, ∀y ∈ M, y ≤ x.
∀x ∈ A, sup M ≤ x ⇒ sup M ∈ M,
c’est-à-dire, sup M est aussi une borne inférieure de A. Est-ce que c’est la plus
grande borne inférieure de A ? S’il existait une borne inférieure z de A tel que
z > sup M , on aurait z ∈ / M et, par définition de M , z ne serait pas une borne
inférieure de A. De cette contradiction, on conclut que inf A = sup M et E a la
propriété de la borne inférieure. La réciproque de démontre de façon analogue.
Exemple 3.3.
Soit l’ensemble ordonné E = {x ∈ R : x > 0}. Supposons que A, ∅ 6= A ⊂ E, soit
borné supérieurement dans E. Comme A est aussi borné supérieurement en tant
que sous-ensemble de R, on sait par la propriété P7 que sup A ∈ R. Il vient alors
Définition 3.7.
Un corps ordonné est un corps K muni d’un ordre total ≤ tel que :
x 7→ (x, 0) : R → R2
pour les deux éléments de la base. Tout x = (x1 , x2 ) peut s’écrire sous la forme
x = (x1 , x2 ) = x1 (1, 0) + x2 (0, 1) = x1 + i x2
en omettant le 1.
On introduit maintenant la table de multiplication 2.1 des éléments de base 1
et i de façon à vérifier l’équation (4.5). Par définition, on a bien
⊙ 1 i
1 1 i
i i −1
Tout quaternion (a, b, c, d) ∈ R4 est une combinaison linéaire des quatre qua-
ternions ≪unités ≫ : 1 = (1, 0, 0, 0), i = (0, 1, 0, 0), j = (0, 0, 1, 0), et k = (0, 0, 0, 1) :
∀(a, b, c, d) ∈ R4 , (a, b, c, d) = a 1 + b i + c j + d k.
Ces quaternions unités ne sont autres que les quatre éléments de la base orthonor-
male dans R4 . La définition de la multiplication s’obtient à partir de la Table de
multiplication 2.2.
⊙ 1 i j k
1 1 i j k
i i −1 k −j
j j −k −1 i
k k j −i −1
× e1 e2 e3
e1 0 e3 −e2
e2 −e3 0 e1
e3 e2 −e1 0
Ici. il ne s’agit pas d’un corps puisque qu’il n’y a pas d’élément neutre (axiome
(M4)) et pas d’inverse (axiome (M5)) multiplicatif. Il n’y a pas non plus de com-
mutativité (axiome (M2)).
5 Exercices
Exercice 5.1 (W. Rudin [1, exercice 8, p. 21]).
Montrer qu’il est impossible de définir sur l’ensemble des nombres complexes C un
ordre total qui lui confère une structure de corps ordonné. (Indication : −1 est un
carré.
5. Exercices 45
Exercice 5.2.
Démontrer les résultats suivants.
(i) L’ensemble des irrationnels R \ Q n’est pas dénombrable.
(ii) Le segment ]a, b[ et le segment ]c, d[ ont le même cardinal.
(iii) Le segment ]0, 1[ et R ont le même cardinal.
46 Chapitre 2. Quelques notions ensemblistes et algébriques
Chapitre 3
Topologie et suites
dans les
espaces métriques
et la notation R = R ∪{±∞} pour l’ensemble étendu des réels (droite réelle achevée).
Pour un entier n ≥ 1, on considère maintenant les suites ordonnées x =
(x1 , . . . , xn ) de nombres réels xi . On appelle produit cartésien l’ensemble de toutes
ces suites
déf
Rn = R × . . . × R. (1.1)
| {z }
n fois
Définition 1.1.
La base canonique orthonormale de Rn est l’ensemble {eni ∈ Rn : 1 ≤ i ≤ n} des
éléments de Rn définis par
(
n déf déf 1, si i = j
(ei )j = δij , δij =
0, si i 6= j,
47
48 Chapitre 3. Topologie et suites dans les espaces métriques
où la fonction de deux variables δij est appelée symbole de Kronecker. Explicitement,
en1 = (1, 0, 0, . . . , 0, 0), en2 = (0, 1, 0, . . . , 0, 0), ..., enn = (0, 0, 0, . . . , 0, 1).
Définition 1.2.
Soit E un ensemble non vide. On dit que (E, +, ×) est un espace vectoriel sur R
muni d’une addition
x, y 7→ x + y : E × E → E
et d’une multiplication par un scalaire
α, x 7→ α × x : R ×E → E
α × (x + y) = α × x + α × y,
(α + β) × x = α × x + β × x,
α × (βx) = (αβ) × x,
1 × x = x.
Exemple 1.1.
Les suites infinies x = (x1 , x2 , . . . ) ∈ R × R × . . . de réels avec les opérations
déf déf
x + y = (x1 + y1 , x2 + y2 , . . . ) et α x = (α x1 , α x3 , . . . )
Exemple 1.2.
L’ensemble des fonctions f : [0, 1] → R est un espace vectoriel pour l’addition et la
multiplication par un scalaire suivantes :
déf déf
(f + g)(x) = f (x) + g(x) et (α f )(x) = α f (x).
√
pour lequel kxkRn = x · x.
c’est-à-dire, la plus petite distance entre les deux points comme en géométrie eucli-
dienne.
On peut vérifier les propriétés suivantes pour la norme euclidienne.
Démonstration. Les propriétés (a), (b) et (c) sont faciles à vérifier et la propriété
(f) est une conséquence de (e) : kx − zk = k(x − y) + (y − z)k.
(d) Le polynôme quadratique
n
X n
X n
X n
X
0≤ (xi + λ yi )2 = x2i + 2 λ xi yi + λ2 yi2
1=1 1=1 1=1 1=1
n
!2 n
! n
!
X X X
xi yi − x2i yi2 ≤0
1=1 1=1 1=1
Définition 1.4. (i) Une norme sur un espace vectoriel V est une application
déf
p : V → R+ = {x ∈ R : x ≥ 0}
est bien un disque de rayon r dans le plan donné par l’inégalité y12 + y22 < r2 . Pour
p = 1, la “boule”
déf
Br (0) = y ∈ R2 : kyk1 < r
est un losange donné par l’inégalité |y1 | + |y2 | < r, et, pour p = ∞, la “boule”
déf
Br (0) = y ∈ R2 : kyk∞ < r
n n
!1/p n
!1/q
X X X
p q
|xi yi | ≤ |xi | |yi | = kxkp kykq , 1 < p < ∞,
i=1 i=1 i=1
Xn n
X
|xi yi | ≤ |xi | max |yj | = kxk1 kyk∞ , p = 1;
1≤j≤n
i=1 i=1
n
!1/p n
!1/p n
!1/p
X X X
|xi + yi |p ≤ |xi |p + |yi |p , 1 ≤ p < ∞,
i=1 i=1 i=1
max |xi + yi | ≤ max |xi | + max |yi |, p = ∞.
1≤i≤n 1≤i≤n 1≤i≤n
Démonstration. Les parties (i) et (ii) sont évidentes. Le cas p = 1 est immédiat.
2. Otto Ludwig Hölder (1859–1937). C’est la généralisation de l’inégalité de Cauchy-Schwarz
qui correspond à p = 2.
3. Hermann Minkowski (1864–1909). Voir aussi la démonstration plus directe de la Remarque
3.3 du Chapitre 4 page 123.
52 Chapitre 3. Topologie et suites dans les espaces métriques
On passe donc au cas 1 < p < ∞. Soit α > 0 et β > 0 tel que α + β = 1. On a
besoin de l’ inégalité arithmético-géométrique pondérée suivante : pour tous u > 0
et v > 0, on a
uα v β ≤ α u + β v ou uα v 1−α ≤ α u + (1 − α) v. (1.5)
tα ≤ 1 + α (t − 1) ⇒ tα ≤ α t + β. (1.6)
On obtient
!1/p !1/q
|x |p |y |q 1 |x |p 1 |yi |q
Pn i p
Pn i q
≤ Pn i + P n
j=1 |xj | j=1 |yj | p j=1 |xj |p q j=1 |yj |
q
|xi | |y | 1 |x |p 1 |yi |q
Pn p 1/p
Pn i q 1/q ≤ Pn i p
+ Pn q
( j=1 |xj | ) ( j=1 |yj | ) p j=1 |xj | q j=1 |yj |
|xi | |yi | 1 |xi |p 1 |yi |q
Pn P n ≤ P n + P n .
( j=1 |xj |p )1/p ( j=1 |yj |q )1/q p j=1 |xj |p q j=1 |yj |
q
Pour p = 1, q = ∞ et
n n n n
!
X X X X
xi yi ≤ |xi yi | ≤ |xi | |yi | ≤ |xi | max |yj |.
1≤j≤n
i=1 i=1 i=1 i=1
En additionnant
1−1/p 1/p 1/p
n
X n
X n n
X X
|xi + yi |p ≤ |xi + yi |p |xj |p + |yj |p
i=1 j=1 j=1 j=1
Enfin, pour p = 1
n
X n
X n
X n
X
|xi + yi | ≤ |xi | + |yi | = |xi | + |yi |;
i=1 i=1 i=1 i=1
pour p = ∞
|xi + yi | ≤ |xi | + |yi | ≤ max |xi | + max |yi |
1≤i≤n 1≤i≤n
Exemple 1.3.
On revient à l’exemple 1.2 de l’espace vectoriel C[0, 1] des fonctions continues f :
[0, 1] → R. Les fonctions
Z 1
f 7→ max |f (x)| et f 7→ |f (x)| dx
x∈[0,1] 0
sont des normes sur C[0, 1]. On verra plus loin que pour un sous-ensemble borné
fermé K ⊂ Rn , l’espace des fonctions continues sur K,
déf déf
C(K) = {f : K → R | f est continue sur K} , kf kC(K) = sup |f (x)|
x∈K
Exemple 1.4.
Si l’on passe à des espaces de suites infinies comme
( ∞
)
déf
X
ℓp = x = (x1 , x2 , . . . ) : xi ∈ R et |xi |p < ∞ , 1 ≤ p < ∞,
i=1
on peut encore montrer que ℓp est un espace vectoriel, mais il n’est plus de dimension
finie. On peut aussi vérifier que la fonction
∞
!1/p
déf
X p
kxkℓp = |xi |
i=1
Définition 1.5.
Soit V un espace vectoriel sur R. Un produit scalaire sur V est une application
(x, y) 7→ x · y : V × V → R (1.7)
Exemple 1.5.
On revient à l’exemple 1.2 de l’espace vectoriel C[0, 1] des fonctions continues f :
[0, 1] → R. La fonction
Z 1
déf
f, g 7→ f · g = f (x) g(x) dx
0
Définition 2.1. (i) Une métrique sur un ensemble X est une fonction
déf
(x, y) 7→ d(x, y) : X × X → R+ , R+ = {x ∈ R : x ≥ 0}
Il est important d’insister sur le fait que l’on n’a supposé aucune structure algébrique
sur X comme le montre l’exemple suivant.
56 Chapitre 3. Topologie et suites dans les espaces métriques
d(x, y) = kx − yk
est une métrique sur X à partir des propriétés (N1), (N2) et (N3) de la Définition
1.4 du Chapitre 2 (voir l’Exercice 10.5). Les espaces R, Rn , ℓp et C(K) sont donc
des espaces métriques.
On termine par l’exemple de la métrique de Hausdorff.
A ←→ dA
∈F (K) ∈Cd (K)
ce qui permet d’identifier Cd (K) à F (K). Comme l’espace des fonctions continues
C(K) est un espace normé pour la norme du sup sur K, cela induit la métrique
suivante sur F (K) :
déf
d(A, B) = kdA − dB kC(K) = sup |dA (x) − dB (x)|.
x∈K
2. Métrique et espace métrique 57
qui est généralement définie sur les sous-ensembles compacts de Rn plutôt que
sur les sous-ensembles compacts d’un compact K. L’avantage de cette dernière
construction est de pouvoir dans un second temps définir une métrique sur tous
les sous-ensembles fermés de Rn bornés ou non-bornés (voir M. C. Delfour et
J.-P. Zolésio [1, pp. 268–275].
En effet, pour x ∈ K, xA ∈ A, et xB ∈ B
|x − xA | ≤ |x − xB | + |xB − xA |
⇒ dA (x) ≤ |x − xB | + dA (xB ) ≤ |x − xB | + sup dA (y)
y∈B
4. L’écart mutuel entre deux ensembles fut introduit par D. Pompéiu [1] dans sa thèse
présentée à Paris en mars 1905. C’est le premier exemple d’une métrique entre deux ensembles. Elle
fut étudiée avec plus de détails par F. Hausdorff [2, “Quellenangaben”, p. 280, and Chap. VIII,
sect. 6] en 1914.
5. Felix Hausdorff (1868–1942) est considéré comme l’un des fondateurs de la topologie mo-
derne.
58 Chapitre 3. Topologie et suites dans les espaces métriques
sup |dA (x) − dB (x)| ≥ sup |dA (x) − dB (x)| = sup dB (x)
x∈K x∈A x∈A
sup |dA (x) − dB (x)| ≥ sup |dA (x) − dB (x)| = sup dA (x)
x∈K x∈B x∈B
⇒ sup |dA (x) − dB (x)| ≥ max sup dB (x), sup dA (x) .
x∈K x∈A x∈B
déf d(x, y)
(x, y) 7→ d(x, y) =
1 + d(x, y)
est une métrique sur X.
(iv) Soit {dn : n ≥ 1} une suite de fonctions dn : X × X → R+ tel que pour
tout entier n ≥ 1 6
et, en plus,
d1 (x, y) = 0 ⇒ x = y. (2.4)
6. Une application d : X × X → R+ vérifiant les conditions (2.1) à (2.3) est applelée pseu-
dométrique ou écart. En introduisant la relation déquivalence x R y si d(x, y) = 0 et en posant
déf
d∗ (Rx, Ry) = d(x, y) on obtient une métrique sur l’espace quotient X ∗ = X/R.
3. Ensemble ouvert et ensemble fermé 59
La fonction
X∞
déf 1 dn (x, y)
(x, y) 7→ d∞ (x, y) = n 1 + d (x, y)
n=1
2 n
Remarque 3.1.
Attention à la terminologie boule ouverte et à sa notation, car elles peuvent être
trompeuses. Soit R2 muni de la métrique usuelle
déf p
d((x2 , y2 ), (x1 , y1 )) = |y2 − y1 |2 + |x2 − x1 |2 .
7. Certains auteurs associent un nom aux métriques dp : Manhattan pour p = 1 parce que
c’est la plus petite distance entre deux points parcourue par un taxi lorsqu’il se déplace dans une
ville américaine où les rues sont agencées selon un réseau ou quadrillage, Euclide pour p = 2,
Minkowski pour 1 < p < ∞, et Tchebychev ou distance de l’échiquier pour p = ∞.
60 Chapitre 3. Topologie et suites dans les espaces métriques
correspond bien à l’intuition que l’on se fait d’une boule. Cependant, si l’on prend
X = Q2 , l’ensemble des points de R2 de coordonnées rationnelles, avec la métrique
d, la boule ouverte de rayon un en (0, 0) dans (Q2 , d) est
n p o
déf
B1 (0, 0) = (x, y) ∈ Q × Q : x2 + y 2 < 1 .
déf
B1 (0, 0) = {(x, 0) : x ∈ Q et |x| < 1} ⊂ Q × Q.
Pour être précis, il faudrait ajouter l’indice X et utiliser la notation B1X (0, 0)
pour bien la distinguer de celle de la boule ouverte de rayon un en (0, 0) dans R2 .
Comme l’espace X est en général fixé, on choisit de laisser tomber l’indice X pour
alléger la notation.
Exemple 3.1.
Soient R muni de la métrique d(x, y) = |x− y| et Y = {x ∈ R : x ≥ 0}. On considère
pour b > 0 le sous-ensemble E = {x ∈ R : 0 ≤ x < b} pour lequel E ⊂ Y ⊂ R. Le
point 0 n’est pas un point intérieur de E dans (R, d) puisque pour tout r, 0 < r < b,
De même, tout point x, 0 < x < b, est un point intérieur car pour r = min{x, b−x} >
0, on a x ≥ r, b − x ≥ r et
Donc, E est ouvert dans (Y, d) mais pas dans (R, d).
et y ∈ int Br (x). Donc tout point de Br (x) est un point intérieur et Br (x) est un
ensemble ouvert.
(ii) Pour chaque x ∈ int E, il existe r > 0 tel que Br (x) ⊂ E. Donc, pour tout
y ∈ Br (x), on a 0 < d(y, x) < r. Soit ρ = r − d(y, x) > 0. On a
On en conclut que Br (x) ⊂ int E et que x est un point intérieur de int E. Donc
int E est ouvert. On a aussi montré que int E ⊂ int (int E).
(iii) De la partie (ii), int E est ouvert. Si E = int E, alors E est ouvert.
Réciproquement, par définition, int E ⊂ E. Si E est ouvert, alors pour chaque
x ∈ E, il existe r > 0 tel que Br (x) ⊂ E et x ∈ int E. Donc E ⊂ int E et E = int E.
(iv) De la partie (iii). Comme il n’y a pas de points dans ∅, l’ensemble de ses
points intérieurs est vide : int ∅ = ∅. Par définition de Br (x), pour tout x ∈ X et
tout r > 0, on a toujours Br (x) ⊂ X et donc X ⊂ int X ⊂ X. Donc X = int X et
X est un ouvert.
(v) Si ∩m m
i=1 Gi = ∅, le résultat est vrai. Sinon, soit x ∈ ∩i=1 Gi . Comme pour
chaque i, x ∈ Gi et que Gi est ouvert, il existe ri > 0 tel que Bri (x) ⊂ Gi . On
prend r = min{ri : 1 ≤ i ≤ m} > 0 qui est strictement positif. Donc
(vi) Si tous les Gα sont vides, l’union est vide et il n’y a rien à démontrer.
Sinon, pour chaque x ∈ ∪α∈A Gα , il existe α ∈ A tel que x ∈ Gα . Comme Gα est
ouvert, il existe r > 0 tel que
Br (x) ⊂ Gα ⊂ ∪α∈A Gα
Définition 3.2.
Soit (X, d) un espace métrique.
(i) La famille T de tous les ouverts dans X est appelée la topologie 8 de X
générée par la métrique d.
(ii) On dit qu’une famille d’ouverts {Oα } est une base de (X, d) si tout ouvert
de X est la réunion d’ouverts de cette famille.
Théorème 3.2. Soit (X, d) un espace métrique. La famille de toutes les boules
ouvertes {Br (x) : x ∈ X, r > 0} plus l’ensemble vide ∅ est une base de (X, d).
Démonstration. Par le Théorème 3.1 (iii), lorsque ∅ 6= E ⊂ X est ouvert, il coı̈ncide
avec son intérieur int E. Si x ∈ int E, il existe rx > 0 tel que Brx (x) ⊂ E. Donc
On revient à l’Exemple 3.1. Si (X, d) est un espace métrique, alors pour toute
partie Y ⊂ X, (Y, d) est aussi un espace métrique avec ses ouverts. Il est donc
important de bien comprendre l’utilisation de la notation ambigue Br (x) pour la
boule ouverte. En effet la boule ouverte de centre a ∈ X et de rayon r > 0 dans
(X, d) est définie comme
déf
BrX (a) = {z ∈ X : d(x, a) < r},
alors que la boule ouverte de centre b ∈ Y et de rayon r > 0 dans (Y, d) est définie
comme
déf
BrY (b) = {z ∈ Y : d(y, b) < r}.
Si a ∈ Y ⊂ X, on a alors
Définition 3.3.
Soient (X, d) un espace métrique et Y ⊂ X. Un ensemble G ⊂ Y est ouvert relati-
vement à Y si G est ouvert dans (Y, d), c’est-à-dire, pour chaque x ∈ G
∃r > 0 tel que BrY (x) ⊂ G, (3.1)
Définition 3.4.
Soit E une partie d’un espace métrique (X, d).
(i) a ∈ E est un point isolé de E si
Remarque 3.2.
De cette définition, on constate que les points isolés de E sont donnés par
déf
/ E′}
E\E ′ = {x ∈ E : x ∈ (3.2)
Exemple 3.2.
Soit R avec la métrique d(x, y) = |x − y|. On se donne les sous-ensembles
(ii) Si E ne contient qu’un nombre fini de points, alors tous ses points sont
des points isolés.
Démonstration. (i) Il suffit de démontrer pour toute boule ouverte Br (x) contient
une infinité de points de E. Supposons donc qu’il existe r > 0 tel que Br (x) ne
contienne qu’un nombre fini de points x1 , . . . xn de E distincts de x. Soit
déf
r = min{d(xi , x) : 1 ≤ i ≤ n}.
Définition 3.5.
Soit E une partie d’un espace métrique (X, d). E est un ensemble fermé s’il contient
tous ses points d’accumulation, c’est-à-dire, si E ′ ⊂ E.
Encore une fois, il faut être prudent en présence de définitions aussi générales.
Définition 3.6.
Soient A et B deux parties d’un ensemble X.
(i) L’ensemble {x ∈ A : x ∈
/ B} est le complément de B par rapport à A. On
écrira A\B ou ∁A B.
(ii) Lorsque A = X on écrira ∁B ou X\B et on dira que ∁B est le complément
de B par rapport à X.
66 Chapitre 3. Topologie et suites dans les espaces métriques
Théorème 3.5. Soit E une partie d’un espace métrique (X, d).
(i) E est ouvert si et seulement si X\E est fermé. En particulier, X et ∅ sont
à la fois ouverts et fermés dans (X, d).
(ii) E est fermé dans (X, d) si et seulement si X\E est ouvert dans (X, d).
Démonstration. (i) (⇒) Par l’absurde : si X\E n’est pas fermé, alors il existe un
point d’accumulation x ∈ (X\E)′ qui n’appartient pas à X\E. Donc x ∈ E. Comme
E est ouvert, il existe r > 0 tel que Br (x) ⊂ E et donc
∃r > 0 tel que Br (x) ∩ (X\E) = ∅ ⇒ ∃r > 0 tel que Br′ (x) ∩ (X\E) = ∅
et comme x ∈
/ (X\E)
Comme tous les points de E sont des points intérieurs, E est ouvert par définition.
(ii) On applique la partie (i) à X\E : E = X\(X\E) est fermé si et seulement
X\E est ouvert.
Définition 3.7.
Soit E une partie d’un espace métrique (X, d).
(i) a ∈ X est un point d’adhérence de E si pour tout r > 0 on a Br (a)∩E 6= ∅.
(ii) L’adhérence de E est l’ensemble de tous les points d’adhérence de E. On
la notera E.
6 ∅. On a
On voit que E ⊂ E puisque, pour tout r > 0, Br (x) ∩ E ∋ {x} =
aussi pour tout point d’accumulation x ∈ E ′
Lemme 3.1. Soit E une partie d’un espace métrique (X, d).
(i) E = E ∪ E ′ et
E= E′ ∪ E\E ′ .
points d’accumulation points isolés de E
de E
3. Ensemble ouvert et ensemble fermé 67
Démonstration. (i) On a déjà montré que E ∪ E ′ ⊂ E. Dans l’autre sens, pour tout
point d’adhérence x ∈ E et toute boule ouverte Br (x), on a Br (x) ∩ E 6= ∅. Si pour
tout r > 0, Br′ (x) ∩ E 6= ∅, alors x est un point d’accumulation de E. S’il existe
r > 0 tel que Br′ (x) ∩ E = ∅, alors comme {x} = Br (x) ∩ E 6= ∅, on a x ∈ E. Par
définition, c’est un point isolé de E. Donc E ⊂ E ∪ E ′ .
/ E = E ′ ∪ E, c’est-à-dire x ∈
(ii) Soit x ∈ X\E. Alors, de la partie (i), x ∈ / E′
′
et x ∈ / E. Donc, il existe r > 0 tel que Br (x) ∩ E = ∅. Comme x ∈ / E on a
Br (x) ∩ E = ∅ et Br (x) ⊂ X\E. Par définition x ∈ int X\E ce qui montre que
X\E ⊂ int (X\E).
Dans l’autre sens, si x ∈ int (X\E), il existe r > 0 tel que Br (x) ⊂ X\E ce
qui implique que Br (x) ∩ E = ∅. Donc, x ∈ / E et, de là, x ∈ X\E. Pour la seconde
identité voir l’Exercice 10.10 (a).
Théorème 3.6. Soit E une partie d’un espace métrique (X, d). L’adhérence E de
E est fermée dans (X, d).
Démonstration. Par le Théorème 3.1 (ii), int (X\E) est ouvert. Par le Lemme 3.1
(ii), int (X\E) = X\E. Par le Théorème 3.5 (i), son complement E = X\(int (X\E))
est fermé.
Théorème 3.7. Soit E une partie d’un espace métrique (X, d).
(i) x ∈ X est un point d’adhérence de E si et seulement si, pour tout voisinage
V (x) de x, V (x) ∩ E 6= ∅.
(ii) E est fermé si et seulement si E = E.
(iii) Pour toutes parties A et B de X tel que A ⊂ B, on a A ⊂ B. Si B est
fermé, alors A ⊂ B. En particulier A = A.
Br (sup E) ∩ E = ∅
⇒ ∀x ∈ E, sup E + r ≤ x ou x ≤ sup E − r
Dans le premier cas, comme sup E est une borne supérieure de E, on a x ≤ sup E
pour tout x ∈ E et cela impliquerait sup E + r ≤ x ≤ sup E et r ≤ 0 une contra-
diction. Comme le premier a été exclus, il ne reste donc que le second cas
∀x ∈ E, x ≤ sup E − r.
Pour obtenir les propriétés des ensembles fermés à partir de celles des ouverts,
on utilise la propriété du complémentaire et les règles de De Morgan. 9
Théorème 3.9. Pour toute famille {Xα : α ∈ A} de parties d’un ensemble X
et E = A.
Remarque 3.3.
En général, on n’a que A ∩ B ⊂ A ∩ B. Il suffit de prendre A = (0, 1) et B = (1, 2)
dans R. On a A ∩ B = ∅ mais A = [0, 1], B = [1, 2] et A ∩ B = {1}.
Définition 3.8.
Soit E une partie d’un espace métrique (X, d). La frontière de E est définie comme
E ∩ X\E. On la notera ∂E.
La boule ouverte Br (x) dans R2 a pour frontière le cercle de rayon r. Cela correspond
bien à notre intuition d’une frontière ou du bord d’un objet géométrique. Il y a
cependant des frontières que l’on pourrait qualifier d’épaisses.
Exemple 3.4.
On considère le sous-ensemble E = Br (x) ∩ (Q × Q) de X = R × R des points à
coordonnées rationnelles dans le disque Br (x). Par densité des rationnels et des
irrationnels dans R,
E = Br (x), ∁E = R × R ⇒ ∂E = Br (x).
Théorème 3.11. Soit E une partie d’un espace métrique (X, d). Alors,
∂(X\E) = ∂E (3.6)
E = int E ∪ ∂E et ∂E = E\int E (3.7)
X\E = int (X\E) ∪ ∂E et ∂E = X\E\int (X\E). (3.8)
4 Ensembles compacts
La compacité est une propriété topologique importante qui se définit en topo-
logie générale, à partir de la notion de recouvrement ouvert. Toutefois dans le cadre
des espaces métriques (comprenant notamment les espaces vectoriels normés), il
est possible d’en donner une caractérisation en termes de suites. Il est fréquent de
faire prendre à cette dernière le rôle d’une définition. La notion de compacité ainsi
présentée est appelée compacité séquentielle. On la verra un peu plus loin.
Définition 4.1.
Soit E une partie d’un espace métrique (X, d).
(i) Une famille d’ouverts {Gα : α ∈ A} est un recouvrement ouvert de E si
E ⊂ ∪α∈A Gα .
Remarque 4.1.
De ces définitions, tout ensemble fini est compact. L’ensemble vide ∅ est compact.
En effet, si X = ∅, le seul recouvrement ouvert de ∅ n’a qu’un seul élément ∅ et la
définition est vérifiée. Si X 6= ∅, alors de tout recouvrement ouvert {Gα : α ∈ A}
de ∅, on a un sous-recouvrement par n’importe quel Gα : ∅ ⊂ Gα .
E ⊂ ∪ni=1 Gαi .
Enfin, comme Gα ⊂ Oα ,
Remarque 4.2.
En particulier, si Y = E, la compacité relativement à (E, d) signifie que les ouverts
du recouvrement {Gα : α ∈ A} de E relativement à (E, d) sont des sous-ensembles
de E et non de X :
E = ∪α∈A Gα .
Définition 4.2.
Soit E une partie d’un espace métrique (X, d). (E, d) est borné si E = ∅ ou s’il
existe x ∈ X et r > 0 tel que E ⊂ Br (x).
Remarque 4.3.
Comme la compacité, la bornitude est une notion intrinsèque. En effet, pour ∅ 6=
E ⊂ Y ⊂ X, on a
E borné dans (X, d) ⇐⇒ E borné dans (Y, d) ⇐⇒ E borné dans (E, d).
Si E est borné dans (X, d), il existe x ∈ X et r > 0 tel que E ⊂ BrX (x). On choisit
un point a ∈ E :
X
∀y ∈ E, d(y, a) ≤ d(y, x) + d(x, a) < r + d(x, a) ⇒ E ⊂ Br+d(x,a) (a)
X X Y
⇒ E ⊂ Br+d(x,a) (a) ∩ E ⊂ Br+d(x,a) (a) ∩ Y = Br+d(x,a) (a)
et E est borné non seulement dans (Y, d) mais aussi dans (E, d). Enfin, si E est
borné dans (E, d), il existe x ∈ E et r > 0 tel que E ⊂ BrE (x) ⊂ BrX (x) et E est
borné dans (X, d).
Théorème 4.2. Toute partie compacte d’un espace métrique (X, d) est bornée et
fermée.
Exemple 4.1.
On considère l’espace métrique R+ = {x ∈ R : x > 0}, le sous-ensemble E = ]0, 1]
est borné et fermé dans R+ . Il n’est cependant pas compact dans R+ car s’il l’était,
par le Théorème 4.1, il devrait aussi être compact dans R, où il n’est pas fermé car
0 est un point d’accumulation de E dans R qui n’appartient pas à E.
puisque l’intersection est vide par choix du rayon ry . La famille de boules {Bry (y) :
y ∈ K} est un recouvrement ouvert de K. Par compacité, il existe un sous-
recouvrement {Bryi (yi ) : 1 ≤ i ≤ n} de K tel que
Comme il existe r > 0 tel que Br (x) ⊂ ∁K, x est un point intérieur de ∁K et ∁K
est ouvert.
Théorème 4.3. Soit K un compact dans un espace métrique (X, d). Toute partie
fermée E de K est compacte.
Démonstration. Soit {Gα : α ∈ A} un recouvrement ouvert de E dans X. Comme
E est fermé, ∁E est ouvert et la famille {Gα : α ∈ A} plus ∁E est un recouvrement
ouvert de K :
K ⊂ E ∪ ∁E ⊂ ∪α∈A Gα ∪ ∁E.
et E est compact.
74 Chapitre 3. Topologie et suites dans les espaces métriques
Alors
∩α∈A Kα 6= ∅. (4.2)
∩m
i=1 Kni = Kmax{ni :1≤i≤m} 6= ∅.
Remarque 4.4.
La réciproque de ce théorème est vraie, mais sa démonstration nécessite quelques
résultats préliminaires non-triviaux. On peut y arriver en regardant la question du
point de vue de la topologie générale et en considérant les espaces métriques comme
un cas particulier. Cela conduirait à l’introduction de notions trop générales pour
ces notes. L’approche privilégiée sera donc de passer par les suites et les sous-suites
qui sont de toutes façons une partie incontournable des espaces métriques. Cette
réciproque sera démontrée plus loin au paragraphe 7 en page 89 où l’on introduira
aussi la notion de compacité séquentielle.
5. Caractérisation de la compacité dans Rk 75
E ∩ Br′ y (y) = ∅.
On en conclut que E ne possède qu’un nombre fini de points ce qui contredit l’hy-
pothèse que E est infini.
∀n ≥ 1, In+1 ⊂ In ,
on a ∩∞
n=1 In 6= ∅.
Théorème 5.2. Pour toute suite décroissante de pavés {Pn } dans Rk , c’est-à-dire,
∀n ≥ 1, Pn+1 ⊂ Pn ,
on a ∩∞
n=1 Pn 6= ∅.
(a) P 0 ⊃ P 1 ⊃ P 2 ⊃ · · · ⊃ P n ⊃ . . . ,
(b) P n ne peu être recouvert par un nombre fini de Gα ,
(c) pour tout x, y ∈ P n , kx − yk ≤ kb − ak/2n .
k
De (a) par le Théorème 5.2, ∩∞ n
n=1 P 6= ∅ et il existe x ∈ R tel que x ∈ P pour
n
kb − ak
∀n > N, < r.
2n
Par la propriété (c), pour tout n > N , P n ⊂ Br (x) ⊂ Gα ce qui contredit (b).
Définition 5.1.
Un sous-ensemble E de Rk est borné si E = ∅ ou
10. Heine est surtout connu pour le théorème de Heine-Borel en 1872 dont l’historique débute
au XIXème siècle avec la recherche de bases solides pour l’anayse réelle. L’élément central de la
théorie était la notion de continuité uniforme et le théorème qui dit que toute fonction continue sur
un intervalle fermé est uniformément continue. Dirichlet fut le premier à le démontrer en utilisant
implicitement l’existence d’un sous-recouvrement fini d’un recouvrement ouvert d’un intervalle
fermé dans sa démonstration. Il utilisa cette démonstration dans ses conférences de 1862 (qui
furent publiées seulement en 1904) avant que Heine ne le démontre en 1872. Plus tard, Eduard
Heine, Karl Weierstrass et Salvatore Pincherle utilisèrent des techniques semblables. Émile Borel
en 1895 fut le premier à formuler et à démontrer une forme de ce qui est maintenant appelé le
théorème de Heine-Borel. Sa formulation était limitée à des recouvrements dénombrables. Lebesgue
(1898) et Schoenflies (1900) le généralisèrent à des recouvrements arbitraires.
11. Professeur à la Faculté des sciences de Paris, spécialiste de la théorie des fonctions et des
probabilités, membre de l’Académie des sciences, a été aussi un homme politique français, député,
et ministre. Avec René Baire et Henri Lebesgue, il était parmi les pionniers de la théorie de la
mesure et de son application à la théorie des probabilités. Le concept de tribu borélienne est nommé
78 Chapitre 3. Topologie et suites dans les espaces métriques
Démonstration. (i) ⇒ (ii). Comme E est borné, il existe un pavé P tel que E ⊂ P .
Comme P est fermé et que P est compact, alors E est compact par le Théorème
4.3.
(ii) ⇒ (iii). Par le Théorème 4.5.
(iii) ⇒ (i). Par l’absurde. Si E n’était pas borné, pour chaque n ≥ 1, il
existerait xn ∈ E tel que kxn k > n. Le sous-ensemble de S = {xn : n ≥ 1} de E
est infini. Si S avait un point d’accumulation x, alors, par le Théorème 3.4 (i), pour
tout r > 0 la boule Br (x) contiendrait un nombre infini de points de S. Mais ceci
n’est pas possible car, si x ∈ S ′ , alors
en son honneur. Dans l’un de ses livres sur les probabilités, il présente l’amusante expérience de
pensée connue sous le nom paradoxe du singe savant ou analogues. Il a également édité un certain
nombre d’articles de recherche sur la théorie des jeux ainsi qu’un véritable monument sur le jeu
de bridge. Il a créé en 1928, avec le soutien financier des Rockefeller et des Rothschild, le Centre
Mathématique qu’il a nommé Institut Henri-Poincaré (où se trouve maintenant le Centre Émile
Borel), et qu’il a dirigé pendant plus de trente ans.
6. Suites de Cauchy, complétude et complété 79
Définition 6.1.
Soit un espace métrique (X, d).
(i) Une suite dans (X, d) est une application x : N → (X, d). On utilisera la
notation xn = x(n) pour ses éléments et {xn } pour désigner la suite.
(ii) Une suite {xn } est dite d-Cauchy si
∀ε > 0, ∃N > 0 tel que ∀n, m > N, d(xn , xm ) < ε. (6.1)
(iv) Une suite {xn } est d-divergente si elle n’est pas d-convergente :
∀x ∈ X, ∃ε > 0, ∀N, ∃n > N, d(xn , x) ≥ ε.
On peut vérifier que la notion de suite d-Cauchy est intrinsèque alors que celle de
suite convergente ne l’est pas. En effet, la suite xn = 1/n est Cauchy dans R, R+
et R+ . Elle est convergente vers 0 dans R et R+ mais pas dans R+ puisque 0 ∈ / R+ .
La notion de suite d-Cauchy dépend de la métrique d. La même suite peut
être d-Cauchy pour une métrique et ne pas l’être pour une autre métrique.
Toute suite d-convergente dans (X, d) est une suite d-Cauchy, mais la réciproque
n’est pas nécessairement vraie car il n’est pas toujours possible de trouver un point
dans X. On résume quelques propriétés.
Théorème 6.1. Soit un espace métrique (X, d) et {xn } une suite d’éléments de X.
(a) xn → x si et seulement si pour tout r > 0, Br (x) ∩ {xn } contient tous les
éléments de la suite sauf au plus un nombre fini de ses éléments.
(b) Si {xn } converge, elle converge vers un point unique dans X que l’on ap-
pelera la limite de la suite.
(c) Toute suite de Cauchy est bornée.
(d) Toute suite convergente est de Cauchy. En particulier de (c), si {xn }
converge, elle est bornée.
(e) Si x ∈ X est un point d’accumulation de E ⊂ X, alors il existe une suite
{xn } ⊂ E qui converge vers x.
Démonstration. (a) Par définition, pour tout r > 0, il existe N > 0 tel que pour
tout n > N , xn ∈ Br (x) et Br (x) contient tous les points de {xn } sauf au plus les
N premiers. Réciproquement, pour r = ε > 0, soit N le plus grand indice tel que
xN ∈/ Bε (x). Alors, ∀n > N , xn ∈ Bε (x) et d(xn , x) < ε.
(b) Si la suite admettait deux limites distinctes x et x′ , pour ε > 0, aurait
N > 0 et N ′ > 0 tels que
déf
∀n > N = max{N, N ′ }, d(xn , x) < ε et d(xn , x′ ) < ε.
82 Chapitre 3. Topologie et suites dans les espaces métriques
Définition 6.2.
Soient un espace métrique (X, d) et une suite {xn } dans X.
(i) Étant donnée une suite d’entiers naturels {nk } ⊂ N telle que
Remarque 6.1.
Pour tout k ≥ 1, nk ≥ k et nk → +∞ lorsque k → +∞.
Exemple 6.2.
Les suites {1/k 2 }, {1/(2k)}, {1/3k } sont des sous-suites de {1/n} avec
Sinon,
∀i, ∃k i , ∀n ≥ ki , xn 6= si
déf
⇒ ∀i, ∀n ≥ N = max{k1 , . . . , km }, xn 6= si
⇒ ∀n ≥ N , ∀i, 1 ≤ i ≤ m, xn 6= si ⇒ ∀n ≥ N , xn ∈
/ S.
Ceci contredit le fait que {xn : n ≥ 1} = S. On peut donc extraire de la suite {xnk }
une sous-suite de {xn } telle que nk > nk−1 pour tout k ≥ 2.
Si S est infini dans K, alors S possède un point d’accumulation x ∈ K : pour
′
tout k ≥ 1, B1/k (x) ∩ S 6= ∅. On construit une sous-suite de {xn } qui converge
vers x ∈ K comme suit. Pour k = 1, on prend un point arbitraire xn1 ∈ B1′ (x) ∩ S.
′
Pour k = 2, on peut trouver un point xn2 ∈ B1/2 (x) ∩ S tel que n2 > n1 puisque
′
B1/2 (x)∩S contient un nombre infini de points de S. On continue ainsi. À l’étape k,
′ ′
on peut trouver un point xnK ∈ B1/k (x) ∩ S tel que nk > nk−1 puisque B1/k (x) ∩ S
contient un nombre infini de points de S. On a ainsi construit une sous-suite {xnk }
de telle que d(xnk , x) < 1/k. Donc, il existe x ∈ K et une sous-suite {xnk } de {xn }
telle que xnk → x.
(c) Comme {xn } est bornée dans Rk , il existe r > 0 tel que {xn } ⊂ Br (0) ⊂
Br (0). Puisque Br (0) est bornée et compacte, on applique la partie (b).
(d) Soit A l’ensemble des valeurs d’adhérence de {xn } et soit x ∈ X un point
d’accumulation de A, c-à-d., x ∈ A′ . Pour tout r > 0, Br′ (x) ∩ A 6= ∅. Pour
r = 1/(2k), k ≥ 1, il existe x∗k ∈ A tel que d(x∗k , x) < 1/(2k). Pour k = 1, il existe
une sous-suite de {xn } qui converge vers x∗1 . On choisit dans cette sous-suite un
point xn1 tel que d (xn1 , x∗1 ) < 1/2 ce qui donne
Pour k = 2, il existe une sous-suite de {xn } qui converge vers x∗2 . On choisit dans
cette sous-suite un point xn2 tel que n2 > n1 et d (xn2 , x∗2 ) < 1/4 ce qui donne
À l’étape k, il existe une sous-suite de {xn } qui converge vers x∗k . On choisit dans
cette sous-suite un point xnk tel que nk > nk−1 et d (xnk , x∗k ) < 1/(2k) ce qui donne
On a donc construit une sous-suite {xnk } de {xn } qui converge vers x. Par définition,
x ∈ A et A est fermé.
Définition 6.4.
Soit (X, d) un espace métrique. On associe à tout sous-ensemble E
déf
diam (E) = sup d(x, y)
x,y∈E
On peut associer à une suite {xn } les ensembles EN = {xn : n > N }, N ≥ 1. Il est
facile de vérifier à partir des définitions que
lim diam Kn = 0,
n→∞
alors ∩∞
n=1 Kn est un singleton.
En laissant tendre ε vers zéro, diam E ≤ diam E et, en combinant avec la première
inégalité, diam E = diam E .
(b) Par le Corollaire au Théorème 4.4, K = ∩∞
n=1 Kn 6= ∅. Si K n’est pas un
singleton, diam K > 0 et comme K ⊂ Kn :
Théorème 6.4. (i) Soit (X, d) un espace métrique compact. Toute suite de
Cauchy dans X converge vers un point de X. Donc (X, d) est complet.
(ii) Toute suite de Cauchy dans Rk est convergente dans Rk . Donc Rk est
complet.
déf
lim diam EN = 0, EN = {xn : n > N }.
N →∞
Lemme 6.1. Si {xn } et {yn } sont deux suites de Cauchy dans X, alors la suite
{d(xn , yn )} est Cauchy.
Définition 6.5.
Soit (X, d) un espace métrique. Étant données deux suites de Cauchy {xn } et {yn }
dans X : {xn } R {yn } si
lim d(xn , yn ) = 0.
n→∞
Lemme 6.2. Soit (X, d) un espace métrique. Alors R de la Définition 6.5 est une
relation d’équivalence dans S au sens de la Définition 1.4 du Chapitre 2.
0 = d(xn , xn ) → 0.
Elle est symétrique car d(xn , yn ) = d(yn , xn ). Elle est transitive car pour trois suites
{xn }, {yn } et {zn } dans S telles que {xn } R {yn } et {yn } R {zn }
d(xn , zn ) ≤ d(xn , yn ) + d( yn , zn )
⇒ 0 ≤ lim d(xn , zn ) ≤ lim d(xn , yn ) + lim d(xn , yn ) = 0 + 0 = 0.
n→∞ n→∞ n→∞
Notation 6.1.
b = S/R l’ensemble de toutes les classes d’équivalence de suites de
On notera X
Cauchy dans X. Ces classes définissent un partition de l’ensemble S des suites de
Cauchy dans X.
Par symétrie de d,
lim d(x′n , yn′ ) ≤ lim d(xn , yn ) ⇒ lim d(x′n , yn′ ) = lim d(xn , yn ).
n→∞ n→∞ n→∞ n→∞
ˆ B) déf
(A, B) 7→ d(A, b ×X
= lim d(xn , yn ) : X b → R+ (6.6)
n→∞
Par définition {xn } R {yn } et, par le Lemme 1.1 du Chapitre 2, A = B. Récipro-
quement, si A = B, pour tout {xn } ∈ A et {yn } ∈ B, {xn } ∈ B, {xn } R {yn },
ˆ B) = lim d(xn , yn ) = 0.
lim d(xn , yn ) = 0 et d(A,
n→∞ n→∞
b d)
On a vérifié les trois axiomes d’une métrique et (X, ˆ est un espace métrique.
On définit l’applicarion
déf b
x 7→ ϕ(x) = R{x} : X → X. (6.7)
Définition 6.6.
Soit (X, d) un espace métrique. E ⊂ X est dense dans X si tout point de X est un
point d’adhérence de E (ou encore E = X).
b d)
Théorème 6.5. Soit (X, d) un espace métrique. L’espace (X, ˆ est un espace
b
métrique complet et X0 = ϕ(X) est dense dans X.
Démonstration. (i) (X0 est dense dans (X,b d).)
ˆ Soit A ∈ X b et {xn } ∈ A. À chaque
xn ∈ X, on associe la suite constante et sa classe d’équivalence ϕ(xn ) ∈ X0 . Alors,
b d).
la suite ϕ(xn ) converge vers A dans (X, ˆ En effet, pour tout n ≥ 1,
ˆ
d(ϕ(xn ), A) = lim d(xn , xm )
m→∞
et, comme {xn } est Cauchy, pour tout ε > 0 il existe N tel que
∀m, n > N, d(xn , xm ) < ε
ˆ
⇒ ∀n > N, d(ϕ(x n ), A) = lim d(xn , xm ) < ε
m→∞
7. Compacité et compacité séquentielle 89
Comme {An } est Cauchy, pour tout ε > 0, il existe N1 tel que
et il existe N2 tel que pour tout n > N2 , 2−n < ε/3. Donc, pour tout n, m >
max{N1 , N2 }, d(yn , ym ) < ε et la suite {yn } est bien Cauchy. Il existe donc B ∈ Xb
tel que {yn } ∈ B. Il reste à montrer que B est la limite de la suite {An }. En effet,
ˆ An ) ≤ d(B,
d(B, ˆ ϕ(yn )) + d(ϕ(y
ˆ n ), An ) ≤ lim d(ym , yn ) + 2
−n
.
m→∞
Comme {yn } est Cauchy le premier terme du membre de droite tend vers zéro
lorsque n tend vers l’infini. De même pour 2−n . On a donc bien construit un point
B∈X b tel que An → B.
Remarque 6.2.
La construction de Cantor correspond à X = Q et à la métrique
déf
(x, y) 7→ d(x, y) = |x − y| : Q × Q → Q+ = {x ∈ Q : x ≥ 0}.
Bien que la Definition 2.1 de la métrique comme une application (x, y) 7→ d(x, y) :
X × X → R+ présuppose que R ait déjà été construit, la métrique définie plus
haut dans Q reste un rationnel positif ou nul. On n’a donc pas besoin de R. On
peut donc construire Q, b l’ensemble des classes d’équivalence des suites de Cauchy
dans Q. Cependant, dans notre construction, la définition (6.6) de la métrique dˆ
b nécessite la connaissance de R. Il faudrait voir comment G. Cantor [2] a
sur Q
contourné cette difficulté et comment il obtient la propriété (P7) s’il l’obtient.
Définition 7.1.
Un sous-ensemble E d’un espace métrique (X, d) est séquentiellement compact si
E = ∅ ou toute suite {xn } dans E possède une sous-suite {xnk } qui converge vers
un élément x ∈ E.
90 Chapitre 3. Topologie et suites dans les espaces métriques
Définition 7.2.
Soit (X, d) un espace métrique. Un sous-ensemble E de X est précompact si E = ∅
ou si, pour chaque r > 0, il existe un nombre fini {x1 , x2 , . . . , xnr } de points de E
tel que
E ⊂ ∪ni=1
r
Br (xi ) (7.1)
ou, de façon équivalente, si, pour tout r > 0, on peut recouvrir E par un nombre
fini de parties de E de diamètre inférieur à r.
Théorème 7.1. Soit E un sous-ensemble d’un espace métrique (X, d). E est sé-
quentiellement compact si et seulement si E est précompact et complet.
Démonstration. Si E = ∅, il n’y a rien à démontrer. On suppose donc que E 6= ∅.
(⇒) (E précompact.) Par l’absurde. On suppose que, pour un certain r > 0,
aucune union finie de boules de rayon r ne recouvre E. On construit la suite {xn }
de points de E suivante. On prend x1 ∈ E et
∀n ≥ 1, / ∪nk=1 Br (xk ) .
xn+1 ∈ E tel que xn+1 ∈
∀m 6= n ≥ 1, d(xm , xn ) ≥ r.
Cette suite ne peut donc pas avoir de sous-suite convergente, ce qui contredit l’hy-
pothèse de compacité séquentielle de E.
(E complet.) Si {xn } est une suite de Cauchy dans E, il existe x ∈ E et une
sous-suite qui converge vers x. Comme la suite est de Cauchy toute la suite converge
vers x ∈ E et E est complet.
(⇐) Soit une suite {xn } ⊂ E et S = ∪∞ n=1 {xn } l’ensemble des points de la
suite. Si S = {s1 , . . . , sm } est fini, alors il existe si ∈ S et une sous-suite constante
xnk = si tel que xnk → si lorsque k → ∞ (même démonstration que pour le
Théorème 6.2 (b)).
Considérons le cas S infini. Comme E est précompact, pour tout r > 0, il existe
un ensemble fini de points de E tel que E soit recouvert par les boules ouvertes de
rayon r centrées en ces points. Une de ces boules contient donc un nombre infini de
points de S. On procède alors à la construction suivante :
déf
r = 1/2, ∃y1 ∈ E tel que S1 = B1/2 (y1 ) ∩ S infini
déf
r = 1/22 , ∃y2 ∈ E tel que S2 = B1/22 (y2 ) ∩ S1 infini
...
déf
r = 1/2k , ∃yk ∈ E tel que Sk = B1/2k (yk ) ∩ Sk−1 infini.
7. Compacité et compacité séquentielle 91
1 1 1
d(xnk , xnk+1 ) ≤ d(xnk , yk ) + d(yk , xnk+1 ) < k
+ k = k−1 .
2 2 2
Cette sous-suite est de Cauchy. En effet, pour k ′ > k,
′ ′
kX −1 kX −1
1 1
d(xnk′ , xnk ) ≤ d(xni+1 , xni ) ≤ < k−2 .
2i−1 2
i=k i=k
Donc pour tout ε > 0, il existe K tel que, pour tout k, k ′ > K, d(xnk′ , xnk ) < ε.
Comme E est complet cette sous-suite {xnk } de {xn } converge vers un point x ∈ E
et E est bien séquentiellement compact.
∃r > 0, ∀x ∈ E, ∃α ∈ A, Br (x) ⊂ Gα .
Les rayons r > 0 qui jouissent de cette propriété sont appellés les nombres de
Lebesgue du recouvrement ouvert {Gα }α∈A .
1
∀y ∈ B1/nk (xnk ), d(y, x) ≤ d(y, xnk ) + d(xnk , x) < + d(xnk , x)
nk
∀ε > 0, ∃K1 tel que ∀k > K1 , d(xnk , x) < ε/2
1
∃K > K1 tel que < ε/2
nK
⇒ ∀y ∈ B1/nK (xnK ), d(y, x) ≤ d(y, xnK ) + d(xnK , x) < ε
⇒ B1/nK (xnK ) ⊂ Bε (x) ⊂ Gαx
Remarque 7.1.
L’implication (iii) ⇒ (i) est la réciproque du Theorem 4.5 page 74.
D’après le Théorème 7.1, E est recouvert par un nombre fini de boules de rayon r,
c’est-à-dire, il existe une partie finie {x1 , x2 , . . . , xn } ⊂ E telle que E ⊂ ∪ni=1 Br (xi )
ce qui donne
Exemple 7.1.
En général, un sous-ensemble borné et fermé d’un espace métrique n’est ni séquen-
tiellement compact ni compact. L’exemple classique est celui de l’espace métrique
ℓ2 des suites x = (x1 , x2 , . . . ) : xi ∈ R, i ≥ 1, de carré sommable :
( ∞
) "∞ #1/2
déf
X X
ℓ2 = x = (x1 , x2 , . . . ) : |xi |2 < ∞ , d(x, y) = |xi − y i |2 .
i=1 i=1
2
On considère la sphère de rayon un et de centre 0 dans ℓ
déf
E = {x ∈ ℓ2 : d(x, 0) = 1}
et la suite {xn } ⊂ E telle que (xn )k = δnk . Par définition, E ⊂ B2 (0) et E est borné.
Pour montrer que E est fermé, on montre que son complément est ouvert. En effet,
pour tout x ∈ ℓ2 tel que d(0, x) 6= 1, ou bien d(0, x) < 1 et on a B1−d(0,x) (x) ⊂ ∁E ;
ou bien d(0, x) > 1 et on a Bd(0,x)−1 (x) ⊂ ∁E. On vérifie que
√
∀m 6= n, d(xm , xn ) = 2
8. Ensembles parfaits 93
Définition 7.3.
Soit (X, d) un espace métrique. (X, d) est séparable s’il contient un sous-ensemble
dense dénombrable.
8 Ensembles parfaits
Définition 8.1.
Soit (X, d) un espace métrique. Un sous-ensemble E de X est parfait si E est fermé
et ne contient aucun point isolé.
Remarque 8.1.
Comme pour tout fermé on a E = E = E ′ ∪ E\E ′ et qu’il n’y a pas de points isolés,
il vient E = E = E ′ et E = E ′ . Réciproquement, si E = E ′ , alors E est parfait
puisque E ′ est un ensemble fermé (voir Exercice 10.8) et que l’ensemble des points
isolés E\E ′ est vide.
1 d(x2 , x1 ) ≥ 2r2
r2 = min {d(x2 , x1 ), r1 − d(x2 , x1 )} > 0 ⇒
2 0 < d(x2 , x1 ) ≤ r1 − 2r2 .
16. dp , 1 ≤ p ≤ ∞, est la métrique associée aux normes définies au Théorème 1.2 page 51.
94 Chapitre 3. Topologie et suites dans les espaces métriques
Comme x2 est un point d’accumulation de E, Br′ 2 (x2 )∩E 6= ∅ et il existe des points
de E dans la boule trouée. On saute dans l’ordre en commençant par sn2 +1 tous les
points de la suite {sn } qui ne sont pas dans Br′ 2 (x2 ). Soit x3 = sn3 le premier point
de la suite {sn } qui se trouve dans Br′ 2 (x2 ). En particulier, x3 6= x2 . On choisit le
rayon
1 d(x3 , x2 ) ≥ 2r3
r3 = min {d(x3 , x2 ), r2 − d(x3 , x2 )} > 0 ⇒
2 0 < d(x3 , x2 ) ≤ r2 − 2r3 .
∅ 6= K = ∩∞
k=1 Kk ⊂ E.
car ∩∞
k=1 Brk (xk ) ne contient aucun point de E.
Le nombre d’intervalles distincts dans l’union est donc au plus dénombrable. Enfin,
comme on sait que si r 6= r′ sont deux points de G ∩ Q on a Ir ∩ Ir′ = ∅ ou Ir = Ir′ ,
il suffit de retenir les indices correspondant à des intervalles disjoints.
Contrairement à ce que l’on pourrait penser, un fermé n’est pas la réunion
d’une famille au plus dénombrable d’intervalles fermés. L’ensemble de Cantor est
un sous-ensemble parfait de l’intervalle [0, 1]. C’est donc un fermé qui n’est pas la
réunion dénombrable d’une famille d’intervalles fermés disjoints (ici des intervalles
triviaux ne contenant qu’un point).
0 1/3 2/3 1
ouvert médian de E0
1 2
,
3 3
pour obtenir le nouveau fermé
déf déf 1 déf 2 1
E1 = I11 ∪ I12 ⊂ E0 , I11 = 0, et I12 = ,1 , |I1,k | =
3 3 3
96 Chapitre 3. Topologie et suites dans les espaces métriques
qui lui aussi est compact. Ensuite, on enlève les intervalles ouverts médians de I11
et I12 . Chacun laisse deux nouveaux intervalles fermés de longueur 3−2
déf 1 déf 2 3 déf 6 7 déf 8
I21 = 0, , I22 = , , I23 = , et I24 = ,1
9 9 9 9 9 9
pour obtenir le nouveau fermé
déf 1
E2 = I21 ∪ I22 ∪ I23 ∪ I24 ⊂ E1 , |I2,k | =
32
qui lui aussi est compact. À l’étape n, on enlève encore l’ouvert médian de chaque
intervalle I(n−1)k , 1 ≤ k ≤ 2n−1 , ce qui laisse deux nouveaux intervalles fermés de
longueur 3−n pour obtenir le nouveau fermé
2n
[
déf 1
En = Ink ⊂ En−1 , |Ink | = n
3
k=1
comme union finie des intervalles fermés Ink . En est donc compact. L’ensemble
∞
\
déf
C = En
n=1
Exemple 9.1.
1) Les intervalles [0, 1] et ]1, 2] ne sont pas séparés.
2) R, Rk , les intervalles [a, b], ]a, b], [a, b[ , et ]a, b[ dans R sont connexes.
3) Q et l’ensemble à deux éléments {0, 1} ne sont pas connexes.
Théorème 9.1. Soit E un sous-ensemble d’un espace métrique (X, d). Les pro-
priétés suivantes sont équivalentes :
(i) E est la réunion de deux ensembles séparés non-vides de (X, d) ;
(ii) E est la réunion de deux ouverts de (E, d) 17 non-vides et disjoints ;
(iii) il existe un sous-ensemble G, ∅ 6= G $ E, qui soit à la fois fermé et
ouvert 18 dans (E, d).
Démonstration. (i) ⇒ (ii) E est la réunion A ∪ B de deux ensembles séparés A et
B non-vides. Alors,
)
A ∩ B = ∅ ⇒ ∅ 6= A ⊂ E\B
⇒ E = A ∪ B = E\B ∪ E\A .
B ∩ A = ∅ ⇒ ∅ 6= B ⊂ E\A
E est donc la réunion de deux ouverts non-vides par rapport à la topologie induite
sur (E, d). En effet, par le Théorème 3.3, E\B = E ∩ [X\B] est l’intersection de E
et de l’ouvert X\B dans (X, d). Même chose pour E\A. Quant à leur intersection
E\B ∩ E\A = E\(A ∪ B) ⊂ E\(A ∪ B) = ∅.
17. Ouverts par rapport à la topologie induite (ou relative) sur (E, d).
18. Ouverts et fermés par rapport à la topologie induite (ou relative) sur (E, d).
98 Chapitre 3. Topologie et suites dans les espaces métriques
E = G ∪ (E\G) et G ∩ (E\G) = ∅.
Comme G est ouvert et fermé dans (E, d), le complément E\G est fermé et ouvert
dans (E, d). Par le Théorème 3.3, il existe des ouverts O et O′ dans (X, d) tel que
G=E∩O et E\G = E ∩ O′
⇒ E\G = E ∩ (X\O) et G = E ∩ (X\O′ ).
Ces ensembles sont séparés car pour les fermetures dans (X, d)
puisque X\O et X\O′ sont fermés dans (X, d) comme compléments des ouverts O
et O′ . On a utilisé le fait que A ∩ B ⊂ A ∩ B par le Théorème 3.10 (ii). G et E\G
sont donc séparés.
En prenant systématiquement le contraire de chaque propriété, on obtient des
conditions équivalentes pour la connexité.
Corollaire 1. Soit E un sous-ensemble d’un espace métrique (X, d). Les propriétés
suivantes sont équivalentes :
(i) E est connexe dans (X, d) (Définition 9.1 (ii)) ;
(ii) E n’est pas la réunion de deux sous-ensembles non-vides, disjoints et ou-
verts dans (E, d) 19 (Définition 9.2) ;
(iii) les seuls sous-ensembles de E qui soient à la fois fermés et ouverts 20 dans
(E, d) sont ∅ et E.
Remarque 9.1.
Dans la Définition 9.1 (ii), on travaille avec des adhérences dans (X, d), alors que
pour l’autre définition, les ouverts sont par rapport à la topologie induite sur (E, d)
et non par rapport à celle de (X, d). La notion de connexité est donc, comme celles
de compacité et de bornitude, une notion intrinsèque.
Exemple 9.2.
On considère l’ensemble à deux éléments X = {0, 1} dans R avec la métrique
d(x, y) = |x − y|. Les ensembles ∅ et X sont ouverts et fermés. Les ensembles
{0} et {1} sont ouverts car B1/2 (0) = {0} et B1/2 (1) = {1}. Ils sont fermés car les
compléments des ouverts {0} et {1}
Exemple 9.3.
On considère dans R2 le sous-ensemble X = B1 (0, 0) ∪ B1 (3, 3). Les deux boules
sont non-vides, disjointes et sont des ensembles ouverts dans (X, d). L’espace X
n’est donc pas connexe. De plus, par complémentarité, B1 (0, 0) = X\B1 (3, 3)
et B1 (3, 3) = X\B1 (0, 0) sont fermées dans (X, d) par le Théorème 3.5 et, par
conséquent, ouvertes et fermées dans (X, d) sans être égales à ∅ ou X. Attention,
elles ne seraient pas fermées dans (R2 , d).
Définition 9.3.
Soit (X, +, ×) un espace vectoriel sur R au sens de la Définition 1.1 du Chapitre 2.
(i) E ⊂ X est convexe si
∀x, y ∈ A, ∀α ∈ R, α × x + (1 − α) × y ∈ A. (9.3)
Remarque 9.2.
Dire que E est convexe revient à dire que, pour toute paire de points x, y, x 6= y,
déf
dans E, le segment [x, y] = {λx + (1 − λ)y : 0 ≤ λ ≤ 1} est contenu dans E.
La boule Br (x) dans Rn est convexe. Les sous-espaces affines et les sous-espaces
linéaires sont des convexes.
Le lecteur attentif pourra s’apercevoir que la partie (⇐) de la démonstration
du Théorème 9.2 peut servir à démontrer le résultat général intuitif suivant.
Théorème 9.3. Soit (X, +, ×) un espace vectoriel normé sur R au sens de la
Définition 1.1 du Chapitre 2. Alors tout partie convexe de X est connexe.
Démonstration. Par l’absurde. Supposons que E ne soit pas connexe. On peut alors
trouver deux ensembles séparés A et B non vides tels que E = A ∪ B, A ∩ B = ∅
et A ∩ B = ∅. En particulier, A ∩ B = ∅ et il existe x ∈ A et y ∈ B tel que x 6= y.
On considère le segment [x, y] = {λx + (1 − λ)y; 0 ≤ λ ≤ 1}. On peut sans perte de
généralité orienter ce segment de façon que x < y. En posant
déf
zA = sup (A ∩ [x, y])
∀a ∈ A, A = a + S.
10 Exercices
Exercice 10.1 (W. Rudin [1, exercice 17, p. 22]).
Soient x, y ∈ Rk . Établir que
Exercice 10.3.
Soit R+ = {x ∈ R : x ≥ 0}.
102 Chapitre 3. Topologie et suites dans les espaces métriques
(i) Montrer que, pour tout espace métrique (X, d) et pour toute constante
α > 0, la fonction
déf
(x, y) 7→ (αd)(x, y) = α d(x, y)
déf d(x, y)
(x, y) 7→ d(x, y) =
1 + d(x, y)
et, en plus,
d1 (x, y) = 0 ⇒ x = y. (10.4)
Exercice 10.4.
Soient (Xi , di ), 1 ≤ i ≤ n, des espaces métriques et
déf
X1 × · · · × Xn = {(x1 , . . . , xn ) : xi ∈ Xi } (10.5)
Exercice 10.5.
Soit E un espace vectoriel normé au sens des Définitions 1.1 et 1.4 du Chapitre 2.
Montrer que
déf
d(x, y) = kx − yk
Bn = ∪ni=1 Ai et B = ∪∞
i=1 Ai .
Démontrer que
∀n ≥ 1, Bn = ∪ni=1 Ai et B ⊃ ∪∞
i=1 Ai .
Exercice 10.13.
On considère l’ensemble à deux éléments {0, 1} dans R équipé d’une métrique arbi-
traire d (il en existe au moins une : d(x, y) = |x − y|).
(i) Énumérer tous les ouverts de ({0, 1}, d). Justifier.
(ii) Énumérer tous les compacts de ({0, 1}, d). Justifier.
(iii) Est-ce que ({0, 1}, d) est complet ? Justifier.
(iv) Énumérer tous les fermés de X = {0, 1, 2} pour une métrique arbitraire
dX sur X. Justifier.
Exercice 10.15.
Soit X = R muni de la métrique d(x, y) = |x − y|.
(i) Montrer que l’application
déf x
x 7→ ϕ(x) = : R → ] − 1, 1[ (10.8)
1 + |x|
est une bijection.
(ii) Vérifier que
déf x y
dϕ (x, y) = d(ϕ(x), ϕ(y)) = − (10.9)
1 + |x| 1 + |y|
est une métrique sur R.
(iii) Vérifier que la suite {n}, n ≥ 1, est dϕ -Cauchy, mais pas d-Cauchy.
Montrer que ∩∞
n=1 En est un singleton.
10. Exercices 105
Définition 1.1.
Soit une fonction f : X → Y , l’ensemble P(X) des sous-ensembles de X et l’en-
semble P(Y ) des sous-ensembles de Y .
(i) À chaque A ⊂ X, on associe l’image de A par f
déf
f (A) = {f (x) : x ∈ A} ⊂ Y. (1.1)
107
108 Chapitre 4. Fonctions, limites et continuités
Un exemple pour lequel f (A1 ∩ A2 ) $ f (A1 ) ∩ f (A2 ) dans la partie (2) est la
fonction x 7→ f (x) = 1 : R → R avec A1 = [0, 1] et A2 = [2, 3]. En effet, A1 ∩A2 = ∅,
f (A1 ∩ A2 ) = ∅ et f (A1 ) ∩ f (A2 ) = {1}.
et, en particulier,
f f −1 (B) = f (X) ∩ B. (1.6)
∀ε > 0, ∃δ > 0 tel que ∀x ∈ E , 0 < dX (x, a) < δ, dY (f (x), y) < ε. (2.1)
On dira que y est la limite 1 de f en a par rapport à E et on l’écrira
lim f (x) ou simplement lim f (x) (2.2)
x→a x→a
E
Remarque 2.1.
Pour une fonction f : (X, dX ) → (Y, dY ), il ne faut pas confondre la Définition 2.1
de la limite en a ∈ E ′ de f : E → (Y, dY ) avec celle (plus forte) de limite en a ∈ E ′
de f : X → (Y, dY )
lim f (x) (2.3)
x→a
X
qui signifie
∀ε > 0, ∃δ > 0 tel que ∀x ∈ X , 0 < dX (x, a) < δ, dY (f (x), y) < ε, (2.4)
où l’on approche du point a non seulement par des points x de E mais aussi par
des points dans le plus gros ensemble X.
1. C’est K. Weierstrass qui le premier introduisit la définition epsilon-delta de la limite d’une
fonction de la manière qu’elle est écrite de nos jours. Il introduisit aussi la notation lim et limx→a
(voir l’histoire des mathématiques de D. Burton [1, pp. 558–559]).
110 Chapitre 4. Fonctions, limites et continuités
Exemple 2.1.
Soient X = R2 , E = B1 (0, 0), a ∈ R2 tel que kak = 1 et la fonction
(
déf 1, si x ∈ B1 (0, 0),
f (x) =
0, si x ∈ R2 \B1 (0, 0).
Cette fonction n’a pas de limite en a dans R2 , mais elle en a une dans B1 (0, 0)
lim f (x) = 1 6= 0 = f (a).
x → a
B1 (0,0)
y f (a) = y
f (a) f (a)
a a a
Exemple 2.2.
La fonction de Dirichlet 2 sur R
(
déf 0, si x ∈ Q
f (x) =
1, si x ∈ R \ Q
une contradiction.
si et seulement si
et limn→∞ f (xn ) = y.
(⇐). Par l’absurde. Supposons
Pour chaque n ≥ 1,
On obtient bien une suite {xn } ⊂ E, xn 6= a, qui converge vers a mais pour laquelle
f (xn ) ne converge pas vers y en contradiction avec notre hypothèse.
112 Chapitre 4. Fonctions, limites et continuités
Corollaire 1. Si f admet une limite en a par rapport à E, cette limite est unique.
Démonstration. Supposons qu’il existe deux limites y1 et y2 . Par le théorème, il
existerait une suite {xn } ⊂ E, xn 6= a, qui converge vers a tel que
1.5
0.5
-0.5
-1
-1.5
Exemple 2.3.
déf
Soit la fonction x 7→ f (x) = sin(1/x) : R \{0} → R. On prend les suites
π
déf 2 1
x+
n = →0 ⇒ f (x+ n ) = sin + 2nπ = 1
π 4n + 1 2
2 1 π
déf
x−
n = → 0 ⇒ f (x−
n ) = sin − + 2nπ = −1.
π 4n − 1 2
f (x) n’a donc pas de limite en x = 0.
Définition 2.2.
Soit (X, d) un espace métrique.
(i) Une fonction f : (X, d) → R est dite fonction à valeurs réelles.
(ii) Une fonction f : (X, d) → C est dite fonction à valeurs complexes.
(iii) Pour k ≥ 1, on dira que f : (X, d) → Rk et f : (X, d) → Ck sont des
fonctions à valeurs vectorielles.
2. Limite d’une fonction 113
Pour les fonctions à valeurs vectorielles, on peut définir les opérations suivantes :
déf déf déf
(f + g)(x) = f (x) + g(x), (f · g)(x) = f (x) · g(x), (λ f )(x) = λ f (x) (2.9)
pour λ ∈ R.
Théorème 2.2. Soient f, g : (X, d) → C, E ⊂ X, a ∈ X un point d’accumulation
de E et y et z dans C tel que
lim f (x) = y et lim g(x) = z.
x→a x→a
Alors,
(a) limx→a (f + g)(x) = y + z ;
(b) limx→a (f g)(x) = y z ;
(c) limx→a (f /g) (x) = y/z si z 6= 0.
Si f et g étaient des fonctions à valeurs vectorielles, on aurait
(a) limx→a (f + g)(x) = y + z,
(b) limx→a (f · g)(x) = y · z,
en raisonnant composante par composante.
Définition 2.3.
Soit f : R → (Y, d).
(i) Soit E un sous-ensemble de R qui n’est pas borné supérieurement. On dit
f tend vers y ∈ Y lorsque x ∈ E tend vers +∞ si
∀ε > 0, ∃M tel que ∀x ∈ E, x > M, dY (f (x), y) < ε. (2.10)
On écrira
lim f (x) = y ou lim f (x) = y. (2.11)
x→ +∞ x→ +∞
E
Comme g(ε) est l’infimum de f sur l’ensemble non-vide Bε′ (a) ∩ E, il est égal à un
réel ou à −∞. La fonction g(ε) est monotone croissante lorsque ε tend vers 0 car
lim g(ε)∈ R,
εց0
Définition 2.4.
Soient (X, d) un espace métrique, E, ∅ 6= E ⊂ X, a ∈ E ′ est un point d’accumula-
tion de E, et f : E → R.
(i) On appelle limite inférieure de f lorsque x tend vers a dans E la quantité
déf
lim inf f (x) = sup inf f (x).
x→a ε>0 x∈Bε′ (a)∩E
E
3 Fonctions continues
3.1 Définitions et propriétés
Définition 3.1.
Soient
- (X, dX ) et (Y, dY ) deux espaces métriques et
- E un sous-ensemble non-vide de X.
(i) Une fonction f : (E, dX ) → (Y, dY ) est continue en a ∈ E si
∀ε > 0, ∃δ > 0 tel que ∀x ∈ E , dX (x, a) < δ, dY (f (x), f (a)) < ε. (3.1)
(ii) Une fonction f : (E, dX ) → (Y, dY ) est continue sur E si f est continue en tout
point de E.
Remarque 3.1.
Il aurait été suffisant de donner la définition pour E = X, mais on a voulu mettre
l’accent sur une ambiguı̈té possible pour une fonction f : X → R lorsque E ( X.
En effet, la continuité par rapport à (X, d),
∀ε > 0, ∃δ > 0 tel que ∀x ∈ X , dX (x, a) < δ, dY (f (x), f (a)) < ε, (3.2)
implique la continuité par rapport à (E, d), mais la réciproque n’est en général pas
vraie. Par exemple, si l’on considère la fonction
( )
déf 1, kxk ≤ 1
x 7→ f (x) = : Rk → R
0, kxk > 1
Remarque 3.2.
La métrique d : (X × X, d1 ) → R est continue lorsque l’espace produit X × X est
muni de la métrique (voir l’Exercice 10.4 du Chapitre 3)
déf
d1 ((x, y), (x′ , y ′ )) = d(x, x′ ) + d(y, y ′ ).
116 Chapitre 4. Fonctions, limites et continuités
Pour chaque n ≥ 1,
On obtient bien une suite {xn } ⊂ E qui converge vers a mais pour laquelle f (xn )
ne converge pas vers f (a) en contradiction avec notre hypothèse.
Par définition de la continuité, toute fonction f est continue en un point isolé de E.
En effet, a ∈ E est un point isolé de E s’il existe r > 0 tel que Br′ (a) ∩ E = ∅. Donc,
pour tout δ, 0 < δ ≤ r, Bδ (a) = {a} et f (a) − f (a) = 0 ce qui trivialement donne la
continuité en a. La continuité n’a donc à être vérifiée qu’aux points d’accumulation
de E. Des Théorèmes 2.1 et 3.1 on a le résultat suivant.
Corollaire 1. Soient (X, dX ) et (Y, dY ) deux espaces métriques, E un sous-ensemble
de X et f : (E, dX ) → (Y, dY ). Si a ∈ E est un point d’accumulation de E, c’est-à-
dire, a ∈ E ∩ E ′ , alors f est continue en a ∈ E si et seulement si
Démonstration. Soit ε > 0. Comme g est continue en f (a), il existe η > 0 tel que
∀y ∈ f (E) tel que dY (y, f (a)) < η, dZ (g(y), g(f (a)) < ε.
et g ◦ f est continue en a.
Théorème 3.3. Soient (X, dX ) et (Y, dY ) deux espaces métriques et une fonction
f : (X, dX ) → (Y, dY ). Les propriétés suivantes sont équivalentes.
(i) f est continue sur X.
(ii) Pour tout A ⊂ X, on a f (A) ⊂ f (A).
(iii) Pour tout B ⊂ Y , on a f −1 (B) ⊂ f −1 (B).
(iv) ∀ F un fermé dans Y , f −1 (F ) est un fermé dans X.
(v) ∀ O un ouvert dans Y , f −1 (O) est un ouvert dans X.
par le Théorème 1.2 (2). Comme b ∈ A, on a Bδ (b) ∩ A 6= ∅ et, a fortiori, f (Bδ (b) ∩
A) 6= ∅ ce qui entraı̂ne Bε (f (b)) ∩ f (A) 6= ∅ tel que désiré.
118 Chapitre 4. Fonctions, limites et continuités
f −1 (F ) ⊂ f −1 (F ) ⊂ f −1 (F ) = f −1 (F ) ⇒ f −1 (F ) = f −1 (F )
| {z }
et f −1 (F ) est fermé.
(iv) ⇒ (v) Pour tout ouvert O ⊂ Y , Y \O est fermé et
par le Théorème 1.3 (2). Mais f (Bδ (a)) ⊂ Bε (f (a)) est la forme ensembliste de la
définition (ε, δ) de la continuité en a.
Comme pour la notion de limite, les opérations suivantes sont permises pour
les fonctions continues à valeurs réelles ou complexes.
Théorème 3.4. Soient f, g : (X, d) → C ou R des fonctions continues sur X. Alors
(a) f + g est continue sur X ;
(b) f g est continue sur X ;
(c) f /g est continue sur X si g(x) 6= 0 pour tout x ∈ X.
Pour des fonctions à valeurs vectorielles f, g : (X, d) → Ck ou Rk continues sur X,
(a) f + g est continue sur X ;
(b) f · g est continue sur X.
3. Fonctions continues 119
k
Même chose pour C :
1/2
k
X
dC (pi (y), pi (z)) = |pi (y) − pi (z)| ≤ |pj (y) − pj (z)|2 = dCk (y, z).
j=1
et f est continue en x.
En combinant ce théorème et le Théorème 3.4 qui dit que les sommes, produits
et multiplication par un scalaire de fonctions continues sont continus, on en déduit
que les fonctions polynômiales de la forme
k
X
P (x) = cn1 ,...,nk xn1 1 . . . xnk k
i=1
120 Chapitre 4. Fonctions, limites et continuités
pour des entiers ni positifs ou nuls sont continues sur Rk . Plus généralement les
fonctions rationnelles
P (x)
f (x) = , Q(x) 6= 0, (3.6)
Q(x)
pour deux fonctions polynômiales P et Q sont continues aux points x tels que
Q(x) 6= 0.
Enfin, la norme sur Rk
x 7→ kxk : Rk → R (3.7)
x 7→ kf (x)k : Rk → R (3.8)
Définition 3.3.
Soit f : (X, dX ) → (Y, dY ) une bijection.
(i) On dit que f est un homéomorphisme si f est continue sur X et f −1 est
continue sur Y . On écrira f : X ∼
=Y.
(ii) On dit que deux espaces (X, dX ) et (Y, dY ) sont homéomorphes s’il existe
un homéomorphisme f entre X et Y . On écrira X ∼ = Y.
Exemple 3.1.
P 1/2
déf k
Pour k ≥ 1 on introduit la norme euclidienne kx − ykRk = i=1 |xi − yi |2 et
déf
la métrique dRk (x, y) = kx − ykRk . L’application
déf x
x 7→ ϕ(x) = : (Rk , dRk ) → (B1 (0), dRk ) (3.9)
1 + kxkRk
3. Fonctions continues 121
Exemple 3.2.
Avec la même norme et métrique de l’Exemple 3.3 sur Rk , k = 2, 3, soit p = (0, 0, 1)
le pôle nord de la sphère
q
déf
S 2 = x ∈ R3 : kxkR3 = x21 + x22 + x23 = 1 ⊂ R3 .
Théorème 3.6. Soit f : (X, dX ) → (Y, dY ) une bijection. Les propriétés suivantes
sont équivalentes :
(i) f est un homéomorphisme ;
(ii) f est continue et ouverte ;
(iii) f est continue et fermée ;
(iv) pour tout A ⊂ X, f (A) = f (A).
Démonstration. (i) ⇒ (ii) Du Théorème 3.3, comme f −1 est continue pour tout
ouvert O dans X,
(ii) ⇒ (iii) Du Théorème 3.3, comme f = (f −1 )−1 est ouverte, f −1 est conti-
nue. Du même théorème, pour tout fermé F dans X
(iii) ⇒ (iv) Comme f est continue on a du Théorème 3.3 f (A) ⊂ f (A). Comme
f est fermée, on a aussi f (A) fermé. Donc
(iv) ⇒ (i) Comme pour tout A ⊂ X, f (A) ⊂ f (A), f est continue par le
Théorème 3.3. Pour établir la continuité de f −1 , il suffit de montrer que pour tout
fermé F ⊂ X, (f −1 )−1 (F ) = f (F ) est fermé. En faisant A = F , on a f (F ) =
f (F ) = f (F ) et f (F ) est fermé dans Y .
On peut facilement vérifier le résultat suivant à partir du Théorème 1.6.
Théorème 3.7. Soient f : (X, dX ) → (Y, dY ) et g : (Y, dY ) → (X, dX ) deux
applications continues tel que g ◦ f = IX et f ◦ g = IY . Alors f est bijective,
g = f −1 et f est un homéomorphisme.
Définition 3.5 (J. Dugundji [1, Déf. 3.1 et Th. 3.2, sec. 3, Chapitre IX, p. 184]).
Soient deux métriques d1 et d2 sur l’espace X. On dit que d1 et d2 sont équivalentes si les topologies
T (d1 ) et T (d2 ) sont équivalentes (T (di ) = l’ensemble de tous les ouverts dans (X, di )).
3. Fonctions continues 123
Exemple 3.3.
On a montré au Théorème 1.2 du Chapitre 3 que les fonctions
" k
#1/p
déf
X déf
p
dp (x, y) = |xi − yi | , p ≥ 1 un entier, d∞ (x, y) = max |xi − yi |,
1≤i≤k
i=1
sont toutes des métriques sur Rk . Pour montrer qu’elles sont toutes équivalentes, il
suffit de montrer l’équivalence des normes. Pour 1 ≤ p, q < ∞ et x ∈ Rk
k
" k #1/p " k #1/q " k #1/p
X X X X
p p p q p
∀i, |xi | ≤ |xi | ⇒ |xi | ≤ |xi | ⇒ |xi | ≤ |xi | k 1/q
i=1 i=1 i=1 i=1
1/q 1/p
⇒ kxkp ≤ k kxkq et kxkq ≤ k kxkp .
On voit que les δp et δq ne dépendent que de ε. Cette continuité est plus forte que la
simple continuité. En particulier, l’homéomorphisme x 7→ IRk (x) = x : (Rk , dp ) →
(Rk , dq ) transporte les suites de Cauchy en suites de Cauchy puisque pour tous
1 ≤ p, q ≤ ∞
déf x
x 7→ ϕ(x) = : (Rk , dRk ) → (B1 (0), dRk ) (3.13)
1 + kxkRk
f : (X, d1 ) → (Y, dY )
f : (X, d2 ) → (Y, dY )
Exemple 3.5 (Exemple 6.1 du Chapitre 3 page 81 et les Exemples 3.1 et 3.4).
Soit d(x, y) = |x − y| la métrique sur X = R et la bijection
déf x
x 7→ ϕ(x) = : R → ] − 1, 1[ (3.16)
1 + |x|
qui a pour inverse
déf y
y 7→ ϕ−1 (y) = : ] − 1, 1[ → R . (3.17)
1 − |y|
Les fonctions ϕ et ϕ−1 sont continues comme quotients de deux fonctions continues
dont le dénominateur ne s’annulle pas. La fonction ϕ est donc un homéomorphisme
par le Théorème 3.7.
On a vu dans l’Exemple 6.1 du Chapitre 3 que la fonction
déf x y
dϕ (x, y) = d(ϕ(x), ϕ(y)) = − (3.18)
1 + |x| 1 + |y|
est aussi une métrique sur R. L’application identité
déf
x 7→ I(x) = x : (R, d) → (R, dϕ ) (3.19)
qui est donc une bijection continue dans les deux sens et les deux métriques d et dϕ
sont équivalentes sur R au sens de la Définition 3.4. En effet, comme ϕ est continue,
x y
∀ε > 0, ∃δ1 > 0, ∀y, |y − x| < δ1 , − <ε
1 + |x| 1 + |y|
⇒ ∀y, |y − x| < δ1 , dϕ (y, x) < ε.
Dans l’autre sens, x = ϕ−1 (ϕ(x)) et
d(y, x) = |y − x| = |ϕ−1 (ϕ(y)) − ϕ−1 (ϕ(x))|.
Comme ϕ−1 est aussi continue au point ϕ(x),
∀ε > 0, ∃δ2 > 0, ∀z ∈ ] − 1, 1[ , |z − ϕ(x)| < δ2 , ϕ−1 (z) − ϕ−1 (ϕ(x)) < ε.
En particulier,
∀y ∈ R, |ϕ(y) − ϕ(x)| < δ2 , ϕ−1 (ϕ(y)) − ϕ−1 (ϕ(x)) < ε
⇒ ∀y ∈ R, dϕ (y, x) < δ2 , d(y, x) = |y − x| < ε.
La fonction ϕ est cependant un peu plus continue que son inverse ϕ−1 . En effet,
x y x − y + x |y| − y |x|
dϕ (x, y) = − =
1 + |x| 1 + |y| (1 + |x|) (1 + |y|)
(1 + |y|) (x − y) + y (|y| − |x|)
=
(1 + |x|) (1 + |y|)
(1 + |y|) |x − y| + |y| |y − x|
≤ < 2 |y − x| = 2 d(y, x).
(1 + |x|) (1 + |y|)
3. Fonctions continues 127
Comme dϕ (x, y) < 2 d(y, x), toute suite d-Cauchy est dϕ -Cauchy : dϕ (xn , xm ) <
2 |xn − xm | = 2 d(xn , xm ). Cependant, la réciproque est fausse. La suite {n} n’est
pas d-Cauchy car n → +∞ mais elle est dϕ -Cauchy. En effet, pour tout ε > 0,
N > 1/ε, n > N et k ≥ 1,
n n+k k 1 1
dϕ (n, n + k) = − = < < < ε.
1+n 1+n+k (1 + n) (1 + n + k) 1+n n
Définition 3.6.
Soit A, ∅ 6= A ⊂ X. On dit que F : X → Rn est un prolongement de f : A → Rn si
∀a ∈ A, F (a) = f (a) (ou sous forme compacte F |A = f ).
La fonction F |A : A → Rn est appelée restriction de F à A.
C’est une fonction continue sur [ai , bi ] qui coı̈ncide avec f aux deux extrémités
de l’intervalle [ai , bi ]. En procédant intervalle par intervalle, on construit ainsi une
fonction continue sur R dont la restriction à A est f .
Le prolongement n’est pas unique car, au lieu de tracer une droite entre
(ai , f (ai )) et (bi , f (bi )), on aurait pu prendre n’importe quelle fonction continue
sur [ai , bi ] passant par (ai , f (ai )) et (bi , f (bi )).
Ce résultat demeure vrai non seulement dans l’espace euclidien Rn de dimen-
sion n ≥ 2 mais aussi dans un espace métrique arbitraire (X, d). En 1915 H. Tietze
d’une fonction f : A → R pour A fermé sous l’hypothèse que inf x∈A f (x) > 0. Cette
restriction n’est pas contraignante car on peut à l’aide d’un homéomorphisme de R,
comme par exemple
déf z
z 7→ h(z) = + 2 : R → ]1, 2[ ,
1 + |z|
{x ∈ X : dA (x) = 0} = A et dA = dA .
ce qui donne une contradiction. Enfin, comme A ⊂ A, dA (x) ≥ dA (x) pour tout
x ∈ X. Par définition de l’infimum dA (x), pour tout n ≥ 1, il existe bn ∈ A tel que
1
dA (x) ≤ d(bn , x) < dA (x) +
2n
9. On verra plus loin qu’elle est non seulement continue mais aussi lipschitzienne sur X au
sens de la Définition 7.1 page 142.
130 Chapitre 4. Fonctions, limites et continuités
1 1
dA (x) ≤ d(an , x) ≤ d(an , bn ) + d(bn , x) < + dA (x) +
2n 2n
⇒ dA (x) ≤ dA (x)
et on a bien dA = dA sur X.
(iii) Si x ∈ A, on a dA (x) = 0 et ΠA (x) = {x}. Sinon, par définition de
l’infimum, pour tout n ≥ 1, il existe an ∈ A tel que
1 1
inf d(a, x) ≤ d(an , x) < inf d(a, x) + ⇒ 0 ≤ d(an , x) − inf d(a, x) <
a∈A a∈A n a∈A n
et la suite {d(an , x)} converge vers dA (x). Comme cette suite est bornée dans R,
la suite {an } est aussi bornée dans Rn . Par le Théorème 6.2 (c) du Chapitre 3, de
toute suite bornée dans Rn , on peut extraire une sous-suite convergente : il existe
p ∈ Rn et {ank } tel que ank → p et donc la limite p ∈ A. Enfin, par continuité de
la métrique,
Alors la fonction 10
f (x), si x ∈ A,
déf
F (x) = d(x, a) (3.25)
inf f (a) +
a∈A −1 , si x ∈ X\A,
dA (x))
10. C’est le prolongement utilisé par F. Hausdorff [1, p. 296] en 1919 pour démontrer ce
théorème (voir aussi R. Engelking [1, exercice 4.1.F, p. 247, Théorème 2.1.8]).
3. Fonctions continues 131
(a) On démontre d’abord que la fonction F est bien définie et qu’elle vérifie
les inégalités (3.26). La fonction F est bien définie pour x ∈ A. Pour x ∈ X\A,
comme A est fermė, on a d(x, a) ≥ dA (x) > 0 et
d(x, a)
∀a ∈ A, f (a) + − 1 ≥ f (a) > λ.
dA (x)
Comme cette fonction est bornée inférieurement, son infimum, F (x), par rapport à
A, appartient à R. La fonction F est donc bien définie et
d(x, a)
F (x) = inf f (a) + − 1 ≥ inf f (a) ≥ λ.
a∈A dA (x) a∈A
Par hypothèse, pour tout x ∈ A, F (x) = f (x) > λ. Mais l’inégalité est aussi stricte
en tout point x ∈ X\A car dA (x) > 0. Sinon, F (x) = λ et, par définition de
l’infimum, pour tout n ≥ 1, il existe an ∈ A tel que
d(x, an ) 1
λ ≤ f (an ) + −1<λ+ .
dA (x) n
Comme la suite {d(x, an )} est bornée la suite {an } l’est aussi. Du Lemme 3.1 (iii),
il existe une sous-suite {ank } ⊂ A et p ∈ A tel que ank → p et d(x, ank ) → d(x, p) =
dA (x). Par continuité de f sur A, il vient aussi f (ank ) → f (p) et on obtient la
contradiction λ < f (p) = λ. Pour la borne supérieure, comme il existe p ∈ A tel
que d(x, p) = dA (x),
d(x, a) d(x, p)
F (x) = inf f (a) + − 1 ≤ f (p) + − 1 = f (p) < µ.
a∈A dA (x) dA (x)
(b) F continu sur X\A. Comme X\A est un ouvert, en tout point x ∈ X\A,
il existe r > 0 tel que B2r (x) ⊂ X\A. On a donc
d(an , yn ) 1
F (yn ) ≤ f (an ) + − 1 < F (yn ) + . (3.27)
dA (yn ) n
De là
d(an , yn ) 1
0≤ < F (yn ) − f (an ) + 1 + ≤ µ − λ + 2
dA (yn ) n
⇒ d(an , yn ) < (µ − λ + 2) dA (yn ) ≤ (µ − λ + 2) d(x, yn )
⇒ d(an , x) ≤ d(an , yn ) + d(yn , x) ≤ (µ − λ + 3) d(x, yn ).
λ ≤ F (yn ) ≤ µ.
Il existe donc F̂ ∈ R et une sous-suite {F (ynk } telle que F (ynk ) → F̂ . De là, comme
d(an ,yn )
dA (yn ) − 1 ≥ 0,
d(ank , ynk ) 1
f (ank ) ≤ f (ank ) + − 1 < F (ynk ) + ⇒ f (x) ≤ F̂ .
dA (ynk ) nk
Pour démontrer l’inégalité dans l’autre sens, par définition de dA (ynk ) en tant qu’in-
fimum sur A, il existe bnk ∈ A tel que
1
0 < dA (ynk ) ≤ d(bnk , ynk ) < 1+ dA (ynk ) (3.28)
k
1
⇒ d(bnk , x) ≤ d(bnk , ynk ) + d(ynk , x) < 1 + dA (ynk ) + d(ynk , x)
k
1
≤ 2+ d(ynk , x)
k
⇒ bnk → x et f (bnk ) → f (x). (3.29)
134 Chapitre 4. Fonctions, limites et continuités
En combinant ceci avec le résultat précédent, il vient F̂ = f (x). Donc, comme toute
sous-suite convergente de {F (yn )} converge vers f (x), on en conclut que toute la
suite converge, c’est-à-dire, F (yn ) → f (x), ce qui complète la démonstration de la
continuité du prolongement F sur X.
(ii) Pour une application f : A → R, on utilise l’homéomorphisme (3.16) de
l’Exemple 3.5
déf z
z 7→ h(z) = : R → ] − 1, 1[ .
! + |z|
qui satisfait les hypothèses de la partie (i) avec λ = −1, µ = +1. On obtient alors
un prolongement Fe : X → ] − 1, 1[ . Il suffit ensuite de revenir en introduisant la
fonction F = h−1 ◦ Fe continue sur X pour laquelle
4 Continuité et compacité
Définition 4.1.
Une fonction f : (X, dX ) → (Y, dY ) est bornée sur un sous-ensemble E de X, s’il
existe x0 ∈ E et M > 0 tel que f (E) ⊂ BM (f (x0 )).
∃M > 0, ∀x ∈ E, kf (x)kp ≤ M.
Théorème 4.1. Soit f : (X, dX ) → (Y, dY ) continue. Si X est compact, alors f (X)
est compact dans (Y, dY ). En particulier, f (X) est fermée et bornée et l’application
f est bornée sur X.
4. Continuité et compacité 135
f −1 (∪α Gα ) = ∪α f −1 (Gα )
f (X) ⊂ ∪α Gα ⇒ f −1 [f (X)] ⊂ f −1 [∪α Gα ] ⊂ ∪α f −1 (Gα ).
X ⊂ f −1 [f (X)] ⊂ ∪α f −1 (Gα ).
∃a ∈ X tel que f (a) = inf f (X) et ∃b ∈ X tel que f (b) = sup f (X). (4.1)
Démonstration. Par compacité de X, f (X) est compact. Il est donc borné et, a for-
tiori, borné inférieurement et supérieurement. Par le Théorème 3.8 et son corollaire
du Chapitre 3
f −1 : (Y, dY ) → (X, dX )
Exemple 4.1.
Soient
déf déf
X = [0, 2π[ et Y = {x ∈ R2 : kxk = 1}
5 Continuité et connexité
On a vu au Chapitre 3 que, comme la compacité et la bornitude, la connexité
est une notion intrinsèque. Elle aussi est préservée par la continuité.
Théorème 5.1. Soit f : (X, dX ) → (Y, dY ) continue. Si E ⊂ X est connexe, alors
f (E) est connexe dans (Y, dY ).
Démonstration. Par l’absurde. Supposons que f (E) = A ∪ B pour deux sous-
ensembles séparés non-vides A et B de Y . Alors
Posons
déf déf
G = E ∩ f −1 (A) et H = E ∩ f −1 (B) ⇒ E =G∪H
par le Théorème 1.1 (1). Comme A et B ne sont pas vides, par le Théorème 1.3 (2)
et G et H ne sont pas vides. Il reste à montrer que G et H sont séparés pour obtenir
une contradiction. Il vient
A⊂A ⇒ f −1 (A) ⊂ f −1 (A) ⇒ G = E ∩ f −1 (A) ⊂ E ∩ f −1 (A)
B⊂B ⇒ f −1 (B) ⊂ f −1 (B) ⇒ H = E ∩ f −1 (B) ⊂ E ∩ f −1 (B)
Comme f est continue, par le Théorème 3.3, f −1 (A) et f −1 (B) sont fermés et
G ⊂ E ∩ f −1 (A) ⊂ E ∩ f −1 (A) ⇒ G ⊂ E ∩ f −1 (A)
H ⊂ E ∩ f −1 (B) ⊂ E ∩ f −1 (B) ⇒ H ⊂ E ∩ f −1 (B).
Enfin, par le Théorème 1.1 (2)
G ∩ H ⊂ (E ∩ f −1 A) ∩ E ∩ f −1 (B) = (E ∩ E) ∩ f −1 (A) ∩ f −1 (B)
= E ∩ f −1 (A ∩ B) = ∅
H ∩ G ⊂ (E ∩ f −1 B) ∩ E ∩ f −1 (A) = (E ∩ E) ∩ f −1 (B) ∩ f −1 (A)
= E ∩ f −1 (B ∩ A) = ∅
⇒ G∩H =∅ et G ∩ H = ∅.
G et H sont bien séparés ce qui contredit le fait que E est connexe.
On obtient ainsi le Théorème des valeurs intermédiaires.
Théorème 5.2. Soit f : [a, b] → R, a < b, continue sur [a, b].
(i) Si f (a < f (b), alors
∀c, f (a) < c < f (b) ⇒ ∃x, a < x < b, tel que f (x) = c.
Démonstration. (i) Comme [a, b] est connexe, f ([a, b]) est connexe. Par le Théorème
9.2 du Chapitre 3, tout c tel que f (a) < c < f (b) appartient à f ([a, b]). Il existe
donc x ∈ [a, b] tel que f (x) = c. Comme f (a) < f (x) < f (b), x ne peut être a ou b.
(ii) Même démonstration.
La réciproque de ce théorème n’est pas vraie. On peut avoir la propriété des
valeurs intermédiaires sans que f soit continue.
Exemple 5.1.
La fonction f : [−2, 2] → R possède la propriété des valeurs intermédiaires sur
[−2, 2], mais n’est pas continue en x = −1 et x = 1
x, − 2 ≤ x ≤ −1
déf
f (x) = − x, −1<x<1 (5.1)
x, 1 ≤ x ≤ 2.
138 Chapitre 4. Fonctions, limites et continuités
Avant de terminer, considérons l’ensemble à deux éléments {0, 1} qui n’est pas
connexe pour la métrique d(x, y) = |x − y| et la famille des fonctions
f : (X, d) → {0, 1}. (5.2)
Si X est connexe et non vide et f est continue sur X, son image f (X) doit être
connexe. Elle ne peut donc être que {0} ou {1}. Ceci signifie que si X est connexe,
il n’existe pas de fonction continue et surjective de (X, d) dans {0, 1}.
La réciproque est vraie et donne une nouvelle caractérisation de la connexité
qui s’ajoute à celles du Corollaire 1 au Théorème 9.1 du Chapitre 3.
Théorème 5.3. (X, d) est connexe si et seulement si il n’existe pas d’application
continue et surjective de (X, d) dans {0, 1}.
Démonstration. Il suffit de démontrer la réciproque. Supposons que X ne soit pas
connexe, alors, par le Théorème 9.1 du Chapitre 3, il existe E, ∅ 6= E $ X, qui est
à la fois ouvert et fermé dans (X, d). La fonction surjective
( )
déf 1, si x ∈ E
x 7→ χE (x) = : (X, d) → {0, 1}
0, si x ∈ X\E
est donc surjective. Dans {0, 1}, les ouverts sont ∅, {0}, {1}, et {0, 1}. Les images
inverses
f −1 (∅) = ∅, f −1 ({1}) = E, f −1 ({0}) = X\E, f −1 ({0, 1}) = X
sont toutes des sous-ensembles ouverts de X car, E étant ouvert et fermé, X\E
est ouvert. L’application surjective χE est donc continue ce qui contredit notre
hypothèse.
Remarque 5.1.
La fonction χE est appelée fonction caractéristique de E. À toute fonction f :
(X, d) → {0, 1} on peut associer l’ensemble
déf
E = {x ∈ X : f (x) = 1}
et la fonction caractéristique χE pour laquelle f = χE . Il y a donc une bijection
entre l’ensemble des fonctions caractéristiques et l’ensemble P(X) :
déf
E 7→ χE : P(X) → {0, 1}X = {χE : E ⊂ X}. (5.3)
La notation {0, 1}X peut être interprétée comme une extension de la notation du
produit {0, 1}n de n copies de {0, 1}.
continue sur E ⊂ X si, pour tout ε > 0, il existe δ > 0 tel que
Une fonction uniformément continue sur E est continue sur E, mais la réciproque
n’est pas vraie comme le montre l’exemple de la fonction
qui n’est pas uniformément continue sur ]0, 1], mais qui est uniformément continue
sur [1, +∞). La fonction f (x) = x sur R est uniformément continue mais pas bornée
sur R.
X ⊂ ∪m
i=1 Bδ(ε,xi )/2 (xi ).
On choisit
puisque le minimum est pris par rapport à un nombre fini de scalaires strictement
positifs. Ayant construit un δ correspondant au ε, on vérifie maintenant la continuité
uniforme. Soient x′ , x ∈ X tel que dX (x′ , x) < δ. Comme il y a recouvrement fini,
il existe xi ∈ X tel que x ∈ Bδ(ε,xi )/2 (xi ) et donc
δ(ε, xi )
dX (x′ , xi ) ≤ dX (x′ , x) + dX (x, xi ) ≤ δ + < δ(ε, xi )
2
ε
⇒ dY (f (x′ ), f (xi )) < .
2
De là, pour x′ , x ∈ X tel que dX (x′ , x) < δ,
ε ε
dY (f (x′ ), f (x)) < dY (f (x′ ), f (xi )) + dY (f (xi ), f (x)) < + =ε
2 2
ce qui donne bien la continuité uniforme.
140 Chapitre 4. Fonctions, limites et continuités
Remarque 6.1.
La composition g ◦ f de deux fonctions f : (X, dX ) → (Y, dY ) uniformément conti-
nue sur E ⊂ X et g : (Y, dY ) → (Z, dZ ) uniformément continue sur f (E) ⊂ Y
est uniformément continue sur X (voir Exercice 10.11). Les opérations habituelles
préservent la continuité uniforme sur un sous-ensemble E de (X, dX ) : pour f, g :
(X, dX ) → R
déf déf
(f + g)(x) = f (x) + g(x) et ∀α ∈ R, (αf )(x) = α f (x).
Par le Théorème 6.2, la suite {f (xn )} ⊂ f (E) est Cauchy dans (Y, dY ). Comme
(Y, dY ) est complet, la suite {f (xn )} converges vers un point y ∈ Y . Ce point
est unique car toutes les suites de Cauchy {xn } ⊂ E convergeant vers x sont
équivalentes. Par continuité uniforme, les suites de Cauchy {f (xn )} ⊂ f (E) sont
aussi équivalentes et elles ont donc toutes la même limite y. On pose f¯(x) = y ce
qui définit f¯ uniquement en tout point d’accumulation de E qui n’est pas dans E.
Par hypothèse, f¯ = f est continue en tout point de E et, par construction, f¯ est
continue en tout point d’accumulation de E qui n’appartient pas à E.
b = S/R est l’ensemble de toutes les
11. Voir la définition donnée en (6.7) au Chapitre 3. X
classes d’équivalence de suites de Cauchy dans (X, dX ) et l’application
déf b
x 7→ ϕ(x) = R{x} : X → X. (6.3)
b dˆX ).
est une isométrie de (X, dX ) sur l’image X0 = ϕ(X) de X par ϕ dans (X,
142 Chapitre 4. Fonctions, limites et continuités
∀x1 , x2 ∈ E tel que dX (x1 .x2 ) < 3δ, dY (f (x1 ), f (x2 )) < ε/3.
Soient x̄1 , x̄2 ∈ E tel que dX (x̄1 , x̄2 ) < δ. Par construction de f¯, il existe x1 , x2 ∈ E
tel que
Ceci entraı̂ne
Finalement,
7 Fonctions lipschitziennes
7.1 Définitions et propriétés
Définition 7.1.
Soit une fonction f : (X, dX ) → (Y, dY ) entre deux espaces métriques.
(i) f est lipschitzienne en x ∈ X s’il existe une constante c(x) > 0 et un rayon
r(x) > 0 tel que
(ii) f est lipschitzienne sur un sous-ensemble E de X s’il existe c(E) > 0 tel
que
Il vient immédiatement.
Exemple 7.1.
La norme x 7→ f (x) = kxk2 : (Rn , d2 ) → (R, dR ) est lipschitzienne sur (Rn , d2 ) de
constante c(Rn ) = 1 pour les métriques d2 (x, y) = kx − yk2 et dR (a, b) = |a − b|
puisque
Remarque 7.1.
La composition g ◦ f de deux fonctions f : (X, dX ) → (Y, dY ) lipschitzienne en
x ∈ X et g : (Y, dY ) → (Z, dZ ) lipschitzienne en f (x) ∈ Y est lipschitzienne en
x ∈ X (voir Exercice 10.11). Les opérations habituelles préservent la continuité
lipschitzienne sur un sous-ensemble E de (X, dX ) : pour f, g : (X, dX ) → Rn
déf déf
(f + g)(x) = f (x) + g(x) et ∀α ∈ R, (αf )(x) = α f (x).
144 Chapitre 4. Fonctions, limites et continuités
F (b) = inf {f (a) + Lip (f, E) dX (b, a)} ≤ f (b) + Lip (f, E) dX (b, b) = f (b).
a∈E
{f (a) + Lip (f, E) dX (y, a)} ≤ {f (a) + Lip (f, E) dX (x, a)} + Lip (f, E) dX (y, x).
Remarque 7.2.
On peut améliorer l’estimé de la constante de Lipschitz du prolongement de la partie
(ii). Le théorème de M. D. Kirszbraun [1] 12 affirme que pour un sous-ensemble
E d’un espace de Hilbert H1 et une fonction lipschitzienne f : U → H2 , H2 un
autre espace de Hilbert, sur U , il existe un prolongement F : H1 → H2 lipschitzien
avec la même constante de Lipschitz : Lip (F, H1 ) = Lip (f, E). On a comme cas
particulier les espaces euclidiens H1 = Rn et H2 = Rk . C’est sous cette forme que
Kirszbraun démontra initiallement son résultat. La version hilbertienne se trouve
par exemple dans J. T. Schwartz [1, p. 21]. En général, ce résultat n’est pas vrai
dans les espaces de Banach même s’ils sont de dimension finie comme Rk , k > 1,
équipé de la norme
( k )1/p
déf
X
kxkℓp (Rk ) = |xi |p , p 6= 2
i=1
12. Le théorème fut démontré par Mojzesz David Kirszbraunc (1903 ou 1904–1942), et plus
tard de nouveau par Frederick A. Valentine (1911– 2002) (cf. F. A. Valentine [1, 2]).
146 Chapitre 4. Fonctions, limites et continuités
Les applications contractantes sont donc des applications lipschitziennes d’un espace
métrique dans lui même.
Théorème 8.1. Soient (X, d) un espace métrique complet et ϕ : (X, d) → (X, d)
une application contractante. Alors
∃x ∈ X tel que ϕ(x) = x
et ce point est unique.
Démonstration. Soit x0 ∈ X un point quelconque. On construit la suite suivante :
x1 = ϕ(x0 ), x2 = ϕ(x1 ), ... , xn+1 = ϕ(xn ), ...
Soit k, 0 < k < 1, la constante telle que
∀x, y ∈ X, d(ϕ(x), ϕ(y)) ≤ k d(x, y).
On vérifie que
d(x2 , x1 ) = d(ϕ(x1 ), ϕ(x0 )) ≤ k d(x1 , x0 ),
d(x3 , x2 ) = d(ϕ(x2 ), ϕ(x1 )) ≤ k d(x2 , x1 ) ≤ k 2 d(x1 , x0 ),
d(x4 , x3 ) = d(ϕ(x3 ), ϕ(x2 )) ≤ k d(x3 , x2 ) ≤ k 3 d(x1 , x0 ),
...
d(xn+1 , xn ) ≤ k n d(x1 , x0 ).
On a ainsi construit une suite {xn } qui est de Cauchy : pour n < m
m
X m
X kn
d(xn , xm ) ≤ d(xi , xi−1 ) ≤ k i−1 d(x1 , x0 ) ≤ d(x1 , x0 ).
i=n+1 i=n+1
1−k
Définition 9.1.
Soit f : R → (Y, d) et x0 ∈ R.
(i) f possède une limite à gauche en x0 si
On en déduit que
limite limite
à droite à gauche
lim f (x)
x→a−
lim f (x)
x→a+
a a
Définition 9.2.
Soit f : ]a, b[ → (Y, d), a < b, et x ∈ ]a, b[ un point de discontinuité de f .
(i) La fonction f possède un point de discontinuité de la première espèce en
x ∈ ]a, b[ si f (x+ ) et f (x− ) existent.
(ii) La fonction f possède un point de discontinuité de la seconde espèce en
x ∈ ]a, b[ si x n’est pas une discontinuité de la première espèce.
Exemple 9.1.
Les fonctions f : R → R suivantes ont des discontinuités de seconde espèce.
a) Discontinuité de seconde espèce en tout point de R :
(
déf 1, si x ∈ Q
f (x) =
0, si x ∈ R \ Q .
Définition 9.3.
Soit une fonction f : ]a, b[ → R.
(i) f est croissante sur ]a, b[ si
Dans les deux cas, on dira que f est monotone sur ]a, b[ .
f (x+ ) ≤ f (y − ).
De la même façon
On utilise maintenant la densité des rationnels dans ]a, b[ pour construire une
application injective r : E → Q.
Si x ∈ E, ou bien f (x− ) < f (x) ≤ f (x+ ) et il existe un rationnel r(x) tel
que f (x− ) < r(x) < f (x) ≤ f (x+ ), ou bien f (x− ) ≤ f (x) < f (x+ ) et il existe
un rationnel r(x) tel que f (x− ) ≤ f (x) < r(x) < f (x+ ). On a donc construit une
fonction r : E → r(E) ⊂ Q. Cette fonction est injective puisque pour x1 , x2 ∈ E,
x1 < x2 , il vient dans tous les cas r(x1 ) < r(x2 ). E peut donc être identifié au
sous-ensemble r(E) de Q qui est au plus dénombrable.
Remarque 9.1.
On peut montrer que les points de discontinuité d’une fonction monotone ne sont
pas nécessairement des points isolés.
Définition 9.4.
Soit f : [a, b] → R, a < b. f est à variation bornée sur [a, b] si le supremum
( n )
déf
X
Var [a, b] = sup |f (ak ) − f (ak−1 | : n ≥ 0, a ≤ a0 ≤ · · · ≤ an ≤ b (9.6)
k=1
pris par rapport à toutes les suites finies a0 , . . . , an et à tous les entiers n ≥ 0 est
fini. On appelle Var [a, b] la variation totale de f sur [a, b].
Définition 9.5.
Soit f : [a, b] → R, a < b. f est absolument continue sur [a, b] si pour tout ε > 0,
il existe δ > 0 tel que pour toute suite a ≤ a1 ≤ b1 ≤ · · · ≤ ak ≤ bk ≤ · · · ≤ an ≤
bn ≤ b et tout n ≥ 1 tel que
X n n
X
|bk − ak | < δ, on a |f (bk ) − f (ak )| < ε. (9.7)
k=1 k=1
Les fonctions absolument continues sont les seules fonctions qui sont l’intégrale de
leur dérivée. Déterminer cette classe de fonction était l’une des préoccupations de
Henri Lebesgue. En effet, on savait qu’il existait des fonctions continues mono-
tones croissantes qui n’étaient pas l’intégrale (au sens de Lebesgue) de leur dérivée
10. Exercices 151
presque partout. C’est le cas de l’≪escalier de Cantor≫ qui est une fonction mono-
tone, définie et continue partout sur le segment [0, 1] (voir Figure 4.5). Sa dérivée
est, évidemment, égale à zéro en tout point appartenant à un intervalle contigu
f (x)
0
0 1
10 Exercices
Exercice 10.1.
Soit f : X → Y . Alors l’application inverse induite f −1 : P(Y ) → P(X) préserve
les opérations élémentaires suivantes :
(1) f −1 (∪α Bα ) = ∪α f −1 (Bα ).
(2) f −1 (∩α Bα ) = ∩α f −1 (Bα ).
(3) f −1 (B1 \B2 ) = f −1 (B1 )\f −1 (B2 ).
Exercice 10.2.
Soit f : X → Y . Alors l’application induite f : P(X) → P(Y ) préserve les
opérations suivantes :
(1) f (∪α Bα ) = ∪α f (Bα ).
(2) f (∩α Bα ) ⊂ ∩α f (Bα ).
Exercice 10.3.
Soit f : X → Y . Alors
(1) pour chaque A ⊂ X, f −1 [f (A)] ⊃ A.
152 Chapitre 4. Fonctions, limites et continuités
Exercice 10.4.
Soit f : X → Y et g : Y → Z. Alors, pour les applications induites, on a (g ◦ f )−1 =
f −1 ◦ g −1 .
Exercice 10.6.
Soit f : X → Y et g : Y → X tel que g ◦ f = IX où IX est la fonction identité sur
X. Alors f est injective et g est surjective.
Exercice 10.9 (W. Rudin [1, Exercice 7, p. 91]). (i) On se donne la fonction
f : R2 → R
2
xy , si (x, y) 6
= (0, 0)
déf
f (x, y) = x2 + y 4
0, si (x, y) = (0, 0)
10. Exercices 153
Montrer que f est bornée sur R2 et n’est pas continue en (0, 0), mais que
sa restriction à toute droite passant par (0, 0) est continue.
(ii) On se donne la fonction g : R2 → R
2
xy , si (x, y) 6= (0, 0)
déf
g(x, y) = x2 + y 6
0, si (x, y) = (0, 0)
Montrer que g n’est bornée sur aucun voisinage de (0, 0) et n’est pas conti-
nue en (0, 0), mais que sa restriction à toute droite passant par (0, 0) est
continue.
Exercice 10.13.
Soient deux espaces métriques (X, dX ) et (Y, dY ) et leur produit
déf
X × Y = {(x, y) : x ∈ X et y ∈ Y } . (10.4)
(i) Montrer que
déf
((x, y), (x′ , y ′ )) 7→ dX×Y ((x, y), (x′ , y ′ )) = dX (x, x′ ) + dY (y, y ′ )
(10.5)
: (X × Y ) × (X × Y ) → R+
définit une métrique sur X × Y .
(ii) Montrer que la projection sur X
déf
(x, y) 7→ pX (x, y) = x : (X × Y, dX×Y ) → (X, dX )
est lipschitzienne sur X × Y .
154 Chapitre 4. Fonctions, limites et continuités
Exercice 10.14.
On dénote par dn (y, x) = ky − xkRn la métrique euclidienne sur Rn , n ≥ 1 un entier.
Soit le pole nord p = (0, 0, 1) ∈ R3 de la sphère de rayon un
q
(2) déf déf
S = x = (x1 , x2 , x3 ) : kxkR3 = x1 + x2 + x3 = 1 ⊂ R3 .
2 2 2
Définition 1.1.
Soit E un ensemble non vide. On dit que E est un espace vectoriel sur R muni d’une
addition
x, y 7→ x + y : E × E → E
et d’une multiplication à gauche ou multiplication par un scalaire
λ, x 7→ λ x : R ×E → E
∀x ∈ E, x + 0 = x,
x + (−x) = 0,
155
156 Chapitre 5. Espaces vectoriels, convergences et applications linéaires
Les éléments d’un espace vectoriel sont appelés vecteurs. La définition d’espace
vectoriel s’applique aussi au cas où R est remplacé par C.
Définition 1.2.
Soit E un espace vectoriel. Une norme sur E est une application
x 7→ kxkE : E → R+ (1.1)
qui satifait les axiomes suivants :
(N1) kxkE = 0 ⇐⇒ x = 0.
(N2) kλxkE = |λ| kxkE .
(N3) kx + ykE ≤ kxkE + kykE (inégalité du triangle).
Un espace vectoriel muni d’une norme est applelé espace vectoriel normé ou sim-
plement espace normé.
Définition 1.3.
Un espace vectoriel normé est applelé espace de Banach s’il est complet par rapport
à la métrique associée à sa norme.
Exemple 1.1.
L’espace euclidien Rn est un espace vectoriel normé pour les opérations
déf
(x1 , . . . , xn ) + (y1 , . . . , yn ) = (x1 + y1 , . . . , xn + yn )
(1.3)
déf
λ (x1 , . . . , xn ) = (λ x1 , . . . , λ xn )
et l’une des normes du Théorème 1.2 du Chapitre 3 (voir aussi le Théorème 1.1 du
Chapitre 3 pour p = 2) :
( n )1/p
déf
X déf
p
kxkp = |xi | , 1 ≤ p < +∞, ou kxk∞ = max |xi | . (1.4)
1≤i≤n
i=1
Elle sont toutes équivalente (voir l’Exemple 3.3 du Chapitre 3). Par le Théorème
6.4 du Chapitre 3, Rn est complet par rapport à la métrique correspondant à p = 2.
C’est donc un espace de Banach. En fait, on peut montrer que Rn est un espace de
Banach pour toutes les normes k kp , 1 ≤ p ≤ +∞.
2. Suites, espaces et séries de fonctions 157
Définition 2.1.
Soient un ensemble E 6= ∅, un espace normé (F, k kF ), une suite de fonctions {fn },
fn : E → F , et une fonction f : E → F .
(i) La suite {fn } converge vers f (converge simplement ou ponctuellement) si
∀ε > 0, ∃δ > 0, ∀α, ∀x, y ∈ E , dE (y, x) < δ, kfα (x) − fα (y)kF < ε.
Exemple 2.1.
Pour chaque entier n ≥ 1, soit la fonction continue fn : [0, 2] → R définie par
1, si x ∈ [0, 1],
déf
fn (x) = 1 − n(x − 1), si x ∈ [1, 1 + 1/n],
0, si x ∈ [1 + 1/n, 2].
2. Suites, espaces et séries de fonctions 159
est une fonction discontinue en x = 1. Cette suite est simplement convergente mais
pas uniformément convergente sur [0, 2]. En effet, pour tout n ≥ 1
1 1 1
sup |fn (x) − f (x)| ≥ fn 1 + −f 1+ = .
x∈[0,2] 2n 2n 2
kf (x) − f (y)kF ≤ kf (x) − fn (x)kF + kfn (x) − fn (y)kF + kfn (y) − f (y)kF . (2.3)
kfn (y) − fn (x)kF ≤ kfn (y) − f (y)kF + kf (y) − f (x)kF + kf (x) − fn (x)kF
ce qui entraı̂ne
∀n ≥ 1, ∀x ∈ E, kfn (x)kF ≤ M.
Pour tout n ≥ 1,
C’est un fonction non-négative telle que fn (1) = fn (0) = 0. Les limites aux deux
bouts sont donc 0. Pour 0 < x < 1, on applique le critère du quotient :
2
fn+1 (x) n+1
= (1 − x2 ) → (1 − x2 ) < 1
fn (x) n
⇒ lim fn (x) = 0.
n→∞
2. Suites, espaces et séries de fonctions 161
Comme (1−1/n)n tend vers e−1 lorsque n tend vers l’infini, le côté droit de l’inégalité
tend vers l’infini et la convergence n’est pas uniforme.
Exemple 2.3.
Soit E un ensemble non-vide et F un espace de Banach. L’espace
déf
B(E; F ) = {f : (E, d) → F | f bornée sur E} (2.6)
déf déf
(f + g)(x) = f (x) + g(x), (λ f )(x) = λ f (x) (2.7)
est un espace vectoriel car il hérite des propriétés de l’espace F : les deux opérations
sont bien définies et préservent la “bornitude” sur E. La fonction
déf
f 7→ kf kB(E;F ) = sup kf (x)kF : B(E; F ) → R+ (2.8)
x∈E
est donc bien définie : comme f est bornée sur E, le supremum est un réel positif.
De plus, c’est une norme car les trois propriétés qui la caractérisent sont vérifées :
Exemple 2.4.
Soit E 6= ∅ un sous-ensemble d’un espace métrique (X, d) et F un espace de Ba-
nach. Soit C 0 (E; F ) l’espace des fonctions continues sur E mais pas nécessairement
bornées sur E. Le sous-espace
déf
B 0 (E; F ) = {f : (E, d) → F | f continue et bornée sur E} (2.9)
déf déf
(f + g)(x) = f (x) + g(x), (λ f )(x) = λ f (x) (2.10)
déf
f 7→ kf kB(E;F ) = sup kf (x)kF : B(E; F ) → R+ (2.11)
x∈E
est un espace vectoriel normé car c’est un sous-espace de B(E; F ) muni de la même
norme (métrique) (2.8) et un espace vectoriel car les deux opérations préservent la
continuité. Lorsque Y = R, on adoptera la notation B 0 (E) pour B 0 (E; R).
Le second espace est l’espace des fonctions uniformément continues bornées sur E
qui est un sous-espace de B 0 (E; F ) de l’Exemple 2.4.
Exemple 2.5.
Soit E 6= ∅ un sous-ensemble d’un espace métrique (X, d) et F un espace de Banach.
L’espace 1
déf
C 0 (E; F ) = {f : (E, d) → F | f uniformément continue et bornée sur E} (2.12)
déf déf
(f + g)(x) = f (x) + g(x), (λ f )(x) = λ f (x) (2.13)
déf
f 7→ kf kB(E;F ) = sup kf (x)kF : B(E; F ) → R+ (2.14)
x∈E
est un espace vectoriel car les deux opérations préservent la continuité uniforme et
que C 0 (E; F ) ⊂ B 0 (E; F ) avec la même métrique (2.8). La notation E rappelle le
fait qu’il y a toujours un prolongement uniformément continu unique à E (Théorème
6.3, Chapitre 4) et dans ce cas-ci le prolongement est aussi borné. est une norme sur
C 0 (E; F ) puisque C 0 (E; F ) ⊂ B 0 (E; F ). Lorsque Y = R, on adoptera la notation
C 0 (E) pour C 0 (E; R).
(iv) Soit E 6= ∅ un sous-ensemble compact d’un espace métrique (X, d). Alors
déf
C 0 (E; F ) = {f : (E, d) → F |f continue sur E} (2.15)
Démonstration. (i) Il reste à montrer que B(E; F ) est complet. Soit {fn } une suite
de Cauchy dans B(E; F ) : pour tout ε > 0 il existe N > 0 tel que
Par l’équivalence des parties (iii) et (i) du Théorème 2.1, il existe f : E → F tel que
{fn } convergerge uniformément vers f . Ceci définit la fonction f : E → F candidate
pour la limite de la suite {fn }. Mais une suite de Cauchy est toujours bornée :
Les fonctions de la famille {fn } sont donc uniformément bornées sur E. Par le
Théorème 2.2, la fonction f est aussi bornée sur E. Elle appartient donc à B(E; F )
qui est par ce fait complet.
(ii) Il faut montrer que B 0 (E; F ) est complet. Soit {fn } une suite de Cauchy
dans B 0 (E; F ). Comme B 0 (E; F ) ⊂ B(E; F ) et que ce dernier est complet, il existe
f ∈ B(E; F ) tel que {fn } converge uniformément vers f sur E. Comme les {fn }
sont continues, f est continue par le Théorème 2.2 (i) et B 0 (E; F ) est complet.
(iii) Il faut montrer que C 0 (E; F ) est complet. Soit {fn } une suite de Cauchy
dans C 0 (E; F ). Comme C 0 (E; F ) ⊂ B 0 (E; F ) et que ce dernier est complet, il existe
f ∈ B 0 (E; F ) tel que {fn } converge uniformément vers f sur E. Comme les {fn }
sont uniformément continues, f est uniformément continue par le Théorème 2.2 (ii)
et B 0 (E; F ) est complet.
(iv) Toute fonction continue sur E est bornée par le Théorème 4.1 et uni-
formément continue par le Théorème 6.1 du Chapitre 4. Les trois espaces coı̈ncident
donc avec la même norme (2.8). Conséquemment C 0 (E; F ) est un Banach.
Exemple 2.6.
Une limitation importante des définitions des espaces B 0 (E; F ) et C 0 (E; F ) est
la condition que les fonctions soient bornées sur E. Dans certains cas, on peut
palier à cette difficulté. Par exemple, lorsque E = Ω, un sous-ensemble ouvert de
Rk , on montre qu’il existe une suite croissante de compacts non vides Kk tel que
Ω = ∪k≥1 Kk et, pour tout compact K ⊂ Ω, il existe k ≥ 1 tel que K ⊂ Kk (voir
l’Exercice 8.3 en fin de chapitre). À l’aide de cette suite on peut déinir une métrique
sur l’espace
déf
C 0 (Ω) = {f : Ω → R |f continue sur Ω}
164 Chapitre 5. Espaces vectoriels, convergences et applications linéaires
des fonctions continues sur Ω, où Ω n’est pas nécessairement borné (voir l’Exercice
8.4 en fin de chapitre). La construction se fait comme suit. Pour f ∈ C 0 (Ω) et k ≥ 1
on définit
déf
qk (f ) = sup |f (x)|
x∈Kk
C’est la métrique de convergence uniforme sur les compacts. (voir la propriété (iv)
du paragraphe 2.2, page 58, et l’Exercice 10.3 (iv) page 101 du Chapitre 3).
Exemple 2.7.
Soit E 6= ∅ un sous-ensemble d’un espace métrique (X, d) et F un espace de Banach.
déf
C 0,1 (E; F ) = {f : E → F | f lipschitzienne et bornée sur E} (2.18)
déf déf
(f + g)(x) = f (x) + g(x), (λ f )(x) = λ f (x) (2.19)
qui n’est pas une norme sur C 0,1 (E; F ) et on dénote par kf kB(E;F ) la norme (2.8)
sur B 0 (E; F ). La nouvelle fonction
déf
f 7→ kf kC 0,1 (E;F ) = kf kB(E;F ) + c(f, E) : C 0,1 (E; F ) → R+ (2.21)
Théorème 2.4. L’espace (vectoriel) normé C 0,1 (E; F ) tel que défini dans l’Exemple
2.7 avec la norme (2.21) est un espace de Banach.
Démonstration. Soit {fn } une suite de Cauchy pour la norme C 0,1 (E; F ). Comme
C 0,1 (E; F ) ⊂ C 0 (E; F ) et que kf kB(E;F )) ≤ kf kC 0,1 (E;F ) , {fn } est aussi une suite
de Cauchy dans C 0 (E; F ). Par la démonstration du Théorème 2.3 (iii), il existe
2. Suites, espaces et séries de fonctions 165
et f est bien lipschitzienne sur E. Enfin, comme on a montré que pour la suite de
Cauchy {fn } dans la norme (2.21) de C 0,1 (E; F ),
f ∈ C 0,1 (E; F ) est bien la limite de {fn } pour la norme (2.21) de C 0,1 (E; F ).
Remarque 2.1.
Ici aussi on peut se libérer de la contrainte que les fonctions soient bornées en
remplaçant la norme du supremum par la norme de kf (x0 )kF en un point de x0 ∈ E :
déf
f 7→ kf kLip (E;F ) = kf (x0 )kF + c(f, E) : Lip (E; F ) → R+ (2.22)
où
déf
Lip (E; F ) = {f : E → F | f lipschitzienne sur E} . (2.23)
166 Chapitre 5. Espaces vectoriels, convergences et applications linéaires
la série dénotée
∞
X X
ai ou ai
i=1
est la suite des sommes partielles {sn }. La série est dite convergente si la suite {sn }
converge.
Définition 2.2.
Soient E 6= ∅ un sous-ensemble d’un espace métrique (X, d), F un espace de Banach,
une suite de fonctions {fi }, fi : E → F , et, pour chaque x ∈ E, les sommes partielles
n
X
déf
sn (x) = fi (x), n ≥ 1. (2.24)
i=1
P
(i) On dit que la série fi converge (ou converge simplement ou ponctuelle-
ment sur E) si la suite de fonctions {sn } converge (simplement sur E).
P
(ii) On dit que fi converge uniformément (sur E) si la suite de fonctions
{sn } converge uniformément (sur E).
Comme le critère de Cauchy est satisfait pour la suite de fonctions {sn }, elles
convergent uniformément par le Théorème 2.1 et, par définition, la série converge
uniformément.
3. ◮ Espaces de Banach de fonctions différentiables 167
Exemple 3.1.
Soit Ω un sous-ensemble ouvert non-vide de Rn . L’espace
f continue et bornée sur Ω
déf
B 1 (Ω) = f : Ω → R ∂i f continue et bornée sur Ω, (3.1)
1≤i≤n
déf déf
(f + g)(x) = f (x) + g(x), (λ f )(x) = λ f (x), (3.2)
Exemple 3.2.
Soit Ω un sous-ensemble ouvert non-vide de Rn . L’espace
f uniformément continue et bornée sur Ω
déf
C 1 (Ω) = f : Ω → R ∂i f uniformément continue et bornée sur Ω, (3.4)
1≤i≤n
déf déf
(f + g)(x) = f (x) + g(x), (λ f )(x) = λ f (x), (3.5)
Exemple 3.3.
De la même façon on peut définir B k (Ω) et C k (Ω) pour k ≥ 2 sur un sous-ensemble
ouvert non-vide Ω de Rn . On introduit d’abord des notations compactes pour les
dérivées partielles de tout ordre. Soit Nn l’ensemble de toutes les n-suites d’entiers
α = (α1 , . . . , αn ) ∈ Nn . Un élément de Nn sera appelé un multi-index. Pour chaque
α ∈ Nn , on définit l’ordre |α| de α et la dérivée partielle ∂ α comme suit :
n
X ∂ |α|
|α| = αi , ∂α = . (3.7)
i=1
∂xα
1
1
. . . ∂xα
n
n
168 Chapitre 5. Espaces vectoriels, convergences et applications linéaires
Les fonctions (f, g) 7→ |f − g|m,Ω pour m ≥ 1 ne sont pas des métriques mais
seulement des pseudo-métriques. Elles vérifient les axiomes (M2) et (M3), mais
|f |m,Ω = 0 n’entraı̂ne pas f = 0 pour l’axiome (M1). La fonction
est une norme sur B k (Ω) et sur son sous-espace C k (Ω). Ce sont des espaces de
Banach.
Exemple 3.4.
Soit Ω un sous-ensemble ouvert non-vide de Rn . Les espaces
f continue et bornée sur Ω
∞ déf n
B (Ω) = f : Ω → R ∀k ≥ 1, ∀α ∈ N tel que |α| = k (3.10)
α
∂ f continue et bornée sur Ω
f uniformément continue et bornée sur Ω
déf
C ∞ (Ω) = f : Ω → R ∀k ≥ 1, ∀α ∈ Nn tel que |α| = k (3.11)
∂ α f uniformément continue et bornée sur Ω
sont des espaces vectoriels. Toutes les normes sur B k (Ω) et C k (Ω) sont des normes
sur B ∞ (Ω) et C ∞ (Ω), mais B ∞ (Ω) et C ∞ (Ω) ne sont pas complets par rapport à
2. Les |f |m,Ω , m ≥ 1, sont des semi-normes. Une semi-norme sur un espace vectoriel E est
une application q : E → R+ vérifiant les axiomes suivants :
(i) homogénéité : ∀λ ∈ R, ∀x ∈ E, q(λ x) = |λ| q(x) ;
(ii) sous-additivité : ∀x, y ∈ E, q(x + y) ≤ q(x) + q(y).
Comme q(0) = 0 par (i), il ne manque que l’implication q(x) = 0 ⇒ x = 0 pour en faire une
norme.
4. Produit scalaire et espaces de Hilbert 169
est une métrique par rapport à laquelle B ∞ (Ω) et C ∞ (Ω) sont complets 4 .
Définition 4.1.
Soit E un espace vectoriel. Un produit scalaire sur E est une application (x, y) 7→
(x|y) : E × E → R qui possède les propriétés suivantes :
(PS 1) (x|x) ≥ 0 pour tout x ∈ E.
(PS 2) (x|x) = 0 ⇐⇒ x = 0.
(PS 3) (x|y) = (y|x) pour tout x, y ∈ E.
(PS 4) (λx + µy|z) = λ(x|z) + µ(y|z) pour tout λ, µ ∈ R et x, y, z ∈ E.
Un espace vectoriel muni d’un produit scalaire est appelé espace préhilbertien. 6
Remarque 4.1.
Pour les besoins de la définition, on a adopté la notation (x|y) pour le produit
scalaire afin de le distinguer de la notation (x, y) pour une paire de points de E. On
utilisera la notation (x, y) pour le produit scalaire lorsque le contexte le permet.
Théorème 4.1. Soit E un espace vectoriel muni d’un produit scalaire. L’application
déf p
x 7→ kxk = (x|x) : E → R+ (4.1)
définit une norme sur E et l’application
(x, y) 7→ kx − yk : E × E → R+ (4.2)
est une métrique sur E. De plus, on a l’ inégalité de Cauchy-Schwarz
∀x, y ∈ E, |(x|y)| ≤ kxk kyk. (4.3)
p
Démonstration. Pourp(N1), kxk = p (x|x) = 0 ⇐⇒ p (x|x) = 0 ⇐⇒ x = 0.
2
Pour (N2), kλxk = (λx|λx) = |λ| (x|x) = |λ| (x|x) = |λ| kxk. Pour (N3),
pour tout λ ∈ R
0 ≤ (x + λy|x + λy) = (x|x) + λ2 (y|y) + 2λ(x|y)
2
p p
⇒ |(x|y)| − (x|x) (y|y) ≤ 0 ⇒ (x|y) ≤ |(x|y)| ≤ (x|x) (y|y).
3. Voir la propriété (iv) du paragraphe 2.2 du Chapitre 3, page 58.
4. Ce sont des espaces de Fréchet.
5. Inner product en anglais pour le distinguer du produit extérieur à valeurs dans E.
6. Inner product space en anglais.
170 Chapitre 5. Espaces vectoriels, convergences et applications linéaires
Donc
Définition 4.2.
Un espace vectoriel muni d’un produit scalaire est appelé espace de Hilbert s’il
est complet pour la métrique correspondant à la norme associée à son produit
scalaire.
Exemple 4.1.
On a vu au Chapitre 3 que l’espace des suites infinies
( ∞
)
X
2 déf 2
ℓ = x = (x1 , x2 , . . . ) : xi ∈ R et |xi | < ∞ ,
i=1
Exemple 4.2.
Soit C 0 ([0, 2]) l’espace de Banach des fonctions continues sur [0, 2] muni de la norme
du sup. En utilisant l’intégrale de Riemann, il est facile de vérifier que la fonction
Z 2
déf
(f, g) 7→ (f |g) = f (x) g(x) dx : C 0 ([0, 2]) × C 0 ([0, 2]) → R (4.6)
0
4. Produit scalaire et espaces de Hilbert 171
est un produit scalaire sur C 0 ([0, 2]). L’espace C 0 ([0, 2]) muni de ce produit scalaire
est préhilbertien, mais il n’est pas complet par rapport à la norme associée
Z 1/2
p 2
2
kf kL2 = (f, f ) = f (x) ) dx .
0
En effet, considérons la suite de fonctions 7 {fn } ⊂ C 0 ([0, 2]) définies comme suit :
pour chaque entier n ≥ 1
1, si 0 ≤ x ≤ 1,
1
fn (x) = 1 − n (x − 1),
déf si 1 < x < 1 + ,
n (4.7)
1
0, si 1 + ≤ x ≤ 2.
n
Ce n’est pas une suite de Cauchy dans pour la norme du supremum puisque
Mais elle est Cauchy pour la norme k kL2 . En effet, pour m > n > N
0, si 0 ≤ x ≤ 1
1
(m − n) (x − 1),
si 1 < x < 1 +
m
déf
fn (x) − fm (x) = 1 1 (4.8)
1 − n (x − 1), si 1 + ≤x<1+
m n
1
0, si 1 + ≤ x ≤ 2
n
et
Z 2
|fn (x) − fm (x)|2 dx
0
Z 1+1/m Z 1+1/n
2 2
= (m − n) |x − 1| dx + |1 − n (x − 1)|2 dx
1 1+1/m
h Z
1 n i2 1+1/n
≤ (m − n)2 3
+ 1− dx
3m m 1+1/m
h i h
n 2 1 n i2 1 1 1 1 41 4 1
≤ 1− + 1− − ≤ + < < .
m 3m m n m 3m n 3n 3N
Bien qu’un espace de Hilbert soit plus proche de l’espace euclidien qu’un espace
de Banach, les espaces de Hilbert de fonctions nécessitent l’introduction de la théorie
de la mesure de Lebesgue 8 pour définir l’espace L2 (Ω) des fonctions mesurables de
carré intégrable et de la théorie des distributions pour définir les espaces de Sobolev
H k (Ω) des fonctions k-fois différentiables au sens des distributuions. Ce sont les
analogues de C 0 (Ω), C 0 (Ω), C k (Ω) et C k (Ω).
On verra plus loin au Théorème 6.1 page 178 que si E est de dimension finie, alors les
applications linéaires sur E sont continue. Cependant, en général, une application
linéaire n’est pas continue et cela même si E et F sont des espaces de Hilbert.
8. Par rapport à l’intégrale de Riemann, l’intégrale de Lebesgue permet d’intégrer des fonc-
tions qui sont ni continues ni bornées. Le cadre hilbertien est aussi mieux adapté aux problèmes
de la physique impliquant un potentiel ou une énergie que la nature cherche à minimiser. C’est le
principe de la moindre quantité d’action énoncé par Maupertuis en 1746 à l’Académie des sciences
en 1744, et à l’Académie royale des sciences de Prusse. Par exemple, les solutions de problèmes
aux limites pour l’équation de Laplace satisfont le principe de Dirichlet.
5. Applications linéaires et linéaires continues 173
Exemple 5.1.
La fonction
df
f 7→ : C 1 ( ]0, 1[ ) → C 0 ( ]0, 1[ )
dx
est linéaire. Elle n’est pas continue si C 1 ( ]0, 1[ ) est équippé de la norme
kf kC 0 ( ]0,1[ ) = sup |f (x)|,
0<x<1
mais elle l’est pour la norme kf kC 1 ( ]0,1[ ) définie en (3.3) page 167.
Théorème 5.1. Soit f : E → F une application linéaire entre deux espaces normés
E et F . Les propriétés suivantes sont équivalentes.
(i) f est continue sur E.
(ii) f est continue en 0.
(iii) f est uniformément continue sur E.
(iv) Il existe M > 0 tel que
∀x ∈ E, kf (x)kF ≤ M kxkE . (5.4)
Remarque 5.1.
De la partie (iv), on a aussi que f est lipschitzienne sur E :
∀x, y ∈ E, kf (y) − f (x)kF = kf (y − x)kF ≤ M ky − xkE .
174 Chapitre 5. Espaces vectoriels, convergences et applications linéaires
Théorème 5.2. Soit f : E → F une application linéaire entre deux espaces normés
E et F .
(i) La fonction
déf
x 7→ kxkf = kxkE + kf (x)kF (5.5)
kλxkE + kf (λx)kF = |λ| kxkE + kλf (x)kF = |λ| kxkE + |λ| kf (x)kF = |λ| kxkf .
(N3)
(ii) La fonction
déf kf (x)kF
f 7→ kf kL(E,F ) = sup : L(E, F ) → R+ (5.8)
06=x∈E kxkE
Remarque 5.2.
On voit facilement que kf kL(E,R) est la partie c(f, E) de la norme 9 sur C 0,1 (E).
Il est intéressante de noter que, pour les applications linéaires et continues, c(f, E)
devient une norme ce qui permet d’écarter la contrainte que f soit bornée sur E. En
effet, c(f, E) = 0 implique que f est constante, mais comme f est linéaire f (0) = 0
ce qui force la constante à être nulle.
(iii) Soit {fn } une suite de Cauchy dans L(E, F ) : pour tout ε > 0, il existe
N > 0 tel que, pour tout m, n > N ,
Pour chaque x 6= 0, la suite {fn (x)} est une suite de Cauchy et, comme F est
complet, il existe une limite f (x) ∈ F tel que fn (x) → f (x). Pour x = 0, fn (0) =
0 → 0 et on prend f (0) = 0. La fonction f est linéaire car pour tout x, x′ ∈ E et
λ, µ ∈ R,
et d’utiliser la matrice tranposée ~x⊤ pour écrire le produit scalaire comme produit
de deux matrices
y1
⊤
.
x · y = ~x ~y = x1 . . . xn .. . (6.3)
yn
(iii) On dit qu’un sous-espace linéaire S de Rn est de dimension k s’il existe une
suite {x1 , . . . , xk } linéairement indépendante et toute suite {y1 , . . . , yℓ },
ℓ > k, est linéairement dépendante. On écrira dim S = k.
(iv) On associe à U ⊂ Rn , 10 le plus petit sous-espace linéaire de Rn qui contient
U
déf
\
Vect (U ) = S. (6.4)
S sous-espace linéaire
tel que U⊂S
On peut vérifier que tout sous-espace linéaire de Rn est fermé dans Rn et que
Vect (U ) est aussi un sous-espace linéaire fermé.
Définition 6.2.
La base canonique orthonormale de Rn est l’ensemble {eni ∈ Rn : 1 ≤ i ≤ n},
(
déf déf 1, si i = j
(eni )j = δij , δij =
0, si i 6= j,
en1 = (1, 0, 0, . . . , 0, 0), en2 = (0, 1, 0, n . . . , 0, 0), ..., enn = (0, 0, 0, . . . , 0, 1).
En particulier, eni · enj = δij . La fonction de deux indices δij est appelée symbole de
Kronecker.
Remarque 6.1.
(i) Si l’on utilise une autre norme kak∗ que la norme euclidienne kak dans la partie
(i) du théorème, on n’aura que l’inégalité kf kL(Rn ,R) ≤ kak∗ . En général, les normes
kf kL(Rn ,R) et kak∗ seront équivalentes, mais pas égales.
(ii) La norme de Frobénius kAk2 est équivalente mais pas égale à la norme
kLkL(Rn ,Rm ) de l’application linéaire correspondante.
Le vecteur g est unique. Pour tout ε > 0, on prend δ = ε/(kgk + 1). De là,
Mais, comme |f (g)| = |g · g| = kgk2, le supremum est atteint et kf kL(Rn ,R) = kgk.
(ii) On applique (i) à chaque composante Li (x) = ei · L(x) de L : il existe
ai ∈ Rn tel que Li (x) = ai · x. En utilisant les composantes (ai1 , . . . , ain ) de chaque
ai , on forme ainsi la matrice A :
L1 (x) a1 · x a11 . . . a1n x1
.. .. .. . .. .
.. ...
L(x) = . = . = .
Ln (x) an · x an1 . . . ann xn
| {z } | {z }
A x
L◦M
des matrices A et B et
kABk2 kAk2 kBk2
z }| { z }| {
1/2 z( }| {
)1/2 1/2
Xm X
n m X
X ℓ X X
ℓ n
(A B)2ij ≤ a2ik b2kj . (6.10)
i=1 j=1 i=1 k=1 k=1 j=1
(S ⊥ )⊥ = S.
∀h ∈ U ⊥ , h · (αx + βy) = α h · x + β h · y = α0 + β 0 = 0
et h ∈ (Vect U )⊥ .
(iv) De la partie (i) on sait que S ⊂ (S ⊥ )⊥ . La réciproque n’est en général
pas vraie, mais ici S est un sous-espace linéaire. On considère le problème de mini-
misation suivant pour un point arbitraire z ∈ (S ⊥ )⊥ :
déf 1
inf f (x), f (x) = kx − zk2 .
x∈S 2
182 Chapitre 5. Espaces vectoriels, convergences et applications linéaires
déf
Ce problème possède une solution x0 ∈ S. En effet, comme f (x) ≥ 0, m =
inf f (S) ∈ R. Soit M > m, alors
déf
∃x ∈ S, m ≤ f (x) < M 6 ∅.
⇒ SM = {x ∈ S : f (x) ≤ M } =
Puisque f est continue sur Rn , SM est fermé. Il est aussi borné car
1 √
∀x ∈ SM , kx − zk2 ≤ M ⇒ kx − zk ≤ 2M .
2
Donc, SM est compact, f (SM ) est compact et inf f (SM ) ∈ f (SM ). Comme m =
inf f (S) = inf f (SM ), il existe x0 ∈ SM ⊂ S tel que m = f (x0 ). Pour tout t > 0 et
tout s ∈ S, x0 + ts ∈ S, f (x0 + ts) ≥ f (x0 ) et
f (x0 + ts) − f (x0 ) t
0≤ = (x0 − z) · s + ksk2 → (x0 − z) · s
t 2
lorsque t → 0. Comme S est linéaire, ±s ∈ S et
±(x0 − z) · s ≥ 0 ⇒ ∀s ∈ S, (x0 − z) · s = 0.
(x0 − z) · x0 = 0 et (x0 − z) · z = 0.
| {z } ∈S | {z } ∈(S ⊥ )⊥
∈S ⊥ ∈S ⊥
On obtient finalement
et (S ⊥ )⊥ ⊂ S.
(v) découle des parties (iii) et (iv).
Soit l’application linéaire A : Rn → Rm (qui admet pour représentation une
matrice m × n). On définit l’application transposée ou adjointe A⊤ : Rm → Rn de
A : Rn → Rm par le processus suivant. Pour tout y ∈ Rm , l’application x 7→ y · Ax :
Rn → R est linéaire. Il existe donc un unique vecteur a(y) ∈ Rn tel que
∀x ∈ Rn , a(y) · x = y · Ax
∀x ∈ Rn , y ∈ Rm , y · Ax = A⊤ y · x. (6.12)
Si Aij = Aeni · em
j est la matrice n × m associée à A pour les bases orthonormales
n m
canoniques {eni : 1 ≤ i ≤ n} et {em j : 1 ≤ j ≤ m} de R et R , alors la matrice
⊤ ⊤
m × n associée à A est donnée par (A )ij = Aji .
Théorème 6.4. (i) Pour tout A ∈ L(Rn , Rm ), on a l’identité
L’application
est continue.
(iii) Pour tout A ∈ L(Rn , Rm ), on a les identités suivantes :
(A⊤ )⊤ = A (6.13)
[Im A]⊥ = Ker(A⊤ ) (6.14)
⊥ ⊤
[Ker A] = Im (A ). (6.15)
⊤
A injective ⇐⇒ Ker A = {0} ⇐⇒ A surjective.
|Ax · y|
kAxk = kAxkL(Rn ,R) = sup
06=y∈Rm kyk
kAxk |Ax · y|
⇒ kAkL(Rn ,Rm ) = sup = sup sup
06=x∈Rn kxk 06=x∈R 06=y∈R kxk kyk
n m
|x · A⊤ y|
kA⊤ yk = kA⊤ ykL(Rm ,R) = sup
06=x∈Rn kxk
⊤
kA yk |x · A⊤ y|
⇒ kA⊤ kL(Rm ,Rn ) = sup = sup sup .
06=y∈Rm kyk 06=y∈Rm 06=x∈Rn kxk kyk
(ii) Soient (A, B), (C, D) ∈ L(Rℓ , Rm )×L(Rn Rℓ ). En utilisant (i) et l’inégalité
(6.8) du Théorème 6.2 (i) :
kC ◦ D − A ◦ Bk ≤ kC ◦ D − C ◦ Bk + kC ◦ B − A ◦ Bk
≤ k(C ◦ D − C ◦ B)⊤ k + k(C − A) ◦ Bk
≤ kD⊤ ◦ C ⊤ − B ⊤ ◦ C ⊤ k + kC − Ak kBk
≤ k(D⊤ − B ⊤ ) ◦ C ⊤ k + kC − Ak kBk
≤ k(D − B)⊤ k kC ⊤ k + kC − Ak kBk
≤ kD − Bk kCk + kC − Ak kBk
≤ max{kCk, kBk} (kD − Bk + kC − Ak) |
≤ kD − Bk kCk + kC − Ak kBk
≤ max{kC − Ak + kAk, kBk} (kD − Bk + kC − Ak) .
kC − Ak + kD − Bk < δ,
il vient
Ax · y = x · A⊤ y = (A⊤ )⊤ x · y.
Donc,
b) Par définition,
[Im A]⊥ = {y ∈ Rm : Ax · y = 0, ∀x ∈ Rn }.
Mais
0 = Ax · y = x · A⊤ y, ∀x ∈ Rn ⇒ A⊤ y = 0 ⇒ y ∈ Ker A⊤ .
Réciproquement,
y ∈ Ker A⊤ ⇒ A⊤ y = 0 ⇒ ∀x ∈ Rn , x · A⊤ y = 0
et
0 = x · A⊤ y = Ax · y, ∀x ∈ Rn ⇒ y ∈ [Im A]⊥ .
7. Groupe général linéaire : métriques et complétude 185
Enfin par le Théorème 6.3, comme Im A⊤ est un sous-espace linéaire (Im A⊤ )⊥⊥ =
Im A⊤ . d) Conéquence de (c).
(iv) L’image d’un convexe est un convexe par linéarité.
Définition 7.1.
Soit X un ensemble arbitraire et une opération sur X × X que l’on notera +. On
dira que (X, +) est un groupe si les propriétés (ou axiomes) suivantes sont vérifiées :
(i) pour tous x, y ∈ X, x + y ∈ X (loi de composition interne) ;
(ii) pour tous x, y, z ∈ X, (x + y) + z = x + (y + z) (associativité) ;
(iii) il existe un élément neutre 0 pour lequel x + 0 = x = 0 + x quelque soit
x∈X;
(iv) chaque x ∈ X possède un inverse ou opposé −x tel que x + (−x) = 0 =
(−x) + x.
On dira que le groupe est commutatif ou abélien si, en plus, x + y = y + x pour tous
x, y ∈ X.
déf
GL (n) = {A ∈ L(Rn ) : A bijective} . (7.1)
GL (n) peut être identifié avec le groupe des matrices n × n inversibles muni de
la multiplication matricielle. Pour simplifier, on utilisera la même notation pour
l’application linéaire et sa matrice associée.
On aura besoin plus tard du résultat technique suivant.
B −1 − A−1 = B −1 (A − B) A−1
kB −1 kL(Rn )
kB −1 kL(Rn ) − kA−1 kL(Rn ) ≤ kB −1 − A−1 kL(Rn ) ≤ kA − BkL(Rn )
α
α − kA − BkL(Rn ) 1
⇒ kB −1 kL(Rn ) ≤ kA−1 kL(Rn ) =
α α
1
⇒ kB −1 kL(Rn ) ≤
α − kA − BkL(Rn )
si kA − BkL(Rn ) < α. De plus,
I = An ◦ A−1
n → A◦B et I = A−1
n ◦ An → B ◦ A
est continue par rapport à la norme kAkL(Rn ) + kBkL(Rn ) sur L(Rn ) × L(Rn ). Donc
est continue par rapport à la norme kA−1 kL(Rn ) + kB −1 kL(Rn ) ce qui entraı̂ne la
continuité de la composition pour la métrique d0 .
qui vérifie les deux premiers axiomes d’une métrique. Pour (M1)
A = F1 ◦ · · · ◦ Fk , Fi ∈ GL (n),
k
X
d(A, B) = inf kFi − IkL(Rn ) + kFi−1 − IkL(Rn )
F1 ,...,Fk ∈GL (n)
i=1
A◦B −1 =F1 ◦···◦Fk
≤ kI − IkL(Rn ) + kI −1 − IkL(Rn ) = 0.
Dans l’autre sens, par le Lemme 7.2, d(A◦B −1 , I) = d(A, B) = 0 implique A◦B −1 =
I et A = B ce qui vérifie l’axiome (M1). L’axiome (M2) est immédiat puisque
A ◦ B −1 = F1 ◦ · · · ◦ Fk , Fi ∈ GL (n),
B ◦ C −1 = G1 ◦ · · · ◦ Gℓ , Gj ∈ GL (n), .
A ◦ C −1 = F1 ◦ · · · ◦ Fk ◦ G1 ◦ · · · ◦ Gℓ
15. Voir les travaux de R. Azencott [2] en 1994 et de A. Trouvé [1, 2, 3] en 1995 et les
travaux de F. Mémoli [1] et F. Mémoli et G. Sapiro [1] basés sur les idées de M. Gromov [1]
pour les structures métriques et les isométries (Prix Abel 2009).
192 Chapitre 5. Espaces vectoriels, convergences et applications linéaires
de A ◦ C −1 . Par définiton
k
X
d(A, C) ≤ kFi − IkL(Rn ) + kFi−1 − IkL(Rn )
i=1
ℓ
X
+ kGj − IkL(Rn ) + kGj−1 − IkL(Rn )
j=1
k
X
⇒ d(A, C) ≤ inf kFi − IkL(Rn ) + kFi−1 − IkL(Rn )
F1 ,...,Fk ∈GL (n)
i=1
A◦B −1 =F1 ◦···◦Fk
ℓ
X
+ inf kGj − IkL(Rn ) + kG−1
j − IkL(Rn )
G1 ,...,Gℓ ∈GL (n)
j=1
B◦C −1 =G1 ◦···◦Gℓ
(ii) Il reste à démontrer que GL (n) est complet par rapport à cette métrique.
Soit {An } une suite de Cauchy dans (GL (n), d). On procède en quatre étapes.
n
(a) Bornitude de {An } et {A−1 n } dans L(R ). Par l’inégalité du triangle
{d(I, An )} est Cauchy, et donc bornée par une constante L. Du Lemme 7.2
∀n ≥ 1, kAn − Ik + kA−1
n − Ik ≤ d(An , I) e
d(An ,I)
≤ L eL
déf
⇒ kAn k + kA−1 −1 −1 L
n k ≤ kIk + kAn − Ik + kIk + kAn − Ik ≤ c = 2 + L e .
n
Les suites {An } et {A−1
n } sont donc bornées dans L(R ).
−1 n
(b) Convergence de {An } et {An } dans L(R ). Pour tout m, n
An − Am = (An ◦ A−1
m − I) ◦ Am et A−1 −1 −1 −1
n − Am = (An ◦ Am − I) ◦ Am
et
−1
kAm − An k ≤ kAn ◦ Am − Ik kAm k ≤ c kAn ◦ A−1
m − Ik
kA−1 −1 −1 −1 −1
m − An k ≤ kAn ◦ Am − Ik kAm k ≤ c kAn ◦ Am − Ik
kAm − An k + kA−1 −1 −1 −1
m − An k ≤ c (kAn ◦ Am − Ik + kAn ◦ Am − Ik)
≤ c d(An , Am ) ed(An,Am ) .
n
Les suites {An } et {A−1n } sont donc Cauchy dans l’espace de Banach L(R ) et il
n −1
existe A et B dans L(R ) tel que An → A et An → B.
(c) A est bijective. Par le Théorème 6.4 (ii), la composition (F, G) 7→ F ◦ G :
L(Rn ) × L(Rn ) → L(Rn ) est continue :
I = An ◦ A−1
n →A◦B et I = An−1 ◦ An → B ◦ A.
7. Groupe général linéaire : métriques et complétude 193
Finalement,
k
X Pk
kFi −Ik
kA − Ik =kF1 ◦ · · · + ◦Fk − Ik ≤ kFi − Ik e i=1 ,
i=1
194 Chapitre 5. Espaces vectoriels, convergences et applications linéaires
k
X Pk
kFi−1 −Ik
kA−1 − Ik ≤ kFi−1 − Ik e i=1
i=1
k
X Pk
kFi − Ik + kFi−1 − Ik e i=1 (kFi −Ik+kFi −Ik) .
−1
⇒ kA−1 − Ik + kA−1 − Ik ≤
i=1
8 Exercices
Exercice 8.1.
Soit {fn } une suite de fonctions dans C 0 (K), K ⊂ Rn compact. Montrer que si
{fn } est uniformément équicontinue et que pour chaque x ∈ K, la suite {fn (x)}
dans R converge vers une fonction f : K → R,
fn (x) → f (x),
∀α, ∀x, y ∈ K tel que ky − xk < δ, |fα (y) − fα (x)| < ε.)
Exercice 8.2.
Soit (X, d) un espace métrique compact, l’ensemble
déf
X = {A : ∅ 6= A ⊂ X et A fermé}
déf
et ∀A ∈ X , ∀x ∈ X, dA (x) = inf d(a, x).
a∈A
déf
(A, B) 7→ ρX (A, B) = sup |dA (x) − dB (x)| : X × X → R+
x∈X
Exercice 8.3.
Soit Ω un sous-ensemble ouvert non-vide de Rn . Montrer qu’il existe une suite
croissante de compacts non vides Kk tel que Ω = ∪k≥1 Kk et, pour tout compact
K ⊂ Ω, il existe k ≥ 1 tel que K ⊂ Kk .
Exercice 8.4.
Soit Ω un ouvert non-vide de Rn et
déf
C(Ω) = {f : Ω → R |f continue sur Ω}
l’espace des fonctions continues sur Ω, où Ω n’est pas nécessairement borné. Soit
{Kk } la famille des sous-ensembles compacts construite dans l’Exercice 8.3 et pour
tout f ∈ C(Ω) et k ≥ 1 on pose
déf
qk (f ) = sup |f (x)|.
x∈Kk
Exercice 8.5. (i) Montrer que si A ∈ L(Rn ) est inversible, alors A−1 ∈ L(Rn ).
(ii) Montrer que si A ∈ L(Rn , Rm ) est injective, alors A⊤ A ∈ L(Rn ) est inver-
sible, où A⊤ ∈ L(Rm , Rn ) est l’application transposée de A.
(iii) Montrer que pour A ∈ L(Rn , Rm ), Ker A et Im A sont des sous-espaces
linéaires (espaces vectoriels).
Exercice 8.6. (i) Trouver et caractériser tous les A ∈ GL (n) tels que
forme un groupe ?
Exercice 8.7.
Soit X = R \{0} et la fonction
déf 1 1
x, y 7→ d(x, y) = |x − y| + − .
x y
Exercice 8.8.
On considère l’ensemble P(X) des sous-ensembles d’un ensemble arbitraire X in-
cluant l’ensemble vide ∅ muni de l’opération différence symétrique △
déf
A △ B = [A\B] ∪ [B\A] .
Montrer que (P(X), △) vérifie les propriétés d’un groupe abélien ((i) à (v)) :
(i) pour tous A, B ∈ P(X), A △ B ∈ P(X) ;
(ii) pour tous A, B, C ∈ P(X), (A △ B) △ C = A △ (B △ C) ;
(iii) ∅ est l’élément neutre pour lequel A △ ∅ = A = A △ ∅ pour tout
A ∈ P(X) ;
(iv) chaque A ∈ P(X) possède un inverse puisque A △ A = ∅. Ici A est son
propre inverse, c’est-à-dire, A−1 = A ;
(v) (commutativité) A △ B = B △ A ;
(vi) pour A, B, C ∈ P(X), (A △ B) ∩ C = (A ∩ C) △ (B ∩ C).
Exercice 8.9.
Soit X un ensemble arbitraire et P(X) l’ensemble de tous les sous-ensembles de X
incluant l’ensemble vide ∅. Soit l’ensemble
déf
{0, 1}X = {toutes les applications f : X → {0, 1}}
de toutes les applications définies sur X à valeurs dans l’ensemble à deux éléments
{0, 1}. On associe à chaque A ∈ P(X) la fonction caractéristique
(
déf 1, si x ∈ A
χA (x) =
0, si x ∈ X\A.
et en déduire que
définit une métrique sur {0, 1}X et que ({0, 1}X , d) est complet.
(iv) Montrer que (P(X), ρ) est un espace métrique complet pour la métrique
déf
ρ(A, B) = sup |χA (x) − χB (x)| .
x∈X
(v) En supposant démontré que P(X) est un groupe abélien pour l’opération
binaire différence symétrique (8.5) (voir la section 7.1), montrer que △ est
continue par rapport à la métrique ρ.
k
!1/2
déf
X
2
kf kC 0 = sup kf (x)k, kyk = |yi | . (8.7)
x∈X i=1
1 Introduction
Selon certains historiens le calcul différentiel ou infinitésimal serait implicite-
ment apparu très tôt. Par exemple, le mathématicien astronome Aryabhata (476–
550 ap. J.-C.) en 499 ap. J.-C. utilisait une notion d’infinitésimaux et exprimait
un problème d’astronomie sous la forme d’une équation différentielle élémentaire. 1
Pour d’autres historiens, le calcul différentiel fut inventé au XVIIe siècle.
Si l’on accepte ce point de vue, la première idée du calcul différentiel et de la
règle pour le calcul des extrema d’une fonction remonteraient à Pierre de Fermat 2
en 1638. Il imagina, pour déterminer les maxima et minima d’une fonction et les
tangentes à certaines courbes 3 , une méthode, dite de maximis et minimis, qui le fait
regarder comme le premier inventeur du calcul différentiel. Les idées menant aux
notions de fonction, de dérivée, et d’intégrale furent développées pendant le XVIIe
siècle. Il est généralement accepté que la notion de dérivée est due à Leibniz 4
et Newton. 5 La condition obtenue par Fermat pour l’extremum d’une fonction
algébrique est donc de facto généralisée sous la forme f ′ (x) = 0. Elle est utilisée en
1691 dans la démonstration du Théorème de Rolle 6 qui mène à la règle de l’Hôpital 7
en 1696.
La publication des principaux ouvrages de Newton 8 prit plusieurs années,
1. George G. Joseph, The Crest of the Peacock, Princeton University Press (2000), pp. 298–
300.
2. Pierre de Fermat (1601–1665).
3. D’abord consignée dans une lettre à Mersenne (le correspondant de nombreux scientifiques
de l’époque qui assurait la diffusion de nouveaux résultats) en 1638, la première version imprimée
de la méthode se trouve dans le cinquième volume de Supplementum Cursus Mathematici (1642)
écrit par Herigone, et ce n’est qu’en 1679 qu’elle apparaı̂t dans Varia opera mathematica sous
le titre de Methodus ad disquirendam Maximam et Minimam suivie de De tangentibus linearum
curvarum.
4. Gottfried Wilhelm Leibniz (1646–1716).
5. Sir Isaac Newton (1643–1728).
6. Michel Rolle (1652–1719).
7. Guillaume François Antoine de l’Hôpital (1661–1704).
8. La Method of Fluxions complétée 1671 et publiéee en 1736 et Philosophiae Naturalis
199
200 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
alors que Leibniz publia le premier (Nova methodus, 9 1684) et le domaine fut
subséquemment tourmenté par une querelle de priorité entre les deux inventeurs
du calcul.
≪Au début du calcul différentiel, l’utilisation de quantités infinitési-
Définition 2.1.
Soit f : R → R une fonction numérique d’une variable réelle.
(i) La fonction f est dérivable à droite en x ∈ R si la limite
f (x + t) − f (x)
lim+ (2.1)
tց0 t
existe et est finie où limtց0+ signifie que t tend vers 0 par valeurs stricte-
ment positives. On l’écrira df (x; +1).
Principia Mathematica (Principes mathématiques de philosophie naturelle), souvent abrégé en
Principia (Principes), 1687 et 1726 (troisième édition).
9. Nova methodus pro maximis et minimis, itemque tangentibus, quae nec fractas nec ir-
rationales quantitates moratur, et singulare pro illis calculi genus (Nouvelle méthode pour les
maxima et minima, ainsi que les tangentes, qui ne bute ni sur les fractions ni sur les irration-
nelles, avec un mode original de calcul), dans Acta Eruditorum, 1684, un journal créé à Leipzig
deux ans plus tôt.
10. Augustin-Louis Cauchy (1789–1857).
11. Karl Theodor Wilhelm Weierstrass (1815–1897).
2. Fonctions numériques d’une variable réelle 201
Les dérivées à droite et à gauche sont aussi des cas particuliers des différentielles de
Dini 13 .
Remarque 2.1.
Si f est dérivable à droite en x ∈ R, on a l’homogénéité positive :
déf f (x + αt) − f (x)
∀α ≥ 0, df (x; α) = lim = α df (x; +1), df (x; 0) = 0; (2.6)
tց0+ t
de même, si f est dérivable à gauche en x ∈ R, on a l’homogénéité positive :
déf f (x − αt) − f (x)
∀α ≥ 0, df (x; −α) = lim = α df (x; −1), df (x; 0) = 0. (2.7)
tց0+ t
On remarquera facilement que si f est dérivable en x, alors
f (x) .
f (x) . f (x) .
x x x
f dérivable à droite f dérivable à gauche f dérivable à gauche
en x. en x. et à droite en x.
f (x) .
f (x) .
x x
f dérivable en x. f n’est dérivable ni à gauche
ni à droite en x.
f (x + t) − f (x)
∀t, 0 < t < δ(x), − df (x; 1) < ε.
t
alors
0 < t < δ ′ (x) entraı̂ne |f (x + t) − f (x)| < t c(ε, x) < ε
Remarque 2.2.
On rappelle que pour les fonctions dérivables en x, les opérations ponctuelles de
somme de deux fonctions, de multiplication par un réel, de multiplication et de
division par une fonction non-nulle sont dérivables en x. De plus, la composition
(f ◦ g)(x) = f (g(x)) est dérivable en x si f ′ (g(x)) et g ′ (x) existent et sa dérivée est
donnée par (f ◦ g)′ (x) = f ′ (g(x)) g ′ (x) (voir l’Exercice 7.1).
Exemple 2.1.
Soit la fonction définie par
x sin 1 , x 6= 0
déf
f (x) = x (2.12)
0, x = 0.
f (t) − f (0) 1
− 0 = sin , t 6= 0;
t t
qui ne possède pas de limite lorsque t → 0. Ainsi f est dérivable partout dans R
sauf en x = 0. Il n’y a pas non plus de dérivée à droite ou à gauche en x = 0.
Exemple 2.2.
Soit la fonction définie par
(
déf x2 sin x1 , x 6= 0
f (x) = (2.13)
0, x = 0.
f (t) − f (0) 1
− 0 = t sin − 0 ≤ |t|, t 6= 0;
t t
Cet exemple montre qu’une fonction dérivable en tout point peut avoir une
dérivée qui ne soit pas continue en certains points. Ceci ne veut cependant pas
dire que n’importe quelle fonction puisse être la dérivée d’une fonction continue et
dérivable en tout point. En effet la dérivée d’une fonction continue et dérivable en
tout point d’un intervalle ouvert possède une propriété importante dont jouissent
aussi les fonctions continues sur un intervalle : elles passent par tous les points
intermédiaires (§ 2.3, Théorème 2.5).
Si f est dérivable en x, on a
f ′ (x) = 0. (2.15)
Démonstration. Comme x est un point intérieur de [a, b], on peut choisir un δ > 0
tel que ] a, b [ ⊃ V (x) ⊃ Iδ = ] x − δ, x + δ [. On a donc
∀y ∈ Iδ , f (y) ≤ f (x).
2. Fonctions numériques d’une variable réelle 205
f (x − t) − f (x)
≤0 ⇒ df (x; −1) ≤ 0
t
f (x + t) − f (x)
≤0 ⇒ df (x; +1) ≤ 0.
t
Mais comme f est dérivable en x, on a 0 ≥ df (x; −1) = −df (x; +1) ≥ 0 et donc
f ′ (x) = df (x; +1) = 0.
Théorème 2.3. Si f et g sont deux fonctions continues sur [a, b] et dérivables sur
]a, b[ , alors il existe un point x ∈ ]a, b[ auquel
Démonstration. On pose
Théorème 2.4 (de la moyenne). Si f est econtinue sur [a, b] et dérivable partout
dans ]a, b[ , il existe un point x ∈ ]a, b[ pour lequel
Théorème 2.6 (Taylor 14 ). Soit f : ]a, b[ → R tel que f (n) existe dans ]a, b[ pour
un entier n ≥ 1. Étant donné x, a < x < b, on définit le polynôme de degré n − 1
n−1
X
déf f (k) (x)
Px (y) = (y − x)k , a < y < b. (2.19)
k!
k=0
Il suffit alors de démontrer qu’il existe θn ∈ ]0, 1[ tel que g(1) = 0 = g (n) (θn ) pour
obtenir que M = f (n) (x+θn (y −x)) et, en substituant dans (2.21), la formule (2.20).
En effet, la fonction g est continue sur [0, 1] et dérivable sur [0, 1] et g(1) = g(0) = 0.
Par le Théorème 2.4, il existe θ1 ∈ ]0, 1[ tel que 0 = g(1)−g(0) = g ′ (θ1 ). De nouveau,
par le Théorème 2.4, il existe θ2 ∈ ]0, θ1 [ tel que 0 = g ′ (θ1 ) − g ′ (0) = θ1 g (2) (θ2 ) et
donc g (2) (θ2 ) = 0. Ainsi de suite jusqu’à la dernière étape : il existe θn ∈ ]0, θn−1 [ tel
que 0 = g (n−1) (θn−1 ) − g (n−1) (0) = θn−1 g (n) (θn ) et donc g (n) (θn ) = 0. Finalement,
g(1) = 0 entraı̂ne g (n) (θn ) = 0 et, comme y 6= x, M = f (n) (x + θn (y − x)).
14. Brook Taylor (1685–1731).
208 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
Définition 3.1.
Soient f : Rn → Rm , x un point de Rn et v ∈ Rn une direction.
(i) f est dérivable au point x dans la direction v si la limite suivante existe
f (x + tv) − f (x)
lim . (3.2)
t→0 t
Lorsque la limite (3.2) existe, on la désignera par f ′ (x; v). Par définition
f ′ (x; 0) = 0 et on a l’homogénéité
Remarque 3.1.
Attention. Dans plusieurs ouvrages on dit que f est Gateaux différentiable si elle
possède une dérivée directionnelle dans toutes les directions v. On retrouve effecti-
vement cette notion dans les articles posthumes de Gateaux. 19 Dans nos notes, ce
terme est réservé à la notion (iii) plus forte où nous imposons en plus la linéarité
par rapport à v.
(f + g)′ (x; v) = f ′ (x; v) + g ′ (x; v), ∀α ∈ R, (αf )′ (x; v) = αf ′ (x; v), (3.4)
(f · g)′ (x; v) = f ′ (x; v) · g(x) + f (x) · g ′ (x; v), (3.5)
18. Carl Jacobi (1804–1851) frère du physicien Moritz Hermann von Jacobi. Il établit la théorie
des déterminants fonctionnels, appelés depuis jacobiens.
19. ≪. . .Nous allons emprunter au Calcul fonctionnel la notion de variation, qui nous rendra les
services que
h rend la différentielle
i totale dans la théorie des fonctions d’un nombre fini de variables.
d
δF (x) = dλ F (x + λ δx) (cf. R. Gateaux [7, page 83]). . . .≫
λ=0 h i
≪. . .Considérons U (z + λ t1 ). Supposons que
d
dλ
U (z + λ t1 ) existe quel que soit t1 . On
λ=0
l’appelle la variation première de U au point z : δU (z, t1 ). C’est une fonction de z et t1 , qu’on
suppose habituellement linéaire, en chaque point z par rapport à t1 . . . .(cf. R. Gateaux [6, page
11]).. . .≫
210 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
Exemple 3.1.
Soit la fonction x 7→ fi (x) = xi : Rn → R, 1 ≤ i ≤ n. Alors, pour t 6= 0 et v ∈ Rn
fi (x + tv) − fi (x) (x + tv)i − xi
= = vi
t t
et l’application v 7→ fi′ (x; v) = vi : Rn → R est linéaire. La fonction fi est donc
Gateaux différentiable en tout point x ∈ Rn .
À partir de ce résultat, on peut considérer la fonction x 7→ fi2 (x) = |xi |2 :
n
R → R, 1 ≤ i ≤ n. Comme |xi |2 = xi xi = fi (x) fi (x), il vient de la partie (ii) du
théorème :
∀v ∈ Rn , (fi2 )′ (x; v) = 2 xi vi
et l’application v 7→ (fi2 )′ 2(x; v) = 2 xi vi : Rn → R est linéaire. La fonction fi2 est
donc Gateaux différentiable en tout point x ∈ Rn . P
n
Pour le carré de la norme x 7→ g(x) = kxk2 = i=1 |xi |2 : Rn → R, il vient de
la partie (ii) du théorème :
n
X
∀v ∈ Rn , g(x; v) = 2 xi vi = 2 x · v.
i=1
3. Fonctions de plusieurs variables réelles 211
Le second exemple est celui d’une fonction continue et dérivable dans toutes
les directions mais pas Gateaux différentiable.
Exemple 3.2.
Soit la fonction
x31
, si (x1 , x2 ) 6= (0, 0)
f (x1 , x2 ) = x21 + x22
0, si (x1 , x2 ) = (0, 0).
Pour x = (x1 , x2 ) 6= (0, 0), la fonction f est continue et Gateaux dérivable en x dans
toutes les directions v car elle est le quotient de deux polynômes et le dénominateur
est différent de zéro. Il suffit d’appliquer les règles du Théorèm 3.1.
On voit que f est continue en (0, 0) :
x31 x21
= |x1 | ≤ |x1 | ≤ kxk → 0 lorsque x = (x1 , x2 ) → (0, 0).
x21 + x22 x21 + x22
Pour la dérivée directionnelle en (0, 0), soient v = (v1 , v2 ) et t 6= 0. Par définition,
1 (tv1 )3
f (0 + tv) − f (0) 2 + (tv )2
, si (v1 , v2 ) 6= (0, 0)
= t (tv1 ) 2
t
0,
si (v1 , v2 ) = (0, 0)
(v1 )3
2 2
, si (v1 , v2 ) 6= (0, 0)
= (v1 ) + (v2 ) = f (v1 , v2 )
0,
si (v1 , v2 ) = (0, 0)
et donc
∀v ∈ R2 , f ′ (0, 0; v1 , v2 ) = f (v1 , v2 ).
On voit que f n’est pas Gateaux différentiable car v 7→ f ′ (0; v) n’est pas linéaire.
212 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
2.5
z
4
0
-2.5
2
-5
0
y 4
2
-2
0
x
-2
-4
-4
L’exemple 3.2 est celui d’une fonction continue et dérivable dans toutes les
directions mais pas Gateaux différentiable.
Le second exemple est très riche et important. On le retrouvera plus tard. C’est
celui d’une fonction Gateaux différentiable en (0, 0) mais pas continue en (0, 0). En
comparant avec le premier exemple, on constate que ce n’est donc pas la linéarité
qui entraı̂ne la continuité de la fonction.
est Gateaux différentiable en x = (0, 0), mais elle n’est pas continue en (0, 0).
La fonction f est continue et dérivable en x = (x1 , x2 ) 6= (0, 0) dans toutes
les directions v car elle est le quotient de deux polynômes dont le dénominateur est
différent de zéro. Il suffit d’appliquer les règles du Théorèm 3.1.
On voit que f est discontinue en x = (0, 0) en approchant de (0, 0) par le
3. Fonctions de plusieurs variables réelles 213
10
10
8
10
6
10
4
10
2
10 0
0.2
0 0.4
10
1 0.8 0.6
0.6 0.4 0.2 0 0.8
! 0.2 ! 0.4 ! 0.6 ! 0.8 1
!1
α6 1
|f (α, α2 ) − f (0, 0)| = = 2 → +∞ lorsque α → 0.
α8 α
On calcule d’abord la dérivée directionnelle de f en (0, 0). Pour v = (v1 , v2 ) 6=
(0, 0), on considère deux cas : v2 = 0 et v2 6= 0. Si v2 = 0 et v1 6= 0 pour t 6= 0
Donc
Définition 3.2.
Soient f : Rn → R et {ei : 1 ≤ i ≤ n}, (ei )j = δij , la base canonique orthonormale
de Rn . La fonction f possède des dérivées partielles en x si pour chaque i, f est
dérivable en x dans la direction ei , c’est-à-dire,
f (x + t ei ) − f (x)
∀i, 1 ≤ i ≤ n, lim existe.
t→0 t
On écrira la limite ∂i f (x) ou ∂f /∂xi (x). Par définition ∂i f (x) = f ′ (x; ei ) et la
fonction α 7→ f ′ (x; α ei ) : R → R est homogène.
′ n
Lorsque f est Gateaux différentiable en x, Pnl’application v 7→ f (x; v) : R → R
est linéaire. Donc, comme v = (v1 , . . . , vn ) = i=1 vi ei , par linéarité
X n Xn
′ ′
f (x; v) = f x; vi ei = vi f ′ (x; ei ) = g(x) · v,
i=1 i=1
en introduisant le vecteur
n
X
déf
g(x) = f ′ (x; ei ) ei ∈ Rn .
i=1
Ce vecteur est unique. En effet, s’il existe deux vecteurs g1 et g2 dans Rn tel que
∀v ∈ Rn , g1 · v = f ′ (x; v) = g2 · v,
Définition 3.3.
Soit une fonction f : Rn → R Gateaux différentiable en x ∈ Rn . On appelera
gradient de f en x l’unique vecteur ∇f (x) de Rn tel que
En particulier,
n
X
∇f (x) = ∂i f (x) ei ,
i=1
Remarque 3.2.
On a aussi Df (x)v = f ′ (x; v) = ∇(x) · v. L’application jacobienne Df (x) est
équivalente à une matrice 1 × n ou vecteur ligne et la direction v à un vecteur
colonne n × 1.
L’exemple suivant montre que, même si les dérivées partielles existent, le gra-
dient peut ne pas exister et, a fortiori, la dérivée directionnelle f ′ (x; v) peut ne pas
exister dans certaines directions v.
z
-4
0
-2
-2
0
4 y
2
2
0
x
-2
4
-4
f (0 + tv) − f (0)
f ′ (0, v) = lim = 0.
t→0 t
En particulier, si l’on prend comme base orthonormale e1 = (1, 0) et e2 = (0, 1)
de R2 , on a les dérivées partielles
∂f ∂f
(0, 0) = f ′ ((0, 0); e1 ) = 0 et (0, 0) = f ′ ((0, 0); e2 ) = 0.
∂x1 ∂x2
L’exemple montre que pour une direction (v1 , v2 ), v1 v2 6= 0 la dérivée f ′ ((0, 0); v1 , v2 )
n’existe pas et n’est donc pas égale au produit scalaire
∂f ∂f
(0, 0), (0, 0) · (v1 v2 ) = 0.
∂x1 ∂x2
Définition 3.4.
Soient {enj : j = 1, . . . , n} et {em
i : i = 1, . . . , m} les bases canoniques orthonormales
respectives dans Rn et Rm , respectivement. Si f : Rn → Rm est Gateaux différen-
tiable en x, on peut associer à l’application (linéaire) jacobienne Df (x) : Rn → Rm
la matrice jacobienne m × n.
déf
Df (x)ij = em n
i · df (x; ej ) = ∂j fi (x), 1 ≤ i ≤ m, 1 ≤ j ≤ n.
La fonction vectorielle h(t) = (x(t), y(t)) définit un chemin ou une trajectoire dans
R2 en fonction de t. Pour obtenir la différentielle au point (x, y), on peut, sans perte
20. Jacques-Salomon Hadamard (1865–1963). Il obtint d’importants résultats sur les équations
aux dérivées partielles du domaine de la physique mathématique. Il fut aussi l’un des collaborateurs
à l’élaboration de la théorie moderne de l’analyse fonctionnelle.
218 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
de généralité, prendre h(0) = (x, y). On obtient ainsi un chemin (x(t), y(t)) dans
R2 qui passe par le point (x(0), y(0)) = (x, y) avec comme tangente (x′ (0), y ′ (0))
en ce point. La différentielle en (x, y) existe lorsque l’on peut trouver une fonction
linéaire 21 L(x, y) : R2 → R tel que g ′ (0) = L(x, y)(h′ (0)) pour tout chemin h qui
passe par (x, y). La fonction L(x, y) dépend de (x, y), mais est indépendante du
choix du chemin h. C’est ce que l’on appellera le point de vue géométrique. Il se
généralise immédiatement à des fonctions définies sur des variétés en choisissant des
chemins contenus dans celles-ci dont la tangente est tangente à la variété.
Il faut retenir de la citation de Hadamard au moins deux choses :
(a) l’identité (3.17) doit être vérifiée pour tous les chemins h(t) = (x(t), y(t))
et pas seulement le long de droites ;
(b) la différentielle doit être linéaire par rapport au vecteur tangent h′ (0) =
(x′ (0), y ′ (0)).
Enfin, en choisissant le chemin h(t) = (x + tv, y + tw) pour lequel h′ (0) = (v, w),
la différentielle au sens de Hadamard entraı̂ne l’existence de la différentielle au sens
de Gateaux.
La fonction de l’exemple suivant satisfait les points (a) et (b).
Exemple 3.5.
Soit la fonction f (x, y) = x2 + 2 y 2 . On vérifie facilement que
′
dg 2x x (0)
(0) = 2x x′ (0) + 4y y ′ (0) = · ′
dt 4y y (0)
pour tout chemin h(t) = (x(t), y(t)) donné par (3.18) satisfaisant h(0) = (x, y).
Il existe cependant des fonctions pour lesquelles il n’y a pas linéarité comme le
montre l’Exemple 3.2.
déf x3 déf
f (x, y) = , si (x, y) 6= (0, 0), f (0, 0) = 0. (3.19)
x2 + y 2
21. Rappel. La fonction L(x, y) : R2 → R est linéaire par rapport au couple (v, w) si pour
tout α, β ∈ R et pour tout (v1 , w1 ), (v2 , w2 ) ∈ R2 ,
Si l’on se limite à des chemins le long de droites passant par (x, y), on retrouve
la notion plus faible de dérivée directionnelle dans la direction (v, w) en (x, y) qui
s’obtient en posant
déf
t 7→ h(t) = (x + tv, y + tw) : R → R2 , h(0) = (x, y), h′ (0) = (v, w), (3.20)
220 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
(b) il existe une application g(x) : Rn → Rm tel que pour tout v ∈ Rn et toute
suite (tn , wn ) → (0, v), tn 6= 0,
f (x + tn wn ) − f (x)
lim = g(x)(v). (3.22)
n→∞ tn
Remarque 3.3.
(i) Bien que l’on ait parlé de chemin ou de trajectoire, l’application h n’a pas besoin
d’être continue ou dérivable pour t 6= 0. Seul son comportement en t = 0 compte.
3. Fonctions de plusieurs variables réelles 221
(b) il existe une application linéaire L(x) : Rn → Rm tel que pour tout v ∈ Rn
et toute suite (tn , wn ) → (0, v), tn 6= 0,
f (x + tn wn ) − f (x)
lim = L(x) v. (3.24)
n→∞ tn
Démonstration du Théorème 3.2. (b) ⇒ (a). Soit h une fonction telle que h(0) = x
et h′ (0) existe. Alors pour toute suite {tn 6= 0} tendant vers 0 on a
déf h(tn ) − h(0)
wn = → h′ (0), ⇒ h(tn ) = x + tn wn .
tn
Comme la limite existe et est égale à g(x)(h′ (0)), on a pour toute suite {tn 6= 0}
tendant vers 0,
f (h(tn )) − f (h(0)) f (x + tn wn ) − f (x)
= → g(x)(h′ (0))
tn tn
et (f ◦ h)′ (0) = g(x)(h′ (0)).
(a) ⇒ (b). On voit immédiatement que f est directionnellement dérivable. En
effet, pour v ∈ Rn , on prend la fonction h(t) = x + tv qui vérifie bien h(0) = x et
h′ (0) = v et pour laquelle on a de la propriété (3.23) (f ◦ h)′ (0) = g(x)(h′ (0)) =
g(x)(v). Par définition de la dérivée (f ◦ h)′ (0) en t = 0, pour toute suite {tn },
tn 6= 0, tn → 0, on a
f (x + tn v) − f (x) f (h(tn )) − f (h(0))
= → (f ◦ h)′ (0) = g(x)(h′ (0))
tn tn
⇒ f ′ (x; v) = g(x)(v).
Pour obtenir plus, on procède par l’absurde. L’objectif est de construire une
fonction h qui donnera une contradiction. Supposons qu’il existe v et une suite
(tn , wn ) → (0, v), tn 6= 0, tel que la suite des quotients différentiels
déf f (x + tn wn ) − f (x)
qn =
tn
222 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
ne converge pas vers g(x)(v). Alors, il existe η > 0 tel que, pour tout k ≥ 1, il existe
nk ≥ k tel que |qnk − g(x)(v)| ≥ η. Pour simplifier la notation, on désignera par
(tn , wn ) la sous-suite (tnk , wnk ). On peut partitionner cette dernière suite en deux
suites :
{(t+ + − −
nk , wnk ) : tnk > 0} et {(tnk′ , wnk′ ) : tnk′ < 0}.
L’une d’entre elle contient un nombre infini d’éléments. Supposons, sans perte de
généralité que ce soit {(t+ +
nk , wnk ) : tnk > 0}. Encore pour simplifier la notation, on
écrira cette nouvelle sous-suite {(tn , wn )}. Elle jouit donc de la propriété :
∃η > 0 tel que ∀n ≥ 1, |qn − g(x)(v)| ≥ η.
On construit la nouvelle sous-suite (tnk , wnk ) suivante. Soit n1 le premier
n ≥ 1 tel que tn ≤ 1. Soit n2 le premier n > n1 tel que tn ≤ tn1 /2. À l’étape
k + 1, soit nk+1 le premier n > nk tel que tn ≤ tnk /2. Par construction, nk >
nk+1 and tnk+1 ≤ tnk /2 < tnk . La sous-suite {(tnk , xnk )} est telle que {tnk } soit
monotone strictement décroissante vers 0 et wnk → v. On peut donc supposer, sans
perte de généralité, que, pour la suite initiale {(tn , wn )}, la suite {tn } est monotone
strictement décroissante. Comme wn converge vers v, il existe une constante c tel
que kwn k ≤ c pour tout n et pour tout ε > 0, il existe N tel que
∀n > N, kwn − vk < ε et tn < ε/c.
On introduit maintenant la fonction h : R → Rn :
x + tv,
si t ≤ 0
déf
h(t) = x + t wn , si tn ≤ t < tn−1 , n ≥ 2,
x + tw1 , si t1 ≤ t
La fonction vectorielle h est continue en t = 0. En effet, elle est continue à gauche
puisque h(t) = x + tv → x = h(0) lorsque t < 0 tend vers 0. À droite pour
δ = tN +1 > 0 et 0 < t < δ, il existe n > N + 1 tel que tn ≤ t < tn−1 et donc
kh(t) − h(0)k = t kwn k ≤ tn−1 kwn k < tN +1 c < (ε/c) c = ε
et h est continue à droite en 0.
Pour la dérivée à droite, pour δ = tN +1 > 0 et 0 < t < δ, il existe n > N + 1
tel que tn ≤ t < tn−1 et
h(t) − h(0)
− v = kwn − vk < ε
t
et dh(0; +1) = v. Pour la dérivée à gauche on a trivialement dh(0; −1) = −v,
−dh(0; −1) = v = dh(0; +1) et en fait la dérivée existe et h′ (0) = v. Mais, par
hypothèse, pour une telle fonction h, on a l’existence de (f ◦ h)′ (0) et donc de
d(f ◦h)(0; +1) qui est égale à g(x)(v). En particulier, par construction de la fonction
h,
f (x + tn wn ) − f (x) f (h(tn )) − f (h(0))
qn = = → d(f ◦ h)(0; +1) = g(x)(v).
tn tn
Ceci contredit notre hypothèse initiale que qn 6→ g(x)(v).
3. Fonctions de plusieurs variables réelles 223
Nous verrons que ces fonctions retiennent deux propriétés importantes des fonctions
Hadamard différentiables : elles sont continues en x (Théorème 3.3) et la règle de
dérivation en chaı̂ne des fonctions composées demeure valide (Théorème 3.5).
Malheureusement, cédant à la critique, il ne pousse pas cette nouvelle notion
plus loin.
Mais comme l’a fait observer M. Paul Lévy, une telle définition n’est
pas suffisante, car une fonction différentiable à ce sens peut perdre d’im-
portantes propriétés de la différentielle des fonctions simples et en par-
ticulier la propriété (3) (la linéarité !). Tel est, par exemple, le cas pour
la fonction
s
x2
f (x, y) = x pour (x, y) 6= (0, 0) avec f (0, 0) = 0. (3.26)
x + y2
2
et que g((0, 0) n’est pas linéaire en (v, w). Loin de discréditer la nouvelle notion, cet
exemple montre qu’il existe de telles fonctions.
3.3.2 Définitions
Les équivalences du Théorème 3.2 et de son corollaire offrent le choix entre
deux définitions de la différentielle et de la dérivée directionnelle au sens de Hada-
mard : la condition (a) qui fait appel à des chemins et la (b) à des suites.
22. Voir la Remarque 3.9 à la page 233.
224 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
Remarque 3.4.
Ces définitions pour Rn sont en fait beaucoup plus générales qu’il n’en paraı̂t.
Par exemple, la fonction pourrait être définie sur un sous-ensemble M de l’espace
vectoriel Rn muni d’un espace tangent de la forme
∃ 0 6= tn → 0 et M ∋ xn → x
déf
T x M = v ∈ Rn : xn − x
tel que v = lim
n→∞ tn
ce qui donne un sens aux suites xn = x + tn wn ∈ M . La différentielle d’une fonction
f : M → R serait alors une application g(x) : Tx M → R. Si l’espace tangent Tx M
est un sous-espace linéaire de Rn , on peut imposer que g(x) soit linéaire auquel cas
on obtiendrait un gradient tangentiel ∇M f (x) ∈ Tx M tel que g(x) v = ∇M f (x) · v
pour le produit scalaire dans le sous-espace linéaire Tx M . On peut penser à la sphère
S n−1 de rayon 1 dans Rn pour laquelle Tx S n−1 = Rn−1 .
De retour dans Rn , on choisit les définitions en termes de suites qui sont plus simples
à utiliser dans un espace vectoriel que celles qui font appel à des chemins.
Définition 3.6.
Soient f : Rn → Rm , x un point de Rn et v ∈ Rn une direction.
(i) f est dérivable au sens de Hadamard au point x dans la direction v si la
limite suivante existe
f (x + tw) − f (x)
lim dans Rm . (3.27)
t→0 t
w→v
′
Lorsque la limite (3.27) existe, on la désignera par fH (x; v). De la définition,
′ ′
on a fH (x; v) = f (x; v).
′
(ii) f est directionnellement dérivable au sens de Hadamard en x si fH (x; v)
n
existe pour tout v ∈ R .
(iii) f est différentiable au sens de Hadamard au point x si f est dérivable au
sens de Hadamard et l’application
déf
′
v 7→ Df (x)v = fH (x; v) : Rn → Rm (3.28)
Remarque 3.5.
La Définition 3.1 (i) que la limite existe est équivalente à sa caractérisation par les
3. Fonctions de plusieurs variables réelles 225
suites : il existe q ∈ R tel que pour toutes suites (tn , wn ) → (0, v), tn 6= 0,
f (x + tn wn ) − f (x)
→ q.
tn
Conformément à la définition de la limite, cela inclut les suites wn → v et la suite
constante wn = v puisque, comme tn 6= 0, on a toujours (tn , wn ) 6= (0, v).
Exemple 3.7. √
On considère le carré f (x) = kxk2 de la norme kxk = x · x de x dans Rn . Elle est
continue dans Rn . Pour tout (t, w) → (0, v), t 6= 0,
f (x + tw) − f (x) kx + twk2 − kxk2 (2x + tw) · tw
= = = (2x + tw) · w → 2x · v
t t t
′
par continuité du produit scalaire. Donc fH (x; v) existe pour tout x et tout v,
′
fH (x; v) = 2x · v,
′
et comme v 7→ fH (x; v) est linéaire, f est Hadamard différentiable et Df (x) = 2x.
La norme n(x) = kxk est aussi Hadamard différentiable en tout point x 6= 0.
Pour tout (t, w) → (0, v), t 6= 0,
n(x + tw) − n(x) kx + twk − kxk 1 kx + twk2 − kxk2
= =
t t kx + twk + kxk t
1 x
→ 2x · v = ·v
2 kxk kxk
et Dn(x) = x/kxk. La dérivée directionnelle n’existe cependant pas en x = 0 car
pour v 6= 0 le quotient différentiel
n(0 + tv) − n(0) k0 + tvk − k0k |t|
= = kvk
t t t
ne converge pas lorsque t tend vers 0 cat il oscille entre ±kvk.
Exemple 3.8.
Soit g : Rm → Rn une application linéaire : g(x) = Ax pour A ∈ L(Rm , Rn ). Alors
A(x + tw) − Ax A(tw)
∀t > 0, ∀w ∈ Rm , = = Aw → Av
t t
lorsque t > 0 → 0 et w → v et
Dg(x) = A ∈ L(Rm , Rn ).
était Gateaux différentiable en x = (0, 0), mais qu’elle n’est pas continue en (0, 0).
On montre maintenant qu’elle ne possède pas de dérivée directionnelle au sens de
Hadamard en (0, 0) dans les directions (0, 0) et (1, 0).
Pour montrer que la dérivée directionnelle au sens de Hadamard n’existe pas
en (0, 0) dans la direction (0, 0), on choisit les suites suivantes :
1 1 1
tn = ց 0 et wn = , 3 → (0, 0) lorsque n → +∞.
n n n
En formant le quotient
déf f ((0, 0) + tn wn ) − f (0, 0)
qn = ,
tn
on peut vérifier que
( n12 )6 5
qn = 1 1 8 = n → +∞
(
n n 2 )
′
et fH f (0, 0; 0, 0) n’existe pas.
′
Pour montrer que fH f (0, 0; 1, 0) n’existe pas, on calcule le quotient différentiel
en utilisant la suite (wn , tn ) → (v, 0) suivante
1 1
wn = 1, , ∀n et tn = , ∀n
n n
f (tn wn ) − f (0, 0) 1 ( n1 )6 3
1 = 1 1 8 = n → +∞.
n (
n n )
3. Fonctions de plusieurs variables réelles 227
Le dernière fonction est celle de l’Exemple 3.6 déjà considérée au paragraphe 3.2
où la fonction est continue et directionnellement dérivable, mais pas Gateaux diffé-
rentiable.
′
Comme fH (x; 0) = 0, lorsque y → x, t = ky − xkα
Rn → 0 et
y−x y−x
w= = ky − xk1−α → 0 lorsque y → x
ky − xkα
R n ky − xkRn
y−x
f x + ky − xkα ky−xk α − f (x)
Rn ′
⇒ lim α − fH (x; 0) = 0.
y→x ky − xkRn
Rm
On a donc la continuité de f en x.
(f + g)′H (x; v) = fH
′ ′
(x; v) + gH (x; v) (3.29)
′ ′
∀α ∈ R, (αf )H (x; v) = αfH (x; v) (3.30)
(f · g)′H (x; v) = fH
′ ′
(x; v) · g(x) + f (x) · gH (x; v) (3.31)
(f g)′H (x; v) = fH
′ ′
(x; v) g(x) + f (x) gH (x; v) (3.35)
f ′ (x; v) g(x) − f (x) gH
′
(x; v)
(f /g)′H (x; v) = H 2
, g(x) 6= 0, (3.36)
g(x)
Corollaire 1. Si, en plus des hypothèses du Théorème 3.4, les fonctions sont Ha-
damard différentiables, alors les fonctions suivantes sont Hadamard différentiables :
Un résultat
P analogue demeure vrai pour les dérivées directionnelles : étant
donné v = m j=1 vj ej
Xm Xm X n X n Xm
∂hi ∂fi ∂gℓ ∂f ∂gk
(x) vj = (g(x)) (x) vj = (g(x)) (x) vj
j=1
∂xj j=1 ℓ=1
∂yℓ ∂xj ∂yℓ j=1
∂xj
ℓ=1
n n
!
X ∂fi X
′ ′ ′
hi (x; v) = (g(x)) gℓ (x; v) = fi g(x); ′
gℓ (x; v) eℓ = fi′ (g(x); g ′ (x; v))
∂yℓ
ℓ=1 ℓ=1
⇒ h′ (x; v) = f ′ (g(x); g ′ (x; v)) ,
(f ◦ g)′ (x; v) = fH
′
(g(x); g ′ (x; v)); (3.44)
230 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
′
(ii) si, en plus, gH (x; v) existe, alors (f ◦ g)′H (x; v) existe et l’on a
(f ◦ g)′H (x; v) = fH
′ ′
(g(x); gH (x; v)). (3.45)
Remarque 3.6.
On peut considérer la composition d’un nombre fini de fonctions g1 ◦ g2 ◦ g3 qui
soient toutes dérivables au sens de Hadamard sauf la dernière qui n’a besoin que
d’être directionnellement dérivable, c’est-à-dire,
(g1 ◦ g2 ◦ g3 )′ (x; v) = (g1 )′H (g2 (g3 (x)); (g2 )′H (g3 (x); g3′ (x; v))).
D(g1 ◦ g2 ◦ g3 )(x) = Dg1 ((g2 ◦ g3 )(x)) ◦ Dg2 (g3 (x)) ◦ Dg3 (x)
ou D(g1 ◦ g2 ◦ g3 )(x) = Dg1 ((g2 ◦ g3 )(x)) Dg2 (g3 (x)) Dg3 (x).
Remarque 3.7.
Si f : Rn → R est une fonction à valeurs réelles, on a
déf 1
q(t) = [f (g(x + tv)) − f (g(x))].
t
3. Fonctions de plusieurs variables réelles 231
On remarque que
En réécrivant
1
q(t) = [f (g(x) + t v(t)) − f (g(x))],
t
′
il vient par la définition et l’existence de fH (g(x); g ′ (x; v) que
′
lim q(t) = fH (g(x); g ′ (x; v)).
t→0
déf 1
q(t, w) = [f (g(x + tw)) − f (g(x))].
t
On remarque que l’on peut réécrire le terme g(x + tw) sous la forme
Remarque 3.8.
′
Il est important de rappeler que fH (x; v) n’a pas besoin d’être linéaire en v comme
le montre la fonction de l’Exemple 3.10.
L’hypothèse que g ′ (x; v) et f ′ (g(x); g ′ (x; v)) existent n’est pas suffisante pour
démontrer le théorème. La démonstration utilise de fa¸con critique l’hypothèse plus
′
forte que fH (g(x); g ′ (x; v)) existe aussi. On donne maintenant l’exemple de la com-
position f ◦ g d’une fonction Gateaux différentiable f et d’une fonction infiniment
différentiable 23 g. La composition n’est pas Gateaux différentiable et pas même
simplement différentiable en 0 dans quelque direction v 6= 0.
Exemple 3.11.
Soient les fonctions
x6
f : R2 → R, f (x, y) = si (x, y) 6= (0, 0) et f (0, 0) = 0
(y − x2 )2 + x8
x
g : R → R2 , g(x) = 2 .
x
On voit aussi que g est de classe C (∞) dans R et que la matrice jacobienne associée
est donnée par
1 1
Dg(x) = et Dg(0) = .
2x 0
La composition f (g(x)) de f et g
1
, si x 6= 0
h(x) = f (g(x)) = f (x, x2 ) = x2
0, si x = 0
donne une fonction réelle d’une variable réelle x qui n’est ni continue en 0 ni continue
en 0 à droite ou à gauche. Elle n’est donc pas différentiable ni même dérivable en
x = 0 dans les directions v 6= 0. En appliquant la règle de dérivation en chaı̂ne des
fonctions composées, il vient
′ ⊤
0
h (0) = [Dg(0)] ∇f (g(0)) = 1 0 = 0.
0
Le résultat donné par la règle de dérivation en chaı̂ne des fonctions composées est
faux. Ceci provient du fait que, la différentiabilité de f au sens de Gateaux n’est pas
suffisante. Il faudrait que f soit différentiable au sens de Hadamard en (0, 0).
23. Une fonction qui est dérivable et dont toutes les dérivées partielles de tout ordre sont
dérivables.
3. Fonctions de plusieurs variables réelles 233
Définition 3.7.
f : Rn → Rm est différentiable au sens de Fréchet 24 en x ∈ Rn s’il existe une
application linéaire L(x) : Rn → Rm tel que
f (x + v) − f (x) − L(x)v
lim = 0 dans Rm . (3.50)
v→0 kvk
Remarque 3.9.
Cette définition fut initiallement donnée par M. Fréchet [1] en 1911 dans le
contexte des fonctionnelles, c’est-à-dire, les fonctions de fonctions. Cependant, en
dimension finie, sa définition est équivalente à la notion antérieure de différentielle
totale que l’on trouve chez O. Stolz 26 en 1893, J. Pierpont 27 en 1905, et W. H.
Young 28 en 1908-1909 :
≪En fait, une définition équivalente avait été donnée en 1908 par
M. W.-H. Young [1, p. 157], [2, p. 21], qui avait, en outre, développé
explicitement les conséquences.≫ (M. Fréchet [2])
≪Mais je me suis aperçu qu’on trouve déjà cette définition dans Stolz,
24. Maurice René Fréchet (1873–1973) apporta d’importantes contributions à l’analyse réelle
et fonda la théorie des espaces abstraits. Il écrivit sa thèse sous la supervision de Hadamard en
1906. Il introduisit le concept d’espace métrique et formula la notion abstraite de la compacité.
25. L’application v 7→ f (x)+ L(x)v peut aussi s’interpréter comme une approximation linéaire
(affine) de f (x + v) au point (x, f (x)) à léchelle infinitésimale.
26. Otto Stolz (1842–1905) (voir O. Stolz [1, p. 133]).
27. James Pierpont (1866–1938) (voir J. Pierpont [1, p. 268]).
28. William Henry Young (1863–1942) (voir W.-H. Young [1, p. 157], [2, p. 21]).
234 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
tv → 0 lorsque t → 0.
Mais
f (x + tv) − f (x) − L(x)(tv) t 1 f (x + tv) − f (x) − L(x)(tv)
=
ktvk |t| kvk t
f (x + tv) − f (x) − L(x)(tv) 1 f (x + tv) − f (x)
⇒ = − L(x) v .
ktvk kvk t
f (x + tv) − f (x)
lim − L(x)v = 0
t→0 t
f (x + tv) − f (x)
f ′ (x; v) = lim = L(x)v.
t→0 t
Puisque l’application L(x) est linéaire de Rn dans Rm , f est bien Gateaux diffé-
rentiable en x et par la Définition 3.3 de l’application jacobienne
On a déjà montré que f ′ ((0, 0); (v1 , v2 )) = 0 pour tout (v1 , v2 ), que f est Gateaux
différentiable en (0, 0) et que f est discontinue en (0, 0). On montre maintenant que
f n’est pas Fréchet différentiable en (0, 0). On choisit
v(α) = (α, α2 ), α 6= 0.
Lorsque α tend vers 0, v(α) tend vers (0, 0). On calcule le quotient de Fréchet
|t|
q(t, w) = Q(h(t, w)) kwk + L(x) w → 0 kvk + L(x) v,
t
236 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
′ ′
fH (x; v) existe et fH (x; v) = L(x) v est linéaire (et continue) par rapport à v. Par
définition f est Hadamard différentiable en x.
′
(ii) ⇒ (i). Comme f est Hadamard différentiable, fH (x; v) existe pour tout v
déf
′
et l’application v 7→ L(x)v = fH (x; v) est linéaire. Soit
déf
Q = lim sup kQ(h)k,
06=khk→0
où Q(h) est définie par (3.51) pour ce choix de L(x). Comme kQ(h)k ≥ 0, Q est
un nombre positif, nul ou +∞. Il existe donc une suite {hn }, 0 6= hn → 0, tel que
kQ(hn )k converge vers Q. Comme {h/khk : ∀h ∈ Rn , h 6= 0} est la sphère S de
rayon 1, S est compacte dans Rn et il existe une sous-suite {hnk } et v ∈ S tel que
déf hnk
wnk = → v ∈ S.
khnk k
On voit que pour h 6= 0
f x + khk h − f (x)
h khk h
Q(h) = Q khk = − L(x) .
khk khk khk
′ ′
Comme fH (x; v) existe et que L(x)wnk → L(x)v = fH (x; v), en prenant tnk = khnk k
qui tend vers 0, il vient
Comme kQ(h)k ≥ 0 et que la limsup Q est égale à zéro, la limsup est égale à la
limite. En particulier, la limite du quotient Q(h) existe et est 0 lorsque h tend vers
0. Par définition, f est donc Fréchet différentiable en x.
Définition 3.8.
Soit f : Rn → Rm , n ≥ 1, m ≥ 1.
3. Fonctions de plusieurs variables réelles 237
(i) f est lipschitzienne en x s’il existe c(x) > 0 et un voisinage V (x) de x tel
que
∀y, z ∈ V (x), kf (z) − f (y)kRm ≤ c(x) kz − ykRn .
(ii) f est lipschitzienne sur une partie U de Rn s’il existe c(U ) > 0 tel que
∀y, z ∈ U, kf (z) − f (y)kRm ≤ c(U ) kz − ykRn .
Exemple 3.13.
La norme f (x) = kxk est lipschitzienne dans Rn puisque
∀y, z ∈ Rn , |f (y) − f (z)| = |kyk − kzk| ≤ ky − zk,
avec une constante de Lipschitz c(Rn ) = 1. La fonction f (x) = kxk2 n’est pas
lipschizienne sur tout Rn , mais elle est lipschitzienne en tout point x ∈ Rn . En effet
pour tout r > 0,
∀y, z ∈ Br (x), |f (y)− f (z)| = kyk2 − kzk2 ≤ ky + zk ky − zk ≤ 2(r + kxk)ky − zk.
On choisit le voisinage Br (x) et la constante c(x) = 2(r + kxk).
Remarque 3.10.
′
Ce théorème est presque la réciproque du Théorème 3.3 qui dit que si fH (x; v)
existe, alors f est continue en x.
Démonstration. (i) Soit {wn } une suite tendant vers v et t > 0. Alors il existe N
et t̄ > 0 tel que pour tout n > N et 0 < t < t̄ on ait x + twn ∈ V (x). On forme le
quotient différentiel
f (x + twn ) − f (x) f (x + twn ) − f (x + tv) f (x + tv) − f (x)
= + .
t t t
Par hypothèse, le second terme tend vers f ′ (x; v). Comme f est lipschitzienne en
x
∃c(x), ∀y, z ∈ V (x), kf (y) − f (z)kRm ≤ c(x)ky − zkRn
238 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
f (x + twn ) − f (x + tv)
≤ c(x) kwn − vkRn → 0 lorsque n → ∞.
t Rm
′ ′
Lorsque t tend vers zéro, il vient kfH (x; v) − fH (x; w)k = kf ′ (x; v) − f ′ (x; w)kRm ≤
c(x) kv − wkRn .
En effet, par définition de g ′ (t) en un point 0 < t < 1 : pour |s| assez petit
Remarque 3.11.
Le Théorème 3.10 semble contredire l’Exemple 3.3 d’une fonction Gateaux diffé-
rentiable f (x, y) au point (0, 0), mais discontinue en ce point. En effet la fonction
f (x, y) est Gateaux différentiable non seulement en (0, 0), mais aussi dans tout R2 .
Cependant, la fonction et son gradient ne sont bornées dans aucune boule Bδ (0, 0),
δ > 0, autour de (0, 0). 30 Il est facile de vérifier que pour (x, y) 6= (0, 0),
∂f 2 x6 (y − x2 ) ∂f (y − x2 )(3y − x2 ) − x8
=− , = 2x5 .
∂y [(y − x2 )2 + x8 ]2 ∂x [(y − x2 )2 + x8 ]2
∂f ∂f 2
(x, x2 ) = 0, (x, x2 ) = − 3
∂y ∂x x
∀x ∈ U, Df (x) = 0,
Pour tout point x1 ∈ U \U1 , il existe r > 0 tel que Br (x1 ) ⊂ U et par le même
argument que précédemment f (x) = f (x1 ) 6= f (x0 ) pour tout x ∈ Br (x1 ). De là
Br (x1 ) ⊂ U \U1 et U \U1 est ouvert.
Si U \U1 6= ∅, alors U est l’union de deux ensembles ouverts non-vides et
disjoints U1 et U \U1 de l’espace euclidien Rn . Mais ceci est impossible puisque U
est sous-ensemble connexe de Rn . Donc U \U1 = ∅ et U = U1 .
Remarque 3.12.
H. Whitney [1] a donné l’exemple d’une partie convexe U ⊂ R2 et d’une fonction
f différentiable tel que ∇f (x, y) = 0 pour tout (x, y) ∈ U , mais f (x, y) n’est pas
constante dans U . Cet ensemble n’a pas de points intérieurs.
30. Voir aussi l’Exercice 7.7.
3. Fonctions de plusieurs variables réelles 241
Définition 3.9.
Soient f : Rn → R, U ⊂ Rn ouvert.
(i) f est de classe C (0) sur U si f est continue sur U . On écrira f ∈ C (0) (U ).
(ii) f est de classe C (1) sur U si les dérivées partielles ∂i f (x), 1 ≤ i ≤ n,
existent et sont continues sur U . On écrira f ∈ C (1) (U ). 31
Ces définitions et les résultats qui suivent s’étendent aux fonctions à valeurs vecto-
rielles f : U ⊂ Rn → Rm .
Puisque f est dérivable dans la direction ei pour tout point de V (x), la fonction
gi (α) = f (xi−1
k + α tk (wk )i ei ) est continue dans [0, 1] et différentiable dans ]0, 1[ .
Par le théorème de la moyenne (Théorème 3.8)
i−1
X
kxi−1
k + αik tk (wk )i ei − xk = (xjk − xj−1 i
k ) + αk tk (wk )i ei
j=1
1/2
i−1
X Xi−1
= tk (wk )j ej + αik tk (wk )i ei = |tk | |(wk )j |2 + |αik (wk )i |2
j=1 j=1
1/2 1/2
Xi Xn
≤ |tk | |(wk )j |2 ≤ |tk | |(wk )j |2 = |tk | kwk k
j=1 j=1
il est continu dans U comme la somme de n fonctions continues dans U par hy-
pothèse sur les dérivées partielles est Fréchet différentiable dans tout U , pour tout
y dans U ,
∀w ∈ Rn , f ′ (y; w) = ∇f (y) · w = L(y)w.
Soit (x, v) un point arbitraire de U × Rn et (y, w) un autre point de U × Rn . On
évalue
f ′ (y; w) − f ′ (x; v) = f ′ (y; w) − f ′ (x; w) + f ′ (x; w) − f ′ (x; v)
= [∇f (y) − ∇f (x)] · w + ∇f (x) · (w − v)
′ ′
⇒ |f (y; w) − f (x; v)| ≤ k∇f (y) − ∇f (x)k kwk + k∇f (x)k kw − vk.
Puisque x est fixe, il existe une constante c > 0 tel que k∇f (x)k ≤ c et pour tout
ε > 0 et tout w tel que kw − vk ≤ ε/(2c) on a
Mais, par continuité des n dérivées partielles dans U , il existe un δ(x) > 0 tel que
X
n 1/2
2 ε
ky − xk < δ(x) ⇒ |∂j f (y) − ∂j f (x)| ≤
j=1
2(kvk + ε/(2c))
⇒ k∇f (y) − ∇f (x)k kwk ≤ ε/2.
244 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
Remarque 3.13.
Les définitions et résultats précédents s’appliquent aussi à des fonctions à valeurs
vectorielles en procédant composante par composante.
Remarque 3.14.
Les opérations habituelles sont permises dans la classe des fonctions de classe C (1) .
Si f et g sont des fonctions de classe C (1) dans le même ouvert U , alors la somme
(f + g)(x) = f (x) + g(x) et la multiplication par un scalaire (α f )(x) = αf (x)
sont de classe C (1) dans U . De la même façon, le produit (f g)(x) = f (x)g(x) est de
classe C (1) puisque D(f g)(x) = f (x)Dg(x)+ g(x)Df (x). La composition g ◦ f d’une
fonction f : U ⊂ Rn → Rm et d’une fonction g : V ⊂ Rm → Rp , f (U ) ⊂ V , pour
deux ouverts U et V est de classe C (1) puisque D(g ◦ f )(x) = Dg(f (x)) ◦ Df (x).
Définition 3.10.
Soient f : Rn → R, x ∈ Rn , et deux directions v et v dans Rn . On suppose que
f ′ (y; v) existe pour tout y dans un voisinage V (x) de x. On dit que f possède une
dérivée directionnelle du second ordre dans les directions (v, v) au point x si la limite
f ′ (x + t v; v) − f ′ (x; v)
lim
t→0 t
existe. Dans ce cas on écrira cette limite d2 f (x; v; v).
en terme de la base orthonormale canonique {ei }ni=1 . Sous les hypothèses du Thé-
orème 3.12, l’application (v, v) 7→ d2 f (x; v; v) : Rn × Rn → R est bilinéaire. Donc
X n n
X X n Xn
2 2
d f (x; v; v) = d f x; vi ei ; v j ej = d2 f (x; ei ; ej )vi v j .
i=1 j=1 i=1 j=1
2
Les éléments d f (x; ei ; ej ) sont les éléments de la matrice associée à l’application
linéaire Hf (x) de Rn . À la lumière du théorème et de cette discussion, on peut
donner les définitions suivantes.
Définition 3.11.
On se place dans le cadre des hypothèses du Théorème 3.12.
(i) On appellera application hessienne 32 de f en x l’application linéaire Hf (x) :
Rn → Rn définie par (3.62).
(ii) La matrice hessienne de f en x est la matrice n × n formée des éléments
déf
Hf (x)ij = d2 f (x; ei ; ej ) = ∂j (∂i f (x))
pour la base orthonormale canonique {ei }ni=1 de Rn .
Par abus de notation, on utilisera la même notation Hf (x) pour l’application et la
matrice qui lui est associée.
Démonstration du Théorème 3.12. Par hypothèse, pour tout y ∈ V (x), f est Ga-
teaux différentiable en y et
f ′ (y; v) = ∇f (y) · v
et comme ∇f est Gateaux différentiable en x
(∇f )′ (x; v) = D(∇f )(x) v,
où D(∇f )(x) : Rn → Rn est l’application (linéaire) jacobienne de la fonction
vectorielle y 7→ ∇f (y).
Pour v et v dans Rn et t 6= 0, considérons le quotient
f ′ (x + tv; v) − f ′ (x; v) ∇f (x + tv) − ∇f (x)
= · v.
t t
Lorsque t → 0
∇f (x + tv) − ∇f (x)
→ D(∇f )(x) v
t
′ ′
f (x + tv; v) − f (x; v) ∇f (x + tv) − ∇f (x)
= · v → D(∇f )(x) v · v
t t
⇒ d2 f (x; v; v) = D(∇f )(x) v · v.
32. La matrice hessienne fut développée au XIXe siècle par Ludwig Otto Hesse (1811–1874)
et plus tard appelée hessienne d’après lui. Hesse utilisait le terme déterminant fonctionnel.
246 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
Remarque 3.15.
En général, la matrice hessienne des dérivées secondes n’est pas symétrique si l’on
n’a pas la continuité (3.64). Voir l’Exercice 7.8 pour un contre-exemple à (3.65).
déf
Démonstration. (i) Pour chaque i, la fonction y 7→ hi (y) = ∂i f (y) possède des
dérivées partielles ∂j hi sur Br (x) qui sont continues en x. Les hypothèses du Théo-
rème 3.9 (i) sont donc vérifiées et hi est Fréchet différentiable et continue en x.
3. Fonctions de plusieurs variables réelles 247
Définition 3.12.
Soient f : Rn → R et U un ouvert de Rn . La fonction f est de classe C (p) dans U si
toutes les dérivées partielles d’ordre p de f existent et sont continues dans U .
On peut montrer par les résultats précédents (cf. Corollaire 1 au Théorème 3.11)
que les fonctions de classe C (p) sont de classe C (p−1) et ainsi de suite.
f (x) f (x)
x x
Fonction convexe Fonction concave
Figure 6.5. Fonction convexe et fonction concave
Mais,
et λx + (1 − λ)y ∈ int U .
(ii) Posons U = ∩α∈A Uα . Si U est vide, alors il est convexe par définition. Si
U n’est pas vide, on prend
x et y ∈ U = ∩α∈I Uα ⇒ ∀α ∈ A, x ∈ Uα , y ∈ Uα .
(iii) Comme int U 6= ∅, on prend un point x ∈ int U . Par convexité, pour tout
y ∈ ∂U , le segment [x, y] = {λx + (1 − λ)y : 0 ≤ λ ≤ 1} est dans U et [x, y[ =
{λx + (1 − λ)y : 0 < λ ≤ 1} ⊂ int U . Il existe donc une suite yn = x + (y − x)/(n + 1)
dans int U qui converge vers y, d’où le résultat.
(ii) Si, en plus, f est Gateaux différentiable en tout point de U , alors f est
convexe sur U si et seulement si
et la convexité de f sur U .
(ii) Comme f est Gateaux différentiable, il y a un gradient et f ′ (x; v) =
∇f (x) · v. Il suffit alors de substituer dans la partie (i).
(ii) Si, en plus, f est Gateaux différentiable en tout point de U , alors f est
strictement convexe sur U si et seulement si
Par homogénéité positive t f ′ (x; y − x) = f ′ (x; t(y − x)). Comme f est strictement
convexe,
Définition 4.2.
Une matrice symétrique A est définie positive (resp. semi-définie positive) si
Remarque 4.1.
La réciproque de la partie (ii) du Théorème 4.4 n’est pas vraie. En effet, considérons
la fonction f (x) = x4 définie sur R. Sa dérivée seconde est donnée par f (2) (x) =
12x2 . Au point x = 0, f s’annule bien que f soit strictement convexe dans tout
voisinage de x = 0.
Comme U est une partie convexe de Rn , la condition (4.5) signifie que U est
contenu dans le demi espace fermé défini par (cf. Figure 6.6)
{y ∈ Rn : ∇f (x) · (y − x) ≥ 0}.
Ensembles de niveau de f
x
1
2
∇f (x) 3
Démonstration. Si la condition (4.5) est vérifiée, alors on sait, par le Théorème 4.2,
que pour une fonction convexe Gateaux différentiable
et t ∈ ]0, 1],
f (x + t(y − x)) − f (x)
f (x + t(y − x)) − f (x) ≥ 0 ⇒ ≥0 (4.6)
t
et comme f est Gateaux différentiable, en passant à la limite,
f (x + t(y − x)) − f (x)
∇f (x) · (y − x) = f ′ (x; y − x) = lim ≥0 (4.7)
tց0 t
ce qui complète la démonstration.
Corollaire 1. Sous les conditions du Théorème 4.5, on a les résultats suivants.
(i) Si U = S, un sous-espace linéaire, alors la condition (4.5) est équivalente
à :
En particulier, ∇f (x) ∈ S ⊥ .
(ii) Si U = A, un sous-espace affine, alors la condition (4.5) est équivalente
à :
Remarque 4.2.
L’égalité (4.8) qui doit être vérifiée pour chaque y ∈ S est le prototype d’une
équation variationnelle qui implique ici que ∇f (x) ∈ S ⊥ et pas nécessairement
l’équation ∇f (x) = 0. Une équation variationnelle est donc une forme plus faible
d’équation.
Réciproquement, on a
Ensembles de niveau de f
x
1
U = A ou S 2
3
∇f (x)
Remarque 4.3.
Lorsque U est donné par
{x ∈ Rn : gj (x) ≤ 0, 1 ≤ j ≤ m}
Définition 4.3.
Soit U , ∅ 6= U ⊂ Rn .
(i) On dit que f : Rn → R a un minimum global dans U si
Le théorème suivant donne des conditions pour l’existence d’un minimum local.
Elles deviennent nécessaires et suffisantes dans le cas quadratique.
Théorème 4.6. Soit f : Rn → R de classe C (2) dans une ouvert non vide U ⊂ Rn .
(i) Si f a un minimum local dans U , alors
(ii) Si
∃x ∈ U tel que ∇f (x) = 0
et s’il existe un voisinage convexe V (x) ⊂ U de x tel que
Soit la fonction g(t) = f (x + t(y − x)). Alors pour y ∈ Br (x), |t| < 1 et |s| < 1, les
points x + s(y − x) et x + t(y − x) appartiennent à Br (x) et pour s 6= t,
g(s) − g(t) f (x + s(y − x)) − f (x + t(y − x))
=
s−t s−t
f (x + t(y − x) + (s − t)(y − x)) − f (x + t(y − x))
=
s−t
258 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
1
f (y) = f (x) + ∇f (x) · (y − x) + Hf (x + α(y − x))(y − x) · (y − x).
2
Mais ∇f (x) = 0 et comme V (x) est convexe, x+α(y −x) ∈ V (x) et, par hypothèse,
Hf (x + α(y − x)) ≥ 0 est semi-définie positive. Ceci entraı̂ne
Comme ∇f (x) = 0 et que (4.14) est vérifiée dans Br (x), x est un minimum global
dans Br (x). De plus, pour tout y ∈ Br (x), y 6= x, il existe α ∈ ]0, 1[ tel que
1
f (y) = f (x) + ∇f (x) · (y − x) + Hf (x + α(y − x))(y − x) · (y − x)
2
⇒ ∀y ∈ Br (x) tel que y 6= x, f (y) > f (x).
déf 1
f (x) = Ax · x + b · x + c (4.17)
2
pour une matrice n × n symétrique A, b ∈ Rn et c ∈ R.
(i) f possède un minimum par rapport à Rn si et seulement si
Démonstration. (i) La condition est nécessaire par le Théorème 4.6 (i) et suffisante
par le Théorème 4.6 (ii) puisque Hf (y) = A = Hf (x) ≥ 0 dans V (x) = Rn .
(ii) On sait déjà de la partie (ii) qu’il existe x∗ minimisant si et seulement
si Ax∗ + b = 0 et A ≥ 0. Si A > 0, alors A ≥ 0, A est inversible et pour tout b
260 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
Remarque 5.1.
On peut aussi montrer que, sous les hypothèses du Théorème 5.1, f −1 est de classe
C (k) , k ≥ 2, si f est de classe C (k) .
(voir le Théorème 7.1 (i) du Chapitre 5). Comme f est de classe C (1) dans l’ouvert
O et que a ∈ O, il existe r > 0 assez petit pour que
Br (a) ⊂ O et ∀x ∈ Br (a), kDf (x) − Df (a)kL(Rn ) < α. (5.6)
et ϕy est lipschitzienne dans Br (a). Cette dernière propriété s’étend à Br (a) par le
Théorème 7.2 du Chapitre 4. On en déduit que f est injective sur Br (a). En effet,
s’il existe x1 , x2 ∈ Br (a) tel que f (x1 ) = f (x2 ), alors on a
Puisque b = f (a) ∈ f (Br (a)), il ne reste plus qu’à montrer que V est ouvert.
Pour établir que V = f (Br (a)) est ouvert, on va montrer que tout point
y0 ∈ V est un point intérieur de V . Comme f est bijective, il existe x0 ∈ Br (a) tel
que f (x0 ) = y0 et il existe ρ > 0 tel que Bρ (x0 ) ⊂ Br (a).
On montre maintenant que Bαρ (y0 ) ⊂ V . Soient y ∈ Bαρ (y0 ) et la restriction
de l’application ϕy : Bρ (x0 ) ⊂ Br (a) → Rn . On a alors
ρ
kϕy (x0 ) − x0 kRn = kA−1 (y − f (x0 ))kRn = kA−1 (y − y0 )kRn < kA−1 kL(Rn ) αρ = .
2
Pour tout x ∈ Bρ (x0 ) ⊂ Br (a),
1 ρ
kϕy (x) − x0 kRn ≤ kϕy (x) − ϕy (x0 )kRn + kϕy (x0 ) − x0 kRn < kx − x0 kRn + < ρ
2 2
et ϕy (x) ∈ Bρ (x0 ). Donc ϕy (Bρ (x0 )) ⊂ Bρ (x0 ) ⊂ Bρ (x0 ) et
1
∀x1 , x2 ∈ Bρ (x0 ), kϕy (x1 ) − ϕy (x2 )kRn ≤ kx1 − x2 kRn .
2
Comme Bρ (x0 ) est un espace métrique complet et que ϕy est contractante, elle
possède un point fixe unique
x ∈ Bρ (x0 ), ϕy (x) = x,
par le Théorème 8.1 du Chapitre 4. Mais, par définition de ϕy , on voit que x = ϕy (x)
entraı̂ne y = f (x) ∈ f (Bρ (x0 )). Finalement
f (x, y) = x2 + y 2 − 1,
on cherche les points x ∈ R tel que f (x, y) = 0. Si |y| > 1, il n’y a pas de solution ;
si |y| = 1, il n’y a une solution x = 0 ; si |y| < 1, il n’y a deux solutions. Ceci induit
une fonction multivoque
( )
déf 0, si |y| = 1
y 7→ g(y) = p : [−1, 1] → P([−1, 1]).
± 1 − y2, si |y| < 1
possède une solution unique x pour chaque y tel que (x, y) ∈ V (a, b). L’application
multivoque g devient alors univoque d’où la terminologie application implicite.
Dans un premier temps, on considère une fonction linéaire A : Rn+m → Rn
puis ensuite une fonction vectorielle f : Rn+m → Rn de classe C (1) dans un ouvert
O ⊂ Rn+m . Dans ce contexte, il est important de préciser la notation qui sera
utilisée.
Théorème 5.2. Soit A ∈ L(Rn+m , Rn ) telle que Ax soit inversible. Alors, pour
tout k ∈ Rm , il existe une solution unique h ∈ Rn à l’équation A(h, k) = 0 ce qui
définit implicitement la fonction solution
déf m n
k 7→ g(k) = −A−1
x Ay k : R → R (5.11)
Ax h + Ay k = 0 ⇒ h = −A−1
x Ay k
h 7→ Df (a, b)(h, 0) : Rn → Rn
est inversible.
(i) Il existe des ouverts U ⊂ Rn+m et V ⊂ Rm tel que (a, b) ∈ U et b ∈ V
vérifiant :
où [Df (g(y), y)x Df (g(y), y)y ] est la décomposition de Df (g(y), y) selon la
notation 5.1.
Démonstration. On pose A = Df (a, b) avec la notation A = [Ax Ay ], où en fait
Ax = Dx f (a, b) et Ay = Dy f (a, b). On se ramene au théorème précédent en intro-
duisant l’application
déf
(x, y) 7→ F (x, y) = (f (x, y), y) : Rn+m → Rn+m (5.15)
pour laquelle F (a, b) = (0, b). Elle est, comme f , de classe C (1) sur O et
Df (x, y)x Df (x, y)y
DF (x, y) = ,
0 Im
où Im est la transformation identité sur Rm . Il faut montrer que DF (a, b) est in-
versible :
Df (a, b)x Df (a, b)y Ax Ay
DF (a, b) = = ∈ GL(n + m).
0 Im 0 Im
On peut donc invoquer le Théorème 5.1. Il existe deux ouverts U et U ′ dans Rn+m
tels que (a, b) ∈ U et (0, b) = (f (a, b), b) ∈ U ′ pour lesquels F : U → U ′ = F (U ) est
une bijection. Soit
déf
V = {y ∈ Rm : (0, y) ∈ U ′ }
qui est ouvert et contient b puisque U ′ est ouvert et contient (0, b). Donc, pour
tout y ∈ V , il existe x ∈ Rn tel que (x, y) ∈ U et F (x, y) = (0, y), c’est-à-dire,
f (x, y) = 0 et y = y. Ce point x est unique, car s’il existait un autre x′ ∈ Rn avec
ces propriétés, on aurait F (x, y) = F (x′ , y) et, comme F est injective, x = x′ . On a
donc implicitement construit l’application
déf
y 7→ g(y) = x : V → Rn tel que f (g(y), y) = 0 sur V. (5.16)
(g(y), y) = F −1 (0, y)
est de classe C (1) sur U ′ = F (U ). L’application g est donc aussi de classe C (1) sur
V . Comme F est bijective, F (g(b), b) = (0, b) = F (a, b) entraı̂ne g(b) = a. Enfin,
en faisant appel à la règle de différentiation de la composition, la différentielle de
l’équation F (g(y), y) = (0, y) par rapport à y donne
Dg(y) Df (g(y), y)x Df (g(y), y)y Dg(y)
DF (g(y), y) =
Im 0 Im Im
⇒ Df (g(y), y)x Dg(y) + Dyf (g(y), y)= 0
⇒ Dg(y) = − [Df (g(y), y)x ]−1 Df (g(y), y)y .
v 7→ Df (x)v : Rn → Rm
5. Théorèmes de la fonction inverse, de la fonction implicite et du rang 267
∂j fi (x) = em n
i · Df (x)ej , 1 ≤ i ≤ m, 1 ≤ j ≤ n.
On associe à Df (x) la matrice jacobienne [Df (x)] des dérivées partielles premières
des composantes de f :
∂f1 ∂f1
(x) ... ... (x)
∂x1 ∂xn
∂f2 .. ∂f2
déf (x) . (x)
[Df (x)]ij = [Df (x)ej ]i , c-à-d., [Df (x)] =
n ∂x
1.
∂xn . (5.18)
.. .. ..
. .
∂f ∂fm
m
(x) ... ... (x)
∂x1 ∂xn
∀h ∈ Rn , ∀α ∈ Rm , Df (x)h · α = h · Df (x)⊤ α
Définition 5.1.
Lorsque f : Rn → Rm est Gateaux différentiable en un point x0 , on dira que x0 est
un point régulier de f si l’application Df (x0 ) : Rn → Rm est surjective 33 (ou, de
façon équivalente, si la matrice jacobienne est de rang maximum m). Sinon, on dit
que x0 est un point singulier de f .
Remarque 5.2.
Pour que f : Rn → Rm ait des points réguliers, il est nécessaire que n ≥ m. Dans le
cas m = 1, un point x0 sera régulier si et seulement si le gradient ∇f (x0 ) 6= 0.
33. On dit aussi que f est une submersion au point x0 .
268 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
Remarque 5.3.
Lorsque f est un point régulier de f , Df (x) est surjective et donc Df (x)⊤ est
injective. De là, la composée Df (x)Df (x)⊤ ∈ L(Rm , Rm ) est inversible puisque
La matrice associée à Df (x)Df (x)⊤ est non seulement inversible mais aussi définie
positive.
Comme Df (x0 ) est surjective, la matrice Df (x0 ) Df (x0 )⊤ est définie positive et
donc inversible.
Pour compléter la définition de γ, il faut s’assurer prendre des paires (α, t)
suffisamment proches de (0, 0) pour que x0 + Df (x0 )⊤ α + th soit dans le voisinage
V (x0 ) de x0 où f est définie. Il existe r > 0 tel que B2r (x0 ) ⊂ V (x0 ). On peut alors
prendre
déf déf r déf r
(α, t) ∈ O = Bρ (0) × (−δ, δ), ρ = , δ = ,
kDf (x0 ) Df (x0 )⊤ k1/2 khk + 1
Donc, en explicitant
0 = γ(g(t), t) = f x0 + Df (x0 )⊤ g(t) + th − f (x0 ) − Df (x0 )(th),
g ′ (0) = −[Df (x0 ) Df (x0 )⊤ ]−1 (Df (x0 ) h − Df (x0 ) h) = 0.
On pose
déf déf
x(t) = x0 + Df (x0 )⊤ g(t) + th ⇒ x(0) = x0 + Df (x0 )⊤ g(0) = x0 .
demi-tangente . x
dh(0; +1)
TU (x)
chemin h(t)
Figure 6.8. Demi-tangente dh(0; +1) au chemin h(t) dans U au point h(0) = x.
Définition 5.2.
Soient U ⊂ Rn et x ∈ U .
(i) On dit que h ∈ Rn est une direction admissible pour U en x (ou demi-
tangente en x à U ) s’il existe une suite {tn > 0}, tn ց 0 lorsque n → ∞,
pour laquelle
xn − x
∀n, ∃xn ∈ U tel que lim = h. (5.25)
n→∞ tn
Remarque 5.4.
S’il existe une fonction t 7→ x(t) : [0, t0 ) → U , t0 > 0, tel que x(0) = x et dx(0; +1) =
h, alors h ∈ TU (x). En effet, par hypothèse,
x(t) − x
lim = h. (5.26)
tց0 t
Démonstration. Soit h ∈ TU (x) et {xn } ⊂ U et {tn > 0} les suites tel que (xn −
x)/tn → h. Comme xn → x, il existe N tel que
∀n > N, f (xn ) − f (x) ≥ 0.
Comme tn > 0,
Il reste à caractériser TU (x) pour U donné par (5.24). L’objectif est de démontrer
que pour des gj de classe C (1) dans un voisinage de x et une hypothèse sur la ma-
trice jacobienne de la fonction vectorielle g = (g1 , . . . , gm ) : Rn → Rm en un point
x0 ∈ U ,
TU (x0 ) = {h ∈ Rn : ∇gj (x0 ) · h = 0, 1 ≤ j ≤ m} = Ker Dg(x0 ). (5.28)
De là, comme Ker Dg(x0 ) est un sous-espace linéaire, l’inégalité ∇f (x0 ) · h ≥ 0 pour
h ∈ Ker Dg(x0 ) devient
∇f (x0 ) · h = 0, ∀h ∈ Ker Dg(x0 )
⇒ ∇f (x0 ) ∈ [Ker Dg(x0 )]⊥ = Im Dg(x0 )⊤
⇒ ∃λ ∈ Rm tel que ∇f (x0 ) + Dg(x0 )⊤ λ = 0
m
X
⇒ ∃λ = (λ1 , . . . , λm ) tel que ∇f (x0 ) + λj ∇gj (x0 ) = 0.
j=1
tn
Démonstration. (i) Par le Lemme 5.1, TU0 (x0 ) ⊂ Ker Dg(x0 ). On montre mainte-
nant que tout h ∈ Ker Dg(x0 ) est une direction admissible. Comme x0 est un point
régulier, on a par le Théorème 5.4,
∃t0 > 0, ∃x : ] − t0 , t0 [ → Rn de classe C (1) tel que
x(0) = x0 , x′ (0) = h et g(x(t)) = g(x0 ) + tDg(x0 )h, −t0 < t < t0 .
Donc, si h ∈ Ker Dg(x0 ), alors Dg(x0 )h = 0,
∀t ∈ ] − t0 , t0 [ , g(x(t)) = g(x0 ) ⇒ x(t) ∈ U0
et
x(t) − x(0)
lim = x′ (0) = h.
t→0 t
Par définition d’un élément de TU0 (x0 ), h ∈ TU0 (x0 ) et Ker Dg(x0 ) ⊂ TU0 (x0 ).
(ii) Lorsque x0 est un point singulier pour g, l’application Dg(x0 ) n’est pas
surjective et il existe λ = (λ1 , . . . , λm ) 6= (0, . . . , 0) tel que
m
X
∀h ∈ Rn , (λ1 , . . . , λm ) · Dg(x0 )h = 0 ⇒ λj ∇gj (x0 ) = 0,
j=1
∂L ∂L
(x0 , λ) = 0, 1 ≤ i ≤ n, et (x0 , λ) = 0, 1 ≤ j ≤ m, (5.37)
∂xi ∂λj
en introduisant le lagrangien
m
X
déf
L(x, λ) = λ0 f (x) + λj gj (x) (5.38)
j=1
pour x ∈ Rn et λ = (λ0 , λ1 , . . . , λm ) ∈ R × Rm .
37. Lagrange contribua considérablement à la théorie, et Legendre (Sur la manière de dis-
tinguer les maxima des minima dans le calcul des variations) en 1786 jeta les bases de la
détermination des maxima et minima. Dans son traité innovateur Mécanique analytique (J. L. La-
grange [1]) en 1788, Lagrange résuma tous les travaux faits dans le domaine de la mécanique
classique depuis Newton. C’est dans ce livre que Lagrange expose clairement la règle des multipli-
cateurs dans sa forme contemporaine.
274 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
(v) Les conditions des parties (i)-(iv) seront aussi vérifiées pour tout point x0
de U qui réalise un maximum local de f par rapport à U .
Remarque 5.5.
Comme l’indique la partie (v) du Théorème 5.6, son application donnera non seule-
ment les minima locaux, mais aussi les maxima locaux. Il faudra faire le tri et ne
retenir que les minima ou les maxima selon le problème envisagé.
Démonstration. (i) Par le Théorème 5.5, lorsque f est Fréchet différentiable dans
un voisinage d’un point x0 réalisant un minimum local, on a
∇f (x0 ) − Dg(x0 )⊤ α = 0.
m
X
λ0 ∇f (x0 ) + (−λj )∇gj (x0 ) = 0 et gj (x0 ) = 0, 1 ≤ j ≤ m. (5.43)
j=1
La condition de la partie (i) (pour un minimisant local) est donc vérifée avec λ′0 = λ0
et λ′j = −λj ∈ R, 1 ≤ j ≤ m, pour un maximisant local.
Définition 6.1.
Soit un entier n ≥ 1.
276 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
où signe (x) est la fonction signe égale à −1, 0 ou +1 selon que x < 0,
x = 0 ou x > 0. On écrira aussi τ comme une suite (τ1 , . . . , τn ))
(ii) On appelera permutation de l’ensemble {1, . . . , n} une bijection
(on écrira aussi σ comme une suite (σ1 , . . . , σn )). On dénotera par Sn
l’ensemble de toutes les permutations de {1, . . . , n}. Sn est appelé le groupe
symétrique à n éléments 38
(ii) Une transposition est une permutation qui ne change que deux éléments.
(ii) On dit que la paire (i, j), 1 ≤ i < j ≤ n, est en inversion pour σ lorsque
σi > σj .
(iii) Une permutation σ est dite paire quand elle présente un nombre pair d’in-
versions (sgn (σ) = +1), impaire sinon (sgn (σ) = −1).
Remarque 6.1.
Par définition, sgn (τ ) 6= 0 si et seulement si τ ∈ Sn .
Exemple 6.1.
Pour n = 4, σ = (2, 4, 1, 3) est une permutation de (1, 2, 3, 4) avec σ1 = 2, σ2 = 4,
σ3 = 1, et σ4 = 3 ou sous la forme d’une matrice
i 1 2 3 4
σi 2 4 1 3
Exemple 6.2.
Pour n = 4, σ = (1, 4, 3, 2), σ1 = 1, σ2 = 4, σ3 = 3, et σ4 = 2, ou
1 2 3 4
1 4 3 2
Définition 6.2.
Étant donnée une matrice A de dimension n × n dont les entrées sont notées {ai,j },
X n
Y X
déf
dét (A) = sgn (σ) ai,σi = sgn (σ) a1,σ1 . . . an,σn (6.2)
σ∈Sn i=1 σ∈Sn
Exemple 6.3.
Le déterminant d’une matrice A de dimension 2 × 2 est
X 2
Y 2
Y 2
Y
sgn (σ) ai,σi = sgn ([1, 2]) ai,[1,2]i + sgn ([2, 1]) ai,[2,1]i
σ∈S2 i=1 i=1 i=1
2
Y 2
Y
= ai,[1,2]i − ai,[2,1]i = a1,1 a2,2 − a1,2 a2,1
i=1 i=1
Exemple 6.4.
Le déterminant d’une matrice A de dimension 3 × 3 est
X 3
Y
sgn (σ) ai,σi
σ∈S3 i=1
3
Y 3
Y
= sgn ([1, 2, 3]) ai,[1,2,3]i + sgn ([1, 3, 2]) ai,[1,3,2]i
i=1 i=1
3
Y 3
Y
+ sgn ([2, 1, 3]) ai,[2,1,3]i + sgn ([2, 3, 1]) ai,[2,3,1]i
i=1 i=1
Y3 Y3
+ sgn ([3, 1, 2]) ai,[3,1,2]i + sgn ([3, 2, 1]) ai,[3,2,1]i
i=1 i=1
3
Y 3
Y 3
Y
= ai,[1,2,3]i − ai,[1,3,2]i − ai,[2,1,3]i
i=1 i=1 i=1
3
Y 3
Y n
Y
+ ai,[2,3,1]i + ai,[3,1,2]i − ai,[3,2,1]i
i=1 i=1 i=1
= a1,1 a2,2 a3,3 − a1,1 a2,3 a3,2 − a1,2 a2,1 a3,3
+ a1,2 a2,3 a3,1 + a1,3 a2,1 a3,2 − a1,3 a2,2 a3,1
= a1,1 [a2,2 a3,3 − a2,3 a3,2 ] − a1,2 [a2,1 a3,3 − a2,3 a3,1 ] + a1,3 [a2,1 a3,2 − a2,2 a3,1 ].
278 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
est multilinéaire si elle est linéaire par rapport à chaque vecteur ai (les
autres restant fixes).
(ii) Une application multilinéaire est alternée si f (a1 , . . . , an ) = 0 lorsqu’il
existe un indice i, 1 ≤ i ≤ n − 1, tel que ai = ai+1 .
Alors,
X
f (w1 , . . . , wn ) = b1,σ1 . . . bn,σn f (vσ1 , . . . , vσn )
σ∈Sn
X
= sgn (σ) b1,σ1 . . . bn,σn f (v1 , . . . , vn ) (6.7)
σ∈Sn
0 = f (. . . , ai + ai+1 , ai+1 + ai , . . . )
| {z } | {z }
terme i terme i+1
= f (. . . , ai , ai+1 , . . . ) + f (. . . , ai+1 , ai , . . . ).
|{z} |{z} |{z} |{z}
terme i terme i+1 terme i terme i+1
f (. . . , ai + α aj , . . . , aj , . . . ) = f (. . . , ai , . . . , aj , . . . ) + α f (. . . , aj , . . . , aj , . . . )
= f (. . . , ai , . . . , aj , . . . )
Comme l’application multilinéaire est alternée, f (vj1 , . . . , vjn ) = 0 sauf dans le cas
où il existe σ ∈ Sn telle que σi = ji , 1 ≤ i ≤ n. On peut donc remplacer les n
sommes par une somme sur σ ∈ Sn
X
f (w1 , . . . , wn ) = b1,σ1 . . . bn,σn f (vσ1 , . . . , vσn )
σ∈Sn
X
= sgn (σ) b1,σ1 . . . bn,σn f (v1 , . . . , vn ) (6.13)
σ∈Sn
de la partie (iii). On applique ensuite encore deux fois les résultats de la partie (iii) :
(ii) L’application
déf
(a1 , . . . , an ) 7→ dét (a1 , . . . , an ) = dét ([a1 . . . an ]) : Rn × · · · × Rn → R,
| {z }
n fois
(6.16)
où [a1 . . . an ] est la matrice formée des n éléments ai rangés sous forme
de vecteurs colonnes, est multilinéaire. De plus, comme dét ([a1 . . . an ]) =
dét ([a1 . . . an ]⊤ ), il est équivalent de former la matrice à partir des n
éléments ai rangés sous forme de vecteurs lignes
⊤
a1
..
dét (a1 , . . . , an ) = dét ([a1 . . . an ]) = dét . .
a⊤
n
(iii) dét (a1 , . . . , an ) change de signe si l’on permute deux de ses vecteurs consécutifs.
(iv) dét (a1 , . . . , an ) est nul si deux de ses vecteurs sont égaux.
Démonstration. (i) Si A = In , alors aii = 1 et aij = 0, i 6= j. Comme la seule
permutation pour laquelle le produit des ai,σi est non nul est la permutation identité
σi = i pour laquelle sgn (σ) = 1 et a1,σ1 . . . an,σn = a1,1 . . . an,n = 1. Il vient donc
dét (In ) = 1. Par définition,
X X
dét (A) = sgn (σ) a1,σ1 . . . an,σn , dét (A⊤ ) = sgn (σ) aσ1 ,1 . . . aσn ,n .
σ∈Sn σ∈Sn
(6.17)
a1,σ−1 . . . an,σn−1 .
1
−1
Puisque sgn (σ ) = sgn (σ), on obtient
X X
dét (A⊤ ) = sgn (σ −1 ) a1,σ−1 . . . an,σn−1 = sgn (σ) a1,σ1 . . . an,σn = dét (A)
1
σ∈Sn σ∈Sn
car, comme la sommation est par rapport à toutes les permutations σ ∈ Sn , elle
l’est aussi par rapport à toutes les permutations σ −1 ∈ Sn .
6. ◮ Déterminants et formules de changement de variable 281
Démonstration du Théorème 6.3. (i) On a montré au Théorème 6.2 que dét (A)
avait les propriétés désirées. L’unicité est maintenant la conséquence du Théorème
6.1 (iii).
(ii) Conséquence du Théorème 6.1 (iv) avec f (e1 , . . . , en ) = 1.
(iii) En utilisant les vecteurs colonnes a1 , . . . , an de A, l’équation Ax = b
devient
n
X
xi ai = 0.
i=1
Si xj 6= 0, alors
X
aj = − xi ai ⇒ dét (a1 , . . . , an ) = 0.
1≤i≤n
i6=j
e1 = b11 a1 + · · · + b1n an
...
en = bn1 a1 + · · · + bnn an
il vient
dét (a1 , . . . , aj−1 , aj , aj+1 , . . . , an )
X n
= ai,j dét (a1 , . . . , aj−1 , ei , aj+1 , . . . , an )
i=1
n
X X
= ai,j sgn (σ) a1,σ1 . . . aj−1,σj−1 (ei )σj aj+1,σj+1 . . . an,σn
i=1 σ∈Sn
Xn X Y
= ai,j sgn (σ) aℓ,σℓ .
i=1 σ∈Sn 1≤ℓ≤n
σj =i ℓ6=j
σℓ 6=i
Pour chaque (i, j), les produits qui apparaissent dans le terme
X Y
sgn (σ) aℓ,σℓ
σ∈Sn 1≤ℓ≤n
σj =i ℓ6=j
σℓ 6=i
Pour (i, j), on fait remonter la ligne j de la matrice A en position 1 ce qui change le
signe de sgn (σ) par le facteur (−1)j−1 ; on déplace ensuite la colonne i de la matrice
résultante en position 1 ce qui change le signe de sgn (σ) par le facteur (−1)i−1 . On
obtient donc une nouvelle matrice A′ telle que a′1,1 = ai,j et comme les lignes et
colonnes restantes sont restées dans le même ordre on obtient la matrice Aj,i une
fois que la première ligne et la première colonne ont été envlevées. Enfin,
X Y X Y
sgn (σ) aℓ,σℓ = sgn (τ ) (−1)i−1+j−1 a′ℓ,τℓ .
σ∈Sn 1≤ℓ≤n τ ∈Sn 1≤ℓ≤n
σj =i ℓ6=i τ1 =1 ℓ6=1
σℓ 6=1 τℓ 6=1
De nouveau, comme on fait la somme par rapport à toutes les permutations telles
que τ1 = 1 cela revient à faire la somme par rapport à toutes les permutations τ ′
de {2, . . . , n} et
X Y X Y
sgn (σ) aℓ,σℓ = (−1)i+j sgn (τ ) (Aj,i )ℓ,τℓ
σ∈Sn 1≤ℓ≤n τ ∈Sn 1≤ℓ≤n
σj =i ℓ6=i τ1 =1 ℓ6=1
σℓ 6=1 τℓ 6=1
Ce lemme mène à la formule de Laplace qui est itérative dans le sens que, une
fois connu la formule du déterminant des matrices de taille (n − 1) × (n − 1), on
obtient celle des matrices de taille n × n.
Théorème 6.4 (Formule de Laplace). On peut développer le calcul du déterminant
de A suivant une ligne ou une colonne d’une matrice A de dimension n × n :
(i) formule de développement par rapport à la colonne j
n
X
dét A = ai,j (−1)i+j dét (Ai,j );
i=1
Pour bien s’en convaincre. on peut vérifier que la formule de Laplace donne
bien le même résultat que la formule de Leibniz pour n = 3 dans l’Exemple 6.4 :
a11 a12 a13
dét a21 a22 a23
a31 a32 a33
a a23
= a11 (−1)1+1 dét 22
a32 a33
1+2 a21 a23 1+3 a21 a22
+ a12 (−1) dét + a13 (−1) dét .
a31 a33 a31 a32
Définition 6.4.
Le terme
déf
[M (A)]ij = dét (Ai,j ) (6.24)
déf
[Cof (A)]ij = (−1)i+j dét (Ai,j ) (6.25)
est appelé le cofacteur de ai,j . La matrice Cof (A) de dimension n × n est appelée
matrice des cofacteurs ou comatrice et est aussi dénotée com A.
Les formules du Théorème 6.4 portent le nom de développement suivant une ligne
(ou une colonne), méthode de Laplace ou méthode des cofacteurs ou des mineurs.
Avec ces définitions, il vient
1 1
A−1 = Cof A⊤ = (Cof A)⊤ . (6.27)
dét A dét A
est l’hypercube dans Rn dont la longueur des arêtes est 1 et dont le volume est 1.
L’hypercube C est transformé par A en un hyper-parallélépipède
( n )
déf
X
AC = αi ~ai : 0 ≤ αi ≤ 1, 1 ≤ i ≤ n . (6.32)
1=1
ka − â1 k = m = ka − â2 k.
Démonstration du Théorème 6.6. (i) Si les vecteurs ~a1 , . . . , ~an sont linéairement
dépendants, alors AC se trouve dans le sous-espace linéaire Lin (~a1 , . . . , ~an ) de di-
mension inférieure ou égale à n − 1. Le volume n-dimensionnel (n-volume) de AC
est donc 0 et le déterminant de la matrice A est aussi zéro car une de ses colonnes
est la combinaison linéaire des autres colonnes. Il est donc suffisant de démontrer le
théorème pour une famille de n vecteurs ~a1 , . . . , ~an linéairement indépendants (et
donc non nuls) dans Rn .
(ii) Pour le vecteur ~a1 , le 1-volume Vol(~a1 ) = k~a1 k, la longueur du vecteur ~a1 .
On pose ~b1 = ~a1 .
Pour deux vecteurs {~a1 , ~a2 }, le 2-volume Vol(~a1 , ~a2 ) = k~a1 k dLin (~a1 ) (~a2 ). Comme
Lin (~a1 ) = {α~a1 : α ∈ R} = Lin (~b1 ), la projection πLin (~b1 ) (~a2 ) = α̂1 ~b1 est ca-
ractérisée par
Comme les ~ai sont linéairement indépendants, ~b2 6= 0, ~b2 · ~b1 = 0 et Vol(~a1 , ~a2 ) =
k~b1 k k~b2 k.
On considère trois vecteurs {~a1 , ~a2 , ~a3 }. Puisque Lin (~a1 , ~a2 ) = Lin (~b1 , ~b2 ) =
{α1~b1 + α2~b2 : αi ∈ R}, le 3-volume Vol(~a1 , ~a2 , ~a3 ) = Vol(~a1 , ~a2 ) dLin (~b1 ,~b2 ) (~a3 ). La
288 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
projection πLin (~b1 ,~b2 ) (~a3 ) = α̂1 ~b1 + α̂2 ~b2 est caractérisée par
~a3 · ~bi
(~a3 − α̂1 ~b1 − α̂2 ~b2 ) · ~bi = 0, i = 1, 2, ⇒ α̂i = , i = 1, 2,
k~bi k2
déf ~a3 · ~b1 ~ ~a3 · ~b2 ~
⇒ ~b3 = ~a3 − b1 − b2 .
k~b1 k2 k~b2 k2
Comme les ~ai sont linéairement indépendants, ~b3 6= 0 et ~b3 · ~bi = 0, i = 1.2.
À l’étape i ≥ 3, on construit le vecteur
i−1
X i
Y
~bi déf ~ai · ~bj ~bj , ~bi 6= 0, ~bi · ~bj = 0, 1 ≤ j ≤ i − 1,
= ~ai − Vol(~a1 , . . . , ~ai ) = k~bj k
j=1 k~bj k2 j=1
n
Y
Vol(AC) = Vol(~a1 , . . . , ~an ) = k~bj k.
j=1
D’autre part, pour la matrice B = [~b1 . . . ~bn ], la matrice B ⊤ B est diagonale puisque
(B ⊤ B)ij = ~bi · ~bj et que les vecteurs ~bi sont orthogonaux entre eux. Il vient donc
n
Y
B ⊤ B = diag{kb1 k2 , . . . , |bn k2 } ⇒ dét (B ⊤ B) = dét B ⊤ dét B = k~bj k2
j=1
2
n
Y n
Y
⇒ |dét B| = 2
k~bj k ⇒ |dét A| = |dét B| = k~bj k = Vol(AC)
j=1 j=1
est appelée densité canonique (voir, par exemple, M. Berger et B. Gostiaux [1]).
Enfin, attention, il y a des hypothèses à vérifier sur T et f . En particulier, dét DT
ne doit pas changer de signe sur Ω.
On dit que la courbe est simple si T est injective, c’est-à-dire, la courbe ne s’inter-
secte pas avec elle-même. Lorsque T est linéaire
a1 a
x 7→ T (x) = x : R → R , DT (x) = 1 ∈ L(R, R2 ),
2
(6.39)
a2 a2
pour un vecteur
a
~a = 1 ∈ R2 .
a2
Lorsque ~a n’est pas nul, la courbe est simple et correspond au vecteur partant de
l’origine dans R2 et se terminant au point ~a. Sa longueur est donc
s s q
q a1
a1
a21 + a22 = a1 a2 = dét a1 a2 = dét (DT (x)⊤ DT (x)).
a2 a2
qui se reduit à |dét DT (x)| si T : Rn → Rn car |dét [DT (x)]| = |dét [DT (x)⊤ ]|.
Elle demeure vraie pour des courbes simples non-planaires dans Rn , n ≥ 3, en
introduisant une application différentiable et injective T : R → Rn .
On peut passer des courbes aux surfaces dans R3 ou en dimensions supérieures
en introduisant une application continue T : R2 → Rn , n ≥ 3, qui transformera le
carré [0, 1] × [0, 1] en une surface
déf
S = {T (x) : x ∈ [0, 1] × [0, 1]} ⊂ Rn .
Lorsque T est linéaire
a11 a12 a11 a12
x 7→ T (x) = ... .. x1 : R2 → Rn , ..
DT (x) = . .. ∈ L(R2 , Rn ),
. x2 .
an1 an2 an1 an2
pour une matrice n × 2
a11 a12
.. .
A = ... .
an1 an2
On obtient alors un parallélépipède P dans Rn généré par les deux vecteurs
a11 a12
~a1 = ... ~a2 = ... .
an1 an2
L’aire de P est alors donnée par la formule
r q
⊤
aire (P ) = dét ~a1 ~a2 ~a1 ~a2 = |dét (A⊤ A)|,
7 Exercices
Exercice 7.1.
déf
Soient deux fonctions f, g : R → R et leur composition x 7→ (f ◦ g)(x) = f (g(x)) :
R → R. Montrer que si f (g(x)) et g (x) existent au point x alors la dérivée (f ◦g)′ (x)
′ ′
Exercice 7.2.
Soit f : [a, b] → R telle que f ′ (x) existe et soit uniformément continue sur ]a, b[ .
Montrer que, pour tout ε > 0, il existe δ > 0 tel que
f (y) − f (x)
∀x, y ∈ ]a, b[ , 0 < |y − x| < δ, − f ′ (x) < ε.
y−x
0.5
0.25
z
4
0
-0.25
2
-0.5
0
y 4
2
-2
0
x
-2
-4
-4
Exercice 7.3.
Montrer que la fonction numérique (voir Figure 6.9)
2
xy , si x 6= 0
déf
f (x, y) = x2 + y 4
0, si x = 0
292 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
est dérivable en (x, y) = (0, 0) dans toutes les directions v = (v1 , v2 ), mais qu’elle
n’est ni différentiable au sens de Gateaux ni continue au point (x, y) = (0, 0).
Remarquer que l’on a les propriétés suivantes
Exercice 7.4.
Montrer que si f : Rn → Rm est directionnellement dérivable au sens de Hadamard
en x, alors l’application
v 7→ dH f (x, v) : Rn → Rm (7.1)
Exercice 7.5.
Soient f, g : Rn → Rm deux applications Fréchet différentiables sur Rn et la nouvelle
application
déf
x 7→ h(x) = f (x) · g(x) : Rn → R . (7.2)
ou, si ∇h(x) est interprété comme un vecteur colonne (ou matrice n × 1) et f (x) et
g(x) comme des vecteurs colonnes (ou matrice m × 1),
Exercice 7.6.
Soit f : Rn → Rm une application Fréchet différentiable telle que kf (x)kRm = 1
pour la norme euclidienne. Montrer que
Df (x)⊤ f (x) = 0.
Exercice 7.7.
Soit f : Rn → R admettant des dérivées partielles d’ordre un bornées dans un
ouvert U de Rn .
(i) Montrer que f est continue sur U et lipschizienne en chaque point de U .
Indication. S’inspirer de la démonstration du Théorème 3.11.
(ii) Est-ce que, en général, f est Gateaux différentiable en tout point de U ?
7. Exercices 293
Montrer que
(i) f , ∂x f et ∂y f existent et sont continues sur R2 ;
2
(ii) ∂xy 2
f = ∂x (∂y f ) et ∂yx f = ∂y (∂x f ) existent dans R2 et sont continues sauf
en (0, 0) ;
2 2
(iii) ∂xy f (0, 0) = 1 et ∂yx f (0, 0) = −1.
Rappel. La notation (3.66) :
2 ∂ ∂f
∂ji f (x) = (x) = d2 f (x; ei ; ej ) = Hf (x)ij .
∂xj ∂xi
Exercice 7.9.
Soit l’application linéaire A : Rn → Rn (ou une matrice n × n) et b ∈ Rn (ou un
n-vecteur). On construit la fonction
déf 1
f (x) = (Ax) · x + b · x, x ∈ Rn .
2
(i) Calculer f ′ (x; v) (ou le gradient de f ) et d2 f (x; v; w) (ou la hessienne de
f ).
(ii) Donner des conditions nécessaires et suffisantes sur A et b pour que f soit
convexe dans tout Rn .
(iii) Donner des conditions nécessaires et suffisantes sur A et b pour que f soit
strictement convexe dans tout Rn .
(iv) Est-ce que les fonctions f associées aux matrices et vecteurs
3 1 −2 2 4 1
(a) A = ,b= , et (b) A = ,b= ,
−1 2 1 4 1 1
sont convexes ?
Exercice 7.10.
Soient f (x) = kxkn , n ≥ 1, et kxk la norme euclidienne de x ∈ Rk , k ≥ 1.
(i) Déterminer les n ≥ 1 pour lesquels f est Hadamard (Fréchet) différentiable
en tout point de Rk .
(ii) Déterminer les n ≥ 1 pour lesquels Hf (x) existe en tout point de Rk
(iii) Déterminer les valeurs de n ≥ 1 pour lesquelles f est convexe dans Rk .
294 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
Exercice 7.11.
Montrer que la fonction f (x) = sin x+(1+x)2 est convexe dans l’intervalle [0, 1].
Exercice 7.12.
On dit que C ⊂ Rn est un cône de sommet 0 si
∀x ∈ C, ∀λ > 0, λx ∈ C. (7.6)
(i) Soit f : Rn → R une fonction convexe Gateaux différentiable en tout point
d’un cône convexe C. Montrer que argminf (C) 6= ∅ si et seulement si
∃x ∈ C, ∇f (x) · x = 0 et ∀y ∈ C, ∇f (x) · y ≥ 0. (7.7)
Exercice 7.13.
Pour ε > 0, une matrice m × n et un vecteur c ∈ Rm on considère le problème :
déf
inf f (x) + εkxk2Rn , f (x) = kAx − ck2Rm . (7.8)
x∈Rn
Exercice 7.14.
Soit B une matrice n × n symétrique et définie positive. On associe à B la fonction
déf Bx · x
f (x) = , x 6= 0, (7.9)
kxk2
où kxk est la norme euclidienne dans Rn .
(i) Montrer qu’il existe x∗ ∈ Rn tel que kx∗ k = 1 et
Bx · x
f (x∗ ) = inf . (7.10)
06=x∈Rn kxk2
Exercice 7.15.
Soient A et B deux matrices symétriques n× n. On suppose B définie positive. Pour
x ∈ Rn , x 6= 0, on définit la fonction
déf Ax · x
f (x) = . (7.12)
Bx · x
déf
(i) Montrer que l’ensemble U = {x ∈ Rn : Bx · x = 1} est non-vide et
compact.
(ii) Montrer qu’il existe x̂ ∈ Rn tel que B x̂ · x̂ = 1 et
Ax · x
f (x̂) = inf . (7.13)
06=x∈Rn Bx · x
(iii) Calculer ∇f (x) pour x 6= 0 et caractériser x̂. Montrer que pour tout λ tel
que dét (A − λB) = 0, on a f (x̂) ≤ λ.
296 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
Annexe A. Corrigés des exercices 297
1 Exercices du Chapitre 1
Exercice 5.1
Montrer que si r ∈ Q et s ∈ R \ Q, alors r + s ∈ R \ Q et rs ∈ R \ Q i ∪ {0}.
Solution. (i) (addition.) Par l’absurde. On suppose que r + s ∈ Q. Ce qui donne
s = (r + s) − r ∈ Q ce qui contredit le fait que s ∈ R \ Q.
(ii) (produit.) Si r = 0, alors rs = 0. Si 0 6= r ∈ Q, alors
rs
s= ∈Q
r
comme quotient de deux rationnels ce qui contredit le fait que s ∈ R \ Q.
Exercice 5.2
Soit A, ∅ 6= A ⊂ R et
déf
−A = {−a : a ∈ A} .
∀a ∈ A, b0 ≤ a ⇒ ∀a ∈ A, −a ≤ −b0
et −b0 est une borne supérieure de −A. Donc c0 = sup (−A) ∈ R et c0 ≤ −b0 . Ceci
entraı̂ne
∀a ∈ A, −a ≤ c0 ≤ −b0
⇒ ∀a ∈ A, b0 ≤ −c0 ≤ a
et −c0 est une borne inférieure de A. Mais comme b0 est la plus grande borne
supéreure de A, on a b0 ≥ −c0 et finalement b0 = −c0 . Par définition de b0 et c0 ,
2 Exercices du Chapitre 2
Exercice 5.1
Montrer qu’il est impossible de définir sur l’ensemble des nombres complexes
C un ordre total qui lui confère une structure de corps ordonné. (Indication : −1
est un carré.
298 Annexe A. Corrigés des exercices
Solution. S’il y a un ordre total sur C qui en fasse un corps ordonné, alors de la
Proposition 3.4 (d), on a 1 > 0 et pour tout x ∈ C, x 6= 0, on a x2 > 0. Comme
i 6= 0 on a ou bien i > 0 ou −i > 0 ce qui donne −1 = i2 > 0 et −1 = (−i)2 > 0.
On obtient donc une contradiction dans chaque cas.
Exercice 5.2
Démontrer les résultats suivants.
(i) L’ensemble des irrationnels R \ Q n’est pas dénombrable.
(ii) Le segment ]a, b[ et le segment ]c, d[ ont le même cardinal.
(iii) Le segment ]0, 1[ et R ont le même cardinal.
Démonstration. (i) On a déjà démontré que R n’est pas dénombrable (Théorème
2.5 du Chapitre 2) et que Q est dénombrable (Exemple 2.3). On peut partionner R
en deux ensembles disjoints
3 Exercices du Chapitre 3
Exercice 10.1
Soient x, y ∈ Rk . Établir que
kx + yk2 + kx − yk2 = (x + y) · (x + y) + (x − y) · (x − y)
= x · x + y · y + 2x · y + x · x + y · y − 2x · y
= 2 x · x + 2 y · y = 2 kxk2 + 2 kyk2.
La somme des carrés des côtés d’un parallèlogramme est égale à la somme des carrés
de ses deux diagonales.
Exercice 10.2
Soit x ∈ Rk , k ≥ 2. Démontrer qu’il existe y ∈ Rk , y 6= 0, tel que x · y = 0.
k
X k
X
x2j = 0 et x2j > 0.
j=1 j=1
j6=i j6=i
yi = 0 et yj = 1 pour j 6= i;
k
1 X 2
yj = xj pour j 6= i et yi = − x .
xi j=1 j
j6=i
300 Annexe A. Corrigés des exercices
Exercice 10.3
Soit R+ = {x ∈ R : x ≥ 0}.
(i) Montrer que, pour tout espace métrique (X, d) et pour toute constante
α > 0, la fonction
déf
(x, y) 7→ (αd)(x, y) = α d(x, y)
déf d(x, y)
(x, y) 7→ d(x, y) =
1 + d(x, y)
et, en plus,
d1 (x, y) = 0 ⇒ x = y. (3.4)
Exercice 10.5
Soit E un espace vectoriel normé au sens des Définitions 1.1 et 1.4 du Chapitre
2. Montrer que
déf
d(x, y) = kx − yk
Bn = ∪ni=1 Ai et B = ∪∞
i=1 Ai .
Démontrer que
∀n ≥ 1, Bn = ∪ni=1 Ai et B ⊃ ∪∞
i=1 Ai .
Ai ⊂ ∪∞
i=1 Ai ⇒ Ai ⊂ ∪∞
i=1 Ai = B ⇒ ∪∞
i=1 Ai ⊂ B.
ce qui donne Ai = Ai et
∪∞
i=1 Ai = B $ B ∪ {0} = B.
Exercice 10.7
Donner un exemple d’un ensemble borné de R ayant exactement trois points
d’accumulation.
Solution. L’ensemble
1 1 1
: n ≥1 ∪ 1+ : n ≥ 1 ∪ 2+ : n ≥ 1
n n n
Exercice 10.8
On désigne par E ′ l’ensemble des points d’accumulation d’un sous-ensemble
d’un espace métrique (X, d). Établir que E ′ est fermé et que E et E ont les mêmes
points d’accumulation. E et E ′ ont-ils toujours les mêmes points d’accumulation ?
Solution. Soit (X, d) l’espace métrique sousjacent et E ⊂ X.
(i) (E ′ )′ ⊂ E ′ . Pour montrer que E ′ est fermé dans (X, d), il suffit d’établir
que (E ′ )′ ⊂ E ′ , c’est-à-dire, tout point d’accumulation x′ ∈ X de E ′ est un point
d’accumulation de E ce qui revient à démontrer que
Il existe donc x′1 ∈ E ′ , x′1 6= x′ , tel que d(x′1 , x′ ) < r/2. Comme x′1 ∈ E ′ ,
′ ′
Bd(x ′ ,x′ )/3 (x1 ) ∩ E 6= ∅
1
et il existe x1 ∈ E, x1 6= x′1 , tel que d(x′1 , x1 ) < d(x′1 , x′ )/3. Donc, par l’inégalité du
triangle,
d(x′1 , x′ )
d(x1 , x′ ) ≤ d(x′1 , x′1 ) + d(x′1 , x′ ) < + d(x′1 , x′ ) < r ⇒ x1 ∈ Br (x′ ) ∩ E
3
d(x′1 , x′ )
d(x1 , x′ ) ≥ d(x′1 , x′ ) − d(x′1 x1 ) > d(x′1 , x′ ) − > 0 ⇒ x1 6= x′
3
⇒ Br′ (x′ ) ∩ E ⊃ {x1 } 6= ∅.
et E ′ ⊂ (E)′ .
Dans l’autre sens, on veut montrer que pour x′ ∈ (E)′ , on a x′ ∈ E ′ , c-à-d.,
′
On fixe r > 0. Comme Br/2 (x′ ) ∩ E 6= ∅, soit x̄ ∈ Br/2
′
(x′ ) ∩ E. Comme x̄ ∈ E est
′
un point d’adhérence de E et que d(x̄, x ) > 0, il vient
d(x̄, x′ ) r r
d(y, x′ ) ≤ d(y, x̄) + d(x̄, x′ ) < + d(x̄, x′ ) < + < r
3 6 2
d(x̄, x′ ) 2
d(y, x′ ) ≥ d(x̄, x′ ) − d(y, x̄) > d(x̄, x′ ) − = d(x̄, x′ ) > 0
3 3
⇒ y ∈ Br (x′ ) ∩ E ⇒ x′ ∈ E ′
qui a pour points d’accumulation exactement E ′ = {0, 1, 2}. Comme E ′ n’a que
des points isolés, (E ′ )′ = ∅. Donc, en général, (E ′ )′ $ E ′ .
3. Exercices du Chapitre 3 305
Exercice 10.9
Tout point d’un ensemble fermé E ⊂ R2 est-il point d’accumulation de E ?
Reprendre le problème en supposant E ouvert.
Solution. (i) Tout point d’un ensemble fermé n’est pas un point d’accumulation. Il
suffit de prendre E = {0} dans R.
(ii) Cependant, pour tout point x d’un ensemble ouvert E, il existe r > 0 tel
que Br (x) ⊂ E et pour tout ρ, 0 < ρ ≤ r, Bρ (x) ⊂ E, Donc
Exercice 10.10
Soit (X, d) un espace métrique et E un sous-ensemble de X. Montrer que
(a) ∁ int E = ∁E.
(b) Est-ce que E et int E ont le même intérieur ?
(c) Est-ce que E et int E ont la même adhérence ?
∁E ⊂ ∁ int E.
Dans l’autre sens, on montre que ∁∁E ⊂ int E ce qui implique ∁ int E ⊂ ∁E. Comme
∁∁E est ouvert, pour tout x ∈ ∁∁E, il existe r > 0 tel que
et x ∈ int E.
(b) Est-ce que E et int E ont le même intérieur ? Oui car, par le Théorème 3.1
(ii) et (iii) du Chapitre 3, int E est ouvert et, si E est ouvert, alors E = int E. On
a donc int (int E) = int E.
(c) Est-ce que E et int E ont la même adhérence ? Par définition, int E ⊂ E
entraı̂ne int E ⊂ E. En général, on n’a pas l’égalité. Par exemple,
déf
E = {0} ∪ [1, 2], E = E, int E = ]1, 2[ , int E = [1, 2].
Exercice 10.11
Donner un exemple d’un recouvrement ouvert de l’intervalle ]0, 1[ dont on ne
peut extraire de sous-recouvrement fini.
Solution. On prend
déf 1 déf 1 1
Gn = ,1 , n≥1 ou Gn = ,1 − , n ≥ 1.
n n n
Exercice 10.12
Si X est un ensemble infini, on pose pour tout x, y ∈ X
(
1, si x 6= y
d(x, y) =
0, si x = y.
Montrer que d est une métrique sur X. Quels en sont les ouverts ? les fermés ? les
compacts ?
(ii) Soit x ∈ X. En prenant r = 1/2, il vient B1/2 (x) = {x}. Par définition
tout singleton {x} de X est un ouvert. Comme les unions arbitraires d’ouverts sont
ouvertes, alors tout sous-ensemble de X est ouvert.
De même, pour tout sous-ensemble E de X, ∁E est un ouvert ce qui entraı̂ne
E = ∁(∁E) est fermé.
Pour un compact K ⊂ X, pour tout recouvrement ouvert Gα de K, il existe
un sous-recouvrement fini :
K ⊂ ∪ni=1 Gαi .
Exercice 10.13
On considère l’ensemble à deux éléments {0, 1} dans R équipé d’une métrique
arbitraire d (il en existe au moins une : d(x, y) = |x − y|).
(i) Énumérer tous les ouverts de ({0, 1}, d). Justifier.
(ii) Énumérer tous les compacts de ({0, 1}, d). Justifier.
(iii) Est-ce que ({0, 1}, d) est complet ? Justifier.
(iv) Énumérer tous les fermés de X = {0, 1, 2} pour une métrique arbitraire
dX sur X. Justifier.
Exercice 10.14
Soit {xn } une suite de Cauchy d’une espace métrique (X, d) ayant une valeur
d’adhérence x ∈ X. Montrer que xn → x.
Solution. Soit {xnk } la sous-suite telle que xnk → x. Par l’inégalité du triangle
ε
nk ≥ k > K > N ⇒ d(xn , xnk ) < .
2
308 Annexe A. Corrigés des exercices
Exercice 10.15
Soit X = R muni de la métrique d(x, y) = |x − y|.
(i) Montrer que l’application
déf x
x 7→ ϕ(x) = : R → ] − 1, 1[ (3.12)
1 + |x|
est une bijection.
(ii) Vérifier que
déf x y
dϕ (x, y) = d(ϕ(x), ϕ(y)) = − (3.13)
1 + |x| 1 + |y|
est une métrique sur R.
(iii) Vérifier que la suite {n}, n ≥ 1, est dϕ -Cauchy, mais pas d-Cauchy.
Démonstration. (i) La fonction ϕ est bien définie. Pour x, y ∈ R tel que ϕ(x) = ϕ(y),
on a
x y
=
1 + |x| 1 + |y|
ce qui veut dire que x et y ont le même signe. Si x ≥ 0
x y
= ⇒ x = y;
1+x 1+y
si x < 0
x y
= ⇒ x = y.
1−x 1−y
La fonction ϕ est injective. Pour la surjectivité, on se donne y ∈ ] − 1, 1[ et on
cherche s ∈ R tel que x/(1 + |x|) = y. On voit que x doit être du même signe que
y. Il y a de nouveau deux cas. Si x ≥ 0
x y y
=y ⇒ x= = ;
1+x 1−y 1 − |y|
si x < 0
x y y
=y ⇒ x= = .
1−x 1+y 1 − |y|
3. Exercices du Chapitre 3 309
La fonction inverse
y
ϕ−1 (y) =
1 − |y|
est donc bien définie et ϕ est bijective.
(ii) Par définition, dϕ (x, y) = d(ϕ(x), ϕ(y)) ≥ 0 puisque d est une métrique.
Comme ϕ est une bijection, on a M1
Pour M2
Pour M3
n+m n m 1
dϕ (n + m, n) = − = < .
1+n+m 1+n (1 + n + m)(1 + n) 1+n
Pour ε > 0, soit N un entier naturel plus grand que 1/ε − 1, Alors, pour tout n > N
et tout m ≥ 1
1 1
dϕ (n + m, n) < < <ε
1+n 1+N
et {n} est dϕ -Cauchy.
Exercice 10.16
Soient (X, d) un espace métrique complet et {En } une suite décroissante de
fermés bornés non-vides tel que
Montrer que ∩∞
n=1 En est un singleton.
Solution. Comme limn→∞ diam (En ) = 0, il existe une sous-suite {Enk } telle que
1
∀k ≥ 1, diam (Enk ) < .
2k
Pour chaque k on choisit un point xk ∈ Enk . Comme Enk+1 ⊂ Enk , on a
1
∀k ≥ 1, d(xk+1 , xk ) ≤ diam (Enk ) < .
2k
310 Annexe A. Corrigés des exercices
Exercice 10.17
On dit qu’un espace métrique est séparable s’il contient un sous-espace dé-
nombrable et dense. Montrer que Rk est séparable.
Solution. Il suffit de prendre le sous-espace Qk . Comme Q est dénombrable, Qk est
dénombrable par le Théorème 2.3 du Chapitre 2. De la même façon, comme Q est
dense dans R, Qk est dense dans Rk .
Exercice 10.18
On dit qu’une famille d’ouverts {Oα } est une base de X si tout ouvert de X
est la réunion d’ouverts de cette famille. Montrer qu’un espace métrique séparable
posssède une base dénombrable.
Solution. Soit S le sous-espace dénombrable dense de (X, d). On associe à chaque
s ∈ S la famille de boules ouvertes
déf
{Bq (s) : 0 < q ∈ Q} et B = {Bq (s) : 0 < q ∈ Q et s ∈ S} (3.14)
Comme il y a bijection
déf
(s, q) 7→ Bq (s) : S × Q+ , Q+ , = {q ∈ Q : q > 0
Enfin, par densité de Q dans R, il existe qr ∈ Q+ tel que r/3 < qr < r/2. On a donc
r r r
∀z ∈ Bqr (sx ), d(x, z) ≤ d(x, sx ) + d(sx , z) < + qr < + < r
3 3 2
r
d(x, sx ) < < qr ⇒ x ∈ Bqr (sx ) ⊂ Br (x) ⊂ O.
3
On a montré que, pour chaque x ∈ O, il existe sx ∈ S et qx ∈ Q+ tel que
x ∈ Bqx (sx ) ⊂ Br (x) ⊂ O
⇒ O⊂∪ s∈S et ∃q∈Q+ Bq (s) ⊂ O.
tel que Bq (s)⊂O
Exercice 10.19
Soit un espace métrique (X, d) dans lequel tout sous-ensemble infini possède
au moins un point d’accumulation. Démontrer que X est séparable. Indication :
Soit r > 0 et x1 ∈ X ; ayant déterminé x1 . . . . , xj ∈ X, choisir, s’il existe, un point
xj+1 tel que d(xj , xj+1 ) ≥ r pour tout i = 1, . . . , j. Montrer que cette construction
s’arrête au bout d’un nombre fini de boules ouvertes de rayon r. Prendre r = 1/n
(n = 1, 2, 3, . . . ) et considérer les centres des boules correspondantes.
Solution. Soit r > 0 et x1 ∈ X ; ayant déterminé x1 . . . . , xj ∈ X, choisir, s’il existe,
un point xj+1 tel que d(xj , xj+1 ) ≥ r pour tout i = 1, . . . , j.
Si la construction ne s’arrète pas après un nombre fini d’étapes, on obtient
une suite infinie de points distincts S = {xi : i ∈ N}. Par hypothèse, cet ensemble
possède au moins un point d’accumulation x ∈ X :
∀ρ > 0, Bρ′ (x) ∩ S 6= ∅.
Pour ρ = r/4, Bρ′ (x) ∩ S contient une infinité de points de S et
r
∀s ∈ Bρ′ (x) ∩ S, d(s, x) < .
4
Donc pour tous points s1 et s2 de Bρ′ (x) ∩ S, s1 6= s2 ,
r r r
d(s1 , s2 ) ≤ d(s1 , x) + d(s2 , x) < + = < r
4 4 2
ce qui contredit le fait que par construction tous les points de S sont distants d’au
moinst r.
Pour r = 1, soit x1,1 , . . . , x1,N1 } la suite finie associée ; pour r = 1/2, soit
x2,1 , . . . , x2,N2 } la suite finie associée ; pour r = 1/n, soit xn,1 , . . . , xn,Nn } la suite
finie associée. L’union E de toutes ces suites est au plus dénombrable.
Cet ensemble est dense dans X. En effet, supposons qu’il existe x ∈ X et ε > 0
tel que pour tout xn,jn ∈ S, d(x, xn,jn ) ≥ ε. Soit n ∈ N tel que 1/n < ε. Donc,
1
∀jn , 1 ≤ jn ≤ Nn , d(x, xn,jn ) ≥ ε >
n
et ceci contredit la construction des points xn,jn pour r = 1/n car on pourrait y
ajouter x qui est à une distance plus grande que 1/n de tous les autres.
312 Annexe A. Corrigés des exercices
Exercice 10.20
Démontrer que tout espace métrique compact K a une base dénombrable et
qu’il est donc séparable. Indication : pour tout entier n > 0, il existe un nombre
fini de boules ouvertes de rayon 1/n recouvrant K.
4 Exercices du Chapitre 4
Exercice 10.1
Soit f : X → Y . Alors l’application induite f −1 : P(Y ) → P(X) préserve les
opérations élémentaires suivantes :
(1) f −1 (∪α Bα ) = ∪α f −1 (Bα ).
(2) f −1 (∩α Bα ) = ∩α f −1 (Bα ).
(3) f −1 (B1 \B2 ) = f −1 (B1 )\f −1 (B2 ).
On obtient donc
puisque f −1 (B1 ) ⊂ X.
4. Exercices du Chapitre 4 313
Exercice 10.2
Soit f : X → Y . Alors l’application induite f : P(X) → P(Y ) préserve les
opérations suivantes :
(1) f (∪α Bα ) = ∪α f (Bα ).
(2) f (∩α Bα ) ⊂ ∩α f (Bα ).
Démonstration. Même type d’argument que pour l’Exercice 10.1.
Exercice 10.3
Soit f : X → Y . Alors
(1) pour chaque A ⊂ X, f −1 [f (A)] ⊃ A.
(2) pour chaque A ⊂ X et B ⊂ Y ,
f A ∩ f −1 (B) = f (A) ∩ B (4.1)
et, en particulier,
f f −1 (B) = f (X) ∩ B. (4.2)
Démonstration. (1) Par définition,
f −1 (f (A)) = {x ∈ X : f (x) ∈ f (A)} ⊃ {x ∈ A : f (x) ∈ f (A)} = A.
(2) Par définition,
A ∩ f −1 (B) = A ∩ {x ∈ X : f (x) ∈ B} = {x ∈ A : f (x) ∈ B}
⇒ f (A ∩ f −1 (B)) = {f (x) : x ∈ A et f (x) ∈ B} = f (A) ∩ B.
Enfin, on applique la formule avec A = X.
Exercice 10.4
Soit f : X → Y et g : Y → Z. Alors (g ◦ f )−1 = f −1 ◦ g −1 .
Démonstration. Comme chaque application inverse induite est bien définie
f −1 : P(Y ) → P(X) et g −1 : P(Z) → P(Y ),
la composition g −1 ◦ f −1 : P(Z) → P(X) est bien définie. De même la composition
des applications induites est bien définie
f : P(X) → P(Y ) et g : P(Y ) → P(Z) ⇒ f ◦ g : P(X) → P(Z).
Pour C ∈ P(Z)
(g ◦ f )−1 (C) = {x ∈ X : g(f (x)) ∈ C}
= {x ∈ X : f (x)) ∈ g −1 (C)}
= f −1 (g −1 (C)) = (f −1 ◦ g −1 )(C)).
Donc (g ◦ f )−1 = f −1 ◦ g −1 .
314 Annexe A. Corrigés des exercices
Exercice 10.5
(i) Soit un ensemble arbitraire X et soit {Aα } un recouvrement de X par des
sous-ensembles de X.
(ii) Soit Y un autre ensemble et une famille fα : Aα → Y d’applications tel
que
∀α, f |A α = f α .
pour un α tel que x ∈ Aα . La fonction f est bien définie car s’il existe un β 6= α tel
que x ∈ Aβ , alors, par hypothèse, f (x) = fα (x) = fβ (x). L’application f est unique
car s’il y en avait une seconde f ′ , on aurait
f ′ | A α = f α = f |A α ⇒ f ′ = f sur X = ∪Aα .
Exercice 10.6
Soit f : X → Y et g : Y → X tel que g ◦ f = IX où IX est la fonction identité
sur X. Alors f est injective et g est surjective.
Démonstration. L’application f est injective puisque, pour tous x, x′ ∈ X,
z = g(f (z)),
Exercice 10.7
Soit f : (X, dX ) → R une application continue. Montrer que
déf
f −1 {0} = {x ∈ X : f (x) = 0} (4.3)
Exercice 10.8
Soient f, g : (X, dX ) → (Y, dY ) deux applications continues entre deux espaces
métriques et E un sous-ensemble dense dans (X, d). Montrer que
(i) f (E) est dense dans (f (X), dY ) ;
(ii) f = g sur E entraı̂ne f = g sur X.
Comme f (E) est fermé, f (X) = f (E) et f (E) est dense dans f (X).
(ii) Soit x ∈ X. Par densité de E dans X, il existe une suite {xn } dans E qui
dX -converge vers x. Par continuité de f , f (xn ) → f (x) dans (Y, dY ). Comme f = g
sur E, g(xn ) = f (xn ) et, par continuité de g, g(xn ) → g(x). Par unicité de la limite
dans (Y, dY ), f (x) = g(x).
Exercice 10.9
(i) On se donne la fonction f : R2 → R
xy 2
déf , si (x, y) 6= (0, 0)
f (x, y) = x2 + y 4
0, si (x, y) = (0, 0)
Montrer que f est bornée sur R2 et n’est pas continue en (0, 0), mais que
sa restriction à toute droite passant par (0, 0) est continue.
(ii) On se donne la fonction g : R2 → R
xy 2
déf , si (x, y) 6= (0, 0)
g(x, y) = x2 + y 6
0, si (x, y) = (0, 0)
Montrer que g n’est bornée sur aucun voisinage de (0, 0) et n’est pas conti-
nue en (0, 0), mais que sa restriction à toute droite passant par (0, 0) est
continue.
xy 2 1 xy 2 1
0 ≤ (x ± y 2 )2 = x2 + y 4 ± 2 x y 2 ⇒ ∓ 2 4
≤ ⇒ 2 4
≤ .
x +y 2 x +y 2
v w2 w2
t →0 = 0.
v2 2
+t w 4 v
On a donc bien la continuité en (0, 0) le long de droites passant par (0, 0).
Pour montrer que f est discontinue en (0, 0), on suit le chemin x = y 2 ce qui
donne
4
y 1
= , si y 6= 0
f (y 2 , y) = y 4 + y 4 2 .
0, si y = 0
1
f (1/n2 , 1/n)) = 6→ 0 = f (0, 0).
2
(ii) Pour montrer que que f n’est pas continue en (0, 0), on suit le chemin
x = y 2 ce qui donne
y4 1
2 4 6
= , si y 6= 0
g(y , y) = y + y 1 + y2
0, si y = 0
⇒ g(y 2 , y) → 1 6= 0 = f (0, 0) lorsque y → 0.
Exercice 10.10
Démontrer que l’on peut remplacer la définition de la continuité uniforme sur
X par : pour tout ε > 0, il existe δ > 0 tel que
Pour tout E ⊂ X tel que diam (E) < δ, on a, par définition du diamètre,
Donc
∀x, ∀x′ ∈ X tel que dX (x′ , x) < δ/2, dY (f (x′ ), f (x)) < ε
Exercice 10.11
Démontrer.
(i) La composition g◦f de deux fonctions f : (X, dX ) → (Y, dY ) uniformément
continue sur E ⊂ X et g : (Y, dY ) → (Z, dZ ) uniformément continue sur
f (E) ⊂ Y est uniformément continue sur X
(ii) La composition g ◦ f de deux fonctions f : (X, dX ) → (Y, dY ) lipschit-
zienne en x ∈ X et g : (Y, dY ) → (Z, dZ ) lipschitzienne en f (x) ∈ Y est
lipschitzienne en x ∈ X.
Démonstration. (i) Par hypothèse, pour tout ε > 0 il existe η > 0 tel que
∀x, x′ ∈ E, dX (x, x′ ) < δ, dY (f (x), f (x′ )) < η ⇒ dZ (g(f (x)), g(f (x′ ))) < ε.
(ii) Par définition, il existe c(f (x)) et r(f (x)) > 0 tel que
∀y,1 y2 ∈ Br(f (x)) (f (x)), dZ (g(y1 ), g(y2 )) ≤ c(f (x)) dY (y1 , y2 )
On réduit le rayon de Br(x) (x) ⊂ X pour que son image tombe dans la boule
Br(f (x)) (f (x)) ⊂ Y . On choisit le rayon ρ(x) = min{r(x), r(f (x))/c(x)}
Exercice 10.12
On dit qu’une application f : (X, dX ) → (Y, dY ) est ouverte si l’image f (O)
de tout ouvert O dans X est ouverte dans Y . Montrer qu’une application f : R → R
continue et ouverte est monotone.
Démonstration. On montre d’abord que f est injective. Soit x1 et x2 tel que f (x1 ) =
f (x2 ). Supposons sans perte de généralité que x1 < x2 . Comme [x1 , x2 ] est compact
et que f est continue
∃a ∈ [x1 , x2 ] tel que f (a) = inf f ([x1 , x2 ])
∃b ∈ [x1 , x2 ] tel que f (b) = sup f ([x1 , x2 ]).
4. Exercices du Chapitre 4 319
Si f (a) < f (x1 ), alors x1 < a < x2 et f (a) ∈ f ((x1 , x2 )). Comme f est ouverte,
l’image f ((x1 , x2 )) est ouverte et il existe r > 0 tel que Br (f (a)) ⊂ f ((x1 , x2 )) ce
qui signifierait qu’il existe z ∈ (x1 , x2 ) tel que f (z) = f (a) − r/2 ce qui contredirait
la minimalité de f (a). Donc f (x1 ) = f (a). Par le même argument appliqué au sup, il
vient f (x1 ) = f (b). La fonction f est donc constante et égale à f (x1 ) sur l’intervalle
(x1 , x2 ). Mais ceci contredit le fait que f est ouverte car f ((x1 , x2 )) = {f (x1 )} serait
fermée. f est donc injective.
Soit x1 < x2 . Comme f est injective f (x1 ) 6= f (x2 ). Supposons que f (x1 ) <
f (x2 ). On démontre d’abord que f est strictement croissante sur [x1 , x2 ]. Par le
raisonnement pécédent on a
Soient deux points x, y tel que x1 ≤ x < y ≤ x2 . On veut démontrer que f (x) <
f (y). Par injectivité de f , f (x) 6= f (y). Supposons que f (x) > f (y). Par injectivité
de f , ceci implique que f (x1 ) < f (y) < f (x) < f (x2 ) et x1 < x < y < x2 . Par le
théorème des valeurs intermédiaires, il existe z ∈ (y, x2 ) tel que f (z) = f (x) ce qui
contredit le fait que f est injective.
Il reste à démontrer que f est croissante sur R. Il suffit de démontrer qu’elle
est strictement croissante sur tout intervalle [a, b] tel que a < x1 < x2 < b. Ceci
découle des inégalités suivantes :
inf f ([a, b]) ≤ inf f ([x1 , x2 ]) = f (x1 ) < f (x2 ) = sup f ([x1 , x2 ]) ≤ sup f ([a, b]).
Par le même raisonnement que sur [x1 , x2 ], on démontre que f (a) = inf f ([a, b]) et
que f (b) = sup f ([a, b]). De là, f est strictement croissante sur [a, b].
Si l’on avait supposé que f (x1 ) > f (x2 ), on aurait obtenu que f est décroissante
sur R. Dans les deux cas f est monotone sur R.
Exercice 10.13
Soient deux espaces métriques (X, dX ) et (Y, dY ) et leur produit
déf
X × Y = {(x, y) : x ∈ X et y ∈ Y } . (4.5)
Exercice 10.14
On dénote par dn (y, x) = ky − xkRn la métrique euclidienne sur Rn , n ≥ 1 un
entier. Soit le pole nord p = (0, 0, 1) ∈ R3 de la sphère de rayon un
q
déf déf
S (2) = x = (x1 , x2 , x3 ) : kxkR3 = x21 + x22 + x23 = 1 ⊂ R3 .
ρ(x, y) = d3 (ϕ−1 (x), ϕ−1 (y)) = d3 (ϕ−1 (y), ϕ−1 (x)) = ρ(y, x).
Pour (M3) et x, y, z
d3 (ϕ−1 (x), ϕ−1 (z)) ≤ d3 (ϕ−1 (x), ϕ−1 (y)) + d3 (ϕ−1 (y), ϕ−1 (z))
⇒ ρ(x, z) ≤ ρ(x, y) + ρ(y, z).
est donc aussi une isométrie qui possède un prolongement uniformément continu ϕ b
à l’adhérence (S (2) \{p}, d3 ) qui est égale à S (2) (Théorème 6.3 du Chapitre 4).
322 Annexe A. Corrigés des exercices
Soit j : (S (2) \{p}, d3 ) → (S (2) , d3 ) l’injection de (S (2) \{p}, d3) dans son
adhérence (S (2) \{p}, d3 ) qui est égale à S (2) . La composition j ◦ ϕ−1
ϕ−1 j
(R2 , ρ) −→ (S (2) \{p}, d3) −→ S (2)
est donc aussi une isométrie qui possède un prolongement uniformément continu ψb
c2 , ρ̂) (Théorème 6.3 du Chapitre 4).
au complété (R
Les compositions ϕ c2 , ρ̂) → (R
b ◦ ψb : (R c2 , ρ̂) et ψb ◦ ϕb : S (2) → S (2) coincı̈dent
2 (2)
avec l’identité sur les sous-ensembles denses R et S \{p}. Par l’Exercice 10.8,
elles sont donc égales à l’identité et ϕ b est une bijection. Son inverse et elle sont
uniformément continues. En fait, comme ρ̂(x, y) = ρ(x, y) = d3 (ϕ−1 (x), ϕ−1 (y)),
sur R2 , il vient ρ̂(x, y) = d3 (ϕb−1 (x), ϕb−1 (y)) par densité et ϕ b est une isométrie.
(v) Comme ϕ̂ : S (2) c2
→ (R , ρ̂) est un homéomorphisme, elle est continue.
Enfin, comme la sphère S (2) est compacte dans (R3 , d3 ), son image par ϕ̂ :
c2 = ϕ(S
R b (2) )
5 Exercices du Chapitre 5
Exercice 8.1
Soit {fn } une suite de fonctions dans C 0 (K), K ⊂ Rn compact. Montrer que
si {fn } est uniformément équicontinue et que pour chaque x ∈ K, la suite {fn (x)}
dans R converge vers une fonction f : K → R,
fn (x) → f (x),
Solution. (i) On montre d’abord que f est uniformément continue sur K. Par hy-
pothèse la famille {fn } est uniformément équicontinue sur K si
∀ε > 0, ∃δ > 0, ∀n ≥ 1, ∀x, y ∈ K tel que kx − yk < δ, |fn (x) − fn (y)| < ε/3.
∀n > Nx , |f (x) − fn (x)| < ε/3 et ∀n > Ny , |f (y) − fn (y)| < ε/3.
5. Exercices du Chapitre 5 323
∀ε > 0, ∃δ > 0, ∀x, y ∈ K tel que kx − yk < δ, |f (x) − f (y)| < ε/3
|fn (x) − f (x)| ≤ |fn (x) − fn (xi )| + |fn (xi ) − f (xi )| + |f (xi ) − f (x)|
< ε/3 + |fn (xi ) − f (xi )| + ε/3
∀n > N, ∀x ∈ K |fn (x) − f (x)| < ε/3 + |fn (xi ) − f (xi )| + ε/3
< ε/3 + ε/3 + ε/3 = ε.
Exercice 8.2
Soit (X, d) un espace métrique compact, l’ensemble
déf
X = {A : ∅ 6= A ⊂ X et A fermé}
déf
et ∀A ∈ X , ∀x ∈ X, dA (x) = inf d(a, x).
a∈A
324 Annexe A. Corrigés des exercices
∀a ∈ A, d(a, x) ≥ 0
(iii) Pour montrer que ρX est une métrique, on doit vérifier les trois axiomes.
Pour (M1). Si A = B, alors dA = dB et ρX (A, B) = 0. Si ρX (A, B) = 0, alors
∀x ∈ X, dA (x) = dB (x).
Pour (M2)
ρX (A, B) = sup |dA (x) − dB (x)| = sup |dB (x) − dA (x)| = ρX (B, A).
x∈X x∈X
Donc la suite {an } ⊂ X est bornée. Par compacité de X, il existe une sous-suite,
encore indicée par n, qui converge vers un point y ∈ X :
an → y ⇒ d(y, x) = f (x).
f (y) ≤ [f (y) − dAn (y)] + [dAn (y) − dAn (an )] + dAn (an ),
| {z } | {z }
≤ d(y,an ) =0
le dernier terme est zéro et dAn est Lipschitz continue de constante 1. En passant à
la limite
⇒ ∀x ∈ X, f (x) ≥ dA (x).
|f (x) − f (y)| ≤ |f (x) − dAn (x)| + |dAn (x) − dAn (y)| + |dAn (y) − f (y)|,
| {z } | {z } | {z }
→0 ≤ d(x,y) →0
puisque dAn est Lipschitz de constante un. Enfin, le premier et troisième termes
tendent vers 0 par convergence uniforme. Comme f (y) = 0, il vient
⇒ ∀x ∈ X, f (x) ≤ dA (x).
Exercice 8.3
Soit Ω un sous-ensemble ouvert non-vide de Rn . Montrer qu’il existe une suite
croissante de compacts non vides Kk tel que Ω = ∪k≥1 Kk et, pour tout compact
K ⊂ Ω, il existe k ≥ 1 tel que K ⊂ Kk .
∅ = Ω ∩ ∁Ω = Ω ∩ ∁Ω ⇒ Ω⊂Ω⊂Ω ⇒ Ω = Ω.
Comme la norme et la fonction distance sont des fonctions continues, Kk est fermé.
Par définition, Kk est contenu dans la boule compacte Bk (0) de Rn . Les ensembles
Kk sont donc compacts comme sous-ensembles fermés de compacts. Enfin, pour
tout k ≥ 1,
∃xM ∈ K tel que kxM k = sup kx|| et ∃xm ∈ K tel que d∁Ω (xm ) = inf d∁Ω (x)
x∈K x∈K
Exercice 8.4
Soit Ω un ouvert non-vide de Rn et
déf
C(Ω) = {f : Ω → R |f continue sur Ω}
l’espace des fonctions continues sur Ω, où Ω n’est pas nécessairement borné. Soit
{Kk } la famille des sous-ensembles compacts construite dans l’Exercice 8.3 et pour
tout f ∈ C(Ω) et k ≥ 1 on pose
déf
qk (f ) = sup |f (x)|.
x∈Kk
qk (f − g) 1
=1− .
1 + qk (f − g) 1 + qk (f − g)
Maintenant, puisque qk (f − g) ≤ qk (f − h) + qk (h − g), il vient
1 + qk (f − g) ≤ 1 + qk (f − h)) + qk (h − g)
1 1
≥
1 + qk (f − g) 1 + qk (f − h) + qk (h − g)
1
≥
1 + qk (f − h) + qk (h − g) + qk (f − h) qk (h − g)
1
= .
(1 + qk (f − h)) (1 + qk (h − g))
328 Annexe A. Corrigés des exercices
Donc
qk (f − g) 1
=1 −
1 + qk (f − g) 1 + qk (f − g)
1
≤ 1−
(1 + qk (f − h)) (1 + qk (h − g))
qk (f − h) + qk (h − g) + qk (f − h) qk (h − g)
=
(1 + qk (f − h)) (1 + qk (h − g))
qk (f − h) + qk (h − g) + 2 qk (f − h) qk (h − g)
≤
(1 + qk (f − h)) (1 + qk (h − g))
qk (f − h) qk (h − g)
= + .
1 + qk (f − h)) 1 + qk (h − g)
Exercice 8.5
(i) Montrer que si A ∈ L(Rn ) est inversible, alors A−1 ∈ L(Rn ).
(ii) Montrer que si A ∈ L(Rn , Rm ) est injective, alors A⊤ A ∈ L(Rn ) est inver-
sible, où A⊤ ∈ L(Rm , Rn ) est l’application transposée de A.
(iii) Montrer que pour A ∈ L(Rn , Rm ), Ker A et Im A sont des sous-espaces
linéaires (espaces vectoriels).
A(αx + βy) = α Ax + β Ay = α 0 + β 0 = 0.
5. Exercices du Chapitre 5 329
α Ax + β Ay = A(αx + βy) ∈ Im A.
Soit y ∈ (Im A)′ un point d’accumulation de Im A. Il existe donc une suite {yk =
Axk } dans Im A tel que yk 6= y et yk → y dans Rm . On a aussi vu que Im A =
[Ker A⊤ ]⊥ , Donc, pour tout z ∈ Ker A⊤
0 = yk · z → y · z ⇒ ∀z ∈ Ker A⊤ , y · A⊤ z = 0
⇒ y ∈ [Ker A⊤ ]⊥ = Im A.
et Im A est fermée.
Exercice 8.6
(i) Trouver et caractériser tous les A ∈ GL(n) tels que
forme un groupe ?
Solution. (i) Pour tout x ∈ Rn , on a
En particulier,
∀x, y ∈ Rn , AA⊤ (x − y) = x − y
⇒ kA(x − y)k2 = A⊤ A(x − y) · (x − y) = x − y · (x − y) = kx − yk2
330 Annexe A. Corrigés des exercices
et la propriété (8.1) kA(x − y)k = kx − yk. On montre maintenant que O(N)(n) est
un groupe pour la composition. Pour A, B ∈ O(N)(n), (AB)⊤ AB = B ⊤ A⊤ AB =
B ⊤ B = I et (BA)⊤ BA = A⊤ B ⊤ BA = A⊤ A = I. Donc A ◦ Bin O(N)(n). L’iden-
tité appartient à AB ∈ O(N)(n). Pour l’inverse, on a vu dans la partie (i) que
A−1 = A⊤ et donc (A−1 )⊤ = (A⊤ )⊤ = A. Donc
(A−1 )⊤ A−1 = A A−1 = I et A−1 (A−1 )⊤ = A−1 A = I.
O(N)(n) est donc bien un sous-groupe de GL(n). C’est le groupe des isométries
linéaires de Rn : les transformations qui prérvent la distance dans Rn . De plus, par
continuité de la composition, O(N)(n) est un sous-groupe fermé de GL(n).
Exercice 8.7
Soit X = R \{0} et la fonction
déf 1 1
x, y 7→ d(x, y) = |x − y| + − .
x y
Montrer que (X, d) est un espace métrique complet.
Solution. Par définition de d, d(x, y) = 0 ⇐⇒ x = y et d(x, y) = d(y, x). Pour
x, y, z ∈ X
1 1 1 1 1 1
|x − y| + − ≤ |x − z| + |z − y| + − + −
x y x z z y
1 1 1 1
≤ |x − z| + − + |z − y| + − .
x z z y
Soir {xn } une suite de Cauchy dans X. Pour tout ε > 0, il existe N tel que pour
tout m, n > N
1 1
|xn − xm | + − < ε.
xn xm
Les suites {xn } et {1/xn } sont donc Cauchy dans R. Comme R est complet, il existe
x, y ∈ R tel que
1 1 1
xn → x et →y ⇒ 1 = xn → xy ⇒ x 6= 0 et y =
xn xn x
et x ∈ X.
Exercice 8.8
On considère l’ensemble P(X) des sous-ensembles d’un ensemble arbitraire X
y compris l’ensemble vide ∅ muni de l’opération différence symétrique △
déf
A △ B = [A\B] ∪ [B\A] .
Montrer que (P(X), △) vérifie les propriétés d’un groupe abélien :
5. Exercices du Chapitre 5 331
Exercice 8.9
Soit X un ensemble arbitraire et P(X) l’ensemble de tous les sous-ensembles
de X incluant ∅. Soit l’ensemble
déf
{0, 1}X = {toutes les applications f : X → {0, 1}}
332 Annexe A. Corrigés des exercices
de toutes les applications définies sur X à valeurs dans l’ensemble à deux éléments
{0, 1}. On associe à chaque A ∈ P(X) la fonction caractéristique
(
déf 1, si x ∈ A
χA (x) =
0, si x ∈ X\A.
et en déduire que
définit une métrique sur {0, 1}X et que ({0, 1}X , d) est complet.
(iv) Montrer que (P(X), ρ) est un espace métrique complet pour la métrique
déf
ρ(A, B) = sup |χA (x) − χB (x)| .
x∈X
(v) En supposant démontré que P(X) est un groupe abélien pour l’opération
binaire différence symétrique (5.7) (voir la section 7.1 du Chapitre 5), mon-
trer que △ est continue par rapport à la métrique ρ.
Solution. (i) L’application A 7→ χA : P(X) → {0, 1}X est clairement bien définie.
Elle est injective. En effet, si χA = χB , alors pour tout x ∈ A, χB (x) = 1 et A ⊂ B
et, réciproquement, pour tout x ∈ B, χA (x) = 1 et B ⊂ A, d’où A = B. Elle est
surjective puisque que pour tout f ∈ {0, 1}X , on a, pour A = f −1 {1} ∈ P(X),
f −1 {0} = X\A et χA = f .
(ii) L’ensemble {0, 1}X est un groupe pour l’opération (5.5). En effet, la valeur
absolue |f1 (x) − f2 (x)| de deux fonctions ne prenant que les valeurs 0 ou 1 est égale
à 0 ou 1. Donc, f1 △ f2 ∈ {0, 1}X et, par définition, f1 △ f2 = f2 △ f1 . L’élément
neutre est la fonction f = 0 et l’inverse de f est f car f △ 0 = 0 = 0 △ f . C’est
donc bien un groupe.
5. Exercices du Chapitre 5 333
Pour A, B ∈ P(X),
(
1, si x ∈ [A\B] ∪ [B\A]
|χA (x) − χB (x)| =
0, si x ∈ [A ∩ B] ∪ [X\B ∩ X\A].
L’espace {0, 1}X est complet. Soit {fn } une suite d-Cauchy :
Sinon,
Ceci voudrait dire que la suite {fn (x)} est finie ce qui est une contradiction. Comme
toute sous-suite de la suite initiale {fn (x)} converge vers la même limite on en
conclut que f (x) ∈ {0, 1}. La fonction limite f appartient donc à {0, 1}X qui est
complet.
(iv) En utilisant la bijection (5.6) et le fait que {0, 1}X soit complet, on peut
maintenant définir la métrique ρ(A, B) = d(χA , χB ) sur P(X) via les fonctions
caractéristiques puisque de la partie (i)
La fonction est donc non seulement ρ-continue en (A, B), mais aussi lipschitzienne
sur P(X).
Exercice 8.10
Soit (X, d) un espace métrique compact et C 0 (X; Rk ) pour k ≥ 1 muni de la
norme
k
!1/2
déf
X
2
kf kC 0 = sup kf (x)k, kyk = |yi | . (5.9)
x∈X i=1
kf (y) − f (x)k ≤ kf (y) − fi (y)k + kfi (y) − fi (x)k + kfi (x) − f (x)k
| {z } | {z } | {z }
ε/3 ε/3 ε/3
(b) Comme S est compact dans C 0 (X; Rk ), il est fermé et borné. Il existe donc
M > 0 tel que
∀f ∈ S, sup kf (x)k = kf kC 0 ≤ M.
x∈X
(ii) On montre maintenant la réciproque. Étant donné la famille S qui vérifie (a) et
(b), il faut montrer la compacité séquentielle de S : pour toute suite {fn } ⊂ S, il
existe f ∈ S et une sous-suite {fnk } tel que fnk → f dans C 0 (X; Rk ), c’est-à-dire,
uniformément dans X.
Par uniforme équicontinuité de S,
∀ε > 0, ∃δ > 0, ∀n, ∀x, y ∈ X, d(y, x) < δ, kfn (x) − fn (y)k < ε/3.
Par compacité de X, il peut être couvert par un nombre fini de boules Bδ (xj ),
x1 , . . . , xℓ ∈ X. Comme, pour chaque j et n, la suite {fn (xj )} est bornée, il existe
une sous-suite {fnk } de {fn } que l’on écrira {fn } et il existe N tel que
Cette sous-suite est Cauchy dans C 0 (X; Rk ). En effet, pour tout x ∈ X, il existe xj
tel que d(x, xj ) < δ et pour tous m, n > N
kfm (x) − fn (x)k ≤ kfm (x) − fm (xj )k + kfm (xj ) − fn (xj )k + kfn (xj ) − fn (x)k
< ε/3 + ε/3 + ε/3 = ε.
6 Exercices du Chapitre 6
Exercice 7.1
Soit t 6= 0 et la fonction
f (g(x + t)) − f (g(x)) , si g(x + t) − g(x) 6= 0
déf
q(t) = g(x + t) − g(x) (6.1)
′
f (g(x)), si g(x + t) − g(x) = 0.
336 Annexe A. Corrigés des exercices
f (g(x) + θ) − f (g(x))
∀ε > 0, ∃η tel que ∀0 < |θ| < η, − f ′ (g(x)) < ε.
θ
Finalement,
Exercice 7.2
Soit f : [a, b] → R telle que f ′ (x) existe et soit uniformément continue sur
]a, b[ . Montrer que, pour tout ε > 0, il existe δ > 0 tel que
f (y) − f (x)
∀x, y ∈ ]a, b[ , 0 < |y − x| < δ, − f ′ (x) < ε.
y−x
Solution. Pour tous x, y ∈ [a, b], par le Théorème 2.3 de la moyenne du Chapitre 6,
et pour x 6= y
f (y) − f (x)
− f ′ (x) = |f ′ (x + θ(y − x)) − f ′ (x)| .
y−x
6. Exercices du Chapitre 6 337
Comme f ′ est uniformément continue sur ]a, b[ , pour tout ε > 0, tel que
Exercice 7.3
Montrer que la fonction numérique (voir Figure 6.9)
2
xy , 6 0
si x =
déf
f (x, y) = x + y 42
0, si x = 0
est dérivable en (x, y) = (0, 0) dans toutes les directions v = (v1 , v2 ), mais qu’elle
n’est ni différentiable au sens de Gateaux ni continue au point (x, y) = (0, 0).
Remarquer que l’on a les propriétés suivantes
x1 x22
f (x1 , x2 ) = si x1 6= 0, f (0, x2 ) = 0
x21 + x42
La fonction f est dérivable en x = 0 dans toutes les directions. Elle n’est cependant
pas Gateaux différentiable en 0 puisque pour v1 6= 0,
Exercice 7.5
Soient f, g : Rn → Rm deux applications Fréchet différentiables sur Rn et la
nouvelle application
déf
x 7→ h(x) = f (x) · g(x) : Rn → R . (6.2)
Démontrer que h est Fréchet différentiable et que
Dh(x) = Df (x)⊤ g(x) + Dg(x)⊤ f (x) (6.3)
ou, si ∇h(x) est interprété comme un vecteur colonne (ou matrice n × 1) et f (x) et
g(x) comme des vecteurs colonnes (ou matrice m × 1),
∇h(x) = g(x)⊤ Df (x) + f (x)⊤ Dg(x), (6.4)
où Df (x) et Dg(x) sont des matrices m × n.
Solution. On démontre que h est Hadamard différentiable. Pour t → 0, t 6= 0, et
w → v, on a
h(x + tw) − h(x) f (x + tw) − f (x) g(x + tw) − g(x)
= · g(x + tw) + f (x) ·
t t t
Comme f et g sont Hadamard différentiables et continues, il vient
h′H (x; v) = fH
′ ′
(x; v) · g(x) + f (x) · gH (x; v)
= Df (x)v · g(x) + f (x) · Dg(x)v = Df (x)⊤ g(x) + Dg(x)⊤ f (x) · v
et, comme cette application est linéaire par rapport à v, h est Hadamard et donc
Fréchet différentiable et Dh(x) = Df (x)⊤ g(x) + Dg(x)⊤ f (x).
6. Exercices du Chapitre 6 339
Exercice 7.6
Soit f : Rn → Rm une application Fréchet différentiable telle que, pour tout
x, kf (x)kRm = 1. Montrer que
Df (x)⊤ f (x) = 0.
Exercice 7.7
Soit f : Rn → R admettant des dérivées partielles d’ordre un bornées dans un
ouvert U de Rn .
(i) Montrer que f est continue sur U et lipschizienne en chaque point de U .
Indication. S’inspirer de la démonstration du Théorème 3.11 du Chapitre
6 des notes.
(ii) Est-ce que, en général, f est Gateaux différentiable en tout point de U ?
Démonstration. (i) Soit M la constante tel que
∀y ∈ U, ∀i, 1 ≤ i ≤ n, |∂i f (y)| < M. (6.5)
Soit x ∈ U . Comme U est ouvert, il existe une boule B3r (x), r > 0, telle que
B3r (x) ⊂ U . Soient deux points y, z ∈ Br (x). On leur associe les points suivants
déf déf
x0 = z, xi = xi−1 + (y − z)i ei , 1 ≤ i ≤ n,
où (y − z)i est la ieme composante du vecteur y − z ∈ Rn .
On considère la différence
f (y) − f (z)
que l’on peut réécrire sous la forme
n
X
f (y) − f (z) = f (xi ) − f (xi−1 ).
i=1
Pour chaque i, la fonction f varie le long d’une ligne de direction ei passant par les
points xi−1 et xi où la dérivée partielle ∂i f existe. Puisque f est dérivable dans la
direction ei en tout point de B3r (x), la fonction gi (α) = f (xi−1 + α (y − z)i ei ) est
continue sur [0, 1] et dérivable sur ]0, 1[ . Par le théorème de la moyenne (Théorème
3.8, Chapitre 6) et par homogénéité positive
On a vu que f est continue en (0, 0) et Hadamard dérivable dans toutes les directions
3
v1 ,
2 ′ 2 + v2 si (v1 , v2 ) 6= (0, 0)
∀v ∈ R , fH (0; v) = v 1 2 = f (v1 , v2 ).
0,
si (v1 , v2 ) = (0, 0)
′
Cependant, f n’est pas Gateaux différentiable car v 7→ fH (0; v) n’est pas linéaire.
Les dérivées partielles existent et sont bornées dans tout R2 . En effet,
∂x f (0, 0) = 1 et ∂y f (0, 0) = 0.
Pour (x, y) 6= (0, 0),
x4 + 3 x2 y 2 yx3
∂x f (x, y) = et ∂y f (x, y) = −
(x2 + y 2 )2 (x2 + y 2 )2
et l’on a les majorations suivantes
2
x4 + 3 x2 y 2 x4 + 3 x2 y 2 x2 3 2 x2 y 2 3 5
2 2 2
= 2 2 2
≤ 2 2
+ 2 2 2
≤1+ =
(x + y ) (x + y ) x +y 2 (x + y ) 2 2
3 2
yx x 1 2yx 1 1
− 2 = 2 ≤1 = .
(x + y 2 )2 x + y 2 2 x2 + y 2 2 2
Les dérivées partielles existent et sont bornées dans U = R2 , mais f n’est pas
Gateaux différentiable en (0, 0).
Exercice 7.8
On considère la fonction f : R2 → R suivante
2 2
xy (x − y ) , si (x, y) 6= (0, 0)
déf 2 2
f (x, y) = x +y (6.7)
0, si (x, y) = (0, 0).
Montrer que
(i) f , ∂x f et ∂y f existent et sont continues sur R2 ;
2
(ii) ∂xy 2
f = ∂x (∂y f ) et ∂yx f = ∂y (∂x f ) existent dans R2 et sont continues sauf
en (0, 0) ;
2 2
(iii) ∂xy f (0, 0) = 1 et ∂yx f (0, 0) = −1.
Rappel de la notation (3.66) du Chapitre 6 :
2 ∂ ∂f
∂ji f (x) = (x) = d2 f (x; ei ; ej ) = Hf (x)ij .
∂xj ∂xi
√
Pour ε > 0, on prend δ = ε:
√ √
∀(x, y) ∈ Bδ (0, 0), |f (x, y) − f (0, 0)| < ε ε = ε.
Pour (x̂, ŷ) 6= (0, 0)), k(x̂, ŷ)k > 0. On prend r = k(x̂, ŷ)k/2 : pour tout (x, y) ∈
Br (x̂, ŷ)
1 3
k(x̂, ŷ)k ≤ k(x, y)k ≤ k(x̂, ŷ)k
2 2
et le dénominateur ne s’annule pas. La fonction f est donc continue en (x̂, ŷ) en
tant que quotient de deux fonctions polynômiales.
Dérivées partielles d’ordre un. En un point (x̂, ŷ) 6= (0, 0)), il existe t̄ > 0 tel
que (x̂, ŷ) + t ei ∈ Br (x̂, ŷ) et (x̂, ŷ) + t ei 6= (0, 0)) pour tout t, 0 ≤ t ≤ t̄. On calcule
d d (x̂ + t)2 − ŷ 2
∂x f ((x̂, ŷ)) = f (x̂ + t, ŷ) = (x̂ + t) ŷ
dt t=0 dt (x̂ + t)2 + ŷ 2 t=0
x̂2 − ŷ 2 4 x̂2 ŷ 2 x̂4 − ŷ 4 + 4 x̂2 ŷ 2
= ŷ 2 + ŷ = ŷ .
x̂ + ŷ 2 (x̂2 + ŷ 2 )2 (x̂2 + ŷ 2 )2
ŷ 4 − x̂4 + 4 x̂2 ŷ 2
∂y f ((x̂, ŷ)) = −∂x f ((ŷ, x̂)) = −x̂ .
(x̂2 + ŷ 2 )2
Comme le dénominateur est différent de 0 dans la boule Br (x̂, ŷ), ces expressions
sont continues en (x̂, ŷ). Il reste maintenant le point (0, 0) autour duquel f (t, 0) =
0 = f (0, t), t 6= 0. Donc
x4 − y 4 + 4 x2 y 2
|∂x f ((x, y)) − ∂x f ((0, 0))| = y −0
(x2 + y 2 )2
x4 y4 4 x2 y 2
≤ |y| + +
(x2 + y 2 )2 (x2 + y 2 )2 (x2 + y 2 )2
≤ |y| (1 + 1 + 2)
et
y 4 − x4 + 4 x2 y 2
|∂y f ((x, y)) − ∂y f ((0, 0))| = −x − 0 ≤ |x| (1 + 1 + 2) .
(x2 + y 2 )2
Il y a donc bien continuité en (0, 0). On en conclut par le Théorème 3.11 du Chapitre
6 que f est Fréchet différentiable partout dans R2 .
6. Exercices du Chapitre 6 343
4 4 2 2
y x −y +4x y , si (x, y) 6= (0, 0)
∂x f (x, y) = (x2 + y 2 )2
0, si (x, y) = (0, 0)
4 4 2 2
−x y −x +4x y ,
2 2 2
si (x, y) 6= (0, 0)
∂y f (x, y) = (x + y )
0, si (x, y) = (0, 0).
Comme il s’agit de quotients de polynômes ∂y (∂x f (x, y)) et ∂y (∂x f (x, y)) existent et
sont continues sur R2 \(0, 0). Par le Théorème 3.13 du Chapitre 6, ∂y (∂x f (x, y)) =
∂y (∂x f (x, y)). On calcule maintenant les dérivées partielles croisées au point (0, 0).
On forme le quotient différentiel pour t 6= 0
∂x f (0, t) − ∂x f (0, 0) 1 −t4
= t 2 2 − 0 = −1 ⇒ ∂y (∂x f (0, 0)) = −1
t t (t )
∂y f (t, 0) − ∂y f (0, 0) 1 t4
= t 2 2 = +1 ⇒ ∂x (∂y f (0, 0)) = +1.
t t (t )
On observe que pour tous (x, y) ∈ R2 , on a ∂y (∂x f (x, y)) = −∂x (∂y f (y, x)).
Si les dérivées secondes étaient continues en (0, 0), on aurait ∂y (∂x f (0, 0)) =
∂y (∂x f (0, 0)). Comme ce n’est pas le cas, au moins une des deux (et en fait les deux)
dérivées secondes n’est pas continue en (0, 0).
344 Annexe A. Corrigés des exercices
Enfin
x6 − y 6 − 9 x2 y 4 + 9 x4 y 2
∂y (∂x f (x, y)) − ∂y (∂x f (0, 0)) = − (−1)
(x2 + y 2 )3
x6 − y 6 − 9 x2 y 4 + 9 x4 y 2 + (x2 + y 2 )3
=
(x2 + y 2 )3
2 x2 x4 − 3 y 4 + 6 x2 y 2
= 2 .
x + y2 (x2 + y 2 )2
Si on prend deux chemins différents, (0, y) → (0, 0) et (x, 0) → (0, 0), on obtient
deux limites différentes
2 02 04 − 3 y 4 + 6 02 y 2
∀y 6= 0, =0
02 + y 2 (02 + y 2 )2
2 x2 x4 − 3 04 + 6 x2 02
∀x 6= 0, =2
x2 + 02 (x2 + 02 )2
Exercice 7.9
Soit l’application linéaire A : Rn → Rn (ou une matrice n × n) et b ∈ Rn (ou
un n-vecteur). On construit la fonction
déf 1
f (x) = (Ax) · x + b · x, x ∈ Rn .
2
(i) Calculer f ′ (x; v) (ou le gradient de f ) et d2 f (x; v; w) (ou la hessienne de
f ).
(ii) Donner des conditions nécessaires et suffisantes sur A et b pour que f soit
convexe dans tout Rn .
(iii) Donner des conditions nécessaires et suffisantes sur A et b pour que f soit
strictement convexe dans tout Rn .
(iv) Est-ce que les fonctions f associées aux matrices et vecteurs
3 1 −2 2 4 1
(a) A = ,b= , et (b) A = ,b= ,
−1 2 1 4 1 1
sont convexes ?
Démonstration. (i) Pour t 6= 0 et w → v
f (x + tw) − f (x) 1 1 1
= A(x + tw) · (x + tw) − Ax · x + b · tw
t t 2 2
1
= (Ax · w + Aw · x + t Aw · w) + b · w
2
′ 1 A + A⊤
⇒ fH (x; v) = (Ax · v + Av · x) + b · v = x + b · v.
2 2
f est Hadamard et donc Fréchet différentiable. Pour les dérivées secondes, avec
t 6= 0 et w → v,
′ ′
fH (x + t w; v) − fH (x; v)
t
1 A + A⊤ A + A⊤
= (x + t w + b) · v − x+b ·v
t 2 2
A + A⊤ A + A⊤
= w ·v → v ·v
2 2
A + A⊤ A + A⊤
⇒ d2 f (x; v; v) = v · v ⇒ Hf (x) = .
2 2
A + A⊤ A + A⊤
≥ 0, c’est-à-dire, semi-définie positive.
2 2
346 Annexe A. Corrigés des exercices
Comme le terme b·x est linéaire en x, il disparaı̂t et la condition sur f est équivalente
à la condition suivante sur A :
f (λx + (1 − λ)y) − λf (x) − (1 − λ)f (y)
= A(λx + (1 − λ)y) · (λx + (1 − λ)y) − λ(Ax) · x − (1 − λ)(Ay) · y
= (λ2 − λ)Ax · x + (1 − λ)2 − (1 − λ) Ay · y + 2λ(1 − λ)Ax · y
= − λ(1 − λ) [Ax · x + Ay · y − 2Ax · y] = −λ(1 − λ)A(x − y) · (x − y) ≤ 0.
Comme l’inéquation
−λ(1 − λ)A(x − y) · (x − y) ≤ 0
∀x ∈ Rn , Ax · x ≥ 0
et A ≥ 0 est semi-définie positive. Il n’y a donc pas de condition sur le terme linéaire
b · x. Réciproquement, si A ≥ 0 est semi-définie positive, alors, du calcul précédent
et f est convexe.
(iii) Première démonstration. Par le Théorème 4.4 (i) du Chapitre 6, si Hf (x) =
(A + A⊤ )/2 est définie positive, alors f est strictement convexe dans un voisinage
de x. Comme la matrice hessienne est constante, on peut prendre tout Rn comme
voisinage et f est strictement convexe sur Rn .
Deuxière démonstration. On reprend le calcul de la partie (ii) : pour tous
λ ∈ [0, 1] et x, y ∈ Rn ,
∀v 6= 0, Av · v > 0
6. Exercices du Chapitre 6 347
et (A + A⊤)/2 > 0 est définie positive. Dans l’autre sens, comme λ > 0, (1 − λ > 0
et y 6= x,
et f est convexe et même strictement convexe. Pour le second cas, comme la matrice
symétrisée
2 4 A + A⊤ 2 4
A= , =
4 1 2 4 1
A + A⊤
v · v = 2v12 + 8v1 v2 + v22
2
= (v2 + 4v1 )2 − 16v12 + 2v12
= (v2 + 4v1 )2 − 14v12 .
Exercice 7.10
Soient f (x) = kxkn , n ≥ 1, et kxk la norme euclidienne de x ∈ Rk , k ≥ 1.
(i) Déterminer les n ≥ 1 pour lesquels f est Hadamard (Fréchet) différentiable
en tout point de Rk .
(ii) Déterminer les n ≥ 1 pour lesquels Hf (x) existe en tout point de Rk
(iii) Déterminer les valeurs de n ≥ 1 pour lesquelles f est convexe dans Rk .
On a
x x 1 x x
n (n − 1) kxkn−2 ·v · v + n kxkn−1 v·v− ·v ·v
kxk kxk kxk kxk kxk
x x x x
= n kxkn−2 (n − 1) ·v ·v+v·v− ·v ·v
kxk kxk kxk kxk
x x
= n kxkn−2 (n − 2) ·v ·v+v·v
kxk kxk
x x
d2 f (x; v; v) = n kxkn−2 (n − 2) ·v ·v+v·v .
kxk kxk
∇f (x) = n |x|n−2 x, ∀x ∈ Rk .
Pour n = 1, la limite n’existe pas lorsque t → 0 puisque l’on peut tendre vers
des limites différentes par valeurs t > 0 ou t < 0 :
f ′ (tw; v) − f ′ (0; v) 1 tw
= n ktwkn−1 ·v
t t ktwk
= n ktwkn−2 w · v
= |t|n−2 n kwkn−2 w · v
(
2 v · v, si n = 2
⇒ d2 f (0; v; v) =
0, si n > 2.
Le hessien est donc bien bilinéaire et continue en 0 et donc sur Rk . où il est donné
par la formule
x x
d2 f (x; v; v) = n kxkn−2 (n − 2) ·v ·v+v·v .
kxk kxk
350 Annexe A. Corrigés des exercices
∀x, y ∈ R, ∀λ ∈ [0, 1], kλx + (1 − λ)yk ≤ |λxk + k(1 − λ)yk = λkxk + (1 − λ)kyk.
Pour n = 2,
df
f (x) = kxk2 , (x) = 2x et d2 f (x; v; v) = 2 kvk2 ≥ 0, ∀v ∈ Rk .
dx
f est de classe C (2) et la dérivée seconde est positive. Elle est donc convexe.
Pour n ≥ 3, on a
" #
2
x
d2 f (x; v; v) = n kxkn−2 (n − 2) · v + kvk2 ≥ 0, ∀v ∈ Rk .
kxk
Exercice 7.11
Montrer que la fonction f (x) = sin x + (1 + x)2 est convexe dans l’intervalle
[0, 1].
Solution. C’est une fonction de classe C (2) dans R et pour tout x ∈ R,
df d2 f
(x) = cos x + 2(1 + x) et (x) = − sin x + 2 ≥ 1.
dx dx2
Elle est donc convexe sur tout R et sa restriction à [0, 1] est aussi convexe.
Exercice 7.12
On dit que C ⊂ Rn est un cône de sommet 0 si
∀x ∈ C, ∀λ > 0, λx ∈ C. (6.9)
∃x ∈ C, ∀y ∈ C, ∇f (x) · (y − x) ≥ 0.
6. Exercices du Chapitre 6 351
(ii) On applique la partie (i) f est strictement convexe car sa matrice hessienne
est définie positive
x +1 1 0
∇f (x) = 2 1 Hf (x) = > 0.
x2 − 1 0 1
x1 ≥ 0, x2 ≥ 0, 2(x1 + 1) x1 + 2(x2 − 1) x2 = 0
2(x1 + 1) y1 + 2(x2 − 1) y2 ≥ 0, ∀y1 ≥ 0, y2 ≥ 0.
Exercice 7.13
Pour ε > 0, une matrice m × n et un vecteur c ∈ Rm on considère le problème
suivant :
déf
inf f (x) + εkxk2Rn , f (x) = kAx − ck2Rm . (6.11)
x∈Rn
Solution. (i) Soit fε (x) = f (x) + εkxk2 . Une condition nécessaire et suffisante pour
la convexité est Hfε (y) ≥ 0 sur Rn :
fε′ (x; v) = 2(Ax − c) · Av + 2ε x · v = 2 [A⊤ A + εI]x − A⊤ c · v
∇fε (x) = 2 [A⊤ A + εI]x − A⊤ c , Hfε (x) = 2 [A⊤ A + εI].
On vérifie que Hfε (x) est définie positive. Elle est symétrique. Pour 0 6= v ∈ Rn ,
∃x ∈ Rn tel que A⊤ A x = A⊤ c.
Pour avoir l’existence nous allons utiliser la partie (ii). Pour tout εn = 1/n, il existe
un point unique xn tel que
1 1
A⊤ Axn + xn = A⊤ c, kAxn k2 + kxn k2 = Axn · c ≤ kAxn k kck
n n
1 √
⇒ kAxn k ≤ kck, kxn k2 ≤ kAxn k kck ≤ kck2 , kxn k ≤ nkck.
n
Comme la suite {Axn } est bornée, il existe y ∈ Rm et une sous-suite {Axnk } tel
que Axnk → y. et y ∈ Im A = Im A car c’est un sous-espace linéaire (donc fermé).
Il existe donc x tel que Ax = y Finalement, en passant à la limite
1 xn
A⊤ Axnk + √ √ k = A⊤ c → A⊤ Ax = A⊤ c
| {z } nk nk
→Ax | {z }
xn
√ k ≤kck
nk
Exercice 7.14
Soit B une matrice n × n symétrique et définie positive. On associe à B la
fonction
déf Bx · x
f (x) = , x 6= 0, (6.12)
kxk2
Bx · x
f (x∗ ) = inf . (6.13)
06=x∈Rn kxk2
∀x ∈ Rn , Bx · x ≥ β kxk2 . (6.14)
Bx · x| déf
∀x 6= 0, 2
≥ β = Bx∗ · x∗ > 0 ⇒ ∀x ∈ Rn , Bx · x ≥ β kxk2 .
kxk
2 Bx · v kxk2 − 2 x · v Bx · x 2
fh′ (x; v) = 4
= [B − f (x) I] · v,
kxk kxk2
2
⇒ ∇f (x) = [B − f (x) I] x,
kxk2
Exercice 7.15
Soient A et B deux matrices symétriques n× n. On suppose B définie positive.
Pour x ∈ Rn , x 6= 0, on définit la fonction
déf Ax · x
f (x) = . (6.15)
Bx · x
déf
(i) Montrer que l’ensemble U = {x ∈ Rn : Bx · x = 1} est non-vide et
compact.
(ii) Montrer qu’il existe x̂ ∈ Rn tel que B x̂ · x̂ = 1 et
Ax · x
f (x̂) = inf . (6.16)
06=x∈Rn Bx · x
(iii) Calculer ∇f (x) pour x 6= 0 et caractériser x̂. Montrer que pour tout λ tel
que dét (A − λB) = 0, on a f (x̂) ≤ λ.
Solution. (i) Pour tout 0 6= z ∈ Rn , Bz · z > 0 puisque B est définie positive. On
associe à z le point
z z z Bz · z
x= √ ⇒ Bx · x = B √ ·√ = =1 ⇒ x ∈ U.
Bz · z Bz · z Bz · z Bz · z
L’ensemble U n’est donc pas vide et comme x 7→ Bx · x est continue, l’image inverse
de 1 qui est U est fermée. Enfin, de l’exercice 7.14, il existe β > 0 tel que
1
1 = Bx · x ≥ βkxk2 ⇒ kxk ≤ √
β
et U est borné. Donc U est compact non-vide.
(ii) Étant donné 0 ≤ x ∈ Rn , Bx · x > 0 puisque B est définie positive et
Ax · x x x
f (x) = = A√ ·√ ⇒ inf f (x) = inf Ax · x.
Bx · x Bx · x Bx · x 06=x∈Rn x∈U
R. A. Adams et J. J. F. Fournier
[1], Sobolev spaces, Second Edition, Academic Press, Elsevier Science, Amsterdam,
Boston, Heidelberg, London, New York, 2003.
E. Asplund et L. Bungart
[1], A first cource in integration, Holt, Rinehart and Winston, New York, Chicago,
San Francisco, Toronto, London, 1966.
J. P. Aubin et A. Cellina
[1], Set-Valued Maps And Viability Theory, Grundl. der Math. Wiss., vol. 264,
Springer - Verlag, Berlin, 1984.
J. P. Aubin et H. Frankowska
[1], Set-Valued Analysis, Birkhäuser, Basel, 1990.
R. Azencott
[1], Random and deterministic deformations applied to shape recognition, Cortona
workshop, Italy 1994.
[2], Geodesics in diffeomorphisms groups : Deformation distance between shapes,
Int. Conf. Stoch. Structures and Monte-Carlo Optim., Cortona, Italy, 1994.
M. Barbut, B. Locker, L. Mazilak et P. Priouret
[1], Cinquante ans de correspondance mathématique en 107 lettres, Paul Lévy -
Maurice Fréchet, Birkhäuser, Boston, 1990.
C. Berge
[1], Espaces topologiques, fonctions multivoques, Collection Universitaire de Math-
matiques, Vol. III, Dunod, Paris 1959.
M. Berger et B. Gostiaux
[1], Géométrie différentielle : variétés, courbes et surfaces, 2e édition Presses uni-
versitaires de France, Paris 1992.
G. Bouligand
[1], Sur les surfaces dépourvues de points hyperlimités, Ann. Soc. Polon. Math. 9
(1930), 32–41.
[2], Introduction à la géométrie infinitésimale directe, Gauthier-Villars, Paris, 1932.
D. Burton
[1], The History of Mathematics : An introduction, 3e édition, McGraw-Hill, New
York, 1997.
G. Cantor
357
358 Éléments de bibliographie
[1], Über die Ausdehnung eines Satzes aus der Theorie der trigonometrischen Rei-
hen, Math. Annalen 5 (1872), 123–132.
[2], Über eine Eigenschaft des Inbegriffes aller reellen algebraischen Zahlen, Journal
für die reine und angwandte Mathematik, 77 (1874), 258–262.
C. Cassidy et M. L. Lavertu
[1], Introduction à l’analyse : fonction d’une variable réelle, Les Presses de l’Uni-
versité Laval, Sainte-Foy, Canada, 1994.
R. Dedekind
[1], Stetigkeit und irrational Zahlen, Friedrich Vieweg und Sohn, Braunschweig
1872. Traduction anglaise par W. W. Beman Essays on the Theory of Numbers,
I. Continuity and Irrational Numbers, The Open Court Publishing Co., Chicago
1901. Aussi Dover Publications, New York 1963.
M. C. Delfour
[1], Introduction à l’optimisation et au calcul semi-différentiel, Collection Sciences
Sup., Mathématiques appliquées pour le Master/SMAI, Dunod, Paris 2012.
[2], Introduction to optimization and semidiferential calculus, SIAM-MOS series,
Society for Industrial and Applied Mathematics, Philadelphia, USA, 2012.
M. C. Delfour et J.-P. Zolésio
[1], Shapes and geometries : Metrics, analysis, differential calculus and optimiza-
tion, SIAM series on Advances in Design and Control, SIAM, Philadelphia, PA 2011,
second edition.
U. Dini
[1], Fondamenti per la teorica delle funzioni di variabili reali, T. Nistri, Pisa 1878
[Fondements de la théorie des fonctions d’une variable réelle] (traduction allemande :
Grundlagen für eine Theorie der Funktionen einer veränderlichen reellen Grösse,
Teubner, 1892).
A. Dontchev et R. T. Rockafellar
[1], Implicit functions and solution mappings. A view from variational analysis,
Springer Monographs in Mathematics, Springer, Dordrecht, 2009.
J. Dugundji
[1], Topology, Allyn and Bacon, Boston, 1966.
R. Engelking
[1], General topology, Heldermann Verlag, Berlin, 1989.
L. Euler
[1], Methodus inveniendi lineas curvas maximi minimive proprietate gaudentes, sive
solutio problematis isoperimetrici latissimo sensu accepti, 1744 [Une méthode pour
trouver des lignes courbes jouissant de propriétés de maximum ou de minimum, ou
la solution de problèmes isopérimétrique dans le sens le plus large], Opera Omnia :
Series 1, Volume 24 (1952), 1–308.
P. de Fermat
[1], Methodus ad disquirendam Maximam et Minimam, Varia opera mathematica,
1679 (D’abord consigné dans une lettre à Mersenne en 1638, la première version
imprimée de la méthode se retrouve dans le cinquième volume de Supplementum
Cursus Mathematici (1642) écrit par Herigone, et ce n’est qu’en 1979 qu’elle ap-
paraı̂t dans Varia opera mathematica.). Version électronique du manuscrit en latin :
http ://fr.wikisource.org/wiki/Œuvres de Fermat - Livre I - Maxima et Minima.
Éléments de bibliographie 359
H. Tietze
[1], Über Funktionen die auf einer abgeschlossenen Menge stetig sind, Journal für
die reine und angewandte Mathematik 145 (1915), 9–14.
A. Trouvé
[1], Action de groupe de dimension infinie et reconnaissance de formes, C. R. Acad.
Sci. Paris Sér. I Math. (8) 321 (1995), 1031–1034.
[2], An approach of pattern recognition through infinite dimensional group actions,
Rapport de recherche du LMENS, France, 1995.
[3], Diffeomorphisms groups and pattern matching in image analysis, Int. J. Com-
put. Vis. (3) 28 (1998), 213–221.
F. A. Valentine
[1], On the extension of a vector function so as to preserve a Lipschitz condition.
Bulletin of the American Mathematical Society 49 (1943), 100–108.
[2], A Lipschitz Condition Preserving Extension for a Vector Function. American
Journal of Mathematics 67 (1) (1945), 83–93.
[3], Convex sets, McGraw-Hill, New York, 1964.
J.-L. Verley
[1], Espaces métriques, dans Dictionnaire des mathématiques ; algèbre, analyse,
géométrie, Albin Michel, 2003.
K. Weierstrass
[1], Mathematische Werke. Rester Band. Abhandlungen I. Mayer & Müller, Berlin
1894 ; Zweiter Band. Abhandlungen II. Mayer & Müller, Berlin 1895 ; Dritter Band.
Abhandlungen III. Mayer & Müller, Berlin 1903.
[2], Mathematische Werke. Vierter Band. Vorlesungen über die Theorie der Abel-
schen Transcendenten. Mayer & Müller, Berlin 1902.
[3], Mathematische Werke. Siebenter Band. Vorlesungen über Variationsrechnung.
Akademische Verlagsgesellschaft M. B. H., Leipzig, 1927.
H. Whitney
[1], A function that is not constant on a connected set of critical points, Duke Math.
J. 1, no. 4 (1935), 514–517.
W.-H. Young
[1], On differentials, Proc. London Mathematical Society, series 2, 7 (1909), 157.
[2], The fundamental theorems of Differential Calculus, University Press, Cam-
bridge, 1910.