Vous êtes sur la page 1sur 52

École Normale Supérieure Assia Djebar - Constantine

Master de Didactique des Mathématiques

2017-2018

ANALYSE FONCTIONNELLE - I

Cours tenu par


l’enseignant :
Hisao Fujita Yashima

1
En guise d’introduction
Au début du XXe siècle Fredholm 1 étudia la possibilité de résoudre l’équation intégrale
Z b
u(x) − λ K(x, y)u(y)dy = f (x);
a

pour ce faire, il utilisa l’idée de l’approximation de cette équation par le système


d’équations linéaires
N
b−aX
ui = −λ Kij uj = fi , i = 1, · · · , N.
N j=1

Dans les années suivantes, Hilbert 2 et ses collaborateurs (en particulier Schmidt 3 )
développèrent l’idée de Fredholm en une théorie plus générale. Ainsi, avec la contribution
de F. Riesz 4 et de Fischer 5 la structure fondamentale de l’espace de Hilbert a été fondée.
En même temps, Fréchet 6 donna des suggestions que les résultats de l’école de Hil-
bert pouvait être englobée dans une théorie plus générale, en considérant la structure
topologique et la structure des espaces vectoriels.
Il est bon de rappeler que l’introduction de l’intégrale de Lebesgue date de 1902–1904 7 .
En effet beaucoup d’espaces fonctionnels qui devaient devenir les exemples fondamentaux
de l’Analyse fonctionnelle sont définis sur la base de l’intégrale de Lebesgue. Dans cet
ordre d’idées, Riesz introduisit l’espace Lp et chercha à étendre les propriétés de L2 à Lp ,
y compris son théorème de représentation 8 .
Pour que les exemples de plus en plus nombreux d’espaces fonctionnels pussent être mis
dans une théorie générale, il fallait attendre 1920, quand Banach, dans sa thèse (publiée
2 ans plus tard) 9 , donna l’idée d’unifier les espaces fonctionnels connus sous le concept
d’espace vectoriel. Sa recherche sur les propriétés de cette nouvelle structure l’amena à sa
célèbre “Théorie des opérations linéaires” (Monogr. Matem. Warszawa, 1932), qui donna
la définition définitive de la structure fondamentale de l’Analyse fonctionnelle.

1. I. Fredholm : Sur une classe d’équations fonctionnelles. Acta Math., vol. 27 (1903), pp. 365–390.
2. Hilbert publia notamment quatre articles entre 1904 et 1906 sur la revue Nachr. Königl. Gessell.
Wissensch. Göttingen, recueillis en suite dans le livre Grundzüge einer allgemeinen Theorie der linearen
Integralgleichungen, Teubner, 1912
3. E. Schmidt : Zur Theorie der linearen und nichtlinearen Integralgleichungen. Math. Ann., vol. 63
(1907), pp. 433–467, vol. 64 (1907), pp. 161–174, vol. 65 (1908), pp. 370–399, originellement sa thèse
soutenue à Göttingen sous la supervision de Hilbert.
4. F. Riesz : Sur les systèmes orthogonaux de fonctions. C.R.A.S. Paris, vol. 144 (1907), pp. 615–619,
et les articles successifs.
5. E. Fischer : Sur la convergence en moyenn. C.R.A.S. Paris, vol. 144 (1907), pp. 1022–1024.
6. M. Fréchet : Sur quelques points du calcul fonctionnel. Rend. Circ. Mat. Palermo, vol. 22 (1906),
pp. 1–72, et d’autres articles de l’époque.
7. H. Lebesgue : Leçons sur l’intégration et la recherche des fonctions primitives. Gauthier-Villars,
1904 ; les idées fondamentales avaient été illustrées dans sa thèse de 1902.
8. F. Riesz : Untersuchungen über Systeme integrierbarer Funktionen. Math. Ann., vol. 69 (1910), pp.
449–497.
9. S. Banach : Sur les opérations linéaires dans les ensembles abstraits et leur application aux équations
intégrales. Fundamenta Mathematicae, vol. 3 (1922), pp. 133–181.

2
1 Espaces vectoriels
1.1 Définition et exemples élémentaires
Commençons par la définition des espaces vectotiels.
Définition. On appelle espace vectoriel (ou espace linéaire) sur un corps K un
ensemble X muni de deux lois de composition :
I) loi interne appelée addition + : X × X → X qui vérifie les conditions suivantes :
a) x1 + x2 = x2 + x1 ∀ x1 , x2 ∈ X ,
b) (x1 + x2 ) + x3 = x1 + (x2 + x3 ) ∀ x1 , x2 , x3 ∈ X ,
c) il existe un élément et un seul, noté 0, tel que 0 + x = x pour tout x ∈ X,
d) pour tout élément x de X il existe un élément et un seul −x tel que x + (−x) = 0,
II) loi externe appelée multiplication · : K × X → X qui vérifie les conditions suivantes :
e) (c1 + c2 ) · x = c1 · x + c2 · x ∀ x ∈ X, ∀ c1 , c2 ∈ K,
f) c · (x1 + x2 ) = c · x1 + c · x2 ∀ x1 , x2 ∈ X, ∀ c ∈ K,
g) (c1 · c2 ) · x = c1 · (c2 · x) ∀ x ∈ X, ∀ c1 , c2 ∈ K,
h) 1 · x = x ∀ x ∈ X.
Les éléments d’un espace vectoriel X sur le corps K sont appelés vecteurs, tandis que
les éléments de K sont appelés scalaires. Un espace vectoriel X sur le corps K est dit
complexe si K = C ; il est dit réel si K = R.
Remarque. On peut définir l’espace vectoriel en utilisant, au lieu des conditions a),
b), c), d ), e), f ), g), h) citées ci-dessus, les conditions suivantes :
a 0 ) x1 + x2 = x2 + x1 ∀ x1 , x2 ∈ X ,
b 0 ) (x1 + x2 ) + x3 = x1 + (x2 + x3 ) ∀ x1 , x2 , x3 ∈ X ,
c 0 ) x1 + x2 = x1 + x3 implique x2 = x3 pour tout x1 , x2 , x3 ∈ X,
d 0 ) (c1 + c2 ) · x = c1 · x + c2 · x ∀ x ∈ X, ∀ c1 , c2 ∈ K,
e 0 ) c · (x1 + x2 ) = c · x1 + c · x2 ∀ x1 , x2 ∈ X, ∀ c ∈ K,
f 0 ) (c1 · c2 ) · x = c1 · (c2 · x) ∀ x ∈ X, ∀ c1 , c2 ∈ K,
g 0 ) 1 · x = x ∀ x ∈ X.
On voit presque immédiatement que les conditions a)–h) impliquent les conditions
a 0 )–g 0 ). En effet, si on a
x1 + x2 = x1 + x3 ,
en vertu de d) il existe −x1 de sotre que l’on a

x1 + x2 + (−x1 ) = x1 + x3 + (−x)

et (utilisant aussi a) et b))

x1 + x2 + (−x1 ) = x2 , x1 + x3 + (−x) = x3 ,

d’où
x2 = x3 .
D’autre part, si les conditions a 0 )–g 0 ) sont vérifiées, alors on a

x = 1 · x = (1 + 0) · x = 1 · x + 0 · x,

3
c’est-à-dire, pour chaque x ∈ X il existe un élément 0 · x tel que

x + 0 · x = x.

Donc pour un autre élément y ∈ X aussi il existe un élément 0 · y tel quey + 0 · y = y. On


a donc
y + 0 · y + x = y + x.
Donc d’après c 0 ) on a
0 · y + x = x.
On a donc
0 · y + x = x = 0 · x + x,
Donc d’après c 0 ) on a
0 · y = 0 · x.
C’est-à-dire il existe l’unique élément, noté 0, tel que

x+0=x

pour tout x ∈ X.
D’autre part, d’après d 0 ) et g 0 ) on a

x + (−1) · x = 1 · x + (−1) · x = (1 − 1) · x = 0 · x.

Or, d’aprés ce que nous avons vu ci-dessus, on a 0 · x = 0. C’est-à-dire, on a

x + (−1) · x = 0.

Remarque - bis. On peut définir l’espace vectoriel, au lieu du système des conditions
a)–h) ou des conditions a 0 )– g 0 ) cités ci-dessus, par le système des conditions suivantes :
a 00 ) x1 + x2 = x2 + x1 ∀ x1 , x2 ∈ X ,
b 00 ) (x1 + x2 ) + x3 = x1 + (x2 + x3 ) ∀ x1 , x2 , x3 ∈ X ,
c 00 ) ∃ 0 ∈ X tel que 0 · x = 0 pour tout x ∈ X,
d 00 ) (c1 + c2 ) · x = c1 · x + c2 · x ∀ x ∈ X, ∀ c1 , c2 ∈ K,
e 00 ) c · (x1 + x2 ) = c · x1 + c · x2 ∀ x1 , x2 ∈ X, ∀ c ∈ K,
f 00 ) (c1 · c2 ) · x = c1 · (c2 · x) ∀ x ∈ X, ∀ c1 , c2 ∈ K,
g 00 ) 1 · x = x ∀ x ∈ X.
Pour voir que le système a)–h) implique qu’il existe 0 ∈ X tel que 0 · x = 0 pour tout
x ∈ X, il suffit de rappeler la chaı̂ne d’égalités vérifiées dans le système a)–h) : quel que
soit x ∈ X, on a

x = 1 · x = (1 + 0) · x = 1 · x + 0 · x = x + 0 · x,

et donc d’après c) on a
0 · x = 0.
Voyons maintenant que le système a 00 )– g 00 ) implique le système a)–h). En effet, d’après
c 00 ), g 00 ), d 00 ), on a

x + 0 = 1 · x + 0 · x = (1 + 0) · x = 1 · x = x,

4
c’est-à dire, pour tout x ∈ X on a
x + 0 = x.
En outre, d’après g 00 ), d 00 ), c 00 ), on a

x + (−1) · x = 1 · x + (−1) · x = (1 − 1) · x = 0 · x = 0.

C’est-à-dire, en posant −x = (−1) · x, on a

x + (−x) = 0.

Si on a en outre x + y = 0, alors on a

x + (−x) = 0 = x + y.

En adjoignant aux deux membres de cette égalité −x, on a

x + (−x) + (−x) = x + y + (−x),

ou, en utilisant l’égalité établie x + (−x) = 0, on a

−x + 0 = y + 0;

d’après ce que l’on a démontré, on a

−x = −x + 0 = y + 0 = y,

ce qui signifie que un tel élément −x est unique.


Il n’est pas difficile de déduire des conditions a)–h) les propriétés suivantes :
1) 0 · x = 0 ∀x ∈ X,
2) (−1) · x = −x,
3) si λ · x = 0 et x 6= 0, alors on a λ = 0.
[Pour démontrer la propriété 3), il est utile de raisonner par absurde et, en utilisant la
propriété 1), de multiplier les deux membres de l’égalité λ · x = 0 · x par λ1 .]
4) si λ · x = µ · x et x 6= 0, alors on a λ = µ.
Dans la suite, là où il n’y a pas de risque d’équivoque, nous allons désigner un produit
c·x entre un scalaire c et un vecteur x par la notation abrégée cx (c’est-à-dire, en omettant
le symbole “ · ” entre c et x), qui généralement ne donne pas lieu aux équivoques.
Exemple 1. L’ensemble Rn (n ∈ N\{0}) muni de l’addition usuelle
     
x1 y1 x1 + y1
 x2   y2   x2 + y2 
 ..  +  ..  =  .. 
     
. .  . 
xn yn xn + yn

et du produit avec un scalaire (réel)


   
x1 cx1
 x2   cx2 
c  ..  =  .. 
   
.  . 
xn cxn

5
est un espace vectoriel réel.
Exemple 2. L’ensemble Cn (n ∈ N\{0}) muni de l’addition usuelle et du produit
avec un scalaire (complexe) est un espace vectoriel complexe.
Exemple 3. L’ensemble des fonctions à valeurs complexes u(x) qui vérifient l’équation
différentielle linéaire d’ordre n
dn dn−1
(∗) u(x) + a n−1 (x) u(x) + · · · + a0 (x)u(x) = 0
dxn dxn−1
est un espace vectoriel.
En effet, si u(x) et v(x) vérifient l’équation (∗), alors on voit aisément que la fonction
w(x) = u(x) + v(x) vérifie elle aussi l’équation (∗). De plus, si c est un scalaire (nombre
complexe) et u(x) vérifie l’équation (∗), alors on voit la fonction w(x) = c · u(x) elle aussi
vérifie l’équation (∗). Donc l’addition “+” et la multiplication “ · ” sont bien définies sur cet
ensemble. En outre, la fonction identiquement nulle u(x) ≡ 0 vérifie elle aussi l’équation
(∗). Les autres conditions de la définition de l’espace vectoriel résultent immédiatement.
Exemple 4. Soit r0 un nombre réel. L’ensemble des fonctions continues définies sur
R à valeurs réelles (resp. complexes) u(x) telles que u(r0 ) = 0 est un espace vectoriel réel
(resp. complexe).
Exemple 5. L’ensemble des fonctions définies sur Rn à valeurs réelles (resp. com-
plexes) infiniment dérivables est un espace vectoriel réel (resp. complexe).
Exemple 6. L’ensemble des séries entières convergentes sur le disque ouvert {z ∈
C | |z| < 1} est un espace vectoriel complexe.
Exemple 7. L’ensemble des matrices du type (n × m) dont les éléments sont des
nombres réels (resp. complexes), muni de la loi d’addition
     
a11 · · · a1m b11 · · · b1m a11 + b11 · · · a1m + b1m
 .. ... . .
..  +  .. . . .
  .
..  = 
  .. .. .. 
 . . . . 
an1 · · · anm bn1 · · · bnm an1 + bn1 · · · anm + bnm

et de la loi de multiplication entre un scalaire c et une matrice (aij )


   
a11 · · · a1m ca11 · · · ca1m
c ·  ... ... ..  =  .. ... .. 

.   . . 
an1 · · · anm can1 · · · canm

est un espace vectoriel réel (resp. complexe). [Attention ! Ici on ne considère pas le
produit entre deux matrices.]
Exemple 8. L’ensemble des suites de nombres réels (resp. complexes) {ak }∞
k=1 conver-
gentes vers 0 est un espace vectoriel réel (resp. complexe).
Exemple 9. L’ensemble des suites de nombres réels (resp. complexes) {ak }∞
k=1 telles
que
sup |ak | < ∞
k∈N\{0}

est un espace vectoriel réel (resp. complexe).

6
Exemple 10. Quel que soit le nombre réel strictement positif p (c’est-à-dire 0 < p <
∞), l’ensemble des suites de nombres réels (resp. complexes) {ak }∞
k=1 telles que

X
|ak |p < ∞
k=1

est un espace vectoriel réel (resp. complexe).


Dans le cas p = 1, on voit immédiatement que, si {ak }∞ ∞
k=1 et {bk }k=1 appartiennent à

cet ensemble, alors la suite {ak + bk }k=1 elle aussi y appartient, car

X ∞
X ∞
X ∞
X
|ak + bk | ≤ (|ak | + |bk |) = |ak | + |bk | < ∞.
k=1 k=1 k=1 k=1

Dans le cas 0 < p < 1, on rappelle que, pour a > 0 et b > 0, on a


 a p a  b p b
> , > ,
a+b a+b a+b a+b
d’où  a p  b p a b
+ > + = 1,
a+b a+b a+b a+b
ou
ap + bp > (a + b)p .
On a donc

X ∞
X ∞
X ∞
X
p p p p
|ak + bk | ≤ (|ak | + |bk | ) = |ak | + |bk |p < ∞.
k=1 k=1 k=1 k=1

Dans le cas 1 < p < ∞, on remarque que la fonction f (x) = xp (x > 0) est convexe.
Donc pour deux nombres positifs a et b on a
 a + b p 1
≤ (ap + bp ),
2 2
ou
2p
(a + b)p ≤ (ap + bp ).
2
Par conséquent on a
∞ ∞ ∞ ∞
X
p
X
p 2p  X
p p
X
p

|ak + bk | ≤ (|ak | + |bk | ) = |ak | + |bk | < ∞.
k=1 k=1
2 k=1 k=1

[Remarque : Comme on le verra dans la suite, cette dernière inégalité sera améliorée par
l’inégalité de Minkowski.]

1.2 Variétés linéaires


Nous précisons d’abord la définition des variétés linéaires.
Définition. Un ensemble non vide L d’éléments d’un espace vectoriel X (sur le corps
K) sera appelé variété linéaire, si, pour quelconque ensemble fini d’éléments {x1 , · · · , xn }
de L, l’ensemble L contient toutes leurs combinaisons linéaires
n
X
α k xk , α1 , · · · , αn ∈ K.
k=1

7
Il est clair que l’espace vectoriel X est lui aussi une variété linéaire. D’autre part, on
voit aisément qu’une variété linéaire peut être considérer comme un espace vectoriel.
En outre, il n’est pas difficile de constater que toute variété linéaire L d’un espace
vectoriel X contient 0. En effet, L contient au moins un élément x. Donc 0 · x = 0
appartient à L.
Soient x1 , · · · , xn des éléments de l’un espace vectoriel X. L’ensemble L0 des combi-
naisons linéaires n
X
α k xk , α1 , · · · , αn ∈ K,
k=1

de x1 , · · · , xn est une variété linéaire.


En effet, si y1 , · · · , ym sont des éléments de L0 , alors chaque élément yj a la forme
n
X
yj = αkj xk , α1j , · · · , αnj ∈ K.
k=1

Donc chaque combinaison linéaire ye de y1 , · · · , ym a la forme


m
X m
X n
X n X
X m
ye = βj yj = βj αkj xk = βj αkj xk ,
j=1 j=1 k=1 k=1 j=1
Pm
c’est-à-dire, en posant α
ek = j=1 βj αkj , on a
n
X
ye = α
e k xk ,
k=1

ce qui signifie que ye appartient à L0 et que donc L0 est une variété linéaire.
Rappelons la notion de dépendance linéaire. Des éléments x1 , · · · , xn d’un espace vec-
toriel sont dits linéairement indépendants, si la relation
n
X
λ k xk = 0 (λk ∈ K)
k=1

entraı̂ne λk = 0 pour tout k = 1, 2, · · · , n.


Si au contraire il existe des scalaires λ1 , λ2 , · · · , λn non tous nuls tels que
n
X
λk xk = 0,
k=1

alors on dira que les éléments x1 , · · · , xn sont linéairement dépendants.


Soit L une variété linéaire. Si L est l’ensemble des combinaisons linéaires de n éléments
linéairement indépendants x1 , · · · , xn , alors nous dirons que L est à n dimensions. C’est-
à-dire, une variété linéaire L est à n dimensions, s’il existe n éléments linéairement
indépendants et si toute collection de n + 1 éléments est linéairement dépendante.
Une variété linéaire L est de dimension infinie, si pour tout n ∈ N\{0} il existe n
éléments linéairement indépendants.
Maintenant nous considérons une variété linéaire L de dimension finie. Pour fixer
l’idée, nous considérons une variété linéaire L à n dimensions. Alors d’après la définition
il existe n éléments x1 , · · · , xn de L linéairement indépendants et toute collection de n + 1
éléments est linéairement dépendante.

8
Lemme 1.1 Soit L une variété linéaire à n dimensions. Soient x1 , · · · , xn n éléments de
L linéairement indépendants. Soit x un élément (arbitraire) de L. Alors il existe un n-plet
(α1 , · · · , αn ) ∈ Kn et un seul tel que
n
X
(1.1) x= α k xk .
k=1

Démonstration Supposons d’abord par absurde qu’il n’existe pas de n-plet


n
(α1 , · · · , αn ) ∈ K qui vérifie l’égalité (1.1). Alors il n’existerait pas de n + 1-plet
(α0 , α1 , · · · , αn ) ∈ Kn+1 \{(0, 0, · · · , 0)} qui vérifie l’égalité
n
X
α0 x + αk xk = 0,
k=1

c’est-à-dire n + 1 éléments x, x1 , · · · , xn seraient linéairement indépendants, ce qui contre-


dit l’hypothèse que L est à n dimension. Donc il existe un n-plet (α1 , · · · , αn ) ∈ Kn qui
vérifie l’égalité (1.1).
Supposons maintenant que (α1 , · · · , αn ) et (α10 , · · · , αn0 ) sont deux n-plets d’éléments
de K tels que l’égalité (1.1) soit vérifiée. Alors on a
n
X n
X
αk xk = αk0 xk ,
k=1 k=1

d’où n
X
(αk − αk0 )xk = 0.
k=1
Or, comme par hypothèse x1 , · · · , xn sont linéairement indépendants, on a
αk − αk0 = 0,
ce qui démontre l’unicité du n-plet (α1 , · · · , αn ) qui vérifie l’égalité (1.1). 
Introduisons maintenant la notion de somme directe. Soit X un espace vectoriel. Soient
L1 , · · · , Ln des variétés linéaires de X. Si chaque élément x de X peut être représenté de
façon unique dans la forme
n
X
x= xk , xk ∈ Lk , k = 1, · · · , n,
k=1

alors nous dirons que X est la somme directe des variétés linéaires L1 , · · · , Ln et écrirons
X = L1 ⊕ L2 ⊕ · · · ⊕ Ln .
Comme nous l’avons vu en haut, l’ensemble des combinaisons linéaires d’un nombre
fini d’éléments x1 , · · · , xn d’un espace vectoriel X est une variété linéaire. En particulier,
si y est un élément de X, alors l’ensemble
L = { x ∈ X | x = αy, α ∈ K }
est une variété linéaire. Ainsi, du lemme 1.1 découle la propriété suivante : Si X est un
espace vectoriel à n dimensions et si x1 , · · · , xn sont n éléments linéairement indépendants
de X, alors on a
X = L1 ⊕ L2 ⊕ · · · ⊕ Ln ,

9
où
Lk = { x ∈ X | x = αxk , α ∈ K }, k = 1, · · · , n.

Il n’est pas difficile de voir aussi la propriété suivante.

Lemme 1.2 Soit X un espace vectoriel. Soient L1 et L2 deux variétés linéaires de X.


Si X = L1 ⊕ L2 , alors on a L1 ∩ L2 = {0}.
Réciproquement, si pour chaque élément x de X il existe deux éléments x1 et x2 tels
que x1 ∈ L1 , x2 ∈ L2 et que x = x1 + x2 et si L1 ∩ L2 = {0}, alors on a X = L1 ⊕ L2 .

1.3 Relations entre les espaces vectoriels réels et complexes


Soit X un espace vectoriel complexe. Alors on peut considérer l’espace vectoriel réel,
noté XR , qui a les mêmes éléments que X et est muni de la même loi d’addition, mais
muni de la loi de multiplication seulement par les nombres réels.
Par exemple, considérons l’ensemble des nombres complexes comme espace vectoriel
complexe, noté X, dont le corps des scalaires est K = C. Alors quelconques deux éléments
z1 et z2 de X sont linéairement dépendants. En effet, si un des deux éléments est nul,
pour fixer l’idée, supposons que z1 = 0, alors il suffit de prendre un nombre complexe α1
différent de 0 et α2 = 0 de sorte que l’on a

α1 z1 + α2 z2 = α1 · 0 + 0 · z2 = 0,

ce qui signifie que z1 et z2 sont linéairement dépendants dans X. Si z1 6= 0 et z2 6= 0, alors


il suffit de prendre α1 = 1 et α2 = − zz12 . Il est clair que − zz21 ∈ C = K et que
z1
α1 z1 + α2 z2 = z1 + (− )z2 = 0,
z2
ce qui signifie que z1 et z2 sont linéairement dépendants dans X.
D’autre part, dans XR les éléments 1 et i (i est l’unité imaginaire) sont linéairement
indépendants. En effet, il n’existe pas de couple de nombres réels (α1 , α2 ) tel que α1 · 1 +
α2 · i = 0.
Une autre relation entre les espaces vectoriels complexes et les espaces vectoriels réels
est la suivante. Soit X un espace vectoriel complexe muni de l’opération

∗:X→X

tel que
(x + y)∗ = x∗ + y ∗ ,
(αx)∗ = αx∗ (α est le conjugué du nombre complexe α),
(x∗ )∗ = x.
C’est le cas des espaces vectoriels complexes que l’on connaı̂t communément comme X =
Cn ou X = C k (Ω; C) (Ω ⊂ Rn ) etc... ; dans ces cas l’opération ∗ n’est autre que le passage
au nombre complexe conjugué. On a en effet, si on définit

x∗ ≡ x = (x1 , · · · , xn ) pour x ∈ X = Cn ,

alors on a
(x + y)∗ = x + y = x + y = x∗ + y ∗ ,

10
(αx)∗ = α x = α x = αx∗ ,
(x∗ )∗ = (x) = x.
On peut comprendre immédiatement que, même si x est une fonction définie sur un
domaine de Rn à valeurs complexes, ces relations sont vérifiées.
Pour les espaces vectoriels complexes munis de l’opération ∗ on peut introduire la
décomposition de X en la “partie réelle” et la “partie imaginaire”. Soit x un élément
arbitraire de X. On pose
1 1
u = (x + x∗ ), v= (x − x∗ ).
2 2i
Alors on a
x = u + iv.
On pose
1
(1.2) U = { u ∈ X | ∃x ∈ X t.q. u = (x + x∗ ) },
2

1
(1.3) V = { v ∈ X | ∃x ∈ X t.q. v = (x − x∗ ) }.
2i
On remarque que, si u1 et u2 appartiennent à U , alors il existe deux éléments x1 et x2 de
X tels que
1 1
u1 = (x1 + (x1 )∗ ), u2 = (x2 + (x2 )∗ ).
2 2
On a donc
1 1 1 1
u1 +u2 = (x1 +(x1 )∗ )+ (x2 +(x2 )∗ ) = (x1 +x2 +(x1 )∗ +(x2 )∗ ) = ((x1 +x2 )+(x1 +x2 )∗ ).
2 2 2 2
Comme x1 + x2 ∈ X, cette dernière relation signifie que u1 + u2 appartient à U .
D’autre part, si x est un élément (arbitraire) de X et α est un nombre réel, alors on a

α x∗ = α x∗ = (α x)∗

et donc
1 1
α u = (α x + α x∗ ) = (α x + (α x)∗ ),
2 2
ce qui, compte tenu que α x ∈ X, signifie que α u appartient à U . C’est-à-dire, sur l’en-
semble U sont bien définies deux opérations : addition + et multiplication ·. Il n’est pas
difficile de vérifier que toutes les règles a)–h) de la définition des espaces vectoriels avec
le corps des scalaires K = R sont valables. Donc, U est un espace vectoriel réel.
De manière analogue on peut montrer que V est lui aussi un espace vectoriel réel. Nous
avons donc montré que les élémens x d’un espace vectoriel complexe muni de l’opération
∗ peuvent être représentés dans la forme

x = u + iv, u ∈ U, v ∈ V,

avec deux espaces vectoriels réels U et V . Par abus de langage nous écivons aussi

X = U + iV.

11
2 Espaces métriques
2.1 Distance
Nous introduisons d’abord la distance (ou métrique).
Définition. Soit X un ensemble non vide. Une fonction dist : X × X → R+ est
appelée distance (ou métrique) si elle satisfait aux conditions

(2.1) dist(x, y) = 0 si et seulement si x = y,

(2.2) dist(x, y) = dist(y, x),

(2.3) dist(x, z) ≤ dist(x, y) + dist(y, z).

L’inégalité (2.3) est communément appelée l’inégalité triangulaire.


Les exemples fondamentaux sont la distance sur R et sur Rn . Sur R on définit

dist(x, y) = |x − y|.

On voit immédiatement que cette distance sur R vérifie les conditions (2.1)–(2.3).
Pour x, y ∈ Rn (x = (x1 , · · · , xn ), y = (y1 , · · · , yn )), on définit
v
u n
uX
(2.4) dist(x, y) = t (xk − yk )2 .
k=1

Il est clair que dans le cas n = 1 la définition (2.4) se réduit à dist(x, y) = |x − y|. Il
est également clair que la distance définie par (2.4) vérifie les conditions (2.1) et (2.2). Il
nous reste donc à examiner l’inégalité triangulaire (2.3) pour la fonction définie par (2.4).
C’est-à-dire, nous devons démontrer l’inégalité
v v
n u n u n
X
2
u X uX 2
2
(2.5) (ak + bk ) ≤ t ak + t b2k ,
k=1 k=1 k=1

qui, avec ak = yk − xk et bk = zk − yk pour k = 1, · · · , n, nous donne l’inégalité (2.3) pour


la fonction dist(·, ·) définie par (2.4).
Pour démontrer l’inégalité (2.5), commençons par remarquer que
1 1 1
(ak bj )2 + (aj bk )2 − ak bj aj bk = (ak bj − aj bk )2 ≥ 0,
2 2 2
ce qui nous donne
n X
n n n n n n n
X 1 XX 1 XX XX
ak b j aj b k ≤ (ak bj )2 + (aj bk )2 = (ak bj )2 .
k=1 j=1
2 k=1 j=1
2 k=1 j=1 k=1 j=1

Or, comme on a
n X
X n n
X 2 n X
X n n
X n
 X 
2
ak b j aj b k = ak b k , (ak bj ) = a2k b2k ,
k=1 j=1 k=1 k=1 j=1 k=1 k=1

12
on a
n
X 2 n
X n
 X 
(2.6) ak b k ≤ a2k b2k .
k=1 k=1 k=1

Cela étant, en revenant à (2.5), on remarque que


n
X n
X n
X n
X
2
(ak + bk ) = a2k + b2k +2 ak b k ,
k=1 k=1 k=1 k=1
v v v v
u n u n n n u n u n
uX uX  2 X X uX uX
2 2 2 2 2
t ak + t bk = ak + bk + 2 t ak t b2k .
k=1 k=1 k=1 k=1 k=1 k=1

Donc, pour démontrer (2.5), il suffit de démontrer l’inégalité


v v
X n u n
X
u n
u uX
2t
ak b k ≤ t ak b2k ;
k=1 k=1 k=1

cette inégalité résulte immédiatement de (2.6). Ainsi, l’inégalité (2.5) est démontrée. C’est-
à-dire, la fonction dist(·, ·) définie par (2.4) satisfait à toutes les trois conditions de la
définition de la distance (2.1)–(2.3).
Rappelons que la définition de la distance citée ci-dessus est une définition assez
générale de sorte qu’il y a des fonctions admises comme distance qui sont assez différentes
de la distance dans R ou Rn que nous venons de voir. Par exemple, considérons un en-
semble non vide quelconque X et la fonction

1 si x = y,
δ(x, y) =
0 autrement

définie sur X × X. Il est clair que la fonction δ(·, ·) vérifie les conditions (2.1) et (2.2).
Mais elle satisfait aussi à (2.3). En effet, soient x, y, z trois éléments de X. Si x = z,
alors δ(x, z) = 0 et donc, quelles que soient les valeurs de δ(x, y) et de δ(y, z), on a
δ(x, z) ≤ δ(x, y) + δ(y, z). D’autre part, si x 6= z, alors ou x 6= y ou y 6= z. Donc
δ(x, z) = 1 et δ(x, y) + δ(y, z) ≥ 1. Par conséquent, on a δ(x, z) ≤ δ(x, y) + δ(y, z). Donc
dans tous les cas l’inégalité (2.3) est vérifiée.
Citons un autre exemple. Soit X un ensemble. Soit d0 (·, ·) une distance définie sur X.
Soit ϕ une fonction définie sur R+ à valeurs réelles non identiquement nulle, croissante,
concave et telle que ϕ(0) = 0. On définit la fonction

d1 (x, y) = ϕ(d0 (x, y))

pour (x, y) ∈ X ×X. On remarque que les hypothèses sur ϕ impliquent que, si r > 0, alors
on a ϕ(r) > 0. Par conséquent, si x 6= y, alors d0 (x, y) > 0 et donc d1 (x, y) = ϕ(d0 (x, y)) >
0. D’autre part, si x = y, alors d0 (x, y) = 0 et donc d1 (x, y) = ϕ(d0 (x, y)) = 0. La condition
(2.1) est vérifiée. Quant à la condition (2.2), elle résulte immédiatement de la définition.
Pour examiner la validité de l’inégalité (2.3) pour la fonction d1 (·, ·), rappelons d’abord
que la concavité de ϕ implique que

(1 − ϑ)ϕ(r1 ) + ϑϕ(r2 ) ≤ ϕ(r1 + ϑ(r2 − r1 )) ∀ϑ ∈ [0, 1],

13
en particulier, si on pose R = d0 (x, y) + d0 (y, z), on a

d0 (x, y) d0 (x, y) d0 (y, z)


ϕ(R) = ϕ(R) + ϕ(0) ≤ ϕ(d0 (x, y)),
R R R
d0 (y, z) d0 (y, z) d0 (x, y)
ϕ(R) = ϕ(R) + ϕ(0) ≤ ϕ(d0 (y, z)),
R R R
d’où
ϕ(R) ≤ ϕ(d0 (x, y)) + ϕ(d0 (y, z)).
Rappelons l’inégalité (2.3) pour la fonction d0 (·, ·), qui implique

d0 (x, z) ≤ d0 (x, y)) + d0 (y, z) = R.

Comme la fonction ϕ est croissante, on a ϕ(d0 (x, z)) ≤ ϕ(R). En combianant les deux
inégalités, on obtient

d1 (x, z) = ϕ(d0 (x, z)) ≤ ϕ(d0 (x, y)) + ϕ(d0 (y, z)) = d1 (x, y) + d1 (y, z),

ce qui signifie que la fonction d1 (·, ·) satisfait à la condition (2.3).

2.2 Inégalités de Hölder et de Minkowski


Même si l’inégalité de Hölder et celle de Minkowski sont bien connues, pour leur
importance, nous rappelons leur démonstration.
Soient p et q deux nombres réels tels que p > 1, q > 1 et p1 + 1q = 1. On considère la
fonction
tp 1
ϕ(t) = + − t, 0 ≤ t < ∞.
p q
En dérivant la fonction ϕ(t), on a

d
ϕ(t) = tp−1 − 1.
dt

Puisque p − 1 > 0, il en résulte que dtd ϕ(t) t=1 = 0, dtd ϕ(t) < 0 pour 0 < t < 1 et d
dt
ϕ(t) >0
pour t > 1. Comme ϕ(1) = 0, on en réduit
tp 1
t≤ + ∀t ≥ 0.
p q
−1
En y substituant t = uv p−1 (u ≥ 0, v > 0), on obtient l’inégalité
−p
−1 up v p−1 1
uv p−1 ≤ + ,
p q
p
ou, en multipliant par v p−1 = v q les deux membres de cette inégalité,
up v q
(2.7) uv ≤ +
p q

(par la continuité cette inégalité est valable pour tout u ≥ 0, v ≥ 0). En utilisant l’inégalité
(2.7), on démontre l’inégalité de Hölder et celle de Minkowski.

14
Proposition 2.1 [Inégalité de Hölder] Soient p et q deux nombres réels tels que
p > 1, q > 1 et p1 + 1q = 1. Alors, quels que soient 2n nombres complexes ξ1 , · · · , ξn , η1 ,
· · · , ηn , on a
n
X n
X n
1/p  X 1/q
p
(2.8) |ξk ηk | ≤ |ξk | |ηk |q .
k=1 k=1 k=1
n
X n
X
Démonstration. Si |ξk |p = 0 ou |ηk |p = 0, alors ξ1 = · · · = ξn = 0 ou η1 = · · · =
k=1 k=1
n
X
ηn = 0 et donc on a |ξk ηk | = 0, de sorte que l’inégalité (2.8) est vérifiée.
k=1
n
X
Il ne nous reste qu’à démontrer l’inégalité (2.8) sous l’hypothèse que |ξk |p > 0 et
k=1
n
X
|ηk |p > 0. Sous cette hypothèse, on substitue
k=1
n
X −1/p n
X −1/q
u = |ξk | |ξk |p , v = |ηk | |ηk |q .
k=1 k=1

Alors on a
Xn −1/p  Xn −1/q 1 Xn −1 1 Xn −1
p q p p q q
|ξk ηk | |ξk | |ηk | ≤ |ξk | |ξk | + |ηk | |ηk | .
k=1 k=1
p k=1
q k=1

Si on fait la somme des deux membres de cette inégalité pour k = 1, · · · , n, la somme des
seconds membres devient égale à 1. On a donc
n
X n
X n
−1/p  X −1/q
|ξk ηk | |ξk |p |ηk |q ≤ 1,
k=1 k=1 k=1

d’où on obtient (2.8), ce qui achève la démonstration de la proposition 2.1. 


Proposition 2.2 [Inégalité de Minkowski] Soit p un nombre réel tel que p > 1.
Alors, quels que soient 2n nombres complexes ξ1 , · · · , ξn , η1 , · · · , ηn , on a
n
X 1/p n
X 1/p n
X 1/p
p p
(2.9) |ξk + ηk | ≤ |ξk | + |ηk |p .
k=1 k=1 k=1

Démonstration. Remarquons d’abord que


n
X n
X
p
|ξk + ηk | = |ξk + ηk |p−1 |ξk + ηk | ≤
k=1 k=1
n
X n
X
≤ |ξk + ηk |p−1 |ξk | + |ξk + ηk |p−1 |ηk |.
k=1 k=1
En appliquant l’inégalité de Hölder à chaque somme du second membre de cette inégalité
p
et en posant q = p−1 , on a
n
X n
X n
1/q  X 1/p
p−1 (p−1)q
|ξk + ηk | |ξk | ≤ |ξk + ηk | |ξk |p ,
k=1 k=1 k=1

15
n
X n
X n
1/q  X 1/p
p−1 (p−1)q
|ξk + ηk | |ηk | ≤ |ξk + ηk | |ηk |p .
k=1 k=1 k=1
p
En adjoignant ces inégalités et en tenant compte que (p − 1)q = (p − 1) p−1 = p, on obtient
n
X n
X n
1/q h X 1/p n
X 1/p i
|ξk + ηk |p ≤ |ξk + ηk |p |ξk |p + |ηk |p .
k=1 k=1 k=1 k=1

n
X n
X
Si |ξk + ηk |p = 0, alors l’inégalité (2.9) est vérifiée trivialement. Si |ξk + ηk |p > 0,
k=1 k=1
n
X 1/q
alors on peut diviser les deux membres de la dernière inégalité par |ξk + ηk |p , de
k=1
sorte que l’on obtient (2.9). La proposition est démontrée. 

2.3 Remarques sur certaines métriques sur Rn


Comme il est bien connu, la distance entre deux points de Rn qui est communément
utilisée est la distance définie par (2.4). Mais la définition générale d’une distance (ou
métrique) introduite au début du présent chapitre nous permet de définir d’autres dis-
tances (ou métriques). En particulier, nous examinons les variantes suivantes de la distance
définie par (2.4)
n
X 1/p
(2.10) %p (x, y) = |xk − yk |p ,
k=1

où
x = (x1 , · · · , xn ), y = (y1 , · · · , yn ) ∈ Rn .
Rappelons d’abord la relation suivante.

Remarque 2.1 Si n ≥ 2 et si 0 < p < 1, alors la fonction %p (·, ·) définie par (2.10) ne
vérifie généralement pas l’inégalité triangulaire (2.3).

Démonstration. Il suffit de considérer trois points

x = (0, 0, · · · , 0), y = (1, 0, · · · , 0), z = (1, 1, 0, · · · , 0).

En effet, on a

%p (x, y) = 1, %p (y, z) = 1, %p (x, z) = 21/p > 2 = %p (x, y) + %p (y, z),

ce qui contredit la condition (2.3). 


Dans le cas où p = 1, on voit aisément que %1 (·, ·) vérifie l’inégalité triangulaire.

Remarque 2.2 Pour p = 1 la fonction %p (·, ·) = %1 (·, ·) définie par (2.10) avec p = 1
vérifie l’inégalité triangulaire (2.3).

16
Démonstration. Dans le cas où p = 1, %1 (·, ·) se réduit à
n
X
%1 (x, y) = |xk − yk |.
k=1

Comme
|xk − zk | ≤ |xk − yk | + |yk − zk |,
en faisant la somme de cets inégalités pour k = 1, · · · , n, on a
n
X n
X n
X
|xk − zk | ≤ |xk − yk | + |yk − zk |.
k=1 k=1 k=1

Cette inégalité n’est autre que

%1 (x, z) ≤ %1 (x, y) + %1 (y, z).

L’énoncé de la remarque est démontré. 


Dans le cas où 1 < p < ∞, l’inégalité triangulaire pour %p (·, ·) résulte de l’inégalité de
Minkowski (dans le cas p = 2, on a déjà montré l’inégalité triangulaire, mais l’utilisation
de l’inégalité de Minkowski conduit elle aussi au même résultat).

Proposition 2.3 Pour 1 < p < ∞ la fonction %p (·, ·) définie par (2.10) vérifie l’inégalité
triangulaire (2.3).

Démonstration. Soient x, y, z ∈ Rn . Si on pose

ξk = xk − yk , ηk = yk − zk ,

l’inégalité triangulaire (2.3) résulte immédiatement de l’inégalité de Minkowski (2.9). 


Nous pouvons aussi introduire une distance %∞ (·, ·) sur Rn définie par

(2.11) %∞ (x, y) = max |xk − yk |,


k∈{1,··· ,n}

où
x = (x1 , · · · , xn ), y = (y1 , · · · , yn ) ∈ Rn .
On voit immédiatement que la fonction %∞ (·, ·) vérifient les relations (2.1) et (2.2). Elle
satisfait aussi à l’inégalité triangulaire (2.3). En effet, si x = (x1 , · · · , xn ), y = (y1 , · · · , yn ),
z = (z1 , · · · , zn ) sont trois points dans Rn , on a

max |xk − zk | ≤ max (|xk − yk | + |yk − zk |) ≤ max |xk − yk | + max |yk − zk |,


k∈{1,··· ,n} k∈{1,··· ,n} k∈{1,··· ,n} k∈{1,··· ,n}

ce qui n’est autre que l’inégalité %∞ (x, z) ≤ %∞ (x, y) + %∞ (y, z).


On remarque aussi que toutes ces remarques peuvent s’étendre au cas de Cn (au lieu
de Rn ). En effet, l’inégalité de Minkowski a été établie en haut pour les éléments de Cn .

17
2.4 Espaces métriques
Soit X un ensemble. Une fois définie une distance (ou métrique) dist(·, ·) sur X, on
dira que X muni de la métrique dist(·, ·) est un espace métrique. L’espace métrique est
muni de la topologie déterminée par le système fondamental de voisinages
1
{ { y ∈ X | dist(x, y) < } }n∈N\{0}
n
de chaque point x de X.
Un espace métrique est séparé, c’est-à-dire, quels que soient deux points x et y non
identiques de l’espace métrique X, il existe un voisinage Ux de x et un voisinage Uy de
y tels que Ux ∩ Uy = ∅. En effet, pour le voir, il suffit de choisir un nombre r tel que
0 < r < 21 dist(x, y) et

Ux = { z ∈ X | dist(x, z) < r }, Uy = { z ∈ X | dist(y, z) < r }.

Dans l’espace métrique la limite d’une suite {xk }∞


k=1 est caractérisée par le fait que,
s’il existe la limite de {xk }∞
k=1 , alors
1
L = lim xk ⇐⇒ ∀n ∈ N\{0} ∃k n tel que ∀k ≥ kn dist(L, xk ) < .
k→∞ n
Comme l’espace métrique est séparé, cette caractérisation de la limite d’une suite nous
donne l’unicité de la limite (mais ne garantit pas l’existence de la limite).
Rappelons qu’une suite de Cauchy dans un espace métrique est une suite {xk }∞ k=1 telle
que, pour tout ε > 0, il existe un k ε tel que pour tout k1 ≥ k ε et k2 ≥ k ε on ait

dist(xk1 , xk2 ) ≤ ε.

Définition. Un espace métrique est dit complet, si toute suite de Cauchy de ses
éléments admet la limite qui appartient à lui. Nous appelerons complétion d’un espace
métrique X le plus petit espace métrique contenant l’espace X.
On sait que tout espace métrique admet une complétion.

Théorème 2.1 Tout espace métrique admet une complétion.

On peut trouver sa démonstration par exemple dans : L. Kantorovitch-G. Alikov,


Analyse fonctionnelle, Tome 1 (Éd. Mir, 1981), pp. 33–35, ou A. Kolmogorov-S. Fomine
Élements de la théorie des fonctions et de l’analyse fonctionnelle (Éd. Mir, 19..), pp.
65–68.
Nous rappelons aussi la notion d’espace métrisable.
Définition Un espace topologique est dit métrisable, s’il existe une métrique (dis-
tance) qui engendre sa topologie.
Il faut rappeler qu’une même topologie peut être engendrée par différentes métriques.
Par exemple, en haut nous avons vu différentes distances sur Rn . Mais il est facile de voir
que toutes ces différentes métriques engendrent la même topologie de Rn .

18
3 Espaces normés
3.1 Définition des espaces normés et remarques générales
Retournons à l’espace vectoriel et introduisons sur lui la norme.
Définition. Soit X un espace vectoriel réel ou complexe. Le nombre positif, noté kxk,
donné à chaque élément x de X est appelé la norme de x, si les conditions suivantes sont
vérifiées :
a) kxk ≥ 0 pour tout x ∈ X ; kxk = 0 si et seulement si x = 0.
b) kαxk = |α|kxk pour tout x ∈ X et pour tout α ∈ K.
c) kx + yk ≤ kxk + kyk pour tout x, y ∈ X.
L’espace vectoriel réel ou complexe muni de la norme est appelée espace normé.
Il est claire que l’espace normé X est un espace métrique si on définit

(3.1) dist(x, y) = kx − yk.

Mais la distance dist(x, 0) de x de 0 n’est pas généralement une norme. En effet on voit
facilement que, par exemple, la fonction
n
X 1/4
p
ϕ(x, y) = |x − y| = (xk − yk )2
k=1

définie sur Rn × Rn est une distance (voir le chapitre précédent, 2.1 Distance), mais on a
p p p p
ϕ(αx, 0) = |αx| = |α| |x| = |α|ϕ(x) 6= |α|ϕ(x)

(si |α| =
6 1).
On remarque que dans un espace normé X l’ensemble Br (x0 ) = { x ∈ X | kx−x0 k < r }
ainsi que sa ferméture B r (x0 ) = { x ∈ X | kx − x0 k ≤ r } sont convexes. En effet, si x
et y appartiennent à Br (x0 ) et si z = ϑx + (1 − ϑ)y (0 ≤ ϑ ≤ 1), alors on a z − x0 =
ϑ(x − x0 ) + (1 − ϑ)(y − x0 ). Donc d’après la condition c) (inégalité triangulaire) de la
définition de la norme, on a

kz − x0 k ≤ kϑ(x − x0 )k + k(1 − ϑ)(y − x0 )k.

D’autre part, d’après la condition b) de la définition de la norme, on a

kϑ(x − x0 )k = ϑkx − x0 k, k(1 − ϑ)(y − x0 )k = (1 − ϑ)ky − x0 k.

Or, comme d’après la définition de Br (x0 ) on a kx − x0 k < r et ky − x0 k < r, on déduit


que
kz − x0 k ≤ (ϑ + (1 − ϑ))r = r,
ce qui montre que z ∈ Br (x0 ) et que donc Br (x0 ) est convexe.
La convexité de B r (x0 ) se démontre d’une manière analogue, en remplaçant “<” par
“≤” dans le raisonnement illustré ci-dessus.

19
3.2 Exemples d’espaces normés
Dans le chapitre précédent, nous avons vu que la fonction %p (x, y) avec 1 ≤ p < ∞
définie par (2.10) sur Rn ou sur Cn ainsi que la fonction %∞ (x, y) définie par (2.11) sont
des métriques, c’est-à-dire distances, sur Rn ou sur Cn . Il n’est pas difficile de voir que
les fonctions %p (0, x) sont aussi des normes. Il est évident que les conditions a) et c) sont
vérifiées. Donc pour voir qu’elles sont des normes, il suffit de démontrer la relation b) pour
ces fonctions. On a en effet, pour 1 ≤ p < ∞,
n
X 1/p n
X 1/p
p
%p (0, αx) = |αxk | = |α| |xk |p = |α|%p (0, x),
k=1 k=1

ce qui montre que les fonctions %p (0, x) vérifient la condition b) et donc elles peuvent être
des normes. Il n’est pas difficile de voir que même la fonction %∞ (0, x) vérifie la condition
%∞ (0, αx) = |α|%∞ (0, x).
Ces normes sur Rn ou Cn peuvent être étendues à des espaces de suites. Pour ce faire,
on peut utiliser les propriétés des normes sur Rn ou Cn , mais il faut aussi faire certaines
précautions.
Exemple 1 Soit X l’ensemble des suites x = {ξk }∞k=1 de nombres réels ou de nombres
complexes telles que sup |ξk | < ∞. En défnissant de manière naturelle la somme et la
k∈N\{0}
multiplication par un scalaire, on voit sans difficulté que X est un espace vectoriel. Si on
définit sur X la fonction

(3.2) kxk = sup |ξk |,


k∈N\{0}

on voit immédiatement que les conditions a) et b) sont vérifiées. Pour montrer la condition
c), considérons deux éléments x = {ξk }∞ ∞
k=1 et y = {ηk }k=1 . L’inégalité élémentaire

|ξk + ηk | ≤ |ξk | + |ηk |

nous donne

max |ξk + ηk | ≤ max (|ξk | + |ηk |) ≤ max |ξk | + max |ηk |


k∈{1,··· ,n} k∈{1,··· ,n} k∈{1,··· ,n} k∈{1,··· ,n}

pour tout n ∈ N\{0}. On rappelle que max |ξk + ηk |, max |ξk |, max |ηk | consti-
k∈{1,··· ,n} k∈{1,··· ,n} k∈{1,··· ,n}
tuent des suites croissantes et que

sup |ξk + ηk | = lim max |ξk + ηk |,


k∈N\{0} n→∞ k∈{1,··· ,n}

sup |ξk | = lim max |ξk |, sup |ηk | = lim max |ηk |.
k∈N\{0} n→∞ k∈{1,··· ,n} k∈N\{0} n→∞ k∈{1,··· ,n}

On a donc

max |ξk +ηk | ≤ max (|ξk |+|ηk |) ≤ max |ξk |+ max |ηk | ≤ sup |ξk |+ sup |ηk |,
k∈{1,··· ,n} k∈{1,··· ,n} k∈{1,··· ,n} k∈{1,··· ,n} k∈N\{0} k∈N\{0}

d’où, en passant à la limite, on obtient

sup |ξk + ηk | ≤ sup |ξk | + sup |ηk |,


k∈N\{0} k∈N\{0} k∈N\{0}

20
ce qui signifie que la fonction kxk définie par (3.2) vérifie aussi la condition c) de la
définition de la norme. Donc elle est une norme et l’espace X munie de cette norme est
un espace normé.
Exemple 2 Soit p ∈ [1, ∞[. Soit X l’ensemble des suites x = {ξk }∞k=1 de nombres réels

X
ou de nombres complexes telles que |ξk |p < ∞. En défnissant de manière naturelle la
k=1
somme et la multiplication par un scalaire, on voit sans difficulté que X est un espace
vectoriel. Définissons sur X la fonction

X 1/p
(3.3) kxkp = |ξk |p .
k=1

Il n’est pas difficile de voir que les conditions a) et b) sont vérifiées. Pour montrer que la
condition c) est elle aussi vérifiée, considérons deux éléments x = {ξk }∞ ∞
k=1 et y = {ηk }k=1 .
D’après l’inégalité de Minkowski (2.9), on a
n
X 1/p n
X 1/p n
X 1/p
p p
|ξk + ηk | ≤ |ξk | + |ηk |p
k=1 k=1 k=1

pour tout n ∈ N\{0}. Cela étant, on peut procéder d’une manière analogue à l’exemple
n
X n
1/p  X n
1/p  X 1/p
1, c’est-à-dire que |ξk + ηk |p , |ξk |p , |ηk |p sont des suites crois-
k=1 k=1 k=1
santes et que
n
X 1/p
kx + ykp = lim |ξk + ηk |p ,
n→∞
k=1
n
X 1/p n
X 1/p
kxkp = lim |ξk |p , kykp = lim |ηk |p .
n→∞ n→∞
k=1 k=1

On a donc
n
X 1/p n
X 1/p n
X 1/p
p p
|ξk + ηk | ≤ |ξk | + |ηk |p ≤ kxkp + kykp ,
k=1 k=1 k=1

d’où, en passant à la limite, on obtient

kx + ykp ≤ kxkp + kykp .

On a montré que la fonction kxk définie par (3.3) vérifie aussi la condition c) de la
définition de la norme. Donc elle est une norme et l’espace X munie de cette norme est
un espace normé.
Exemple 3 L’ensemble C([a, b]) de toutes les fonctions définies et continues sur
un intervalle fermé et borné [a, b] à valeurs réelles ou complexes muni des opérations de
addition et de multiplication par un scalaire naturelles et de la norme

(3.4) kuk = sup |u(t)|


a≤t≤b

est un espace normé. En effet, on voit aisément que la norme définie par (3.4) satisfait à
toutes les trois conditions a), b), c) de la définition de la norme.

21
Il n’est pas difficile de voir que les espaces normés des exemples 1, 2, 3 sont complets.
En effet le fait que R muni de la métrique usuelle est complet, c’est-à-dire toutes les
suites de Cauchy dans R admettent la limite dans R, peut conduire à la convergence sur
chaque point ·k ou x ∈ [a, b] d’un ensemble dénombrable (sur [a, b] nous pouvons choisir
un ensemble dénombrable et dense dans [a, b] puis utiliser la continuité).
Exemple 4 Considérons le même ensemble C([a, b]) de toutes les fonctions définies
et continues sur un intervalle fermé et borné [a, b] à valeurs réelles ou complexes. Avec les
opérations de addition et de multiplication par un scalaire naturelles, comme dans le cas
de l’exemple 3, C([a, b]) est un espace vectoriel. Définissons la fonction
Z b
(3.5) kuk1 = |u(t)|dt.
a

Il est clair que cette fonction sur C([a, b]) satisfait aux conditions a) et b) de la définition
de la norme. En outre on a
Z b Z b Z b Z b
|u(t) + v(t)|dt ≤ (|u(t)| + |v(t)|)dt = |u(t)|dt + |v(t)|dt,
a a a a

ce qui montre que la fonction k · k1 définie par (3.5) elle aussi vérifie la relation c) de la
définition de la norme et donc elle est elle aussi une norme.
Mais l’espace normé C([a, b]) muni de la norme k · k1 n’est pas complet. En effet, si on
considère la suite de fonctions {uk }∞
k=1 ,

 0 si a ≤ x ≤ a+b 2
,
a+b a+b
uk (x) = k(x − 2 ) si 2
≤ x ≤ min(b, 2 + k1 ),
a+b

1 si x ≥ min(b, a+b + k1 ),

2

alors on a
Z b Z min(b, a+b + k1∗ )
2 1
kuk − uk0 k1 = |uk (t) − uk0 (t)|dt = |uk (t) − uk0 (t)|dt ≤ ,
a a+b
2
2k ∗
où k ∗ = min(k, k 0 ). Donc la suite {uk }∞
k=1 est une suite de Cauchy dans l’espace normé
C([a, b]) muni de la norme k · k1 . Mais cette suite n’admet pas de limite dans cet espace.

3.3 Équivalence de normes


Nous définissons l’équivalence entre deux (ou plusieurs) normes comme suit :
Définition Soit X un espace vectoriel. Soient k · k(1) et k · k(2) deux normes définies
sur X. S’il existe deux constantes strictement positives C1 et C2 telles que
(3.6) C1 kxk(2) ≤ kxk(1) ≤ C1 kxk(2) ∀x ∈ X,
on dira que la norme k · k(1) et la norme k · k(2) sont équivalentes.
Il est clair que l’existence de deux constantes strictement positives C1 et C2 vérifiant
(3.6) est équivalente à l’existence de deux constantes strictement positives C10 et C20 telles
que
C10 kxk(1) ≤ kxk(2) ≤ C10 kxk(1) ∀x ∈ X.
En outre, on voit immédiatement que, si les normes k · k(1) et k · k(2) sont équivalentes et
si les normes k · k(2) et k · k(3) sont équivalentes, alors la norme k · k(1) et la norme k · k(3)
sont équivalentes.
Dans le cas où l’espace vectoriel est de dimension finie, on a le théorème suivant.

22
Théorème 3.1 Soit X un espace vectoriel de dimension finie. Alors toutes les normes
définies sur X sont équivalentes.

Démonstration Supposons que X est à n dimensions. Choisissons une base {ek }nk=1 de
l’espace vectoriel X. Introduisons sur X la norme k · k2 définie par
n
X 1/2
kxk2 = |αk |2 ,
k=1

où α1 , · · · , αn sont les scalaires tels que


n
X
x= αk ek ;
k=1

cette norme k · k2 est donc la norme usuelle de Kn , c’est-à-dire ou de Rn ou de Cn , par


rapport à (α1 , · · · , αn ).
Xn
Soit k · k∗ une autre norme quelconque définie sur X. Soit x = αk ek un élément
k=1
générique de X. Alors on a
n
X n
X
kxk∗ = k αk e k k ∗ ≤ |αk |kek k∗ ≤
k=1 k=1

n
X n
1/2  X 1/2 n
X 1/2
2
≤ |αk | kek k2∗ = kek k2∗ kxk2 .
k=1 k=1 k=1

Donc si on pose
n
X 1/2
C2 = kek k2∗ ,
k=1
on a
kxk∗ ≤ C2 kxk2 .
D’autre part, pour obtenir lı́négalité dans le sens opposé, nous considérons l’ensemble
S = { x ∈ X | kxk2 = 1 }. Or, en vertu de l’inégalité triangulaire pour la distance k · k∗ et
de l’inégalité précédente, nous avons

| kxk∗ − kx0 k∗ | ≤ kx − x0 k∗ ≤ C2 kx − x0 k2 ,

ce qui signifie que, en tant que fonction définie sur l’espace des coefficients Kn défini par
rapport à la base {ek }nk=1 et muni de la métrique k · k2 , la fonction k · k∗ est continue.
Comme S est un ensemble borné et fermé dans cet espace Kn . Donc la fonction k · k∗
admet sur S une valeur maximale et une valeur minimale sur S. La valeur minimale
ne peut pas être négative ni nulle (en vertu de la définition de la distance et du fait que
x 6= 0 pour tout x ∈ S). Désignons par µ cette valeur minimale de kxk∗ sur S. Considérons
maintenant un élément quelconque x de X différent de 0. Comme
1
x ∈ S,
kxk2
on a 1
x ≥ µ.

kxk2 ∗

23
On en déduit que
1 1
kxk∗ = kxk2 x = kxk2 x ≥ µkxk2 .

kxk2 ∗ kxk2 ∗

Donc, en posant µ = C1 , on a

C1 kxk2 ≤ kxk∗ ≤ C2 kxk2 ,

ce qu’il fallait démontrer. 

3.4 Sous-espaces d’un espace normé


Nous choisissons une dénomination “sous-espace” d’un espace normé dans le sens
suivat.
Définition Soit X un espace normé. Nous appelons sous-espace (de l’espace normé
X) chaque variété linéaire fermée de X.
On remarque qu’une variété linéaire L d’un espace normé X est fermée, si L est de
dimension finie. En effet, dans cette hypothèse on peut choisir une base {ek }nk=1 (n étant
la dimension de L). On note k · kX la norme de l’espace normé X, tandis que sur L on
définit une norme n
X 1/2
2
kxk2 = |αk | ,
k=1

où α1 , · · · , αn sont les scalaires tels que


n
X
x= αk ek ,
k=1

c’est-à-dire la norme que nous avons utilisée dans la démonstration du théorème 3.1.
Comme d’après le théorème 3.1 les deux normes k · kX et k · k2 sont équivalentes, si
{x(m) }∞m=1 est une suite de Cauchy de l’espace normé X telle que x
(m)
∈ L pour tout
m ∈ N\{0}, alors {x(m) }∞ m=1 est aussi une suite de Cauchy par rapport à la norme k · k2
(m) (m)
et donc, pour chaque k ∈ {1, · · · , n} fixé, le coefficient αk de x forme une suite de
(m) ∞
Cauchy {αk }m=1 dans R ou C. Donc pour chaque k il existe un nombre réel ou complexe
αk tel que
(m)
αk → α k pour m → ∞.
n
X
La combinaison linéaire x = αk ek , qui appartient à L, est évidemment la limite de la
k=1
suite {x(m) }∞m=1 dans la topologie déterminée par la norme k · k2 , et donc, en vertu de
l’équivalence des deux normes, est la limite de la suite {x(m) }∞ m=1 dans la topologie de
l’espace normé X. En d’autres termes, la variété linéaire L est fermée.
Citons un exemple de sous-espace et de variété linéaire qui n’est pas sous-espace.
Exemple On considère l’espace normé X = C([0, 1]) muni de la norme usuelle

kuk = sup |u(t)|.


0≤t≤1

24
L’ensemble des polynômes de degré inférieur ou égal à n (considérés sur [0, 1]) est un
sous-espace de X = C([0, 1]). [En effet, cet ensemble est une variété linéaire à n + 1
dimensions ; une base de cette variété linéaire est {1, t, t2 , · · · , tn }.]
D’autre part, l’ensemble de tous les polynômes (considérés sur [0, 1]) n’est pas fermé
n
X tk
dans la topologie de l’espace normé X = C([0, 1]). En effet, les polynômes Pn (t) =
k=0
k!
(n = 1, 2, · · · ) appartiennent évidemment à cet ensemble et constituent une suite de
n
t
X tk
Cauchy dans l’espace normé X = C([0, 1]). Mais sa limite e = lim n’est pas
n→∞
k=0
k!
polynôme et donc cet ensemble n’est pas fermé.
Introduisons maintenant la distance entre un point x et un ensemble A dans un espace
métrique. On pose

(3.7) dist(x, A) = inf dist(x, y).


y∈A

Cette distance entre un point x et un ensemble A est celle qui est utilisée communément.
Pour un sous-espace d’un espace normé, on a la propriété suivante.

Lemme 3.1 Soit L un sous-espace d’un espace normé X. Si x 6∈ L, alors on a


dist(x, L) > 0.

Démonstration Soit x un point qui n’appartient pas à L. Supposons par absurde que
dist(x, L) = 0. Alors il existerait une suite {yk }∞
k=1 telle que yk ∈ L pour tout k et
kx − yk k → 0 pour k → ∞. Sans restreindre la généralité, on peut supposer que
1
kx − yk k ≤ ∀k ∈ N\{0}.
k
Ceci implique que yk converge vers x et comme par hypothèse L est fermé, x devrait
appartenir à L, ce qui contredit notre hypothèse. Donc il faut que dist(x, L) > 0. 

3.5 Espaces de Banach - définition


Maintenant nous pouvons définir les espaces de Banach.
Définition Un espace normé complet est appelé espace de Banach. Si les scalaires de
l’espace vectoriel sur lequel la norme est définie sont réels, on l’appelle espace de Banach
réel ; s’ils sont complexes, on l’appelle espace de Banach complexe.

25
4 Compléments pour les espaces métriques
4.1 Espaces métriques séparables
Rappelons que dans un espace topologique E un sous-ensemble A de E est dit dense,
si la ferméture A de A coı̈ncide avec E.
Définition Un espace métrique X est dit séparable, s’il existe un sous-ensemble
dénombrable dense dans X.
Des exemples d’espaces métriques séparables sont bien connus. Par exemple, l’espace
n
R muni de métriques dist(·, ·) définie par (2.4), dist(·, ·) = %p (·, ·) définie par (2.10) ou
dist(·, ·) = %∞ (·, ·) définie par (2.11) est un espace séparable. Il est clair que ces métriques
définissent la même topologie sur Rn et l’ensemble Qn (ensemble des n-plets de nombres
rationnels) est dénombrable et dense dans Rn muni de ces métriques.
Comme exemple d’espace métrique non séparable, nous citons l’espace métrique, noté
X, de l’exemple 1 de l’espace normé, espace des suites x = {ξk }∞ k=1 de nombres réels. Dans
cet espace nous considérons l’ensemble A des suites x = {ξk }∞ k=1 telles que ξk ∈ {0, 1}.
Il est clair que la distance entre deux éléments différents de A est égale à 1 ; donc, si un
ensemble B est dense dans cet espace, B doit contenir un élément yx appartenant à
1
{ y ∈ X | ky − xk < }
4
pour chaque élément x appartenant à A et on a yx(1) 6= yx(2) si x(1) 6= x(2) . D’autre part,
l’ensemble A n’est pas dénombrable, comme on peut le constater par la méthode diagonale
de Cantor. Donc l’ensemble B lui non plus ne peut pas être dénombrable, ce qui signifie
que l’espace métrique X n’est pas séparable.

4.2 Ensembles de première et deuxième catégories


On considère un espace métrique X. On dit qu’un sous-ensemble M de X est un
ensemble de première catégorie s’il peut être représenté par la réunion d’un nombre au
plus dénombrable d’ensembles nulle part dense. Un ensemble qui n’est pas de première
catégorie est appelé ensemble de deuxième catégorie. Un exemple d’ensemble de première
catégorie est l’ensemble
{ (x1 , x2 ) ∈ R2 | x2 ∈ Q },
qui est dense dans R2 mais est la réunion dénombrable des ensembles nulle part denses, qui
sont les droites parallèles à l’axe x1 passant par le point (0, x2 ) avec un nombre rationnel
x2 .
Il nous sera utile d’utiliser des suites de boules fermées emboı̂tées dans un espace
métrique X. Nous appelerons boule fermée un ensemble D ayant la forme

D = { y ∈ X | dist(y, x) ≤ ε },

où x est un élément de X, tandis que ε est un nombre strictement positif (qui est le rayon
de D). Nous dirons que la suite {Dk }∞ k=1 est une suite de boules fermées emboı̂tées, si Dk
sont des boules fermées et si Dk+1 ⊂ Dk pour tout k. On a le lemme suivant.

Lemme 4.1 Pour qu’un espace métrique X soit complet, il faut et il suffit que toute suite
de boules fermées emboı̂tées dont le rayon tend vers 0 ait une intersection non vide.

26
Démonstration Démontrons d’abord que la condition est nécessaire. Pour ce faire,
supposons que l’espace métrique X est complet et considérons une suite de boules fermées
emboı̂tées {Dk }∞
k=1 dans X. Désignons par xk et par εk le centre et le rayon de la boule
Dk pour k = 1, 2, · · · . Supposons que εk → 0 pour k → ∞.
On remarque que pour j ≥ k on a xj ∈ Dk et donc dist(xj , xj 0 ) ≤ 2εk pour j, j 0 ≥ k.
Comme εk tend vers 0 pour k → ∞, il résulte que, pour tout ε > 0, il existe un nombre
naturel kε tel que pour tout j, j 0 ≥ kε on ait dist(xj , xj 0 ) ≤ ε, c’est-à-dire, xk , k = 1, 2, · · · ,
forment une suite de Cauchy. Comme X est complet par hypothèse, il existe un élément
x ∈ X tel que
x = lim xk .
k→∞

Remarquons aussi que, comme pour j ≥ k on a xj ∈ Dk et que Dk est un ensemble fermé,


on a x ∈ Dk . Comme c’est vrai pour tout k ∈ N\{0}, on a

\
x∈ Dk ,
k=1

en d’autres termes, l’intersection de Dk pour k ∈ N\{0} n’est pas vide.


De ce lemme on déduit une caractérisation des espaces métriques complets, connue
sous le nom de théorème de Baire.

Proposition 4.1 Tous les espaces métriques complets sont des ensembles de seconde
catégorie.

Démonstration. Soit X un espace métrique complet. Supposons par absurde que X


soit un ensemble de première catégorie, c’est-à-dire

[
X= Ek ,
k=1

où Ek sont des ensembles tels que chaque boule ouverte Br (x) = {y ∈ X| dist(y, x) < r}
de X contienne une autre boule fermée Br0 (x0 ) telle que Br0 (x0 )∩Ek soit vide. Considérons
une boule fermée B1 (x0 ). D’après l’hypothèse sur Ek , B1 (x0 ) doit contenir une autre boule
B2r1 (x1 ) (donc r1 ≤ 12 ) telle que B2r1 (x1 ) ∩ E1 soit vide. Considérons maintenant la boule
fermée Br1 (x1 ), qui ne contient évidemment aucun point de E1 . De manière analogue
la boule fermée Br1 (x1 ) doit à son tour contenir une autre boule fermée B2r2 (x2 ) (donc
r2 ≤ r21 ) telle que B2r2 (x2 )∩E2 soit vide. La boule fermée B2r2 (x2 ) ne contient évidemment
aucun point de E2 . En répétant ce procédé, on obtiendrait une chaı̂ne de boules fermées
Brk (xk ) (k = 1, 2, · · · ) telle que Brk+1 (xk+1 ) ⊂ Brk (xk ) pour tout k ∈ N\{0}, que l’on ait
rk ≤ 2−k et que Brk+1 (xk+1 ) ne contienne aucun point de Ek+1 . Comme {xk }∞ k=1 constitue
une suite de Cauchy T dans l’espace métrique complet X, il existe sa limite x et x est
l’unique point de k∈N\{0} Brk (xk ) ; de plus x n’appartient à aucun des ensembles Ek ,
c’est-à-dire x 6∈ ∞
S
k=1 Ek , ce qui contredit l’hypothèse. Donc l’affirmation du lemme est
démontrée. 

27
4.3 Rappels sur les ensembles compacts
Nous voulons voir les propriétés des ensembles compacts dans l’espace métrique. Pour
ce faire, nous commençons par rappeler les définitions concernant les ensembles compacts.
Définition Un espace topologique K est appelé espace compact, si tout recouvrement
ouvert de K contient un sous-recouvrement fini.
Rappelons aussi l’axiome de Hausdorff : quels que soient deux points distincts x et y
d’un espace topologique T , il existe un voisinage Ux de x et un voisinage Uy de y tels que
Ux ∩ Uy = ∅.
Cela étant, on définit les compacts.
Définition Un espace topologique compact est appelé compact, si l’axiome de Haus-
dorff y est vérifié.
Nous allons voir une caractérisation des espaces compacts. Pour ce faire, nous allons
introduire les familles dites centrées de sous-ensembles d’un espace topologique.
Définition Soit X un espace topologique. Une famille de sous-ensembles {Aι }ι∈I est
dite centrée, si, quelle que soit la sous-famille finie {Aιk }N
k=1 de {Aι }ι∈I , leur intersection
\N
n’est pas vide, c’est-à-dire Aιk 6= ∅.
k=1

On a alors la caractérisation suivante des espaces compacts.

Proposition 4.2 Pour qu’un espace topologique X soit compact, il faut et il suffit que
toute famille centrée de sous-ensembles fermés admette une intersection non vide, c’est-
à-dire,
\ si {Aι }ι∈I est une famille centrée de sous-ensembles fermés de X, alors on ait
Aι 6= ∅.
ι∈I

Démonstration. Supposons d’abord que X est compact et considérons une famille


centrée de sous-ensembles fermés {Aι }ι∈I . On pose Dι = X\Aι ; comme Aι sont fermés
par hypothèse, Dι sont ouverts. Or, en vertu de la définition de la famille centrée, quelle
[N N
\
que soit la sous-famille finie {Aιk }N
k=1 de {A }
ι ι∈I , on a X\ D ιk = Aιk 6= ∅. Ça
k=1 k=1
signifie que {Dιk }N
k=1 ne constitue pas un recouvrement de X. Si {Dι }ι∈I constituait
un recouvrement de X, en vertu de la définition des espaces compacts, il y aurait un
[N N
[
N
recouvrement fini {Dιk }k=1 de sorte que Dιk = X, ou X\ Dιk = ∅, ce qui vient
k=1 k=1
d’être
\ exclu.[Donc {Dι }ι∈I ne peut pas constituer un recouvrement de X, c’est-à-dire,
Aι = X\ Dι 6= ∅.
ι∈I ι∈I
Maintenant, supposons que la \ condition : “si {Aι }ι∈I est une famille centrée de sous-
ensembles fermés de X, alors on a Aι 6= ∅”, est remplie. Soit {Dι0 }ι0 ∈I 0 un recouvrement
ι∈I
ouvert de X. Posons Aι0 = X\D sont fermés (ι0 ∈ I 0 ). Comme {Dι0 }ι0 ∈I 0 est
\ι0 . Alors Aι0 [
un recouvrement de X, on a Aι0 = X\ Dι0 = ∅. Donc, par notre hypothèse, la
ι0 ∈I 0 ι0 ∈I 0
famille {Aι0 }ι0 ∈I 0 ne peut pas être centrée, ce qui implique qu’il existe une sous-famille finie
de {Aι0 }ι0 ∈I 0 telle que l’intersection des sous-ensembles appartenant à cette sous-famille

28
N0
\
N0
finie est vide, c’est-à-dire, il existe une sous-famille finie {Aι0k }k=1 telle que Aι0k = ∅,
k=1
N 0
[
ou Dι0k = X, ce qui signifie que d’un recouvrement ouvert {Dι0 }ι0 ∈I 0 de X on peut
k=1
extraire un recouvrement fini, c’est-à-dire, X est compact. 
En utilisant la proposition 4.2 on démontre la propriété suivante des espaces compacts.

Théorème 4.1 Si l’espace topologique X est compact, tout sous-ensemble infini admet
au moins un point d’accumilation.

Démonstration. Soit X un espace compact. Supposons par absurde qu’il existe un sous-
ensemble infini E ne possédant pas de point d’accumilation. Alors on pourrait extraire de
E un sous-ensemble dénombrable

[
A1 = {xk },
k=1

qui ne possède pas de point d’accumilation. On pose



[ ∞
[
A2 = {xk }, · · · , Ak = {xk0 }, · · · .
k=2 k0 =k

Alors on voit que la famille {Ak }∞ k=1 serait une famille centrée de sous-ensembles fermés
avec leur intersection vide, ce qui, d’après la proposition 4.2, impliquerait que X ne serait
pas compact contrairement à notre hypothèse. Le théorème est démontré. 
Définition Un espace topologique est dit dénombrablement compact, si tout sous-
ensembles infini admet au moins un point d’accumulation.
Du théorème 4.1 il résulte immédiatement que, si un espace topologique est compact,
alors il est dénombrablement compact.
Introduisons aussi la notion d’espace topologique séquentiellement compact.
Définition Un espace topologique K est dit séquentiellement compact, si toute suite
de K contient une suite convergeant vers un point de K.
On remarque que, si K est séquentiellement compact, alors il est dénombrablement
compact. En effet, la limite d’une suite (contenant un nombre infini d’éléments) est un
point d’accumulation de cette suite et donc d’un ensemble contenant cette suite.

4.4 Compacité dans les espaces métriques


Dans les espaces métriques il résulte que la compacité, la compacité séquentielle et
la compacité dénombrable ainsi que certaines d’autres caractérisations sont équivalentes.
Nous commençons par rappeler le lemme suivant.

Lemme 4.2 Soit X un espace métrique. Si x ∈ X est un point d’accumulation d’un


ensemble infini E ⊂ X, alors il existe une suite {xk }∞
k=1 d’éléments de E qui converge
vers x.

29
Démonstration Considérons une suite de nombres strictement positifs {εk }∞ k=1
décroissante et congergente vers 0, par exemple εk = k1 . Comme les boules ouvertes
Bεk (x) de centre x et de rayon εk sont des voisinages de x, chaque boule ouverte Bεk (x)
contient au moins un élément de E diffénent de x. En choisissant un élément, noté xk , de
E ∩ (Bεk (x)\{x}), on obtient une suite {xk }∞ k=1 . Comme dist(xk , x) < εk et que εk → 0,
la suite {xk }∞
k=1 converge vers x. Le lemme est démontré. 
Rappelons aussi le lemme suivant.

Lemme 4.3 Soient X un espace métrique séparable et {Aι }ι∈I un recouvrement ouvert
de X. Alors on peut extraire de {Aι }ι∈I un recouvrement dénombrable de X.

Démonstration Soit E un ensemble dénombrable et dense dans X. Considérons une


suite de nombres strictement positifs {εk }∞ k=1 décroissante et convergente vers 0, par
1
exemple εk = k , et les boules ouvertes Bεk (x) de centre x et de rayon εk avec x ∈ E.
Il est clair que l’ensemble {Bεk (x)}x∈E est dénombrable et donc on peut numéroter les
boules Bεk (x) comme Sn , n = 1, 2, · · · . Comme Aι sont des ensembles ouverts, pour
chaque x ∈ Aι il existe un ε = ε(x) > 0 tel que Bε(x) (x) ⊂ Aι . Choisissons un εk tel que
2εk < ε(x) et considérons Bεk (x). Comme E est dense, on a Bεk (x) ∩ E 6= ∅. On choisit un
élément y = y(x) ∈ Bεk (x) ∩ E. On remarque que x ∈ Bεk (y(x)) et que Bεk (y(x)) ⊂ Aι .
Comme Bεk (y(x)) est une des boules numérotées en haut, il existe un nombre naturel
n = n(x) tel que Bεk (y(x)) = Sn(x) . C’est-à-dire, pour chaque x ∈ X on peut choisir
Aι(x) et Sn(x) ⊂ Aι(x) = Aι(n(x)) . Comme la famille d’ensembles {Sn(x) }x∈X recouvre X, la
famille d’ensembles {Aι(n(x)) }x∈X elle aussi recouvre X. Comme {n(x)}x∈X ⊂ N et donc
la famille {Aι(n(x)) }x∈X est dénombrable, le lemme est démontré. 
Maintenant on va démontrer le théorème fondamental de la caractérisation des com-
pacts dans les espaces métriques.

Théorème 4.2 Soit K un espace métrique. Les conditions suivantes A), B), C), D) sont
équivalentes.
A) K est compact,
B) K est séquentiellement compact,
C) K est dénombrablement compact,
D) K est complet et pour tout ε > 0 il existe un ε-réseau fini de K.

Démonstration
i) Comme la limite d’une suite d’éléments différents d’elle est un point d’accumulation
de cette suite, on a B) ⇒ C).
ii) On a C) ⇒ B) d’après le lemme 4.2.
iii) On a A) ⇒ C) d’après le théorème 4.1.
iv) On va démontrer l’implication B) ⇒ D). On remarque d’abord que, si la condition
B) est remplie, K est complet. En effet, si {xk }∞ k=1 est une suite de Cauchy contenue dans
K, d’après la condition B), sa limite est contenue dans K. Ceci signifie que K est complet.
Maintenant, pour démontrer que pour tout ε > 0 il existe un ε-réseau fini de K, supposons
par absurde que cette dernière condition ne soit pas remplie. Alors pour un certain ε > 0
il n’existe pas de ε-réseau fini de K. C’est-à-dire, si on choisit un x1 ∈ K et un x2 ∈ K de
telle sorte que dist(x1 , x2 ) ≥ ε et encore, si x1 , x2 , · · · , xk−1 sont tels que dist(xk0 , xk00 ) ≥ ε
pour tout k 0 , k 00 ∈ {1, 2, · · · , k − 1}, k 0 6= k 00 , alors on choisit xk ∈ K de telle sorte que
dist(xk0 , xk ) ≥ ε pour tout k 0 ∈ {1, 2, · · · , k −1}, alors en vertu de l’inexistence de ε-réseau

30
fini de K, on pourrait continuer ce choix pour n’importe k. Ainsi on obtiendrait une suite
{xk }∞ 0
k=1 d’éléments de K telle que dist(xk , xk0 ) ≥ ε pour tout k, k ∈ N\{0}, k 6= k.
0

Il est clair que de cette suite on ne peut pas extraire une sous-suite convergente, ce qui
contredit l’hypothèse que la condition B) est remplie. Donc la condition B) doit impliquer
la condition D).
v) Montrons maintenant l’implication D) ⇒ B). Supposons que la condition D)
est vérifiée. Soit {xk }∞ k=1 une suite quelconque d’éléments de K (éléments deux à deux
différents). Considérons une suite de nombres strictement positifs {εn }∞ n=1 décroissante
1
et congergente vers 0, par exemple εn = n . Pour chaque εn il existe, par hypothèse, un
εn -réseau fini. Considérons d’abord un ε1 -réseau fini ; comme les boules de rayon ε1 et
de centre à chaque point de ce réseau recouvre K, au moins une de ces boules, que nous
notons B [1] , contient un nombre infini d’éléments de la suite {xk }∞ k=1 . On en choisit un,
que l’on note xk1 . Considérons maintenant un ε2 -réseau fini ; comme les boules de rayon ε2
et de centre à chaque point de ce réseau recouvre K et donc aussi K ∩ B [1] , au moins une
de ces boules, que nous notons B [2] , contient un nombre infini d’éléments de l’intersection
de la suite {xk }∞ [1]
k=1 et de B . On en choisit un, que l’on note xk2 . En procédant ainsi, on
construit une suite {xkj }∞ 0 [j]
j=1 ; comme pour tout j ≥ j on a xkj 0 ∈ B , B
[j]
étant de rayon
εj , on a dist(xkj0 , xkj00 ) ≤ 2εj pour j , j ≥ j, ce qui signifie que {xkj }∞
0 00
j=1 est une suite
de Cauchy dans l’espace métrique K. Comme K est complet par hypothèse, il existe sa
limite appartenant à K. Ceci signifie que la condition B) est remplie.
vi) Enfin nous démontrons que les conditions B) et D) impliquent la condition A).
Pour ce faire, remarquons d’abord que l’espace qui vérifie la condition D) est séparable.
En effet, si εk , k = 1, 2, · · · , sont strictement positifs et convergent vers 0 et si Mk =
[∞
[k]
{xj }N k
j=1 sont des ε k -réseaux de K, alors l’ensemble M = Mk est dénombrable et
k=1
dense dans K, ce qui signifie que K est séparable.
Soit {Aι }ι∈I un recouvrement ouvert de K. Comme K est séparable, d’après le lemme
4.3 il existe un recouvrement dénombrable {Aιk }∞k=1 qui est une sous-famille de {Aι }ι∈I .
Supposons par absurde qu’il n’existe pas de sous-famille finie de {Aιk }∞
k=1 qui recouvre
[k
K, c’est-à-dire, pour tout k ∈ N\{0} on ait Dk = K\ Aιk0 6= ∅. Choisissons un élément
k0 =1
yk de chaque ensemble non vide Dk . Alors d’après la condition B) il existe une sous-suite
{ykj }∞ ∞
j=1 de {yk }k=1 qui converge vers un élément y de K. Comme Dkj est un ensemble
fermé et que ykj0 ∈ Dkj pour tout j 0 ≥ j, on a y ∈ Dkj , d’où

\
y∈ Dkj .
j=1

Donc, d’après la définition de Dk , on a



\ ∞
\ ∞
[
y∈ Dkj = Dk = K\ Aιk ,
j=1 k=1 k=1

ce qui contredit le fait que {Aιk }∞


k=1 qui recouvre K.
Le théorème est démontré. 

31
5 Structures fondamentales des espaces de Hilbert
5.1 Définition des espaces de Hilbert
Les espaces de Hilbert sont les espaces de Banach munis du produit scalaire. On
commence donc par la définition d’un produit scalaire.
Définition Soit H un espace vectoriel complexe. Une application h·, ·i qui à chaque
couple (x, y) ∈ H × H associe un nombre complexe, que nous notons hx, yiH , est appelée
produit scalaire, si les relations suivantes sont vérifiées :
a) hx, yiH = hy, xiH ∀ x, y ∈ H,
b) hx + y, ziH = hx, ziH + hy, ziH ∀ x, y, z ∈ H,
c) hλx, yiH = λhx, yiH ∀ x, y ∈ H, ∀ λ ∈ C,
d) hx, xiH ≥ 0 ∀x ∈ H et hx, xiH = 0 si et seulement si x = 0.

Remarque 5.1 On a

hx, λyiH = λhx, yiH ∀x, y ∈ H, ∀λ ∈ C.

En effet, d’après a) et c) on a

hx, λyiH = hλy, xiH = λhy, xiH = λ hy, xiH = λhx, yiH .

D’une manière analogue, sur un espace vectoriel réel on peut définir un produit scalaire
qui à chaque couple de ses éléments associe un nombre réel ; la condition a) sera alors
réduite à
a0 ) hx, yiH = hy, xiH ∀ x, y ∈ H.
Quand il n’y a pas de risque d’équivoque, on écrira simplement hx, yi au lieu de hx, yiH
pour désigner le produit scalaire.

Remarque 5.2 Soit H un espace vectoriel muni du produit scalaire h·, ·iH . Alors on a

(5.1) |hx, yiH |2 ≤ hx, xiH hy, yiH ∀x, y ∈ H.

Démonstration Nous écrivons h·, ·i au lieu de h·, ·iH . Si y = 0, alors l’inégalité (5.1) est
vérifiée. Donc, pour compléter la démonstration de (5.1), nous supposons que y 6= 0.
En vertu de d) de la définition du produit scalaire on a pour tout nombre complexe λ

hx + λy, x + λyi ≥ 0.

En développant le premier membre de cette inégalité, on a

hx, xi + λhx, yi + λhy, xi + |λ|2 hy, yi ≥ 0.

En particulier, cette inégalité est vraie pour λ = − hx,yi


hy,yi
. Alors, compte tenu de la relation
λ = − hy,xi
hy,yi
, on a
|hx, yi|2 |hx, yi|2 |hx, yi|2
hx, xi − − + ≥ 0,
hy, yi hy, yi hy, yi
ou
hx, xihy, yi − |hx, yi|2 ≥ 0,
d’où résulte (5.1). 

32
Remarque p 5.3 Soit H un espace vectoriel muni d’un produit scalaire h·, ·iH . Si on pose
kxkH = hx, xiH , l’application k · kH : H → R+ vérifie les axiomes a), b), c) de la
définition de la norme, c’est-à-dire k · kH est une norme.

Démonstration Les propriétés a) et b) de la définition de la norme résultent


immédiatement de d) et c) de la définition du produit scalaire.
D’autre part, d’après b) (et a)) et (5.1), on a

kx + yk2H = hx + y, x + yi = hx, xi + hx, yi + hy, xi + hy, yi ≤

≤ kxk2H + |hx, yi| + |hy, xi| + kyk2H ≤ kxk2H + 2kxkH kykH + kyk2H = (kxkH + kykH )2 ,
d’où l’inégalité triangulaire, c’est-à-dire la propriété c) de la définition de la norme. 

Remarque 5.4 pSoit H un espace vectoriel muni d’un produit scalaire h·, ·iH et de la
norme kxkH = hx, xiH . Si xn → x et yn → y pour n → ∞, alors on a hxn , yn iH →
hx, yiH . C’est-à-dire, l’application
p h·, ·iH de H × H dans C est continue dans la topologie
définie par la norme kxkH = hx, xiH .

Démonstration Comme

hxn , yn i − hx, yi = hxn − x, yn i + hx, yn − yi,

d’après (5.1) on obtient

|hxn , yn i − hx, yi| ≤ |hxn − x, yn i| + |hx, yn − yi| ≤

≤ kxn − xkH kyn kH + kxkH kyn − ykH .


Puisque par hypothèse on a kxn − xkH → 0 et kyn − ykH → 0 et que donc kyn kH est
uniformément bornée, on a
|hxn , yn i − hx, yi| → 0,
ce qui achève la démonstration. 
Une des propriétés les plus importantes du produit scalaire est l’égalité du pa-
rallélogramme. Plus précisément, on a la

Proposition 5.1 Soit H un espace vectoriel muni du produit scalaire h·, ·iH . Alors on
a

(5.2) kx + yk2H + kx − yk2H = 2(kxk2H + kyk2H ).

Démonstration Nous écrivons simplement k · k et h·, ·i au lieu de k · kH et h·, ·iH . On a

kx + yk2 + kx − yk2 = hx + y, x + yi + hx − y, x − yi =

= hx, xi + hx, yi + hy, xi + hy, yi + hx, xi − hx, yi − hy, xi + hy, yi = 2(kxk2 + kyk2 ).

Définition
p Un espace de Banach H muni d’un produit scalaire h·, ·iH et de la norme
kxkH = hx, xiH est appelé espace de Hilbert. On l’appelera espace de Hilbert complexe
(resp. réel), si H est un espace de Banach complexe (resp. réel).

33
Nous citons ici deux exemples fondamentaux d’espaces de Hilbert.
Exemple 1. L’ensemble de suites de nombres complexes

X
{xj }∞ |xj |2 < ∞

l2 = x= j=1 , xj ∈ C
j=1

avec les opérations d’addition et de multiplication par un scalaire naturelles, muni du


produit scalaire

X
hx, yil2 = xj yj
j=1

et de la norme ∞
p X 1/2
kxkl2 = hx, xil2 = |xj |2 ,
j=1

est un espace de Hilbert complexe.


Exemple 2. Soit Ω un ouvert de Rn . L’ensemble
Z
2

|u(x)|2 dx < ∞

L (Ω) = u : Ω → C mesurable

avec les opérations d’addition et de multiplication par un scalaire naturelles, muni du


produit scalaire Z
hu, viL2 (Ω) = u(x)v(x)dx

p
et de la norme kukL2 (Ω) = hu, uiL2 (Ω) , est un espace de Hilbert complexe.
Il est facile de voir qu’on peut construire les espaces de Hilbert réels correspondants
aux exemples 1 et 2, c’est-à-dire l’espace l2 de suites de nombres réels et l’espace L2 (Ω) de
fonctions définies sur Ω à valeurs réels, avec les produits scalaires et les normes analogues.

5.2 Orthogonalité, sous-espace et distance à un ensemble


Le produit scalaire nous permet de définir l’orthogonalité entre deux éléments et même
entre deux ensembles (ou un élément et un ensemble) d’un espace de Hilbert. Nous dirons
en effet que deux éléments x et y d’un espace de Hilbert H sont orthogonaux, si
hx, yiH = 0.

Définition Soit H un espace de Hilbert. Soit M un sous-ensemble de H. On dira


que’un élément x de H est orthogonal à M , si hx, yiH = 0 pour tout y ∈ M .
Soient M et N deux sous-ensembles de H. On dira que les ensembles M et N sont
orthogonaux (l’un à l’autre), si on a
hx, yiH = 0 ∀(x, y) ∈ M × N.

Définition Soit H un espace de Hilbert. Soit M un sous-ensemble de H. L’ensemble


des éléments de H orthogonaux à M est appelé le complémentaire orthogonal de M et
noté M ⊥ . C’est-à-dire
(5.3) M ⊥ = {x ∈ H | hx, yiH = 0 ∀y ∈ M }.

34
Remarque 5.5 Soit H un espace de Hilbert. Soient M et N deux sous-ensembles de H.
Le complémentaire orthogonal M ⊥ est fermé et on a
(5.4) 0 ∈ M ⊥.
Si 0 ∈ M , alors on a
(5.5) M ∩ M ⊥ = {0}.
On a en outre
(5.6) N ⊂ M ⇒ M ⊥ ⊂ N ⊥,

(5.7) ( M )⊥ = M ⊥ ,

(5.8) M ⊂ (M ⊥ )⊥ ,

(5.9) ((M ⊥ )⊥ )⊥ = M ⊥ ,
où M désigne la ferméture de M dans la topologie de H.
Démonstration Nous écrivons simplement h·, ·i au lieu de h·, ·iH . Considérons une suite
de Cauchy {xk }∞
k=1 ⊂ M

et posons
x = lim xk .
k→∞

Alors, quel que soit z ∈ M , on a


hz, xi = lim hz, xk i = 0.
k→∞

C’est-à-dire, M ⊥ est fermé. De plus, il est clair que h0, xi = 0 pour tout x ∈ M . Donc
0 ∈ M ⊥.
Pour démontrer (5.5), on rappelle que 0 ∈ M par hypothèse et 0 ∈ M ⊥ d’après (5.4).
D’autre part, si x ∈ M ∩ M ⊥ , alors x ∈ M ⊥ et x ∈ M et donc hx, xi = 0, ce qui, d’après
la condition d) de la définition du produit scalaire, implique que x = 0. Ainsi (5.5) est
démontrée.
Les relations N ⊂ M et x ∈ M ⊥ impliquent que, quel que soit z ∈ N , on a z ∈ M et
donc hz, xi = 0, ce qui signifie que M ⊥ ⊂ N ⊥ ; (5.6) est vérifiée.
Comme M ⊂ M , la relation (5.6) implique que ( M )⊥ ⊂ M ⊥ . D’autre part,
considérons x ∈ M ⊥ . Si z ∈ M , alors il existe une suite {zk }∞ k=1 telle que zk ∈ M
pour tout k ∈ N\{0} et que zk → z dans H pour k → ∞. On a alors
hz, xi = lim hzk , xi = 0
k→∞

et donc, compte tenu que z ∈ M est arbitraire, on a x ∈ (M )⊥ . On en déduit (5.7).


Par la définition de M ⊥ on a
y ∈ M ⇒ hy, xi = 0 ∀x ∈ M ⊥ ;
cette relation signifie, d’après la définition de (M ⊥ )⊥ , que y ∈ (M ⊥ )⊥ , c’est-à-dire (5.8)
est vérifiée.
Enfin, en appliquant (5.6) aux ensembles M et (M ⊥ )⊥ , qui vérifient (5.8), on ob-
tient ((M ⊥ )⊥ )⊥ ⊂ M ⊥ . D’autre part, en appliquant (5.8) à l’ensemble M ⊥ , on a
M ⊥ ⊂ ((M ⊥ )⊥ )⊥ . On en déduit (5.9). 

35
Lemme 5.1 Soit H un espace de Hilbert ; soit M un sous-ensemble de H. Le
complémentaire orthogonal M ⊥ de M est un sous-espace (c’est-à-dire, une variété linéaire
fermée) de H.

Démonstration Soient x et y deux éléments de M ⊥ . Alors, quels que soient z ∈ M et


λ, µ ∈ C, on a

hz, λx + µyi = hz, λxi + hz, µyi = λhz, xi + µhz, yi = 0.

Cela signifie que λx + µy ∈ M ⊥ . On en déduit que M ⊥ est une variété linéaire.


D’autre part, comme on l’a vu dans la remarque précédente, M ⊥ est fermé. Donc, on
peut conclure que M ⊥ est un sous-espace de H. 
Rappelons que dans (3.7) nous avons défini la distance d’un point à un ensemble.
Comme dans un espace normé la distance est exprimée par la norme de la différence entre
deux éléments, la distance d’un point à un ensemble est exprimée par

dist(x, M ) = inf kx − yk.


y∈M

Dans le lemme 3.1 on a montré que, si un point x n’appartient pas à un sous-espace


L, la distance de x à L est strictement positive. Le lemme 3.1 peut être étendu au cas
où L n’est pas nécessairement une variété linéaire, mais simplement un ensemble fermé.
En effet on voit aisément que le même raisonnement peut être appliqué au cas où L est
simplement un ensemble fermé. Pour la distance d’un point à un ensemble fermé on a
aussi la propriété suivante.

Proposition 5.2 Soit H un espace normé. Soit M un sous-ensemble fermé et convexe


de H. Si x ∈ H\M , alors il existe un élément y ∈ M et un seul tel que

dist(x, M ) = kx − yk.

Démonstration Comme on l’a mentionné ci-dessus, on a dist(x, M ) > 0. Par la


définition de la distance, il existe pour tout k ∈ N\{0} un élément yk de M tel que
1
dist(x, M ) ≤ kx − yk kH ≤ dist(x, M ) + .
k
Montrons maintenant que {yk }∞ k=1 est une suite de Cauchy. En effet, en vertu de
l’égalité du parallélogramme (5.2) on a

2kx − yk k2H + 2kx − yk0 k2H = kyk − yk0 k2H + k2x − (yk + yk0 )k2H .

On remarque que, M étant convexe, on a


yk + yk0
∈ M.
2
Il en résulte que
yk + yk0 2
k2x − (yk + yk0 )k2H = 4kx − kH ≥ 4(dist(x, M ))2 .
2
D’autre part, par l’hypothèse sur yn on a
1 2 1 2
kx − yk k2H ≤ dist(x, M ) + , kx − yk0 k2H ≤ dist(x, M ) + .
k k0

36
Il s’ensuit

kyk − yk0 k2H = 2kx − yk k2H + 2kx − yk0 k2H − k2x − (yk + yk0 )k2H ≤
1 2 1 2
≤ 2 dist(x, M ) + + 2 dist(x, M ) + 0 − 4dist(x, M )2 =
k k
1 1  1 1 
= 4dist(x, M ) + 0 + 2 2 + 02 .
k k k k
Comme le dernier membre 4dist(x, M ) k + k0 + 2 k2 + k0 2 tend vers 0 pour k, k 0 → ∞,
1 1 1 1
 

{yk }∞k=1 est une suite de Cauchy.


Comme M est un ensemble fermé par hypothèse, la suite {yk }∞ k=1 converge vers un
élément y appartenant à M . En passant à la limite dans l’inégalité
1
dist(x, M ) ≤ kx − yk kH ≤ dist(x, M ) + ,
k
on a
kx − ykH = dist(x, M ).
Reste à démontrer l’unicité de cet élément y. Pour cela, supposons que pour un y ∗ ∈ M
est valable l’égalité
kx − y ∗ kH = dist(x, M ).
En vertu de l’égalité du parallélogramme (5.2) on a

y + y∗ 2
4dist(x, M )2 = 2kx − yk2H + 2kx − y ∗ k2H = ky − y ∗ k2H + 4kx − kH .
2
y+y ∗
Comme 2
∈ M en vertu de la convexité de M , on a

y + y∗ 2
kx − kH ≥ dist(x, M )2 .
2
Il en résulte que
4dist(x, M )2 ≥ ky − y ∗ k2H + 4dist(x, M )2 ,
ce qui implique que ky − y ∗ k = 0, ou y = y ∗ . La proposition est démontrée. 
Comme un sous-espace d’un espace de Hilbert est convexe et fermé, le corollaire suivant
résulte de la proposition 5.2.

Corollaire 5.1 Soit H un espace de Hilbert. Soit L un sous-espace de H. Soit x ∈ H.


Alors il existe et est unique l’élément y de L tel que

kx − ykH = dist(x, L).

Démontrons maintenant les théorèmes suivants.

Théorème 5.1 Soit H un espace de Hilbert. Soit L un sous-espace de H. Soit x ∈ H.


Si y ∈ L et si kx − ykH = dist(x, L), alors x − y est orthogonal à L, c’est-à-dire on a

hx − y, zi = 0 ∀z ∈ L.

37
Démonstration Si z = 0 (z ∈ L), alors on a hx − y, zi = 0. Donc nous supposons que
z ∈ L et z 6= 0 et nous allons démontrer l’égalité hx − y, zi = 0.
Alors, quel que soit λ ∈ C, on a y − λz ∈ L. On a donc

kx − (y − λz)kH ≥ dist(x, L) = kx − ykH ,

ou
hx − y + λz, x − y + λzi ≥ hx − y, x − yi,
ou encore
λhz, x − yi + λ hx − y, zi + λ λ kzk2H ≥ 0.
Puisque cette inégalité doit être vérifiée pour quelconque λ ∈ C, elle doit être valable
aussi pour le choix particulier
hx − y, zi
λ=− .
kzk2H
En substituant cette expression de λ dans l’inégalité précédente, on obtient
|hx − y, zi|2
− ≥ 0.
kzk2H
Pour qu’elle soit vérifiée, il faut que l’on ait

hx − y, zi = 0,

ce qui achève la démonstration. 

Théorème 5.2 Soit H un espace de Hilbert. Soit L un sous-espace de H. Soit x ∈ H.


Alors il existe un u ∈ L et un seul et un v ∈ L⊥ et un seul tels que

x = u + v.

Démonstration L’existence de u ∈ L et de v ∈ L⊥ tels que x = u + v résulte du


théorème 5.1.
Pour démontrer l’unicité de u et de v, supposons qu’il y a u, u∗ ∈ L et v, v ∗ ∈ L⊥ tels
que x = u + v = u∗ + v ∗ . On a alors

0 = hx − x, x − xi = hu − u∗ + v − v ∗ , u − u∗ + v − v ∗ i =

= ku − u∗ k2H + kv − v ∗ k2H + hu − u∗ , v − v ∗ i + hv − v ∗ , u − u∗ i.
Comme u, u∗ ∈ L, on a u − u∗ ∈ L. Analoguement, comme v, v ∗ ∈ L⊥ , on a v − v ∗ ∈ L⊥ .
Par conséquent, on a

hu − u∗ , v − v ∗ i = hv − v ∗ , u − u∗ i = 0.

On a donc
0 = ku − u∗ k2H + kv − v ∗ k2H ,
ce qui implique que u = u∗ et v = v ∗ . Le théorème est démontré. 

Remarque 5.6 Soit H un espace de Hilbert. Soit L un sous-espace de H. Soit x ∈ H.


Si x = u + v, u ∈ L, v ∈ L⊥ , alors on a

(5.10) kxk2H = kuk2H + kvk2H .

38
Démonstration On a

kxk2H = hx, xi = hu + v, u + vi = kuk2H + kvk2H + hu, vi + hv, ui.

Mais, comme u ∈ L et v ∈ L⊥ , on a

hu, vi = hv, ui = 0.

On en déduit (5.10). 
Rappelons que pour un x ∈ H le corollaire 5.1 nous donne l’unique point y sur un
sous-espace L tel que kx − ykH = dist(x, L) et x − y ∈ L⊥ . Ceci nous permet de définir
la projection orthogonale de x sur L, que nous noterons

y = PL x.

Les projections orthogonales joueront des rôles importants dans l’Analyse fonctionnelle.

5.3 Systèmes orthogonaux


Dans cette partie nous nous limitons à considérer les espaces de Hilbert séparables,
donc de dimension finie ou dénombrable. L’espace de Hilbert que nous considérons sera
noté H.

Définition On dira qu’un ensemble {xk }N k=1 ou {xk }k=1 est un système orthogonal,
si pour tout k on a xk 6= 0 et hxk , xk0 i = 0 pour k 6= k 0 .
À titre d’exemple, considérons l’espace H = Cn (n ≥ 2) et deux vecteurs u =
(α, 0, 0, · · · , 0) et v = (0, β, 0, · · · , 0), où α et β sont deux nombres complexes différents
de 0. Il est clair que hu, vi = 0 et donc l’ensemble {u, v} est un système orthogonal. Mais
si on définit

η = (cos ϑ α, sin ϑ α, 0, · · · , 0), ζ = (− sin ϑ β, cos ϑ β, 0, · · · , 0), ϑ ∈ R,

on a

hη, ζi = cos ϑ α(− sin ϑ β) + sin ϑ α(cos ϑ β) = αβ(− cos ϑ sin ϑ + sin ϑ cos ϑ) = 0.

Donc l’ensemble {η, ζ} est lui aussi un système orthogonal. Il est bon de rappeler que
{η, ζ} est obtenu de {u, v} par la rotation de ϑ.

Définition L’ensemble {ek }N
k=1 ou {ek }k=1 est appelé système orthonormal (ou
système orthonormé), si on a

(5.11) hek , ek0 i = δkk0 pour tout k, k 0 ,

où δkk0 est le symbole de Kronecker (δkk0 = 1 si k = k 0 et δkk0 = 0 si k 6= k 0 ).


On remarque que la relation (5.11) implique que kek kH = 1. En effet, on a

kek k2H = hek , ek i = δkk = 1.



On voit aisément que, si {xk }N N
k=1 ou {xk }k=1 est un système orthogonal, alors {ek }k=1
x
ou {ek }∞
k=1 avec ek = kxk kH est un système orthonormal. En effet, on a
k

xk xk 0 1
hek , ek0 i = h , i= hxk , xk0 i,
kxk kH kxk0 kH kxk kH kxk0 kH

39
d’où on obtient la relation (5.11).
À titre d’exemple, nous considérons l’espace de Hilbert l2 (que nous avons vu dans
l’exemple 1 d’espace de Hilbert). Soit J ⊂ N\{0}. On pose
[k] [k]
ek = {zj }∞
j=1 , zj = δjk eiϑk , ϑk ∈ R.

Alors l’ensemble {ek }k∈J est un système orthonormal. En effet, on a



[k] [k0 ] [k] [k0 ]
X
hek , ek0 i = zj zj = δkk0 zk zk0 = δkk0 eiϑk e−iϑk0 = δkk0 .
j=1

Une des propriétés fondamentales des systèmes orthonormaux est la suivante.

Théorème 5.3 Soit {ek }∞k=1 un système orthonormal d’un espace de Hilbert H. Alors,
quel que soit x ∈ H, on a

X
(5.12) |hx, ek i|2 ≤ kxk2H .
k=1

L’inégalité (5.12) est appelée l’inégalité de Bessel.


Pour démontrer le théorème 5.3, commençons par le lemme suivant.

Lemme 5.2 Soit Ln le sous-espace engendré par {e1 , · · · , en }. Soit x ∈ H. Alors on a


n
X
(5.13) dist(x, Ln ) = dist(x, hx, ek iek ),
k=1

n
X
(5.14) (dist(x, Ln ))2 = kxk2H − |hx, ek i|2 .
k=1

Démonstration Rappelons d’abord la définition de la distance de x à Ln :

dist(x, Ln ) = inf kx − ykH .


y∈Ln

Or, y ∈ Ln peut être exprimé dans la forme


n
X
y= αk ek ,
k=1

où αk , k = 1, · · · , n, sont des nombres complexes. On a donc


n
X n
X
kx − yk2H = hx − y, x − yi = hx − αk ek , x − αk ek i =
k=1 k=1

n
X n
X n X
X n
= kxk2H − hx, αk ek i − hαk ek , xi + hαk ek , αk0 ek0 i =
k=1 k=1 k=1 k0 =1
n
X n
X n
X
= kxk2H − αk hx, ek i − αk hek , xi + |αk |2 =
k=1 k=1 k=1

40
n
X
kxk2H − αk hx, ek i − αk hek , xi + |αk |2 .

= +
k=1

On remarque que

|hx, ek i − αk |2 = |hx, ek i|2 − hx, ek iαk − hek , xiαk + |αk |2 ,

ou
−αk hx, ek i − αk hek , xi + |αk |2 = |hx, ek i − αk |2 − |hx, ek i|2 .
En substituant cette expression dans le dernier membre de la chaı̂ne d’égalités précédente,
on a n n
X X
2 2 2
kx − ykH = kxkH − |hx, ek i| + |hx, ek i − αk |2 .
k=1 k=1

Il est clair que


h n
X n
X i
2 2
minn kxkH − |hx, ek i| + |hx, ek i − αk |2 (α = (α1 , · · · , αn ))
α∈C
k=1 k=1

est réalisé par


αk = hx, ek i pour k = 1, · · · , n.
En rappelant la définition de la distance dist(x, Ln ), on en déduit (5.13) et (5.14). 
Démonstration du théorème 5.3 Comme la série partielle nk=1 |hx, ek i|2 ne peut être
P
que croissante par rapport à n, de (5.14) on déduit que la suite {kxk2H − nk=1 |hx, ek i|2 }∞
P
n=1
est décroissante et bornée inférieurement par 0 (parce que (dist(x, Ln ))2 ≥ 0). Donc, en
passant à la limite dans l’inégalité
n
X
kxk2H − |hx, ek i|2 ≥ 0,
k=1

on obtient l’inégalité de Bessel (5.12). 

5.4 Base orthonormale


La base orthonormale est une des notions les plus importantes concernant les espaces
de Hilbert (ici nous nous limitons aux espaces de Hilbert séparables). Rappelons d’abord
sa définition.
Définition Soit H un espace (complexe ou réel) séparable. Un système orthonormal
{ek }∞
k=1 est appelé base orthonormale, s’il est complet, c’est-à-dire, si tout élément x ∈ H
peut avoir la forme

X
(5.15) x= ck ek , ck = hx, ek i.
k=1

Remarque 5.7 Soit H un espace (complexe ou réel) séparable. Un système orthonormal


{ek }∞
k=1 est une base orthonormale, si et seulement si pour tout élément x ∈ H on a


X
(5.16) kxk2H = |hx, ek i|2 .
k=1

41
Démonstration Ceci résulte immédiatement du lemme 5.2 et de la définition de la base
orthonormale.
L’égalité (5.16) est appelée l’égalité de Parseval.
Il est bon de rappeler que les bases orthonormales ne sont pas uniques.
Le théorème suivant donne une caractérisation importante d’une base orthonormale.

Théorème 5.4 Soit H un espace (complexe ou réel) séparable. Un système orthonor-


mal {ek }∞ k=1 est une base orthonormale, si et seulement si l’ensemble des combinaisons
linéaires de ek , k = 1, 2, · · · , est dense dans H.

Démonstration Supposons d’abord que {ek }∞ k=1 est une base orthonormale de H.
Désignons par L l’ensemble des combinaisons linéaires de ek , k = 1, 2, · · · , et par L
sa ferméture. Comme L est un sous-espace, s’il existait un élément x ∈ H\L, alors
d’après le corollaire 5.1 et le théorème 5.1 il existerait un élément y ∈ L tel que
kx − yk = dist(x, L) > 0 et que x − y ∈ (L)⊥ . Alors on aurait

hx − y, ek i = 0 pour tout k ∈ N\{0}.

Mais, comme {ek }∞


k=1 est une base orthonormale, on aurait

X
x−y = ck ek
k=1

avec ck = 0 pour tout k ∈ N\{0} et donc kx − ykH = 0, ce qui contredit kx − yk =


dist(x, L) > 0. Donc L = H.
Supposons maintenant que L est dense dans H. Soit x ∈ H. Alors pour tout n ≥ 1 il
existe un élément xn ∈ L tel que kx − xn kH ≤ n1 . On voit aisément que xn , n = 1, 2, · · · ,
constituent une suite de Cauchy et xn convergent vers x. D’autre part, on a
∞ 1
X 1 2
kxn − xm k2H = |hxn − xm , ek i| ≤ 2
+ ,
k=1
n m

d’où on déduit que hxn , ek i constituent eux aussi une suite de Cauchy (par rapport à n) et
donc il existe la limite ck vers laquelle hxn , ek i convergent ; de plus l’inégalité précédente
implique que hxn , ek i convergent uniformément (par rapport à n) vers ck . Or, comme xn
convergent vers x, on a ck = hx, ek i. On a donc

X ∞
X ∞
X
xn = hxn , ek iek → ck ek = hx, ek iek = x.
k=1 k=1 k=1

On en déduit que {ek }∞


k=1 est une base orthonormale de H. 

Maintenant nous voulons montrer que tout espace de Hilbert séparable admet une
base orthonormale. Pour ce faire, rappelons qu’un espace de Hilbert (complexe ou réel)
sṕarable par définition admet un ensemble dénombrable {xk }∞ k=1 dense dans H. Il n’est
pas difficile d’extraire de {xk }∞ k=1 un ensemble dénombrable {x ∞
kj }j=1 tel que tout sous-
ensemble fini de {xkj }∞ j=1 est linéairement indépendant et que l’ensemble des combinaisons
linéaires d’éléments de {xkj }∞ ∞
j=1 coı̈ncide avec celui de {xkj }j=1 . En effet, il suffit d’éliminer
les éléments xk qui sontPdes combinaisons linéaires d’éléments précédents (c’est-à-dire, xk
k−1
qui ont la forme xk = j=1 αj xj ).
Cela étant, nous citons la proposition suivante.

42
Proposition 5.3 Soit {xk }∞ k=1 une famille libre d’éléments de H, c’est-à-dire un en-
semble d’éléments de H tel que pour tout n ∈ N les éléments x1 , · · · , xn sont linéairement
indépendants. Alors il existe un système orthonormal {ek }∞ k=1 tel que l’ensemble des com-
binaisons linéaires de ses éléments ek coı̈ncide avec l’ensemble des combinaisons linéaires
d’éléments xk .

Démonstration Construisons d’abord un système orthogonal {yk }∞ k=1 ayant le même



ensemble des combinaisons linéaires que {xk }k=1 . Posons d’abord y1 = x1 . Puis cherchons
y2 ayany la forme y2 = x2 − λ21 y1 avec la propriété hy2 , y1 i = 0. On aura donc hx2 −
λ21 y1 , y1 i = 0 ou hx2 , y1 i = λ21 hy1 , y1 i, d’où λ21 = hx 2 ,y1 i
hy1 ,y1 i
. On a donc construit y2 =
x2 −λ21 y1 = x2 − hx2 ,y1 i
y . Remarquons que y2 ne peut être 0, car x2 et y1 sont linéairement
hy1 ,y1 i 1
indépendants.
Raisonnons ensuite par récurrence. Supposons que les éléments y1 , · · · , yk−1 sont déjà
construits. Nous cherchons yk ayant la forme
k−1
X
y k = xk − λkj yj
j=1

avec la propriété hyk , yj i = 0 pour j = 1, · · · , k − 1. De ces équations on obtient λkj =


hxk ,yj i
hyj ,yj i
, j = 1, · · · , k − 1. Pour yk aussi on a yk 6= 0 en vertu de l’indépendance linéaire
de xk , y1 , · · · , yk−1 . Ainsi on contruit le système orthogonal {yk }∞
k=1 . De la construction

de {yk }k=1 il résulte qu’un élément x ∈ H est une combinaison linéaire de {xk } si et
seulement s’il est une combinaison linéaire de {yk }.
yk
Un système orthogonal {yk }∞ k=1 étant construit, en posant ek = kyk kH , on aura un
système orthonormal ayant l’ensemble des combinaisons linéaires de ses éléments identique
à l’ensemble des combinaisons linéaires d’éléments xk . La proposition est démontrée. 
La proposition 5.3 étant démontrée, en rappelant que d’un ensemble dénombrable on
peut extraire un sous-ensemble dénombrable libre ayant la même l’ensemble des combi-
naisons linéaires, on obtient le résultat suivant.

Corollaire 5.2 Soit H un espace de Hilbert (complexe ou réel). Si H est séparable, H


admet une base orthonormale. 

5.5 Série de Fourier


Considérons un espace de Hilbert complexe séparable H et une base orthonormale
{ek }∞
k=1 . On rappelle l’égalité de Parseval


X
(5.16) kuk2H = |hu, ek i|2 ∀u ∈ H.
k=1

On a en outre

X
(5.17) u= hu, ek iek ∀u ∈ H
k=1

(dans (5.16) et (5.17) hu, ek i = hu, ek iH ). Par analogie à la série de Fourier classique que
nous allons voir dans la suite, on appelle souvent l’expression du second membre de (5.17)
la série de Fourier de u (dans l’espace de Hilbert H) et hu, ek i les coefficients de Fourier

43
de u. Il est clair que l’on peut définir d’une manière analogue la série de Fourier dans un
espace de Hilbert réel séparable.
Il est clair que dans les espaces de Hilbert séparables la formulation de la série de
Fourier donnée dans (5.17) est valable par rapport à une base orthonormale quelconque.
Toutefois, pour les applications certaines bases orthonormales sont particulièrement utiles,
comme nous allons le voir dans la suite.

5.6 Série de Fourier classique


Historiquement la série de Fourier est développée comme représentation d’une fonction
périodique par une série de fonctions trigonomériques. Même aujoud’hui la dénomination
“série de Fourier ” est souvent utilisée pour désigner cette représentation d’une fonction
par la série de fonctions trigonomériques ou, quand il s’agit des fonctions à valeurs com-
plexes, représentation par la série sur la base des fonctions eikx (k ∈ Z).
Commençons par une remarque sur l’orthogonalité des fonctions eikx et des fonctions
trigonométriques. En effet, si on considère l’espace de Hilbert
Z 2π
2
L (0, 2π; C) = { ϕ : ]0, 2π[ → C mesurable | |ϕ(x)|2 dx < ∞ }
0

muni du produit scalaire Z 2π


hϕ, ψi = ϕ(x)ψ(x)dx
0
et de la norme
p Z 2π
kϕkL( 0,2π;C) = hϕ, ϕi = |ϕ(x)|2 dx,
0
alors on a
Z 2π Z 2π Z 2π
ikx ik0 x ikx −ik0 x 0
he ,e i= eikx eik0 x dx = e e dx = ei(k−k )x dx = 2δkk0 π,
0 0 0

ce qui signifie que la famille de fonction {eikx }k∈Z est un système orthogonal dans
L2 (0, 2π; C). On voit aisément que, si on pose
1
(5.18) ek (x) = √ eikx ,
2

la famille de fonctions {ek }k∈Z est un système orthonormal dans L2 (0, 2π; C).
Pour l’espace de Hilbert réel L2 (0, 2π; R) on remarque d’abord qu’on a
Z 2π Z π
(5.19) cos kx dx = sin kx dx = 0 ∀k ∈ N\{0},
0 −π

mais aussi
Z 2π Z π
2
(5.20) (cos kx) dx = (sin kx)2 dx = π ∀k ∈ N\{0},
0 −π

Z 2π Z π
(5.21) cos kx cos mx dx = sin kx sin mx dx = 0 ∀k, m ∈ N\{0}, k 6= m,
0 −π

44
Z 2π
(5.22) cos kx sin mx dx = 0 ∀k, m ∈ N\{0} (y compris le cas k = m).
0

Pour nous convaincre des égalités (5.20)–(5.22) il suffit de rappeler les relations
1 
cos kx cos mx = cos(k − m)x + cos(k + m)x ,
2
1 
sin kx sin mx = cos(k − m)x − cos(k + m)x ,
2
1 
cos kx sin mx = sin(k + m)x − sin(k − m)x .
2
Des relations (5.19)–(5.22), jointes à l’égalité triviale
Z 2π 
1 2
√ dx = 1,
0 2π
on déduit que les fonctions
1 1 1
(5.23) √ , √ cos kx, k ∈ N\{0}, √ sin kx, k ∈ N\{0},
2π π π

constituent un système orthonormal dans l’espace de Hilbert réel L2 (0, 2π; R).
En réalité, les fonctions données dans (5.18) et les fonctions données dans (5.23)
forment, non seulement un système orthonormal, mais aussi une base orthonormale res-
pectivement dans L2 (0, 2π; C) et dans L2 (0, 2π; R). Pour le démontrer, il faut montrer que
ces systèmes sont complets dans l’espace de Hilbert respectif.
Nous citons une démonstration de la compétude du système de fonctions donné
dans (5.23). Pour cela nous définissons d’abord les coefficients de Fourier. Soit f (·) ∈
L2 (0, 2π; R). On pose
Z 2π
1
(5.24) a0 = f (x)dx,
2π 0

Z 2π
1
(5.25) ak = f (x) cos kx dx,
π 0

Z 2π
1
(5.26) bk = f (x) sin kx dx.
π 0

Les nombres a0 , ak , bk ainsi définis sont appelés les coefficients de Fourier de f (x). [Ici
nous avons supposé que f (·) ∈ L2 (0, 2π; R), mais on voit aisément que même pour les
fonctions f (·) ∈ L1 (0, 2π; R) les coefficients de Fourier sont bien définis.]
Pour démontrer la complétude du système de fonctions donné dans (5.23), la proposi-
tion suivante (due à Lebesgue) est cruciale.

Proposition 5.4 Si deux fonctions f1 (x) et f2 (x) appartenant à L1 (0, 2π) ont les mêmes
coefficients de Fourier a0 , ak , bk (k ∈ N\{0}), alors f1 (x) = f2 (x) presque partout dans
[0, 2π].

45
Démonstration Nous posons

f (x) = f1 (x) − f2 (x).

Alors il est clair que les coefficients de Fourier de f (x) sont tous nuls.
Supposons par absurde que f (x) 6= 0 sur un ensemble de mesure strictement positive.
Examinons d’abord le cas où f (x) est continue. Si f (x) est continue et f (x) 6≡ 0, alors il
existe un nombre γ > 0 et un intervalle [a, b] (0 ≤ a < b ≤ 2π) tels que

f (x) ≥ γ ∀x ∈ [a, b], ou f (x) ≤ −γ ∀x ∈ [a, b].

Comme dans les deux cas le raisonnement sera substantiellement identique, nous exami-
nons seulement le cas où f (x) ≥ γ pour tout x ∈ [a, b].
Rappelons que
Z 2π Z 2π Z 2π
f (x)dx = f (x) cos kx dx = f (x) sin kx dx = 0 (k ∈ N\{0}.
0 0 0

Il n’est pas difficile d’en déduire que, si on pose


a+b a−b
ψ(x) = 1 + cos(x − ) − cos ,
2 2
quel que soit n ∈ N, (ψ(x))n pourra être exprimée par une somme de fonctions trigo-
nométriques cos kx et sin kx multipliées par des constantes, ce qui implique que
Z π
(ψ(x))n f (x)dx = 0.
−π

On remarque que

ψ(x) ≥ 1 pour x ∈ [a, b], |ψ(x)| ≤ 1 pour x ∈ [−π, π]\[a, b],

et qu’il existe un nombre δ > 0 et un intervalle [a0 , b0 ] ⊂ [a, b] (a0 < b0 ) tels que

ψ(x) ≥ 1 + δ pour x ∈ [a0 , b0 ].

On considère les intégrales


Z b Z
In = (ψ(x))n f (x)dx, Jn = (ψ(x))n f (x)dx.
a [0,2π]\[a,b]

En vertu des propriétés citées ci-dessus, on aurait

In ≥ γ((b − a) − (b0 − a0 )) + γ(b0 − a0 )(1 + δ)n → ∞ pour n → ∞.

D’autre part, comme |ψ(x)| ≤ 1 pour x ∈ [−π, π]\[a, b], on aurait

|Jn | ≤ (2π − (b − a)) sup |f (x)| ∀n ∈ N\{0}.


−π≤x≤π

Ces deux relations conduisent une contradiction, car


Z 2π
In + Jn = (ψ(x))n f (x)dx = 0.
0

46
Donc f (x) = 0 pour tout x ∈ [0, 2π].
Maintenant nous admettons seulement que f (x) appartient à L1 (0, 2π) (et que ses
coefficients de Fourier sont tous nuls). Posons
Z x
F (x) = f (x0 )dx0 (x ∈ [0, 2π]).
0
R 2π
Comme 0
f (x)dx = 0, on a F (2π) = 0. On a en outre
Z 2π Z 2π
 2π
0= f (x) cos kx dx = F (x) cos kx 0 + k F (x) sin kx dx =
0 0
Z 2π
=k F (x) sin kx dx,
0
Z 2π  2π
Z 2π
0= f (x) sin kx dx = F (x) sin kx 0 − k F (x) cos kx dx =
0 0
Z 2π
= −k F (x) cos kx dx.
0
1
R 2π
De la sorte, si on pose C = 2π 0
F (x)dx, tous les coefficients de Fourier de la fonction
F (x) − C seront nuls. Comme F (x) est continue, d’après ce que nous avons vu en haut,
on a F (x) − C = 0. Comme F (0) = 0, on a C = 0, c’est-à-dire, F (x) = 0 pour tout
x ∈ [0, 2π]. Donc
d
f (x) = F (x) = 0
dx
presque partout dans [0, 2π]. La proposition est démontrée. 
Comme une fonction appartenant à L2 (0, 2π; R) appartient aussi à L1 (0, 2π; R), la
proposition 5.4 implique que, si deux fonctions f1 (x) et f2 (x) appartenant à L2 (0, 2π; R)
ont les mêmes coefficients de Fourier a0 , ak , bk (k ∈ N\{0}), alors f1 (x) = f2 (x) presque
partout dans [0, 2π]. On en déduit le corllaire suivant.

Corollaire 5.3 Le système orthonormal


1 1 1
√ , √ cos kx, k ∈ N\{0}, √ sin kx, k ∈ N\{0},
2π π π
est complet dans l’espace de Hilbert réel L2 (0, 2π; R).

Le corollaire 5.3 étant démontré, nous pouvons définir la série de Fourier sur la base
donnée dans le corollaire 5.3. Soit f ∈ L2 (0, 2π; R). Soient a0 , ak , bk les coefficients de
Fourier de f (définis dans (5.24)–(5.26)). En tant qu’éléments de l’espace de Hilbert
L2 (0, 2π; R), on a

X
f (x) = a0 + (ak cos 2πkx + bk sin 2πkx);
k=1
cette égalité doit être conçue comme égalité entre deux éléments de l’espace de Hilbert
L2 (0, 2π; R) (ce qui impliquera que l’égalité est valable presque partout dans [0, 2π]), mais
pas nécessairement comme égalité ponctuelle pour tout x ∈ [0, 2π]. Pour cette raison on
écrit souvent

X
(5.27) f (x) ∼ a0 + (ak cos kx + bk sin kx).
k=1

47
La dénomination “série de Fourier ” était attribuée originellement au deuxième membre
de (5.27) et son utilisation pour indiquer la formule (5.17) est plutôt récente. Il est bon
de rappeler que même aujourd’hui dans beaucoup de textes la dénomination “série de
Fourier ” est urilisée pour indiquer le deuxième membre de (5.27).
Il est clair que, au lieu de L2 (0, 2π; R) et des fonctions √12π , √1π cos kx, √1π sin kx,
k ∈ N\{0}, on peut considérer l’espace de Hilbert L2 (0, T ; R) avec quelconque constante
T > 0 et les fonctions
√ √
1 2 2π 2 2π
√ , √ cos( kx), √ sin( kx), k = 1, 2, · · · ,
T T T T T
de sorte que ces fonctions constituent une base orthonormale de L2 (0, T ; R) et qu’on
définit la série de Fourier
∞  √ √
X 2 2π 2 2π 
f (x) ∼ a0 + ak √ cos( kx) + bk √ sin( kx)
k=1
T T T T
avec √
Z T Z 1
1 2 2π
a0 = √ f (x)dx, ak = 2 f (x) √ cos( kx) dx,
0 T 0 T T
Z 1

2 2π
bk = 2 f (x) √ sin( kx) dx.
0 T T

Dans le cas de l’espace de Hilbert complexe L2 (0, 2π; C), les relations

eikx + e−ikx eikx − e−ikx


eikx = cos kx + i sin kx = +
2 2
e ikx
nous permettront de déduire du corollaire 5.3 que le système { √ }
2π k∈Z
est une base
2
orthonormale de l’espace de Hilbert complexe L (0, 2π; C).
Cela étant, si on pose ek (x) = √12π eikx et
Z 2π
1
(5.28) ck = hf, ek i = √ f (x)e−ikx dx,
2π 0

on peut définir la série de Fourier


X 1
(5.29) f (x) ∼ ck √ eikx .
k∈Z

5.7 Quelques applications de la série de Fourier


Dans la suite nous allons illustrer deux exemples plutôt simples d’applications de la
série de Fourier. Dans le premier exemple, on va considérer le cas complexe avec l’espace
eikx
de Hilbert L2 (R/2π; C) et sa base orthonormale { √ } . Dans le deuxième exemple, on
2π k∈Z
va voir l’équation de la chaleur où on utilise la série de Fourier formulée dans (5.27) sur
la base des fonctions trigonomériques.
Rappelons d’abord la propriété bien connue des fonctions trigonométriques et des
fonctions eikx , c’est-à-dire
d2 d2
(5.30) 2
cos kx = −k 2 cos kx, 2
sin kx = −k 2 sin kx, k ∈ N,
dx dx

48
d2 ikx
(5.31) 2
e = −k 2 eikx , k ∈ Z.
dx

Exemple 1. Soit f ∈ L2 (R/2π; C) R 2π(les fonctions définies sur R/2π sont des fonctions
périodiques de période 2π) telle que 0 f (x)dx = 0. On va chercher la solution u(x) de
l’équation
d2
(5.32) u(x) = f (x) dans R/2π
dx2
avec la condition
Z 2π
(5.33) u(x)dx = C,
0

C étant une constante (nombre complexe).


Comme f ∈ L2 (R/2π; C), d’après (5.29) (voir aussi (5.28)), on peut écrire
X 1
f (x) = ck (f ) √ eikx
k∈Z

(ici l’égalité est dans le sens de L2 (R/2π; C)) avec


Z 2π
1
ck (f ) = √ f (x)e−ikx dx, c0 (f ) = 0.
2π 0
D’après l’égalité de Parseval (5.16), on a
X
(5.34) |ck (f )|2 = kf k2L2 (R/2π) < ∞.
k∈Z

Nous cherchons la solution u dans L2 (R/2π; C), ce qui nous permet d’écrire
X 1
u(x) = ck (u) √ eikx
k∈Z

avec Z 2π
1
ck (u) = √ u(x)e−ikx dx.
2π 0
d2
Si on applique la dérivée seconde dx2
à chaque terme ck (u) √12π eikx , on a, d’après (5.31),

d2 1 1
2
(ck (u) √ eikx ) = −k 2 ck (u) √ eikx .
dx 2π 2π
Donc, au moins formellement, on a
d2 d2 h X 1 ikx i X 1
2
u(x) = 2
c k (u) √ e = − k 2 ck (u) √ eikx
dx dx k∈Z 2π k∈Z

(on montrera dans la suite la convergence de cette série).


d2
Ces représentations de f (x) et de dx 2 u(x) nous permettent d’écrire l’équation (5.32)

dans la forme
X 1 X 1
(5.35) − k 2 ck (u) √ eikx = ck (f ) √ eikx .
k∈Z
2π k∈Z

49
e ikx
Comme { √ }
2π k∈Z
est une base orthonormale de L2 (R/2π; C), en faisant le produit scalaire
0
e√ik x
des deux membres de (5.35) avec 2π
, on obtient

−k 2 ck (u) = ck (f ),

d’où
1
ck (u) = − 2 ck (f ) pour k ∈ Z\{0}.
k
R 2π
Pour le cas k = 0, la condition 0 f (x)dx = 0 nous donne c0 (f ) = 0. Donc l’équation
−k 2 ck (u) = ck (f ) pour k = 0 n’est pas contradictoire, mais elle ne détermine pas c0 (u).
Mais la condition (5.33) nous donne
Z 2π
1 C
c0 (u) = √ u(x)dx = √ .
2π 0 2π
On a donc la solution (formelle)
X 1 1 C
(5.36) u(x) = − 2
ck (f ) √ eikx + .
k∈Z,k6=0
k 2π 2π

Pour vérifier que le deuxième membre de (5.36) est bien défini, nous rappelons que u
appartient à L2 (R/2π; C), si et seulement si
X
|ck (u)|2 < ∞.
k∈Z

Comme ck (u) = − k12 ck (f ) pour k 6= 0, en vertu de (5.34), on a


X X 1 C2 X C2
|ck (u)|2 = |c k (f )|2
+ ≤ |c k (f )|2
+ < ∞.
k∈Z k∈Z,k6=0
k4 2π k∈Z,k6=0

Il s’ensuit que u ∈ L2 (R/2π; C).


De plus, comme
d2 X 1
2
u(x) = (−k 2 ck (u)) √ eikx
dx k∈Z

e ikx
et que −k 2 ck (u) = ck (f ), compte tenu encore une fois du fait que { √ }
2π k∈Z
est une base
orthonormale, on a

d2 2
X
2 2
X
k u(·)k 2
L (R/2π;C) = | − k c k (u)| = |ck (f )|2 = kf k2L2 (R/2π) < ∞.
dx2 k∈Z k∈Z

d 2
2
On a montré que u ainsi que dx 2 u(·) appartient à L (R/2π; C) et donc les séries écrites

ci-dessus sont convergentes. Le problème est résolu au moins dans le cadre de l’espace de
Hilbert L2 (R/2π; C).
Exemple 2. Considérons l’équation de la chaleur

∂ ∂2
(5.37) u(t, x) = u(t, x) dans [0, ∞[ ×I
∂t ∂x2

50
avec les conditions aux limites

u(t, a) = u(t, b) = 0, I = ]a, b[ , a < b,

et la condition initiale

(5.38) u(0, x) = u0 (x) dans I,

où u0 (x) est une fonction donnée. Or, comme il est facile de transformer l’équation et
les conditions posées dans I = ]a, b[ dans une équation et des conditions posées dans un
autre intervalle borné, par la commodité de présentation, nous choisissons

I = ]0, π[ ,

de sorte que les conditions aux limites doivent être écrites comme

(5.39) u(t, 0) = u(t, π) = 0;

dans (5.37) et (5.38) nous convenons de considérer I = ]0, π[ (sans réécrire explicitement
l’équation et la condition).
Pour formuler le problème (5.37), (5.39) et (5.38) dans un cadre d’un espace de Hilbert
avec une base orthonormale de fonctions trigonométriques, nous remarquons d’abord la
propriété suivante.

Lemme 5.3 Soit ϕ une fonction définie sur [0, 2π] appartenant à L2 (0, 2π; R) et telle que
ϕ(0) = ϕ(2π). Si

(5.40) ϕ(x) = −ϕ(2π − x) ∀x ∈ [0, π],

alors on a
ϕ(0) = ϕ(π) = ϕ(2π) = 0,

Z 2π
(5.41) ϕ(x) cos kxdx = 0 ∀k ∈ N.
0

Démonstration En substituant x = 0 dans (5.40) et en tenant compte de la condition


ϕ(0) = ϕ(2π), on a ϕ(0) = −ϕ(2π) = −ϕ(0), d’où ϕ(0) = 0 et donc aussi ϕ(2π) = 0.
D’autre part, en substituant x = π dans (5.40), on a ϕ(π) = −ϕ(π), d’où ϕ(π) = 0.
Pour obtenir (5.41), il suffit de remarquer que pour tout k ∈ N on a

cos(kx) = cos(k(2π − x))

et donc
cos(kx)ϕ(x) = − cos(k(2π − x))ϕ(2π − x) ∀x ∈ [0, π],
ce qui implique l’égalité (5.41). 
Vu le lemme 5.3 nous pouvons chercher la solution u du problème (5.37), (5.39) et
(5.38) dans la classe de fonctions
∞ √
X 2
(5.42) u(t, x) = bk (t) √ sin kx.
k=1
π

51
En effet, si on prolonge l’intervalle I = ]0, π[ en ]0, 2π[ et la fonction u0 (x) en

 u0 (x) si 0 < x < π
u0 (x) = −u0 (2π − x) si π < x < 2π ,
0 si x = π

alors tous les coefficients de Fourier de u0 (·) relatifs à cos kx sont nuls et on peut chercher
la solution u de la forme (5.42). On rappelle aussi que
Z π√ √
2 2
√ sin kx √ sin k 0 xdx = δkk0 .
0 π π

Supposons donc que la solution u a la forme (5.42). Alors en vertu de (5.30) on a


∞ √ ∞ √
∂2 ∂2 h X 2 i X 2
2
u(t, x) = 2
bk (t) √ sin kx = − k 2 bk (t) √ sin kx.
∂x ∂x k=1 π k=1
π

D’autre part on a
∞ √ ∞ √
∂ ∂ hX 2 i X dbk (t) 2
u(t, x) = bk (t) √ sin kx = √ sin kx.
∂t ∂t k=1 π k=1
dt π

On peut donc réécrire l’équation (5.37) dans la forme


∞ √ ∞ √
X dbk (t) 2 X 2
(5.43) √ sin kx = − k 2 bk (t) √ sin kx.
k=1
dt π k=1
π

En multipliant les deux membres de (5.43) par √π2 sin k 0 x et en l’intégrant de 0 à π, on
obtient la famille d’équations différentielles ordinaires

dbk (t)
(5.44) = −k 2 bk (t), k = 1, 2, · · · .
dt
La condition initiale pour√ les équations (5.44) est donnée par le produit scalaire des deux
membres de (5.38) avec √π2 sin k 0 x, qui nous donne
Z π

2
(5.45) bk (0) = u0 (x) √ sin kxdx ≡ β0,k .
0 π

Il est facile de voir que la solution du problème (5.44)–(5.45) est


2
(5.46) bk (t) = β0,k e−k t .

Cela étant, la solution u(t, x) du problème (5.37), (5.39) et (5.38) sera


∞ √
X
−k2 t 2
(5.47) u(t, x) = β0,k e √ sin kx.
k=1
π

52

Vous aimerez peut-être aussi