Vous êtes sur la page 1sur 384

Cours de mathmatiques

PSI
Aurlien Monteillet

9 d embre 2015

ii

Ce document contient les notes dun cours de mathmatiques pour la classe de PSI.
Les dmonstrations non exigibles ou hors programme sont explicitement repres comme
telles dans les notes.

Bonne lecture !

Ce document est mis disposition selon les termes de la Licence Creative Commons

(Attribution Pas dUtilisation Commerciale Partage dans les Mmes Conditions 3.0 France)
http://creativecommons.org/licenses/by-nc-sa/3.0/fr/

iii

iv

Sommaire
1 Suites numriques
I.
Dfinitions et rsultats fondamentaux . . . . . . . . . . . . . . . . . . . . . . . . .
II. Suites dfinies par rcurrence . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
III. Suites rcurrentes linaires dordre 2 . . . . . . . . . . . . . . . . . . . . . . . . .
2 Sries numriques
I.
Dfinition et convergence dune srie
II. Sries de rels positifs . . . . . . . .
III. Convergence absolue . . . . . . . . .
IV. La formule de Stirling . . . . . . . .
V. Le thorme des sries alternes . . .
VI. Produit de deux sries . . . . . . . .

1
1
4
7

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

11
11
16
23
25
26
28

3 Espaces vectoriels et applications linaires


I.
Espaces vectoriels . . . . . . . . . . . . . . . . . . .
II. Somme et somme directe de sous-espaces vectoriels
III. Applications linaires . . . . . . . . . . . . . . . . .
IV. Isomorphismes et automorphismes . . . . . . . . .
V. Rang et thorme du rang . . . . . . . . . . . . . .
VI. Formes linaires et hyperplans . . . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

31
31
40
45
53
57
59

4 Matrices
I.
Calcul matriciel . . . . . . . . . . . . . . . .
II. Matrices, vecteurs et applications linaires .
III. Image, noyau et rang dune matrice . . . . .
IV. La mthode de Gauss-Jordan . . . . . . . .
V. Trace dune matrice et dun endomorphisme
VI. Sous-espaces stables . . . . . . . . . . . . .
VII. Dterminant . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

63
63
65
71
73
89
91
95

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

5 Espaces vectoriels norms. Convergence et continuit


I.
Espaces vectoriels norms . . . . . . . . . . . . . . . . .
II. Suites dun espace vectoriel norm de dimension finie . .
III. Vocabulaire de topologie . . . . . . . . . . . . . . . . . .
IV. Fonctions entre espaces vectoriels norms :
limite et continuit . . . . . . . . . . . . . . . . . . . . .
V. Proprits des fonctions continues valeurs relles . . .
VI. Le cas des applications linaires et multilinaires . . . .
6 Suites et sries de fonctions
I.
Diffrents modes de convergence . . . . . . . . . .
II. Limite et continuit des suites et sries de fonctions
III. Intgration des suites et sries de fonctions . . . . .
IV. Drivation des suites et sries de fonctions . . . . .
v

.
.
.
.

.
.
.
.

.
.
.
.

107
. . . . . . . . . . . . . . 107
. . . . . . . . . . . . . . 113
. . . . . . . . . . . . . . 115
. . . . . . . . . . . . . . 119
. . . . . . . . . . . . . . 125
. . . . . . . . . . . . . . 126
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

129
130
138
140
142

7 Drivation et intgration des fonctions de R dans K


I.
Thorme de Rolle et accroissements finis . . . . . . . . . . . . . . .
II. Drives dune bijection rciproque . . . . . . . . . . . . . . . . . . .
III. Intgration sur un segment des fonctions continues : quelques rappels
IV. Intgrale sur un segment des fonctions continues par morceaux . . .
V. Mthodes de calculs dintgrales . . . . . . . . . . . . . . . . . . . . .
VI. Formules de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

145
145
148
150
153
156
158

8 Rduction des endomorphismes et des matrices carres


I.
lments propres dun endomorphisme et dune matrice carre
II. Recherche des lments propres, polynme caractristique . . .
III. Diagonalisabilit . . . . . . . . . . . . . . . . . . . . . . . . . .
IV. Rduction et polynmes annulateurs . . . . . . . . . . . . . . .
V. Endomorphismes et matrices trigonalisables . . . . . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

161
161
165
169
173
177

9 Espaces probabiliss
I.
Ensembles dnombrables . .
II. Espaces probabiliss . . . .
III. Probabilits conditionnelles
IV. vnements indpendants .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

183
183
185
193
197

.
.
.
.
.

199
199
204
207
210
212

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

10 Intgrales gnralises
I.
Convergence des intgrales gnralises . . . . . . . . . .
II. Intgrales absolument convergentes, fonctions intgrables
III. Mthodes de calcul des intgrales gnralises . . . . . .
IV. Comparaison entre une srie et une intgrale . . . . . . .
V. Espaces fonctionnels et fonctions intgrables . . . . . . .

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

11 Interversions pour les intgrales gnralises. Intgrales paramtre


215
I.
Les thormes dinterversion pour les intgrales gnralises . . . . . . . . . . . . 215
II. Intgrales paramtre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
12 Espaces prhilbertiens, espaces
I.
Produit scalaire . . . . . . . .
II. Orthogonalit . . . . . . . . .
III. Distance . . . . . . . . . . . .
IV. Formes linaires sur un espace

euclidiens
. . . . . . .
. . . . . . .
. . . . . . .
euclidien .

.
.
.
.

13 Sries entires
I.
Dfinition et convergence des sries entires
II. Oprations sur les sries entires . . . . . .
III. Rgularit de la somme dune srie entire .
IV. Dveloppements en sries entires . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

14 Variables alatoires
I.
Dfinitions, premires proprits . . . . . . . . . .
II. Loi dune variable alatoire . . . . . . . . . . . . .
III. Familles de variables alatoires . . . . . . . . . . .
IV. Esprance . . . . . . . . . . . . . . . . . . . . . . .
V. Sries gnratrices des variables alatoires valeurs
VI. Variance . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

. . .
. . .
. . .
. . .
dans
. . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

225
225
229
238
240

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

243
243
248
249
252

. .
. .
. .
. .
N
. .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

257
257
258
266
270
275
278

.
.
.
.

15 Endomorphismes remarquables des espaces euclidiens


289
I.
Isomtries vectorielles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
II. Endomorphismes symtriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294
III. Espaces euclidiens orients de dimension 2 et 3 . . . . . . . . . . . . . . . . . . . 297
vi

16 Fonctions vectorielles. Arcs paramtrs


307
I.
Drivation des fonctions valeurs vectorielles . . . . . . . . . . . . . . . . . . . . 307
II. Drives dordre suprieur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311
III. Arcs paramtrs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313
17 quations diffrentielles
I.
Rsultats thoriques sur les systmes diffrentiels . . .
II. Systmes coefficients constants sans second membre .
III. quations scalaires dordre 1 . . . . . . . . . . . . . .
IV. quations scalaires dordre 2 . . . . . . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

323
323
326
329
331

18 Fonctions de plusieurs variables. Calcul et gomtrie


I.
Fonctions de classe C 1 . . . . . . . . . . . . . . . . . .
II. Problmes dextrema . . . . . . . . . . . . . . . . . . .
III. Drives partielles dordre 2 . . . . . . . . . . . . . . .
IV. Rsolution dquations aux drives partielles . . . . .
V. Courbes et surfaces . . . . . . . . . . . . . . . . . . . .

diffrentiels
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

341
341
351
353
353
358

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

Annexe 1 : Relations de comparaison


367
I.
Le cas des suites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 367
II. Le cas des fonctions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371
Annexe 2 : Intgrales de Wallis

373

vii

viii

Chapitre 1

Suites numriques
I.

Dfinitions et rsultats fondamentaux

Dans cette partie, on considre une suite (un )nN dlments de K = R ou C, i.e., une
application de N dans K. Toutes les dfinitions et tous les thormes que nous allons donner
peuvent tre adapts au cas dune suite (un )n>p dfinie partir dun certain rang p.

1.

Convergence dune suite


Dfinition
Soit K. On dit que (un ) converge vers (ou que un tend vers ) si
> 0, n0 N; n > n0 , |un | 6 .
On note ceci un .
On dit que (un ) est convergente sil existe K tel que un . Dans ce cas, est
unique, il est appel limite de (un ) et not lim un .
Lorsque K = R, on dit que (un ) a pour limite + (ou diverge vers +, ou que
un tend vers +) si :
A > 0, n0 N; n > n0 , un > A.
On dfinit de faon analogue le fait que (un ) a pour limite .
On note ceci un + (ou un ).
Sinon, on dit que (un ) diverge.

Dmonstration de lunicit de la limite


On suppose quil existe et dans K qui sont tous deux limites de (un ). Soit > 0 fix ; il
existe n1 et n2 dans N tels que
n > n1 , |un | 6 et n > n2 , |un | 6 .
Alors, pour tout n > n0 = max{n1 ,n2 },
| | = | un + un | 6 |un | + |un | 6 2.
Le nombre positif | | est plus petit que toute constante strictement positive, il est donc nul,
ce qui prouve que = .

Remarque En adaptant cet argument, on montre bien sr lunicit de la limite y compris dans
le cas des limites infinies.
1

Thorme de la limite monotone


Soit (un ) une suite croissante majore de nombres rels. Alors (un ) converge et
lim un = sup {un ; n N}.
Toute suite croissante non majore de nombres rels a pour limite +.
Dmonstration
Soit (un )nN une suite croissante majore et soit M = sup {un ; n N}. Soit > 0 fix. Par
dfinition de la borne suprieure, il existe n0 N tel que un0 > M (en effet, M < M ,
donc M nest pas un majorant de {un ; n N}). Par croissance de (un ), on a alors, pour tout
n > n0 ,
un > un0 > M .
Sachant de plus que pour tout n, un 6 M 6 M + , on a finalement, pour tout n > n0 ,
|un M | 6 , donc un M.
Soit (un )nN une suite croissante non majore et soit A > 0 fix. Il existe n0 N tel que
un0 > A, et par croissance de un , on a pour tout n > n0 , un > un0 > A, ce qui montre que
un +.

Remarques
On a un rsultat analogue pour une suite dcroissante, selon quelle est minore ou non (avec
une limite finie ou gale ).
Bien entendu, ce nest pas la seule possibilit qua une suite pour converger : par exemple, la
suite ((1)n /n)n>1 converge vers 0 mais nest ni croissante, ni dcroissante.
Dfinition
Soient (un ) et (vn ) deux suites de rels. On dit que (un ) et (vn ) sont adjacentes si
(un ) est croissante et (vn ) dcroissante (ou le contraire),
un vn 0.
Thorme
Deux suites adjacentes sont convergentes et ont la mme limite.
Dmonstration Quitte changer les rles de (un ) et (vn ), on peut supposer que (un ) est
croissante et (vn ) dcroissante. Soit > 0 fix et n0 N tel que |un vn | 6 .
Pour tout n > n0 , on a en particulier un 6 vn + 6 v0 + par dcroissance de (vn ). Donc
(un ) est majore. Sachant de plus quelle est croissante, elle converge daprs le thorme de la
limite monotone. Soit sa limite.
On montre de mme que (vn ) converge et on note sa limite. Alors en passant la limite
dans lingalit |un vn | 6 valable pour n > n0 , on obtient | | 6 . Ceci tant vrai pour
tout > 0, on a = , ce qui termine la dmonstration.


2.

Suites extraites
Dfinition
On appelle suite extraite de la suite (un ) (ou sous-suite de (un )) toute suite de la
forme (vn ) = (u(n) ) o : N N est une application strictement croissante.

Remarque Une suite extraite de (un ) est une suite constitue de certains des termes de (un ) ;
les valeurs prises par reprsentent les indices choisis (qui apparaissent par ordre strictement
croissant). Les proprits de entranent immdiatement (par rcurrence) que (n) > n pour
tout n N.
Exemple Les suites (u2n ), (u2n+1 ), (un2 ) sont extraites de (un ).
Proprit
Si (un ) converge, alors toute suite extraite de (un ) converge, et admet la mme limite.
On a un rsultat analogue si (un ) a pour limite + ou .
Dmonstration On dmontre le rsultat dans le cas dune limite K, les autres cas sont
similaires. Soit > 0 fix ; il existe n0 N tel que pour tout n > n0 , |un | 6 . Soit (u(n) ) une
suite extraite de (un ). Alors daprs la remarque prcdente, pour tout n > n0 , (n) > n > n0 ,
et donc |u(n) | 6 , ce qui prouve le rsultat.


Remarque On emploie trs souvent la contrapose de cette proprit : pour montrer quune
suite na pas pour limite , on en construit une suite extraite qui na pas pour limite ; pour
prouver quune suite diverge, on construit deux suites extraites qui ont des limites diffrentes.
n
Ainsi les suites ((1)n ), (cos(n/2)) et (2n(1) ) divergent.
Inversement, on a le rsultat suivant :
Proprit
Si les suites (u2n ), (u2n+1 ) convergent vers la mme limite , alors (un ) converge vers
. On a un rsultat analogue si (u2n ), (u2n+1 ) tendent vers +, ou vers .
Dmonstration nouveau, on fait la preuve dans le cas dune limite K. Soit > 0 fix ;
il existe n0 N et n1 N tels que pour tout n > n0 , |u2n | 6 et pour tout n > n1 ,
|u2n+1 | 6 . Alors, pour tout p > max{2n0 , 2n1 + 1}, |up | 6 ; en effet, soit p est pair, de
la forme 2n avec n > n0 , soit il est impair, de la forme 2n + 1 avec n > n1 . On a donc montr
que un .

Exemple On pose, pour n N , Sn =

n
X
(1)k
k=1

Les suites (S2n ) et (S2n+1 ) sont adjacentes car

(1)2n+2 (1)2n+1
1
1
+
=

< 0,
2n + 2
2n + 1
2n + 2 2n + 1
(1)2n+3
(1)2n+2
1
1
n N, S2n+3 S2n+1 =
+
=

> 0,
2n + 3
2n + 2
2n + 2 2n + 3
(1)2n+1
n N , S2n+1 S2n =
et donc S2n+1 S2n 0.
2n + 1
n N ,

S2n+2 S2n =

On en dduit que (S2n ) et (S2n+1 ) convergent vers la mme limite R, et donc, que (Sn )
X (1)k1
est convergente.
converge vers . Ceci montre que la srie harmonique alterne
k
k>1

II.

Suites dfinies par rcurrence


Soit D un sous-ensemble de K, f : D K, a D et n0 N. On dfinit la suite (un )n>n0 par
un0 = a et pour tout entier n > n0 , un+1 = f (un ).

Dfinition de la suite : pour que lexistence de un entrane lexistence de un+1 , il suffit que
un D. En gnral, il suffira de vrifier que D est stable par f , cest--dire que
f (D) D.
Si a D, on admettra que cela entrane que (un )n>n0 est bien dfinie, de faon unique, et
termes dans D (lunicit se montre facilement par rcurrence, mais lexistence est plus dlicate,
elle est lie la thorie des ensembles).
On supposera dans la suite que (un )n>n0 est bien dfinie avec un D pour tout n > n0 .
Convergence : le plus souvent, la fonction f est continue sur D. Donc, si (un ) converge vers
et si D, alors en passant la limite dans la relation un+1 = f (un ), on obtient f () = .
Les solutions de cette quation sont appels les points fixes de f .

Si lquation f () = na pas de solution dans D, alors, soit la suite (un ) est divergente, soit
un tend vers un point du bord de D (y compris, ventuellement, ).
On est donc amen chercher les solutions de cette quation dans D et vrifier si la suite (un )
converge ou non vers un tel nombre .
Une fois les points fixes de f dtermins, la vrification de la convergence est facilite dans
les cas suivants :
La fonction f est contractante sur D, cest--dire
k [0,1[,

(a,b) D 2 , |f (b) f (a)| 6 k |b a|.

()

Lorsque K = R et D est un intervalle, le thorme des accroissements finis peut permettre de


trouver une valeur de k sil en existe : si f est drivable sur D et si |f | 6 k sur D, alors f est
k-contractante.
Tout dabord, lingalit () assure lunicit dun ventuel point fixe de f dans D : si a et b
sont deux points fixes de f dans D, alors daprs (), on a |b a| = |f (b) f (a)| 6 k |b a|.
Sachant que k [0,1[, cela entrane que a = b.

Supposons que soit un point fixe de f dans D. En remplaant b par un D et a par D


dans (), on en dduit que
n > n0 ,

|un+1 | 6 k |un |.

Par rcurrence sur n, on montre alors que


n > n0 , |un | 6 knn0 |un0 |.
Pour n = n0 , la proprit est vraie car |un0 | 6 k0 |un0 |.
Supposons la proprit vraie pour un certain entier naturel n. Alors daprs lingalit (),
|un+1 | 6 k |un | 6 k knn0 |un0 | = kn+1n0 |un0 |.
La proprit est donc vraie au rang n + 1, et par principe de rcurrence, elle est vraie pour tout
n > n0 .
On conclut que (un ) converge vers car kn tend vers 0. De plus, pour > 0 fix, on peut
trouver n tel que |un | < : il suffit que knn0 |un0 | < (pour tre exploitable, cela supose
de connatre au moins une majoration de |un0 |).
4

K = R et f (x) x est de signe constant sur D ; dans ce cas la suite (un ) est monotone.
Si f (x) > x sur D, la suite (un ) est croissante.
Si f (x) 6 x sur D, la suite (un ) est dcroissante.
En effet, si f (x) > x sur D, alors pour tout n > n0 , un+1 = f (un ) > un , donc (un ) est
croissante. On procde de mme si f (x) 6 x sur D.
K = R et la fonction f est croissante sur D ; dans ce cas la suite (un ) est monotone.
Si f (un0 ) = un0 +1 > un0 , on montre par rcurrence que la suite (un ) est croissante. En
effet la proprit un+1 > un est vraie au rang n0 et hrditaire car un+1 > un entrane,
par croissance de f , que f (un+1 ) > f (un ), cest--dire un+2 > un+1 .
Si f (un0 ) = un0 +1 6 un0 , on montre de mme que la suite (un ) est dcroissante.
Dans les cas voqus dans les deux derniers points, le problme est donc ramen trouver
un majorant ou un minorant (qui pourra tre la limite suppose) afin dappliquer le thorme
de la limite monotone.
K = R et la fonction f est dcroissante sur D ; dans ce cas la fonction f f est croissante.
On tudie alors les suites extraites (vn ) = (u2n ) et (wn ) = (u2n+1 ). Ce sont des suites
rcurrentes associes la fonction croissante f f . Elles sont donc monotones daprs le point
prcdent, et en fait, elles sont de monotonie contraire : par exemple si (u2n ) est croissante, pour
tout n tel que 2n > n0 , u2n+2 > u2n , donc par dcroissance de f , u2n+3 6 u2n+1 . Ainsi (u2n+1 )
est dcroissante.
Pour que (un ) converge, il faut et il suffit que (vn ) et (wn ) convergent vers la mme limite, ce
que lon peut essayer de montrer en utilisant le thorme de la limite monotone et en tudiant
les points fixes de f f dans D. Si (vn ) et (wn ) convergent vers la mme limite , alors (un )
converge vers .
Remarques
Dans la pratique, pour que certaines des proprits ci-dessus soient vraies (stabilit de D par f ,
comportement de f ), on est souvent amen choisir D en restreignant lensemble de dfinition
de f , quitte tudier plusieurs cas, chacun correspondant un choix diffrent de D.
Pour guider ce choix et bien visualiser la situation, il est souvent judicieux de commencer par
un graphique, sur lequel on reprsente les courbes dquation y = x et y = f (x). Mais bien sr,
un dessin ne constitue pas une dmonstration.
Cas particuliers :
Suite arithmtique de raison b : n > n0 , un+1 = un + b. On a alors, pour tout n > n0 ,
un = un0 + (n n0 )b.
Si b = 0, la suite est constante, si b 6= 0, la suite ne converge pas (|un | tend vers +).

Suite gomtrique de raison a : n > n0 , un+1 = a un et un0 6= 0. On a alors, pour tout


n > n0 , un = ann0 un0 .
si |a| < 1, la suite converge vers 0.
si |a| > 1, la suite ne converge pas (|un | tend vers +).
si a = 1, la suite diverge (un = un0 si n n0 est pair, un = un0 sinon).
si a = 1, la suite est constante.
Suite arithmtico-gomtrique : n > n0 , un+1 = a un + b avec a 6= 1.
b
. On se ramne ltude dune suite
Lunique point fixe de f : x 7 a x + b est =
1a
gomtrique dfinie par vn = un . En effet, pour tout n > n0 ,
vn+1 = un+1 = (a un + b) (a + b) = a(un ) = a vn .

On a donc, pour tout n > n0 , vn = ann0 vn0 = ann0 (un0 ), puis




b
b
nn0
nn0
un = + a
(un0 ) =
+a
un0
.
1a
1a
5

Exemple tudions la suite dfinie par u0 R et pour tout n N, un+1 = 2un u2n .

Posons, pour tout x rel, f (x) = x(2 x) ; la situation peut tre reprsente sur le graphique
ci-dessous, o lon a reprsent le comportement de (un ) pour deux choix de valeurs initiales u0 .
y=x
1+

y = f (x)
u3
|

u2 u1u0
|

u0

u1 u2 1

La fonction f est dfinie sur R, en particulier, quel que soit u0 , la relation un+1 = f (un )
dfinit bien (un ). De plus f est strictement croissante sur ] ,1] et strictement dcroissante
sur [1, + [.

Premier cas : u0 = 0, u0 = 1 ou u0 = 2. On remarque que f (0) = f (2) = 0. En particulier si


u0 = 0, alors un = 0 pour tout n par une rcurrence immdiate. Si u0 = 2, alors u1 = 0 puis
un = 0 pour tout n > 1. Enfin on remarque que f (1) = 1 donc, si u0 = 1, alors un = 1 pour tout
n N.

Limites possibles : si (un ) converge vers un certain rel , alors daprs la relation un+1 = f (un )
et par continuit de f , on a = f (), donc 2 = 0, i.e. = 0 ou = 1.

Deuxime cas : u0 I0 = ],0[. Lintervalle I0 est stable par f car f est strictement croissante
sur I0 avec f (0) = 0. Par rcurrence, on montre alors que un I0 pour tout n. Pour tout x I0 ,
f (x) 6 x car x x2 6 0. En particulier, pour tout n, un+1 = f (un ) 6 un , donc (un ) est
dcroissante. Si elle convergeait, sa limite devrait vrifier 6 u0 < 0, ce qui contredit le fait
que = 0 ou 1. Donc un daprs le thorme de la limite monotone.

Troisime cas : u0 I1 = ]0,1]. Lintervalle I1 est stable par f car f est strictement croissante
sur I1 avec f (0) = 0 et f (1) = 1. Pour tout x I1 , f (x) > x car x x2 = x(1 x) > 0. On en
dduit que (un ) est valeurs dans I1 et quelle est croissante. Elle est donc convergente, et sa
limite vrifie I1 par croissance de (un ). Sachant que = 0 ou = 1, on a finalement = 1 :
(un ) converge vers 1.
Cas particulier du prcdent : u0 I2 = [3/4,1]. La fonction f est continue et croissante sur
],1], donc
f (I2 ) = [f (3/4),f (1)] = [15/16,1] I2 .
De plus f est drivable sur R avec |f (x)| = 2(1 x) 6
donc 1/2-contractante sur I2 .

1
pour tout x I2 . La fonction f est
2

Si u0 I2 , alors pour tout n N, un I2 car I2 est stable par f , et


1
|un+1 1| = |f (un ) f (1)| 6 |un 1|.
2
6

1
|u0 1| pour tout n N.
2n
On retrouve, par encadrement, le fait que dans ce cas, un 1, car 1/2n 0. Mais on a de
plus une estimation de la vitesse de convergence. Dailleurs, dans le cas o u0 I0 = ]0,1], on
a montr que (un ) converge vers 1 en croissant. Il existe donc n0 N tel que un0 [3/4,1].
Lestimation de la vitesse de convergence sapplique partir de n0 .
On montre alors par rcurrence sur n que |un 1| 6

Autres cas : si u0 [1,2[, alors u1 ]0,1] = I1 et, un dcalage dindice prs, on est dans la
situation du troisime cas, donc un 1. Si u0 > 2, alors u1 ],0[ = I0 et, un dcalage
dindice prs, on est dans la situation du deuxime cas, donc un .

III.

Suites rcurrentes linaires dordre 2

Les raisonnements de cette partie utilisent des notions dalgbre linaire, vues en premire
anne et qui seront rappeles en dtails dans le chapitre Espaces vectoriels et applications
linaires.
Soit (a,b) K2 . On cherche dterminer lensemble not Sa,b des suites dlments de K,
vrifiant la relation de rcurrence linaire dordre 2 suivante :
n N, un+2 + aun+1 + bun = 0.
Premire formulation : soit F : (un )nN 7 (un+2 +aun+1 +bun )nN . On vrifie trs facilement
que F L (KN ), et on cherche dterminer lensemble des solutions de lquation linaire
F (u) = 0KN , i.e. Sa,b = Ker(F ). En particulier, Sa,b est un sous-espace vectoriel de KN .

Sa,b K2
Deuxime formulation : soit :
u = (un ) 7 (u0 ,u1 )

En imposant les conditions initiales u0 = x et u1 = y, le problme revient dterminer lensemble


des lments u de Sa,b tels que (u) = (x,y).
Thorme
Lapplication est un isomorphisme de Sa,b sur K2 . En particulier, dim(Sa,b ) = 2.

Dmonstration Tout dabord, est linaire : soient u = (un ) et v = (vn ) deux suites et un
scalaire. Alors
(u + v) = (u0 + v0 ,u1 + v1 )
= (u0 ,u1 ) + (v0 ,v1 )
= (u) + (v).
La bijectivit de se traduit ainsi : pour tout (x,y) K2 , il existe une unique suite vrifiant la
relation de rcurrence dordre 2, et dont les deux premiers termes sont respectivement x et y.
Or, les relations
(
un+2 + aun+1 + bun = 0 n N
u0 = x, u1 = y

dfinissent entirement et de faon unique la suite (un ) : est donc un isomorphisme.

Reste savoir comment dterminer explicitement une suite (un ) de Sa,b en fonction de ses
deux premiers termes.
Proprit
Pour r K, la suite gomtrique (r n )nN appartient Sa,b si et seulement si r est une
solution de lquation caractristique associe :
x2 + ax + b = 0.

(E)

Dmonstration
Si (r n )nN appartient Sa,b , alors pour tout n N, r n+2 + ar n+1 + br n = 0. Avec n = 0, on
obtient r 2 + ar + b = 0.
Si r 2 + ar + b = 0, en multipliant cette galit par r n , on obtient r n+2 + ar n+1 + br n = 0
pour tout n N, donc (r n )nN appartient Sa,b .

Thorme
On suppose (a,b) 6= (0,0).
Si (E) admet deux racines distinctes r1 et r2 dans K, alors les suites ((r1 )n ) et ((r2 )n )
forment une base de Sa,b .
Pour tout (un ) Sa,b , il existe un unique couple (,) K2 tel que, pour tout n N,
un = (r1 )n + (r2 )n .
Si (E) admet une racine double r dans K, alors les suites (r n ) et (nr n ) forment une
base de Sa,b .
Pour tout (un ) Sa,b , il existe un unique couple (,) K2 tel que, pour tout n N,
un = r n + nr n = ( + n)r n .
Si K = R et si (E) admet deux racines complexes conjugues distinctes z = ei et z,
alors les suites (n cos(n)) et (n sin(n)) forment une base de Sa,b .
Pour tout (un ) Sa,b , il existe un unique couple (,) R2 tel que, pour tout n N,
un = n cos(n) + n sin(n) = n ( cos(n) + sin(n)).
Dmonstration
On sait que ((r1 )n ) et ((r2 )n ) appartiennent Sa,b daprs la proprit prcdente. De plus,
Sa,b est de dimension 2. Il suffit donc de montrer que ((r1 )n ) et ((r2 )n ) sont indpendantes.
Supposons quil existe deux scalaires et tels que (r1 )n + (r2 )n = 0 pour tout n. On en
dduit en particulier, pour n = 0 et n = 1, que (,) est solution du systme linaire

+ = 0
r1 + r2 = 0
Or, r1 et r2 tant distinctes, ce systme est de rang 2, et son unique solution est (0,0). Donc
= = 0.
On procde de la mme faon lorsque (E) possde une racine double r. Il suffit de remarquer
que la suite (nr n ) appartient Sa,b car, pour tout n > 0,
(n + 2)r n+2 = (n + 2)r n [(ar + b)] = a(n + 2)r n+1 b(n + 2)r n

= a(n + 1)r n+1 b nr n (ar + 2b)r n .

Or, r tant racine double du polynme X 2 + aX + b, on a


X 2 + aX + b = (X r)2 = X 2 2rX + r 2 .
On en dduit que a = 2r et b = r 2 , do ar +2b = 0. Ainsi (nr n ) vrifie la relation de rcurrence
dordre 2. La libert de la famille se prouve comme dans le point prcdent (elle est mme plus
simple, il suffit de remarquer que r 6= 0 car (a,b) 6= (0,0)).
Enfin, lorsque K = R et (E) admet deux racines complexes conjugues distinctes z = ei et
z = ei , on sait daprs le premier point que (z n ) et (
z n ) forment une base de Sa,b vu comme
C-espace vectoriel. Il suffit de remarquer que
n cos(n) = Re(z n ) =
8

1 n
(z + z n ),
2

et donc (n cos(n)) appartient Sa,b comme combinaison linaire de (z n ) et (


z n ). De mme,
n sin(n) = Im(z n ) =

1 n
(z z n ),
2i

et donc (n sin(n)) appartient Sa,b comme combinaison linaire (dans C, mme si cette suite
est relle) de (z n ) et (
z n ). La libert de la famille se prouve nouveau comme dans le premier
point, en remarquant que 6= 0 et sin() 6= 0 car z est complexe non rel.


Mthode Pour dterminer explicitement et , qui sont les coordonnes de (un ) sur la base
que lon vient dexpliciter (selon les cas), on procde en considrant les deux premiers termes.
Par exemple, dans le premier cas, pour trouver et tels que un = (r1 )n + (r2 )n pour
tout n N, on rsout le systme

+ = u0
r1 + r2 = u1
correspondant n = 0 et n = 1.

Dans le second cas, on rsout le systme




= u0
r + r = u1
et dans le troisime,

= u0
cos() + sin() = u1 .

Dans tous les cas, le systme rsoudre est de rang 2.


Exemple Dterminons explicitement la suite (un ) dfinie par u0 = 0, u1 = 1 et pour tout n N,
un+2 = un+1 + un .
Lquation caractristique associe cette suite suite rcurrente linaire dordre 2 est
X2 = X + 1
qui possde deux racines distinctes,

1+ 5
r1 =
2

1 5
et r2 =
.
2

On sait donc quil existe (,) R2 tel que pour tout n N,


un = (r1 )n + (r2 )n .
Les conditions initiales donnent
(

+ =0
r1 + r2 = 1

+ =0

r1 r2 = 1

Finalement, pour tout n N,


1
un =
5

+ = 0
1
=
r1 r2

!n
1
1+ 5

2
5

=
5
1

=
5

!n
1 5
.
2

1+ 5
La suite (un ) est appele suite de Fibonacci. Le rel r1 =
est le nombre dor.
2
9

10

Chapitre 2

Sries numriques
Dans ce chapitre, K dsigne R ou C et (un ) une suite dlments de K.

I.

Dfinition et convergence dune srie

1.

Notion de srie
Dfinition
Soit (un ) une suite dlments de K. Notons, pour tout entier naturel p,
Sp =

p
X

un .

n=0

On appelle srie de terme gnral un la suite (Sp )pN .


X
X
X
Elle est note
un ,
un ou
un .
n>0

nN

Le scalaire Sp est appele somme partielle dordre p de cette srie.

Remarques
Bien sr, on sautorise
P aussi considrer des suites (un ) dfinies partir dun certain rang n0 .
Dans ce cas, onPnote n>n0 un la srie correspondante. On peut aussi poser un = 0 pour n < n0
afin de
Pdfinir n>0 un . Pour simplifier les notations, on crira la plupart des rsultats pour une
srie n>0 un .
Pour toute suite (Sp ), il existe une unique suite (un ) telle que (Sp ) soit la srie de terme gnral
un : cest la suite dfinie par u0 = S0 et pour tout n N , un = Sn Sn1 (voir plus loin le
principe des sries tlescopiques).
On parle de sries numriques pour les distinguer des sries de fonctions, des sries entires,
que nous tudierons galement.
Dfinition Somme dune srie convergente
P
La srie n>0 un est convergente (i.e., la suite (Sp ) possde une limite dans K) si et
seulement sil existe S K tel que
p
X

n=0

Dans ce cas, cette limite S est note

un S.

+
X

p+

un . Elle est appele somme de la srie.

n=0

Dans le cas contraire, la srie est dite divergente.

11

Remarque On notera bien la distinction entre les objets

n>0

un et

+
X

un .

n=0

Le premier existe toujours et dsigne une suite, le second existe si et seulement si la srie converge,
et dsigne alors un lment de K.
P
Remarques Par dfinition, tudier une srie
n>0 un revient tudier la suite (Sp ) de ses
sommes partielles.

On pourrait donc croire que le travail est dj fait. Pourtant, sauf cas trs favorables, on ne
peut pas simplifier lexpression des sommes partielles Sp . Nous allons voir quen fait, on passe
trs rarement par ltude directe de la suite des sommes partielles pour tudier une srie. On va
plutt dvelopper des critres portant sur le terme gnral un .

Inversement, on a vu que pour n > 1, un = Sn Sn1 ; on peut parfois tudier une suite (un )
en passant par la srie de terme gnral un .
Proprit/Dfinition
P
P
Soit n>0 un une srie et m un entier naturel.
Alors la srie n>m+1 un est de mme
P
nature (convergente ou divergente) que n>0 un .
Si elle converge, sa somme
+
X
un
Rm =
n=m+1

est appel reste dordre m de la srie.

Dmonstration Pour tout p > m + 1,


p
X

n=0

un

p
X

un =

n=m+1

m
X

un

n=0

ne dpend pas de p. La suite associe est donc stationnaire. En particulier, les sries
P
n>m+1 un sont de mme nature.

n>0 un

et


Proprit
P
Si la srie n>0 un converge, la suite (Rm )mN converge vers 0.
Dmonstration En notant Sp les sommes partielles de la srie, on a en passant la limite lorsque
p + dans lgalit de la dmonstration prcdente,
+
X

un = Sm + Rm ,

n=0

et ce pour tout m N. Or, par dfinition,


Sm

m+

Le rsultat suit par diffrence.

+
X

un .

n=0

La proprit suivante montre que si ncessaire, ltude des sries de nombres complexes se
ramne ltude des sries de rels :
12

Proprit
P
Une srie n>0 un de nombres complexes converge si et seulement si les sries
X

n>0

Re(un ) et

n>0

Im(un )

(sries des parties relles et imaginaires de un ) convergent. Dans ce cas,


+
X

un =

+
X

n=0

n=0

Re(un ) + i

Dmonstration Pour tout p N,


p
X

un =

p
X

(Re(un ) + i Im(un )) =

n=0

n=0

+
X

n=0

p
X

n=0

Im(un ).

Re(un ) + i

p
X

n=0

Im(un ).

P
Or, daprs une proprit connue sur les suites, ( pn=0 un ) a une limite dans K si et seulement si sa
partie relle et sa partie imaginaire ont
(dans R), ce qui quivaut daprs lgalit
Pune limite finieP
ci-dessus la convergence des sries n>0 Re(un ) et n>0 Im(un ). En cas de convergence, on
a lgalit souhaite en passant la limite dans lgalit ci-dessus.


2.

Premiers exemples

Srie gomtrique
Soit z un nombre complexe. On appelle srie gomtrique de raison z la srie

zn.

n>0

On sait que pour tout entier naturel p,

p+1
1 z
zn =
Sp =
1z

p+1
n=0
p
X

si z 6= 1

si z = 1.

Ainsi, (Sp ) est convergente si et seulement si : z 6= 1 et (z p ) converge. Ceci quivaut : |z| < 1. En
effet, si |z| < 1, alors z 6= 1 et (z p ) converge. Rciproquement, si z 6= 1 et si (z p ) converge, alors
|z| 6 1 (car (z p ) diverge si |z| > 1). Supposons que |z| = 1 ; sachant de plus que (z p ) converge,
sa limite vrifie 6= 0 ; en remarquant que z p+1 /z p = z pour tout p N, et en passant la
limite dans cette relation, on obtient z = 1, ce qui est exclu. Donc |z| < 1.
En cas de convergence, on a
+
X
1
.
zn =
1

z
n=0
Si z est un nombre complexe tel que |z| < 1, alors le reste dordre m de la srie gomtrique de
raison z est
+
X
z m+1
.
zn =
Rm =
1z
n=m+1

Srie harmonique

On appelle srie harmonique la srie

X1
k>1

n
X
1
La srie harmonique est divergente : en notant Hn =
pour tout n > 1, on a
k
k=1

H2n Hn =

n
2n
2n
2n
X
X
1
1 X
1
1 X1

=
>
1= .
k
k
k
2n
2
k=1

k=1

k=n+1

13

k=n+1

Si la srie harmonique convergeait, on aurait H2n Hn 0, ce que contredit lingalit prcdente.


Srie harmonique alterne
On appelle srie harmonique alterne la srie

X (1)k1
k

k>1

La srie harmonique alterne converge et sa somme est ln(2). En effet, on remarque que pour
tout n > 1,
!
Z 1 X
n Z
n
n
X
(1)k1 X 1
k1 k1
k1
(1) t
dt =
=
(t)
dt.
k
0
0
k=1

k=1

k=1

On reconnat la somme des premiers termes dune srie gomtrique de raison t 6= 1 :


!
Z 1
Z 1 X
Z 1
Z 1
n
1 (t)n
1
(t)n
k1 k1
dt =
(1) t
dt =
dt
dt.
1+t
0
0
0 1+t
0 1+t
k=1

Or,

1
0

1
dt = ln(2) et
1+t
Z


Sries tlscopiques

1
0

Z 1
(t)n
1
dt 6
0.
tn dt =
1+t
n+1
0

On appelle srie tlescopique une srie de la forme

(n+1 n ).

n>0

Lexpression des sommes partielles de cette srie est trs simple, car pour tout entier naturel p,
p
X

(n+1 n ) =

n=0

p
X

n=0

n+1

p
X

n =

n=0

p+1
X

n=1

p
X

n=0

n = p+1 0 .

On en dduit le rsultat suivant :


Proprit
La srie tlescopique

(n+1 n ) converge si et seulement si la suite (n ) converge.

n>0

Exemple Pour p > 1,


p
X

n=1

La srie

n>1

3.

X
1
=
n(n + 1)

n=1

1
1

n n+1

=1

1
.
p+1

1
est donc convergente, et sa somme est 1.
n(n + 1)

Une condition ncessaire mais non suffisante de convergence


Proprit
X
Soit
un une srie convergente. Alors un tend vers 0 lorsque n +.
n>0

14

Dmonstration En notant Sn =

n
X

uk , on a, pour tout entier n > 1,

k=0

un = Sn Sn1 .
Par hypothse, (Sn ) converge, et donc (Sn1 ) converge galement, vers la mme limite. Par
diffrence, un 0.

Attention ! Il ne faut surtout pas confondre cette proposition avec sa rciproque qui est fausse :
ce nest pas parce que le terme gnral dune srie tend vers 0 que cette srie converge : lexemple
de la srie harmonique le montre bien.
Remarque
P On utilise souvent la contrapose de ce rsultat : si un ne tend pas vers 0, alors la
srie n>0 un est divergente. On parle alors de divergence grossire.

4.

Oprations sur les sries


Proprit
P
P
Soient n>0 un et n>0 vn deux sries convergentes, et K. Alors la srie
X

(un + vn )

n>0

converge et
+
X

(un + vn ) =

+
X

n=0

n=0

un +

+
X

vn .

n=0

Dmonstration Pour p N, on a
p
X

(un + vn ) =

n=0

p
X

n=0

un +

p
X

n=0

vn
p+

+
X

un +

n=0

+
X

vn

n=0

P
P
par dfinition de la convergence des deux sries P
n>0 un et
n>0 vn et par combinaison linaire
de limites. Ceci signifie exactement que la srie n>0 (un + vn ) converge ainsi que la formule
annonce.

Corollaire
Lensemble des sries convergentes dlments de K est un K-espace vectoriel.

Trs souvent, les hypothses des thormes sur les sries seront vrifies partir dun certain
rang. Cela nempchera pas leur application, grce la proprit suivante :
Proprit
Soit (un ) et (vn ) deuxPsuites dontP
seulement un nombre fini de termes diffrent.
Alors les deux sries n>0 un et n>0 vn sont de mme nature.
Attention ! En revanche, elles nont pas ncessairement mme somme.
15

II.
1.

Sries de rels positifs


Critre de convergence, thormes de comparaison
Proprit
P
Soit n>0 un une srie termes rels positifs. Alors, pour que cette srie converge, il
faut et il suffit que la suite de ses sommes partielles soit majore. Dans ce cas, on a
+
X

un = sup

p
X

p>0 n=0

n=0

un .

Dmonstration La suite des sommes partielles (Sp ) est croissante. Le rsultat vient donc du
thorme de la limite monotone : si (Sp ) est majore, alors la srie converge vers sa borne
suprieure, sinon elle diverge vers +.

Thorme
P
P
Soient n>0 un et n>0 vn deux sries termes rels positifs, et soit n0 N.
X
X
Si pour tout n > n0 , un 6 vn et si
vn converge, alors
un converge et
n>0

06

+
X

n>0

un 6

Si un vn , alors les sries

vn .

n=n0

n=n0

Si pour tout n > n0 , un 6 vn et si

+
X

un diverge, alors

n>0

n>0 un

et

vn diverge.

n>0

n>0 vn

sont de mme nature.

Rappel Pour des suites (un ) et (vn ) termes positifs telles que vn 6= 0 partir dun certain
rang N , la condition un vn signifie que
un
1, i.e., > 0, n1 N, n1 > N ; n > n1 , (1 ) vn 6 un 6 (1 + ) vn .
vn
Dmonstration du thorme
De lhypothse, on dduit que pour tout p > n0 ,
06

p
X

un 6

p
X

vn .

n=n0

n=n0

P
P
sommes partielles est majore
Si
n>n0 vn converge, donc la suite de sesP
n>0 vn converge,
daprs la proprit
prcdente.
Il
en
est
donc
de
mme
pour
n>n0 un . Daprs la proprit
P
P
prcdente, n>n0 un converge, et donc n>0 un converge. De plus, en passant la limite dans
lingalit prcdente, on obtient
06

+
X

un 6

+
X

vn .

n=n0

n=n0

Le deuxime point est tout simplement la contrapose du premier.


Si un vn , alors il existe n1 N tel que pour tout n > n1 , 12 vn 6 un 6 32 vn . Les deux premiers
points, et le fait que lon ne modifie pas la nature dune srie par multiplication par un scalaire
non nul, permettent de conclure.

16

Exemples
Montrons que la srie

X 1
converge. Pour tout n > 2,
n2

n>1

06

1
1
.
6
n2
n(n 1)

Or, nous avons prouv plus haut ( un dcalage dindices prs), que la srie

n>2

1
converge.
n(n 1)

On en dduit le rsultat par comparaison de sries termes positifs.


X 1
diverge par comparaison avec la srie harmonique : pour tout n > 1,
De mme, la srie
n
n>1

1
1
6 .
n
n

06

Or on a montr plus haut que la srie harmonique diverge. On en dduit le rsultat par comparaison de sries termes positifs.
 
X
1
diverge : en effet
La srie
n sin
n2
n>1

n sin

1
n2

1
> 0.
n

Par comparaison avec la srie harmonique, divergente et termes positifs, on en dduit le rsultat.
Remarques
On peut bien sr remplacer lhypothse termes positifs par lhypothse termes ngatifs (si on le fait, ce doit tre pour les deux sries).
En revanche, lhypothse de mme signe constant est essentielle. Par exemple, pour n > 1,

et la srie

1
1
6 2,
n
n

X 1
X 1
converge. Bien sr, pourtant, la srie
diverge.
2
n
n

n>1

n>1

Le thorme prcdent montre bien lutilit de connatre la nature de quelques sries de


rfrence auxquelles on pourra essayer de comparer les sries que lon tudiera. Nous connaissons

dj la nature de la srie gomtrique, des sries de termes gnraux 1/n, 1/n2 , 1/ n. En fait,
ces trois derniers exemples se gnralisent :
Thorme/Dfinition : Sries de Riemann
Une srie de Riemann est une srie de la forme

X 1
o R.
n
n>1

On a le critre suivant de convergence des sries de Riemann :

X 1
converge si et seulement si > 1.
n

n>1

Dmonstration Si 6 1, alors pour tout n > 1,


06

1
1
6 ,
n
n
17

donc la srie

n>1 1/n

diverge par comparaison avec la srie harmonique.

Si > 1, on remarque que pour tout n > 2, et pour tout t [n 1,n],


1
1
6 ,
n
t
et donc, aprs intgration sur [n 1,n], intervalle de longueur 1, on a
Z n
1
1
6
dt.

n
t
n1
En sommant ces ingalits pour n entre 2 et p > 2, et en ajoutant le terme manquant correspondant n = 1, on obtient, daprs la relation de Chasles,

p


Z p
p
X
1
1
1
1
1
1
=
1
+
6
1
+
dt
=
1
+
61+
1

1
1
n
t
(1

)t

1
p

1
1
1
n=1
P

car 1 > 0. La suite des sommes partielles


de
la
srie
n>1 1/n , qui est termes positifs,
P
est majore. On en dduit que la srie n>1 1/n converge lorsque > 1.

P
Exemple La srie n>0 n8 en converge : la suite de terme gnral n2 n8 en = n10 en tend
vers 0 par croissances compares puissance/exponentielle. Donc pour n assez grand,
0 6 n8 en 6

1
.
n2

Par comparaison de sries termes positifs, on en dduit le rsultat, car la srie de Riemann
X 1
, dexposant 2 > 1, converge.
n2
n>1

On peut souvent montrer par cet argument la convergence de sries dont le terme gnral
converge assez vite vers 0.
Lide de la dmonstration du thorme prcdent (dans le cas o > 1) est gnralisable :
considrons une fonction f : [0, + [ R+ continue et dcroissante. Si n N , on a pour tout
t [n 1,n], f (n) 6 f (t), et donc, aprs intgration sur [n 1,n],
Z n
f (n) 6
f (t) dt.
n1

De la mme faon, pour tout n N,

n+1

f (t) dt 6 f (n).

Ceci est illustr sur le graphique suivant, laire sous la courbe de f entre les points dabscisses
n 1 et n tant minore par laire du rectangle de base 1 et de hauteur f (n), et laire sous la
courbe de f entre les points dabscisses n et n + 1 tant majore par laire de ce mme rectangle.
Cf

f (n)

n1
18

n+1

En additionnant la premire ingalit pour n entre 1 et p > 1 puis en ajoutant f (0), et en


additionnant la seconde pour n entre 0 et p, on obtient
Z

p+1

f (t) dt 6

p
X

f (n) 6 f (0) +

n=0

f (t) dt.
0

On
P peut donc, grce la mthode des rectangles, encadrer les sommes partielles de la srie
n>0 f (n). Si lon sait calculer les intgrales de f , ou au moins dcrire leur comportement,
P
ceci peut permettre de dcrire le comportement asymptotique des sommes partielles pn=0 f (n)
lorsque p +.
Remarque On adapte facilement cet encadrement :
Lorsque f est dfinie sur [n0 , + [, comme dans la dmonstration du critre de convergence
des sries de Riemann avec n0 = 1.
Lorsque f est croissante.

Exemples
La srie harmonique correspond au choix de la fonction inverse qui est continue, dcroissante et
positive sur [1, + [ ; en mettant en oeuvre la mthode prcdente, on obtient, pour tout p > 1,
Z

p+1

cest--dire,

Z p
p
X
1
1
1
dt 6
6 f (1) +
dt,
t
n
1 t
n=1

p
X
1
ln(p + 1) 6
6 1 + ln(p).
n
n=1

On retrouve la divergence de la srie harmonique, mais bien plus prcisment, car par encadrement, on obtient que
p
X
1
ln(p).
n p+
n=1

En effet,

1 + ln(p)

p+

1
ln(p + 1) = ln(p) + ln 1 +
p

ln(p) et

ln(p) + o(1)

p+

p+

ln(p).

En sommant diffremment les ingalits obtenues par la mthode des rectangles, on peut obtenir
dautres rsultats intressants. Par exemple, dans le cas des sries de Riemann convergentes, cest-dire lorsque f : t 7 1/t avec > 1 (f est continue, dcroissante et positive sur [1, + [), on
a pour tout n > 2,
Z
Z
n+1

f (t) dt 6 f (n) 6

f (t) dt.

n1

En sommant ces ingalits entre m + 1 avec m > 1 et p > m + 1, on obtient donc


Z

p+1

f (t) dt 6

m+1

p
X

f (n) 6

n=m+1

f (t) dt,
m

cest--dire
1
1

1
1

1
(m + 1)
(p + 1)1

p
X

1
1
6
6

n
1
n=m+1

1
m1

Lorsque p tend vers +, tous les termes ont une limite finie et on obtient
+
X
1
1
1
1
1
6
6
,
1

1
1 (m + 1)
n
1 m
n=m+1

19

1
p1

ce qui entrane que


+
X

1
n
n=m+1

m+

1
1
.
1
1 m

On obtient donc un quivalent des restes dordre m de la srie

X 1
lorsque m +.
n

n>1

2.

La rgle de dAlembert
Thorme Rgle (ou critre) de dAlembert
Soit

un une srie termes rels strictement positifs. On suppose que

n>0

possde une limite > 0 (ventuellement infinie).


X
Si [0,1[, alors
un converge.

un+1
un

n>0

Si > 1 ou si = +, alors

un diverge grossirement.

n>0

Si = 1, on ne peut pas conclure.


Dmonstration
On suppose que
=

un+1
un

a une limite [0,1[. En appliquant la dfinition de la limite avec

1
, on en dduit quil existe n0 N tel que pour tout n > n0 ,
2
06

En notant k =

1+
un+1
6+=
< 1.
un
2

1+
, on a k [0,1[ et pour n > n0 ,
2
06

un+1
6 k.
un

(1)

Montrons alors par rcurrence que pour tout n > n0 ,


0 6 un 6

un 0 n
k .
k n0

Pour n = n0 , le rsultat est vrai car il se lit 0 6 un0 6 un0 . Si le rsultat est vrai au rang n, alors
daprs (1),
un
un
0 6 un+1 6 kun 6 k n00 kn = n00 kn+1 ;
k
k
le rsultat est donc vrai au rang n + 1 et daprs le principe de rcurrence, il est vrai pour tout
n > n0 .
La srie de
gnral kn converge car cest la srie gomtrique de raison k [0,1[,
Xterme
P
un0 n
k
converge.
Par
comparaison
de
sries

termes
positifs,
la
srie
donc la srie
n>0 un
n
k 0
n>n0
converge.
On procde de la mme faon dans le cas o > 1. On obtient lexistence de k > 1 tel que
pour tout n assez grand,
un+1
> k.
un
n
On en dduit que kn = O(un ). Or, sachant
P que k > 1, k + lorsque n + et il en est
donc de mme pour un . En particulier, n>0 un diverge grossirement.


20

Remarques
Lorsquelle sapplique, la rgle de dAlembert permet de conclure des convergences, ou des
divergences grossires, cest--dire, des comportements particuliers. Souvent, la limite du quotient, si elle existe, est gale P
1, et
peut pas conclure par cet argument. Par exemple, il
Pon ne
ne sapplique pas aux sries
n,
1/n2 . Souvent aussi, cette limite nexiste pas et la rgle ne
sapplique pas. En revanche, la rgle de dAlembert est trs efficace pour traiter des sries qui
ressemblent des sries gomtriques.
P
Il nexiste pas de rciproque la rgle de dAlembert : si une srie n>0 un termes positifs
converge, on ne peut pas en dduire quoi que ce soit sur le comportement du quotient un+1 /un ,
qui peut mme ne pas tre dfini !
Il est indispensable de passer la limite dans la rgle de dAlembert : si un > 0 pour tout n, le
fait que le quotient un+1 /un appartienne [0,1[, ou ]1, + P
], pour tout n, ne permet aucune
conclusion quant la convergence ou divergence de la srie n>0 un .
X
Exemple Soit x un rel positif. Montrons que la srie
nxn converge si et seulement si x [0,1[.
Si x = 0 le rsultat est vident. Sinon, pour tout n,

n>0

(n + 1)xn+1
n+1
=
x x.
n
n+
nx
n
Par consquent, daprs la rgle de dAlembert, si x < 1, la srie converge, si x > 1, elle P
diverge.
Si x = 1, on ne peut pas conclure par la rgle de dAlembert mais on obtient la srie
n qui
diverge grossirement.

3.

Dveloppement dcimal dun nombre rel

On a lhabitude, au point de ne plus y penser, dcrire nos nombres en base 10. Pourtant,
notre systme de numration est le fruit de plusieurs millnaires de maturation depuis lapparition des premiers systmes de numrations additifs (gyptien, romain et grec par exemple), qui
consistaient reprsenter un nombre entier par juxtaposition de symboles reprsentant chacun
une quantit fixe (1, 10, 50,...), la valeur du nombre reprsent tant la somme des valeurs des
diffrents symboles. Sont ensuite apparus des systmes de numration dans lesquels la valeur dun
symbole dpend de sa place dans lcriture : ils sont dits systmes de numration de position.
Les sytmes chinois, babylonien et bien sr les systmes de base b en sont des exemples. Et ce
nest quautour du 4e sicle de notre re que le zro, venu dInde, efface les ambiguts dues aux
espaces dans lcriture dun nombre, pour prendre, peu peu, un vritable caractre opratoire.
Dailleurs, la base 10 nest pas plus naturelle que dautres qui ont t et sont encore largement
utilises dans de nombreuses civilisations : la base 12 et la base 60 ont lavantage doffrir de plus
nombreux diviseurs que la base 10 ; on se sert encore de la premire pour compter les oeufs
par exemple, de la seconde pour lheure. La base 2 enfin a pris toute son importance avec le
dveloppement de linformatique, videmment (cest Leibniz qui en avait entrevu limportance).
La notion de srie permet de dfinir lcriture en base b des nombres rels ; donnons lexemple
de lcriture dcimale des rels de [0,1[.
Proprit/Dfinition
Soit (an )n>1 une suite dentiers naturels compris entre 0 et 9. Alors la srie
X an
10n

n>1

converge. En notant x sa somme, on a x [0,1], et on dit que cette srie est un


dveloppement dcimal (ou en base 10) de x.

21

Dmonstration Les an tant compris entre 0 et 9 pour tout n > 1, on a lencadrement


9
an
0 6 n 6 n.
10
10
Par comparaison avec une srie gomtrique de raison 0,1 et de premier terme 9 (dont la somme
est 1, voir la remarque suivante), on en dduit la convergence de la srie et le fait que x [0,1].

Remarque Contrairement ce quon pourrait croire, un tel dveloppement nest pas unique :
posons
+
X
9
= 0,9999 . . .
x=
10n
n=1

Alors

+
X
1
1
1
x=9
=9
1 = 1 = 1,00000 . . .
10n
10 1 10
n=1

Pour viter ce phnomne, on dfinit les dveloppements dcimaux propres :


Dfinition
P
Avec les notations prcdentes, on dit que n>1 an /10n est un dveloppement dcimal
propre de x si la suite (an ) ne devient pas constante gale 9.
On a alors le rsultat suivant :
Thorme
Tout rel x [0,1[ possde un unique dveloppement dcimal propre.
Dmonstration de lexistence dun dveloppement dcimal (dmonstration non exigible)
Fixons x [0,1[. Dans ce qui suit, la notation a dsigne la partie entire dun rel a. Pour
tout n N, on pose
10n x
An =
,
10n
en remarquant que A0 = x = 0, et pour tout n > 1, on pose
an = 10n (An An1 ),

de sorte que An soit la troncature de x n dcimales, et an la n-ime dcimale du dveloppement


de x. Pour tout n > 1, on a 0 6 an 6 9. En effet,
10n x 1 < 10n x 6 10n x,

do

On en dduit que
1
n =
10

1
x n
10

1
< An 6 x.
10n

(2)


x < An An1 < x x

1
10n1

1
10n1

et finalement lingalit 0 6 an 6 9 pour tout n > 1. Daprs la proprit prcdente, la srie


P
n
n>1 an /10 converge.
P
En fait, on remarque que la srie n>1 an /10n est tlescopique, et pour tout p > 1,
p
p
X
X
an
(An An1 ) = Ap A0 = Ap .
=
10n

n=1

n=1

Or, daprs lingalit (2), Ap x, do le rsultat.


p+

Remarque On peut montrer quun rel x [0,1[ est rationnel si et seulement si son dveloppement dcimal propre est priodique partir dun certain rang.
22

III.
1.

Convergence absolue
Dfinition et lien avec la convergence

La partie prcdente montre que les sries termes positifs jouent un rle particulier et que
lon dispose pour ces sries de critres de convergence. Il serait donc intressant
de pouvoir sy
P
ramener. Pour cela, la dmarche la plus naturelle est de considrer la srie n>0 |un |.
Dfinition

On dit que la srie


converge.

n>0 un

est absolument convergente si la srie

n>0 |un |

Thorme
P
Si n>0 un est absolument convergente, alors elle est convergente.
Dans ce cas, on a lingalit triangulaire
+ +
X X


|un |.
un 6



n=0

n=0

P
P
Dmonstration Les sries
n>0 Im(un ) sont absolument convergentes par
n>0 Re(un ) et
comparaison, car pour tout n > 0,
p
|Re(un )| 6 Re(un )2 + Im(un )2 = |un | et de mme |Im(un )| 6 |un |.
P
P
Si lon montre que les sries n>0 Re(u
)
et
n
n>0 Im(un ) convergent, alors daprsPune proP
prit donne plus haut, on saura que n>0 un converge. Posons n = Re(un ) (ainsi n>0 |n |
converge) et

1
1

+
n = max{0,n } = (|n | + n ), n = max{0, n } = (|n | n ).
2
2
Pour tout n N,

0 6 +
n 6 |n |, 0 6 n 6 |n |.
P
P
+

Par comparaison de sries termes positifs,


n>0 nPet
n>0 n convergent. On remarque

enfin que lon a n = +


n n , et donc, par diffrence,
n>0 n converge. On procde de mme
avec la partie imaginaire.
On a alors, pour tout p N,

p
p
X X


|un |,
un 6



n=0

n=0

do, en passant la limite, lingalit souhaite.

Exemples
P
P
La srie gomtrique n>0 z n est absolument convergente si et seulement si n>0 |z|n converge,
ce qui quivaut : |z| < 1. On remarque que dans ce cas, la convergence quivaut la convergence
absolue, mais cest un cas trs particulier.
X (1)n
est absolument convergente.
La srie
n(n + 1)
n>1

Attention ! La rciproque du thorme ci-dessus est fausse, comme le montrent les exemples des
sries harmonique et harmonique alterne :
X (1)n1 X 1
X (1)n1
=

converge mais
diverge.


n
n
n
n>1

n>1

n>1

Si la srie ne converge pas absolument, on ne peut pas en dduire quelle ne converge pas.
23

2.

Thorme de comparaison
Thorme
P
P
Soient
n>0 un une srie termes dans K, et
n>0 vn une srie termes rels
positifs. On suppose que
un = O(vn )
P
et que n>0 vn est convergente.
P
Alors n>0 un est absolument convergente, et donc convergente.

Rappel Pour des suites (un ) et (vn ) telles que vn 6= 0 partir dun certain rang N , la condition
un = O(vn ) signifie que la suite (un /vn )n>N est borne.
Dmonstration Daprs lhypothse,
il existe M R+P
et N N tels que pour tout n > N ,
P
on ait |un | 6 M vn . La srie
v
converge,
donc
galement, et par
n
n>0
n>0 M vn converge P
P
comparaison de sries termes positifs, n>0 |un | converge, cest--dire que n>0 un converge
absolument. La convergence absolue entrane la convergence, do le rsultat.

Remarques
Lhypothse un = O(vn ) est en particulier vrifie dans chacun des cas suivants, qui sont des
cas particuliers frquents dutilisation du thorme prcdent :
un = o(vn ).
Pour tout n assez grand, |un | 6 vn .
un vn .

Si (un ) est valeurs dans K , on peut essayer dappliquer la rgle de dAlembert la suite


un+1


un .
P
Si cette suite possde une limite
< 1, alors la srie n>0 |un | converge daprs la rgle de
P
dAlembert, cest--dire que n>0 un converge absolument,
et donc elle converge. Si elle possde
P
une limite > 1 ou une limite
infinie,
alors
la
srie
|u
n>0 n | diverge grossirement, donc un ne
P
tend pas vers 0, et la srie n>0 un diverge galement grossirement (lutilisation de la divergence
grossire est ici cruciale).
X zn
est absolument convergente.
Exemple Pour tout nombre complexe z, la srie
n!
n>0

En effet, si z 6= 0 (sinon la convergence est vidente), alors pour tout n N,




n+1
n+1
z
z
|z|
/(n + 1)!
/(n + 1)!


0.
= n + 1 et donc
n+

z n /n!
z n /n!

La rgle de dAlembert sapplique. Nous montrerons dans le chapitre Sries entires que la
somme de cette srie est ez . Cette srie est appele srie exponentielle.
De la convergence de cette srie, on dduit notamment que pour tout nombre complexe z,
zn
0.
n! n+
On retrouve ainsi un thorme de croissances compares : pour tout z C, z n = o(n!). On peut
de mme retrouver certaines des autres croissances compares usuelles : n = o(an ) si (,a) C2
et |a| > 1, n! = o(nn ). Cela na rien dtonnant, en fait, leur dmonstration classique repose
sur le mme principe que celui mis en oeuvre dans la dmonstration de la rgle de dAlembert :
en notant un le quotient dont on veut prouver quil tend vers 0 (respectivement, un = z n /n!,
n /an ou n!/nn ), on montre que un = O(kn ) pour un certain k [0,1[ en dterminant la limite
du quotient un+1 /un . Dans les cas prsents, cette limite existe et vaut respectivement 0, 1/a et
1/e, dont le module est lment de [0,1[ dans les trois cas.
24

IV.

La formule de Stirling

Thorme
On a lquivalent suivant : n!

 n n
e

2n.

Ide de dmonstration (non exigible) Notons, pour tout entier naturel n > 1,
un =

n!


.
n n
2n
e

Alors un > 0 pour tout n > 1 ; le but est de dmontrer que un 1. Pour cela, dfinissons


un+1
vn = ln
.
un
X
Premire tape : montrons que
vn converge.
n>1

Par dfinition, pour tout n > 1,

(n+1)!
r





n+1 n+1
2(n+1)
nn
un+1
n
( e )
= ln
vn = ln
= ln (n + 1) e
n!
un
(n + 1)n+1 n + 1

n n
2n
(e)
 
n r

n
n
= ln e
n+1
n+1

n+ 1 !
2
n
= ln e
n+1

 

n
1
=1+ n+
ln
2
n+1

 

1
1
=1 n+
ln 1 +
.
2
n
Effectuons alors un dveloppement limit de vn lordre 2 :
 


1
1
1
1
2 +O
vn = 1 n +
2
n 2n
n3

  
 
1
1
1
1
=1 1
+O
+O

2
2n
n
2n
n2
 
1
=O
.
n2

2
La srie de terme
X gnral 1/n est une srie de Riemann dexposant 2 > 1 donc convergente. Par
comparaison,
vn converge absolument, et donc converge.
n>1

Deuxime tape : montrons que (un ) converge.


Pour tout n > 1,


un+1
= ln(un+1 ) ln(un ),
ln
un
P
qui est le terme gnral dune srie tlescopique. La srie n>1 vn tant convergente, on en dduit
que la suite (ln(un )) est convergente, puis que (un ) converge vers une limite strictement positive,
car la fonction exponentielle est continue et valeurs strictement positives. Il existe donc > 0
tel que
n!

.
n n
2n
e
25

Troisime tape : montrons que = 1.


On peut montrer (voir Annexe 2) que les intgrales de Wallis
In =

/2

sinn (x) dx

vrifient, pour tout entier naturel n,


I2n

(2n)!
,
= 2n+1
2
(n!)2

Ainsi

et que I2n

(2n)!
22n (n!)2

Sachant que
n!
on a donc

Aprs simplifications, on obtient

.
4n

1
.
n

 n n
2n,
e

2n 2n
e
2n
2
ne

4n

1
22n .
n
2n

1
22n

22n ,
n
n

et donc = 1.

V.

Le thorme des sries alternes


Dfinition
On appelle srie alterne une srie de la forme
de nombres rels de signe constant.

Exemples La srie harmonique alterne, les sries

n
n>0 (1)

(1)n n2 ,

n>0

un o (un ) est une suite

X (1)n
, sont alternes.
1+ n

n>0

Thorme spcial des sries alternes


P
Soit n>0 (1)n un une srie alterne dont la valeur absolue du terme gnral (|un |)nN
est dcroissante et converge vers 0. Alors :
X
La srie
(1)n un converge.
n>0

Pour tout m N,

+
X

(1)n un est du signe de (1)m um , et

n=m


+

X


(1)n un 6 |um |.



n=m

Dmonstration Nous allons faire la dmonstration dans le cas o un > 0 pour tout n, lautre
cas tant similaire (avec des inversions de signes). Notons (Sn ) la suite des sommes partielles de
la srie. Nous allons montrer que les suites (S2n ) et (S2n+1 ) sont adjacentes. On sait que cela
implique quelles convergent vers la mme limite, ce qui son tour entrane que (Sn ) converge
(vers cette mme limite). Cela dmontrera le premier point.
26

La suite (S2n+1 ) est croissante ; en effet, pour tout n N,


S2n+3 S2n+1 = u2n+2 u2n+3 > 0,
car (un ) est dcroissante. De mme, pour tout n N,
S2n+2 S2n = u2n+1 + u2n+2 6 0,
et donc (S2n ) est dcroissante. Enfin, S2n+1 S2n = u2n+1 0. Do le rsultat.
Dmontrons maintenant lestimation de la somme et des restes. On sait daprs ce qui prcde
que pour tout p N,
+
X
(1)n un 6 S2p .
S2p+1 6
n=0

En particulier, pour p = 0,
u0 u1 6

+
X

(1)n un 6 u0 .

n=0

P
n
Par dcroissance
de (un ), on a u0 u1 > 0. On en dduit que +
n=0 (1) un est du signe de u0
+
+

X
X


(1)n un on remarque que la srie
(ici, positif) et (1)n un 6 |u0 |. Pour lestimation de


n=m

n=0

(1)n un =

n>m

(1)n+m un+m = (1)m

(1)n un+m

n>0

n>0

est, au facteur (1)m prs, une srie alterne de rels dont la valeur
du terme gnral
P absolue
n u est du signe de
dcrot vers 0. En lui appliquant ce qui prcde, on obtient que +
(1)
n
n=m
(1)m um , et sa valeur absolue est majore par |um |.



X (1)n
1

Exemple La srie
est alterne, et
dcrot vers 0. Cette srie est donc
n
n n>1
n>1

convergente et pour tout m > 1, la somme

+
X
(1)n

n
n=m

1
est du signe de (1)m , et est majore en valeur absolue par . Par exemple,
m
+
X
(1)n

6 0 et
n
n=1
+
X
(1)n

> 0 et
n
n=2

+
X
(1)n

6 1,
n
n=1

+
X
(1)n
1

6 ,
n
2
n=2

do

16

do

06

+
X
(1)n

6 0,
n
n=1

+
X
(1)n
1

6 .
n
2
n=2

Remarques
Lorsquune srie converge, son reste dordre m tend vers 0 lorsque m +. Dans le cas
dune srie alterne qui vrifie les hypothses du thorme spcial, on peut affiner ce rsultat en
donnant le signe de ce reste et en prcisant la vitesse avec laquelle il tend vers 0.
Parfois, les hypothses du thorme ne sont vrifies qu partir dun rang n0 > 1. Dans ce
cas, la conclusion sur la convergence de la srie reste vraie, mais le rsultat sur le signe et la
majoration des restes ne peut tre appliqu que pour m > n0 .
27

VI.

Produit de deux sries

P
P
Soient n>0 un et n>0 vn deux sries dlments de K. Si ces deux sries convergent, on
sait que lon peut faire une combinaison linaire de leur somme. On peut aussi se demander si on
peut les multiplier, et si oui, si lon peut exprimer le produit obtenu comme somme dune srie.
Dfinition
On appelle produit de Cauchy des sries

n>n0

un et

up vq .

n>m0

vn la srie

n>n0 +m0 p+q=n

Lorsque n0 = m0 = 0, cette srie scrit de trois faons :


X X

up vq =

n>0 p+q=n

n
XX

uk vnk =

n>0 k=0

n
XX

unk vk .

n>0 k=0

Thorme (admis : dmonstration non exigible)


X
X
Soient
un et
vn deux sries absolument convergentes dlments de K.
n>0

n>0

Alors le produit de Cauchy de


+
X

n=0

un

+
X

n=0

n>0 un

vn

et

+ X
n
X

n>0 vn

est absolument convergent et

uk vnk =

n=0 k=0

+ X
n
X

unk vk .

n=0 k=0

P
n
Exemple Pour x ]1,1[ , la srie
n>0 x converge absolument. Calculons le carr de sa
somme ; daprs le thorme prcdent,
!2 + n
+ X
+
n
+
XX
X
X
X
n
k nk
n
=
x
x x
=
(n + 1) xn .
x =
n=0

n=0 k=0

n=0 k=0

n=0

Daprs la formule donnant la somme dune srie gomtrique,


!2 
2
+
X
1
n
=
,
x
1x
n=0
de sorte que lon a montr que pour tout x ]1,1[ ,
+
X

(n + 1) xn =

n=0

1
.
(1 x)2

Nous verrons dans le chapitre Sries entires que cela na rien dtonnant : il sagit dune
opration de drivation !
P
P
Remarque Dans le cas du produit de Cauchy de deux sries n>n0 un et n>m0 vn avec n0 > 1
et/ou m0 > 1, pour ne pas se tromper, il ne faut pas hsiter se ramener au cas gnral en posant
un = 0 pour 0 6 n < n0 et vn = 0 pour 0 6 n < m0 . On simplifie
obtenue.
P ensuite lexpression
P
On pourra aussi faire des changements dindices : par exemple, n>n0 un = n>0 un+n0 .

Contre-exemple Lhypothse dabsolue convergence est importante, comme le montre le contreexemple suivant : considrons la srie
X (1)n
,
n
n>1

28

qui est convergente daprs le thorme des sries alternes, mais pas absolument convergente
daprs la caractrisation des sries de Riemann convergentes. Calculons son produit de Cauchy
par elle-mme : il sagit de la srie
n1
X
X
X (1)k (1)nk
X n1
1

p
.
=
(1)n
n

k
k
k(n

k)
n>2
n>2 k=1
k=1

Une tude de fonction montre facilement que pour tout k [[1,n 1]], k(n k) 6
1
p

k(n k)

>

n2
, et donc
4

2
.
n

Ainsi, en valeur absolue, le terme gnral de la srie produit vrifie


n1
X
k=1

2(n 1)
1
>
2,
n
k(n k)

et donc le produit de Cauchy diverge grossirement.


Remarque En revanche, la convergence absolue des deux sries nest pas ncessaire la convergence de leur produit de Cauchy : on peut montrer que si les deux sries convergent, dont une
absolument, alors la srie produit de Cauchy converge.
X zn
est absolument convergente, de mme pour
Application Pour tout (z,z ) C2 , la srie
n!
n>0

z , donc daprs le thorme prcdent,


! +
! + n
+ n
X X z k (z )nk
X (z )n
X
z
=
.
n!
n!
k! (n k)!
n=0

Or,

n=0 k=0

n=0

 
n
n
X
X
z k (z )nk
1 n k nk
1
=
z (z )
= (z + z )n ,
k! (n k)!
n! k
n!
k=0

k=0

daprs la formule du binme de Newton. Finalement,


! +
! +
+ n
X (z + z )n
X (z )n
X
z
=
.
n!
n!
n!
n=0

n=0

n=0

En admettant le rsultat mentionn plus haut (i.e., le fait que

ceci est aussi une consquence de la formule ez+z = ez ez .

29

P+

n=0 z

n /n!

= ez pour tout z C),

30

Chapitre 3

Espaces vectoriels et applications


linaires
Dans ce chapitre K dsigne R ou C. Ses lments sont appels scalaires.

I.

Espaces vectoriels

1.

Gnralits
Dfinition Espace vectoriel
Soit E un ensemble non vide, muni de deux lois :
Une loi interne note +, de E E valeurs dans E,
Une loi externe note , de K E valeurs dans E.
On dit que (E, + ,) est un K-espace vectoriel si :
Il existe un lment de E, not 0E , tel que pour tout x E, x + 0E = x,
Pour tout x E, il existe y E tel que x + y = 0E (le vecteur y est alors appel
oppos de x et not x),

pour

tout (x,y,z) E 3 , (,) K2 ,


x + y = y + x (commutativit de +),
(x + y) + z = x + (y + z) (associativit de +),
1 x = x,
(x + y) = x + y (distributivit gauche de sur +),
( + ) x = x + x (distributivit droite de sur laddition de K),
( ) x = ( x) (proprit dassociativit).

On dit aussi que (E, + ,) est un espace vectoriel sur K. Sil ny a aucune ambigut
sur les lois, on mentionne simplement E au lieu de (E, + ,). Les lments de E sont
appels vecteurs.
Remarques
On note trs souvent x au lieu de x. Il est dusage de noter le scalaire gauche et le vecteur
droite.
Si un vecteur x E apparat des deux cts dune galit de la forme x + y = x + z, alors par
ajout de x gauche et droite, par commutativit et associativit de +, on peut simplifier
lgalit en enlevant x des deux cts.
Llment 0E est unique : si e E vrifie la mme proprit que 0E , on a e = e + 0E = 0E .
De mme, loppos dun vecteur x E est unique : si y E vrifie x + y = 0E , alors par
simplification, on a y = x.
Daprs les proprits ci-dessus, pour tout x E, 0 x = (0 + 0) x = 0 x + 0 x, et donc par
simplification, on a 0 x = 0E .
31

Alors, 0E = 0 x = (1 + (1)) x = 1 x + (1) x = x + (1) x, et donc x = (1) x.


De mme, on montre que pour tout K, 0E = 0E .

Espaces vectoriels de rfrence


Soient n, p et k trois entiers naturels non nuls.
Lensemble Kn est un K-espace vectoriel.
Lensemble K[X] des polynmes coefficients dans K est un K-espace vectoriel.
Lensemble Kn [X] des polynmes coefficients dans K de degr infrieur ou gal n est un
K-espace vectoriel.
Lensemble Mn,p (K) des matrices n lignes et p colonnes coefficients dans K est un K-espace
vectoriel.
Lensemble E X = F(X,E) des fonctions de X dans E, o X est un ensemble et E un K-espace
vectoriel, est un K-espace vectoriel, avec les oprations usuelles.
Lensemble C 0 (I,K) des fonctions continues sur I, intervalle de R, valeurs dans K, est un
K-espace vectoriel.
Lensemble C k (I,K) des fonctions de classe C k sur I, intervalle de R, valeurs dans K, est un
K-espace vectoriel.
Lensemble KN des suites valeurs dans K est un K-espace vectoriel.
Proprit/Dfinition Combinaison linaire
Soient E un K-espace vectoriel et (e1 , . . . ,ep ) une famille de vecteurs de E. Pour tout
(1 , . . . ,p ) Kp , on dfinit un vecteur x de E en posant
x=

p
X
i=1

i ei = 1 e1 + + p ep .

Les vecteurs de cette forme sont appels combinaisons linaires de e1 , . . . ,ep .


Remarque Dans lexpression prcdente, il est inutile de parenthser car laddition est associative. De mme, lordre des termes est sans importance par commutativit.
Dfinition Sous-espace vectoriel
Soit E un K-espace vectoriel. On dit quun ensemble F est un sous-espace vectoriel
de E, si F E et si F est un K-espace vectoriel.
Pour montrer quun ensemble est un espace vectoriel, il suffit souvent de montrer que cest
un sous-espace vectoriel dun espace vectoriel de rfrence. Pour cela, on utilise la proprit
suivante :
Proprit Caractrisation des sous-espaces vectoriels
Soit E un K-espace vectoriel. Alors F est un sous-espace vectoriel de E si et seulement
si :
F E,
0E F ,
K, (x,y) F 2 , x + y F .
Remarque Pour prouver que F nest pas un sous-espace vectoriel de E, il suffit souvent de
prouver que 0E
/ F . Par exemple, {A Mn (R); A2 = In } nest pas un sous-espace vectoriel de
Mn (R).
32

Exemple Rn [X] est un sous-espace vectoriel de R[X] et C 1 (R,R) est un sous-espace vectoriel de
C 0 (R,R).

Exercice Quels sont parmi les ensembles suivants ceux qui sont des espaces vectoriels ?
Lensemble des suites relles (un )n>0 vrifiant : n N, un+2 = 2un+1 + un .
Lensemble des solutions de y + ay = 0 o a est une fonction continue.
Lensemble des solutions de y + ay = b o, de plus, b est une fonction continue non nulle.
Lensemble des polynmes P C[X] tels que P (1) = 0, puis tels que P (0) = 1.
Lensemble K[X]P des multiples dun polynme P .
Proprit Intersection de sous-espaces vectoriels
Soient E un K-espace vectoriel,TI un ensemble dindices et (Ei )iI une famille de sousespaces vectoriels de E. Alors iI Ei est un sous-espace vectoriel de E.

T
Dmonstration Bien sr,T iI Ei est inclus dans E, et contient 0E comme chacun des Ei . Soient
x et y deux lments de iI Ei et un scalaire. Alors, pour tout
T i I, x et y appartiennent
au sous-espace vectoriel Ei , et donc x + y Ei . Ainsi x + y iI Ei .

Proprit/Dfinition Espace vectoriel engendr par une famille

Soit F = (e1 , . . . ,ep ) une famille de vecteurs dun K-espace vectoriel E.


Lintersection de tous les sous-espaces vectoriels de E auxquels appartiennent e1 , . . . ,ep
est un sous-espace vectoriel de E ; cest le plus petit (au sens de linclusion) sous-espace
vectoriel de E auquel appartiennent e1 , . . . ,ep .
Il est appel espace vectoriel engendr par F, et not Vect(F) ou Vect(e1 , . . . ,ep ).
Remarque Vect(F) existe toujours car E est un sous-espace vectoriel de E auquel appartiennent
e1 , . . . ,ep .
Lintersection porte donc sur un ensemble dindices non vide.
Dmonstration Lintersection de tous les sous-espaces vectoriels de E auxquels appartiennent
e1 , . . . ,ep est un sous-espace vectoriel de E daprs la proprit prcdente. De plus, si F est
un sous-espace vectoriel de E auquel appartiennent e1 , . . . ,ep , alors F figure parmi lensemble
des sous-espaces vectoriels de E dont on fait lintersection pour dfinir Vect(F). En particulier,
Vect(F) F , ce qui montre que Vect(F) est le plus petit sous-espace vectoriel de E auquel
appartiennent e1 , . . . ,ep .

Proprit
Soit F = (e1 , . . . ,ep ) une famille de vecteurs dun K-espace vectoriel E.
Alors Vect(F) est lensemble des combinaisons linaires de e1 , . . . ,ep .
Dmonstration Soit F lensemble des combinaisons linaires de e1 , . . . ,ep . Il est immdiat de
vrifier que F est un sous-espace vectoriel de E. De plus, e1 , . . . ,ep appartiennent F . On a donc
Vect(F) F. Rciproquement, Vect(F) tant un sous-espace vectoriel de E avec ei Vect(F)
pour tout i [[1,p]], toutes les combinaisons linaires de e1 , . . . ,ep appartiennent Vect(F), do
F Vect(F).


0 1 1

Exemple Soit M = 0 0 1 M3 (R). Alors


0 0 0

a b b
Vect(I3 ,M ) = 0 a b ; (a,b) R2 .

0 0 a
33

Dans toute la suite, E dsigne un K-espace vectoriel.

2.

Familles libres, gnratrices, bases et dimension


Dfinition Familles libres, gnratrices, bases
Soit F = (e1 , . . . ,ep ) une famille dlments de E.
On dit que F est libre si pour toute famille de scalaires (1 , . . . ,p ), on a
p
X
i=1

i ei = 0E

i [[1,p]], i = 0.

On dit aussi que les vecteurs e1 , . . . ,ep sont linairement indpendants.


Si elle nest pas libre, on dit que la famille est lie, ou que les vecteurs e1 , . . . ,ep sont
linairement dpendants. Ceci
Pquivaut lexistence dune famille (1 , . . . , p ) de
scalaires non tous nuls telle que pi=1 i ei = 0E .
On dit que F est gnratrice de E si pour tout x E, il existe une famille de
scalaires (1 , . . . , p ) telle que
p
X
i ei .
x=
i=1

Ceci quivaut : E = Vect(e1 , . . . ,ep ). On dit galement que (e1 , . . . ,ep ) engendre E.
On dit que F est une base de E si elle est la fois libre et gnratrice de E.

Remarques
Une famille o figure le vecteur nul est ncessairement lie.
Une famille constitue dun vecteur est lie si et seulement si ce vecteur est nul.
Si (e1 , . . . ,ep ) est une famille lie, alors lun des vecteurs e1 , . . . ,ep est combinaison linaire des
autres : en effet, il existe (1 , . . . ,p ) Kp et i [[1,p]] tels que i 6= 0 et 1 e1 + + p ep = 0E ,
et alors
1 X
ei =
j ej .
i
j6=i

En revanche, on ne peut pas affirmer que nimporte lequel des vecteurs e1 , . . . ,ep est combinaison
linaire des autres.
Proprit Famille de polynmes degrs chelonns (ou tags)
Soit (P0 , . . . ,Pn ) une famille de polynmes tous non nuls et degrs chelonns, cest-dire telle que pour tout i [[0,n 1]], deg(Pi ) < deg(Pi+1 ). Alors (P0 , . . . ,Pn ) est
libre.
Dmonstration Soit (0 , . . . ,n ) Kn tel que 0 P0 + + n Pn = 0. Tous les coefficients du
polynme 0 P0 + + n Pn sont donc nuls. La famille (P0 , . . . ,Pn ) tant degrs chelonns, le
coefficient dominant de ce polynme est n an , o an est le coefficient dominant de Pn , non nul
car Pn est non nul. Donc n = 0. En ritrant ce raisonnement, on obtient que 0 = = n = 0,
do le rsultat.
On peut aussi rdiger ce raisonnement sans ltape ditration : on raisonne par labsurde, en
supposant que tous les i ne sont pas nuls ; on peut donc dfinir i0 = max{i [[0,n]]; i 6= 0}
(maximum dune partie non vide majore de N). On raisonne alors comme ci-dessus : le coefficient
dominant de 0 P0 + + n Pn est i0 ai0 , o ai0 est le coefficient dominant de Pi0 , non nul car
Pi0 est non nul. On en dduit que i0 = 0, ce qui contredit la dfinition de i0 . Donc tous les i
sont nuls.

34

Proprit/Dfinition
La famille (e1 , . . . ,ep ) est une base de E si et seulement si tout lment de E scrit de
manire unique comme combinaison linaire de e1 , . . . ,ep .
P
Dans ce cas, si x = pi=1 xi ei , on dit que x1 , . . . ,xp sont les coordonnes de x dans
la base (e1 , . . . ,ep ).
Dmonstration laisse en exercice (elle est trs semblable une dmonstration donne ci-dessous,
voir le paragraphe sur les sommes directes).

Dfinition Espace de dimension finie
On dit que E est de dimension finie si E admet une famille gnratrice (finie). Dans
le cas contraire, on dit que E est de dimension infinie.

Thorme de la base extraite


Si E 6= {0E }, alors de toute famille gnratrice de E, on peut extraire une base de E :
si (e1 , . . . ,ep ) est une famille gnratrice de E, il existe une partie I de [[1,p]] telle que
(ei )iI soit une base de E.
Dmonstration Soit (e1 , . . . ,ep ) une famille gnratrice de E. Si (e1 , . . . ,ep ) nest pas libre, on
doit avoir p > 2 : en effet, si lon avait p = 1, on aurait e1 = 0E (car la famille (e1 ) est lie), et donc
E = Vect(e1 ) = {0E }, ce qui est exclu. Alors lun des vecteurs de la famille (e1 , . . . ,ep ) est combinaison linaire des autres, daprs une remarque prcdente. Quitte renommer les lments,
on peut supposer que ep Vect(e1 , . . . ,ep1 ), et alors E = Vect(e1 , . . . ,ep ) = Vect(e1 , . . . ,ep1 ).
On a donc construit une famille gnratrice de E p 1 lments et on peut recommencer
cette procdure. La procdure sarrte ncessairement, car le nombre dlments de la famille
construite dcrot strictement chaque tape. Lorsque la procdure sarrte, la famille obtenue
est libre ; cest finalement une famille libre et gnratrice de E, donc une base de E.

Remarque Dans la dmonstration prcdente apparat une ide trs souvent utilise en algorithmique pour prouver quun algorithme se termine : on a utilis un variant de boucle , ici
le nombre dlments de la famille.
Du thorme prcdent, on dduit immdiatement le rsultat suivant :
Corollaire
Si E 6= {0E } et si E est de dimension finie, alors E possde des bases.

Thorme de la base incomplte


Si E est de dimension finie, alors toute famille libre dlments de E peut tre complte
en une base de E. De plus, pour complter une telle famille, on peut choisir les vecteurs
parmi ceux dune famille gnratrice donne lavance.
Dmonstration Soient (e1 , . . . ,ep ) une famille libre dlments de E et (u1 , . . . ,um ) une famille gnratrice de E (une telle famille existe car E est de dimension finie). Posons F0 = Vect(e1 , . . . ,ep ).
Si u1 nappartient pas Vect(e1 , . . . ,ep ), alors on pose ep+1 = u1 et F1 = Vect(e1 , . . . ,ep+1 ).
La famille (e1 , . . . ,ep+1 ) ainsi construite est libre : en effet, soit (1 , . . . ,p+1 ) Kp+1 tel que
Pp+1
i=1 i ei = 0E . Si lon avait p+1 6= 0, on aurait ep+1 Vect(e1 , . . . ,ep ), ce qui est absurde. Ainsi
35

P
p+1 = 0, puis pi=1 i ei = 0E , ce qui par libert de (e1 , . . . ,ep ) entrane que 1 = = p = 0 ;
tous les i sont donc nuls.
Si u1 Vect(e1 , . . . ,ep ), on ne complte pas la famille (e1 , . . . ,ep ), on pose F1 = F0 .

On poursuit alors la procdure avec u2 , dont on teste lappartenance F1 , ce qui permet de


dfinir F2 . On procde ainsi jusqu um .
lissue de ltape m, on dispose donc dune famille (e1 , . . . ,ek ) avec k > p, qui est libre, et
telle que u1 , . . . ,um sont des lments de Fm = Vect(e1 , . . . ,ek ). Alors
E = Vect(u1 , . . . ,um ) Vect(e1 , . . . ,ek ) E.
La famille (e1 , . . . ,ek ) est donc gnratrice de E, et tant libre, cest une base de E ; de plus, elle
a t construite en compltant la famille (e1 , . . . ,ep ) avec certains des vecteurs u1 , . . . ,um .

Thorme
Soit (e1 , . . . ,ep ) une famille de vecteurs de E et (u1 , . . . ,up+1 ) une famille de vecteurs
de Vect(e1 , . . . ,ep ). Alors la famille (u1 , . . . ,up+1 ) est lie.

Remarque En particulier, si E admet une famille gnratrice finie (e1 , . . . ,ep ), alors une famille
libre dlments de E est compose dau plus p vecteurs.
Dmonstration On procde par rcurrence sur p. Pour p = 1, le rsultat est vrai car deux
vecteurs colinaires un mme vecteur e1 sont linairement dpendants. Supposons le rsultat
vrai pour un certain entier p > 1. Soient p + 2 vecteurs u1 , . . . ,up+2 engendrs par p + 1 vecteurs
e1 , . . . ,ep+1 . On peut donc crire
u1 = 1,1 e1 + + 1,p+1 ep+1 ,

u2 = 2,1 e1 + + 2,p+1 ep+1 ,


..
.

up+2 = p+2,1 e1 + + p+2,p+1 ep+1 ,


o les i,j sont des scalaires. Si i,1 = 0 pour tout i, alors (u1 , . . . ,up+2 ) est une famille de vecteurs
de Vect(e2 , . . . ,ep+1 ), donc est lie par hypothse de rcurrence. Sinon, on peut supposer sans
perte de gnralit que 1,1 6= 0. Alors, grce 1,1 , on limine e1 dans lexpression des vecteurs
u2 , . . . , up+2 :
2,1
u1 Vect(e2 , . . . ,ep+1 ),
u2
1,1
..
.
p+2,1
u1 Vect(e2 , . . . ,ep+1 ).
up+2
1,1
On en dduit que les p + 1 vecteurs
u2

2,1
p+2,1
u1 , . . . , up+2
u1
1,1
1,1

sont combinaisons linaires des p vecteurs e2 , . . . ,ep+1 . Par hypothse de rcurrence, ils forment
donc une famille lie. En crivant une combinaison linaire nulle de ces vecteurs avec des coefficients non tous nuls, on voit alors que la famille (u1 , . . . , up+2 ) est lie.

Remarque Cette ide est la base de lalgorithme de Gauss-Jordan, dont on rappelera le principe
en dtails dans le chapitre Matrices.
36

Thorme/Dfinition Dimension
Si E 6= {0E } et si E est de dimension finie, alors il existe n N tel que toutes les
bases de E sont constitues de n vecteurs.
Lentier n est appel dimension de E, not dim(E).
Si E = {0E }, on pose dim(E) = 0 (mais dans ce cas, E nadmet aucune base).
Dmonstration Soient B et B deux bases de E constitues respectivement de p et m vecteurs. La
famille B est libre et B engendre E, donc daprs le thorme prcdent, p 6 m. En changeant
les roles de B et B , on obtient m 6 p et finalement p = m. Toutes les bases de E sont donc
constitues du mme nombre de vecteurs.

Remarques
Si E est de dimension n > 1, il est engendr par une famille de n vecteurs, donc toute famille
de n + 1 vecteurs de E est lie.
Si E = {0E }, la convention dim(E) = 0 assure que cette dernire proprit est encore valable.
Ainsi, en dimension n, une famille libre est compose dau plus n vecteurs. De mme, une
famille gnratrice est compose dau moins n vecteurs, car dune telle famille, si E 6= {0E }
(sinon le rsultat est vident), on peut extraire une base de E, qui comporte n vecteurs.
Exemple Les espaces de rfrence sont-ils de dimension finie ? Si oui, donner leur dimension.
Thorme Caractrisation des bases
On suppose E de dimension finie n > 1. Soit F une famille de n vecteurs de E.
Alors on a les quivalences :
F est une base de E

F est libre

F est une famille gnratrice de E.

Dmonstration Si F est libre, on peut la complter en base de E, et cette base comporte n


vecteurs, qui est dj le nombre de vecteurs de F. Il ny a donc pas eu de compltion faire,
cest--dire que F est une base de E. De mme, si F est gnratrice de E, on peut en extraire
une base de E (car E 6= {0E }), mais il ny a en fait pas dextraction faire, donc F est une base
de E. Les implications rciproques sont videntes.

Application Soit (P0 , . . . ,Pn ) une famille dlments de K[X] telle que deg(Pi ) = i pour tout
i [[0,n]]. Alors (P0 , . . . ,Pn ) est une base de Kn [X].
En effet, la famille (P0 , . . . ,Pn ) dlments de Kn [X] est degrs chelonns et tous ses
lments sont non nuls (le degr du polynme nul est ), donc elle est libre. De plus, elle
comporte n + 1 = dim(Kn [X]) lments, donc daprs le thorme ci-dessus, cest une base de
Kn [X].
Thorme
On suppose E de dimension finie n. Soit F un sous-espace vectoriel de E. Alors :
F est de dimension finie et dim(F ) 6 dim(E).
Si dim(F ) = n, alors E = F .
Dmonstration On commence par remarquer que pour les deux points, si F = {0E }, le rsultat
est vident. On suppose donc dans la suite que F 6= {0E }.
Si F tait de dimension infinie, on pourrait construire, par une procdure proche de la dmonstration du thorme de la base incomplte, une famille libre constitue dun nombre arbitrairement grand dlments de F , et en particulier une famille libre de n + 1 vecteurs de E, ce qui est
impossible car E est de dimension n ; F est donc de dimension finie. Soit (e1 , . . . , ep ) une base
de F . Cest une famille libre dlments de E, on a donc p 6 n, cest--dire dim(F ) 6 dim(E).
37

De plus, si dim(F ) = dim(E) (i.e. p = n), alors (e1 , . . . , ep ) est une famille libre de n vecteurs
de E, cen est donc une base ; on en dduit que E = Vect(e1 , . . . , ep ) = F.

Attention ! Il est essentiel que F soit un sous-espace vectoriel de E pour appliquer ce thorme.
Si F et G sont deux sous-espaces vectoriels de E de mme dimension, on ne peut videmment
pas affirmer que F = G.

Dfinition Base adapte


On suppose E dimension finie. Soit F un sous-espace vectoriel de E.
Une base de E est dite adapte F si on peut en extraire une base de F .

Dfinition Rang
Soit (x1 , . . . , xp ) une famille de vecteurs de E, espace de dimension finie ou non.
On appelle rang de cette famille, not rg(x1 , . . . , xp ), la dimension du sous-espace
vectoriel Vect(x1 , . . . , xp ).

Remarque La famille finie (x1 , . . . , xp ) est gnratrice de Vect(x1 , . . . , xp ), qui est donc de
dimension finie infrieure ou gale p. On en dduit que rg(x1 , . . . ,xp ) est bien dfini, et infrieur
ou gal p.
Proprit Caractrisation des familles libres, gnratrices par le rang
Si E est de dimension finie n, une famille (x1 , . . . , xp ) de vecteurs de E est gnratrice
de E si et seulement si rg(x1 , . . . , xp ) = n.
Une famille (x1 , . . . , xp ) de vecteurs de E (de dimension finie ou non) est libre si et
seulement si rg(x1 , . . . , xp ) = p.
Si E est de dimension finie n, une famille (x1 , . . . , xp ) de vecteurs de E est une base
de E si et seulement si p = n et rg(x1 , . . . , xn ) = n.

Dmonstration
La famille (x1 , . . . , xp ) est gnratrice de E si et seulement si Vect(x1 , . . . , xp ) = E, ce
qui quivaut daprs le thorme prcdent dim(Vect(x1 , . . . , xp )) = dim(E), i.e., lgalit
rg(x1 , . . . , xp ) = n.
Pour le second point :

La famille (x1 , . . . , xp ) engendre Vect(x1 , . . . , xp ) donc, si elle est libre, cest une base de
Vect(x1 , . . . , xp ) et on a
dim(Vect(x1 , . . . , xp )) = p, i.e.

rg(x1 , . . . , xp ) = p.

La famille (x1 , . . . , xp ) engendre Vect(x1 , . . . , xp ) ; si de plus rg(x1 , . . . , xp ) = p, alors le


nombre de vecteurs de cette famille est dim(Vect(x1 , . . . ,xp )), cest donc une famille libre daprs
le thorme de caractrisation des bases.
Si (x1 , . . . , xp ) est une base de E, on a p = n, et daprs le premier point, rg(x1 , . . . , xn ) = n. Si
p = n et rg(x1 , . . . , xn ) = n, la famille (x1 , . . . , xn ) est une base de E daprs les deux premiers
points.

38

3.

Produit de sous-espaces vectoriels


Dfinition Produit cartsien
Soient E1 , . . . ,Ep des K-espaces vectoriels. Le produit cartsien
p
Y
i=1

Ei = E1 Ep

est lensemble
{(x1 , . . . ,xp ); i [[1,p]], xi Ei }.
Si (x1 , . . . ,xp ) et (y1 , . . . ,yp ) sont deux lments de E1 Ep , et si K, on pose
(x1 , . . . ,xp ) + (y1 , . . . ,yp ) = (x1 + y1 , . . . ,xp + yp ),
(x1 , . . . ,xp ) = (x1 , . . . ,xp )
(toutes les additions et multiplications par un scalaire sont notes avec le mme symbole, mais droite du signe dgalit, ce sont celles de chaque espace vectoriel Ei ).
Q
Attention ! Dans un produit cartsien, lordre des termes est important. La notation pi=1 Ei
doit tre comprise en gardant cela lesprit. Par exemple, le produit E1 E2 nest pas le produit
E2 E1 .
Proprit Produit de sous-espaces vectoriels
Soient E1 , . . . ,Ep des K-espaces vectoriels. Alors E1 Ep est un K-espace vectoriel.
Dmonstration Cest une vrification immdiate, en utilisant le fait que chaque Ei est un Kespace vectoriel, le vecteur nul de E1 Ep tant (0E1 , . . . ,0Ep ), et loppos dun vecteur
(x1 , . . . ,xp ) tant (x1 , . . . , xp ).

Exemples
Le produit cartsien R R2 est lensemble des lments de la forme (x,(y,z)) o x, y et z sont
des rels. Il peut tre identifi (mais nest pas gal) R3 .
Le produit cartsien Mn (K) K[X] est lensemble des lments de la forme (A,P ) o
A Mn (K) et P K[X]. Si A et B sont deux lments de Mn (K), P et Q deux lments
de K[X] et K, on a, par dfinition,
(A,P ) + (B,Q) = (A + B,P + Q).
On voit bien sur cet exemple que les oprations, bien que notes avec le mme symbole, ne sont
pas les mmes oprations (elles ne portent pas sur le mme espace vectoriel).
Proprit
Soient E1 , . . . ,Ep des K-espaces vectoriels de dimension finie. Alors E1 Ep est
de dimension finie et
p
X
dim Ei .
dim(E1 Ep ) =
i=1

Dmonstration Pour tout i [[1,p]], on note ni = dim(Ei ), et lon choisit une base
Bi = (ei,1 , . . . , ei,ni ) de Ei . Alors on vrifie facilement que la famille
((e1,1 ,0E2 , . . . ,0Ep ), . . . ,(e1,n1 ,0E2 , . . . ,0Ep ),(0E1 ,e2,1 , . . . ,0Ep ), . . . ,(0E1 ,e2,n2 , . . . ,0Ep ), . . .
. . .(0E1 , . . . ,0Ep1 ,ep,1 ), . . . ,(0E1 , . . . ,0Ep1 ,ep,np ))
39

dlments de E1 Ep est une base de E1 Ep . En particulier, E1 Ep est de


dimension finie et
p
p
X
X
dim(Ei ).
ni =
dim(E1 Ep ) =
i=1

i=1

Les dtails de cette dmonstration sont trs semblables ceux dune dmonstration donne cidessous pour les sommes directes (voir le thorme sur les bases adaptes une somme directe).


II.
1.

Somme et somme directe de sous-espaces vectoriels


Dfinitions et caractrisations
Dfinition Somme de sous-espaces vectoriels
Soit (E1 , . . . ,Ep ) une famille de sous-espaces vectoriels de E. La somme
p
X
i=1

Ei = E1 + + Ep

est lensemble des vecteurs x de E de la forme


x=

p
X
i=1

xi = x1 + + xp

o, pour tout i [[1,p]], xi Ei .

Remarque On vrifie facilement que lopration de sommation de sous-espaces vectoriels de E


est associative (il est inutile de parenthser, mme lorsque p > 3) et commutative (lordre des
termes na pas dimportance, contrairement aux produits cartsiens), car laddition de vecteurs
de E possde ces proprits.
Proprit
Avec les notations prcdentes,

p
X

Ei est un sous-espace vectoriel de E.

i=1

Dmonstration On a bien sr E1 + + Ep E et 0E E1 + + Ep (car 0E = 0E + + 0E ).


Soient x = x1 + + xp et y = y1 + + yp deux lments de E1 + + Ep , et K. Alors
x + y = (x1 + + xp ) + (y1 + + yp ) = (x1 + y1 ) + + (xp + yp ) E1 + + Ep
car chaque Ei est un sous-espace vectoriel de E. Ainsi E1 + + Ep est un sous-espace vectoriel
de E.

Exemple On a R2 = Vect(1,0) + Vect(1,1) + Vect(0,1).
Dfinition Somme directe
On dit que la somme
a limplication

p
X
i=1

Ei est directe si : pour tout (x1 , . . . ,xp ) E1 Ep , on

p
X

xi = 0E

Ei se note

p
M

i=1

Dans ce cas la somme

p
X
i=1

i=1

i [[1,p]], xi = 0E .
Ei = E1 Ep .

40

Proprit
Soit (E1 , . . . ,Ep ) une famille de sous-espaces vectoriels de E.
P
P
La somme pi=1 Ei est directe si et seulement si tout lment x de pi=1 Ei se dcompose
de manire unique sous la forme x = x1 + + xp avec xi Ei pour tout i [[1,p]].
Dmonstration
P
P
Si la somme est directe, considrons x = pi=1 xi = pi=1 yi deux dcompositions de x avec
xi Ei et yi Ei pour tout i [[1,p]]. On a donc
p
X
(xi yi ) = 0E
i=1

avec xi yi Ei pour tout i [[1,p]] car Ei est un sous-espace vectoriel de E. Par dfinition
dune somme directe, on a donc xi = yi pour tout i, do lunicit de la dcomposition.
P
P
Soit (x1 , . . . ,xp ) E1 Ep tel que pi=1 xi = 0E . En remarquant que pi=1 0E = 0E et
que 0E Ei pour tout i, on obtient deux dcompositions de 0E . Par unicit, on a donc xi = 0E
pour tout i, et la somme est directe.

Exemple La somme Vect(1,0) + Vect(1,1) + Vect(0,1) nest pas directe car (1,1) = (1,0) + (0,1).
Proprit Cas de deux sous-espaces vectoriels
Soient E1 et E2 deux sous-espaces vectoriels de E. La somme E1 + E2 est directe si et
seulement si E1 E2 = {0E }.
Dmonstration
Si la somme est directe, considrons x E1 E2 . Alors x + (x) = 0E avec x E1 et
x E2 . Par dfinition, on en dduit que x = 0E .
Soit x1 E1 et x2 E2 tels que x1 + x2 = 0E . Alors x1 = x2 E1 E2 = {0E }, donc
x1 = x2 = 0E . La somme E1 + E2 est donc directe.

Attention ! Cette proprit ne se gnralise pas une somme de plus de deux sous-espaces
comme le montre lexemple de Vect(1,0) + Vect(1,1) + Vect(0,1), qui nest pas directe alors que
lintersection de deux quelconques des sous-espaces parmi les trois est toujours rduite {(0,0)}.
Dfinition Sous-espaces supplmentaires
Soient F , G deux sous-espaces vectoriels de E.
On dit que F et G sont supplmentaires (dans E) si F G = E cest--dire si la
somme de F et de G est directe et gale E.

Exemples
R2 = Vect(1,0) Vect(1,1), R3 = Vect((1,0,2),(1,1, 1)) Vect(1,2,3).

Soit P un polynme de K[X] de degr n + 1. Alors K[X] = K[X]P Kn [X].

En effet, un multiple de P ne peut tre de degr infrieur ou gal n que sil est nul.
La somme est donc directe. De plus, pour tout polynme A K[X], il existe Q K[X] et
R Kn [X] tels que A = P Q + R, daprs le thorme de division euclidienne dans K[X]. Donc
A K[X]P + Kn [X], et ce pour tout A. La somme est donc gale K[X].
41

2.

Sommes directes, bases et dimensions


Proprit Sommes directes et familles libres
Soit (x1 , . . . ,xp ) une famille libre dlments de E (p > 2). Pour tout i [[1, p 1]],
Vect(x1 , . . . , xi ) et Vect(xi+1 , . . . ,xp ) sont en somme directe et
Vect(x1 , . . . , xp ) = Vect(x1 , . . . , xi ) Vect(xi+1 , . . . , xp ).
Si (E1 , . . . ,Ep ) est une famille de sous-espaces vectoriels de E dont la somme est
directe et si (x1 , . . . ,xp ) E1 Ep est une famille de vecteurs tous non nuls, alors
cette famille est libre.

Dmonstration
Soit x = 1 x1 + + i xi = i+1 xi+1 + + p xp Vect(x1 , . . . , xi ) Vect(xi+1 , . . . , xp ). Alors
1 x1 + + i xi i+1 xi+1 + p xp = 0E .
La famille (x1 , . . . ,xp ) tant libre, on en dduit que i = 0 pour tout i, et donc x = 0E . Ainsi
Vect(x1 , . . . , xi )Vect(xi+1 , . . . , xp ) = {0E }, donc la somme de ces deux sous-espaces est directe.
Il est de plus immdiat que Vect(x1 , . . . , xp ) = Vect(x1 , . . . , xi ) + Vect(xi+1 , . . . , xp ).
Si une combinaison linaire 1 x1 + + p xp est nulle, alors, sachant que i xi Ei pour tout
i, laspect direct de la somme des Ei entrane que i xi = 0E pour tout i, avec xi 6= 0E , et donc
i = 0, do le rsultat.

Notation Si F1 , . . . ,Fp sont des familles dlments de E, on appellera juxtaposition (ou
concatnation) de ces familles la famille F obtenue en plaant dans une mme famille tous les
vecteurs de F1 , . . . ,Fp , en gardant les rptitions ventuelles et en respectant lordre dapparition
des termes. On pourra reprsenter ceci par la notation F = F1 Fp , mais cette notation
nest pas universelle.
Par exemple, (e1 ,e2 ) (f1 ,f2 ,f3 ) = (e1 ,e2 ,f1 ,f2 ,f3 ).


En appliquant plusieurs fois le premier point de la proprit prcdente, on obtient immdiatement :


Corollaire Fractionnement dune base
On suppose que E est de dimension finie n > 2 ; soit B = F1 Fp une base de E.
Alors
p
M
Vect(Fi ).
E=
i=1

Proprit
Si E est de dimension finie et si F est un sous-espace vectoriel de E, alors F possde
des supplmentaires.
Dmonstration Si F = {0E }, le rsultat est vident : E est un supplmentaire de F . De mme,
si F = E, {0E } est un supplmentaire de F . Sinon, soit F une base de F . En compltant F en
base de E, et en appliquant le corollaire prcdent avec p = 2, on obtient un supplmentaire de
F (et la base de E ainsi construite est adapte F ).


42

Inversement, on peut construire des bases de E partir dune dcomposition de E en somme


directe :
Proprit/Dfinition Base adapte une somme directe
Soit (E1 , . . . ,Ep ) une famille
L de sous-espaces vectoriels de E, tous de dimension finie
non nulle, telle que E = pi=1 Ei . Pour tout i, on se donne une base Bi de Ei .

Alors la juxtaposition B = B1 Bp de ces bases est une base de E (qui en particulier


est de dimension finie).
L
On appelle base de E adapte la dcomposition en somme directe E = pi=1 Ei une
base de E de la forme de B.
P
Dmonstration Pour tout i, on note ni = dim(Ei ), Bi = (ei,1 , . . . , ei,ni ) et on pose n = pi=1 ni .
Caractre gnrateur : tout dabord, chaque vecteur ek,j appartient
P Ek et donc la somme
des Ei . Soit x E. Il existe (xi )16i6p E1 Ep tel que x = pi=1 xi . De plus pour tout
i [[1,p]], il existe (i,j )1jni Kni tel que
xi =

ni
X

i,j ei,j .

j=1

Alors
x=

p
X
i=1

ni
X
j=1

i,j ei,j Vect(B).

Ceci tant valable pour tout x appartenant E, on en dduit que E = Vect(B).


Libert : soit (i,j ) Kn un n-uplet de scalaires (avec 1 i p et pour tout i, 1 j ni )
tel que

ni
n
X
X

i,j ei,j = 0E .
i=1

j=1

Pni

Pour tout i [[1,n]],


Pn le vecteur vi = j=1 i,j ei,j appartient Ei , et la somme des Ei tant
directe, lgalit i=1 vi = 0E entrane que vi = 0E pour tout i [[1,p]]. Mais alors, pour tout
i [[1,p]], on a
ni
X
i,j ei,j = 0E ,
j=1

or Bi est une base de Ei donc est une famille libre. On en dduit que i,j = 0 pour tout j [[1,ni ]].
Finalement, pour tout 1 i p, 1 j ni , on a i,j = 0, donc B est libre.

Proprit Dimension dune somme
Soit (E1 , . . . ,Ep ) une famille de sous-espaces vectoriels de dimension finie de E. Alors :
!
p
p
p
X
X
X
dim(Ei ),
Ei est de dimension finie et dim
Ei 6

i=1

i=1

i=1

Il y a galit dans lingalit prcdente si et seulement si la somme


Si E est de dimension finie et si la somme
il faut et il suffit que

p
X

p
X
i=1

dim(Ei ) = dim(E).

i=1

43

p
X

Ei est directe.

i=1

Ei est directe, alors pour que E =

p
M
i=1

Ei ,

Dmonstration Tout dabord, on se ramne facilement au cas o les Ei sont de dimension non
nulle, ce que lon suppose dans la suite de la dmonstration.
Pour tout i [[1,p]], soit Bi une base de Ei , et ni = dim(Ei ). En reprenant la dmonstration
P
prcdente, on obtient que la juxtaposition F de ces bases est une famille gnratrice de pi=1 Ei .
On a donc
!
p
p
p
X
X
X
dim(Ei ).
ni =
Ei 6
dim
i=1

i=1

i=1

Pp

L
Si la somme i=1 Ei est directe, la famille F est une base de pi=1 Ei (daprs la dmonstration
prcdente), donc lingalit prcdente est une galit.
Rciproquement,P
si lingalit prcdente est une galit, alorsP
F est une famille gnratrice
P
p
de pi=1 Ei de dim( pi=1 Ei ) vecteurs, donc F est
une
base
de
i=1 Ei . Daprs
Pp
Lp
Lp la proprit
de fractionnement dune base, on en dduit que i=1 Ei = i=1 Vect(Fi ) = i=1 Ei , donc la
somme est directe.
L
Lp
Dans ce cas, pour que E = pi=1
PpEi , il faut et il suffit que dim ( i=1 Ei ) = dim(E), cest--dire,
daprs le deuxime point, que i=1 dim(Ei ) = dim(E).

Exemple La somme de deux plans vectoriels de R3 nest jamais directe, car la somme de leurs
dimensions est 4.
Corollaire
On suppose E de dimension finie. Soient F et G deux sous-espaces vectoriels de E.
Pour que E = F G, il faut et il suffit que
F G = {0E } et

dim(E) = dim(F ) + dim(G).

Dmonstration Cest un cas particulier de la proprit prcdente dans le cas de deux sousespaces vectoriels F et G, puisqualors, le fait que la somme F + G soit directe quivaut au fait
que F G = {0E }.

Remarque En particulier, tous les supplmentaires de F ont la mme dimension.

Lorsque la somme de deux sous-espaces vectoriels de E nest pas directe, on a le rsultat


suivant :
Thorme Formule de Grassmann
Si E est de dimension finie et F et G sont deux sous-espaces vectoriels de E, alors
dim(F + G) = dim(F ) + dim(G) dim(F G).
Dmonstration Soit F un supplmentaire de F G dans F et G un supplmentaire de F G
dans G. Montrons que F + G = F G (F G). Tout dabord, si x + y + z = 0E avec x F ,
y G et z F G, alors
x = y z F G F (F G) = {0E }.
On en dduit que y = z G (F G) = {0E } et finalement x = y = z = 0E . Donc la
somme est directe. De plus, on constate que
F + G = [(F G) + F ] + [(F G) + G ] = F + G + (F G).
Alors, daprs la proprit sur la dimension dune somme,
dim(F + G) = dim(F ) + dim(G ) + dim(F G)

= dim(F ) dim(F G) + dim(G) dim(F G) + dim(F G)

= dim(F ) + dim(G) dim(F G).


44

Exemple Soit E = Mn (R) (n > 2), F = Sn (R) (ensemble des matrices symtriques de Mn (R))
et G lensemble des matrices triangulaires suprieures de Mn (R). Alors F et G sont des sousespaces vectoriels de E, dont lintersection est lensemble des matrices diagonales de Mn (R). On
a, daprs la formule de Grassmann,
dim(F + G) = dim(F ) + dim(G) dim(F G) =

n(n + 1) n(n + 1)
+
n = n2 .
2
2

Sachant que dim(Mn (R)) = n2 , on en dduit que F + G = Mn (R).


On peut dailleurs prouver ce rsultat directement en dcomposant toute matrice A de Mn (R)
sous la forme de la somme dune matrice symtrique S et dune matrice triangulaire suprieure
T : on choisit pour S la matrice de diagonale nulle dont la partie strictement infrieure est la
mme que celle de A, et dont la partie strictement suprieure est obtenue par symtrie de la
partie strictement infrieure. On pose alors T = AS ; T est triangulaire suprieure car A et S ont
la mme partie triangulaire strictement infrieure. On a donc la dcomposition souhaite. Cette
dcomposition nest pas unique car la somme F + G nest pas directe (F G 6= {0E }), labsence
dunicit provient en fait, lorsque lon effectue la dcomposition, dun choix des diagonales qui
nest pas unique : on peut choisir pour S, au lieu dune diagonale nulle, une diagonale quelconque.

III.

Applications linaires

Dans toute la suite, E et F dsignent deux K-espaces vectoriels.

1.

Dfinition et exemples
Dfinition Application linaire
On appelle application linaire de E dans F toute application u de E dans F vrifiant
les deux conditions suivantes :
(x,y) E 2 , u(x + y) = u(x) + u(y),
K , x E , u(x) = u(x).

Lensemble des applications linaires de E dans F est not L (E,F ).


Si u est une application linaire de E dans E, on dit que u est un endomorphisme
de E. Lensemble des endomorphismes de E est not L (E).

Remarque Si u est linaire, on a ncessairement u(0E ) = 0F . En effet,


u(0E ) = u(0E + 0E ) = u(0E ) + u(0E ),
do le rsultat par soustraction de u(0E ). En particulier, si u(0E ) 6= 0F , alors u nest pas linaire.

R3 R2
nest pas linaire.
Par exemple, u :
(x,y,z) 7 (2x + y,1)
Proprit
Lapplication u de E dans F est linaire si et seulement si
(x,y) E 2 , K, u(x + y) = u(x) + u(y).

45

Exemples
Lapplication nulle de E dans F , u :
notera 0L (E,F ) ou 0L (E) si E = F .

E F
x 7 0F

est une application linaire. On la

E E
est une application linaire.
x 7 x

E E
est une application
Plus gnralement, si K, lapplication de E dans E, f :
x 7 x
linaire. Elle est appele homothtie de rapport .

R3 R2
est linaire.
Lapplication f :
(x,y,z) 7 (2x + y z,x y + z)
 1
C (R,R) C 0 (R,R)
Lapplication :
est linaire.
f 7 f
Lapplication identit de E dans E, IdE :

Dfinition Application linaire canoniquement associe une matrice


Soit M Mn,p (K). On dfinit une application uM par

Mp,1 (K) Mn,1 (K)
uM :
X 7 M X
Lapplication uM est linaire , elle est appele application linaire canoniquement
associe la matrice M .

2.

Oprations sur les applications linaires


Dfinition
Soient u et v deux lments de L (E,F ) et K. Sachant que F est un K-espace
vectoriel, on dfinit des applications u + v et u (ou simplement u) en posant, pour
tout x E,
(u + v)(x) = u(x) + v(x) et (u)(x) = u(x).

Proprit
Lespace (L(E,F ), + ,) est un K-espace vectoriel. En particulier,
(u,v) L (E,F )2 , K, u + v L (E,F ) et u L (E,F ).

Proprit Composition dapplications linaires


Soient E, F et G trois K-espaces vectoriels. Si u L (E,F ) et v L (F,G) alors
v u L (E,G).
La dmonstration de ces deux proprits est laisse en exercice.

Cas particuliers des endomorphismes


Les deux proprits ci-dessus montrent que L (E) est un ensemble dont les lments peuvent
tre additionns, multiplis par un scalaire, et composs. En gnral, la loi de composition nest
pas commutative : il existe des endomorphismes u et v de E tels que u v 6= v u.
46

Dfinition
Soit u un endomorphisme de E. Pour tout k N, on note uk lendomorphisme obtenu
en effectuant la composition u u (k fois). Par convention, u0 = IdE .

Proprit Formule du binme de Newton


Soient u et v deux endomorphismes de E qui commutent (cest--dire tels que uv =
v u). Alors
n

n N, (u + v) =

n  
X
n

k=0

u v

nk

n  
X
n
k=0

unk v k .

Dmonstration Il suffit de dmontrer la premire des deux formules, lautre en tant une rcriture obtenue par changement dindice. On remarque tout dabord que pour tout k N, uk et
v commutent (cela se prouve par rcurrence immdiate sur k). On prouve alors la formule par
rcurrence sur n. Pour n = 0, le rsultat est vident car (u + v)0 = IdE par convention, et
0  
X
0
k=0

uk v 0k = u0 v 0 = IdE IdE = IdE .

Supposons le rsultat vrai au rang n. Alors


(u + v)n+1 = (u + v) (u + n)n = (u + v)

n  
X
n
k=0

uk v nk

par hypothse de rcurrence. Par linarit de u et v et le fait que v commute avec toutes les
puissances de u, on a donc
n+1

(u + v)

n  
X
n
k=0

k+1

nk

n  
X
n
k=0

uk v nk+1 .

Par le changement dindice m = k + 1 dans la premire somme, on obtient


n+1

(u + v)

n+1
X

m=1


n  
X
n
n k
m
nm+1
u v
+
u v nk+1 .
m1
k
k=0

En regroupant les termes communs dans ces deux sommes (on rappelle que k et m sont des
indices muets), on a
n+1

(u + v)

  
n 
X
n
n
+
=u
+
uk v nk+1 + v n+1
k1
k
k=1

n 
X
n+1 k
n+1
u v n+1k + v n+1
=u
+
k
n+1

k=1

daprs la formule de Pascal. On remarque alors que les termes un+1 et v n+1 correspondent au
terme gnral de la somme, pour k = n + 1 et k = 0 respectivement. On a donc la formule au
rang n + 1 et finalement pour tout n par principe de rcurrence.

Remarque On utilise souvent cette formule dans le cas o lun des deux endomorphismes est
lidentit, ou une homothtie, qui commute avec tous les endomorphismes.
47

Polynmes dendomorphismes
Dfinition Polynmes dun endomorphisme
P
Soit u L (E) et P (X) = dk=0 ak X k K[X]. On peut alors dfinir P (u), nouvel
lment de L (E) par
P (u) =

d
X
k=0

ak uk = ad ud + + a1 u + a0 IdE .

On dit que P (u) est un polynme de u. Lensemble des polynmes de u est not K[u].
Attention ! Ne pas se tromper dans le terme a0 IdE correspondant au terme constant de P ! Par
exemple, lorsque P (X) = X 2 + 2X + 3, on a P (u) = u2 + 2u + 3 IdE , cest--dire, pour tout
x E,
P (u)(x) = u2 (x) + 2u(x) + 3x.

Proprit
Soit u L (E). Soient P et Q deux lments de K[X] et K. Alors :
1(u) = IdE
(P + Q)(u) = P (u) + Q(u).
(P Q)(u) = P (u) Q(u). En particulier, P (u) et Q(u) commutent.

Dfinition
Soit u L (E). On dit quun polynme P K[X] est annulateur de u (ou que que u
annule P ) si P (u) = 0L (E) .

3.

Applications linaires et sommes directes


Thorme
L
Soit (Ei )16i6p une famille de sous-espaces vectoriels de E telle que E = pi=1 Ei .
Pour tout i [[1,p]], soit ui une application linaire de Ei dans F .
Alors il existe une unique application linaire u de E dans F dont la restriction Ei
soit ui pour tout i [[1,p]].

Dmonstration
Analyse : si u vrifie les conditions ci-dessus et si x = x1 + + xp E avec xi Ei pour tout
i, on a ncessairement
u(x) = u(x1 + + xp ) = u(x1 ) + + u(xp ) = u1 (x1 ) + + up (xp ).
Lapplication u est donc entirement dtermine, et ceci prouve en particulier son unicit.
Synthse : pour tout x = x1 + + xp avec xi Ei pour tout i, on pose
u(x) = u1 (x1 ) + + up (xp ).
48

Lapplication u est bien dfinie car la dcomposition de x existe et est unique, la somme tant
directe et gale E. Elle est linaire : si x = x1 + + xp et y = y1 + + yp sont deux lments
de E dcomposs sur la somme E1 Ep , et si K, alors
x + y =

p
X

(xi + yi ),

i=1

avec xi + yi Ei pour tout i [[1,p]], donc par dfinition,


u(x + y) =

p
X

ui (xi + yi ) =

u(x + y) =

p
X

(ui (xi ) + ui (yi ))

i=1

i=1

par linarit des ui . Finalement

p
X

ui (xi ) +

p
X

ui (yi ) = u(x) + u(y).

i=1

i=1

Enfin, u concide avec ui sur Ei , car pour tout x Ei , u(x) = ui (x), les autres composantes de
x dans la dcomposition tant nulles. Ceci prouve lexistence de u.

Corollaire
On suppose E de dimension finie. Soient B = (e1 , . . . ,en ) une base de E et (f1 , . . . ,fn )
une famille de vecteurs de F .
Alors il existe une unique application linaire u L (E,F ) telle que pour tout i [[1,n]],
u(ei ) = fi .
Dmonstration On a E =
tout i,

Ln

i=1 Vect(ei ) ;

ui :

4.

il suffit dappliquer le rsultat prcdent avec, pour

Vect(ei ) F
ei 7 fi

Image et noyau dune application linaire

Image et surjectivit
Proprit
Limage par une application linaire u L (E,F ) dun sous-espace vectoriel de E est
un sous-espace vectoriel de F .
Dmonstration Soit G un sous-espace vectoriel de E. Tout dabord, on a videmment u(G) F .
De plus, 0F u(G) car 0F = u(0E ) et 0E E. Enfin, soient u(x) et u(y) deux lments de u(G)
avec x G et y G, et soit K. Alors, par linarit de u, u(x) + u(y) = u(x + y). Or
G est un sous-espace vectoriel de E et x et y sont deux lments de G, donc x + y G, et
ainsi u(x + y) u(G). On a donc montr que u(G) est stable par combinaison linaire, do le
rsultat.

Proprit/Dfinition Image dune application linaire
Limage de u, note Im(u), est limage de E par u, i.e. lensemble des images des
lments de E par u :
Im(u) = u(E) = {y F ; x E, u(x) = y} .
Lensemble Im(u) est un sous-espace vectoriel de F daprs la proprit prcdente.

49

Proprit Dtermination de Im(u)


Soit u L (E,F ) et (e1 , . . . ,en ) une famille gnratrice de E (par exemple, une base).
Alors Im(u) est le sous-espace vectoriel de F engendr par les vecteurs u(e1 ), . . . , u(en ) :
Im(u) = Vect (u(e1 ), . . . ,u(en )) .
Dmonstration Si y = u(x) Im(u) avec x E, on peut dcomposer x sur la famille gnratrice
(e1 , . . . ,en ) de E : il existe (1 , . . . ,n ) Kn tel que x = 1 e1 + + n en . Par linarit de u,
on a donc
y = u(x) = 1 u(e1 ) + + n u(en ) Vect (u(e1 ), . . . ,u(en )) .

Ainsi Im(u) Vect (u(e1 ), . . . ,u(en )) . Rciproquement, Im(u) est un sous-espace vectoriel de F
auquel appartiennent u(e1 ), . . . ,u(en ), donc
Vect (u(e1 ), . . . ,u(en )) Im(u).
On a donc lgalit souhaite.

Remarque Soit u L (E,F ) ; u est surjective si et seulement si pour tout y F , il existe x E


tel que u(x) = y, cest--dire si et seulement si Im(u) = F .
 1
C (R,R) C 0 (R,R)
Exemple Soit :
f 7 f
Lapplication linaire est surjective, car toute fonction continue sur R possde des primitives,
qui sont de classe C 1 .
Noyau et injectivit

Proprit/Dfinition Noyau dune application linaire


Soit u L (E,F ). Le noyau de u est lensemble des vecteurs de E qui ont pour image
le vecteur nul de F . On le note Ker(u). On a donc :
Ker(u) = {x E; u(x) = 0F } = u1 ({0F }).
Ker(u) est un sous-espace vectoriel de E.
Dmonstration Tout dabord, Ker(u) E par dfinition. De plus, 0E Ker(u) car u(0E ) = 0F .
Enfin, soient x et y deux lments de E, et K. Alors par linarit de u,
u(x + y) = u(x) + u(y) = 0F + 0F = 0F ,
et donc x + y Ker(u). Ceci montre que Ker(u) est un sous-espace vectoriel de E.

R3 R3
Exemple Soit u :
(x,y,z) 7 (x 2y,x + 2z,x y + z)

Pour dterminer Ker(u), on rsout lquation u(x,y,z) = 0, ce qui nous conduit la rsolution
du systme :


=0
x 2y
x = 2z
x
+2z = 0
qui quivaut
y = z

x y +z = 0

Do Ker(u) = {(2z, z,z), z R} = Vect(2, 1,1).


Proprit

Soit u L (E,F ). Pour que u soit injective, il faut et il suffit que Ker(u) = {0E }.

50

Dmonstration
Soit x Ker(u). Alors u(x) = 0F = u(0E ), donc par injectivit de u, x = 0E , ce qui montre
que Ker(u) {0E }, linclusion rciproque tant toujours vraie.
Soient x et y deux lments de E tels que u(x) = u(y). Par linarit de u, on a u(xy) = 0F ,
et donc x y Ker(u) = {0E }. Ainsi x = y, ce qui prouve que u est injective.

 1
C (R,R) C 0 (R,R)
Exemple Soit :
f 7 f
Lapplication linaire nest pas injective, car toute fonction constante appartient son
noyau (et il existe des fonctions constantes non nulles). En fait, Ker() est gal lensemble des
fonctions constantes sur R.
quations linaires
Dfinition
Une quation linaire est une quation de la forme u(x) = b o u L (E,F ) et
b F , dinconnue x E.
Bien sr, lquation u(x) = b possde des solutions si et seulement si b Im(u). Si lquation
est sans second membre, cest--dire si b = 0, alors elle scrit u(x) = 0, quation dont lensemble
des solutions est Ker(u). En particulier, lensemble des solutions dune quation linaire sans
second membre est un K-espace vectoriel.
Dans le cas gnral (b quelconque), on peut dcrire la forme de lensemble des solutions :
Proprit Structure de lensemble des solutions
Avec les notations prcdentes, si x0 E est une solution particulire de u(x) = b,
alors lensemble S des solutions de cette quation est
S = {x0 + y; y Ker(u)}.
Dmonstration On a u(x0 ) = b et donc pour x E, on a les quivalences :
u(x) = b

u(x) = u(x0 )

u(x x0 ) = 0F

x x0 Ker(u),

do le rsultat.

Exemples
On considre le systme linaire de n quations p inconnues suivant :

a1,1 x1 + + a1,p xp = b1

a2,1 x1 + + a2,p xp = b2
(S) :
..

a x + + a x = b
n,1 1
n,p p
n

En notant A = (ai,j )16i6n,16j6p Mn,p (K), X Mp,1 (K) la matrice colonne de coefficients
x1 , . . . ,xp et B Mn,1 (K) la matrice colonne de coefficients b1 , . . . ,bn , ce systme se met sous la
forme matricielle (E) : AX = B, cest--dire que (x1 , . . . ,xp ) est solution de (S) si et seulement
si X est solution de (E). Le systme (S) et lquation (E) sont des quations linaires. Dans le
cas de lquation (E) : AX = B, on a u = uA , application linaire canoniquement associe A.
On dit que A est la matrice du systme linaire (S). On reviendra en dtails sur ltude
des systmes linaires dans le chapitre suivant.
51

Les quations diffrentielles linaires dordre 1 et 2 (avec ou sans second membre) sont des
quations linaires : lquation y + a(x)y = b(x) (o a et b sont deux fonctions continues sur un
intervalle I valeurs dans K) peut scrire u(y) = b o
 1
C (I,K) C 0 (I,K)
u:
y 7 y + ay
De mme, lquation y +ay +by = f (x) (o a et b sont deux scalaires et f une fonction continue
sur I valeurs dans K) peut scrire u(y) = f o
 2
C (I,K) C 0 (I,K)
u:
y 7 y + ay + by

5.

Projecteurs et symtries
Proprit/Dfinition Projecteur, symtrie
Soit p L (E). On dit que p est un projecteur sil existe deux sous-espaces vectoriels
F et G de E tels que E = F G et, pour tout x = y + z E avec y F et z G, on
ait p(x) = y.
Dans ce cas, on a F = Im(p) = Ker(p IdE ) et G = Ker(p). On dit que p est le
projecteur (ou la projection) sur F paralllement G.
Soit s L (E). On dit que s est une symtrie sil existe deux sous-espaces vectoriels
F et G de E tels que E = F G et, pour tout x = y + z E avec y F et z G, on
ait s(x) = y z.
Dans ce cas, on a F = Ker(s IdE ) et G = Ker(s + IdE ). On dit que p est la symtrie
par rapport F paralllement G.

Dmonstration des galits sur les images et noyaux


Si p est la projection sur F paralllement G, alors pour tout x = y + z E avec y F et
z G, p(x) = y. Or x Ker(p IdE ) si et seulement si p(x) = x, ce qui quivaut au fait que
y = y + z, et donc que z soit nul, cest--dire que x F. Donc F = Ker(p IdE ).
De mme, x Ker(p) si et seulement si p(x) = 0, ce qui quivaut au fait que y soit nul, et
donc au fait que x G. Donc G = Ker(p).
Enfin, par dfinition, Im(p) F , et si y F , p(y) = y (la dcomposition de y sur la
somme directe E = F G est y = y + 0E ) , do : Im(p) Ker(p IdE ). Rciproquement, si
x Ker(p IdE ), alors x = p(x) Im(p). On a donc Im(p) = Ker(p IdE ).
On procde de faon analogue pour les symtries.

Proprit
Soit p L (E). Pour que p soit un projecteur, il faut et il suffit que p2 = p.
Soit s L (E). Pour que s soit une symtrie, il faut et il suffit que s2 = IdE .
Dmonstration Daprs ce qui prcde, si p est un projecteur, alors Im(p) = Ker(p IdE ). On
en dduit que (p IdE ) p = 0, et donc p2 = p. Rciproquement, si p L (E) vrifie p2 = p,
montrons que E = Ker(p IdE ) Ker(p) : tout dabord, lintersection de ces deux sous-espaces
vectoriels de E est rduite au vecteur nul, car si p(x) = x et p(x) = 0E , alors x = 0E . De plus,
pour tout x E,
x = (x p(x)) + p(x)
avec p(x) Ker(p IdE ) et x p(x) Ker(p) car p2 = p.
52

On a donc bien E = Ker(p IdE ) Ker(p). Il sensuit que p est le projecteur sur Ker(p IdE )
paralllement Ker(p), car si x = y + z E avec y Ker(p IdE ) et z Ker(p), on a
p(x) = p(y) = y.
On a donc lquivalence souhaite. Pour les symtries on procde de la mme faon en remplaant Ker(p) par Ker(s + IdE ).

Remarque Cette proprit se reformule ainsi : p L (E) est un projecteur si et seulement si
X 2 X est annulateur de p ; s L (E) est une symtrie si et seulement si X 2 1 est annulateur
de s.

IV.
1.

Isomorphismes et automorphismes
Dfinitions et premires proprits

Dfinition Isomorphismes, espaces isomorphes


Soit u une application de E dans F . On dit que u est un isomorphisme de E sur
F si u est linaire et bijective de E sur F .
On dit que E et F sont des espaces isomorphes sil existe un isomorphisme de E
sur F .

Exemple Les espaces Mn,1 (K), M1,n (K) et Kn sont isomorphes.


Proprit
Si u est un isomorphisme de E sur F , alors u1 est un isomorphisme de F sur E.

Dmonstration Il suffit de montrer que u1 est linaire. Soit (x,y) F 2 et K. Alors


u1 (x + y) = u1 ((u u1 )(x) + (u u1 )(y)) = u1 (u(u1 (x) + u1 (y))
par linarit de u. En simplifiant u1 u, on obtient
u1 (x + y) = u1 (x) + u1 (y).

Proprit
Soit u L (E,F ). Pour que u soit un isomorphisme de E sur F , il faut et il suffit quil
existe une application v L (F,E) telle que u v = IdF et v u = IdE .
Dans ce cas, u1 = v.

Dmonstration Bien sr, il suffit de montrer limplication rciproque. Si un tel v existe, u est
injective car, si x E vrifie u(x) = 0F , alors v(u(x)) = 0E et donc x = 0E . De plus, u est
surjective, car pour tout y F , y = u(v(y)) est limage par u du vecteur v(y) E. Finalement
u est un isomorphisme et la relation u v = IdF entrane que u1 = v.

Mthode Pour prouver que u est un isomorphisme de E sur F , on peut donc :
Montrer que u est linaire, injective et surjective.
Montrer que u est linaire et dterminer v L (F,E) tel que u v = IdF et v u = IdE .
Cette dernire mthode est trs utile lorsque lon a lintuition de lexpression de u1 .
53

Exemples
Soient

u:

Rn [X] Rn [X]
P (X) 7 P (X + 2)

et

v:

Rn [X] Rn [X]
Q(X) 7 Q(X 2)

Alors u est un isomorphisme de Rn [X] sur Rn [X], de bijection rciproque v.


Soit u L (E) et soit P (X) = ad X d + + a0 K[X] (d > 1) tel que P (u) = 0L (E) ,
cest--dire
0L (E) = ad ud + + a0 IdE .
Si le coefficient constant a0 de P est diffrent de 0, alors on peut crire

a1
ad d
u u = IdE ,
a0
a0

et donc


a1
ad
IdE
u ud1 +
a0
a0

a1
ad
IdE
ud1 +
a0
a0

u = IdE .

Ainsi, u est un isomorphisme de E sur E, de bijection rciproque

ad d1
a1
u

IdE .
a0
a0

Cette expression de u1 est dautant plus simple que P est de bas degr. On voit donc que
lobtention de polynmes annulateurs de u peut donner des informations importantes sur u. On
dveloppera largement ce thme dans le chapitre Rduction des endomorphismes et des
matrices carres.
Par exemple, soit u L (E) tel que u3 + 2u Id = 0. Alors
u (u2 + 2 Id) = (u2 + 2 Id) u = Id .
On sait donc que u est un isomorphisme de E sur E avec u1 = u2 + 2 Id .
Dfinition Automorphismes
Si u est un isomorphisme de E sur E (cest--dire si u : E E est linaire et bijective)
on dit que u est un automorphisme de E.
Lensemble des automorphismes de E est not G(E).

Proprit/Dfinition
Lensemble G(E), muni de lopration de composition des applications, est appel
groupe linaire de E. On a notamment :
Si u G(E), alors u1 G(E).

Si u G(E) et v G(E) alors uv G(E). En fait, on a : (uv)1 = v 1 u1 .

Si u G(E), on dit galement que u est inversible, et u1 est appel inverse de u.

Dmonstration Le premier point a t dmontr plus haut. Quant au second, soient u et v deux
lments de G(E), alors on sait dj que u v est linaire ; de plus,
(u v) (v 1 u1 ) = u (v v 1 ) u1 = u IdE u1 = u u1 = IdE
et de mme, (v 1 u1 ) (u v) = IdE . Ceci prouve que u v G(E) avec (u v)1 = v 1 u1 .

54

2.

Isomorphismes en dimension finie

Caractrisation
Thorme Caractrisation des isomorphismes par les bases
On suppose que E est de dimension finie n > 1. Soit B = (e1 , . . . ,en ) une base de E et
u L (E,F ).
Lapplication u est un isomorphisme si et seulement si u(B) = (u(e1 ), . . . , u(en )) est
une base de F .
Dmonstration
Supposons que u est un isomorphisme, et montrons que u(B) est une famille libre et gnratrice de F .
Libert : si 1 u(e1 ) + + n u(en ) = 0F pour des scalaires 1 , . . . ,n , alors par linarit de u,
u(1 e1 + + n en ) = 0F .
Lapplication u tant injective, on a donc 1 e1 + + n en = 0E . La famille B tant libre, on
en dduit que i = 0 pour tout i.
Aspect gnrateur : soit y F et x E tel que u(x) = y (un tel x existe car u est surjective).
On peut alors crire x = 1 e1 + + n en pour des scalaires 1 , . . . ,n , car B est une famille
gnratrice de E. Finalement
y = u(x) = u(1 e1 + + n en ) = 1 u(e1 ) + + n u(en ).
On a donc montr que y Vect(u(e1 ), . . . ,u(en )), et ce pour tout y F , do le rsultat.
Si u(B) = (u(e1 ), . . . , u(en )) est une base de F , montrons que u est bijective.

Injectivit : soit x = 1 e1 + + n en E tel que u(x) = 0F . Alors

0F = u(1 e1 + + n en ) = 1 u(e1 ) + + n u(en ).


La famille (u(e1 ), . . . ,u(en )) tant libre, on a i = 0 pour tout i, et donc x = 0E : u est injective.
Surjectivit : (u(e1 ), . . . ,u(en )) engendre F , donc pour tout y F , il existe des scalaires
1 , . . . ,n tels que y = 1 u(e1 ) + + n u(en ), et ainsi
y = u(1 e1 + + n en )
avec 1 e1 + + n en E. Finalement, y Im(u), pour tout y F : u est surjective.

Remarque Pour le sens direct, on a en fait montr les rsultats suivants :

Si u est injective, alors limage par u dune famille libre dlments de E est une famille libre
dlments de F .
Si E est de dimension finie, et si u est surjective, alors limage par u dune famille gnratrice
de E est une famille gnratrice de F .
Thorme Caractrisation des isomorphismes en dimension finie
Soient E et F deux K-espaces vectoriels de mme dimension finie n et u une
application linaire de E dans F . On a les quivalences :
u est injective

u est surjective

55

u est bijective.

Dmonstration Le rsultat est vident si n = 0 (les trois proprits sont vraies). Sinon, soit
B une base de E. Si u est injective, u(B) est une famille libre dlments de F de n = dim(F )
vecteurs ; cest donc une base de F . Donc u est bijective daprs le thorme prcdent. Si u est
surjective, u(B) est une famille gnratrice de F de n vecteurs ; cest donc une base de F . Dans
ce cas aussi, u est bijective. Les implications rciproques sont videntes.

Bilan Sous les hypothses prcdentes, les proprits suivantes sont quivalentes :

u est bijective,
u est injective,
u est surjective,

u est un isomorphisme de E sur F,


Ker(u) = {0E } ,
Im(u) = F,
u transforme toute base de E en une base de F .

Attention ! Lhypothse dim(E) = dim(F ) est cruciale. En effet :


f : x 7 (x,x), de R dans R2 , est injective mais non surjective.
g : (x,y) 7 x, de R2 dans R, est surjective mais non injective.

De mme, lhypothse de dimension finie est essentielle mme si E = F , comme le montre


lexemple suivant : soit : C 0 ([0,1],R) 7 C 0 ([0,1],R) lapplication linaire dfinie par :
Z x
0
f (t)dt.
f C ([0,1],R), (f ) : x 7
0

Alors est un endomorphisme, est injective mais non surjective.


Autre contre-exemple : si D : K[X] K[X] dsigne loprateur de drivation P 7 P , alors
D est un endomorphisme, D est surjective mais non injective.
Espaces isomorphes
Proprit
Soit u L (E,F ) un isomorphisme. Alors E est de dimension finie si et seulement si
F est de dimension finie, et dans ce cas dim(E) = dim(F ). On mentionne souvent ce
rsultat en disant : les isomorphismes prservent la dimension .
Dmonstration Supposons E de dimension finie n. Si n = 0, le rsultat est vident car alors
F = {0F }. Si n > 1, limage dune base de E par u est une base de F , qui par consquent
est de dimension finie. De plus, ces deux bases ont le mme nombre de vecteurs, donc on a
dim(E) = dim(F ). Si F est de dimension finie, on raisonne de la mme faon avec la bijection
rciproque u1 : F E.

Proprit Caractrisation des espaces isomorphes par la dimension
Soit E un K-espace vectoriel de dimension finie n. Un K-espace vectoriel F est isomorphe E si et seulement si F est de dimension finie avec dim(F ) = n.
Dmonstration Si E et F sont isomorphes, la proprit prcdente montre que F est de dimension
finie n. Rciproquement, supposons que F est de dimension finie n. Si n = 0, le rsultat est
vident, lapplication nulle tant un isomorphisme de E sur F . Si n > 1, soit (e1 , . . . , en ) une
base de E et (f1 , . . . , fn ) une base de F . Lunique application linaire de E dans F vrifiant
u(ei ) = fi pour tout i est un isomorphisme de E sur F , car elle transforme une base de E en
une base de F . Les espaces E et F sont donc isomorphes.

Exemple Si dim(E) = n > 1 et si (e1 , . . . ,en ) est une base de E, alors lapplication linaire
:

L (E,F ) F n
u 7 (u(e1 ), . . . ,u(en ))
56

est un isomorphisme : en effet, pour toute famille (f1 , . . . ,fn ) dlments de F , il existe une
unique application linaire u L (E,F ) telle que u(ei ) = fi pour tout i [[1,n]], cest--dire,
telle que (u) = (f1 , . . . ,fn ). Ainsi, si F est de dimension finie, L(E,F ) est un espace vectoriel de
dimension finie et de mme dimension que F n , i.e. de dimension ndim(F ) = dim(E)dim(F ).
Corollaire
Tout K-espace vectoriel E de dimension n > 1 est isomorphe Kn .
Remarque Dans ce cas, pour faire le lien avec la dmonstration de la proprite prcdente,
on choisit F = Kn , (f1 , . . . ,fn ) la base canonique de Kn , et u : E Kn lapplication qui
tout vecteur de E associe le n-uplet de ses coordonnes dans une base fixe (e1 , . . . , en ) de E.
Lapplication u est parfois appele isomorphisme des coordonnes.
Le corollaire prcdent montre que Kn est le modle du K-espace vectoriel de dimension n.

V.
1.

Rang et thorme du rang


Rang dune application linaire
Dfinition Rang dune application linaire
Soit u une application linaire de E dans F . Si Im(u) est de dimension finie, on dit que
u est de rang fini et on appelle rang de u la dimension de Im(u), note rg(u).

Remarques
Si F est de dimension finie, alors sachant que Im(u) F , on en dduit que u est de rang fini
avec
rg(u) 6 dim(F ).
On a galit si et seulement si Im(u) = F , i.e., si et seulement si u est surjectif.
Si E est dimension finie n et si (e1 , . . . , en ) est une famille gnratrice de E, on sait que
Im(u) = Vect(u(e1 ), . . . ,u(en )), donc u est de rang fini avec
rg(u) = rg(u(e1 ), . . . ,u(en )) 6 n = dim(E).
En particulier, si, de plus, u est surjective, alors F est de dimension finie et dim(F ) 6 dim(E).
Proprit Rang et composition
Soient E, F et G trois K-espaces vectoriels et u : E F , v : F G deux applications
linaires. Si u ou v est de rang fini, alors v u est de rang fini ; dans le premier cas on
a rg(v u) 6 rg(u), dans le second, rg(v u) 6 rg(v).
En particulier, si u et v sont tous deux de rang fini,
rg(v u) 6 min{rg(u), rg(v)}.
Dmonstration Tout dabord, Im(v u) Im(v), donc si v est de rang fini, v u est de rang fini
avec
rg(v u) = dim(Im(v u)) 6 dim(Im(v)) = rg(v).
Cela prouve lingalit dans le second cas voqu ci-dessus.
Dans le premier cas, notons r le rang de u. Si r = 0, u et v u sont nulles, donc le rsultat est
vrai. Si r > 1, il existe une base (u(e1 ), . . . ,u(er )) de Im(u) o e1 , . . . ,er sont des vecteurs de E.
57

Montrons alors que ((v u)(e1 ), . . . ,(v u)(er )) engendre Im(v u) : soit z = (v u)(x) Im(v u)
avec x E. Alors u(x) Im(u), on peut donc le dcomposer sous la forme
u(x) = 1 u(e1 ) + + r u(er )
o (1 , . . . ,r ) Kr . Par linarit de v, on a alors
z = 1 (v u)(e1 ) + + r (v u)(er ),
ce qui prouve que ((v u)(e1 ), . . . ,(v u)(er )) engendre Im(v u). On en dduit que v u est de
rang fini avec
rg(v u) 6 r = rg(u),
do le rsultat dans ce cas.

Proprit Invariance du rang par composition par des isomorphismes


Soit f G(E) et g G(F ) deux automorphismes et u L(E,F ). Si u est de rang
fini, alors g u f est de rang fini et
rg(u) = rg(g u f ).
Dmonstration Daprs lingalit de la proprit prcdente, on sait que g u est de rang fini
avec rg(g u) 6 rg(u). On en dduit de la mme faon que g u f est de rang fini avec
rg(g u f ) 6 rg(g u) 6 rg(u).
En remarquant que
u = g1 (g u f ) f 1

et en raisonnant de mme, on obtient lingalit oppose

rg(u) 6 rg(g u f )
et finalement le rsultat.

2.

Thorme du rang
Thorme du rang
Si E est de dimension finie et u L (E,F ), alors u est de rang fini et
dim(E) = dim(Ker(u)) + rg(u).

Dmonstration Lespace E est de dimension finie, on sait dj daprs une remarque prcdente
que u est de rang fini ; de plus, Ker(u) admet un supplmentaire V (dans E) : E = Ker(u) V .
Soit

V Im(u)
u
:
x 7 u(x)

Alors u
est injective : soit x V tel que u
(x) = 0Im(u) = 0F . Alors x V Ker(u) = {0E }, donc
x = 0E = 0V . De plus, u
est surjective : fixons y Im(u) et soit x E tel que u(x) = y. On
crit x = x1 + x2 avec x1 V et x2 Ker(u). On a donc
y = u(x1 + x2 ) = u(x1 ) + u(x2 ) = u(x1 ) = u
(x1 ),

et donc y u
(V ). Finalement, u
est un isomorphisme de V sur Im(u) avec E = Ker(u) V ,
donc
dim(E) = dim(Ker(u)) + dim(V ) = dim(Ker(u)) + dim(Im(u)),
58

car les isomorphismes prservent la dimension. On a donc le rsultat car dim(Im(u)) = rg(u). 
Remarque On retrouve la caractrisation des isomorphismes en dimension finie : si E et F sont
de mme dimension finie n, on sait que u est injective si et seulement si dim(Ker(u)) = 0, ce qui
quivaut daprs le thorme du rang rg(u) = dim(E) = dim(F ), cest--dire la surjectivit
de u. En particulier, u est un isomorphisme si et seulement si rg(u) = n.

VI.

Formes linaires et hyperplans

Nous allons maintenant expliciter un lien particulier entre un certain type de sous-espaces
vectoriels de E et un certain type dapplications linaires. Dans cette partie, E est de dimension
finie n > 1.

1.

Formes linaires
Dfinition Forme linaire
On appelle forme linaire sur E toute application linaire de E dans K, i.e., tout
lment de L (E,K).

Remarques
Il sagit dun cas particulier dapplication linaire avec F = K ; en particulier, les scalaires sont
galement les vecteurs de lespace darrive.
Lespace vectoriel K est un K-espace vectoriel de dimension 1, et donc L (E,K) est de dimension
n, comme E.
Exemples
Pour tout i [[1,n]], lapplication
i :

Kn K
(x1 , . . . ,xn ) 7 xi

est une forme linaire sur Kn , appele i-ime forme coordonne (associe la base canonique
de Kn ). Elle est aussi note dxi .
Lapplication

Kn [X] K
Z 1
:

f (x) dx
f 7
0

est une forme linaire sur Kn [X].


Pour tout K, lapplication

Kn [X] K
P 7 P ()

est une forme linaire sur Kn [X].


Remarque Soit L (E,K). Si est non nulle, alors est surjective.
En effet Im() est un sous-espace vectoriel de K, cest donc {0} ou K. Sachant que 6= 0, on a
Im() = K, ce qui prouve que est surjective.
On peut aussi donner une dmonstration plus constructive : il existe x E tel que (x) 6= 0.
Soit K ; alors


(x)
x
= .
=

(x)
(x)
On a donc construit, pour tout K, un vecteur y de E tel que (y) = : est surjective.
59

2.

Hyperplans
Thorme/Dfinition
Soit H un sous-espace vectoriel de E. Les proprits suivantes sont quivalentes :
1. dim(H) = dim(E) 1.
2. Il existe x0 E non nul tel que E = H K x0 .
3. Il existe une forme linaire sur E, non nulle, telle que H = Ker().
Si H vrifie lune de ces proprits quivalentes, on dit que H est un hyperplan de E.

Dmonstration
2 1 : Si E = H K x0 pour un certain vecteur x0 non nul de E, alors
dim(E) = dim(H) + dim(K x0 ) = dim(H) + 1,
do le rsultat.
1 3 : Si n = 1, H = {0E }, et toute forme linaire non nulle convient. Sinon, soit (e1 , . . . ,en1 )
une base de H, que lon complte en base B = (e1 , . . . ,en ) de E. On dfinit alors entirement
une forme linaire sur E en posant
(e1 ) = 0, . . . ,

(en1 ) = 0 , (en ) = 1.

Alors est non nulle (car (en ) = 1) et, si x = x1 e1 + + xn en est un vecteur de E dcompos
sur la base B, on a x Ker() si et seulement si
x1 (e1 ) + + xn (en ) = 0
ce qui quivaut xn = 0, et donc au fait que x Vect(e1 , . . . ,en1 ) = H. On a donc H = Ker().
3 2 : Soit x0 E tel que (x0 ) 6= 0 ; en particulier x0 6= 0E . Il suffit de montrer que
E = Ker() K x0 . Pour tout x E, on a
x=x
De plus,

(x)
x
x0
(x0 )
donc x

(x)
(x)
x0 +
x0 .
(x0 )
(x0 )


= (x)

(x)
(x0 ) = 0,
(x0 )

(x)
(x)
x0 Ker(), et bien sr
x0 K x0 . On a donc E = Ker() + K x0 .
(x0 )
(x0 )

Enfin, si x Ker() K x0 , alors il existe K tel que x = x0 , et 0 = (x) = (x0 ).


Sachant que (x0 ) 6= 0, on a ncessairement = 0, do x = 0E . Ainsi Ker K x0 = {0E }, ce
qui achve de prouver que E = Ker() K x0 .

Remarque Les raisonnements prcdents montrent mme que si H = Ker() est un hyperplan
de E et x0 E, alors E = H K x0 si et seulement si x0
/ H, ce qui quivaut : (x0 ) 6= 0.
Dfinition quation dun hyperplan
Si H est un hyperplan de E et L (E,K) une forme linaire telle que H = Ker(),
on dit que lquation (x) = 0 est une quation de H.

Proprit
Soient et deux formes linaires sur E. Alors Ker() = Ker() si et seulement si il
existe K tel que = .

60

Dmonstration
Cest vident : sachant que 6= 0, pour x E, on a (x) = 0 si et seulement si (x) = 0.
Si = 0, alors = 0 (car dans ce cas Ker() = Ker() = E) et on a = . Sinon, soit
H = Ker(), cest un hyperplan de E en tant que noyau dune forme linaire non nulle. Si n > 2,
soit (e1 , . . . ,en1 ) une base de H, que lon complte en base B = (e1 , . . . ,en ) de E. Alors
(e1 ) = 0 = (e1 ), . . . , (en1 ) = 0 = (en1 ),
(en )
K , on a = , car ces deux applications
(en )
linaires concident sur la base B. Si n = 1, on reprend le raisonnement avec uniquement en . 

et (en ) 6= 0, (en ) 6= 0. En posant =

Remarque On sait que tout hyperplan possde une quation. Daprs la proprit prcdente,
une telle quation est unique multiplication par un scalaire non nul prs.

Soient B = (e1 , . . . ,en ) une base de E et H un hyperplan de E, noyau dune forme linaire
non nulle . Alors, un vecteur x = x1 e1 + + xn en appartient H si et seulement si (x) = 0,
ce qui quivaut par linarit de
x1 (e1 ) + + xn (en ) = 0.
En notant, pour tout i [[1,n]], ai = (ei ) (qui est un lment de K), on a finalement lquivalence :
x H a1 x1 + + an xn = 0.
Dfinition quation dun hyperplan dans une base
Avec les notations prcdentes, on dit que lquation
a1 x1 + + an xn = 0
est une quation de H dans la base B.
On retrouve les quations classiques des hyperplans, par exemple en dimension 2 (droites
vectorielles) et 3 (plans vectoriels).
Les formes linaires sur E dfinissant lhyperplan H sont exactement celles dont lexpression
en coordonnes dans la base B est de la forme
x 7 (a1 x1 + + an xn )
o K . Autrement dit, deux quations dhyperplans dans une mme base dfinissent le mme
hyperplan si et seulement si elles sont proportionnelles.
Exemples
Lquation x + 2y + 3z = 0 dfinit un hyperplan de R3 , cest--dire un plan vectoriel de R3 .
Cest le noyau de la forme linaire non nulle (x,y,z) 7 x + 2y + 3z.
Soit H = {P Kn [X]; P (1) = 0}. Alors H est un hyperplan de Kn [X], cest le noyau de la
forme linaire non nulle

Kn [X] K
:
P 7 P (1)
P
Il a pour quation P (1) = 0. Dans la base (X n , . . . ,1) de Kn [X] (et en notant P = nk=0 xk X k ),
H a pour quation
xn + + x0 = 0.

61

62

Chapitre 4

Matrices
Dans ce chapitre, p et n dsignent deux entiers naturels non nuls et K = R ou C.

I.

Calcul matriciel

1.

Oprations
Soient m et q des entiers naturels non nuls. Soient
A = (ai,j )16i6n Mn,p (K),

B = (bi,j )16i6m Mm,q (K)

16j6p

16j6q

et K. On dfinit la matrice A Mn,p (K) (ou simplement A) par :


(i,j) [[1,n]] [[1,p]], (A)i,j = ai,j .
Si n = m et p = q, on dfinit la matrice A + B Mn,p (K) par :
(i,j) [[1,n]] [[1,p]], (A + B)i,j = ai,j + bi,j .
Si p = m, on dfinit la matrice AB Mn,q (K) par :
(i,j) [[1,n]] [[1,q]], (AB)i,j =

p
X

ai,k bk,j .

k=1

Enfin, on dfinit la matrice transpose de A, note tA ou AT , par :


t

A = (aj,i ) 16i6p Mp,n (K).


16j6n

On vrifie sans difficult que, si A Mn,p (K) et B Mp,q (K), alors


t

(AB) = tB tA.

Notation Si A Mn,p (K), les notations



L1
..
A = . et A = C1

Cp

Ln

signifient que L1 , . . . ,Ln sont les lignes de A, et que C1 , . . . ,Cp sont les colonnes de A (dans cet
ordre).
Remarques

Si A = C1 Cp Mn,p (K) et X =
combinaison linaire des colonnes de A :

x1

xp

AX = x1 C1 + + xp Cp .
63

Mp,1 (K), alors AX est une

L1

Si A = ... Mn,p (K) et B = C1


Cq Mp,q (K), alors :

Ln
La j-ime colonne de AB est le produit ACj de A par la j-ime colonne de B.
La i-ime ligne de AB est le produit Li B de la i-ime ligne de A par B.

Attention !
Le produit matriciel est associatif, mais non commutatif en gnral : si A et B sont deux
lments de Mn (K), on a en gnral AB 6= BA.
Si n > 2, il existe des lments tous deux non nuls A et B de Mn (K) tels que AB = 0.
Le rsultat suivant est immdiat :
Proprit
(Mn,p (K), + ,) est un K-espace vectoriel.
Pour tout (i,j) [[1,n]][[1,p]], on note Ei,j la matrice de Mn,p (K) dont tous les coefficients sont nuls sauf celui en position (i,j) qui vaut 1. Alors la famille (Ei,j )16i6n,16j6p
est une base de Mn,p (K), appele base canonique de Mn,p (K).
(Mn,p (K), + ,) est de dimension finie gale n p.
On montre galement que la formule du binme de Newton est valable pour deux matrices
carres de mme taille qui commutent.

2.

Polynmes de matrices

Si A Mn (K) est une matrice carre, on dfinit, de mme quon la fait pour les endomorphismes, les polynmes de A, et les polynmes annulateurs de A.
Prsentons une mthode trs utile pour calculer les puissances dune matrice A Mn (K).
Soit P un polynme annulateur non nul de A. Pour k N, effectuons la division euclidienne de
X k par P : il existe Qk K[X] et Rk K[X] vrifiant deg(Rk ) < deg(P ), tels que
X k = P (X)Qk (X) + Rk (X).
En valuant cette relation en A, on obtient
Ak = P (A)Qk (A) + Rk (A) = Rk (A),
car P (A) = 0 par dfinition. Le calcul de Ak se ramne donc celui de Rk : il est dautant plus
simple que le degr de P est petit.
Par exemple, soit

0 1 1
A = 1 0 1 M3 (R).
1 1 0
On vrifie facilement que A2 = A + 2I3 , de sorte que le polynme

P (X) = X 2 X 2 = (X + 1)(X 2)
est annulateur de A. Pour k N, la division euclidienne de X k par P peut scrire sous la forme
X k = (X + 1)(X 2)Qk (X) + ak X + bk ,
le reste Rk tant de degr au plus 1. On dtermine ak et bk en valuant la relation prcdente en
1 et 2 (racines de P ) :
(
(1)k = ak + bk
2k = 2ak + bk ,
64

ce qui donne immdiatement


ak =

2k + 2(1)k
2k + (1)k+1
, bk =
.
3
3

Finalement, on a montr que pour tout k N,


Ak =

3.

2k + (1)k+1
2k + 2(1)k
A+
I3 .
3
3

Matrices inversibles
Proprit/Dfinition
Soit A Mn (K). On dit que A est inversible sil existe une matrice B Mn (K)
telle que AB = BA = In .
Une telle matrice est alors unique, elle est note A1 et appele inverse de A.
Lensemble des matrices inversibles de Mn (K) est not Gn (K), il est appel groupe
linaire dordre n.

Dmonstration de lunicit
Si B et C vrifient les proprits de la dfinition, alors
B = BIn = B(AC) = (BA)C = In C = C.

Proprit
Si A et B sont deux lments de Gn (K), alors AB Gn (K) et
(AB)1 = B 1 A1
Dmonstration On a
(AB)(B 1 A1 ) = A(BB 1 )A1 = AIn A1 = AA1 = In ,
et de mme pour le produit (B 1 A1 )(AB). Do le rsultat.

Remarque Dans le chapitre prcdent, on a donn, pour un endomorphisme u, une mthode


pour prouver lexistence de u1 partir dun polynme annulateur de u de coefficient constant
non nul. Cette mthode peut bien sr tre adapte pour les matrices carres.

II.

Matrices, vecteurs et applications linaires

Dans cette partie, sauf indication contraire, E et F dsignent deux K-espaces vectoriels de
dimension finie non nulle. On note p = dim(E), n = dim(F ), B = (e1 , . . . , ep ) une base de
E et C = (f1 , . . . , fn ) une base de F . Enfin, u dsigne une application linaire entre E et F :
u L (E,F ).

1.

Matrices dune famille de vecteurs

Si x est un vecteur de F par exemple (ce qui suit sadapte pour tout espacePvectoriel de
dimension finie), on peut dcomposer x dans la base C de F : on peut crire x = ni=1 ai fi , o
les ai , lments de K, sont les coordonnes de x dans la base C. Le vecteur

a1
..
.
an

65

est appel vecteur (ou matrice) colonne des coordonnes de x dans la base C.
Plus gnralement, si (x1 , . . . ,xk ) est une famille de vecteurs de F , pour tout j [[1,k]], on
peut crire
n
X
ai,j fi ,
xj =
i=1

o les ai,j sont des lments de K.

a1,1
..
.

ai,1

.
..
an,1

Soit A la matrice
. . . a1,j
..
.
...

ai,j
..
.

. . . an,j

. . . a1,k
..
.

. . . ai,k
Mn,k (K)
..
.
. . . an,k

dont la j-ime colonne est, pour tout j [[1,k]], le vecteur des coordonnes de xj dans la base C.
La matrice A est appele matrice de la famille (x1 , . . . ,xk ) dans la base C, note MatC (x1 , . . . , xk ).
Exemple Si C = (1,X,X 2 ) est la base canonique de R2 [X], la matrice de la famille

dans la base C est

2.

(2X 2 X + 1,3X 2 1)

1 1
1 0 .
2
3

Matrices dune application linaire

On sait que lapplication linaire u est entirement dtermine par les p vecteurs u(e1 ), . . . ,u(ep ),
et donc, par leurs coordonnes dans la base C. Linformation concernant u est donc entirement
contenue dans la donne de n p scalaires.
Dfinition
La matrice de la famille u(B) = (u(e1 ), . . . , u(ep )) dans la base C, i.e.
MatC (u(e1 ), . . . , u(ep )) Mn,p (K)
est appele matrice de u dans les bases B et C, et note MatCB (u).
Si E = F et B = C, on note simplement MatB (u).
On retiendra notamment que pour tout j [[1,p]], la j-ime colonne de MatCB (u) est le vecteur
des coordonnes de u(ej ) dans la base C : le fait que
MatCB (u) = (ai,j )16i6n

16j6p

est quivalent au fait que pour tout j [[1,p]],


u(ej ) =

n
X

ai,j fi .

i=1

Exemple Soit
:

R3 [X] R2 [X]
P 7 P

La matrice de dans les bases canoniques de R3 [X] et R2 [X] est

0 1 0 0
0 0 2 0 .
0 0 0 3
66

3.

Isomorphisme entre L (E,F ) et Mn,p(K)

Ainsi, des bases B de E et C de F tant fixes, on peut associer toute application linaire
u L (E,F ) sa matrice dans les bases B et C, qui est un lment de Mn,p (K). On peut en fait
en dire plus :
Thorme
Lapplication
MatCB

L (E,F ) Mn,p (K)


u 7 MatCB (u)

est un isomorphisme despaces vectoriels :


Si u,v L (E,F ) et K,

MatCB (u + v) = MatCB (u) + MatCB (v).


Pour tout A Mn,p (K), il existe une unique application linaire u L (E,F ) dont
la matrice dans les bases B et C soit A.
Dmonstration
Linarit : cest immdiat par dfinition des oprations + et sur les matrices.
P
Bijectivit : Soit A = (ai,j ) Mn,p (K). On pose, pour tout j [[1,p]], yj = ni=1 ai,j fi . Une
application linaire u L (E,F ) a pour matrice A dans les bases B et C si et seulement si pour
tout j [[1,p]], u(ej ) = yj . Or, il existe une unique application linaire u de E dans F satisfaisant

ces conditions. Donc lapplication MatCB est bijective.
Remarques
Attention, on ne peut pas parler de la matrice de lapplication linaire u. Il est indispensable
de prciser les bases au dpart et larrive. Par exemple, lidentit de Rn , dans les bases 2B et
B (B est la base canonique de Rn ) a pour matrice 2In .

Lunique endomorphisme u de E tel que MatB (u) = In est lidentit : u = IdE (remarquer la
diffrence avec lexemple prcdent : ici on considre la mme base au dpart et larrive).
Lunique endomorphisme u de E tel que MatCB (u) = 0 est lapplication nulle.

Cas particulier de E = Mp,1 (K) et F = Mn,1 (K). Pour k entier naturel non nul, lespace
Mk,1 (K) admet pour base canonique la famille Bk = (V1 , . . . , Vk ), o Vi est un vecteur-colonne
n
k composantes, toutes nulles sauf la i-ime qui vaut 1. Daprs le thorme prcdent, MatB
Bp
est un isomorphisme entre L (Mp,1 (K), Mn,1 (K)) et Mn,p (K).
Soit A Mn,p (K). Lunique application linaire de Mp,1 (K) dans Mn,1 (K) dont la matrice
dans les bases Bp et Bn est A, est lapplication linaire canoniquement associe A, i.e.
uA :

Mp,1 (K) Mn,1 (K)


X 7 AX

On fait souvent lidentification entre Mn,1 (K) et Kn (et de mme, entre Mp,1 (K) et Kp ) pour
simplifier lcriture. Il ne faut pas oublier ce que reprsente rellement chacun de ces espaces :
Mn,1 (K) est lespace des vecteurs-colonnes n coefficients, Kn est lespace des n-uplets dlments
de K (et donc, crits en ligne, en sparant les composantes par des virgules).
Les isomorphismes prservent la dimension, donc on retrouve le fait que
dim(L (E,F )) = p n = dim(E) dim(F ).
67

4.

Calcul de limage dun vecteur


Proprit
Soit x E et y = u(x). On note

x1

X = ...
xp

y1

et Y = ...
yn

les vecteurs colonne des coordonnes de x et y dans les bases B et C, respectivement.


Soit A = MatCB (u). Alors Y = AX.

Dmonstration Notons A = (ai,j )16i6n . On a x =


16j6p

u(x) =

p
X

p
X

xj u(ej ) =

j=1

j=1

p
X

xj ej et donc, par linarit de u,

j=1

"

xj

n
X

ai,j fi

i=1

!#

n
X
i=1

p
X

ai,j xj fi .
j=1

Par unicit des coordonnes dans la base C, on en dduit


i [[1,n]],

yi =

p
X

ai,j xj .

j=1

Par dfinition du produit matriciel, ces galits signifient exactement que Y = AX.

Remarque Le produit matriciel a t dfini pour que la proprit prcdente soit vraie.

5.

Lien entre produit de matrices et composition dapplications


Proprit
Soient E, E , E trois K-espaces vectoriels de dimension finie. Soit B une base de E,
B une base de E et B une base de E . Soit u L(E,E ) et v L(E ,E ). On sait
que

v
u
E E E
vu:
x 7 u(x) 7 v(u(x))
appartient L (E,E ). Alors

B
B
MatB
B (v u) = MatB (v) Mat B (u).

B
B
Dmonstration Notons M = MatB
B (v u), A = MatB (u) et B = MatB (v). Soit x E et X
le vecteur colonne des coordonnes de x dans la base B. On sait que M X est le vecteur colonne
des coordonnes de (v u)(x) dans la base B . Or le vecteur colonne des coordonnes de u(x)
dans la base B est Y = AX et le vecteur colonne des coordonnes de v(u(x)) dans la base B
est BY = BAX. Donc

X Mp,1 (K),

M X = BAX,

o p = dim(E). On en dduit que M = BA en choisissant pour X les vecteurs de la base


canonique de Mp,1 (K).

68

Corollaire
Soient E et F deux K-espaces vectoriels de dimension n. Soit B une base de E et C
une base de F . Soit u L (E,F ). Alors on a lquivalence :
u est un isomorphisme MatCB (u) Gn (K).
Dans ce cas,
1
(MatCB (u))1 = MatB
C (u ).

Cas particulier : si E = F et u L (E), on a lquivalence


u est un automorphisme MatB (u) Gn (K).
Dans ce cas,
(MatB (u))1 = MatB (u1 ).
Dmonstration
Si u est un isomorphisme, alors il existe une application linaire v = u1 telle que uv = IdF
B
C
et v u = IdE . Alors daprs la proprit prcdente, MatCB (u) MatB
C (v) = MatC (v) Mat B (u) = In ,
donc MatCB (u) est inversible, dinverse MatB
C (v).
C
Soit A = MatB (u). Si A est inversible, alors il existe une matrice B = A1 telle que
AB = BA = In . Soit v lunique application linaire de F dans E telle que MatB
C (v) = B. Alors
daprs la proprit prcdente, MatC (u v) = MatB (v u) = In , donc u v = IdF et v u = IdE .


6.

Changements de bases
Dfinition Matrice de passage
Soient B = (e1 , .P
. . ,ep ) et B = (e1 , . . . ,ep ) deux bases de E. Pour tout j [[1,p]], on

peut crire ej = pi=1 pi,j ei , cest--dire exprimer ej dans la base B.


La matrice P = (pi,j ) Mp (K) est appele matrice de passage de la base B la
base B .
Les colonnes de P sont les coordonnes des vecteurs de la nouvelle base dans lancienne .

1 est
Remarque On a P = MatB (e1 , . . . ,ep ) = MatB
B (Id). En particulier, P est inversible et P

la matrice de passage de B B.

Exemple Les familles B = (1,X,X 2 ) et B = (1 X + X 2 ,X + 2X 2 ,2 X + 2X 2 ) sont des bases


de R2 [X] : la premire est la base canonique, la seconde comporte 3 = dim(R2 [X]) vecteurs et
on vrifie trs facilement quelle est libre. La matrice de passage de B B est

1 0 2
P = 1 1 1 .
1 2 2
Proprit Formule de changement de bases pour les vecteurs
Soient x un vecteur de E, X la matrice colonne des coordonnes de x dans la base B,
X la matrice colonne des coordonnes de x dans la base B et P la matrice de passage
de B B .
Alors on a la relation X = P X , cest--dire que lon obtient les anciennes coordonnes
en fonction des nouvelles.

69

Dmonstration Daprs la proprit sur le calcul matriciel de limage dun vecteur par une
application linaire, et daprs la remarque ci-dessus,

X = MatB
B (Id) X = P X .

Exemple Dans le cas de lexemple ci-dessus, un polynme a + bX + cX 2 se dcompose dans la


base B sous la forme
(1 X + X 2 ) + (X + 2X 2 ) + (2 X + 2X 2 )

b = P , soit
c

a
= P 1 b .

titre dillustration, en identifiant le coefficient constant dans les deux dcompositions, on


obtient a = + 2, o lon reconnat le premier coefficient du produit


a

b = P .
c

Proprit Formule de changement de bases pour les applications linaires


Soient B et B deux bases de E, C et C deux bases de F . Soient P la matrice de passage
de B B dans E, Q la matrice de passage de C C dans F .

Soient u L (E,F ), A = MatCB (u) et B = MatCB (u). Alors B = Q1 AP .


Dmonstration Avec les notations prcdentes pour x E et des notations analogues pour
y = u(x), on a X = P X , Y = QY , Y = AX et Y = BX , et donc
BX = Y = Q1 Y = Q1 AX = Q1 AP X .
Ceci est vrai pour tout X Mp,1 (K) avec p = dim(E). On en dduit le rsultat en choisissant
pour X les vecteurs de la base canonique de Mp,1 (K).

Exemple Soit
u:

R2 [X] R2 [X]
a + bX + cX 2 7 (a 2b + c) + (3a + 3b 2c)X 2bX 2

Il est immdiat que u L (R2 [X]). crivons la matrice de u dans la base canonique B de R2 [X] ;
on a
u(1) = 1 + 3X, u(X) = 2 + 3X 2X 2 , u(X 2 ) = 1 2X,

donc

1 2 1
A = MatB (u) = 3
3 2 .
0 2 0

De mme, crivons la matrice de u dans la base B de R2 [X] des deux exemples prcdents ; on
a
u(1 X + X 2 ) = 2 2X + 2X 2 = 2(1 X + X 2 ),
u(X + 2X 2 ) = X 2X 2 = (X + 2X 2 ),

donc

u(2 X + 2X 2 ) = 2 X + 2X 2 ,

2 0 0
B = MatB (u) = 0 1 0 .
0 0 1

Les matrices A et B sont relies par la formule de changement de base B = P 1 AP , soit


A = P BP 1 . Du fait de la simplicit de la matrice B, cette relation facilite, par exemple, le
calcul des puissances de A : pour tout k N, Ak = P B k P 1 o B k = diag(2k ,(1)k ,1).
70

Dfinition Matrices semblables


Si (A,B) (Mn (K))2 , on dit que A et B sont semblables si
P Gn (K); B = P 1 AP.

Proprit
Deux matrices de Mn (K) sont semblables si et seulement si elles reprsentent le mme
endomorphisme dun espace de dimension n, quitte faire le mme changement de
base au dpart et larrive.
Remarque La relation de similitude entre matrices dfinit une relation dquivalence sur Mn (K).

III.
1.

Image, noyau et rang dune matrice


Dfinitions, proprits du rang

Toutes les dfinitions et proprits des applications linaires se transposent aux matrices
A Mn,p (K) par lintermdiaire de lapplication linaire canoniquement associe

Mp,1 (K) Mn,1 (K)
uA :
X 7 AX
En particulier, pour A Mn,p (K), on dfinit :
le noyau de A comme le noyau de uA , i.e.
Ker(A) = {X Mp,1 (K); AX = 0}.
limage de A comme limage de uA , i.e.
Im(A) = {Y Mn,1 (K); X Mp,1 (K); Y = AX}.
le rang de A comme le rang de uA .
Remarques
Dterminer Ker(A) revient rsoudre le systme linaire sans second membre de matrice A.

Si A = (C1 Cp ) et X = t x1 xp , alors AX = x1 C1 + + xp Cp . En particulier, les
colonnes de A forment une famille lie si et seulement sil existe un vecteur non nul dans Ker(A),
et un tel vecteur donne explicitement une relation de dpendance linaire entre les colonnes de
A.
Im(A) est engendr par les images par lapplication uA des vecteurs de la base canonique de
Mp,1 (K), cest--dire par les colonnes de A.
En particulier, rg(A) est le rang de la famille des vecteurs colonnes de A.
On sait que le rang dune application linaire nest pas modifi par composition ( droite ou
gauche) par un isomorphisme. Matriciellement, ce rsultat se traduit ainsi :
Proprit
Le rang dune matrice A Mn,p (K) nest pas modifi par multiplication ( droite ou
gauche) par une matrice inversible : si P Gn (K) et Q Gp (K), alors
rg(P A Q) = rg(A).

71

Proprit
Soient u L (E,F ) et A = MatCB (u).
Alors rg(u) = rg(A), i.e., pour calculer le rang de u, il suffit de calculer le rang dune
de ses matrices.
Dmonstration Par dfinition, en notant A = (ai,j ), on a
rg(u) = dim (Vect(u(e1 ), . . . u(ep ))) = dim Vect

n
X

ai,1 fi , . . . ,

n
X

ai,p fi

i=1

i=1

!!

Notons (Vi )16i6n la base canonique de Mn,1 (K) et lisomorphisme de F sur Mn,1 (K) tel que
i [[1,n]],

(fi ) = Vi .

Ainsi, est lapplication qui tout vecteur de F associe la matrice colonne de ses coordonnes
dans la base C. Les isomorphismes prservant la dimension, on a
!!!
!
n
n
X
X
.
ai,p fi
ai,1 fi , . . . ,
rg(u) = dim Vect
i=1

i=1

Ainsi
rg(u) = dim Vect

n
X

ai,1 Vi , . . . ,

n
X

ai,p Vi

i=1

i=1

!!

o lon reconnat le rang de la famille des colonnes de A, et donc rg(A).

Corollaire
Soit (x1 , . . . ,xm ) une famille de vecteurs de E et A = MatB (x1 , . . . ,xm ). Alors
rg(x1 , . . . , xm ) = rg(A),
i.e., pour calculer le rang dune famille de vecteurs, il suffit de calculer le rang dune
de ses matrices.
Dmonstration Soit C = (ej )16j6m la base canonique de Km et u lunique application linaire de
Km dans E telle que pour tout j [[1,m]], u(ej ) = xj . Alors MatB
C (u) = MatB (x1 , . . . ,xm ) = A
et Im(u) = Vect(x1 , . . . , xm ) donc
rg(x1 , . . . , xm ) = rg(u) = rg(A),
la dernire galit provenant de la proprit prcdente.

2.

Caractrisation des matrices inversibles, thorme du rang


Thorme Caractrisation des matrices inversibles
Soit A Mn (K). On a les quivalences :
A est inversible

Im(A) = Mn,1 (K)

rg(A) = n

Ker(A) = {0Mn,1 (K) }.

Ceci permet de montrer que A est inversible sans calculer son inverse.
Dmonstration La matrice A est inversible si et seulement si uA est un isomorphisme. La
caractrisation des isomorphismes en dimension finie donne alors le rsultat.

72

Corollaire
Soient (x1 , . . . ,xp ) une famille de vecteurs de E (on rappelle que p = dim(E)) et
A = MatB (x1 , . . . ,xp ).
Alors, pour que (x1 , . . . ,xp ) soit une base de E, il faut et il suffit que A soit inversible.

Dmonstration La famille (x1 , . . . ,xp ) est une famille de p vecteurs de E avec p = dim(E), donc
cest une base de E si et seulement si elle est gnratrice de E, ce qui quivaut rg(x1 , . . . ,xp ) = p,
i.e., rg(A) = p. Daprs le thorme prcdent, ceci quivaut linversibilit de A.

En appliquant le thorme du rang uA avec A Mn,p (K) (lespace de dpart tant alors
de dimension p), on obtient :
Thorme du rang pour les matrices
Soit A Mn,p (K). Alors

dim(Ker(A)) + rg(A) = p.

Proprit
Soient A et B deux matrices de Mn (K).
Si AB = In alors A et B sont inversibles et inverses lune de lautre.

Dmonstration Si AB = In alors uA uB = Id donc uA est surjective et uB est injective.


Daprs la caractrisation des isomorphismes en dimension finie, on en dduit que uA et uB sont
des isomorphismes, donc A et B sont inversibles. De plus, (uA )1 = uB et donc A1 = B.

Remarque Lorsque AB = In pour deux matrices A et B de Mn (K), il est donc inutile de
vrifier que BA = In , on peut directement conclure que A et B sont inversibles et inverses lune
de lautre.

IV.
1.

La mthode de Gauss-Jordan
Oprations lmentaires

Soit A Mn,p (K). On appelle oprations lmentaires les manipulations suivantes (o


dsigne un scalaire) :
Oprations lmentaires sur les colonnes de A :
Multiplier la i-ime colonne de A par un scalaire non nul : Ci Ci .
Permuter les colonnes i et j de A : Ci Cj ,

Ajouter la i-ime colonne de A, fois la j-ime (j 6= i) : Ci Ci + Cj ,


Oprations lmentaires sur les lignes de A :
Multiplier la i-ime ligne de A par un scalaire non nul : Li Li .

Permuter les lignes i et j de A : Li Lj ,

Ajouter la i-ime ligne de A, fois la j-ime (j 6= i) : Li Li + Lj ,


73

Dfinition Matrices lmentaires


Dans les matrices qui suivent, les coefficients non prciss sont gaux 0. Soit m N .

Pour tout i [[1,m]] et K , on dfinit la matrice de dilatation

Dim () = Ei,i +

Ek,k

k[[1,m]]
k6=i

Ci
..

.
1

1
..

.
..

.
1

Li

Mm (K)

Pour tout (i,j) [[1,m]]2 tel que i 6= j, on dfinit la matrice de transposition

m
i,j
= Ei,j + Ej,i +

k[[1,m]]
k6=i,k6=j

Ek,k

Ci
..

Cj

.
0
..
.
1

..
.

1
..
.
0
..

.
..

Li

Mm (K)
Lj

Dans la matrice prcdente, on a choisi i < j, ce qui nest pas restrictif car pour tout
m = m.
(i,j) [[1,m]]2 tel que i 6= j, i,j
j,i

Pour tout (i,j) [[1,m]]2 tel que i 6= j, pour tout K, on dfinit la matrice de
transvection

m
Ti,j
() = Im + Ei,j

Cj
..

Ci

.
1
..
.

..

1
..

.
..

Lj

Mm (K)
Li

Dans la matrice prcdente, on a choisi i > j, ce qui est restrictif : il est bien sr possible
de choisir i < j, auquel cas le coefficient sera plac au-dessus de la diagonale.

74

Proprit Traduction matricielle des oprations lmentaires


Soit A Mn,p (K). Alors :

1. Oprations lmentaires sur les


La matrice obtenue partir de A
La matrice obtenue partir de A
La matrice obtenue partir de A

2. Oprations lmentaires sur les


La matrice obtenue partir de A
La matrice obtenue partir de A
La matrice obtenue partir de A

colonnes de A :
par lopration Ci Ci est A Dip ().
p
par lopration Ci Cj est A i,j
.
p
par lopration Ci Ci + Cj est A Tj,i
().

lignes de A :
par lopration Li Li est Din () A.
n A.
par lopration Li Lj est i,j
n () A.
par lopration Li Li + Lj est Ti,j

Dmonstration
1. On rappelle quen gnral, la k-ime colonne dun produit AB est le produit de A par la
k-ime colonne de B. On notera C1 , . . . ,Cp les colonnes de A.
En notant T1 , . . . ,Tp les colonnes de Dip (), on a ATi = Ci et ATk = Ck si k 6= i. Do le
rsultat du premier point.
p
De mme, en notant T1 , . . . ,Tp les colonnes de i,j
, on a ATi = Cj , ATj = Ci et ATk = Ck si
k 6= i et k 6= j. Do le rsultat du deuxime point.

p
Enfin, en notant T1 , . . . ,Tp les colonnes de Tj,i
(), on a ATi = Ci + Cj et ATk = Ck si k 6= i.
Do le rsultat du troisime point.
2. De mme, la k-ime ligne dun produit BA est le produit de la k-ime ligne de B par A. On
notera L1 , . . . ,Ln les lignes de A.

En notant T1 , . . . ,Tn les lignes de Din (), on a Ti A = Li et Tk A = Lk si k 6= i. Do le rsultat


du premier point.
n , on a T A = L , T A = L et T A = L si k 6= i
De mme, en notant T1 , . . . ,Tn les lignes de i,j
i
j
j
i
k
k
et k 6= j. Do le rsultat du deuxime point.
n (), on a T A = L + L et T A = L si k 6= i.
Enfin, en notant T1 , . . . ,Tn les lignes de Ti,j
i
i
j
k
k
Do le rsultat du troisime point.


Proprit
Toutes les matrices lmentaires sont inversibles ; plus prcisment : pour tout m N ,
pour tout i [[1,m]], tout j [[1,m]] tel que i 6= j, pour tout K,
(Dim ())1 = Dim (1/) si 6= 0,

m
i,j

1

m
= i,j
,

1
m
m
= Ti,j
().
Ti,j
()

Dmonstration On raisonne laide doprations sur les lignes : si 6= 0, Dim (1/)Dim () est,
daprs la proprit prcdente, la matrice obtenue partir de Dim () par lopration Li Li /,
cest--dire la matrice identit Im . Donc Dim () est inversible dinverse Dim (1/).
m m est la matrice obtenue partir de m par lopration L L , cest--dire,
De mme, i,j
i
j
i,j
i,j
m est inversible et gale sa propre matrice inverse.
la matrice Im . Donc i,j
m ()T m () est la matrice obtenue partir de T m () par lopration
Enfin, Ti,j
i,j
i,j
m () est inversible dinverse
Li Li Lj , cest--dire, ici encore, la matrice Im . Donc Ti,j
m ().
Ti,j


Remarque On comprend bien cette proprit et sa dmonstration en voyant les choses ainsi :
les oprations lmentaires sont reversibles , lopration Li Li pour 6= 0 est compense
par lopration Li Li /, lopration Li Lj est compense par elle-mme, et lopration
Li Li + Lj est compense par lopration Li Li Lj (de mme pour les colonnes).
75

Dfinition Matrices quivalentes par lignes ou par colonnes


Deux matrices A et A de Mn,p (K) sont dites quivalentes par lignes (resp., par colonnes) si elles se dduisent lune de lautre par une suite finie doprations lmentaires
sur les lignes (resp., les colonnes). Ceci se note : A A (resp. A A ).
L

Les oprations lmentaires tant rversibles, il est quivalent dcrire A A et A A (de


L

mme pour les colonnes).

De plus, grce aux rsultats prcdents, A A si et seulement sil existe une matrice
L

E Gn (K), qui est un produit de matrices lmentaires, telle que A = EA . De mme, A A


C

si et seulement sil existe une matrice E Gp (K) produit de matrices lmentaires, telle que
A = A E.

2.

Algorithme du pivot de Gauss-Jordan

On a montr plus haut que le rang nest pas modifi par multiplication gauche ou droite
par une matrice inversible. En fait, il y a dautres invariants de ce type : soit A Mn,p (K).
Si P Gn (K), alors pour tout vecteur X Mp,1 (K), on a lquivalence :
AX = 0 P AX = 0,
car P est inversible. Ceci montre que Ker(A) = Ker(P A) : le noyau dune matrice nest donc pas
modifi par multiplication gauche par une matrice inversible.
Si P Gp (K), alors pour tout vecteur Y Mn,1 (K), on a lquivalence
X Mp,1 (K); Y = AX

X Mp,1 (K); Y = (AP )(P 1 X).

Sachant que P 1 X dcrit Mp,1 (K) lorsque X dcrit Mp,1 (K) (car P est inversible), on en dduit
que Im(A) = Im(AP ) : limage dune matrice nest donc pas modifie par multiplication droite
par une matrice inversible.
Reprenons ces considrations dans le cas o P est une matrice lmentaire : le rang dune
matrice A nest pas modifi par les oprations lmentaires, son noyau nest pas modifi par les
oprations lmentaires sur ses lignes, son image nest pas modifie par les oprations lmentaires
sur ses colonnes. En dautres termes :
Proprit
Deux matrices quivalentes par lignes ou par colonnes ont le mme rang.
Deux matrices quivalentes par lignes ont le mme noyau.
Deux matrices quivalentes par colonnes ont la mme image.
Il est donc naturel dessayer, au moyen doprations lmentaires bien choisies, dobtenir
partir de A une matrice A sur laquelle il sera plus facile de lire les informations telles que son
rang, son noyau ou son image, qui seront les mmes que ceux de A. Cest lobjectif de lalgorithme
de Gauss-Jordan.
Commenons par dcrire la forme quivalente la plus simple laquelle on souhaite aboutir :
76

Dfinition Matrices chelonnes, chelonnes rduites


Soit B Mn,p (K).
On dit que B est chelonne par lignes si elle vrifie les proprits suivantes :
(i) Si une ligne de B est nulle, alors toutes les lignes suivantes de B sont nulles.
(ii) Le cas chant, dans chaque ligne non nulle partir de la deuxime ligne, le premier
coefficient non nul ( partir de la gauche) et situ strictement droite du premier
coefficient non nul de la ligne prcdente.
Le premier coefficient non nul dune ligne non nulle est appel pivot.
On dit que B est chelonne rduite par lignes si elle est chelonne par lignes
et si tous ses pivots sont gaux 1 et sont les seuls lments non nuls de leur colonne.
On dit que B est chelonne par colonnes (resp. chelonne rduite par colonnes) si tB est chelonne par lignes (resp. chelonne rduite par lignes).

Remarque Une matrice chelonne rduite par lignes non nulle a la forme suivante (les pivots
sont nots en gras, le symbole dsigne un coefficient ventuellement non nul. ) :

0
0

..
.

.
..

1
0 0
0 0
.. ..
. .
0 0
0 0
0 0
.. ..
. .

0
0 1
0 0
.. .. .. . .
.
. . .
0 0 0
0 0 0
0 0 0
.. .. ..
. . .

0
0
0
.. .. ..
. . .
0
0 1
0 0 0
.. .. ..
. . .

0 0

0 0 0

0 0 0

..
.

..
.

Le trait de sparation reprsent en partie dans la matrice ci-dessus permet de mettre en


valeur sa structure de matrice chelonne et ses pivots. On parle de schma en escalier.
Chaque ligne et chaque colonne possdant au plus un pivot, le nombre r de pivots dune
matrice chelonne B Mn,p (K) vrifie r 6 n et r 6 p.
Exemple La matrice

1 0 3 5 7
0 2 4 6 8
0 0 0 1 9

est chelonne par lignes, mais pas chelonne rduite par lignes. La matrice

1 0 3 0 7
0 1 4 0 8
0 0 0 1 9
est chelonne rduite par lignes. Une telle matrice peut donc tout fait possder, en dehors des
pivots, des coefficients non nuls.
La matrice prcdente nest pas chelonne par colonnes. La matrice

1 0 0
2 0 0
0 1 0
est chelonne rduite par colonnes.
77

Thorme Algorithme de Gauss-Jordan et traduction matricielle


Soit A Mn,p (K). Alors :
A est quivalente par lignes une unique matrice chelonne rduite par lignes.
De faon quivalente : il existe une matrice E Gn (K), qui est un produit de matrices
lmentaires, et une unique matrice R Mn,p (K) chelonne rduite par lignes, telles
que A = ER.
A est quivalente par colonnes une unique matrice chelonne rduite par colonnes.
De faon quivalente : il existe une matrice E Gp (K), qui est un produit de matrices
lmentaires, et une unique matrice R Mn,p (K) chelonne rduite par colonnes,
telles que A = R E .

Dmonstration de lexistence (la dmonstration de lunicit, non exigible, est admise)


Montrons tout dabord que le premier point entrane le second ; pour cela on applique le
rsultat du premier point tA : il existe E, produit de matrices lmentaires, et R chelonne
rduite par lignes, telles que tA = ER. Alors A = tR tE. Par dfinition, R = tR est chelonne par
colonnes ; la transpose de toute matrice lmentaire tant une matrice lmentaire, E = tE est
un produit de matrices lmentaires. Do lexistence dans le cas des oprations sur les colonnes.
Dans le cas des oprations sur les lignes, on procde par rcurrence sur le nombre p de colonnes
de A = (ai,j ).
Initialisation : si p = 1, A est une matrice colonne. Si A = 0, le rsultat est vrai, sinon, il
existe i0 [[1,n]] tel que ai0 ,1 6= 0. Lopration Li0 L1 (ce qui revient multiplier A gauche
n ) fournit une matrice A quivalente par lignes A dont le coefficient en position (1,1)
par 1,i
0
vaut ai0 ,1 (et dont le coefficient en position (i0 ,1) vaut a1,1 ). Aprs lopration L1 L1 /ai0 ,1
(multiplication de A gauche par D1n (1/ai0 ,1 )) le coefficient en position (1,1) vaut 1. On fait
alors, si n > 2, les n 1 oprations suivantes : Li Li ai,1 L1 , pour i [[2,n]] (multiplication
n (a )), ce qui prouve que A est quivalente par lignes
gauche par Ti,1
i,1

1
0

R = .
..
0

et prouve le rsultat dans ce cas, car R est videmment chelonne rduite par lignes.
Hrdit : supposons le rsultat vrai au rang p, et soit A Mn,p+1 (K).
Premier cas : la premire colonne de A est nulle. On applique alors lhypothse de rcurrence
la matrice B obtenue en extrayant les p dernires colonnes de A. Les oprations faites sur B
peuvent alors tre faites sur A ; elles ne modifient pas la premire colonne de A car cette colonne
est nulle. La matrice obtenue partir de B est chelonne rduite par lignes, il en est de mme
pour celle obtenue partir de A.
Deuxime cas : la premire colonne de A est non nulle. On fait tout dabord, pour cette
premire colonne, exactement le mme raisonnement que pour linitialisation. On note A1 la
matrice quivalente par lignes A laquelle on aboutit alors, puis on applique, si n > 2,
lhypothse de rcurrence la matrice B1 obtenue en extrayant les n 1 dernires lignes et
les p dernires colonnes de A1 . Les oprations faites sur B1 peuvent alors tre traduites en des
oprations sur les n 1 dernires lignes de A1 ; on obtient ainsi une matrice note A2 . Ces
oprations ne modifient pas la premire colonne de A1 car les coefficients de A1 en position (i,1)
avec i > 2 sont nuls.
78

Pour rsumer les notations, on a donc lenchanement suivant dans ce cas :

a1,1
..
..
.
.

A = ai ,1
0
.
..
an,1

..

.
..

..
.

..
.

..
.

traitement de la premire colonne

chelonnement de B1

1
0

..

A1 = .
B1

.
.

1
0

..

,
B2
A2 =
.

.
.

la matrice B2 tant chelonne rduite par lignes.


En particulier, il est clair que A2 est chelonne par lignes. En revanche, elle peut ne pas tre
chelonne rduite car un pivot de B2 peut ne pas tre le seul coefficient non nul de sa colonne
dans la matrice A2 . Ceci nest possible que si B2 6= 0. Dans ce cas, notons (i1 ,j1 ), . . . ,(ir ,jr ) les
positions dans la matrice A2 des pivots de B2 , avec i1 < < ir . Pour k de r 1, on effectue
sur A2 lopration L1 L1 a1,jk Lik . Pour chacune de ces oprations, la premire colonne de
A2 nest pas modifie, les coefficients a1,jm tels que m > k ne sont pas modifis ; lissue de ces
oprations, les pivots de la matrice obtenue, note R, sont donc les seuls coefficients non nuls de
leur colonne. La matrice R est chelonne rduite par lignes, ce qui prouve le rsultat du point
de vue oprations lmentaires .
Du point de vue matriciel, chaque opration revient multiplier gauche par une matrice
lmentaire (comme indiqu dans ltape dinitialisation). On en dduit quil existe une matrice
D, produit de matrices lmentaires, telle que DA = R. Une matrice lmentaire tant inversible
et son inverse tant une matrice lmentaire, D est inversible et D 1 est un produit de matrices
lmentaires. En posant E = D1 , on a bien A = ER avec la forme voulue.

Remarques
La dmonstration ci-dessus dcrit entirement une mthode effective dchelonnement par lignes
ou colonnes. Elle est en particulier programmable pour un traitement par ordinateur.
Dans le cas doprations sur les lignes, la premire tape de lalgorithme est dite tape de
descente, elle aboutit une forme chelonne par lignes. La deuxime tape, qui aboutit la
forme chelonne rduite par lignes, est dite tape de remonte.
Le thorme affirme lunicit de R mais pas celle de E. Cela est li au fait quil ny a pas une
unique suite doprations lmentaires qui permet de passer de A R. En revanche, quelle que
soit la suite doprations convenable, on aboutira la mme matrice chelonne rduite R. Toute
suite doprations lmentaires sur les lignes qui permet de dduire de A une matrice chelonne
rduite par lignes est donc accepte (de mme pour les colonnes).
Notamment, mme si la dmonstration prcdente prsente lannulation des coefficients situs
au-dessus dun pivot seulement en fin de procdure, de la droite vers la gauche, on vrifie facilement quil est possible de le faire au fur et mesure, cest--dire de traiter entirement une
colonne avant de passer la suivante. On remarquera cependant que cela entrane des calculs
moins simples (report de coefficients non nuls) lors des oprations du type Li Li + Lj .

Il faut tre vigilant lorsque lon fait plusieurs oprations la suite, par exemple sur les lignes :
si aprs la premire opration, la ligne i est modifie, et si lopration suivante utilise Li , il sagit
de la ligne modifie. Cest ce qui se passe par exemple lors de la suite doprations L2 L2 L1 ,
L3 L3 L2 : la ligne L2 utilise pour la deuxime opration est celle qui est issue de la
premire opration !
79

Exemples
chelonnons par lignes la matrice M suivante. gauche, on indique les diffrentes matrices
quivalentes par lignes obtenues, jusqu la forme chelonne rduite par lignes, et droite, on
indique lopration qui permet de passer ltape suivante, et sa traduction matricielle (m. g.
signifie multiplication gauche ).

0
= 2
3
2
0
L
3
1
0
L
3
1

0
L
0

0
4
6
4
0
6
2
0
6
2
0
0

1
6
5
6
1
5
3
1
5
3
1
4

2
2
3
2
2
3
1
2
3
1
2
6

L1 L2 ,
L1 L1 /2,
L3 L3 3L1 ,

0 1 0
m. g. par 1 0 0
0 0 1
1/2 0 0
m. g. par 0 1 0
0 0 1 .
1 0 0
m. g. par 0 1 0
3 0 1

On a alors trait la premire colonne, on poursuit lalgorithme en raisonnant sur la matrice


extraite dordre 2 3 en bas droite. La premire colonne de cette matrice tant nulle, on
poursuit en raisonnant sur la matrice extraite dordre 2 2 en bas droite :

1
0
0
1
0
L
0
1
0
L
0
1
0
L
0

2
0
0
2
0
0
2
0
0
2
0
0

3 1
1 2
4 6
3 1
1 2
4 6
3 1
1 2
0 2
3 1
1 2 .
0 1

L2 L2 ,
L3 L3 + 4L2 ,
L3 L3 /(2),

1
m. g. par 0
0
1
m. g. par 0
0
1
m. g. par 0
0

0 0
1 0
0
1
0 0
1 0
4 1

0
0
1
0
0 1/2

ce stade, on a une matrice chelonne par lignes mais pas chelonne rduite. On annule donc,
en partant de la droite, les coefficients situs au-dessus des pivots :

1
0
0
1
0
L
0
1
0
L
0

2
0
0
2
0
0
2
0
0

3
1
0
3
1
0
0
1
0

1
1
L

L
+
2L
2
2
3
2
, m. g. par 0
L1 L1 + L3
1
0
0
1
0
L1 L1 3L2 ,
m. g. par 0
1
0
0
0 .
1

0 0
1 0 1
1 2 , puis 0 1 0
0 1
0 0 1
3 0
1 0
0 1

La matrice ci-dessus, note R, est la matrice chelonne rduite par lignes associe M . On peut
donner directement partir des calculs prcdents, une dcomposition ER pour la matrice M .
80

Lexemple suivant illustre, sur une mme matrice A, les deux mthodes. On remarquera que
lchelonnement en ligne ou en colonne naboutit pas la mme matrice.
chelonnement par lignes :

1 2 8
L3 L3 + L2
A = 1 0 2
L2 L2 + L1
1 1 5

1 2 8
0 2 6 L2 L3
L
0 1 3

1 2 8
0 1 3 L3 L3 2L2
L
0 2 6

1 2 8
0 1 3 L1 L1 2L2
L
0 0 0

1 0 2
0 1 3
L
0 0 0

chelonnement par colonnes :

1 2 8
C2 C2 2C1
A = 1 0 2
C3 C3 8C1
1 1 5

1
0
0
6 C3 C3 3C2
1 2
C
1 1 3

1
0 0
1 2 0 C2 C2 /2
C
1 1 0

1
0
0
1
1
0 C1 C1 + C2
C
1 1/2 0

1
0
0
0
1
0
C
1/2 1/2 0

Rappelons que limage de A nest pas modifie par lalgorithme de Gauss-Jordan sur les
colonnes. On en dduit que

1
0
Im(A) = Vect 0 , 1 ,
1/2
1/2

et en particulier rg(A) = 2. Plus gnralement, cette mthode permet de dterminer lespace


vectoriel engendr par une famille finie de vecteurs dun espace de dimension finie.
De mme, le noyau nest pas modifi par lalgorithme de Gauss-Jordan sur les lignes, et donc :



(
1 0 2
x
x
x + 2z = 0
y Ker(A) y Ker 0 1 3 ,
y + 3z = 0
0 0 0
z
z

On en dduit que


2
2z

Ker(A) = 3z ; z K = Vect 3 ,

z
1

de dimension 1, en accord avec le thorme du rang.

3.

chelonnement, rang et matrices inversibles


Proprit
Soit A Mn,p (K). Alors le rang de A est gal au nombre de pivots de sa matrice
chelonne rduite par lignes, et gal au nombre de pivots de sa matrice chelonne
rduite par colonnes.

Dmonstration Soit R la matrice chelonne rduite par lignes associe A. La matrice R peut
avoir des coefficients non nuls : en position de pivot, droite dans la ligne de chaque pivot (mais
pas au-dessus dautres pivots), et seulement ces positions.
laide doprations sur les colonnes de R, on obtient une matrice quivalente par colonnes
R, o les coefficients autres que les pivots ont t remplacs par des 0. Cette matrice est encore
81

chelonne rduite par lignes et a les mmes pivots que R (attention cependant, elle nest en
gnral pas quivalente par lignes A).
Finalement, il existe une suite finie doprations lmentaires sur les lignes et les colonnes,
qui permet de dduire de A une matrice chelonne rduite par ligne, dont les seuls coefficients
non nuls sont les pivots de R, un tel pivot tant le seul coefficient non nul de sa ligne et de sa
colonne. Le rang dune telle matrice est gal au nombre r des pivots, car la famille de ses colonnes
non nulles est clairement libre, et constitue de r vecteurs.
Les oprations lmentaires ne modifient pas le rang, donc le rang de A est gal au nombre
de pivots de sa matrice chelonne rduite par lignes. En raisonnant de la mme faon, mais en
chelonnant dabord par colonnes, on obtient que le rang de A est gal au nombre de pivots de
sa matrice chelonne rduite par colonnes.

Remarques
Dans le cas des exemples ci-dessus, les transformations du raisonnement prcdent sont les
suivantes :


1 0 0
1 0 2
1 0 0 0
1 2 0 0
A 0 1 3 0 1 0
M 0 0 1 0 0 0 1 0 ,
C
L
C
L
0 0 0
0 0 0
0 0 0 1
0 0 0 1

Lorsque lon passe, par oprations lmentaires, dune matrice chelonne une matrice chelonne rduite (par lignes ou colonnes), le nombre et la position des pivots ne sont pas modifis.
On en dduit que le rang dune matrice chelonne (mme si elle nest pas chelonne rduite)
est gal au nombre de ses pivots. En particulier, le rang de A Mn,p (K) est gal au nombre de
pivots de toute matrice chelonne quivalente par lignes ou par colonnes A.
Proprit Rang de la transpose
Soit A Mn,p (K). Alors rg(tA) = rg(A).
En particulier, le rang de A (qui est le rang de la famille des colonnes de A) est aussi
gal au rang de la famille de ses lignes.

Dmonstration Le rang de tA est gal au nombre de pivots de sa matrice chelonne rduite


par lignes. Or, chelonner tA par lignes revient chelonner A par colonnes, et transposer le
rsultat obtenu. Le nombre de pivots de la matrice chelonne rduite par lignes de tA est donc
gal au nombre de pivots de la matrice chelonne rduite par colonnes de A, qui est le rang
de A. On a donc rg(tA) = rg(A). On en dduit que le rang de A est le rang de la famille des
colonnes de tA, cest--dire le rang de la famille des lignes de A.

Proprit
Soit A Mn (K). La matrice A est inversible si et seulement si elle est quivalente (par
lignes ou par colonnes) la matrice In .
Dmonstration On raisonne dans le cas des lignes, celui des colonnes est analogue. Notons R la
matrice chelonne rduite par lignes de A. La matrice A est carre, on sait quelle est inversible
si et seulement si rg(A) = n, cest--dire, si et seulement si R possde n pivots. Daprs la
dfinition dune matrice chelonne rduite, cest le cas si et seulement si R = In .
Or, on remarque que la matrice In est chelonne rduite par lignes, donc si A In , alors
L

par unicit, R = In . La rciproque est vidente car A R par dfinition de R. Finalement, A


L

est inversible si et seulement si A In .

Or, on sait exactement comment dterminer la matrice chelonne rduite par lignes de A :
cest lalgorithme de Gauss-Jordan. Il en dcoule un moyen effectif de dterminer A1 lorsque A
est inversible :
82

Proprit Calcul de linverse par lalgorithme de Gauss-Jordan


Soit A Gn (K). On note (L) une suite finie doprations lmentaires sur les lignes
de A partir de laquelle on obtient sa matrice chelonne rduite par lignes, In .
Alors la matrice dduite de In par la suite doprations (L) est A1 . On peut donner
le mme rsultat sur les colonnes.

Dmonstration La suite (L) correspond une matrice E Gn (K), produit de matrices lmentaires, telle que EA = In . On en dduit que E = A1 , cest--dire, EIn = A1 . En effectuant
sur In la suite (L) doprations lmentaires, on obtient donc A1 .

Remarque Lalgorithme de Gauss-Jordan permet aussi de prouver que A est inversible : lalgorithme aboutit In si et seulement si A est inversible.

1 0 1
Exemple Soit C = 2 1 3 . On fait en parallle les mmes oprations sur les lignes de C
1 2 2
et de I3 :

1 0 1
1 0 0
L2 L2 2L1
2 1 3
0 1 0
L3 L3 + L1
0 0 1
1 2 2
1 0 1
1 0 0
0 1 1
2 1 0
L3 L3 2L2
0 2 3
1 0 1
1 0 1
1
0 0
L1 L1 L3
0 1 1
2 1 0
L2 L2 L3
5 2 1
0 0 1
4 2 1
1 0 0
7 3 1 .
0 1 0
0 0 1
5 2 1
On en dduit que C est inversible et que C 1

4 2 1
= 7 3 1 .
5 2 1

Soit (x1 , . . . ,xp ) une famille dun K-espace vectoriel E de dimension n. On rappelle que :
(x1 , . . . , xp ) est libre si et seulement si rg(x1 , . . . , xp ) = p.

(x1 , . . . , xp ) engendre E si et seulement si rg(x1 , . . . , xp ) = n.

(x1 , . . . , xp ) est une base de E si et seulement si p = n et rg(x1 , . . . , xp ) = n.

Soit A Mn,p (K) la matrice de (x1 , . . . , xp ) dans une base quelconque de E. Le rang de
(x1 , . . . ,xp ) est gal au rang de la matrice A, qui lui-mme, est gal au nombre r de pivots
de toute matrice chelonne quivalente par lignes ou colonnes la matrice A. On en dduit
que :
(x1 , . . . , xp ) est libre si et seulement si r = p.

(x1 , . . . , xp ) engendre E si et seulement si r = n.

(x1 , . . . , xp ) est une base de E si et seulement si r = p = n.


Exemples
Avec la matrice A des exemples prcdents, montrons que M3,1 (R) = Ker(A) Im(A) : pour
cela on montre que la famille

2
1
0
3 , 0 , 1
1
1/2
1/2
83

est une base de M3,1 (R) grce lalgorithme de Gauss-Jordan sur sa matrice D dans la base
canonique :

2 1
0
D = 3 0
1 C1 C2
1 1/2 1/2

1 2
0
0 3
1 C2 C2 + 2C1
C
1/2 1 1/2

1
0
0
0 3
1 C2 C3
C
1/2 2 1/2

1
0
0
1
3 C3 C3 + 3C2
0
C
1/2 1/2 2

1
0
0
0
1
0
C
1/2 1/2 1/2

La matrice prcdente est chelonne par colonnes. Avec les notations prcdentes, on a dans ce
cas r = p = n = 3, do le rsultat. Daprs un rsultat du chapitre prcdent (fractionnement
dune base), on a donc

2
1
0
M3,1 (R) = Vect 3 Vect 0 , 1 = Ker(A) Im(A).
1
1/2
1/2
Dans E = R1 [X], on considre la famille
F = (X + 1,X + 2,X + 3).
On sait que cette famille est lie car elle est constitue de 3 vecteurs en dimension 2 ; on cherche
une relation de dpendance linaire entre ses lments. On met en oeuvre lalgorithme de GaussJordan sur les lignes de N , matrice de la famille F dans la base (X,1) de R1 [X] :

1
N=
1

1

L 0

1

L 0

1 1
2 3
1 1
1 2

0 1
1 2

L2 L2 L1
L1 L1 L2


On a r = n = 2 et p = 3. On retrouve le fait que la famille F est lie, mais on sait aussi quelle
engendre R1 [X]. De plus, dterminer les relations de dpendance linaire entre les lments de
F revient dterminer les lments non nuls de Ker(N ), qui daprs le calcul prcdent, est
caractris par le systme
(
xz =0
y + 2z = 0

On en dduit que Ker(N ) = Vect(t 1 2 1 ) et notamment,

(X + 1) 2(X + 2) + (X + 3) = 0.

84

4.

Rsolution de systmes linaires

On sintresse dans ce paragraphe la rsolution des systmes linaires par lalgorithme de


Gauss-Jordan. On rappelle que la forme gnrale dun tel systme est

a1,1 x1 + + a1,p xp = b1

a2,1 x1 + + a2,p xp = b2
(S) :
..

a x + + a x = b
n,1 1
n,p p
n

et quen notant A = (ai,j )16i6n,16j6p Mn,p (K), X Mp,1 (K) la matrice colonne de coefficients
x1 , . . . ,xp et B Mn,1 (K) la matrice colonne de coefficients b1 , . . . ,bn , ce systme se met sous la
forme matricielle (E) : AX = B, cest--dire que (x1 , . . . ,xp ) est solution de (S) si et seulement
si X est solution de (E).
Dfinition
Avec les notations prcdentes :
On dit que A est la matrice du systme linaire (S).
On appelle seconds membres du systme (S) les scalaires b1 , . . . ,bn ; on appelle
colonne des seconds membres de (S) la matrice colonne B.
On appelle systme homogne (ou sans second membre) associ (S) le systme
obtenu partir de (S) en remplaant tous les bi par 0. Ce systme scrit matriciellement
AX = 0.
On appelle matrice augmente associe (S) la matrice (A|B) obtenue en mettant
cte cte A et B (dans cet ordre) dans une mme matrice, i.e.
(
ai,j si j 6 p
(i,j) [[1,n]] [[1,p + 1]],
(A|B)i,j =
bi
si j = p + 1.
Comme on la expliqu dans le chapitre prcdent, le systme (S) possde au moins une
solution si et seulement si lquation AX = B possde au moins une solution, ce qui quivaut au
fait que B Im(A).
Dans ce cas, lensemble des solutions de lquation AX = B est {X0 + Y ; Y Ker(A)}, o
X0 dsigne une solution particulire de lquation. En dautres termes, lensemble des solutions
de (S) est {x0 + y; y Sh }, o x0 est une solution particulire de (S) et Sh dsigne lensemble
des solutions du systme homogne (Sh ) associ (S).
Dfinition Systme compatible/incompatible
On dit que le systme (S) est compatible sil possde au moins une solution (cest-dire, avec les notations prcdentes, si B Im(A)).
On dit que (S) est incompatible dans le cas contraire.
Remarque Un vecteur (x1 , . . . ,xp ) Kp est solution de (S) si et seulement si

a1,1 x1 + + a1,p xp b1 = 0

x1

a2,1 x1 + + a2,p xp b2 = 0
..

, ce qui quivaut : . Ker((A|B)).
..

xp

a x + + a x b = 0,
1
n,1 1
n,p p
n

Nous allons maintenant expliquer comment rsoudre en pratique les systmes linaires.
85

Dfinition Oprations sur les lignes dun systme linaire


On dfinit les mmes oprations lmentaires sur les lignes dun systme linaire que
sur les matrices (en tenant compte des seconds membres).
On dit que deux systmes linaires sont quivalents si on peut passer de lun
lautre par une suite finie doprations lmentaires sur les lignes.
Remarques
Les oprations lmentaires tant rversibles, il nest pas ambigu de dire que deux systmes
sont quivalents.
Soient (S) et (S ) deux systmes linaires de matrices respectives A et A de mme taille, et de
colonnes des seconds membres respectives B et B . Alors, pour que (S) et (S ) soient quivalents,
il faut et il suffit que (A|B) et (A |B ) soient quivalentes par lignes. Plus prcisment, si (L)
dsigne une suite finie doprations sur les lignes, alors on peut passer de (S) (S ) par la suite
(L) si et seulement si on peut passer de (A|B) (A |B ) par la suite (L).
Ceci justifie la prsentation matricielle des systmes linaires : pour passer dun systme
linaire (S) un systme (S ) qui lui soit quivalent, on peut former la matrice augmente (A|B)
associe (S), effectuer des oprations lmentaires sur les lignes de (A|B), ce qui fournit une
matrice de la forme (A |B ) partir de laquelle on obtient (S ).
Lintrt des oprations lmentaires sur les lignes dun systme linaire vient notamment de
la proprit suivante :
Proprit
Deux systmes linaires quivalents ont le mme ensemble de solutions.
Dmonstration Avec les notations prcdentes, si (S) et (S ) sont quivalents, (A|B) et (A |B )
sont quivalentes par lignes. Comme on la dj montr, elles ont donc le mme noyau. Ainsi,
pour (x1 , . . . ,xp ) Kp , on a lquivalence

x1
..
.
Ker((A|B))
xp
1

x1
..
.
Ker((A |B )),
xp
1

et donc, daprs une remarque faite plus haut, (x1 , . . . ,xp ) est solution de (S) si et seulement si
(x1 , . . . ,xp ) est solution de (S ).

Rsolution pratique dun systme linaire
Un systme linaire (S) de forme matricielle AX = B, dont la matrice A est chelonne
rduite par lignes, est particulirement facile rsoudre : en gardant lesprit la forme gnrale
dune matrice chelonne rduite par lignes donne page 77, notons (i1 ,j1 ), . . . ,(ir ,jr ) les positions
des pivots de A (on suppose A non nulle) ; en particulier, on a :
j1 < < jr ,
les r premires lignes de A sont non nulles et, le cas chant, les n r dernires sont nulles,
pour tout k [[1,r]], aik ,jk = 1, et aik ,j = 0 si j < jk , ai,jk = 0 si i 6= ik .

Commenons par examiner, le cas chant, les n r dernires lignes de A. Elles correspondent
aux quations 0 = bi , pour i [[r + 1,n]]. Si lun des bi , pour i [[r + 1,n]], est non nul, alors (S)
ne possde aucune solution : il est incompatible.
Sinon, la r-ime quation scrit
xjr + ar,jr +1 xjr +1 + + ar,p xp = br ,
86

elle donne directement xjr en fonction de br et xjr +1 , . . . ,xp . On remonte alors dans le systme,
jusqu la premire quation,
xj1 + a1,j1 +1 xj1 +1 + + a1,p xp = b1 ,
ce qui donne directement xj1 en fonction de b1 et xj1 +1 , . . . ,xp , mais lexpression ne fait pas
intervenir xj2 , . . . ,xjr car la matrice A est chelonne rduite. Finalement, dans ce cas, (S) possde
des solutions, et tout choix de valeurs pour les xj tels que j
/ {j1 , . . . ,jr } donne explicitement
une solution de (S).
Dans le cas gnral, (A quelconque), il existe une matrice E, produit de matrices lmentaires,
et R, chelonne rduite par lignes, telles que EA = R. Lquation AX = B quivaut lquation
RX = EB : on retrouve la situation prcdente. On remarque que EB est la matrice colonne
obtenue en effectuant sur B les oprations faites pour passer de A sa forme chelonne rduite
par lignes R.
En pratique, pour rsoudre lquation AX = B, on forme la matrice augmente (A|B), sur
laquelle on met en oeuvre lalgorithme de Gauss-Jordan sur les lignes :
lissue de la phase de descente, on peut dj dterminer si le systme est compatible ou
incompatible : il est compatible si et seulement si la dernire colonne (correspondant au second
membre) ne contient aucun pivot. Les oprations lmentaires que lon aurait faites en traitant
uniquement A suffisent faire cette vrification.
Si le systme est compatible, la phase de remonte fera intervenir les mmes oprations lmentaires que si lon chelonnait uniquement A, car le dernier pivot ne se situe pas dans la dernire
colonne correspondant au second membre. On obtient donc bien la forme quivalente RX = EB.
Exemple Rsolvons le systme linaire

x +2y +8z = 7
x
2z = 3

x
+y +5z = 5

La matrice de ce systme est la


 matrice A dun exemple trait page 81. La colonne des seconds
t
membres est B = 7 3 5 . On met en oeuvre lalgorithme de Gauss-Jordan sur les lignes
de la matrice augmente (A|B) :

1 2 8
7
L3 L3 + L2
(A|B) = 1 0 2 3
L2 L2 + L1
1 1 5
5

1 2 8 7

0 2 6 4 L2 L3
L
0 1 3 2

1 2 8 7
0 1 3 2 L3 L3 2L2
L
0 2 6 4

1 2 8 7
0 1 3 2
L
0 0 0 0

Le systme est compatible. Lopration L1 L1 2L2

1 0 2

(A|B) 0 1 3
L
0 0 0
Le systme (S) est donc quivalent
(
x + 2z = 3

y + 3z = 2

i.e.,
87

montre finalement que

3
2
0

x = 3 2z
y = 2 3z

Linconnue z nest lie par aucune quation, on la choisit comme paramtre, que lon peut
renommer , cest--dire que lensemble des solutions de (S) est
{(3 2, 2 3, ); K} = {(3,2,0) + (2, 3,1); K}.
On obtient une reprsentation paramtrique de lensemble des solutions, et on retrouve bien,
pour les solutions, la forme gnrale x0 + y o x0 = (3,2,0) est une solution particulire (obtenue
pour = 0), et y Vect(2, 3,1) avec

2
Vect 3 = Ker(A).
1
Dfinition
Soit (S) un systme linaire de matrice A non nulle.
Les inconnues xj1 , . . . ,xjr dont les indices sont ceux des colonnes des pivots de la matrice chelonne rduite par lignes associe A, sont appeles inconnues principales
de (S).
Les autres inconnues sont appeles inconnues secondaires, ou paramtres.
On appelle rang du systme (S) le nombre r, cest--dire le nombre de pivots de la
matrice chelonne rduite par lignes associe A.
Le nombre de paramtres est donc gal p r, cest--dire, la diffrence du nombre
dinconnues et du rang de (S).

Remarques
Comme on la montr dans le paragraphe 3, r est aussi le rang de la matrice A, ce qui montre
la cohrence de lappellation.
Un systme sans second membre est toujours compatible, car le p-uplet (0, . . . ,0) en est solution.
Dans lexemple trait ci-dessus, les inconnues principales sont x et y, le paramtre est z. Le
rang du systme est 2.
De ltude prcdente, on dduit que trois cas se prsentent quant lensemble S des solutions
dun systme linaire (S) de rang r et de matrice A Mn,p (K) :

Si le systme est incompatible, alors S = .


Si le systme est compatible et si r = p, alors le systme na que des inconnues principales,
et donc, possde une unique solution : S est rduit un point.
Si le systme est compatible et si r < p, alors le systme a p r paramtres et S est infini.

Le thorme du rang montre aussi que

p = dim(Ker(A)) + rg(A),

cest--dire que p r = dim(Ker(A)).

Le nombre de paramtres dun systme compatible de matrice A est donc gal dim(Ker(A)).
Ceci est bien sr cohrent avec la description de lensemble des solutions de (S).
De plus, on rappelle que le systme est compatible si et seulement si B Im(A). Par exemple,
si r = n, alors rg(A) = dim(Mn,1 (R)), et donc Im(A) = Mn,1 (R) : le systme est donc compatible
quel que soit le choix de B. Si r < n, il existe des choix de B pour lesquels le systme est
incompatible. Cest par exemple le cas si p < n, car dans ce cas r 6 p < n.
La situation suivante est galement intressante : si r = n = p, alors quel que soit le choix
de B, le systme (S) est compatible et possde une unique solution (on dit dans ce cas que (S)
est un systme de Cramer). On retrouve ce rsultat en remarquant que dans ce cas, A est une
matrice carre inversible ; pour tout B, on a lquivalence AX = B X = A1 B.
88

On a en fait la caractrisation suivante :


Proprit Matrices inversibles et rsolution de systmes
Soit A Mn (K). Les proprits suivantes sont quivalentes :
1. A est inversible.
2. Le systme AX = 0 admet pour unique solution le vecteur nul.
3. Pour tout B Mn,1 (K), le systme AX = B possde une unique solution.
4. Pour tout B Mn,1 (K), le systme AX = B possde au moins une solution.
Dmonstration La matrice A est inversible si et seulement si lapplication uA canoniquement
associe A est un isomorphisme, ce qui quivaut au point 3. Daprs la caractrisation des
isomorphismes en dimension finie, ceci quivaut au fait que Ker(A) = {0Mn,1 (K) }, i.e. au point
2, et galement au fait que Im(A) = Mn,1 (K) (i.e. au point 4).

Dans ce cas, la rsolution du systme AX = B o B est un second membre quelconque
permet mme dexpliciter A1 : si lon rsout le systme AX = B, cest--dire si lon dtermine
M Mn (K) telle que AX = B quivaut X = M B, alors quel que soit le choix de B,
on a A1 B = M B, do lon dduit que A1 = M en choisissant pour B les vecteurs de
la base canonique de Mn,1 (K). Par exemple, on vrifie par oprations sur les lignes que pour
(x1 ,x2 ,x3 ) K3 et (b1 ,b2 ,b3 ) K3 ,

2x1 + x2 + x3 = b1
x1 + 2x2 + x3 = b2

x1 + x2 + 2x3 = b3

x1 = 4 (3b1 b2 b3 )

1
x2 = (b1 + 3b2 b3 )

x3 = (b1 b2 + 3b3 )
4

do lon dduit que

2 1 1
A = 1 2 1
1 1 2

V.
1.

est inversible avec

A1

3 1 1
1
= 1 3 1 .
4
1 1 3

Trace dune matrice et dun endomorphisme


Trace dune matrice carre
Dfinition Trace dune matrice
Soit A = (ai,j )16i,j6n Mn (K) une matrice carre. On appelle trace de A le scalaire
Tr(A) =

n
X

ai,i ,

i=1

cest--dire la somme des coefficients diagonaux de A.

Proprit
Lapplication Tr est une forme linaire sur Mn (K).
Dmonstration Cest immdiat, Tr est une somme de formes linaires sur Mn (K).
89

Proprit
Soient A et B deux matrices carres dordre n. Alors Tr(AB) = Tr(BA).
Dmonstration Notons ai,j et bi,j les coefficients de A et B. Alors pour tout (i,j) [[1,n]]2 ,
n
X

(AB)i,j =

ai,k bk,j ,

k=1

n
n X
n
X
X
ai,k bk,i . En changeant dindice, on peut crire
(AB)i,i =
de sorte que Tr(AB) =
i=1 k=1

i=1

Tr(AB) =

n
X

ai,j bj,i .

i,j=1

En changeant les rles de A et B, on a de mme


Tr(BA) =

n
X

bi,j aj,i .

i,j=1

Le changement dindice i j montre alors que Tr(BA) = Tr(AB).

Proprit
Deux matrices semblables ont la mme trace.
Dmonstration Si A et B sont semblables, il existe P Gn (K) tel que B = P 1 AP. Alors
daprs la proprit prcdente,
Tr(B) = Tr(P 1 AP ) = Tr(AP P 1 ) = Tr(A).

2.

Trace dun endomorphisme


Proprit
Soient E un K-espace vectoriel de dimension finie et u L (E). Toutes les matrices
reprsentant lendomorphisme u ont la mme trace : si B et B sont deux bases de E,
si A = MatB (u) et B = MatB (u), alors Tr(A) = Tr(B).

Dmonstration Si A = MatB (u) et B = MatB (u), alors A et B sont semblables daprs les
formules de changement de bases. Le rsultat provient alors de la proprit prcdente.

Dfinition Trace dun endomorphisme
Soient E un K-espace vectoriel de dimension finie et u L (E). On dfinit la trace de
u comme la trace dune quelconque de ses matrices.
Exemple Soit
u:

M2 (R) M2 (R)
M 7 tM + 2M

Pour calculer Tr(u), crivons la matrice de u dans la



 
1 0
0
B = (e1 ,e2 ,e3 ,e4 ) =
,
0 0
1
90

base de M2 (R)
 
 

0
0 1
0 0
,
,
;
0
0 0
0 1



1 0
1
u(e1 ) =
+2
0 0
0



0 1
0
u(e2 ) =
+2
0 0
1



0
0 0
+2
u(e3 ) =
0
1 0



0
0 0
+2
u(e4 ) =
0
0 1

on a

et donc

do : Tr(u) = Tr(MatB (u)) = 10.

VI.
1.

3
0
MatB (u) =
0
0

0
2
1
0


0
= 3 e1
0

0
= 2 e2 + e3
0

1
= e2 + 2e3
0

0
= 3 e4 ,
1
0
1
2
0

0
0
,
0
3

Sous-espaces stables
Matrices dfinies par blocs

Soient m et q deux entiers naturels non nuls et (Ai,j )16i6m,16j6q une famille de matrices
coefficients dans K. On suppose que pour tout j [[1,q]], toutes les matrices Ai,j pour i [[1,m]]
ont le mme nombre pj de colonnes. De mme, on suppose que pour tout i [[1,m]], toutes les
matrices Ai,j pour j [[1,q]] ont le mme nombre ni de lignes.
On dfinit alors la matrice

A1,1 . . . A1,j
..
..
.
.

B=
A
.
.
.
A
i,j
i,1
.
..
.
.
.
Am,1 . . . Am,j

...
...

A1,q
..
.

Ai,q

..
.

. . . Am,q

obtenue en
P crivant cte cte le contenu des matrices Ai,j . La matrice B possde
lignes et qj=1 pj colonnes.

Pm

i=1 ni

Proprit Calculs par blocs

Sous rserve de compatibilit des tailles des blocs, on a :



 
 

A B
A B
A + A B + B

+
=
,
C D
C + C D + D
C D


 

A B
A B
AA + BC AB + BD

=
.
C D
CA + DC CB + DD
C D
Remarque On gnralisera sans difficult cette proprit au cas dun nombre quelconque de
blocs.
Attention !
Le sens des oprations est important. En effet par exemple, en gnral, AB 6= B A.
Il est ncessaire que les dimensions des blocs soient compatibles. Pour le premier point, les
matrices A et A doivent tre de mme taille, de mme pour B et B , etc... Pour le second point,
le nombre de colonnes de A doit tre gal au nombre de lignes de A , etc...
91

2.

Sous-espaces stables

Dans ce paragraphe uniquement, E est un K-espace vectoriel qui nest pas suppos de dimension finie.
Si E = V W , un endomorphisme u L (E) est entirement dfini par ses restrictions V
et W , qui peuvent tre plus simples si V et W sont bien choisis.
Dfinition Sous-espace stable par un endomorphisme
Soit V un sous-espace vectoriel de E, et u L (E).
On dit que V est stable par u si u(V ) V , cest--dire : x V , u(x) V .
Exemple Soit E = K[X], V = {P E; P (1) = 0} et u lapplication linaire qui P E
associe le polynme XP (X). Alors V est stable par u : si P (1) = 0, on a aussi (u(P ))(1) = 0.
Proprit/Dfinition Endomorphisme induit
Si V est un sous-espace vectoriel de E stable par u, alors lapplication

V V
u|V :
x 7 u(x)
est un endomorphisme de V , appel endomorphisme de V induit par u.
Attention ! Il ne sagit pas dune simple restriction de u : lespace darrive est aussi restreint.
Proprit
Soient u et v deux endomorphismes de E qui commutent (i.e. u v = v u).
Alors Ker(u) et Im(u) sont stables par v.
Dmonstration Soit x Ker(u). Montrons que v(x) Ker(u) : sachant que u et v commutent,
on a u(v(x)) = v(u(x)) = v(0) = 0, i.e. v(x) Ker(u), do le rsultat.
De mme si y = u(x) Im(u), avec x E, alors v(y) = v(u(x)) = u(v(x)) Im(u), donc
Im(u) est stable par v.

Remarque En particulier, si u L (E), Ker(u) et Im(u) sont stables par u (en effet, u commute
avec lui-mme).

3.

Traduction matricielle
Dans ce paragraphe, E est un K-espace vectoriel de dimension finie n > 2.
Proprit
Soit V un sous-espace vectoriel de E de dimension r [[1,n 1]]. Soit B = BV F une
base de E adapte V (avec BV une base de V ) et soit u L (E).
Alors V est stable par u si et seulement si MatB (u) est de la forme


A B
0 C
o A est dordre r et 0 dsigne un bloc nul. Dans ce cas, A = MatBV (u|V ).

92

Dmonstration Notons B = (e1 , . . . ,en ), de sorte que BV = (e1 , . . . ,er ). Le sous-espace V est
stable par u si et seulement si pour tout vecteur x de V , u(x) Vect(e1 , . . . ,er ). En raisonnant avec des combinaisons linaires, il est immdiat que ceci quivaut : pour tout i [[1,r]],
u(ei ) Vect(e1 , . . . ,er ).
Ainsi, V est stable par u si et seulement si les coordonnes de u(e1 ), . . . ,u(er ) selon er+1 , . . . ,en
sont nulles. Or les r premires colonnes de MatB (u) sont les matrices colonnes des coordonnes
de u(e1 ), . . . ,u(er ) dans la base B. On a donc lquivalence souhaite.
Lorsque V est stable par u, les colonnes de la matrice A sont les matrices colonnes des
coordonnes de u(e1 ), . . . ,u(er ) dans la base (e1 , . . . ,er ) de V , donc A = MatBV (u|V ).

En raisonnant de faon analogue, on obtient :
Proprit
Soient m > 2, u L (E) et B = B1 Bm
Bi est compose de ni vecteurs.
Les proprits suivantes sont quivalentes :
MatB (u) est de la forme

A1 0

0 ...

.
..
..
.
0

une base de E, o, pour tout i [[1,m]],

..
.
..
.
0

0
..
.

0
Am

avec, pour tout i [[1,m]], Ai dordre ni .


Pour tout i [[1,m]], Ei = Vect(Bi ) est stable par u.

Dans ce cas, on a Ai = MatBi (u|Ei ) pour tout i [[1,m]].


On a alors une dcomposition E = E1 Em en somme directe de sous-espaces
stables par u.

Dfinition
On appelle matrice diagonale par blocs une matrice carre de la forme prcdente.
Cas particulier Une matrice diagonale est une matrice diagonale par blocs telle que, avec les
notations prcdentes, pour tout i [[1,m]], Ai na quun coefficient (on a alors m = n).
Daprs la proprit prcdente, si B = (e1 , . . . ,en ), ceci quivaut au fait que pour tout
i [[1,n]],
u(ei ) Vect(ei ).
cest--dire, au fait que u(ei ) soit un multiple de ei .
Dfinition
On appelle matrice triangulaire suprieure par blocs une matrice carre, dfinie
par blocs, de la forme

A1,1 A1,2
A1,m

..
..
..
0

.
.
.

,
.

..
..
..
. Am1,m
.
0

0
Am,m

o m > 2 et pour tout i [[1,m]], Ai,i est une matrice carre.

93

Proprit
Soient m > 2, u L (E) et B = B1 Bm une base de E, o, pour tout i [[1,m]],
Bi est compose de ni vecteurs. On note, pour tout i [[1,m]], Ei = Vect(Bi ).
Les proprits suivantes sont quivalentes :
MatB (u) est de la forme prcdente avec, pour tout i [[1,m]], Ai,i dordre ni ,
Pour tout i [[1,m]], u(Ei ) E1 Ei .
Remarque Dans ce cas, E1 est stable par u, mais en gnral, pas E2 , . . . ,Em .
Cas particulier Une matrice triangulaire suprieure est une matrice triangulaire par blocs
telle que, avec les notations prcdentes, pour tout i [[1,m]], Ai,i na quun coefficient (on a
alors m = n).
Daprs la proprit prcdente, si B = (e1 , . . . ,en ), ceci quivaut au fait que pour tout
i [[1,n]],
u(ei ) Vect(e1 , . . . ,ei ).
Exemple Les matrices

1
3

A=
0
0
0

2
4
0
0
0

5
3
2
0
0

3
2
3
5
3

1
4

1
2

et

1
3

B=
0
0
0

2
4
0
0
0

0
0
2
0
0

0
0
0
5
3

0
0

1
2

sont respectivement triangulaire par blocs et diagonale par blocs. Si A et B sont les matrices
respectives de deux endomorphismes u et v de E dans une base (e1 ,e2 ,e3 ,e4 ,e5 ), alors en notant
E1 = Vect(e1 ,e2 ), E2 = Vect(e3 ), E3 = Vect(e4 ,e5 ), on a E = E1 E2 E3 , avec E1 stable par
u et v, E2 et E3 stables par v, et u(E2 ) E1 E2 .

Remarque Un objectif fondamental de lalgbre linaire consiste construire des sous-espaces


stables par u ou en prouver lexistence, voire construire des dcompositions de lespace en
somme directe de sous-espaces stables par u. Dans le cas idal, lendomorphisme induit par u sur
chacun de ces sous-espaces est une homothtie ; la matrice de u dans une base adapte est alors
diagonale, ce qui simplifie tous les calculs. Cest lobjectif de la rduction des endomorphismes,
voir les chapitres Rduction et Endomorphismes remarquables des espaces euclidiens.
Exemple Le cas particulier des projecteurs et des symtries
Si p est un projecteur (cest--dire, si p p = p), alors

E = Ker(p Id) Ker(p)

avec Ker(p Id) = Im(p). De plus Ker(p Id) et Ker(p) sont stables par p (car p commute avec
lui-mme) et p|Ker(pId) = Id, p|Ker p = 0. On a donc, dans une base adapte B :


Ir 0
MatB (p) =
0 0

o r = dim(Im(p)) = rg(p). On remarque en particulier que Tr(p) = rg(p) : le rang dun


projecteur est gal sa trace.
De mme, si s est une symtrie (cest--dire, si s s = Id), alors
E = Ker(s Id) Ker(s + Id).

De plus Ker(s Id) et Ker(s + Id) sont stables par s, avec s|Ker(sId) = Id et s|Ker(s+Id) = Id.
On a donc dans une base adapte B :


Im
0
MatB (s) =
0 Iq

avec m = dim(Ker(s Id)) et q = dim(Ker(s + Id)).


94

VII.

Dterminant

Notation Si f est une application de Mn (K) dans K, si A = (C1 Cn ) Mn (K) et


U Mn,1 (K), on sera amen utiliser la notation
f (C1 Ci1 U Ci+1 Cn ) ou simplement

f (C1 U Cn )

pour i [[1,n]]. Bien sr, cette notation na pas toujours de sens, par exemple pour i = 1, ou
i = n. Dans ces cas, on sous-entend respectivement
f (U Cn ) et f (C1 U )
cest--dire que dans tous les cas, on remplace la colonne Ci par U dans lexpression f (C1 Cn ).

De plus, pour favoriser la lisibilit dans certains cas, on utilisera un trait de sparation vertical
entre les colonnes, cest--dire que la matrice (C1 Cn ) sera parfois note (C1 | | Cn ).

1.

Dterminant dune matrice carre


Thorme/Dfinition : Dterminant dune matrice carre
Il existe une unique application f : Mn (K) K vrifiant les proprits suivantes :
(i) f est linaire par rapport chacune des colonnes de sa variable :

i [[1,n]], (C1 Cn ) Mn (K), (U,V ) (Mn,1 (K))2 , K :


f (C1 | | Ci1 | U + V | Ci+1 | | Cn )

= f (C1 | | Ci1 | U | Ci+1 | | Cn ) + f (C1 | | Ci1 | V | Ci+1 | | Cn ).


(ii) f est antisymtrique par rapport aux colonnes de sa variable :
(i,j) [[1,n]]2 ; i 6= j, (C1 Cn ) Mn (K),
f (C1

Ci
|{z}

position i

(iii) f (In ) = 1.

Cj
|{z}

Cn ) = f (C1

position j

Cj
|{z}

position i

Ci
|{z}

position j

Cn ).

Cette application est appele dterminant et note det.

Proprit
Une application f : Mn (K) K qui vrifie la proprit (ii) vrifie aussi la proprit
suivante : si A Mn (K) a deux colonnes gales, alors f (A) = 0.
Dmonstration En effet, si les colonnes dindices i et j de A sont gales, avec i 6= j, on a par
antisymtrie
f (A) = f (C1 Ci Ci Cn ) = f (C1 Ci Ci Cn ) = f (A)
et donc f (A) = 0.

Dmonstration de lexistence et de lunicit du dterminant


Dmontrons cette proprit dans le cas o n = 3 ; la dmonstration est plus facile dans les
cas n = 1 et n = 2, elle est hors programme pour n > 4.
Unicit : Soit f une application vrifiant les trois proprits ci-dessus et A = (ai,j ) M3 (K).
En notant (e1 ,e2 ,e3 ) la base canonique de M3,1 (K), on a donc
f (A) = f (a1,1 e1 + a2,1 e2 + a3,1 e3 |a1,2 e1 + a2,2 e2 + a3,2 e3 |a1,3 e1 + a2,3 e2 + a3,3 e3 ) .
95

Par linarit de f par rapport chacune des colonnes de sa variable, on peut dvelopper lexpression ci-dessus. De plus, daprs la proprit prcdente, tous les termes correspondant des
matrices ayant deux colonnes gales sont nuls. Ainsi
f (A) = a1,1 a2,2 a3,3 f (e1 |e2 |e3 ) + a1,1 a3,2 a2,3 f (e1 |e3 |e2 )
+ a2,1 a1,2 a3,3 f (e2 |e1 |e3 ) + a2,1 a3,2 a1,3 f (e2 |e3 |e1 )

+ a3,1 a1,2 a2,3 f (e3 |e1 |e2 ) + a3,1 a2,2 a1,3 f (e3 |e2 |e1 )
De plus, daprs la proprit (iii), f (I3 ) = 1, et par antisymtrie,

f (e1 |e3 |e2 ) = f (e3 |e2 |e1 ) = f (e2 |e1 |e3 ) = f (e1 |e2 |e3 ) = 1

f (e2 |e3 |e1 ) = f (e1 |e3 |e2 ) = f (e1 |e2 |e3 ) = 1

f (e3 |e1 |e2 ) = f (e1 |e3 |e2 ) = f (e1 |e2 |e3 ) = 1.


Finalement,
f (A) = a1,1 a2,2 a3,3 + a2,1 a3,2 a1,3 + a3,1 a1,2 a2,3
a3,1 a2,2 a1,3 a2,1 a1,2 a3,3 a1,1 a3,2 a2,3 .
Pour tout A Mn (K), le scalaire f (A) est donc entirement dtermin par une mme formule
sur les coefficients de A. En particulier, il existe au plus une application f vrifiant les trois
proprits du thorme.
Existence : On dfinit f par la formule obtenue ci-dessus. Il est alors immdiat que f (I3 ) = 1 car
dans ce cas, seul le terme a1,1 a2,2 a3,3 est non nul, et il vaut 1. Donc f vrifie la proprit (iii). De
plus, changer deux colonnes de A a pour effet dchanger les indices de colonnes correspondants
sur les ai,j , lintrieur de chacun des termes de la somme. On remarque alors que chaque terme
affect dun signe positif est chang avec un terme affect dun signe ngatif. Limage par f de la
matrice obtenue est donc f (A), ce qui prouve que f vrifie la proprit (ii). Enfin, si la colonne
j de la matrice A est de la forme U + V avec (U,V ) M3,1 (K)2 (de coefficients respectifs nots
u1 , u2 , u3 et v1 , v2 , v3 ), alors pour tout i [[1,3]], ai,j = ui + vi . En reportant cette expression
dans la somme donnant f (A), en dveloppant le rsultat et en regroupant les termes, on obtient
la linarit de f par rapport la j-ime colonne de sa variable, et ce pour tout j [[1,n]].

Remarques
Pour n = 1, si A = (a) avec a K, on a det(A) = a. Pour n = 2, on obtient, pour tout
(a,b,c,d) K4 ,



a c
det
= ad bc.
b d
Pour n = 2 et n = 3, les formules dmontres sont appeles rgle de Sarrus. Elle nont pas
dquivalent lorsque n > 4.
On remarquera que pour chacun des termes de la somme donnant det(A), on choisit un coefficient dans la premire colonne, puis un dans la seconde, jusqu la n-ime, en choisissant des
indices de lignes deux deux distincts. On fait ensuite la somme pour toutes les faons possibles
de faire un tel choix, en affectant chaque terme un signe (dpendant en fait de lordre dans lequel on a choisi les lignes). Cette structure apparat nettement dans la dmonstration dexistence
ci-dessus.
96

Proprit Effet des oprations lmentaires


Soit A = (C1 Cn ) Mn (K).
Si B est obtenue partir de A par lopration Ci Cj (i 6= j), alors
det(B) = det(A).
Si B est obtenue partir de A par lopration Ci Ci + Cj (i 6= j), alors on a :
det(B) = det(A).
Si B est obtenue partir de A par lopration Ci Ci ( K), alors on a :
det(B) = det(A).
Pour tout K, det(A) = n det(A).
Dmonstration
Cest une rcriture de la proprit dantisymtrie par rapport aux colonnes.
Par linarit du dterminant par rapport la i-ime colonne de sa variable,
det(B) = det(C1 Ci1 Ci Ci+1 Cn ) + f (C1 Ci1 Cj Ci+1 Cn ).
Dans le dernier terme, la colonne Cj apparat deux fois, car i 6= j. Ce terme est donc nul daprs
une proprit du dterminant. On en dduit que
det(B) = det(C1 Ci1 Ci Ci+1 Cn ) = det(A).
Il suffit dutiliser la linarit du dterminant par rapport la i-me colonne de sa variable.
On applique successivement le point prcdent chacune des n colonnes de A.

Remarques
En particulier, on remarquera que les oprations lmentaires sur les colonnes conservent le
dterminant ou le multiplient par un scalaire non nul.
Daprs le troisime point, le dterminant dune matrice de dilatation Din () vrifie
det(Din ()) = det(In ) = .
n est obtenue partir de I par lopration C C , donc par
Une matrice de transposition i,j
n
i
j
antisymtrie,
n
det(i,j
) = 1.

n () est obtenue partir de I par lopration C C + C


Une matrice de transvection Ti,j
n
j
j
i
qui ne modifie pas le dterminant, donc
n
det(Ti,j
) = 1.

Corollaire Matrices inversibles et dterminant


Soit A Mn (K). Pour que A soit inversible, il faut et il suffit que det(A) 6= 0.
Dmonstration
Si A est inversible, alors A In , donc on peut passer de In A par une suite finie
C

doprations lmentaires sur les colonnes ; daprs ce qui prcde, il existe K tel que
det(A) = det(In ) = . En particulier, det(A) 6= 0.
97

On raisonne par contraposition : si A nest pas inversible, lune de ses colonnes, disons Ci ,
est combinaison linaire des autres : on peut crire
X
Ci =
j Cj
j6=i

o les j sont des scalaires. Alors, par linarit du dterminant par rapport la i-ime colonne
de sa variable,
X
det(A) =
det(C1
Cj
Cn ) = 0
|{z}
j6=i

position i

car dans chacun des termes de cette somme, deux des colonnes sont gales.

Proprit
Soient A et B deux lments de Mn (K). Alors det(AB) = det(A) det(B).
Dmonstration Si AB est inversible, B lest galement : en effet, si X Mn,1 (K) vrifie
BX = 0, alors ABX = 0 et, AB tant inversible, X = 0, ce qui prouve que B est inversible. Par contraposition, si B nest pas inversible, AB ne lest pas non plus. Dans ce cas, la
formule est vraie car det(B) = det(AB) = 0.
Si B est inversible, elle est quivalente par colonnes In et en particulier, B est un produit
de matrices lmentaires. Notons m le nombre de matrices de transpositions, et p le nombre de
matrices de dilatations, figurant dans ce produit. Notons enfin 1 , . . . ,p les coefficients de ces
matrices de dilatations (on peut toujours supposer que p > 1, quitte ajouter la dilatation In
dans le produit). Daprs la proprit sur leffet des oprations lmentaires sur le dterminant,
m

det(AB) = det(A) (1)

p
Y

i .

i=1

Mais on a galement B = In B, et donc


det(B) = det(In ) (1)m

p
Y
i=1

i = (1)m

p
Y

i .

i=1

On en dduit que det(AB) = det(A) det(B).

Attention ! Il ny a pas de proprit analogue pour la somme si n > 2 : det(In + In ) =


tandis que det(In ) + det(In ) = 2.

2n

>4

Proprit
Si A est inversible, det(A1 ) =

1
.
det(A)

Dmonstration En effet, det(A) det(A1 ) = det(AA1 ) = det(In ) = 1.

Proprit
Deux matrices semblables ont le mme dterminant.
Dmonstration Si A et B sont semblables, il existe P Gn (K) tel que B = P 1 AP. Alors
daprs ce qui prcde,
det(B) = det(P 1 AP ) = det(P 1 ) det(AP ) = det(AP ) det(P 1 ) = det(AP P 1 ) = det(A). 

98

Proprit
Si A est une matrice carre, on a det(A) = det(tA).
Dmonstration Si A nest pas inversible, tA ne lest pas non plus car rg(tA) = rg(A). Dans ce
cas, la formule est vraie car det(A) = det(tA) = 0.
Si A est inversible, on raisonne comme dans la dmonstration de la formule du produit : A
est un produit de matrices lmentaires. On peut alors crire tA comme un produit de matrices
lmentaires, avec les mmes matrices de dilatations et de transpositions que A (car de telles
matrices sont symtriques). Les dterminant de A et tA tant entirement calculable partir du
nombre de matrices de transpositions, et des coefficients des matrices de dilatations apparaissant
dans ces produits, on en dduit le rsultat.

Corollaire
Toutes les proprits du dterminant par rapport aux colonnes sont galement vraies
par rapport aux lignes.

2.

Dterminant dune famille de vecteurs


Soient E un K-espace vectoriel de dimension finie n et B une base de E.
Dfinition Dterminant dune famille de vecteurs dans une base
Soit F = (u1 , . . . ,un ) une famille de n vecteurs de E. On appelle dterminant de F
dans la base B, le dterminant de la matrice de F dans la base B.
Il est not detB (u1 , . . . ,un ).
Thorme Caractrisation des bases
Une famille (u1 , . . . ,un ) de vecteurs de E est une base de E si et seulement si
detB (u1 , . . . ,un ) 6= 0.

Dmonstration La famille (u1 , . . . ,un ) est une base de E si et seulement si sa matrice dans la
base B est inversible, i.e., si et seulement si detB (u1 , . . . ,un ) 6= 0.


3.

Dterminant dun endomorphisme


Soit E un K-espace vectoriel de dimension finie n.
Proprit
Soit u L (E). Toutes les matrices reprsentant lendomorphisme u ont le mme
dterminant : si B et B sont deux bases de E, si A = MatB (u) et B = MatB (u), alors
det(A) = det(B).

Dmonstration Si A = MatB (u) et B = MatB (u), alors A et B sont semblables daprs les
formules de changement de bases. Le rsultat provient alors dune proprit donne ci-dessus. 
Dfinition Dterminant dune application linaire
On dfinit le dterminant de u L (E) comme le dterminant dune quelconque de
ses matrices.

99

Remarque Si A Mn (K), lapplication linaire uA canoniquement associe A a pour matrice


A dans la base canonique de Mn,1 (K), donc det(uA ) = det(A).
Proprit
Soient u et v deux endomorphismes de E.
Pour tout K, det(u) = n det(u).
det(u v) = det(u) det(v).
u est un isomorphisme si et seulement si det(u) 6= 0. Dans ce cas
det(u1 ) =

1
.
det(u)

Dmonstration Cest une consquence immdiate de la dfinition et des proprits analogues


sur les matrices.


4.

Matrices triangulaires
Proprit Dterminant dune matrice triangulaire
Soit (ai,j )16i6j6n une famille de scalaires. Alors

a1,1


..
0
.

.
.
..
..

0

..

.
0


a1,n
.. Y
n
.
ai,i
.. =
. i=1
an,n

(de mme pour une matrice triangulaire infrieure).

Dmonstration Notons A la matrice dont on cherche calculer le dterminant. Si a1,1


Q = 0, le
rsultat est vrai car A a une colonne nulle, elle nest donc pas inversible, et det(A) = 0 = ni=1 ai,i .
Sinon, on effectue successivement les oprations
a1,2
a1,n
C2 C2
C1 , . . . , Cn Cn
C1
a1,1
a1,1
ce qui ne modifie pas la valeur de det(A). On a donc

a1,1 0

0 a2,2

.
..
.
det(A) = ..
0
.
..
..
..
.
.

0
0
On reproduit le raisonnement jusqu aboutir

a1,1 0


..
0
.

det(A) = .
.
..
..

0

..
.
..
.
0


0
a2,n
..
.
..
.
a

..

.
0

n,n






.

0
an,n
0
..
.

Par linarit du dterminant par rapport chaque colonne, on a donc


!
n
n
Y
Y
ai,i .
ai,i det(In ) =
det(A) =
i=1

i=1

100

5.

Calculs de dterminants par blocs


Lemme
On suppose n > 2. Soit B Mn1 (K), L M1,n1 (K) et C Mn1,1 (K). Alors les
matrices dfinies par blocs




1 L
B C

A=
et A =
0 B
0 1
ont pour dterminant det(B).

Dmonstration On fait la dmonstration dans le cas de A, lautre cas est similaire. Si B nest
pas inversible, ses lignes forment une famille lie, donc celles de A galement, et A nest pas
inversible. La formule est donc vraie dans ce cas. Sinon, lorsque lon effectue lalgorithme de
Gauss-Jordan sur les colonnes de A, il est vident que lon aboutit la matrice


1 0
0 R

o R est la matrice chelonne rduite par colonnes associe B. De plus, les oprations effectues
sur A pour aboutir ce rsultat sont du type Ci Ci C1 pour i > 2 (remplacement de L par
une ligne de 0), elles ne changent pas le dterminant, puis ce sont les mmes que celles effectues
sur B. Le dterminant tant entirement calculable partir du nombre dchanges de colonnes,
et des coefficients des dilatations effectues, on en dduit que det(A) = det(B). On procde de
mme pour A .


Proprit
Soit A une matrice carre de la forme A =
Alors det(A) = det(B) det(D).


B C
, avec B et D des matrices carres.
0 D

Dmonstration Soit r lordre de la matrice B. On remarque que




B C
0 D

Ir C
0 D




B
0
.
0 Inr

De plus, en utilisant plusieurs fois le lemme prcdent, on a

det



Ir C
= det(D)
0 D

et


B
0
det
0 Inr

= det(B).

Le rsultat suit car le dterminant dun produit de matrices est le produit des dterminants. 
101

Proprit Matrice triangulaire par blocs ou diagonale par blocs


Soit

A1 A1,2

..
..
0
.
.
A=
.
..
..
..
.
.
0
0

A1,m

..

Am1,m
Am

A1

0
ou A =
.
..

0
..
.
..

..
.
..
.
0

une matrice triangulaire par blocs ou diagonale par blocs. Alors


det(A) = det(A1 ) det(Am ) =

m
Y

0
..
.

0
Am

det(Ai ).

i=1

Soient E un K-espace vectoriel de dimension finie, u L (E) et E1 , . . . ,Em des


sous-espaces vectoriels de E stables par u tels que E = E1 Em . Alors
det(u) = det(u|E1 ) det(u|Em ) =

m
Y
i=1

det(u|Ei ).

Dmonstration
Elle se fait par une rcurrence immdiate partir de la proprit prcdente.

Soit B = B1 Bm une base de E adapte


sait que MatB (u) est de la forme

A1 0

0 ...
A=
.
..
..
.
0

cette dcomposition en somme directe. On

..
.
..
.
0

0
..
.

0
Am

o, pour tout i [[1,m]], Ai est dordre dim(Ei ), et Ai = MatBi (u|Ei ). Le rsultat vient alors du

point prcdent, et du fait que det(u) = det(A) et det(u|Ei ) = det(Ai ) pour tout i.

6.

Dveloppement dun dterminant par rapport aux lignes et colonnes


Thorme Dveloppement par rapport une ligne ou une colonne
Soit A Mn (K). Pour tout (i,j) [[1,n]]2 , soit Ai,j Mn1 (K) la matrice obtenue en
supprimant la i-me ligne et la j-me colonne de A. Alors :
Dveloppement par rapport la j-ime colonne :
det(A) =

n
X

ai,j (1)i+j det(Ai,j ).

i=1

Dveloppement par rapport la i-ime ligne :


det(A) =

n
X

ai,j (1)i+j det(Ai,j ).

j=1

Dmonstration (non exigible)


On fait la dmonstration de la formule de dveloppement par rapport aux colonnes, celle
sur les lignes est analogue. Pour i [[1,n]], on note Ei le i-me vecteur de la base canonique
102

de Mn,1
P(K). Notons A = (ai,j )16i,j6n = (C1 Cn ). On a donc, pour tout j [[1,n]],
Cj = ni=1 ai,j Ei . Alors, par linarit du dterminant par rapport la j-ime colonne de sa
variable,
!
n
X
ai,j Ei | Cj+1 | | Cn
det(A) = det C1 | | Cj1 |
i=1

n
X
i=1

ai,j det(C1 Cj1 Ei Cj+1 Cn ).

Notons Mi,j = (C1 Cj1 Ei Cj+1 Cn ). En changeant la ligne i 1 et la ligne i, puis la


ligne i 2 et la ligne i 1, jusqu changer la ligne 1 et la ligne 2, on se ramne une matrice
obtenue en plaant la i-me ligne de Mi,j la place de la premire ligne. Au cours de chacune
de ces i 1 oprations, le dterminant de A est multipli par 1. On procde de mme avec les
colonnes, ce qui amne multiplier le dterminant par 1, pour chacune des j 1 oprations.
On obtient ainsi une matrice


1
B=
0 Ai,j
avec det(Mi,j ) = (1)i+j2 det(B) = (1)i+j det(B). Or, le lemme ci-dessus montre que lon a
det(B) = det(Ai,j ). On en dduit que
det(C1 Cj1 Ei Cj+1 Cn ) = (1)i+j det(Ai,j )
et le rsultat.

Remarques
Ces formules sont trs utiles, par exemple :

Lorsquune ligne ou colonne de A a un nombre important de coefficients nuls.


Pour calculer des dterminants par rcurrence, lorsque la structure du dterminant sy
prte (par exemple, les dterminants tridiagonaux).

En dimension 3,

a1,1

a2,1

a3,1

on retrouve des formules dj connues, par exemple



a1,2 a1,3
a2,2 a2,3
a3,2 a3,3

= a1,1 (a2,2 a3,3 a3,2 a2,3 ) a2,1 (a1,2 a3,3 a3,2 a1,3 ) + a3,1 (a1,2 a2,3 a2,2 a1,3 ).

En dveloppant le membre de gauche, on retrouve bien sr la formule du dterminant et la rgle


de Sarrus.

7.

Dterminant de Vandermonde
Dfinition
Soit (a1 , . . . ,an ) Kn . On pose

1 a1 a21
1 a2 a22

Mn (a1 , . . . ,an ) = 1 a3 a3
. .
..
.. ..
.
1 an a2n

...
...
...
..
.
...

a1n1
a2n1

j1
a3n1
= (ai )16i,j6n Mn (K)
..
.
ann1

et Vn (a1 , . . . ,an ) = det(Mn (a1 , . . . ,an )).


Ce dterminant (ou celui de sa transpose) est appel dterminant de Vandermonde
associ aux scalaires a1 , . . . , an .

103

Il est non nul si et seulement si les ai sont deux deux distincts, ce que lon peut prouver
sans calculer le dterminant : si deux des ai sont gaux, alors Mn (a1 , . . . ,an ) a deux lignes gales,
donc son dterminant est nul. Si les ai sont deux deux distincts, et si t 0 n1 Kn
appartient au noyau de Mn (a1 , . . . ,an ), alors pour tout i [[1,n]],
n1
X

j aji = 0.

j=0

Pn1

Le polynme P (X) = j=0 j X j , de degr au plus n1, a donc n racines deux deux distinctes,
ce qui montre quil est nul, et donc que tous les j sont nuls. Donc la matrice carre Mn (a1 , . . . ,an )
est inversible et son dterminant est non nul.
Ce dterminant et la matrice associe ont dimportantes applications. Par exemple, soient
(a0 , . . . ,an ) et (b0 , . . . ,bn ) dans Kn+1 . On cherche une fonction polyomiale P telle que
P (a0 ) = b0 , . . . , P (an ) = bn ;
autrement dit, connaissant les valeurs prises par une fonction polynomiale en certains points, on
recherche les coefficients du polynme associ.
Cherchons P sous la forme x0 + x1 X + + xn X n . Les conditions ci-dessus scrivent

x0
b0
1 a0 a20 . . . an0
1 a a2 . . . an .. ..
1

1 .
1
.
. .
..
..
..
. = .
. .
. .
.
.
. .. ..
2
1 an an . . . ann
xn
bn

cest--dire comme un systme linaire dont la matrice est la matrice de Vandermonde


Mn+1 (a0 , . . . ,an ). Si les ai sont deux deux distincts, cette matrice est inversible, et il existe
un unique polynme de Kn [X] qui est solution du problme. Ces problmatiques interviennent
notamment en thorie du signal.
On peut en fait calculer explicitement Vn (a1 , . . . ,an ) :
Proprit Dterminant de Van der Monde
Avec les notations prcdentes,
Vn (a1 , . . . ,an ) =

Y
i<j

(aj ai ).

Dmonstration
Premire mthode : si n > 2, alors, pour tout j de n 2, on fait lopration lmentaire
Cj Cj a1 Cj1 , ce qui ne change pas la valeur du dterminant. On obtient


1

0
0
...
0


1 a2 a1 a22 a1 a2 . . . a2n1 a1 a2n2


n1
n2
2

Vn (a1 , . . . ,an ) = 1 a3 a1 a3 a1 a3 . . . a3 a1 a3
.

..
..
..
..
..

.
.
.
.


1 a a a2 a a . . . an1 a an2
n
1
1 n
1 n
n
n

cest--dire


1
0
0

1 a2 a1 (a2 a1 )a2


Vn (a1 , . . . ,an ) = 1 a3 a1 (a3 a1 )a3
.
..
..
..
.
.

1 a a (a a )a
n
1
n
1 n
104

...
...
...
..
.

...



0
n2
(a2 a1 )a2
(a3 a1 )a3n2

..

.


n2
(a a )a
n

En dveloppant par rapport la premire ligne, on a donc



a2 a1 (a2 a1 )a2 . . .

a3 a1 (a3 a1 )a3 . . .

Vn (a1 , . . . ,an ) = .
..
..
..
.
.

a a (a a )a . . .
n

(dterminant dordre n 1). Chaque ligne Li tant multiple de



1

1

Vn (a1 , . . . ,an ) = (a2 a1 )(a3 a1 ) (an a1 ) .
..

1


(a2 a1 )a2n2
(a3 a1 )a3n2

..

.

n2

(a a )a
n

ai+1 a1 , on obtient

a2 a22 . . . a2n2
a3 a22 . . . a3n2
..
.. . .
..
.
.
.
.
a a2 . . . an2
n

= (a2 a1 )(a3 a1 ) (an a1 ) Vn1 (a2 , . . . ,an ).

Une rcurrence immdiate, avec le fait que V1 (an ) = 1, montre alors le rsultat.
Deuxime mthode : si n > 2, soit P (X) =

i=1

des scalaires.
Lopration Cn Cn +

n1
Y

n2
X

(X ai ) = X n1 +

n2
X

k X k o les k sont

k=0

k Ck+1 montre que

k=0


1 a1
a21

1 a2
a22

..
..
..
Vn (a1 , . . . ,an ) = .
.
.

1 an1 a2
n1

1 a
a2n
n

...
...
..
.
...
...


1 a1
a21

1 a2
a22

..
..
..
= .
.
.

P (an1 ) 1 an1 a2n1
a2n
P (an ) 1 an
P (a1 )
P (a2 )
..
.

...
...
..
.
...
...

et donc, en dveloppant par rapport la dernire colonne,


Vn (a1 , . . . ,an ) = P (an ) Vn1 (a1 , . . . ,an1 ) =

n1
Y
i=1

(an ai ) Vn1 (a1 , . . . ,an1 ),

ce qui permet de conclure par rcurrence comme ci-dessus (on a V1 (a1 ) = 1).

105







,

0
P (an )
0
0
..
.

106

Chapitre 5

Espaces vectoriels norms


Convergence et continuit
Dans ce chapitre, E dsigne un K-espace vectoriel avec K = R ou C, et | | dsigne la valeur
absolue (si K = R) ou le module (si K = C).
Le mot topologie signifie en grec, discours sur le lieu . Il sagit de donner des dfinitions
rigoureuses des notions de proximit, de distance, et en corollaire, de limite et de continuit, dans
des espaces abstraits. Nous nous placerons dans le cadre dj trs riche des espaces vectoriels :
intuitivement, mesurer la distance entre deux lments x et y de E peut se faire en mesurant la
diffrence x y (la notion de diffrence ayant un sens dans un espace vectoriel). Il reste dfinir
ce que lon entend par cette ide de mesurer des vecteurs.

I.

Espaces vectoriels norms

1.

Normes
Dfinition Norme
On appelle norme sur E toute application N : E R+ telle que :

Pour tout K, pour tout x E, N (x) = ||N (x) (homognit),


Pour tout x E, N (x) = 0 si et seulement si x = 0 (sparation),
Pour tout x E, pour tout y E, N (x + y) 6 N (x) + N (y) (ingalit triangulaire).
Le couple (E,N ) est alors appel espace vectoriel norm. Sil ny a pas dambigut
sur la norme, on dira simplement que E est un espace vectoriel norm.
Remarque Cette dfinition est donne par analogie avec la valeur absolue ou le module. Une
norme est dailleurs trs souvent note, non pas comme une application N , mais suivant cette
analogie, avec des doubles barres : la norme de x est note kxk.
Exemples
Sur K
Sur K, x 7 |x| est une norme. En fait cest presque la seule : soit N une norme sur K, alors pour
tout K, N () = N ( 1) = ||N (1). Toute norme sur K est proportionnelle | |.
Norme associe un produit scalaire (voir le chapitre Espaces prhilbertiens, espaces
euclidiens).
Soit E un R-espace vectoriel muni dun produit scalaire ( | ) . Alors lapplication
kk:

E R
p+
(x | x)
x 7
107

est une norme sur E, appele norme euclidienne. Lingalit triangulaire est une consquence de
lingalit de Cauchy-Schwarz
| (x | y) | 6 kxk kyk.
En effet, pour tout (x,y) E 2 ,
kx + yk2 = (x + y | x + y) = kxk2 + 2 (x | y) + kyk2

6 kxk2 + 2kxkkyk + kyk2

= (kxk + kyk)2 .
Sur Kn
Pour tout x = (x1 , . . . ,xn ) Kn , on dfinit
N1 (x) = kxk1 =

n
X
i=1

|xi |,

v
u n
uX
N2 (x) = kxk2 = t
|xi |2
i=1

N (x) = kxk = sup |xi | = max |xi |.


i[[1,n]]

i[[1,n]]

Elles sont appeles respectivement norme 1 , norme 2 , et norme infini .


Toutes les proprits sont videntes sauf lingalit triangulaire : si x = (x1 , . . . ,xn ) Kn et
y = (y1 , . . . ,yn ) Kn , alors
kx + yk1 =

n
X
i=1

|xi + yi | 6

n
X
i=1

(|xi | + |yi |) 6

n
X
i=1

|xi | +

n
X
i=1

|yi | = kxk1 + kyk1 .

Cela prouve lingalit triangulaire pour la norme 1. La norme 2 sur Rn est la norme euclidienne
associe au produit scalaire dfini par
(x | y) =

n
X

xi yi .

i=1

Pour la norme 2 sur Cn , on remarque que


kx + yk2 =

n
X
i=1

|xi + yi |2

!1/2

n
X
(|xi | + |yi |)2
i=1

!1/2

= kX + Y k2

o X et Y dsignent les vecteurs (|x1 |, . . . ,|xn |) et (|y1 |, . . . ,|yn |). Ces vecteurs tant coefficients
rels, on a
kX + Y k2 6 kXk2 + kY k2 = kxk2 + kyk2 .
On a donc aussi lingalit triangulaire dans ce cas.
Quant la norme infini, pour tout i [[1,n]], on a
|xi + yi | 6 |xi | + |yi | 6 max |xj | + max |yj | = kxk + kyk .
j[[1,n]]

j[[1,n]]

Le majorant tant indpendant de i, en passant au maximum gauche, on en dduit


kx + yk = max |xi + yi | 6 kxk + kyk .
i[[1,n]]

108

Sur B(I,K)

Soit I un intervalle (non vide) de R. Lensemble B(I,K) des fonctions bornes de I dans K,
muni de laddition des fonctions et du produit dune fonction par un scalaire, est un K-espace
vectoriel. Pour f B(I,K), on dfinit
N (f ) = kf k = sup |f (x)|.
xI

Lapplication N est appele norme infini ou norme de la convergence uniforme (cette dernire
appellation sera explique dans le chapitre Suites et sries de fonctions). Elle est bien dfinie,
car si f B(I,K), lensemble {|f (x)|; x I} est une partie non vide majore de R, elle a donc
une borne suprieure.
Prouvons simplement lingalit triangulaire, les autres proprits tant videntes. Soient f
et g deux lments de B(I,K). Par dfinition, pour tout x I,
|f (x) + g(x)| 6 |f (x)| + |g(x)| 6 sup |f (y)| + sup |g(y)|.
yI

yI

Le majorant tant indpendant de x, en passant la borne suprieure gauche, on en dduit


sup |f (x) + g(x)| 6 sup |f (y)| + sup |g(y)|,
xI

yI

yI

cest--dire
kf + gk 6 kf k + kgk .
Remarque Si [a,b] est un segment de R, on a C 0 ([a,b],K) B([a,b],K) car la fonction |f | est
continue sur un segment, valeurs relles, donc elle est borne et atteint ses bornes. Ceci montre
aussi que pour f C 0 ([a,b],K),
kf k = max |f (x)|.
x[a,b]

Proprit
Soit (E,k k) un espace vectoriel norm. Alors, pour tout (x,y) E 2 ,


kxk kyk 6 kx yk.
Dmonstration On remarque que x = (x y) + y et donc, daprs lingalit triangulaire,
kxk 6 kx yk + kyk,
ce qui implique que
kxk kyk 6 kx yk.
De mme, en crivant y = (y x) + x, on montre que
kyk kxk 6 kx yk.
De ces deux ingalits, on dduit le rsultat.

Remarque Cette deuxime forme de lingalit triangulaire est trs utile pour obtenir des informations sur la norme dun vecteur, partir dinformations sur sa distance dautres vecteurs.
109

2.

Distance associe, boules et sphres


Proprit/Dfinition : Distance associe une norme
Soit (E,k k) un espace vectoriel norm. Lapplication

E E R+
d:
(x,y) 7 kx yk
est appele distance associe la norme k k. Elle possde les proprits suivantes :
Pour tout (x,y) E 2 , d(x,y) = d(y,x) (symtrie),
Pour tout (x,y) E 2 , d(x,y) = 0 si et seulement si x = y (sparation),
Pour tout (x,y,z) E 3 , d(x,y) 6 d(x,z) + d(z,y) (ingalit triangulaire).

Dfinition Boules ouvertes, boules fermes, sphres


Soit (E,k k) un espace vectoriel norm. Soient a E et r R+ .
On appelle boule ouverte de centre a et de rayon r lensemble, not B(a,r), dfini
par :
B(a,r) = {x E; d(a,x) < r} = {x E; kx ak < r}.
On appelle boule ferme de centre a et de rayon r lensemble, not Bf (a,r), dfini
par :
Bf (a,r) = {x E; d(a,x) r} = {x E; kx ak 6 r}.
On appelle sphre de centre a et de rayon r lensemble, not S(a,r), dfini par :
S(a,r) = {x E; d(a,x) = r} = {x E; kx ak = r}.
On remarquera que S(a,r) = Bf (a,r) \ B(a,r).
Exemples
B(a,0) = , Bf (a,0) = S(a,0) = {a}.
B(a,1) = {x E; kx ak < 1}, Bf (a,1) = {x E ; kx ak 6 1}.
B(0,1) et Bf (0,1) sont appeles respectivement boules unit ouverte et ferme de E.
Exercice Dessiner les boules units de R2 muni des normes 1, 2 et infini.

3.

Suites dlments dun espace vectoriel

Lun des objectifs majeurs de ce chapitre est ltude des suites dlments de E ; commenons
par dfinir cette notion, par gnralisation vidente de la notion de suite relle ou complexe :
Dfinition
On appelle suite dlments de E toute application u : N E.
Pour tout n N, on note alors un = u(n) le terme de rang n de cette suite. La suite
est note (un )nN ou (un ).
On considre galement des suites dfinies partir dun certain rang n0 , cest--dire
dfinies sur lensemble des entiers suprieurs ou gaux n0 . On note (un )n>n0 une telle
suite.
Remarque Lensemble des suites dlments de E est alors muni dune structure de K-espace
vectoriel en dfinissant, pour deux suites (un ) et (vn ) et pour K,
(un ) + (vn ) = (un + vn ), (un ) = (un ).
110

Exemple Soit A Mp (K). Alors (An )nN est une suite dlments de Mp (K) : cest la suite des
puissances de A.
On dfinit alors les suites extraites dune suite dlments de E de la mme faon que cela a
t fait pour les suites relles ou complexes.

4.

Parties, suites et fonctions bornes


Dfinition
Soit (E,k k) un espace vectoriel norm.
Soit A une partie de E. On dit que A est borne sil existe M > 0 tel que
A Bf (0,M ), cest--dire, sil existe M > 0 tel que pour tout x A, kxk 6 M.
Soit (un ) une suite dlments de E. On dit que (un ) est borne sil existe M > 0
tel que pour tout n N, kun k 6 M.
Soit (F,N ) un espace vectoriel norm, A une partie de E et f : A F une fonction.
On dit que f est borne si f (A) est une partie borne de F , cest--dire, sil existe
M > 0 tel que pour tout x A, N (f (x)) 6 M.

Exemples
Une boule ferme Bf (a,r) de E est une partie borne. En effet, pour tout x Bf (a,r),
kxk = k(x a) + ak 6 kx ak + kak 6 r + kak.
La dfinition est donc vrifie avec M = r + kak. On raisonne de mme avec les boules ouvertes,
ou les sphres.

On munit C 0 ([0,1],R) de la norme infini. Soit, pour tout n N, fn : x 7 n xn . La suite


(fn )nN nest pas borne car pour tout n N,

kfn k = n, donc kfn k +;


la dfinition ne peut tre vrifie pour aucune valeur de M .
On munit R3 et R2 de la norme infini. La fonction

[0,1]3 R2
f:
(x,y,z) 7 (x y + 2z, x2 + y 2 + z 2 )
est borne car pour tout (x,y,z) [0,1]3 ,
kf (x,y,z)k = max{|x y + 2z|,|x2 + y 2 + z 2 |} 6 max{|x| + |y| + 2|z|,x2 + y 2 + z 2 } 6 4.

5.

Parties convexes
Dfinition Partie convexe
Soit A une partie de E. On dit que A est convexe si
(a,b) A2 , [0,1],

a + (1 )b A.

Autrement dit, A est convexe si A contient tout segment dont il contient les deux
extrmits.

Proprit
Une boule (ouverte ou ferme) est convexe.

111

Dmonstration Soit Bf (c,r) une boule ferme (on raisonne de mme avec une boule ouverte).
Soient a et b deux lments de Bf (c,r) et [0,1] ; alors
ka + (1 )b ck = k(a + (1 )b) (c + (1 )c)k = k(a c) + (1 )(b c)k.
Daprs lingalit triangulaire et la proprit dhomognit, sachant que > 0 et 1 > 0, on
a
ka + (1 )b ck 6 ka ck + (1 )kb ck 6 r + (1 )r = r.
Donc a + (1 )b Bf (c,r).

Remarque En revanche, une sphre de E de rayon non nul, R2 \ {(x,0); x 6 0} ou une couronne
de R2 ne sont pas convexes.

6.

Effet dun changement de norme

Certaines des notions que nous avons dfinies jusqu prsent dpendent de la norme consid
re. Pour illustrer ceci, posons, pour tout n N, fn : x 7 n xn et considrons la suite (fn )nN
dlments de E = C 0 ([0,1],R). On sait que lon peut munir E de la norme infini, on peut aussi
le munir de la norme k k2 associe au produit scalaire usuel sur E. La suite (fn ) est borne dans
(E,k k2 ), car pour tout n N,
kfn k2 =

Z

1
0

( n xn )2 dx

1/2

n
2n + 1

1/2

6 1.

Elle nest pourtant pas borne dans (E,k k ) comme on la montr dans un exemple prcdent.

Nous admettrons que lorsque E est de dimension finie, toutes les notions que nous allons
dfinir dans la suite sont indpendantes du choix de norme. Cest aussi le cas des notions prcdentes de partie, suite ou fonction borne, de partie convexe (la dfinition de cette dernire
notion ne fait en fait pas intervenir de norme) mais ce nest pas le cas des notions de distance
associe une norme, de boules et de sphre.
partir de maintenant, E dsigne un K-espace vectoriel de dimension finie.

Soit kk une norme sur Kn et B = (e1 , . . . ,en ) une base de E. Pour tout x de E de coordonnes
(x1 , . . . ,xn ) dans la base B, on peut dfinir kxkE = k(x1 , . . . ,xn )k. Alors k kE est une norme sur
E (vrification immdiate).
Un choix trs utile est souvent celui donn par
x E, kxk = max |xi |,
i[[1,n]]

correspondant la norme infini sur Kn . On fera parfois rfrence cette norme sur E comme
norme infini associe la base B.
Un espace vectoriel E de dimension finie peut donc toujours tre muni dune norme, et par
le moyen prcdent, ltude topologique de E se ramne celle de Kn muni dune norme
quelconque.

112

II.

Suites dun espace vectoriel norm de dimension finie


Dfinition Convergence dune suite
Soit (E,k k) un espace vectoriel norm et (un ) une suite dlments de E.
Soit E. On dit que (un ) converge vers (ou que un tend vers ) si
> 0, n0 N; n > n0 , kun k 6 .
On note ceci un .
On dit que (un ) est convergente sil existe E tel que (un ) converge vers . Le
vecteur est alors unique ; il est appel limite de la suite (un ), not lim un .
Dans le cas contraire, on dit que (un ) est divergente.

Remarque En dautres termes, (un ) converge vers si pour toute boule ferme B centre en
de rayon strictement positif, tous les termes de la suite sauf un nombre fini appartiennent B.
Dmonstration de lunicit de Supposons lexistence de deux vecteurs et vrifiant la dfinition. Soient > 0 et deux entiers n0 et n1 vrifiant la condition ci-dessus pour et
respectivement. Alors pour tout n > max(n0 ,n1 ),
k k 6 k un + un k 6 kun k + kun k 6 2.
Ceci tant valable pour tout , on a k k = 0, donc = .

Remarques
Une suite (un ) dlments dun espace vectoriel norm (E,k k) converge vers si et seulement
si la suite relle (kun k) converge vers 0. Cette caractrisation est trs utile pour prouver une
convergence (lorsque lon a lintuition de la limite), par des majorations de kun k.
Comme nous lavons indiqu ci-dessus, la convergence ou divergence dune suite, et en cas de
convergence, la valeur de sa limite, ne dpendent pas de la norme choisie, du fait de la dimension
finie.
Exemples
Illustrons la remarque prcdente dans Kn muni des normes 1 et infini. On remarque que pour
tout x Kn , kxk 6 kxk1 et kxk1 6 n kxk . Si (uk ) converge vers dans (Kn ,k k1 ), alors pour
tout k N,
kuk k 6 kuk k1 avec kuk k1 0,

et donc (uk ) converge vers dans (Kn ,k k ). De mme, si (uk ) converge vers dans (Kn ,k k ),
alors pour tout k N,
kuk k1 6 n kuk k

avec

kuk k 0,

et donc (uk ) converge vers dans (Kn ,k k1 ).


 1/n



1 0
e
2/n
La suite
dlments de M2 (R) converge vers
.
0 0
3/n 4/n n>1

En effet, en notant k k la norme sur M2 (R) associe la norme k k sur R4 (maximum


des valeurs absolues des coefficients de la matrice), on a
 1/n
 1/n

 

e
e
1 0
2/n
1 2/n



0
3/n 4/n 0 0 =

3/n
4/n

car chacun des termes apparaissant dans le maximum tend vers 0.

Mme si la convergence dune suite ne dpend pas de la norme, il semble quand mme quil
faille considrer une norme pour vrifier la dfinition. En fait, ce nest pas le cas, car ltude de
la convergence dune suite se ramne celle de ses coordonnes dans une base :
113

Thorme Convergence composante par composante


Soit (uk )kN une suite dlments de E muni dune base B = (e1 , . . . ,en ). Notons, pour
tout k,
n
X
uk,i ei
uk =
i=1

la dcomposition de uk dans la base B.


Alors, pour que la suite (uk )kN soit convergente, il faut et il suffit que pour tout
i [[1,n]], (uk,i )kN soit convergente. Dans ce cas, on a
lim uk =

k+

n 
X
i=1

lim uk,i

k+

ei ,

cest--dire que les coordonnes de la limite sont les limites des suites-coordonnes.
Dmonstration Notons k k la norme infini sur E associe la base B.
n
X
Fixons un entier i [[1,n]]. Supposons que (uk ) converge vers =
i ei . Alors pour tout

k N,

i=1

|uk,i i | 6 kuk k

avec kuk k 0.

On en dduit que (uk,i )kN converge vers i .


Soit > 0 fix. Si uk,i i pour tout i [[1,n]], alors il existe des entiers k1 , . . . ,kn tels
k+

que pour tout i [[1,n]] et pour tout k > ki ,

|uk,i i | 6 .
Alors pour tout k > max(k1 , . . . ,kn ),
kuk k = max |uk,i i | 6 .
i[[1,n]]

Ainsi (uk ) converge vers =

n
X

i ei .

i=1

Remarques
Une dmonstration semblable montre quune suite dlments de E est borne si et seulement
si chacune de ses suites-coordonnes dans la base B est borne.
De mme, si C est une base dun espace vectoriel de dimension finie F , alors une fonction
f : A E F est borne si et seulement si chacune de ses fonctions-coordonnes dans la base
C est borne.
On parle de convergence (ou de suite ou fonction borne) composante par composante .
Lintrt principal de ces rsultats est de pouvoir se ramener des suites ou des fonctions
valeurs dans K (les coordonnes). Par exemple, une suite de matrices converge si et seulement
si chacune de ses suites-coefficients converge. De mme pour une suite de polynmes de Kn [X].
En revanche, cela na pas de sens pour nous dans K[X], qui nest pas de dimension finie.
En application de ceci, on obtient le rsultat suivant : soient E et F deux espaces vectoriels de
dimension finie. Alors une suite (xk ,yk ) dlments de E F converge vers (x,y) si et seulement
si (xk ) converge vers x et (yk ) converge vers y.
En effet, si (e1 , . . . ,ep ) est une base de E, et (f1 , . . . ,fn ) une base de F , alors
((e1 ,0) . . . (ep ,0),(0,f1 ) . . . (0,fn ))
est une base de E F. Il suffit alors dappliquer le rsultat prcdent.
114

Proprit
Toute suite convergente dlments dun espace vectoriel norm est borne.
La rciproque est fausse.
Dmonstration On utilise les notations prcdentes. Appliquons la dfinition de la limite avec
= 1 : il existe n0 N tel que pour tout n > n0 , kun k 6 1. Daprs la seconde forme de
lingalit triangulaire, on en dduit kun k kk 6 1, et donc, kun k 6 kk + 1 pour tout n > n0 .
Alors, pour tout n N,
kun k 6 max(ku0 k, . . . ,kun0 1 k,kk + 1).
Lexemple de ((1)n )nN montre que la rciproque est fausse.

Proprit Oprations sur les limites


Soient (un ) et (vn ) deux suites convergentes dlments de E, et (n ) une suite convergente dlments de K. Soit n0 N. Alors :
La suite (un + vn ) est convergente et lim(un + vn ) = lim un + lim vn .
La suite (n un ) est convergente et lim(n un ) = lim n lim un .
 
un
Si n 6= 0 pour tout n > n0 et si lim n 6= 0, alors la suite
est convergente
n n>n0
et
 
lim un
un
.
=
lim
n
lim n
Dmonstration Il suffit de raisonner composante par composante, et dappliquer les rsultats
correspondants pour les suites valeurs scalaires.

De la mme faon, on obtient le rsultat suivant :
Proprit
Soit (un ) une suite dlments de E qui converge vers E.
Alors toute suite extraite de (un ) converge vers .

III.

Vocabulaire de topologie

Dfinition Points intrieurs une partie


Soient A une partie de E, et a un point de A. On dit que a est un point intrieur
A si :
r > 0 ; B(a,r) A.
En dautres termes, a est intrieur A si on peut trouver une boule ouverte centre en
a, de rayon strictement positif, et incluse dans A.
Exemple 2 est intrieur [0,3] car 2 ]1.5,2.5[ [0,3]. En revanche, 0 et 3 ne sont pas intrieurs
[0,3].
Remarque Soit A une partie de E. Soit (xn ) une suite dlments de E qui converge vers un
point a intrieur A. Alors, pour n assez grand, xn A.
En effet, soit r > 0 tel que B(a,r) A. En appliquant la dfinition de la limite avec = r/2,
on obtient lexistence de n0 N tel que pour tout n > n0 , kxn ak < r, et donc, xn B(a,r) A.
115

Dfinition Intrieur dune partie


des points
Soit A une partie de E. On appelle intrieur de A lensemble, not A,
intrieurs A.
A.
Remarque On a toujours A
Dfinition Partie ouverte
Une partie A de E est dite ouverte (on dit aussi que A est un ouvert de E) si chacun
de ses points est un point intrieur A :
a A, r > 0 ; B(a,r) A.
Ceci quivaut chacune des proprits suivantes :
= A.
A

Pour chaque point a de A, on peut trouver une boule ouverte centre en a, de


rayon strictement positif, et incluse dans A.

Exemple E et sont des ouverts.


Proprit
Une boule ouverte est un ouvert.
Dmonstration Le cas dune boule ouverte de rayon 0 est trivial. Soient x E et R > 0.
Montrons que B(x,R) est un ouvert de E. On fixe donc a B(x,R), et on dfinit
d = d(a,x) = kx ak.
Alors d < R car a B(x,R), et pour tout y appartenant B(a,R d), on a
kx yk kx ak + ka yk = d + ky ak < d + R d = R,
donc y B(x,R). Ainsi, en posant r = R d > 0, on a : B(a,r) B(x,R). Cette construction
tant possible pour tout a B(x,R) (avec r dpendant de a, ce qui est tout fait possible au
vu de la dfinition prcdente), on a le rsultat.

r =Rd
b

d
x


116

Exemples
Les intervalles ouverts de R sont des ouverts.
Le demi-plan
P = {(x,y) R2 , y > 0}
est un ouvert de R2 . On vrifie la dfinition avec la norme euclidienne usuelle k k2 .
Soit a = (x,y) P. Notons r = y > 0. Pour tout p = (u,v) dans B(a,r), on a
p
|y v| (x u)2 + (y v)2 = kp ak2 < r = y,
donc

y v |y v| < y.
On en dduit que v > 0, donc p P. Ainsi, B(a,r) P.

De mme que lon a dfini les points situs lintrieur de A, on peut dfinir les points
qui touchent A (sans ncessairement appartenir A) : il sagit, intuitivement, des points
situs arbitrairement prs de points de A :
Dfinition Points adhrents une partie
Soient A une partie de E et a E. On dit que a est un point adhrent A si
r > 0, B(a,r) A 6= .
Exemples
Tout point de A est adhrent A.
4 est adhrent [2,4[.
Proprit Caractrisation squentielle des points adhrents
Soient A une partie de E et a E. Le point a est adhrent A si et seulement si il
existe une suite dlments de A qui converge vers a.

Dmonstration
Si a est adhrent A, pour tout entier n > 1, il existe xn B(a,1/n) A. Alors xn a car
pour tout n > 1,
1
kxn ak < .
n
De plus (xn ) est une suite dlments de A.
Soient r > 0 et (xn ) une suite dlments de A qui converge vers a. Comme xn a, pour n
assez grand, xn B(a,r) et mme xn B(a,r) A. Cet ensemble est donc non vide, et ce pour
tout r > 0, donc a est adhrent A.

Exemple La matrice


1 0
0 0

est adhrente lensemble des matrices inversibles, car elle est limite de la suite des matrices


1 0
0 1/n
lorsque n tend vers +.
117

Dfinition Adhrence dune partie


Soit A une partie de E. On appelle adhrence de A lensemble, not A, des points
adhrents A.
Remarque On a toujours A A.
Dfinition Partie ferme
Une partie A de E est dite ferme (on dit aussi que A est un ferm de E) si tous les
points adhrents A appartiennent A (ce qui quivaut au fait que A = A).
Exemples
E et sont des ferms.
], 1] [1, + [ est un ferm de R.
Toute boule ferme est un ferm. Toute sphre est un ferm.

On dduit en particulier de la proprit prcdente une caractrisation des parties ferms :


Proprit Caractrisation squentielle des ferms
Soit A une partie de E. Les proprits suivantes sont quivalentes :
A est une partie ferme.
Pour toute suite convergente (xn ) dlments de A, on a lim xn A.

Exemple Le cercle unit de R2 est lensemble


U = {(x,y) R2 ; x2 + y 2 = 1}.
Soit (xn ,yn ) une suite dlments de U convergeant vers (x,y) R2 . On a, pour tout n N,
x2n + yn2 = 1,
de sorte qu la limite, on obtient x2 + y 2 = 1. Le point (x,y) appartient donc U. On a donc
montr que U est ferm.
Attention ! Les notions douverts et de ferms ne sont pas contraires lune de lautre : E et
lensemble vide sont par exemple la fois ouverts et ferms.
Le lien est en fait le suivant :
Proprit
Une partie A de E est ferme si et seulement si son complmentaire dans E est ouvert.
On rappelle que le complmentaire de A est dfini par A = E \ A = {x E; x
/ A}.
Dmonstration
Si A est ferm, soit a A. On veut montrer quil existe r > 0 tel que B(a,r) A. Si tel
ntait pas le cas, pour tout n N , il existerait xn B(a,1/n) tel que xn A. Le point a serait
donc limite dune suite dlments de A, et A tant ferm, on devrait avoir a A, ce qui nest
pas le cas. On en dduit lexistence de r, et on a donc montr que A est ouvert.
Si A est ouvert, soit a un point de E qui est limite dune suite (xn ) dlments de A. Si
a
/ A, alors a appartient au complmentaire de A qui est ouvert. Il existe donc r > 0 tel que
B(a,r) A. Sachant que xn a, on en dduit que pour n assez grand, xn B(a,r) A, ce
qui est absurde car (xn ) est une suite dlments de A. Donc a A, ce qui montre que A est
ferm.

118

Proprit

Une
Une
Une
Une

runion douverts est un ouvert.


intersection dun nombre fini douverts est un ouvert.
intersection de ferms est un ferm.
runion dun nombre fini de ferms est un ferm.

Dmonstration
S
Soit U = iI Ui une runion douverts, I dsignant un ensemble dindices. Soit a U . Il
existe i I tel que
S a Ui . Comme Ui est un ouvert, il existe r > 0 tel que B(a,r) Ui .
Alors B(a,r) jI Uj = U .
T
Soient p N , et U = pi=1 Ui une intersection finie douverts. Soit a U . Pour tout i [[1,p]],
il existe ri > 0 tel que B(a,ri ) Ui . Posons r = min{ri ; i [[1,p]]}. On a alors r > 0 et
B(a,r) B(a,ri ) pour tout i, donc
B(a,r)

p
\

Ui = U.

i=1

Pour les deux points concernant les ferms, il suffit de passer au complmentaire et dutiliser
les deux premiers points ; en effet, si les Fi sont des ferms,
!
!
p 
p

\
[
[ 
\


Fi .
Fi =
et
Fi =
Fi
iI

i=1

i=1

iI

Dfinition Frontire dune partie


constitu
Soit A une partie de E. On appelle frontire de A lensemble F r(A) = A\ A,
des points de E qui sont adhrents A mais pas intrieurs A.
Bien sr, cette notion coincide avec lintuition que suggre son nom : la frontire correspond
au bord de lensemble. Par exemple, la frontire dune boule Bf (a,r) ou B(a,r) de rayon non
nul est la sphre S(a,r).

IV.

Fonctions entre espaces vectoriels norms :


limite et continuit

Dans toute la suite, E et F dsignent deux espaces vectoriels norms de dimension finie, A
une partie de E et f une fonction dfinie sur A et valeurs dans F . On peut munir E dune
norme k kE et F dune norme k kF .

1.

Dfinitions
Dfinition Limite en un point
Soit a un point adhrent A (a A) et b F .
On dit que f a pour limite b en a (ou que f (x) tend vers b lorsque x tend vers a) si
> 0, > 0; x A, [kx akE 6 ] [kf (x) bkF 6 ].
On note ceci f (x) b.
xa

On dit que f a une limite en a sil existe b F tel que f (x) b. Le vecteur b est
xa

alors unique ; il est appel limite de f en a et not lim f (x) ou lima f.


xa

119

Dmonstration de lunicit de b
Soient b et b deux vecteurs de F vrifiant la dfinition ; soient > 0 et deux rels > 0 et
> 0 vrifiant la condition ci-dessus pour b et b respectivement. Alors pour tout x A tel que
kx akE 6 min(, ),
kb b kF = kb f (x) + f (x) b kF 6 kf (x) bkF + kf (x) b kF 6 2.

Ceci tant vrai pour tout > 0, on en dduit b = b .

Remarque Pourquoi dfinir la limite de f en un point a adhrent A ? Dans la dfinition de


point adhrent, on peut clairement remplacer B(a,r) par Bf (a,r) : les points adhrents A sont
exactement les points de E pour lesquels, pour tout > 0, Bf (a,) A nest pas vide, et donc
ceux pour lesquels lventualit x A et kx akE 6 se prsente.
Dfinition Limite en
Soient m R, f une fonction dfinie sur ]m, + [ valeurs dans F et b F .
On dit que f a pour limite b en + si
> 0, M > 0 ; x > M, kf (x) bkF 6 .
Soient m R, f une fonction dfinie sur ],m[ valeurs dans F et b F .
On dit que f a pour limite b en si
> 0, M > 0 ; x 6 M, kf (x) bkF 6 .
Dfinition Limite infinie
Soient f une fonction dfinie sur A valeurs relles et a un point adhrent A.
On dit que f a pour limite + en a si
K > 0, > 0 ; x A, [kx akE 6 ] [f (x) > K].
Soient f une fonction dfinie sur A valeurs relles et a un point adhrent A.
On dit que f a pour limite en a si
K > 0, > 0 ; x A, [kx akE 6 ] [f (x) 6 K].
On vrifie aisment que lunicit de la limite est toujours vrifie.
Proprit/Dfinition Continuit en un point
Lorsque a A et f admet une limite en a, on a ncessairement lim f (x) = f (a).
xa

Dans ce cas, on dit que f est continue en a.

Dmonstration Soit > 0 fix et b = lima f . Il existe > 0 tel que pour tout x de A vrifiant
kx akE 6 , on ait kf (x) bkF 6 . En appliquant ceci x = a (ce qui est possible car a A),
on a donc kf (a) bkF 6 , et ce pour tout > 0. Ainsi b = f (a), cest--dire
lim f (x) = f (a).

xa

Dfinition Continuit sur une partie


On dit que f est continue sur A si f est continue en tout point de A. Ceci quivaut :
a A, > 0, > 0; x A, [kx akE 6 ] [kf (x) f (a)kF 6 ].

120

2.

Caractrisation squentielle de la limite


Proprit Caractrisation squentielle de la limite
Soit a un point adhrent A ; les proprits suivantes sont quivalentes :
La fonction f possde une limite en a.
Pour toute suite (an ) dlments de A qui converge vers a, la suite (f (an ))nN a
une limite.
Dans ce cas, pour toute suite (an ) dlments de A qui converge vers a,
lim f (x) = lim f (an ).

xa

n+

Dmonstration
Notons b = lim f (x). Soit (an ) une suite dlments de A convergeant vers a. Soit > 0
xa

fix. Il existe > 0 tel que pour tout x de A vrifiant kx akE 6 , on ait kf (x) bkF 6 . Or
an a, donc il existe n0 N tel que pour tout n > n0 , kan akE 6 . Alors, pour un tel n,
kf (an ) bkF 6 ,
do le rsultat.

Commenons par montrer que, avec les notations de lnonc, la limite de (f (an )) ne dpend
pas de la suite (an ). Soient donc (an ) et (n ) deux suites dlments de A qui convergent vers
a. On construit une suite (cn ) en posant, pour tout p N, c2p = ap et c2p+1 = p : (cn ) est
construite en crivant alternativement les termes de (an ) et (n ). En particulier, la suite (cn )
converge vers a, et donc la suite (f (cn )) est convergente. Or les suites (f (an )) et (f (n )) sont
extraites de (f (cn )), donc
lim f (an ) = lim f (cn ) = lim f (n ),
qui est le rsultat annonc.
Notons alors b la valeur commune de la limite de toutes les suites (f (an )) o (an ) est une
suite dlments de A qui converge vers a. Pour montrer que f a une limite en a gale b, on
raisonne par labsurde : supposons au contraire quil existe > 0 tel que pour tout > 0, il
existe x A tel que kx akE 6 mais kf (x) bkF > . En appliquant cela avec = 1/n
(n N ) on construit une suite (an ) dlments de A telle que pour tout n > 1,
kan akE 6

1
n

et kf (an ) bkF > .

Alors an a mais (f (an )) ne converge pas vers b ; cest absurde, et on en dduit le rsultat. 
Remarques
Limplication directe est trs souvent employe sous la forme suivante :
(

an a

f est continue en a

f (an ) f (a).

Cette caractrisation permet de ramener de nombreuses questions de limites de fonctions des


questions de limites de suites, pour lesquelles on a dj de nombreuses proprits.
On a une proprit analogue pour les limites en lorsque E = R.
121

3.

Limite et continuit composante par composante, oprations


Proprit Limite ou continuit composante par composante
Soient C = (1 , . . . ,n ) une base de F et f : A F une fonction. Notons
f=

n
X

fi i

i=1

la dcomposition de f dans la base C, cest--dire que les fonctions fi : A K sont les


fonctions-coordonnes de f dans la base C.

Alors :
1. Soit a un point adhrent A. Pour que f ait une limite en a, il faut et il suffit que
pour tout i [[1,n]], fi ait une limite en a. Dans ce cas, on a
lima f =

n
X
(lima fi ) i ,
i=1

cest--dire que les coordonnes de la limite sont les limites des fonctions-coordonnes.
2. Soit a A. Pour que f soit continue en a, il faut et il suffit que pour tout i [[1,n]],
fi soit continue en a.
3. Pour que f soit continue sur A, il faut et il suffit que pour tout i [[1,n]], fi soit
continue sur A.

Dmonstration Il suffit dutiliser la caractrisation squentielle de la limite et la proprit de


convergence composante par composante pour les suites.

Proprit Oprations algbriques
Soient f et g deux fonctions dfinies sur A valeurs dans F , et une fonction dfinie
sur A valeurs dans K.
1. Soit a un point adhrent A. On suppose que f , g et ont une limite en a.
Alors :
La fonction f + g a une limite en a et lima (f + g) = lima f + lima g.
La fonction f a une limite en a et lima (f ) = (lima ) (lima f ).
f
Si (x) 6= 0 pour tout x A et si lima 6= 0, alors la fonction
a une limite en

a et
 
lima f
f
.
=
lim
a

lima
Toutes ces proprits sont vraies si E = R et a = , ainsi que les cas dj connus
pour des limites infinies ; attention cependant aux formes indtermines.
2. Lorsque a appartient A, on peut traduire ces proprits en termes de continuit
en a.
3. On peut traduire ces proprits en termes de continuit sur A.
En particulier, lensemble C 0 (A,F ) des fonctions continues sur A valeurs dans F est
un K-espace vectoriel (pour les lois usuelles).

Dmonstration Il suffit de dmontrer le point 1. On se ramne aux proprits analogues sur les
suites grce la caractrisation squentielle de la limite.

122

Proprit Composition
Soient E, F et G trois espaces vectoriels norms de dimension finie, A une partie de E
et B une partie de F . Soient f : A F et g : B G deux fonctions. On suppose que
f (A) B, de sorte que la fonction g f : A G est bien dfinie.
1. Soit a un point adhrent A. On suppose que f a une limite b en a. Alors :
b est adhrent B.
Si de plus g a une limite c en b, on a :
g f a une limite en a et (g f )(x) c.
xa

2. Soit a A. Si f est continue en a et si g est continue en f (a), alors g f est continue


en a.
3. Si f est continue sur A et si g est continue sur B, alors g f est continue sur A.
Dmonstration Il suffit de dmontrer le point 1.
Le point a est adhrent A, donc il existe une suite (an ) dlments de A qui converge vers a.
Sachant que f a pour limite b en a, on a donc f (an ) b. Or, pour tout n N, f (an ) f (A) B.
On a donc construit une suite dlments de B qui converge vers b : b est adhrent B.
Soit (an ) une suite dlments de A qui converge vers a. Alors sachant que f a pour limite b
en a et que g a pour limite c en b, on a f (an ) b et g(f (an )) c. Daprs la caractrisation
squentielle de la limite (sens rciproque, appliqu g f ), on obtient que g f a pour limite c
en a.

Proprit Continuit des applications polynomiales
Toute application polynomiale f dfinie sur Kn est continue (par application polynomiale, on entend que chaque fonction-coordonne de f dans une base de lespace
darrive est un polynme en les composantes x1 , . . . ,xn de la variable x).
Dmonstration Daprs les deux premires proprits de ce paragraphe, il suffit de prouver que
pour tout i [[1,n]], lapplication x = (x1 , . . . ,xn ) 7 xi est continue, ce qui est immdiat.

Exemple Lapplication (x,y,z) 7 (x2 + 3xy + 4xz 2 ,xz y 3 ) est continue de R3 dans R2 .

Remarque On montre de la mme faon que toute application f dfinie sur E, polynomiale en
les coordonnes (x1 , . . . ,xn ) de sa variable x dans une base de E, est continue.

4.

Fonctions Lipschitziennes
Dfinition Fonction Lipschitzienne
Soit k R+ . On dit que f est k-Lipschitzienne si
(x,y) A2 , kf (x) f (y)kF 6 k kx ykE .
On dit que f est Lipschitzienne sil existe k tel que f est k-Lipschitzienne.

Remarque Le fait pour une fonction dtre Lipschitzienne ne dpend pas des normes choisies,
mais le fait dtre k-Lipschitzienne en dpend !
Exemples

La fonction racine carre f : x 7 x est Lipschitzienne sur [1, + [ : en effet, f est drivable
sur [1, + [ avec, pour tout x > 1,
1
1
f (x) = 6 .
2 x
2
123

Daprs le thorme des accroissements finis, on a donc, pour tout (x,y) [1, + [ 2 ,
|f (x) f (y)| 6

1
|x y|.
2

Le thorme des accroissements finis est un outil trs utile pour prouver quune fonction est
Lipschitzienne.
Si k k est une norme sur E, lapplication x 7 kxk de E dans R est 1-Lipschitzienne : en effet,
daprs la seconde forme de lingalit triangulaire, pour tout (x,y) E 2 , on a


kxk kyk 6 kx yk.
Remarques
Il est trs facile de prouver que lensemble des fonctions Lipschitziennes de A E dans F est
un K-espace vectoriel.
On a galement une proprit de stabilit vis--vis de la composition : soient (E,kkE ), (F,kkF )
et (G,k kG ) trois espaces vectoriels norms, A une partie de E et B une partie de F . Soient
f : A F et g : B G deux fonctions. On suppose que f (A) B, de sorte que la fonction
g f est bien dfinie.
Si f est k1 -Lipschitzienne et g est k2 -Lipschitzienne, alors g f est k1 k2 -Lipschitzienne.
En effet, pour tout (x,y) A2 ,

k(g f )(x) (g f )(y)kG 6 k2 kf (x) f (y)kF 6 k2 k1 kx ykE .

Proprit
Toute fonction Lipschitzienne est continue. La rciproque est fausse.
Dmonstration Avec les notations prcdentes, soit f une fonction k-Lipschitzienne. Si k = 0,
f est constante et le rsultat est vident. Sinon, soient a A et > 0. Pour tout (x,y) A2 ,
kf (x) f (y)kF 6 k kx ykE .
En particulier, si kx akE 6 /k, alors
kf (x) f (a)kF 6 k

= .
k

Donc f est continue en a, et ce pour tout a A. On voit mme que le nombre = /k permettant
de vrifier la dfinition de la continuit est indpendant de x : le caractre Lipschitzien est donc
beaucoup plus fort que la continuit en chaque point.
Pour montrer que la rciproque est fausse : la fonction x 7 x2 dfinie sur R nest pas
Lipschitzienne, bien quelle soit continue. En effet, supposons au contraire quil existe k tel que
pour tout (x,y) R2 , |x2 y 2 | 6 k|x y|. Alors, pour tout x et y distincts, on a
|x + y| |x y| 6 k|x y| do |x + y| 6 k,
ce qui est absurde lorsque par exemple y = 0 et x tend vers +.

124

V.
1.

Proprits des fonctions continues valeurs relles


Ensembles de niveaux dune fonction continue
Proprit
Soit f une application continue sur E valeurs dans R. Alors :
Lensemble {x E; f (x) > 0} est une partie ouverte de E.
Lensemble {x E; f (x) > 0} est une partie ferme de E.
Lensemble {x E; f (x) = 0} est une partie ferme de E.

Dmonstration
Soit a E tel que f (a) > 0 ; par continuit de f , il existe > 0 tel que pour tout x de E
vrifiant kx akE 6 , on ait |f (x) f (a)| 6 f (a)/2, et donc
f (x) > f (a)

f (a)
f (a)
=
> 0.
2
2

En particulier, B(a,) {x E; f (x) > 0}. Il en rsulte que {x E; f (x) > 0} est ouvert.
On utilise la caractrisation squentielle des ferms : soit (an ) une suite dlments de
{x E; f (x) > 0} qui converge vers a E. Pour tout n, f (an ) > 0, et f tant continue,
on sait que f (an ) f (a). On en dduit que f (a) > 0, cest--dire, a {x E; f (x) > 0}. Cet
ensemble est donc ferm.
On raisonne de mme en passant la limite dans la relation f (an ) = 0.


Remarque Bien sr, en changeant f en f , on prouve des rsultats analogues pour f (x) < 0 et
f (x) 6 0.

Cette dernire proprit est trs utile pour prouver que des parties de E sont ouvertes, ou
fermes : on peut parfois voir ces parties comme ensembles de niveau f (x) > 0, f (x) > 0 ou
f (x) = 0 dune application continue valeurs relles f bien choisie.
Exemples
Lexemple du cercle unit U trait plus haut entre dans ce cadre : on a
U = {(x,y) R2 ; x2 + y 2 1 = 0},
la fonction f : (x,y) 7 x2 + y 2 1 tant continue car polynomiale.
Revenons sur lexemple du demi-plan
P = {(x,y) R2 , y > 0}
Montrons par cette mthode quil sagit dun ouvert de R2 : lapplication
f:

R2 R
(x,y) 7 y

est continue sur R2 . De plus, P = {(x,y) R2 ; f (x,y) > 0}. Daprs la proprit prcdente, P
est donc un ouvert.
Lensemble Gn (R) des matrices inversibles dordre n est un ouvert de Mn (R) : en effet, une
matrice carre A est inversible si et seulement si det(A) 6= 0. On en dduit donc que
Gn (R) = {A Mn (R); det(A) < 0} {A Mn (R); det(A) > 0}.
Nous montrerons bientt que la fonction dterminant est continue sur Mn (R). On en dduit que
Gn (R) est la runion de deux ouverts de Mn (R), cest donc une partie ouverte.
125

Lensemble O des trinmes coefficients rels qui ont deux racines relles distinctes est une
partie ouverte de R2 [X]. Soit en effet lapplication discriminant

R2 [X] R
:
aX 2 + bX + c 7 b2 4ac
et : aX 2 + bX + c 7 a. Alors
O = ({P R2 [X]; (P ) < 0} {P R2 [X]; (P ) > 0}) {P R2 [X]; (P ) > 0}.
Or, et sont continues sur R2 [X] (cest immdiat pour , et est polynomiale en les coordonnes de sa variable). Donc O est une partie ouverte comme intersection de deux ouverts, le
premier tant lui-mme la runion de deux ouverts. De la mme faon, on montre que lensemble
des polynmes de R2 [X] ayant deux racines complexes conjugues distinctes est un ouvert, et
que lensemble des polynmes de R2 [X] ayant au plus une racine (ventuellement double) est un
ferm.

2.

Extrema de fonctions continues


Thorme des bornes atteintes (admis : dmonstration non exigible)
Si K est une partie ferme, borne et non vide de E et f : K R est continue, alors
f est borne et atteint ses bornes.

Remarque Ce thorme est bien sr une gnralisation du thorme selon lequel une fonction
continue sur un segment, valeurs dans R, est borne et atteint ses bornes.
Exemple La boule unit B de Mn (R) pour la norme infini est ferme, borne et non vide. La
fonction dterminant, qui est continue sur B, est donc borne sur B et atteint ses bornes. Ainsi,
parmi les matrices de Mn (R) dont tous les coefficients sont compris entre 1 et 1, il en existe
au moins une dont le dterminant est maximal.

VI.

Le cas des applications linaires et multilinaires

Thorme Caractre Lipschitzien des applications linaires


Soient E et F deux espaces vectoriels de dimension finie et u L (E,F ).
Alors u est Lipschitzienne.
Dmonstration Munissons E dune base B = (e1 , . . . ,en ) et de la norme infini k k associe
cette base, et F dune norme k kF . Soit x E dont la dcomposition dans la base B est
x = x1 e1 + + xn en . Alors par linarit de u,
ku(x)kF = kx1 u(e1 ) + + xn u(en )kF 6 |x1 |ku(e1 )kF + + |xn |ku(en )kF ,
daprs lingalit triangulaire. Alors
ku(x)kF 6 [ku(e1 )kF + + ku(en )kF ] kxk .
Posons k = ku(e1 )kF + + ku(en )kF . Soit (x,y) E 2 ; alors par linarit de u et daprs
lingalit prcdente,
ku(x) u(y)kF = ku(x y)kF 6 k kx yk ,
do le rsultat, car la notion de fonction Lipschitzienne ne dpend pas des normes choisies sur
E et F .

Attention ! La linarit de u est essentielle pour que lingalit ku(x)kF 6 k kxk , valable pour
x E, entrane que u est Lipschitzienne.
126

On sait que le caractre Lipschitzien entrane la continuit, on a donc le rsultat suivant :


Corollaire
Une application linaire entre espaces vectoriels de dimension finie est continue.
Exemple Lapplication Trace, de Mn (K) dans K, est linaire entre deux espaces de dimension
finie, donc Tr est Lipschitzienne. Si Mn (K) est muni de la norme infini (et K de la valeur absolue
ou du module), elle est en fait n-Lipschitzienne car pour tout M = (mi,j )16i,j6n Mn (K),


n
n
X
X


|mi,i | 6 n max |mi,j | = n kM k .
mi,i 6
| Tr(M )| =
i,j


i=1

i=1

Si Mn (K) est muni de la norme 1, dfinie par kM k1 =


| Tr(M )| 6

n
X
i=1

|mi,i | 6

n
X

i,j=1

Pn

i,j=1 |mi,j |,

elle est 1-Lipschitzienne car

|mi,j | = kM k1 .

Proprit Continuit des applications multilinaires


Soit p un entier avec p > 2 et f : (Kn )p F une application multilinaire, cest--dire,
linaire par rapport chacune de ses p variables.
Alors f est continue.
Dmonstration On notera (e1 , . . . ,en ) la base canonique de Kn . Pour j [[1,p]], soit
xj = (xj1 , . . . ,xjn ) = xj1 e1 + + xjn en Kn . Par multilinarit de f , on a
X
f (x1 , . . . ,xp ) =
x1i1 xpip f (ei1 , . . . , eip ).
(i1 ,...,ip )[[1,n]]p

En dcomposant tous les vecteurs f (ei1 , . . . , eip ) dans une base de F , on voit que chaque coordonne de f (x1 , . . . ,xp ) dans cette base dfinit une fonction polynomiale en les xji pour
(i,j) [[1,n]] [[1,p]], et donc, dfinit une fonction continue. On en dduit que f est continue. 

Remarque Si E et F sont de dimension finie, on gnralisera sans difficult la proprit prcdente pour montrer quune application f : E p F multilinaire est continue.

Exemples
Lapplication dterminant, de Mn (K) dans K, est continue car multilinaire par rapport aux
colonnes de sa variable.
Si (E, ( | )) est un espace euclidien, alors le produit scalaire ( | ) est une application continue.
Si de plus E est orient de dimension 3, alors le produit vectoriel est une application continue.
En effet, dans ces deux cas, lapplication considre est bilinaire.
Le produit matriciel

Mn (K) Mn (K) Mn (K)
(A,B) 7 AB
est continu car bilinaire.

On peut donc passer la limite dans un dterminant, un produit scalaire en dimension finie,
un produit vectoriel, un produit de matrices.

127

128

Chapitre 6

Suites et sries de fonctions


Dans ce chapitre, K dsigne R ou C, et I un intervalle de R.
Soit (fn )nN une suite de fonctions dfinies sur un intervalle J et valeurs dans K. Pour tout
x J, (fn (x))nN est une suite dlments de K. Si elle converge, on peut noter sa limite f (x).
Quelles sont alors les proprits de la fonction f :
Si fn est continue ou mme drivable pour tout n, f est-elle continue, drivable ?
Peut-on exprimer lintgrale de f sur un segment comme limite des intgrales des fn ?

On remarque tout de suite que la question nest pas anodine, en considrant la suite de
fonctions (fn ) o fn (x) = xn pour tout n N et tout x rel. Alors bien sr, toutes les fonctions
fn sont de classe C sur R. Pourtant,

si x ]1,1[
0
fn (x)
1
si x = 1
n+

+ si x > 1

et (fn (x))nN na pas de limite si x 6 1. La fonction limite f est dfinie sur ]1,1], et elle
nest pas continue.
On a reprsent ci-dessous f1 , f2 , f5 et f20 (en noir), et la fonction f (en rouge), sur [0,1].

1
b

Cf 1

Cf 2

Cf 5

Cf20

Cf

De, mme, pour chaque x on peut sintresser la srie


de la fonction-somme ainsi dfinie ?

n>0 fn (x).

Quelle sont les proprits

Toutes les fonctions considres dans ce chapitre sont valeurs dans K.


129

I.

Diffrents modes de convergence

1.

Convergence simple, convergence uniforme


Commenons par dfinir la convergence envisage dans lintroduction :
Dfinition Convergence simple
Pour tout n N (ou n > n0 avec n0 N ), on se donne une fonction fn : I K.
On se donne galement une fonction f : I K.
On dit que la suite de fonctions (fn )nN converge simplement vers f sur I si :
x I, fn (x) f (x).
n+

Exemple Comme nous lavons montr dans lintroduction, la suite (fn )nN des fonctions
fn : x 7 xn converge vers la fonction
(
0 si x ]1,1[
f : x 7
1 si x = 1
sur ]1,1].
La convergence simple est donc une notion qui sapplique x par x . Pour la montrer, on
commence par fixer x et on tudie la suite (fn (x))nN dlments de K. Or, le comportement de
cette suite pour un certain x peut tre indpendant du comportement pour un autre x, mme
proche. Cest ce qui arrive dans notre exemple entre x ]1,1[ et x = 1.

Pour pallier cette difficult, on va dfinir un autre mode de convergence en imposant une
certaine uniformit entre les diffrentes valeurs de x :
Dfinition Convergence uniforme
Avec les notations ci-dessus, on dit que (fn ) converge uniformment vers f sur I si
pour n N assez grand, fn f est borne sur I ;
sup |fn (x) f (x)| 0.
xI

n+

Regardons de plus prs cette dfinition, et traduisons-la avec des quantificateurs ; elle signifie :
> 0, n0 N; n > n0 , x I, |fn (x) f (x)| 6 .
Comparons-la la convergence simple ; cette dernire signifie :
> 0, x I, n0 N; n > n0 , |fn (x) f (x)| 6 .
Toute la diffrence rside dans cet change de quantificateurs : dans la convergence simple, le
rang n0 dpend de x ; dans la convergence uniforme, le mme n0 doit convenir pour tout x I.
La convergence uniforme est donc beaucoup plus exigeante que la convergence simple.
Si K = R, lingalit |fn (x) f (x)| 6 est quivalente f (x) 6 fn (x) 6 f (x) + . Ainsi,
pour que la suite de fonctions (fn ) converge uniformment vers f sur I, il faut et il suffit que
pour tout > 0, il existe un entier n0 tel que pour tout n > n0 , pour tout x I,
f (x) 6 fn (x) 6 f (x) + ,
ce qui signifie que pour n > n0 , le graphe de fn est inclus dans le tube dpaisseur 2 autour
du graphe de f .
130

Ce phnomne est illustr sur le graphique suivant :


y = f (x) +

y = f (x)
y = fn (x) avec n > n0
y = f (x)

Proprit
Soit (fn ) une suite de fonctions dfinies sur I, valeurs dans K, et f : I K une
fonction.
Pour que (fn ) converge uniformment vers f sur I, il faut et il suffit quil existe une
suite (an ) de rels positifs telle que
pour n assez grand, pour tout x I, |fn (x) f (x)| 6 an ;
an 0.
n+

Dmonstration
Il suffit de choisir an = supxI |fn (x) f (x)| si fn f est borne (ce qui est le cas pour n
assez grand), an = 0 sinon.
Si une telle suite (an ) existe, alors pour n N assez grand, fn f est borne et
avec

sup |fn (x) f (x)| 6 an


xI

donc (fn ) converge uniformment vers f sur I.

an 0,
n+

Lintrt de cette proprit est de montrer que pour prouver la convergence uniforme de (fn )
vers f sur I, il nest pas ncessaire de calculer supxI |fn (x) f (x)|, mais il suffit de le majorer
par un terme an convenable.
En revanche, si les majorations ne sont pas assez fines, il se peut que lon ne puisse pas
conclure. Il faut alors amliorer les majorations, sachant que la majoration la plus fine possible
sera toujours celle donne par le calcul de supxI |fn (x) f (x)|, qui peut se faire par des tudes
de fonctions.
Pour prouver que (fn ) ne converge pas uniformment vers f sur I, on peut essayer de calculer
supxI |fn (x) f (x)|, ou le minorer par une quantit positive qui ne tend pas vers 0 lorsque
n +.

Remarque Supposons que toutes les fonctions avec lesquelles on travaille soient bornes, cest-dire, appartiennent B(I,K). Sur cet espace, on a dfini dans le chapitre Espaces vectoriels
norms la norme k k . Alors, par dfinition mme, (fn ) converge uniformment vers f sur I
si et seulement si
kfn f k 0.
n+

Cest pourquoi la norme infini sur B(I,K) est appele norme de la convergence uniforme.

131

Revenons nouveau sur lexemple de la suite des fonctions fn : x 7 xn . Il y a convergence


simple vers la fonction f notamment sur [0,1[ (sur lequel f coincide avec la fonction nulle). Il ny
a pas convergence uniforme sur cet intervalle car pour tout n N ,
sup |fn (x) f (x)| = sup xn = 1.

x [0,1[

x[0,1[

Cela dit, on a limpression que labsence de convergence uniforme sur [0,1[ provient du voisinage
de 1. Soit [a,b] un segment inclus dans [0,1[. Alors
sup |fn (x) f (x)| = sup xn = bn 0 ;

x[a,b]

n+

x[a,b]

il y a donc convergence uniforme sur [a,b].


En gnralisant cette ide, on est amen dfinir un troisime mode de convergence :
Dfinition Convergence uniforme sur tout segment
Avec les notations prcdentes, on dit que (fn ) converge uniformment sur tout segment de I vers f si pour tout segment [a,b] inclus dans I, (fn ) converge uniformment
vers f sur le segment [a,b].
Remarque Ce mode de convergence permet parfois deffacer les difficults provenant des extrmits de lintervalle I, lorsque celui-ci est ouvert ou semi-ouvert, comme cest le cas dans
lexemple prcdent.
Proprit Lien entre les diffrentes convergences
On a les implications suivantes :
(fn ) converge uniformment vers f sur I

(fn ) converge uniformment vers f sur tout segment de I


(fn ) converge simplement vers f sur I.

Les deux rciproques sont fausses.

Dmonstration
Si (fn ) converge uniformment vers f sur I, et si J est un segment inclus dans I, on a, pour
n assez grand,
sup |fn (x) f (x)| 6 sup |fn (x) f (x)| avec
xJ

xI

sup |fn (x) f (x)| 0,


xI

n+

donc (fn ) converge uniformment vers f sur J, et ce quel que soit J. Ainsi (fn ) converge uniformment vers f sur tout segment de I.
Si (fn ) converge uniformment vers f sur tout segment de I, alors pour tout x I, il existe
un segment J inclus dans I qui contient x, et alors, pour n assez grand,
|fn (x) f (x)| 6 sup |fn (y) f (y)| avec
yJ

sup |fn (y) f (y)| 0.


yJ

n+

Ainsi (fn ) converge simplement vers f sur I.


Lexemple des fonctions x 7 xn sur [0,1[ montre que la premire rciproque est fausse. Le
mme exemple sur [0,1] montre que la deuxime rciproque est fausse. Autre contre-exemple :
considrons la suite des fonctions fn : x 7 arctan(nx) dfinies sur R ; elle converge simplement
132

sur R vers la fonction f dfinie par f (0) = 0, f (x) = /2 si x < 0 et f (x) = /2 si x > 0.
Cette convergence nest pas uniforme sur tout segment de R car, par exemple,
sup |fn (x) f (x)| =

x[1,1]

,
2

comme le montre une tude de fonctions sans difficult. Cet exemple montre aussi que la seconde
rciproque est fausse.

Remarque Dans certains cas, prouver la convergence uniforme de (fn ) vers f sur tout segment
de I revient la prouver pour des segments dune forme particulire, plus simple :
Si I est de la forme [, [, on peut se limiter aux segments de la forme [,b] o b I (de mme
si I = ],] avec les segments de la forme [a,] o a I).
Si I est symtrique par rapport 0, de la forme ], [, on peut se limiter aux segments de la
forme [a,a] o a [0,[.
En effet, dans chaque cas, tout segment de I est inclus dans un segment de la forme particulire
indique.
Mthode Pour tudier la convergence dune suite de fonctions (fn )nN , on procde souvent
comme suit :
On fixe x et on tudie la convergence de la suite de scalaires (fn (x))nN . On note f (x) sa limite,
o x appartient un certain intervalle I (qui nest pas ncessairement lensemble de dfinition
des fn ) : la suite de fonctions (fn ) converge simplement vers f sur I.
On se demande alors si la convergence est meilleure. Si elle est uniforme, ou au moins uniforme
sur tout segment de I, on sait que la limite ne peut tre que f . On essaie donc de majorer
|fn (x) f (x)|, et plus prcisment, de prouver, pour x I et n assez grand, une ingalit du
type
|fn (x) f (x)| 6 an
o an est indpendant de x, et an 0.
n+

Si lon y parvient sur I tout entier, alors la convergence est uniforme sur I.
Sinon, on essaie de le faire sur tout segment inclus dans I. Si lon y parvient, la convergence
est uniforme sur tout segment de I.
Exemples

1
, pour n > 1, sur R. Il est vident que (fn )
n
converge simplement vers la fonction valeur absolue (note f ) sur R, car pour tout rel x,
r

1
x2 +
x2 = |x|.

n n+
tudions la suite des fonctions fn : x 7

x2 +

On se demande si cette convergence est uniforme. Or, pour tout n > 1 et x R,


r
1
1
1
1/n
1/n
0 6 fn (x) f (x) = x2 + x2 = q
avec 0,
6 =
n
1/
n
n
n n+
x2 + 1 + |x|
n

et lencadrement est indpendant de x. La convergence est donc uniforme sur R. Ce rsultat


montre au passage que lon peut approcher la valeur absolue (non drivable en 0) par des fonctions
de classe C , de faon uniforme sur R et arbitrairement prcise.

tudions la suite des fonctions fn : x 7 nxn (1 x), pour n > 1, sur [0,1]. Par croissances
compares, (fn ) converge simplement vers la fonction nulle f sur [0,1[, et fn (1) = 0 pour tout
n N . Il y a donc convergence simple vers f sur [0,1]. Pour savoir si cette convergence est
uniforme, tudions la fonction fn f = fn sur [0,1]. Pour tout n N , fn est drivable sur [0,1]
et pour tout x [0,1],
fn (x) = n2 xn1 (1 x) nxn = nxn1 (n(1 x) x) = nxn1 (n (n + 1)x).
133

On en dduit immdiatement que fn , qui est positive, admet un maximum global sur [0,1] en
n
. Or
n+1
!n
!n


n

1
n
n
1
n
1
=
=n
fn

.
n+1
n+1
n+1
n + 1 1 + n1
1 + n1
Un dveloppement limit classique montre que
!n
1
1
.

1
n+
e
1+ n
Finalement, f et toutes les fonctions fn sont bornes sur [0,1], et


n
1
kfn f k = fn
.
n + 1 n+ e

La convergence nest donc pas uniforme sur [0,1]. Elle est cependant uniforme sur tout segment
de la forme [0,a] avec 0 6 a < 1 (et donc sur tout segment de [0,1[). En effet, pour tout n tel
n
n
que a <
( ce qui est le cas pour n assez grand car
1), on a
n+1
n + 1 n+
sup |fn (x) f (x)| = fn (a) = nan (1 a) 0.
n+

x[0,a]

Le cas des sries de fonctions


Bien sr, on dfinit la convergence (simple ou uniforme) dune srie de fonctions
comme la convergence de la suite des sommes partielles
!
p
X
fn
(Sp )pN =
n=0

n>0 fn

pN

On se ramne ainsi une suite de fonctions.


Exemples de convergence simple

P
1
Posons, pour n N et x R, fn (x) = x . La srie de Riemann n>1 fn (x) converge si et
n
P
seulement si x > 1. La fonction +
n=1 fn est appele fonction de Riemann, elle est dfinie sur
]1, + [.
P
n
Posons, pour n N et x R, fn (x) = xn . La srie gomtrique
n>0 x converge si et
P+
seulement si x ]1,1[. La fonction S = n=0 fn est dfinie sur ]1,1[ et pour tout x ]1,1[,
S(x) =

1
.
1x

Traduisons plus particulirement la convergence uniforme dune srie de fonctions


Supposons que la fonction somme S soit dfinie sur I. Pour tout x I et p N,
S(x) Sp (x) =

+
X

n=0

fn (x)

p
X

fn (x) =

n=0

Rp est le reste dordre p de cette srie de fonctions.

+
X

fn (x) = Rp (x);

n=p+1

Ainsi, les proprits suivantes sont quivalentes :


P
La srie de fonctions n>0 fn converge uniformment sur I.
La suite (Rp )pN de ses restes converge uniformment vers la fonction nulle sur I.
Pour p assez grand, Rp est born sur I et


X


+

fn (x) 0.
sup |Rp (x)| 0, i.e. sup
p+
xI
xI n=p+1
p+
134

n>0 fn .

2.

Convergence normale des sries de fonctions

Nous allons chercher une condition suffisante simple pour que toutes ces proprits soient
satisfaites. Supposons que fn soit borne sur I pour tout n. Pour tout x I,
|fn (x)| 6 kfn k .
Supposons que la srie

n>0

kfn k

convergeP(la norme infini tant calcule sur I). Alors, par comparaison des sries termes positifs,
la srie n>0 fn (x) converge absolument, et donc converge, pour tout x I. La srie de fonctions
P
2
n>0 fn converge donc simplement sur I. Pour tout x I, pour tout (p,q) N tel que q > p,
on a de plus


q

q
q
X
X
X




kfn k .
fn (x) 6
|fn (x)| 6

n=p+1
n=p+1
n=p+1

Lorsque q tend vers +, on obtient en particulier, pour tout x I, et tout p N,




+

+
+
+
X
X
X
X

kfn k 0.
kfn k avec
|Rp (x)| =
fn (x) 6
|fn (x)| 6
p+
n=p+1
n=p+1
n=p+1
n=p+1

Nous avons major le reste dordre p de la srie par une quantit qui tend vers 0, indpendante
de x : la convergence est donc uniforme sur I.
On dfinit ainsi un nouveau mode de convergence spcifique aux sries de fonctions :
Dfinition Convergence normale
P
On dit que la srie de fonctions n>0 fn (o fn est dfinie sur I pour tout n) converge
normalement sur I si :
fn est borne sur I pour tout n N,
P
la srie numrique n>0 kfn k converge.

On dfinit de faon similaire la convergence normale sur tout segment de I.

Proprit
P
Si n>0 fn converge normalement sur I, alors elle converge uniformment sur I.
Elle converge aussi normalement sur tout segment de I.
Dmonstration La premire implication a t dmontre ci-dessus. La seconde vient du fait que
la norme infini de fn sur un segment de I est infrieure ou gale sa norme infini sur I. Le
thorme de comparaison de sries termes positifs donne alors le rsultat.

En pratique, la convergence normale se montre souvent de la faon suivante :
Proprit
P
Pour que n>0 fn converge normalement sur I, il faut et il suffit quil existe une suite
(n ) de rels positifs telle que
Pour tout x I, pour tout n N, |fn (x)| 6 n ,
X

n converge.
n>0

135

Dmonstration
Il suffit de choisir n = kfn k pour tout n N.
Si une telle suite (n ) existe, alors pourP
tout n N, kfn k 6 n . Par comparaison de sries
Ptermes positifs, la convergence de la srie n>0 n entrane la convergence normale de la srie

n>0 fn .
P
Remarque Ainsi, pour prouver la convergence normale de n>0 fn , il nest pas ncessaire de
calculer kfn k , mais il suffit de majorer kfn k par un terme n convenable.
Pour prouver labsence de convergence normale, on peut calculer kfn k ou le minorer par le
terme gnral positif dune srie divergente.
Exemples
Posons, pour n N et x R,

sin(nx)
;
n2
P
la srie de fonctions n>1 fn converge normalement sur R, car pour tout n > 1, pour tout x R,


sin(nx)
1


n2 6 n2
fn (x) =

et la srie

X 1
converge.
n2

n>1

1 P
Posons, pour n N et x > 1, fn (x) = x ; n>1 fn ne converge pas normalement sur ]1, + [
n
car
1
1
sup x = ,
n
n
x>1
P
or la srie harmonique diverge. En revanche, n>1 fn converge normalement sur tout intervalle
de la forme [a, + [ o a > 1. En effet, dans ce cas,
sup
x>a

1
1
= a,
x
n
n

P
et la srie n>1 1/na converge car a > 1. Ceci montre dailleurs que la convergence normale sur
tout segment de I nentrane pas la convergence normale sur I.
P
n
On montre de mme que la srie gomtrique,
n>0 fn o fn : x 7 x , ne converge pas
normalement sur ]1,1[, mais converge normalement sur tout segment de ]1,1[.

Donnons un autre exemple, qui montre dailleurs que la convergence uniforme sur I nentrane
pas la convergence normale sur I, ni mme la convergence normale sur tout segment de I :
Exemple Posons, pour n N et x > 0,
fn (x) =

(1)n
;
x+n

P
la srie de fonctions n>0 fn ne converge pas normalement sur tout segment de ]0, + [, car
par exemple, pour tout n N,


(1)n
= 1 ,

sup
1+n
x[1,2] x + n

1
diverge (srie harmonique).
1+n
n>1
P
Pourtant, n>0 fn converge uniformment sur ]0, + [ : on remarque en effet que pour tout
x > 0, la srie
X (1)n
or la srie

n>0

x+n

136

est une srie alterne de rels, dont la valeur absolue du terme gnral dcrot vers 0. Elle est
donc convergente et, pour tout x > 0 et p N, on a la majoration suivante de la somme et des
restes :



+
X (1)n
1
1
6

6
.


p+1
n=p+1 x + n x + p + 1

Ce majorant tend vers 0 lorsque p tend vers +, et est indpendant de x, do la conclusion.


P
Mthode Pour tudier la convergence dune srie de fonctions n>0 fn , on procde souvent
comme suit :
P
On fixe x et on tudie la convergence de la srie numrique n>0 fn (x).
P
On note S(x) sa somme, o x appartient un certain intervalle I : la srie de fonctions n>0 fn
converge simplement sur I (vers S).
On se demande alors si la convergence est meilleure.

On essaie de majorer, pour x I, le module du reste dordre p,




+

X


|S(x) Sp (x)| =
fn (x)

n=p+1

par une quantit indpendante de x, qui converge vers 0 lorsque p +.


P
Si lon y parvient sur I tout entier, alors la convergence de n>0 fn est uniforme sur I.
Sinon, on essaie de le faire sur tout segment inclus dans I. Si lon y parvient, la convergence
est uniforme sur tout segment de I.
OnPessaie de majorer, pour x I et n N, |fn (x)| par un terme n indpendant de x, et tel
que n>0 n converge.
P
Si lon y parvient sur I tout entier, alors la convergence de n>0 fn est normale sur I.
Sinon, on essaie de le faire sur tout segment inclus dans I. Si lon y parvient, la convergence
est normale sur tout segment de I.
Si lune de ces deux situations a lieu, la convergence est en particulier uniforme (sur I ou sur
tout segment de I selon le cas) et donc simple sur I. On peut donc directement commencer par
la convergence normale si on a lintuition que cela va aboutir, et si cest le cas, cela remplace les
deux premiers points. Sinon, on essaie de vrifier le premier voire les deux premiers points. 
Nous sommes maintenant prts examiner la question de la rgularit, de la drivation et
de lintgration des suites et sries de fonctions. Si (fn ) est une suite de fonctions dfinies sur I,
qui converge (en un certain sens) sur I vers une fonction f , quelles conditions peut-on crire :
lim lim fn (x) = lim lim fn (x),
xa n+
n+ xa
Z b
Z b

fn (x) dx
f (x) dx, i.e.
n+

(fn ) f , i.e.
n+

lim f
n+ n

lim

n+ a


lim fn

n+

fn (x) dx =

Z b
a


lim fn (x) dx,

n+

On imagine dsormais facilement que la validit de ces galits dpend notamment du mode de
convergence de la suite (fn ) vers sa limite. On remarque aussi que chacune de ces galits revient
intervertir une limite selon n avec, soit une limite selon x, soit une intgrale, soit loprateur
de drivation. On fait donc souvent rfrence ces thormes que nous allons tudier, comme
thormes dinterversion.
137

II.
1.

Limite et continuit des suites et sries de fonctions


Thormes de continuit
Thorme Continuit pour les suites de fonctions
Soit (fn )nN une suite de fonctions dfinies sur I. On suppose que :
Pour tout n N, fn est continue sur I,
(fn ) converge uniformment sur I, ou uniformment sur tout segment de
I, vers une fonction f .
Alors f est continue sur I.

Dmonstration Il suffit de faire la dmonstration sous lhypothse de convergence uniforme sur


tout segment de I. Soit > 0 fix et a I. Pour > 0 assez petit, J = I [a ,a + ] est un
segment de I. Pour tout x J, on a
|f (x) f (a)| 6 |f (x) fn (x)| + |fn (x) fn (a)| + |fn (a) f (a)|.
Par convergence uniforme de (fn ) vers f sur J, il existe n0 N tel que pour tout n > n0 ,
sup |fn (x) f (x)| 6 .
xJ

Alors, pour tout x J,


|f (x) f (a)| 6 |f (x) fn0 (x)| + |fn0 (x) fn0 (a)| + |fn0 (a) f (a)|
6 + |fn0 (x) fn0 (a)| + .

La fonction fn0 tant continue en a, il existe > 0 tel que pour tout x I vrifiant |x a| 6 ,
on ait x J et |fn0 (x) fn0 (a)| 6 . Dans ces conditions, on a |f (x) f (a)| 6 3, do la
continuit de f en a, et ce pour tout a I. Donc f est continue sur I.


Remarque Ce thorme donne aussi un moyen efficace pour montrer quune suite de fonctions
ne converge pas uniformment : par contraposition, on en dduit en effet que, si la limite simple
de la suite (fn ) nest pas continue en un point a de I alors que chacune des fonctions fn est
continue sur I, alors la convergence de (fn ) vers f nest pas uniforme sur I, ni uniforme sur tout
segment de I. Cet argument sapplique par exemple la suite des fonctions fn : x 7 xn sur [0,1],
avec a = 1.
Pour les sries de fonctions, ce thorme prend la forme suivante :
Thorme Continuit pour les sries de fonctions
P
Soit n>0 fn une srie de fonctions dfinies sur I. On suppose que :

Pour tout n N, fn est continue sur I,


X

fn converge uniformment sur I, ou uniformment sur tout segment


n>0

de I.
+
X
fn est continue sur I.
Alors
n=0

+
X
1
est continue sur ]1, + [.
nx
n=1
En effet, la srie de fonctions associe converge normalement sur tout segment (et donc unifor1
mment sur tout segment) de ]1, + [ et pour tout n, la fonction x 7 x est continue sur
n
]1, + [.

Exemple La fonction de Riemann x 7

138

2.

Passages la limite
Thorme de la double limite (admis : dmonstration hors programme)
Soit (fn ) une suite de fonctions dfinies sur I, et a une extrmit de I, ventuellement
infinie. On suppose que :
Pour tout n N, fn possde une limite finie n en a,
(fn ) converge uniformment sur I vers une fonction f .

Alors :

La suite (n ) converge,
La fonction f possde une limite en a, et lim f (x) = lim n , i.e.
xa

n+

lim lim fn (x) = lim lim fn (x).

xa n+

n+ xa

Pour les sries de fonctions, ce thorme prend la forme suivante :


Thorme Interversion limite/somme (admis : dmonstration hors programme)
P
Soit n>0 fn une srie de fonctions dfinies sur I et a une extrmit de I, ventuellement infinie. On suppose que :
Pour tout n N, fn possde une limite finie n en a.
P

n>0 fn converge uniformment sur I.

Alors :

La srie

n>0 n
+
X

La fonction

converge,

fn possde une limite en a, et lim

xa

n=0

lim

xa

+
X

fn (x) =

+
X

n=0

n=0

Exemple Dans le cas de la fonction de Riemann,

+
X

fn (x) =

n=0

+
X

n , i.e.

n=0

lim fn (x).

xa

+
X
1
1.
nx x+

n=1

En effet, la srie de fonctions associe converge normalement sur tout intervalle de la forme
[a, + [ avec a > 1, donc par exemple sur [2, + [ dont + est une extrmit, et pour tout
1
n > 2, la fonction x 7 x converge vers 0 lorsque x +, la limite tant gale 1 pour n = 1.
n
Attention !
Dans lexemple prcdent, il est essentiel de vrifier une convergence au moins uniforme sur un
intervalle de la forme [a, + [. On ne peut se contenter de citer une convergence uniforme ou
normale sur tout segment de ]1, + [.
Dune manire gnrale, une convergence uniforme sur tout segment de I ne permet pas dappliquer ce thorme aux extrmits de I. Pour illustrer ceci, donnons lexemple de la srie gomtrique. La srie de fonctions associe converge normalement (et donc
P uniformment) sur tout
n
segment de ]1,1[ et pour tout n N, x 1. Pourtant, la srie n>0 1 diverge.
x1

Ce rsultat ne porte que sur des limites finies. Par exemple, il ne sapplique donc pas lorsque
fn (x) + pour tout n.
xa

139

III.

Intgration des suites et sries de fonctions

Thorme Interversion limite/intgrale


Soit (fn ) une suite de fonctions dfinies sur un segment [a,b]. On suppose que :
Pour tout n N, fn est continue sur [a,b],
(fn ) converge uniformment sur [a,b] vers une fonction f .

Alors

cest--dire

b
n+

lim

fn (x) dx
b

n+ a

fn (x) dx =

Z b
a

f (x) dx,
a


lim fn (x) dx.

n+

Dmonstration On sait que la fonction f , en tant que limite uniforme dune suite de fonctions
continues, est continue sur [a,b]. De plus, pour tout n N,
Z b
Z b
Z b


(fn (x) f (x)) dx 6
kfn f k dx = (b a)kfn f k .
|fn (x) f (x)| dx 6


a

Par convergence uniforme de (fn ) vers f sur [a,b], kfn f k 0, et donc


Z

(fn (x) f (x)) dx 0,


n+

do le rsultat par linarit de lintgrale.

Contre-exemple La conclusion est fausse en gnral sous lhypothse de convergence simple,


comme le montre lexemple de la suite des fonctions fn dfinies sur [0,1], pour n > 2, par

si x [0,1/n]
n x
1
2
fn (x) = n (x n ) + n si x [1/n,2/n]

0
sinon.

Cf

1/n

On montre facilement que (fn ) converge simplement vers la fonction nulle sur [0,1], et pourtant, pour tout n > 2,
Z 1
fn (x) dx = 1.
0

On ne peut donc pas intervertir limite et intgrale dans ce cas.


140

Pour les sries de fonctions, on obtient :


Thorme Intgration terme terme des sries de fonctions
P
Soit n>0 fn une srie de fonctions dfinies sur un segment [a,b]. On suppose que :
Pour tout n N, fn est continue sur [a,b],
P

n>0 fn converge uniformment sur [a,b].


XZ b
fn (x) dx converge et
Alors la srie
n>0 a

+ Z
X

fn (x) dx =

n=0 a

+
X

b
a

fn (x)

n=0

dx.

Exemple On veut prouver la convergence et calculer la somme de la srie


X1
(en e2n ).
n
n>1

On remarque que, pour tout n

N ,

1 n
(e e2n ) =
n
N ,

enx dx.

On dfinit donc, pour tout n


la fonction fn : x 7 enx .
P
Pour tout n N , fn est continue sur [1,2]. De plus, la srie n>1 fn converge normalement (et
en particulier uniformment) sur [1,2] car pour tout n N et x [1,2],
0 6 enx 6 en ,

P
la srie n>1 en , indpendante de x, tant convergente (srie gomtrique de raison 1/e avec
R2
P
|1/e| < 1). Daprs le thorme dintgration terme terme, la srie n>1 1 enx dx converge
et
!
Z 2 X
+
+ Z 2
X
enx dx.
enx dx =
1

n=1 1

Or, pour tout x [1,2], on a

+
X

enx =

n=1

n=1

ex
1 ex

(somme dune srie gomtrique de raison ex avec |ex | < 1). On vient donc de montrer la
convergence de la srie tudie, avec
Z 2
+
X

2
ex
1 n
(e e2n ) =
dx = ln(1 ex ) 1 = ln(1 + e) 1
x
n
1 1e
n=1
aprs simplifications. Finalement :

+
X
1 n
(e e2n ) = ln(1 + e) 1.
n

n=1

Le thorme dintgration terme terme permet de calculer des sommes de sries non triviales.
Remarque On peut montrer (galement par intgration terme terme par exemple) que pour
tout x ]1,1[,
+ n
X
x
= ln(1 x).
n
n=1

Cela permet de retrouver le rsultat ci-dessus (en utilisant cette galit avec x = 1/e et x = 1/e2 ).
141

IV.
1.

Drivation des suites et sries de fonctions


Thormes sur la classe C 1

La convergence uniforme semble un mode de convergence efficace qui permet de conserver


les proprits des fonctions fn . Pourtant, elle ne suffit pas ds lors que lon souhaite
driver une
q
1
2
limite de suite ou srie de fonctions. En effet, la suite des fonctions fn : x 7 x + n , toutes de
classe C , converge uniformment vers la fonction valeur absolue sur R, qui nest pas drivable
en 0.
Thorme Classe C 1 pour les suites de fonctions
Soit (fn ) une suite de fonctions dfinies sur I. On suppose que :
Pour tout n N, fn est de classe C 1 sur I,
(fn ) converge simplement vers une fonction f sur I,
(fn ) converge uniformment sur I, ou uniformment sur tout segment de
I, vers une fonction g.
Alors f est de classe C 1 sur I et f = g.
Dmonstration Fixons a I. Pour tout x I et n N, on a
Z x
fn (t) dt,
fn (x) = fn (a) +
a

car fn est de classe C 1 . Or, (fn ) converge simplement vers f sur I, donc
fn (x) f (x) et fn (a) f (a).
n+

n+

De plus, g tant limite uniforme sur tout segment de la suite de fonctions continues (fn ), daprs
le thorme dinterversion limite/intgrale, on a, pour tout x I,
Z x
Z x

g(t) dt.
fn (t) dt
n+

Finalement, lorsque n tend vers +, on obtient, pour tout x I,


Z x
f (x) = f (a) +
g(t) dt.
a

Ceci entrane que f est de classe

C1

sur I avec

= g.

Remarque Lhypothse forte du thorme porte sur les drives des fn , et pas sur les fonctions
elles-mmes. Il est indispensable de prouver la convergence uniforme sur tout segment pour (fn ),
mais il est inutile de prouver la convergence uniforme de (fn ) : une convergence simple suffit.
Pour les sries, on a le rsultat suivant :
Thorme Drivation terme terme des sries de fonctions
P
Soit n>0 fn une srie de fonctions dfinies sur I. On suppose que :
Pour tout n N, fn est de classe C 1 sur I,
X

fn converge simplement sur I.


n>0

fn converge uniformment sur I, ou uniformment sur tout segment

n>0

de I.
Alors la fonction

+
X

n=0

fn est de classe C 1 sur I et

142

+
X

n=0

fn

+
X

n=0

fn .

Exemples
Compltons ltude de la fonction de Riemann : la convergence simple de la srie a t tablie
plus haut (on a mme montr une convergence normale sur tout intervalle [a, + [ avec a > 1).
Pour tout n > 1, la fonction
1
fn : x 7 x = exp(x ln(n))
n
1
est de classe C sur ]1, + [ et pour tout x > 1,
fn (x) = ln(n) exp(x ln(n)) =

ln(n)
.
nx

Montrons que la srie des drives converge normalement sur tout intervalle [a, + [ avec a > 1.
Pour tout x > a, pour tout n > 1,


ln(n) ln(n)


nx 6 na .
Il suffit donc dtablir la convergence de la srie

X ln(n)
na

n>1

ln(n)
ln(n)
= a 0
a
n+
n
n

par croissances compares, car a > 0. Ainsi


ln(n)
=o
na
Or, la srie
rsultat.

. Or, en fixant ]1,a[, on a

1
n

X 1
converge car > 1. Par comparaison de sries termes positifs, on obtient le
n

n>1

Finalement, on a montr que la fonction de Riemann est de classe C 1 sur ]1, + [ avec,
pour tout x > 1,
+
X
ln(n)

(x) =
.
nx
n=1

En particulier, est strictement dcroissante sur ]1, + [.


Considrons la srie

(1)n

n>0

x2n+1
2n + 1

pour x ]1,1[. Pour tout n N, la fonction


fn : x 7 (1)n

x2n+1
2n + 1

est de classe C 1 sur ]1,1[. Pour x = 0, tous les termes de la srie sont nuls. Pour tout x ]1,1[
diffrent de 0, pour tout n N,

2n+3

x
/(2n
+
3)
2 2n + 1


|x|2 < 1.
x2n+1 /(2n + 1) = |x| 2n + 3 n+

Daprs le critre de dAlembert, la srie converge simplementP


(et absolument) sur ]1,1[. De
n
2n

plus, pour tout n N et x ]1,1[, fn (x) = (1) x . La srie n>0 fn converge uniformment
(et mme normalement) sur tout segment de ]1,1[, car il sagit de la srie gomtrique de raison
x2 . Daprs le thorme de drivation terme terme, on sait donc que la fonction somme
S : x 7

+
X

(1)n

n=0

143

x2n+1
2n + 1

est de classe C 1 sur ]1,1[, et pour tout x ]1,1[,

S (x) =

+
X

1
1
=
.
1 (x2 )
1 + x2

(1)n x2n =

n=0

On reconnat la drive de la fonction arctan. Sachant que lon travaille sur un intervalle, on en
dduit quil existe une constante k telle que pour tout x ]1,1[,
+
X

(1)n

n=0

x2n+1
= arctan(x) + k.
2n + 1

En valuant cette relation en x = 0, on obtient k = 0. On a donc montr que pour tout x ]1,1[,
arctan(x) =

+
X

(1)n

n=0

x2n+1
.
2n + 1

On remarque que les premiers termes de la somme forment les dveloppements limits de arctan
en 0. Lgalit prcdente sappelle un dveloppement en srie entire de la fonction arctan sur
]1,1[ (voir le chapitre Sries entires).

2.

Thormes sur la classe C k

Pour la classe C k (k > 2), on peut bien sr raisonner par rcurrence partir des thormes
de la classe C 1 . On admettra que cela conduit aux thormes suivants, que lon pourra appliquer
directement :
Thorme Classe C k pour les suites de fonctions
Soit (fn ) une suite de fonctions dfinies sur I. On suppose que :
Pour tout n N, fn est de classe C k sur I,
(fn )nN converge simplement vers une fonction f sur I,
(j)

Pour 1 6 j 6 k 1, (fn )nN converge simplement vers une fonction gj sur I,


(k)

(fn )nN converge uniformment sur tout segment de I vers une fonction
gk .
Alors f est de classe C k sur I et pour tout j [[1,k]], f (j) = gj .

Thorme Classe C k pour les sries de fonctions


P
Soit n>0 fn une srie de fonctions dfinies sur I. On suppose que :
Pour tout n N, fn est de classe C k sur I,
P

n>0 fn converge simplement sur I,


P
(j)
Pour 1 6 j 6 k 1, n>0 fn converge simplement sur I.
P
(k)

n>0 fn converge uniformment sur tout segment de I.

Alors la fonction

+
X

n=0

fn est de classe C k sur I et pour tout j [[1,k]],


+
X

n=0

fn

!(j)

144

+
X

n=0

fn(j).

Chapitre 7

Drivation et intgration des fonctions


de R dans K
Dans ce chapitre, sauf indication contraire, [a,b] dsigne un segment de R (avec a < b), et I
un intervalle de R. Sauf prcision, les fonctions considres sont valeurs dans K = R ou C.
Les parties I, II, III et VI rassemblent des rappels de certains rsultats fondamentaux de drivation et dintgration du cours de premire anne. La partie IV tend une classe plus gnrale
de fonctions lintgration des fonctions continues sur un segment, tudie en premire anne. La
partie V rappelle et/ou gnralise un certain nombre de mthodes de calculs dintgrales.

I.

Thorme de Rolle et accroissements finis


Thorme de Rolle
Soit f : [a,b] R une fonction continue sur [a,b], drivable sur ]a,b[, telle que
f (a) = f (b).
Alors il existe c ]a,b[ tel que f (c) = 0.

Dmonstration Si f est constante, le rsultat est vrai et tout lment c de ]a,b[ convient. La
fonction f est continue sur le segment [a,b], elle est donc borne et atteint ses bornes. Si f nest
pas constante, et si par exemple elle prend une valeur strictement suprieure f (a), alors elle
atteint un maximum en un point not c ]a,b[. Alors, pour tout t [a,b], f (t) 6 f (c) et donc,
pour t [a,c[,
f (t) f (c)
> 0.
tc

Lorsque t c , on en dduit que f (c) > 0. De mme, pour t ]c,b],


f (t) f (c)
6 0.
tc

Lorsque t c+ , on en dduit que f (c) 6 0, do finalement f (c) = 0. On procde de mme si


f prend une valeur strictement infrieure f (a), en considrant le minimum de f .

Thorme galit des accroissements finis
Soit f : [a,b] R une fonction continue sur [a,b], drivable sur ]a,b[.
Alors il existe c ]a,b[ tel que
f (b) f (a) = f (c)(b a).

145

Dmonstration Soit
g : x 7 f (x) f (a)

f (b) f (a)
(x a).
ba

Alors g est continue sur [a,b], drivable sur ]a,b[ de mme que f , et g(a) = g(b) = 0. Daprs le
thorme de Rolle, il existe c ]a,b[ tel que g (c) = 0, i.e.,
f (c)

f (b) f (a)
= 0.
ba

On en dduit le rsultat.

Contre-exemple Le rsultat du thorme de Rolle et lgalit des accroissements finis sont faux
en gnral si f est valeurs dans C, ou valeurs vectorielles : par exemple, la fonction

[0,2] C
f:
t 7 eit
est continue et drivable sur [0,2], et f (0) = 1 = f (2). Pourtant, pour tout t [0,2],
f (t) = ieit 6= 0.
Thorme Ingalit des accroissements finis, cas rel
Soit f : I R une fonction drivable sur I. On suppose quil existe une constante
M > 0 telle que pour tout t I,
|f (t)| 6 M.
Alors f est M -Lipschitzienne sur I : pour tout (x,y) I 2 ,
|f (x) f (y)| 6 M |x y|.
Dmonstration Soit (x,y) I 2 tel que x < y. La fonction f est continue sur [x,y], drivable sur
]x,y[, donc daprs lgalit des accroissements finis, il existe c ]x,y[ tel que
f (y) f (x) = f (c)(y x).
Alors
|f (x) f (y)| = |f (c)| |x y| 6 M |x y|
daprs lhypothse sur f . On procde de mme si x > y en raisonnant sur [y,x], et le rsultat
est vident si x = y.

Corollaire Drivation et fonctions constantes
Soit f : I K une fonction drivable. On rappelle que I est un intervalle.
Pour que f soit constante sur I, il faut et il suffit que f = 0.
Dmonstration Il est vident que pour que f soit constante, il faut et il suffit que les parties
relle et imaginaire de f (qui sont valeurs relles) soient constantes. Or, ces deux fonctions sont
drivables sur I, et on a f = Re(f ) + i Im(f ) . Il suffit donc de prouver le rsultat pour une
fonction g : I R drivable. Or, pour une telle fonction, si g est nulle, alors daprs lingalit
des accroissements finis, pour tout (x,y) I 2 ,
|g(x) g(y)| 6 0 (x y) = 0,
et donc g(x) = g(y). Ceci est vrai pour tout (x,y) I 2 , donc g est constante. La rciproque est
vidente : une fonction constante a une drive nulle.

146

Thorme Drivation et monotonie


Soit f : I R une fonction drivable. Alors :
f est croissante si et seulement si f > 0 sur I.
Si f > 0 sur I et si les zros de f sont en nombre fini, ou forment une suite, alors f
est strictement croissante sur I.
Dmonstration
Si f est croissante, alors pour tout a I et x I distinct de a,
f (x) f (a)
> 0.
xa
Lorsque x a, on obtient f (a) > 0.

Rciproquement, si f > 0, alors pour tout (x,y) I 2 tel que x < y, daprs lgalit des
accroissements finis, il existe c ]x,y[ tel que f (x) f (y) = f (c)(x y). On en dduit que x y
et f (x) f (y) sont de mme signe : f est croissante.
On sait daprs le premier point que f est croissante. Si elle ntait pas strictement croissante,
il existerait a et b dans I tels que a < b et f (a) = f (b). Alors f est ncessairement constante
sur [a,b], et donc pour tout x [a,b], f (x) = 0. Ceci est impossible car les zros de f sont en
nombre fini ou forment une suite.

Thorme Limite de la drive
Soit f : I K une fonction continue sur I et drivable sur I \ {a}, telle que f admet
une limite en a (ventuellement infinie lorsque K = R). Alors
f (x) f (a)
.
xa
xa
x6=a
En particulier, si K, alors f est drivable en a et f (a) = .
Dmonstration
Premier cas : K. Daprs la caractrisation de la limite et de la drivabilit laide des
parties relle et imaginaire, on se ramne en fait K = R. Dfinissons sur I la fonction
g : x 7 f (x) f (a) (x a).
La fonction g est continue sur I, drivable sur I \ {a} avec, pour tout x I \ {a},
g (x) = f (x) .
Par hypothse, g a donc pour limite 0 en a. Fixons > 0 ; il existe > 0 tel que pour tout
t (I \ {a}) [a ,a + ], |g (t)| 6 . Soit x (I \ {a}) [a ,a + ]. Daprs lgalit des
accroissements finis, il existe c strictement compris entre a et x, tel que g(x)g(a) = g (c)(xa),
et alors on a |g (c)| 6 , do
|g(x) g(a)| 6 (x a),
puis





f (x) f (a) (x a) g(x) g(a)
f (x) f (a)






=
= x a 6 .
xa
xa

On a donc montr que

f (x) f (a)
,
xa
xa
x6=a

f est donc drivable en a avec f (a) = .


147

Deuxime cas : K = R et = . On adapte la dmonstration prcdente avec g = f


et en traduisant les limites infinies (il est indispensable alors de raisonner avec lgalit des
accroissements finis, afin de pouvoir minorer la valeur absolue du taux daccroissement, et non
pas avec lingalit).

Remarques
Ce thorme ne permet pas de prolonger par continuit la fonction f sur I : une fois la fonction
f dfinie sur I, si a I, lventuelle drivabilit de f en a est fixe. Si f est drivable en a, ce
thorme est lun des moyens de le prouver, mais ce que lon prouve est que f (a) est dfini.
Une fonction f peut tre drivable sur I sans que f ait pour limite f (a) en tout point a I.
Par exemple, la fonction

]0,1] R
 
1
f:
2
x 7 x sin

x
prolonge par continuit en 0 avec f (0) = 0, est drivable droite en 0 car
 
1
f (x) f (0)
= x sin
0.
x
x x0+

La fonction f est galement drivable sur ]0,1] (par produit et composition) et pour tout x ]0,1],
 
 
1
1

f (x) = 2x sin
cos
.
x
x
Le premier terme tend vers 0, mais le second na pas de limite lorsque x 0+ , donc f na pas
de limite en 0.
Il y a donc une diffrence importante entre la drivabilit et la classe C 1 .

II.

Drives dune bijection rciproque

Dans cette partie, les fonctions sont valeurs relles. Rappelons, sans dmonstration, le
rsultat suivant de premire anne :
Thorme
Soit f : I R une fonction continue et strictement monotone sur I.
Alors f ralise une bijection de I sur lintervalle f (I), et sa rciproque f 1 est continue
et strictement monotone sur f (I), de mme monotonie que f .
Concernant la drivabilit, on a le rsultat suivant :
Thorme
Soit f : I R une fonction drivable et strictement monotone sur I.
Soit a I tel que f (a) 6= 0.
Alors f 1 est drivable en f (a) et
(f 1 ) (f (a)) =

1
f (a)

Dmonstration Notons b = f (a). Pour y dans f (I) avec y 6= b, on a


f 1 (y) f 1 (b)
f 1 (y) f 1 (b)
=
,
yb
f (f 1 (y)) f (f 1 (b))
148

que lon peut voir comme un quotient de la forme


xa
f (x) f (a)
avec x = f 1 (y). Or, lorsque y b, f 1 (y) f 1 (b) = a par continuit de f 1 ; f tant
drivable en a avec f (a) 6= 0, on a

et donc, par composition de limites,

1
xa

f (x) f (a) xa f (a)

f 1 (y) f 1 (b)
1
.
yb f (a)
yb
On en dduit que f 1 est drivable en b = f (a) avec
(f 1 ) (f (a)) =

1
f (a)

Corollaire
Soit f : I R une fonction drivable telle que f soit de signe constant sur I (sans
annulation).
Alors f ralise une bijection de I sur lintervalle f (I), et f 1 est drivable sur f (I)
avec
1
(f 1 ) =
.
f f 1
Dmonstration La fonction f est drivable sur I et f est de signe constant sur I, donc f est
strictement monotone sur I et le thorme prcdent sapplique. On sait notamment que pour
tout b f (I), en notant a = f 1 (b), on a
(f 1 ) (b) = (f 1 ) (f (a)) =

1
1
= 1
,
f (a)
f (f (b))

do la formule annonce.

Enfin, on peut gnraliser ces rsultats la classe C k :


Thorme
Soit f : I R une fonction de classe C k (k N ) telle que f ne sannule pas.
Alors f 1 est de classe C k sur f (I).
Dmonstration Tout dabord, f est continue et ne sannule pas sur lintervalle I, donc f est
de signe constant sur I et le corollaire prcdent sapplique. Pour la classe C k , on raisonne par
rcurrence : si f est de classe C 1 sur I, f est continue sur I, donc daprs la formule ci-dessus et
par composition, f 1 est de classe C 1 sur f (I). Si f est de classe C k+1 sur I, et si le rsultat est
vrai lordre k, alors (f 1 ) est de classe C k sur f (I) comme inverse dune compose de fonctions
de classe C k ne sannulant pas. Donc f 1 est de classe C k+1 sur f (I).

i h
Exemple La fonction tangente ralise une bijection strictement croissante de ,
sur son
2 2
i h
image R. Sa bijection rciproque est la fonction arctan : R , . On sait alors que pour
2 2
tout x R,
1
1
1
=
=
.
arctan (x) =

2
tan (arctan(x))
1 + tan (arctan(x))
1 + x2

149

III.
1.

Intgration sur un segment des fonctions continues :


quelques rappels
Primitives, intgrale fonction de ses bornes

Dfinition
Soient f : I K une fonction continue et g : I K une fonction.
On dit que g est une primitive de f sur I si g est de classe C 1 sur I et g = f .

Proprit
Soient g et h deux primitives dune fonction f continue sur un intervalle I, valeurs
dans K. Alors il existe k K tel que pour tout x I, g(x) = h(x) + k.
Dmonstration La fonction g h est de classe C 1 sur I et vrifie (g h) = 0, donc g h est
constante sur lintervalle I.

On sait donc quil existe au plus une primitive de f sur I prenant en un point donn une
valeur donne. On se pose maintenant la question de lexistence. Soit f : I K une fonction
continue et a I. On peut alors dfinir la fonction

I K
Z x
Fa :
f (t) dt
x 7
a

Thorme

Soit f : I K une fonction continue.


Soit a I. La fonction Fa est de classe C 1 sur I. Cest lunique primitive de f sur I
qui sannule en a.
Soit a I et b K. Il existe une unique primitive de f sur I qui prend la valeur b en
a. Il sagit de la fonction x 7 Fa (x) + b.
Si g est une primitive de f sur I, alors pour tout segment [a,b] de I, on a
Z

b
a

f (t) dt = g(b) g(a), not [g(t)]ba .

Dmonstration
Soit c I et > 0 fix. Par continuit de f en c, il existe > 0 tel que pour tout
t I [c ,c + ], |f (t) f (c)| 6 . Soit x I [c ,c + ]. Alors, pour tout t compris entre c et x, |f (t) f (c)| 6 . On value alors
Z x
Z x




|Fa (x) Fa (c) (x c)f (c)| = [f (t) f (c)] dt 6
|f (t) f (c)| dt 6 |x c|.
c

Si de plus x 6= c, on a donc




Fa (x) Fa (c)

f (c) 6 .

xc

On en dduit que Fa est drivable en c avec Fa (c) = f (c), et ce pour tout c I. De plus, la
fonction f tant continue, Fa est de classe C 1 : Fa est donc une primitive de f sur I. Elle sannule
en a, et on a dj prouv quil y a unicit dune telle fonction.
Cest maintenant immdiat : cette fonction convient, et on sait quil y a unicit.
150

Soit g une primitive de f sur I et [a,b] un segment de I. Daprs le point prcdent, g = Fa +g(a)
et donc
Z b
f (t) dt = Fa (b) = g(b) g(a).

a

Corollaire
Si f : I K est de classe C 1 , alors pour tout (a,b) I 2 ,
Z

b
a

f (t) dt = f (b) f (a).

Dmonstration La fonction f est une primitive de la fonction continue f . Le rsultat vient donc
du troisime point du thorme prcdent (y compris si b 6 a, car dans ce cas on se ramne au
cas prcdent quitte considrer f ).


En application de ce rsultat, on montre facilement lingalit des accroissements finis pour


les fonctions valeurs complexes :
Thorme Ingalit des accroissements finis, cas complexe
Soit f : I C une fonction de classe C 1 sur I. On suppose quil existe une constante
M > 0 telle que pour tout t I,
|f (t)| 6 M.
Alors f est M -Lipschitzienne sur I : pour tout (x,y) I 2 ,
|f (x) f (y)| 6 M |x y|.
Dmonstration Soient x et y dans I tels que x < y ; f est de classe C 1 sur [x,y], donc on peut
crire, daprs le corollaire prcdent,
Z y



|f (y) f (x)| =
f (t) dt .
x

Sachant que

|f (t)|

6 M pour tout t [x,y], on a aussi


Z y
Z y


|f (t)| dt 6 M (y x).
f (t) dt 6

x

On en dduit le rsultat. On procde de mme si x > y en raisonnant sur [y,x], et le rsultat est
vident si x = y.
Remarques
Bien sr, ce thorme sapplique aussi au cas rel : ses hypothses sont plus fortes que lingalit
donne dans le cas rel.
En revanche, la dmonstration du thorme dans le cas rel ne peut pas tre adapte au cas
complexe : elle repose sur lgalit des accroissements finis, et donc sur le thorme de Rolle,
dont le rsultat est faux en gnral pour les fonctions valeurs complexes. Cela explique les
hypothses plus fortes donnes dans le thorme ci-dessus.

2.

Sommes de Riemann

Soit f : [a,b] K une fonction. On dfinit, pour tout entier n > 1,



n1 
ba
ba X
f a+k
.
Sn =
n
n
k=0

Ces quantits sont appeles sommes de Riemann associes f sur [a,b]. On a alors :
151

Thorme
Soit f : [a,b] R une fonction continue. Alors
Sn

n+

f (x) dx.
a

Dmonstration dans le cas o f est de classe C 1


On notera, pour tout k N,

ba
;
n
ainsi (a0 , . . . ,an ) est la subdivision rgulire de [a,b] n + 1 points (i.e., ak+1 ak est constant
gal (b a)/n).
ak = a + k

La fonction f est continue sur le segment [a,b], elle est donc borne par une certaine constante
M > 0. Daprs lingalit des accroissements finis, f est M -Lipschitzienne sur [a,b]. Alors pour
tout n > 1, daprs la relation de Chasles notamment, on a

Z b
n1 Z a
n1

X
k+1

X
b

a


=
f
(x)
dx

S
f
(x)
dx

f
(a
)

n
k



n
a
k=0 ak
k=0


Z ak+1
n1

X

=
(f (x) f (ak )) dx


ak
6

k=0
n1
X Z ak+1
k=0

ak

|f (x) f (ak )| dx.

Or f est M -Lipschitzienne sur [a,b], donc pour tout k [[0,n 1]], pour tout x [ak ,ak+1 ],
|f (x) f (ak )| 6 M |x ak | = M (x ak ).
Ainsi

Z b
n1
XZ




f (x) dx Sn 6 M

a

=M

=M

ak+1

k=0 ak
n1
X
k=0
n1
X
k=0

(x ak ) dx

(x ak )2
2

ak+1
ak

(ak+1 ak )2
(b a)2
(b a)2
=Mn
=
M
0.
n+
2
2n2
2n

Remarque Les
R b sommes de Riemann correspondent un cas particulier de lapproximation
numrique de a f (x) dx par la mthode des rectangles.

Exemple Soit, pour tout n > 1, xn =

n1
X
k=0

1
. En rcrivant
n+k

n1
1 X 1
xn =
n
1+
k=0

k
n

on voit que les xn sont les sommes de Riemann associes la fonction f : x 7


La fonction f tant continue sur [0,1], on sait donc que
Z 1
1
dx = ln(2).
xn
n+ 0 1 + x
152

1
sur [0,1].
1+x

IV.
1.

Intgrale sur un segment des fonctions continues


par morceaux
Dfinitions

Dfinition Fonction continue par morceaux


Soit f : [a,b] K une fonction. On dit que f est continue par morceaux sil existe
une subdivision (a0 , . . . ,ap ) (p > 1) de [a,b] telle que :
a = a0 < a1 < < ap = b.
Pour tout i [[0,p 1]], f| ]ai ,ai+1 [ est la restriction ]ai ,ai+1 [ dune fonction
continue sur [ai ,ai+1 ].
Le (p + 1)-uplet (a0 , . . . ,ap ) est appel subdivision de [a,b] subordonne (ou adapte)
f. Il nest pas unique.
Si f est dfinie sur un intervalle I, on dit que f est continue par morceaux si sa
restriction tout segment de I est une fonction continue par morceaux.
Remarque Le rel
max (ai+1 ai )

i[[0,p1]]

est appel pas de cette subdivision. Il est strictement positif, cest le plus grand cart entre deux
lments conscutifs de la subdivision.
On dit que la subdivision est rgulire si lcart ak+1 ak , pour k [[0,p 1]], est constant.

Voici un exemple de graphe dune fonction continue par morceaux sur un segment [a,b]
valeurs dans R. Les points pais permettent de reprer la valeur prise par la fonction aux points
de discontinuit.

b
b

a = a0

a1

Exemples
La fonction f dfinie sur R+ par

ex
0

si x > 0
si x = 0

(
1/x
g(x) =
0

si x > 0
si x = 0

f (x) =
est continue par morceaux sur R+ .
La fonction g dfinie sur R+ par

a2

a3 = b

est continue sur R+ mais nest pas continue par morceaux sur R+ : f na pas de limite finie
droite en 0.
La fonction h dfinie sur R+ par
(
x 1/x si x > 0
h(x) =
1
si x = 0
153

nest pas continue par morceaux sur R+ : elle a une infinit de points de discontinuit dans ]0,1].
En revanche, elle est continue par morceaux sur R+ .
Remarques
La deuxime condition de la dfinition quivaut chacune des proprits suivantes :

Pour tout i [[0,p 1]], f|]ai ,ai+1 [ est prolongeable par continuit sur le segment [ai ,ai+1 ].
Pour tout i [[0,p 1]], f est continue sur ]ai ,ai+1 [, f possde une limite finie droite en
ai , et une limite finie gauche en ai+1 .

Une fonction continue par morceaux sur un segment est borne.

Les limites de f en ai ne sont pas ncessairement gales f (ai ) ; f peut tre discontinue en
chaque point ai .
Avec les notations prcdentes, si f est continue en un certain ai0 ]a,b[, alors on peut enlever
ai0 de la subdivision (a0 , . . . ,ap ) pour obtenir une subdivision de [a,b] encore adapte f . En
faisant cela pour tous les points de la subdivision qui appartiennent ]a,b[ et qui sont des points
de continuit de f , on construit une subdivision de [a,b] adapte f dont les points sont a, b, et
les points de discontinuit de f dans ]a,b[. Une telle subdivision est unique, elle est, en un certain
sens, minimale.

Proprit
Lensemble des fonctions continues par morceaux sur I valeurs dans K est un K-espace
vectoriel.

Dmonstration La fonction nulle est videmment continue par morceaux. Si f est continue par
morceaux sur I, et si K, alors toute subdivision adapte f dun segment de I est aussi
adapte f , qui est ainsi continue par morceaux sur I. Enfin, soient f et g deux fonctions continues par morceaux sur I, et soit [a,b] un segment de I. On se donne une subdivision (a0 , . . . ,ap )
de [a,b] adapte f , une subdivision (b0 , . . . ,bm ) de [a,b] adapte g. On construit alors une
subdivision adapte la fois f et g en plaant les nombres a0 , . . . ,ap , b0 , . . . ,bm par ordre croissant, et en enlevant les rptitions. On en dduit que f + g est continue par morceaux sur [a,b],
cette nouvelle subdivision de [a,b] tant adapte f + g. Ceci est valable pour tout segment de I,
donc f + g est continue par morceaux sur I. Finalement, lensemble des fonctions continues par
morceaux sur I valeurs dans K est un sous-espace vectoriel de lespace vectoriel des fonctions
de I dans K.

On admettra que lon peut adapter la construction de lintgrale sur un segment, faite en
premire anne pour les fonctions continues, au cadre des fonctions continues par morceaux. Si
f : [a,b] K est une fonction continue par morceaux, son intgrale est toujours note
Z

f (x) dx,
a

[a,b]

ou

f.

Si f est continue par morceaux sur I, elle est continue par morceaux sur tout segment de I, et
donc on peut dfinir son intgrale sur tout segment de I.

2.

Proprits de lintgrale

Les proprits de lintgrale des fonctions continues sur un segment se gnralisent aux fonctions continues par morceaux. Nous donnons ici, souvent sans dmonstration, ces proprits.
154

Proprit Linarit de lintgration


Soient f et g deux fonctions continues par morceaux sur [a,b] valeurs dans K, et
K.
Alors
Z b
Z b
Z b
(f + g) =
f+
g.
a

Proprit Relation de Chasles


Soit f : [a,b] K une fonction continue par morceaux et c [a,b].
Alors, les restrictions de f [a,c] et [c,b] sont continues par morceaux et
Z

f=
a

f+
a

f.
c

Proprit Positivit et croissance de lintgrale


Soit f : [a,b] R+ une fonction continue par morceaux valeurs relles positives.
Z b
f > 0.
Alors
a

Soient f et g deux fonctions continues par morceaux sur [a,b] valeurs relles, telles
Z b
Z b
g.
f6
que f 6 g sur [a,b]. Alors
a

Proprit
Soit f : [a,b] K une fonction continue par morceaux.
Alors la fonction |f | : x 7 |f (x)| est continue par morceaux et
Z b Z b



f 6
|f |.

a

Remarque Soit f : [a,b] K une fonction continue par morceaux. Alors


Z b
Z b
Z b



6
f
(x)
dx
kf k dx = (b a)kf k .
|f
(x)|
dx
6


a

Z b
1
f (x) dx est appel valeur moyenne de f sur [a,b]. Lingalit prcdente,
ba a
quil faut absolument savoir redmontrer pour majorer des intgrales, est appele ingalit de la
moyenne.

Le vecteur

Proprit
Soient f et g deux fonctions continues par morceaux sur [a,b] valeurs dans K, qui
Z b
Z b
g.
f=
concident sauf en un nombre fini de points. Alors
a

En particulier, lintgrale dune fonction continue par morceaux f nest pas modifie si lon
change les valeurs de f en un nombre fini de points.
155

Thorme
Soit f : [a,b] R+ une fonction continue valeurs relles positives.
Z b
f (x) dx = 0.
Alors pour que f soit nulle, il faut et il suffit que
a

Dmonstration Bien sr, si f est nulle, son intgrale est nulle. Rciproquement, raisonnons par
contrapose : si f nest pas identiquement nulle, alors par continuit de f , il existe c ]a,b[ tel
que f (c) > 0, et il existe > 0 tel que [c ,c + ] [a,b] et pour tout x [c ,c + ],
|f (x) f (c)| 6 12 f (c), et en particulier f (x) > 12 f (c). Alors, daprs la relation de Chasles, la
positivit et la croissance de lintgrale,
Z c+
Z b
Z c+
Z c
Z b
1
f > 2 f (c) = f (c) > 0,
f>
f+
f+
f=
2
c
c+
c
a
a
do le rsultat.

Remarque Si f est continue par morceaux sur [a,b], positive, on en dduit en raisonnant sur
Rb
chaque morceau que, pour que a f soit nulle, il faut et il suffit que f soit nulle sauf ventuellement
en un nombre fini de points.

3.

Le cas des fonctions continues par morceaux sur un intervalle

Lorsque f est continue par morceaux sur I, si (a, b) I 2 avec a = b ou a > b, on donne
Rb
galement un sens a f (x) dx en posant respectivement
Z

f (x) dx = 0 et

f (x) dx =

f (x) dx.

La relation de Chasles reste valide, ainsi que la proprit de linarit de lintgrale. En revanche,
ds que des ingalits entrent en jeu, il faut tre vigilant sur lordre des bornes. Par exemple, la
majoration du module de lintgrale prend la forme

Z b
Z b






|f (x)| dx .
f (x) dx 6

a

Pour toute constante k telle que |f (x)| 6 k pour tout x compris entre a et b, on a

Z b



f (x) dx 6 k |b a| .

a

V.
1.

Mthodes de calculs dintgrales

Intgration par parties


Thorme Intgration par parties
Soient f et g deux fonctions de classe C 1 sur I valeurs dans K, et soit (a,b) I 2 .
Alors
Z b
Z b
f (t)g (t) dt.
f (t)g(t) dt = [f (t)g(t)]ba
a

Dmonstration La fonction f g est de classe C 1 sur I donc


Z b
Z b
Z b
Z b
b

f (t)g (t) dt,


f (t)g(t) dt +
[f (t)g(t) + f (t)g (t)] dt =
[f g] (t) dt =
[f (t)g(t)]a =
a

par linarit de lintgrale.


156

2.

Changement de variable
Thorme Changement de variable (cas continu)
Soit f : I K une fonction continue, et soit une fonction de classe C 1 sur un segment
[c,d] valeurs dans I. Alors
Z

(d)

f (x) dx =

f ((t)) (t) dt.

(c)

Remarques
On dira souvent on pose x = (t) . On comprend alors bien la formule en crivant
dx = (t) dt, mme si le sens donner cette galit nest pas vident.
En revanche, dire on pose x = (t) ne suffit pas, il y a des hypothses vrifier.

Dmonstration du thorme Soit F une primitive de f sur I (une telle primitive existe car f est
continue sur I). La fonction F est une primitive sur [c,d] de la fonction continue (f ) ,
donc
Z
Z
d

(d)

(d)

f ((t)) (t) dt = [F ((t))]dc = [F (x)](c) =

f (x) dx.

(c)

Assez souvent, on souhaite faire un changement de variable pour une fonction f continue par
morceaux. On peut donner un thorme de changement de variable dans ce cas :
Thorme Changement de variable (cas continu par morceaux)
Soit f : I K une fonction continue par morceaux, et soit une fonction de classe C 1
sur un segment [c,d] valeurs dans I, strictement monotone. Alors
Z

(d)

f (x) dx =

f ((t)) (t) dt.

(c)

Dmonstration On traite le cas o est strictement croissante, lautre cas tant similaire. Soit
(b0 , . . . , bp ) (p > 1) une subdivision de [(c),(d)] adapte la restriction de f [(c),(d)], et
soit (a0 , . . . , ap ) la subdivision de [c,d] telle que pour tout i [[0,p]], (ai ) = bi (ai existe et est
unique car est une bijection de [c,d] sur [(c),(d)], par continuit et stricte monotonie). Alors
daprs la relation de Chasles,
Z

(d)

f (x) dx =
(c)

p1 Z
X
i=0

bi+1

f (x) dx =
bi

p1 Z
X
i=0

bi+1

fi (x) dx,
bi

o fi dsigne le prolongement de f| ]bi ,bi+1 [ en une fonction continue sur [bi ,bi+1 ]. La dernire
galit vient du fait que, sur [bi ,bi+1 ], les fonctions f et fi diffrent seulement ventuellement en
bi et bi+1 . Alors, pour tout i [[0,p 1]], daprs le thorme prcdent (que lon peut appliquer
car fi est continue sur [bi ,bi+1 ] pour tout i), on a
Z

bi+1

fi (x) dx =

(ai+1 )

fi (x) dx =

(ai )

bi

ai+1

fi ((t)) (t) dt.

ai

Finalement
Z

(d)

(c)

f (x) dx =

p1 Z
X
i=0

ai+1

fi ((t)) (t) dt =
ai

p1 Z
X
i=0

157

ai+1

f ((t)) (t) dt =
ai

f ((t)) (t) dt. 

Remarque Dans la dmonstration, on voit lutilit de lhypothse de stricte monotonie de .


Pour faire la simplification
Z ai+1
Z ai+1

f ((t)) (t) dt,


fi ((t)) (t) dt =
ai

ai

on utilise le fait que les fonctions fi et f concident sur [ai ,ai+1 ], sauf peut-tre aux
points t de [ai ,ai+1 ] tels que (t) est lun des bj , car dans ce cas (t) est un point dventuelle
discontinuit de f . Or, les seuls points vrifiant cette condition sont ai et ai+1 , daprs notre
hypothse sur . Sans cette hypothse, la fonction f pourrait mme ne pas tre continue par
morceaux.

VI.

Formules de Taylor

Thorme Formule de Taylor avec reste intgral


Soit f : I K une fonction de classe C n+1 (n N). Alors pour tout (a,x) I 2 ,
f (x) =

n
X
f (k)(a)
k=0

k!

(x a) +

(x t)n (n+1)
f
(t) dt.
n!

Dmonstration On procde par rcurrence sur n. Pour n = 0, le rsultat montrer scrit


Z x
f (t) dt,
f (x) = f (a) +
a

ce qui est vrai daprs un thorme donn plus haut, f tant de classe C 1 .

Supposons le rsultat vrai pour les fonctions de classe C n+1 , et soit f : I K une fonction
de classe C n+2 . On raisonne dans le cas o a < x, les autres cas tant similaires. Lhypothse de
rcurrence pour la fonction f scrit
f (x) =

n
X
f (k) (a)
k=0

Or t 7
Z

(x t)n (n+1)
f
(t) dt.
n!

(x t)n+1
et f (n+1) sont de classe C 1 sur [a,x], donc par intgration par parties,
(n + 1)!
x

k!

(x a)k +


x Z x
(x t)n+1 (n+2)
(x t)n+1 (n+1)
(x t)n (n+1)
f
(t) dt =
f
(t) +
f
(t) dt
n!
(n + 1)!
(n + 1)!
a
a
Z x
(x a)n+1 (n+1)
(x t)n+1 (n+2)
=
f
(a) +
f
(t) dt,
(n + 1)!
(n + 1)!
a

do le rsultat au rang n + 1. Par principe de rcurrence, la formule est vraie pour tout n N.

Remarque Pour exploiter cette formule, il est souvent utile de savoir majorer le reste intgral.
Sous les hypothses prcdentes, on a pour tout (a,x) I 2 ,
f (x) =

n
X
f (k) (a)
k=0

k!

(x a) +

(x t)n (n+1)
f
(t) dt.
n!

Or, f tant de classe C n+1 , f (n+1) est continue sur le segment [a,x] (ou [x,a]), elle est donc borne
sur ce segment (car ses parties relle et imaginaire le sont), par une certaine constante M . On
158

en dduit que

Z

n

x |x t|n
X

f (k) (a)

k
(n+1)

(x a) 6
|f
(t)| dt
f (x)


k!
n!
a
k=0

Z x
n


|x

t|
dt
6 M
n!
a
n+1
|x a|
.
6M
(n + 1)!

Lavantage de la formule de Taylor avec reste intgral est dtre explicite et globale : elle donne
une information pour tout x de I. Lorsque x est proche de a, on peut donner une estimation de
f (x) sous forme de dveloppement limit. Commenons par rappeler le rsultat suivant :
Thorme Primitivation dun dveloppement limit
Soit f : I K une fonction continue. On suppose que f possde un dveloppement
limit lordre n en a I, cest--dire que lon peut crire
n
X

f (x) =

xa

k=0

k (x a)k + o((x a)n )

avec k K pour tout k [[0,n]].


Alors toute primitive g de f sur I possde un dveloppement limit lordre n + 1 en
a, avec
n
X
k
(x a)k+1 + o((x a)n+1 ).
g(x) = g(a) +
xa
k+1
k=0

Rx
Dmonstration Il suffit de prouver cette formule pour la fonction Fa : x 7 a f (t) dt vrifiant
Fa (a) = 0, toutes les autres primitives de f sen dduisant par ajout de la valeur en a. Fixons
> 0. Par dfinition dun petit o , il existe > 0 tel que pour tout x I [a ,a + ],


n


X

k

(x

a)
f
(x)

6 |x a|n .

k


k=0

Alors pour un tel x,


Z

Z
n
n
x

x
X
X





k
(x a)k+1 6
k (t a)k dt
f (t) dt
f (t)

a

a
k+1
k=0
k=0
Z x



6
|t a|n dt
a

|x a|n+1
.
6
n+1

On a donc montr que


Z

x
a

f (t) dt

n
X
k
(x a)k+1 = o((x a)n+1 ),
xa
k+1
k=0

qui est le rsultat voulu.

Remarque Ce rsultat est trs utile pour obtenir des dveloppements limits. Par exemple, on
obtient par cette mthode un dveloppement tout ordre en 0 de la fonction tangente, bas sur
la formule tan = 1 + tan2 ; on obtient des dveloppements de x 7 ln(1 + x) en 0 tout ordre
1
, trs faciles obtenir partir de la srie gomtrique
en intgrant ceux de la fonction x 7 1+x
de raison x.
159

Thorme Formule de Taylor-Young


Soit f : I K une fonction de classe C n (n N). Alors pour tout a I,
n
X
f (k) (a)

f (x) =

xa

k=0

k!

(x a)k + o((x a)n ).

Dmonstration On procde par rcurrence sur n. Pour n = 0 on reconnat la dfinition de la


continuit de f en a. Supposons le rsultat vrai pour toute fonction de classe C n . Soit f une
fonction de classe C n+1 sur I ; on peut appliquer lhypothse de rcurrence f , ce qui montre
que pour tout a I,

n
X
(f )(k) (a)

f (x) =

xa

k!

k=0

(x a) + o((x a) ) =

xa

n
X
f (k+1) (a)
k=0

k!

(x a)k + o((x a)n ).

Daprs le thorme dintgration des dveloppements limits (f tant continue), on obtient


f (x) = f (a) +
xa

xa

n
X
f (k+1) (a)
k=0

n+1
X
k=0

f (k) (a)
k!

(x a)k+1 + o((x a)n+1 )

(k + 1)!

(x a)k + o((x a)n+1 ),

do le rsultat lordre n + 1, ce qui achve la dmonstration.

Pour terminer, donnons les dveloppements limits de rfrence : pour tout n N (ou n N
si la somme commence k = 1),

n
X
1
=
xk + o(xn ) = 1 + x + x2 + + xn + o(xn ),
1 x x0
k=0

n
X
xk

cos(x) =

sin(x) =

x0

k=0

x0

x0

+ o(xn ) = 1 + x +

k!

x2
xn
+ +
+ o(xn ),
2!
n!

n
X
x2n
x2
x2k
+ o(x2n ) = 1
+ + (1)n
+ o(x2n ),
(1)k
(2k)!
2!
(2n)!
k=0

n
X
x2n+1
x3
x2k+1
+ o(x2n+1 ) = x
+ + (1)n
+ o(x2n+1 ),
(1)k
(2k + 1)!
3!
(2n + 1)!
k=0

(1 + x) = 1 +
x0

n
X
( 1) ( k + 1)

k!

k=1

= 1 + x +

xk + o(xn )

( 1) ( n + 1) n
( 1) 2
x + +
x + o(xn ) ( R),
2!
n!

n
X
xk
x2 x3
xn
(1)k1
+ o(xn ) = x
+
+ + (1)n1
+ o(xn ),
k
2
3
n

ln(1 + x) =

n
X
x2n+1
x3
x2k+1
+ o(xn ) = x
+ + (1)n
+ o(x2n+1 ),
arctan(x) =
(1)k
x0
2k + 1
3
2n + 1

tan(x) = x +

x0

k=1

k=0

x0

x3
+ o(x3 ).
3
160

Chapitre 8

Rduction des endomorphismes et des


matrices carres
De nombreux problmes se ramnent ltude dune matrice ou dun endomorphisme, comme
certaines quations diffrentielles linaires ou suites rcurrentes linaires. On est alors amen
faire notamment des calculs de puissances, dinverse... Dans ce cas, le choix dune base dans
laquelle travailler influence grandement la simplicit des calculs, et donc de ltude du problme.
Un des objectifs de ce chapitre est de ramener ltude des matrices celle de matrices semblables dont la manipulation est plus simple. En particulier, il est trs pratique de travailler avec
des matrices diagonales, ou avec des matrices triangulaires suprieures. En effet, par exemple,
si A = P DP 1 avec P inversible et D diagonale, on montre trs facilement par rcurrence que
pour tout k N, Ak = P D k P 1 , le calcul de D k tant immdiat : il suffit dlever chaque
coefficient diagonal de D la puissance k. De plus, A est inversible si et seulement si D est
inversible, cest--dire, si et seulement si aucun coefficient diagonal de D nest nul. Dans ce cas,
A1 = P D 1 P 1 , le calcul de D 1 se faisant en inversant chaque coefficient diagonal de D.
En termes dendomorphismes, notre objectif est (en dimension finie) de construire des bases
adaptes dans lesquelles crire la matrice de lendomorphisme considr.
Sauf mention contraire, dans tout ce chapitre E dsigne un K-espace vectoriel (non rduit au
vecteur nul) avec K = R ou C, et u un endomorphisme de E.

I.

lments propres dun endomorphisme et dune matrice carre

Comme on la dj remarqu dans le chapitre Matrices, en dimension finie, simplifier


lcriture matricielle de u, cest par exemple chercher une dcomposition de E en somme directe
de sous-espaces stables par u. Si cela est possible, la matrice obtenue est diagonale par blocs,
elle est dautant plus simple que la dimension de ces sous-espaces est petite (mais non nulle,
videmment). On sintresse donc trs naturellement aux droites stables par u (ce qui est possible
mme en dimension infinie, nous ne supposons donc pas ici que E soit de dimension finie).
Proprit
Soient D une droite vectorielle de E et x D non nul. Les proprits suivantes sont
quivalentes :
La droite D est stable par u.
Il existe K tel que u(x) = x.
Dmonstration
D est stable par u, donc u(x) D. Or D = Vect(x), donc il existe K tel que u(x) = x.
On a u(D) = Vect(u(x)), donc sil existe K tel que u(x) = x, alors u(D) = Vect(x).
Or, quel que soit , Vect(x) Vect(x) = D. Donc D est stable par u.

161

1.

lments propres dun endomorphisme


Dfinition Valeur propre, vecteur propre
Un scalaire K est appel valeur propre de u sil existe x E non nul tel que
u(x) = x.
Un vecteur x E est appel vecteur propre de u si x est non nul et sil existe
K tel que u(x) = x.

Remarques
Dans cette dfinition, la condition x 6= 0E est essentielle, sinon tout scalaire serait valeur propre
de u. En effet pour tout K, on a u(0E ) = 0E = 0E .
Un vecteur propre x vrifie la relation u(x) = x pour une unique valeur propre . En effet, si
u(x) = x = x, alors x tant non nul, on a ncessairement = . On peut donc dire que
est la valeur propre associe au vecteur propre x de u.
En revanche, si est valeur propre de u, et si x non nul vrifie u(x) = x, alors par exemple,
pour tout K , le vecteur y = x est non nul et vrifie
u(y) = u(x) = u(x) = (x) = (x) = y.
Un vecteur x 6= 0E tel que u(x) = x est un vecteur propre associ la valeur propre de u. Il
y a une infinit de vecteurs propres associs une mme valeur propre.
Pour faire le lien avec la proprit prcdente, on remarquera quun vecteur x est vecteur propre
de u si et seulement si Vect(x) est une droite vectorielle stable par u.
Exemples
Une rotation vectorielle de R2 dangle 6= 0 [] na pas de valeur propre.
Soit u : P 7 P , dfini sur E = R[X]. Soit P un vecteur propre de u et la valeur propre
associe. Alors P (X) = P (X). En considrant les degrs de ces deux polynmes, on a ncessairement = 0, et P est un polynme constant non nul. La rciproque est immdiate. On en
dduit que lunique valeur propre de u est 0, et lensemble des vecteurs propres de u associs
cette valeur propre est R0 [X] \ {0}.


Remarquons que, pour K et x E, lgalit u(x) = x quivaut (u IdE )(x) = 0E ,


i.e., au fait que x Ker(u IdE ). On en dduit immdiatement le rsultat suivant :
Proprit
Soit K. Alors est une valeur propre de u si et seulement si Ker(u IdE ) 6= {0E },
cest--dire, si et seulement si u IdE nest pas injectif.
Dfinition Sous-espace propre
Si est une valeur propre de u, lensemble E (u) = Ker(u IdE ) est appel sousespace propre de u associ la valeur propre .

Proprit
Soit une valeur propre de u. Alors :
E (u) est un sous-espace vectoriel de E, non rduit {0E }.
Les vecteurs propres de u associs la valeur propre sont les lments non nuls de
E (u).

162

Dmonstration Lensemble E (u) est le noyau de lapplication linaire u IdE , cest donc un
sous-espace vectoriel de E. Le reste des proprits rsulte directement des dfinitions.

Cas particulier Le scalaire 0 est une valeur propre de u si et seulement si u nest pas injectif.
Les vecteurs propres de u associs la valeur propre 0 sont alors les lments de Ker(u) \ {0E }.
Exemple Homothties, projecteurs et symtries
Une homothtie u de E de rapport K a pour unique valeur propre , et tout vecteur non
nul de E est vecteur propre de u associ la valeur propre .
Soit E = F G une dcomposition de E en somme de deux sous-espaces avec F 6= {0E } et
G 6= {0E }, et soit p la projection sur F paralllement G. Alors les valeurs propres de p sont 1
et 0. On a de plus E1 (p) = F , E0 (p) = G.
Avec les mme notations, soit s la symtrie par rapport F paralllement G. Alors les valeurs
propres de s sont 1 et 1. On a de plus E1 (p) = F , E1 (p) = G.

Faisons la dmonstration dans le cas dun projecteur, les autres cas sont laisss en exercice.
Dterminons les lments propres de p : soit x un vecteur propre de p et la valeur propre associe.
crivons x = y + z o y F et z G. On a p(x) = x, donc y = x = (y + z) = y + z. La
somme F + G tant directe, on en dduit que (1 )y = 0E et z = 0E . Or x est non nul, donc
y ou z est non nul. Dans le premier cas, on a ncessairement = 1, z = 0E et donc x = y F ;
dans le second, on a = 0, y = 0E et donc x = z G. La rciproque est immdiate.

Remarque Soit une valeur propre de u, et x un vecteur propre associ la valeur propre .
Alors, pour tout entier k > 1, x est vecteur propre de uk associ la valeur propre k .
Pour dmontrer ce rsultat, on procde par rcurrence sur k. Pour k = 1, le rsultat est vrai
par hypothse. Si le rsultat est vrai pour un certain entier k, alors
uk (x) = k x.
En appliquant u, on obtient
uk+1 (x) = u(k x) = k u(x) = k x = k+1 x.

Comme x 6= 0E , le rsultat est donc vrai au rang k + 1 et finalement pour tout k > 1 par principe
de rcurrence.

2.

Stabilit et somme de sous-espaces propres


Proprit
Tout sous-espace propre de u est stable par u. Si est valeur propre de u, lendomorphisme de E (u) induit par u est lhomothtie de rapport .
Soient u et v deux endomorphismes de E qui commutent (i.e. u v = v u).
Alors tout sous-espace propre de u est stable par v.

Dmonstration Le premier point est immdiat car pour tout x E (u), u(x) = x par dfinition. Le second point vient dune proprit du chapitre Espaces vectoriels et applications
linaires : pour toute valeur propre de u, u IdE et v commutent de mme que u et v, donc
E (u) = Ker(u IdE ) est stable par v.


Daprs le premier point, les sous-espaces E (u) sont donc de bons candidats former une
dcomposition de E pour laquelle lexpression de u soit particulirement simple. De plus, on a
la proprit suivante :
Proprit
La somme dune famille finie de sous-espaces propres associs des valeurs propres de
u deux deux distinctes est directe.

163

Dmonstration Soient E1 , . . . ,Ep des sous-espaces propres de u associs aux valeurs propres
deux deux distinctes 1 , . . . ,p . Soit (x1 , . . . ,xp ) E1 Ep tel que x1 + + xp = 0E .
En appliquant uk pour k N, on obtient, daprs la remarque ci-dessus,
k1 x1 + + kp xp = 0E .

On en dduit que pour tout P K[X],

P (1 )x1 + + P (p )xp = 0E .

Soit i [[1,p]] fix. En choisissant

P (X) =

Y
(X j ),
j6=i

qui vrifie P (i ) 6= 0 et P (j ) = 0 pour tout j 6= i, on obtient alors xi = 0E , ce qui prouve le


rsultat.

Remarque On en dduit que toute famille finie de vecteurs propres de u associs des valeurs
propres deux deux distinctes est libre. Cest une consquence de la proprit prcdente et dun
rsultat du chapitre Espaces vectoriels et applications linaires, des vecteurs propres tant
non nuls par dfinition.
Par exemple, la famille (exp0 , . . . , expp ) dlments de C (R) est libre pour tout entier naturel
p. En effet, pour tout k N, lapplication expk : x 7 ekx est vecteur propre de loprateur
drivation sur C (R), associ la valeur propre k.

3.

lments propres dune matrice

Dans ce paragraphe, A dsigne une matrice de Mn (K). Toutes les dfinitions des lments
propres se traduisent en termes de matrices.
Dfinition
Les lments propres de la matrice A sont les lments propres de lendomorphisme

Mn,1 (K) Mn,1 (K)
uA :
X 7 AX
canoniquement associ A. En dautres termes :
Un scalaire K est appel valeur propre de A sil existe X Mn,1 (K) non nul
tel que AX = X.
Un vecteur X Mn,1 (K) est appel vecteur propre de A si X est non nul et sil
existe K tel que AX = X.
Si est valeur propre de A, le sous-espace propre de A associ la valeur propre
est
E (A) = Ker(A In ).
Remarque Soit u L (E). Soit B une base de E, et A la matrice de u dans cette base. Pour x
vecteur quelconque de E, on note X la matrice colonne de ses coordonnes dans la base B. On
a alors :
Pour tout K, (u(x) = x) (AX = X).
En particulier, u et A ont les mmes valeurs propres et pour toute valeur propre de u et A,
x est un vecteur propre de u si et seulement si X est un vecteur propre de A.
Deux matrices semblables ont les mmes valeurs propres, car elles reprsentent le mme endomorphisme dans des bases diffrentes.
Remarque Bien sr, toute matrice A Mn (R) peut tre vue comme lment de Mn (C). La
relation AX = X, pour X Mn,1 (R) et R, est galement valable dans C. On en dduit
que lensemble des valeurs propres de A vue comme matrice relle est inclus dans lensemble des
valeurs propres de A vue comme matrice complexe.
164

II.

Recherche des lments propres, polynme caractristique


Dans toute la suite, E est suppos de dimension finie n.

1.

Polynme caractristique

Pour linstant, nous navons aucun moyen pratique autre que la dfinition pour dterminer
lensemble des valeurs propres dun endomorphisme u ou dune matrice carre A.
La caractrisation des isomorphismes en dimension finie donne immdiatement la proprit
suivante :
Proprit
Soient u L (E) et K. Les proprits suivantes sont quivalentes :
Le scalaire est valeur propre de u.
Lendomorphisme u IdE nest pas inversible.
det(u IdE ) = 0.
On a les quivalences analogues pour une matrice carre.
Ainsi K est valeur propre de u si et seulement si est un zro de la fonction
x 7 det(u x IdE ).
Fixons une base B de E et soit A = (ai,j )16i,j6n = MatB (u).
a pour matrice A xIn dans cette base, donc

a1,1 x


..
det(u x IdE ) = det(A xIn ) =
.

an,1

Alors pour tout x K, u x IdE


...
..
.
...





.

an,n x
a1,n
..
.

En imaginant le dveloppement de ce dterminant (obtenu par linarit du dterminant par


rapport chaque colonne de sa variable, ou par dveloppements successifs par rapport la
premire colonne), on voit que la fonction x 7 det(u x IdE ) est polynomiale.
Proprit/Dfinition
Le polynme u (X) = (1)n det(u X IdE ) = det(X IdE u) est appel polynme
caractristique de u.
Lensemble des valeurs propres de u est gal lensemble des racines dans K de u .
Il est appel spectre de u, et not Sp(u).
Si A Mn (K), on dfinit le polynme caractristique
A (X) = (1)n det(A XIn ) = det(XIn A)
de A, et son spectre Sp(A), comme tant ceux de lendomorphisme canoniquement
associ A.

2
5 0
Exemple Soit A = 2 1 1 . Alors
2 2 3


X 2

5
0



A (X) = 2
X +1
1 = (X 2)(X + 1)(X 3) + 10 2(X 2) + 10(X 3)
2
2
X 3
= (X 2)(X 2 2X + 5)

= (X 2)(X 1 2i)(X 1 + 2i).


165

La matrice relle A a donc une seule valeur propre, 2, mais la matrice complexe A a trois valeurs
propres, 2, 1 + 2i et 1 2i.
Remarques
Comme on la expliqu plus haut, si u a pour matrice A dans une certaine base, alors pour
tout x K, det(x IdE u) = det(xIn A), et donc det(X IdE u) = det(XIn A) (galit entre
polynmes) : u et A ont le mme polynme caractristique.
Deux matrices semblables ont le mme polynme caractristique car elles reprsentent le mme
endomorphisme dans des bases diffrentes. On peut aussi le montrer ainsi : si deux matrices A
et B de Mn (K) sont semblables, il existe P Gn (K) telle que A = P BP 1 . Alors
A (X) = det(XIn A) = det(XIn P BP 1 ) = det(P (XIn B)P 1 ) = det(XIn B) = B (X).

Daprs ce qui prcde, la recherche des valeurs propres dun endomorphisme ou dune matrice se ramne la recherche des racines dans K dun certain polynme (dpendant de cet
endomorphisme ou matrice). Explicitons en partie ce polynme :
Proprit
Soit u L (E). Alors u a pour terme de plus haut degr X n et pour coefficient
constant (1)n det(u).

Dmonstration Notons (E1 , . . . ,En ) la base canonique de Mn,1 (K). Si M = (mi,j )16i,j6n , par
linarit du dterminant par rapport chaque colonne de sa variable, det(M ) est la somme de
tous les termes de la forme
mi1 ,1 . . . min ,n det Ei1

Ein

o (i1 , . . . ,in ) [[1,n]]n . Si A = (ai,j ) est la matrice de u dans une base fixe et M celle de
X IdE u, on a, pour tout (i,j) [[1,n]]2 , mi,j = ai,j si i 6= j et mi,i = X ai,i . Le terme de
plus haut degr de u provient donc uniquement du produit
(X a1,1 ) (X an,n ),
il est gal X n .
De plus, le coefficient constant de u est gal u (0) = (1)n det(u) par dfinition de u . 
Remarques
On a bien sr un rsultat analogue sur les matrices.

Le polynme caractristique de u L (E) (ou A Mn (K)) est dfini comme det(X IdE u)
(ou det(XIn A)) pour quil soit unitaire. Cela dit, dans les calculs, afin de ne pas avoir changer
les signes de tous les coefficients de A, on pourra calculer det(u X IdE ) (ou det(A XIn )) puis
multiplier le rsultat obtenu par (1)n , cest--dire, changer le signe lorsque n est impair.


a b
Exemple Si A =
est une matrice de M2 (K), alors
c d


X a
b

A (X) =
= (Xa)(Xd)bc = X 2 (a+d)X+adbc = X 2 Tr(A)X+det(A).
c
X d
Le fait que la trace de A apparaisse nest pas un hasard, on retrouvera ce phnomne plus tard
dans le chapitre.
166

Corollaire
Soit u L (E). Alors :
Lendomorphisme u admet au plus n valeurs propres.
Si K = C, u admet au moins une valeur propre.
Dmonstration
Les valeurs propres de u sont les racines de u . Or, le polynme u est de degr n (et en
particulier non nul), il a donc au plus n racines.
Le polynme u possde au moins une racine dans C, daprs le thorme de dAlembert-Gauss.

Remarque Si K = R et n est impair, u possde au moins une valeur propre. En effet, dans ce cas,
n = deg(u ) est impair ; u tant de plus unitaire, on a lim u (x) = et lim u (x) = +.
x

x+

Enfin u dfinit une fonction continue. Le thorme des valeurs intermdiaires montre que u
possde au moins une racine relle, et donc u possde au moins une valeur propre.
Proprit
Soit u L (E). On suppose que u est scind sur K, cest--dire quil possde n racines
dans K, notes 1 , . . . , n (non ncessairement distinctes, et quil faut donc compter
avec leur ordre de multiplicit). Autrement dit, on suppose que u possde n valeurs
propres dans K.
Alors
n
Y
i .
det(u) =
i=1

On a un rsultat analogue pour une matrice carre.


Dmonstration On peut crire
u (X) =

n
Y
(X i ).
i=1

Ainsi, le coefficient constant de u est




(1)n

Qn

i=1 i .

Or, on sait quil vaut aussi (1)n det(u).

Remarque Tout polynme de C[X] est scind dans C (daprs le thorme de dAlembertGauss) ; cette formule est donc toujours vraie si K = C. Elle peut tre fausse dans R comme le
montre lexemple de la matrice relle


0 1
A=
1 0
dont le polynme caractristique est X 2 +1, qui nest pas scind dans R : le spectre de A est donc
vide. En revanche, si lon passe dans C, A possde deux valeurs propres, i et i, et la formule
est alors vrifie.
Remarque Dterminer les lments propres de u L (E) (en dimension finie) ou de A Mn (K)
se fait donc gnralement en deux tapes (formules ici avec A) :
On dtermine les valeurs propres de A, ce qui correspond la rsolution dune quation polynomiale, lquation A () = 0.
On recherche ses vecteurs propres en dterminant, pour Sp(A), le noyau de A In ,
ce qui revient rsoudre lquation linaire (A In )X = 0, par exemple par lalgorithme de
Gauss-Jordan.
On sait notamment que dim(E (A)) = n rg(A In ) est le nombre de paramtres de ce
systme.
167

2.

Sous-espaces stables et polynme caractristique


Proprit
Soit M Mn (K) une matrice carre dfinie par blocs, de la forme


A B
M=
0 C
avec A et C deux matrices carres.
Alors
M (X) = A (X) C (X).

Dmonstration Soit r lordre de la matrice A. Alors, daprs lexpression du dterminant dune


matrice triangulaire par blocs,



XIr A
B
= det(XIr A) det(XInr C) = A (X) C (X).


M (X) =
0
XInr C
Corollaire
Soit u L (E). Soit F un sous-espace vectoriel de E stable par u, avec F 6= {0E }.
Alors u|F , le polynme caractristique de u|F , divise u , le polynme caractristique
de u.
Dmonstration Il suffit dcrire la matrice de u dans une base adapte F et dappliquer la
proprit prcdente.

Proprit/Dfinition
Soit u L (E). Soit une valeur propre de u. Lordre de multiplicit de en tant que
racine de u est appel multiplicit de la valeur propre , not m().
On a
1 6 dim(E (u)) 6 m().
Dmonstration Soit r la dimension de E (u). Un sous-espace propre est par dfinition non rduit
au vecteur nul, donc 1 6 r. De plus, E (u) est stable par u et lendomorphisme de E (u) induit
par u est lhomothtie de rapport . Sa matrice dans une base quelconque est Ir , do
u|E

(u)

Or, daprs la proprit prcdente, u|E

(X) = (X )r .

(u)

divise u , donc r 6 m().

Proprit/Dfinition
On dit quune valeur propre de u est simple si m() = 1.
De lingalit prcdente, on dduit que dans ce cas, dim(E (u)) = 1.
Ainsi, lespace propre associ une valeur propre simple est une droite vectorielle.
Attention ! Il ny a pas de proprit analogue pour une valeur propre de multiplicit m() > 2 :
la dimension de E (u) peut tre a priori nimporte quel entier compris entre 1 et m().
Par exemple, le sous-espace propre associ une valeur propre double (i.e. de multiplicit 2)
peut tre une droite ou un plan.
168

III.
1.

Diagonalisabilit
Dfinition et premier critre

Dfinition Endomorphisme diagonalisable


Soit u L (E). On dit que u est diagonalisable sil existe une base de E dans laquelle
la matrice de u est diagonale.
Cette dfinition sinterprte bien sr en termes de vecteurs propres :
Proprit
Soit u L (E). Les proprits suivantes sont quivalentes :

u est diagonalisable.
Il existe une base de E forme de vecteurs propres pour u.

Dans ce cas, si D est une matrice diagonale reprsentant u dans une base de E, les
coefficients diagonaux de D sont les valeurs propres de u.
Dmonstration On remarque que, si B = (e1 , . . . ,en ) est une base de E, alors MatB (u) est
diagonale si et seulement si pour tout i [[1,n]], ei est un vecteur propre de u associ au coefficient
diagonal de la colonne i de MatB (u), ce qui prouve lquivalence souhaite.
Si u est diagonalisable, et si D est une matrice diagonale reprsentant u dans une base de E,
notons d1 , . . . ,dn les coefficients diagonaux de D. Alors
n
Y
(X di ).
u (X) = det(X IdE u) = det(XIn D) =
i=1

Les coefficients di sont donc exactement les valeurs propres de u.

Donnons deux premiers critres de diagonalisabilit.


Thorme
Soit u L (E). Pour que u soit diagonalisable, il faut et il suffit que la dimension de
E soit gale la somme des dimensions des sous-espaces propres de u, cest--dire, que
X
dim(E) =
dim(E (u)).
Sp(u)

P
Dmonstration On sait que la somme Sp(u) E (u) est directe. Ainsi, daprs un rsultat du
chapitre Espaces vectoriels et applications linaires, le fait que
X
dim(E) =
dim(E (u))
Sp(u)

quivaut au fait que


E=

E (u).

Sp(u)

Si tel est le cas, en juxtaposant des bases des E (u) dont E est somme directe, on obtient une
base de E (daprs un thorme du chapitre Espaces vectoriels et applications linaires).
Une telle base de E est forme de vecteurs propres de u, car tout lment non nul dun espace
propre de u est vecteur propre de u. Donc u est diagonalisable.
P
Si u est diagonalisable, il nous suffit de prouver que E Sp(u) E (u), laspect direct de
la somme tant acquis. Soit donc (e1 , . . . ,en ) une base de E forme de vecteurs propres pour u,
169

et soit x E ; il existe (1 , . . . ,n ) Kn tel que x = 1 e1 + + n en . Pour tout i [[1,n]],


i ei E (u) pour un certain Sp(u). On a donc une dcomposition de x comme somme de
vecteurs appartenant tous un sous-espace propre de u, do le rsultat.

Thorme
Soit u L (E). Pour que u soit diagonalisable, il faut et il suffit que les deux proprits
suivantes soient vrifies :
Le polynme caractristique u de u est scind sur K.
Pour toute valeur propre de u, la dimension du sous-espace propre associ est gale
la multiplicit de en tant que valeur propre de u, cest--dire,
Sp(u),

dim(E (u)) = m().

Dmonstration Si Sp(u) = , u nest pas diagonalisable car elle na pas de valeur propre,
et u nest pas scind sur K pour la mme raison. Sinon, notons 1 , . . . ,p les valeurs propres
deux deux distinctes de u, de sorte que Sp(u) = {1 , . . . ,p }. Alors on a, pour tout i [[1,p]],
dim(Ei (u)) 6 m(i ). On en dduit que
p
X

dim(Ei (u)) 6

p
X

m(i ) 6 deg(u ) = dim(E).

i=1

i=1

Or, daprs le thorme prcdent, u est diagonalisable si et seulement si


dim(E) =

p
X

dim(Ei (u)).

i=1

Daprs les ingalits prcdentes, ceci est quivalent au fait que


p
X

m(i ) = deg(u )

i=1

et que, pour P
tout i [[1,p]], dim(Ei (u)) = m(i ). En remarquant que u est scind sur K si et
seulement si pi=1 m(i ) = deg(u ), on obtient le rsultat.

Corollaire

Si u L (E) admet n valeurs propres deux deux distinctes, alors u est diagonalisable.
De plus, chaque espace propre de u est une droite vectorielle.
Dmonstration Nous avons vu plus haut que le sous-espace propre associ une valeur propre
simple est une droite vectorielle. Ici, on a donc
X
dim(E) = n =
dim(E (u)).
Sp(u)

Le premier critre ci-dessus montre que u est diagonalisable.

Attention ! Bien videmment, la rciproque est fausse : lidentit de E est diagonalisable, mais
possde 1 comme unique valeur propre.
Remarque Le cas du corollaire prcdent est en quelque sorte le cas idal . Lorsque lon nest
pas dans ce cas, on dtermine par le calcul les sous-espaces propres (par la mthode de GaussJordan notamment), pour vrifier lun des critres ci-dessus. Il sagit souvent dune vrification
fastidieuse, do lintrt de nouveaux critres de diagonalisabilit, que nous donnerons dans la
partie IV.
170

2.

Matrices diagonalisables
Dfinition Matrice diagonalisable
Soit A Mn (K). On dit que la matrice A est diagonalisable si A est semblable une
matrice diagonale, cest--dire, sil existe P Gn (K) et D Mn (K) diagonale telles
que A = P DP 1 .

Thorme Lien entre matrices et endomorphismes diagonalisables


Soit A Mn (K) une matrice carre. Les proprits suivantes sont quivalentes :

1. A est diagonalisable.
2. Il existe une base de Mn,1 (K) forme de vecteurs propres pour A.
3. Tout endomorphisme dun K-espace vectoriel de dimension n, de matrice A dans
une certaine base, est diagonalisable.
Si A est diagonalisable et scrit P DP 1 avec P inversible et D diagonale, alors les coefficients diagonaux de D sont les valeurs propres de A, et les colonnes de P constituent
une base de Mn,1 (K) de vecteurs propres de A.

Dmonstration Ces quivalences viennent des formules de changement de base. Si A = P DP 1


avec P inversible et D diagonale, alors les colonnes de P constituent une base de Mn,1 (K) dans
laquelle la matrice de uA est D ; les coefficients diagonaux de D sont donc les valeurs propres de
A, et les colonnes de P constituent une base de Mn,1 (K) de vecteurs propres de A, apparaissant
dans lordre correspondant lordre des valeurs propres dans la matrice D. Il ny a donc dailleurs
pas quun choix possible de P et D.

Remarque Tous les rsultats concernant la diagonalisabilit des endomorphismes se traduisent
donc sur les matrices carres, via les endomorphismes canoniquement associs, et grce au thorme prcdent. Dans le premier critre de diagonalisabilit, il convient de remplacer dim(E) par
lordre de la matrice considre (n si A Mn (K)).

1 4
2
Exemple Considrons la matrice relle A = 0 3 2. Son polynme caractristique est
0 4
3


X 1



4
2


X + 3
2
0


X +3
2 = (X 1)

4
X 3
0
4
X 3

= (X 1)[(X + 3)(X 3) (4) 2]

= (X 1)(X 2 1)

= (X 1)2 (X + 1).
La matrice A possde donc une valeur propre double, 1, et une valeur propre simple, 1. On sait
sans calcul que E1 (A) est de dimension 1. Pour en dterminer une base, on rsout lquation
AX = X correspondant au systme

x +4y +2z = x
2x +4y +2z = 0
3y 2z = y

2y 2z = 0

4y +3z = z
4y +4z = 0

x +2y +z = 0

y +z = 0
(
y = z

x = 2y z = z
171


1
1
On a donc E1 (A) = Vect 1. Notons e3 = 1 .
1
1
De mme, dterminons

x +4y +2z
3y 2z

4y +3z

E1 (A) en rsolvant lquation AX = X correspondant au systme

=x
4y +2z = 0

=y

4y 2z = 0

2y + z = 0.

=z
4y +2z = 0

Donc E1 (A) est un plan vectoriel ; une base de E1 (A) est



1
0
(e1 ,e2 ) = 0 , 1 .
0
2

En particulier, dim(E1 (A)) = 2 et finalement, dim(E1 (A)) + dim(E1 (A)) = 1 + 2 = 3 qui est
lordre de la matrice A. On sait donc que A est diagonalisable. En fait, en posant

1 0
1
P = 0 1 1 ,
0 2 1
alors P est la matrice de passage de la base canonique de M3,1 (R) la base (e1 ,e2 ,e3 ) de vecteurs
propres que lon vient de dterminer, et

1 0 0
A = P 0 1 0 P 1 .
0 0 1

Remarque La matrice A est la matrice dune symtrie de R3 (identifi M3,1 (R)) car A2 = I2 .
Les calculs prcdents permettent de dcrire entirement cette symtrie : il sagit de la symtrie
par rapport au plan E1 (A), paralllement la droite E1 (A).
Proprit
Soit A Mn (K) une matrice diagonalisable. On peut crire

1 0

A = P ... . . . ... P 1

avec 1 , . . . ,n les valeurs propres de A et


Alors, pour tout k N,

(1 )k

Ak = P ...
0

P Gn (K).

..
.

0
.. P 1 .
.
(n )k

Dmonstration Elle se fait par rcurrence immdiate, en utilisant le fait que P 1 P = In .


Dans lexemple prcdent, pour tout entier k

1
k

A =P 0
0

N (et mme pour tout k Z dans ce cas),

0
0
1
0 P 1 .
0 (1)k
172

Application Rcurrences linaires


Considrons la relation de rcurrence linaire dordre 1
1
xk+1 = a1,1 x1k + + a1,n xnk

..
k N,
.

n
xk+1 = an,1 x1k + + an,n xnk

(1)

dont les inconnues sont les n suites (x1k )kN , . . . ,(xnk )kN (lexposant nindique pas une puissance,
mais permet de reprer la j-ime suite inconnue, avec j [[1,n]]).
En notant Uk le vecteur-colonne de coefficients x1k , . . . ,xnk et A = (ai,j )16i,j6n , la relation (1)
est quivalente la relation de rcurrence matricielle
k N, Uk+1 = AUk .

(2)

Par rcurrence immdiate, (Uk ) est solution de (2) si et seulement si pour tout k N, Uk = Ak U0 .
Si A est diagonalisable, la proprit prcdente permet dexprimer explicitement toute solution de (1), en fonction des valeurs propres de A et des conditions initiales.

IV.
1.

Rduction et polynmes annulateurs


Polynmes annulateurs et valeurs propres

Proprit
Soit u L (E) et P K[X] un polynme annulateur de u.
Alors toute valeur propre de u est une racine de P .
Dmonstration Nous avons montr plus haut que lorsque x est un vecteur propre de u associ
la valeur propre , alors pour tout entier naturel k, uk (x) = k x. En crivant P sous forme
dveloppe, on en dduit que P (u)(x) = P () x = 0E car P (u) = 0L (E) . Or x tant vecteur
propre, il est non nul ; on a donc ncessairement P () = 0.

Remarques
Cette proprit est trs intressante, car elle montre que les valeurs propres de u, bien quelles
soient les racines du polynme caractristique de u, qui est de degr n, sont chercher parmi les
racines de tout polynme annulateur de u. Or, on peut parfois trouver un polynme annulateur
trs simple : par exemple, X 2 X est un polynme annulateur de toute projection ; X est
un polynme annulateur de toute homothtie de rapport . De mme, X 2 1 est annulateur de
toute symtrie.
On avait dj remarqu lintrt des polynmes annulateurs dun endomorphisme ou dune
matrice pour les calculs de puissances ou dinverse ventuel. La proprit prcdente en donne
une nouvelle application.
La proprit prcdente est vraie mme en dimension infinie.
Exemple Soit u L (E) tel que u2 2u 3 IdE = 0. Alors (u 3 IdE ) (u + IdE ) = 0, donc
(X 3)(X + 1) est annulateur de u. Les valeurs propres de u sont donc lments de {1; 3}.

Attention ! Ne pas confondre cette proprit avec sa rciproque qui est fausse : si P est annulateur
de u et si P () = 0, alors rien ne dit que est valeur propre de u. En reprenant lexemple
prcdent avec u = 3 IdE , on a bien (u 3 IdE ) (u + IdE ) = 0, mais 1 nest pas valeur propre
de u.
Dans tout polynme annulateur de u, il peut y avoir des facteurs inutiles : soit
P (X) = (X 1 ) (X p )
173

un polynme annulateur scind de u L (E). Si un certain i nest pas valeur propre de u,


alors u i IdE est injective et donc inversible daprs la caractrisation des isomorphismes en
dimension finie. En composant la relation (que lon peut crire dans un ordre arbitraire)
(u 1 IdE ) (u p IdE ) = 0
par (u i IdE )1 , on voit que lon peut enlever u i IdE de cette relation. On obtient donc
un polynme annulateur avec un facteur en moins. Cest le cas du facteur X + 1 dans lexemple
ci-dessus lorsque u = 3 IdE .

Remarque Tout lment u L (E) (E tant de dimension finie n) admet un polynme annu2
lateur non nul. En effet, la famille (IdE ,u, . . . , un ) est compose de n2 + 1 vecteurs de L (E)
P 2
qui est de dimension n2 , elle est donc lie. Soit nk=0 ak uk une combinaison linaire nulle de ces
P 2
lments, les ak tant non tous nuls. Alors le polynme nk=0 ak X k est annulateur de u, et il est
non nul.

2.

Le thorme de Cayley-Hamilton

Le rsultat de la remarque prcdente possde les inconvnients suivants : il ne donne pas


explicitement un polynme annulateur de u, il garantit seulement lexistence de polynmes annulateurs de u de degr au plus n2 , qui est un degr plutt lev . Le thorme suivant y
remdie en partie :
Thorme de Cayley-Hamilton (admis : dmonstration non exigible)
Soit u L (E). Alors u (u) = 0L (E) : le polynme caractristique de u est un polynme
annulateur de u.
On a un rsultat analogue pour les matrices carres.

2 0 0
Exemple Considrons la matrice A = 0 2 0 . Alors
0 0 1


X 2
0
0

X 2
0 = (X 2)2 (X 1).
A (X) = 0
0
0
X 1

Il est immdiat que (X 2)2 (X 1) est annulateur de A (conformment au thorme de CayleyHamilton). En fait, (X 2)(X 1) est aussi annulateur de A.

2 0
4
Considrons maintenant la matrice B = 3 4 12 . Son polynme caractristique est
1 2 5


X 2
0
4

B (X) = 3
X + 4 12 C2 C2 + 2C1
1
2
X 5


X 2 2(X 2)

4



= 3
X 2
12 L1 L1 2L2
1
0
X 5


X + 4

0
20



= 3
X 2 12
1
0
X 5
= X(X 1)(X 2).

En particulier, on sait sans calcul supplmentaire que B est diagonalisable, car B est dordre
3 et possde trois valeurs propres distinctes. On vrifie que B(B I3 )(B 2I3 ) = 0, mais ni
174

B(B I3 ), ni B(B 2I3 ), ni (B I3 )(B 2I3 ) nest nulle, sinon lune des valeurs 0, 1 ou 2 ne
serait pas valeur propre de B.
En revanche, dans le cas de la matrice

on a C (X) = (X 1)3 , mais

1 0 1
C = 0 1 0 ,
0 0 1

0 0 1
(C I3 ) = 0 0 0
0 0 0

et (C I3 )2 = 0,

donc (X 1)2 est annulateur de C. On peut donc parfois trouver des polynmes annulateurs
de plus bas degr que le polynme caractristique. Pour un projecteur, une symtrie ou une
homothtie, ce phnomne est encore plus flagrant.
Remarques
Les valeurs propres de u tant racines de tout polynme annulateur, elles sont racines du
polynme caractristique u . Bien sr, ceci est dj connu ; le polynme caractristique est mme
un exemple de polynme annulateur dont les racines sont exactement les valeurs propres de u.
On sait que lorsque u possde un polynme annulateur P de coefficient constant non nul,
alors u est inversible et on peut calculer u1 comme un polynme en u, partir de la relation
P (u) = 0.
En dimension finie, pour le choix de P = u on a a0 = (1)n det(u). Si a0 6= 0, u est donc
inversible et le thorme de Cayley-Hamilton permet de dterminer explicitement u1 partir
de la relation u (u) = 0.

3.

Un nouveau critre de diagonalisabilit


Thorme
Soit u L (E). Les proprits suivantes sont quivalentes :
1. Lendomorphisme u est diagonalisable.
2. Il existe un polynme annulateur de u scind sur K et racines simples.
Y
3. Le polynme
(X ) est annulateur de u.
Sp(u)

Remarques
Seule la dmonstration de lquivalence entre les proprits 1 et 3 est exigible. Pour limplication
3 1, on peut dmontrer 3 2 et utiliser directement 2 1.
Bien sr, le thorme prcdent se traduit en termes de matrices carres.
Dmonstration
Q
3 2 : Il suffit de remarquer que le polynme Sp(u) (X ) est scind racines simples
(dans ce polynme, chaque valeur propre apparat sans multiplicit).
1 3 : Supposons u diagonalisable. Il existe donc une base (e1 , . . . ,en ) de E forme de vecteurs
propres pour u. Notons 1 , . . . ,p les valeurs propres deux deux distinctes de u. Montrons que
le polynme
Y
P (X) =
(X ) = (X 1 ) (X p )
Sp(u)

est annulateur de u. Les polynmes en u commutent, donc pour tout j [[1,p]],




P (u) = (u 1 IdE ) (u p IdE ) = (u k IdE ) (u j IdE ),
k6=j

175

le symbole dsignant la composition de tous les facteurs dindice k 6= j.


k6=j

Soit i [[1,n]], et j la valeur propre associe au vecteur ei ; ainsi (u j IdE )(ei ) = 0E . En


valuant P (u) en ei , on a alors




P (u)(ei ) = (u k IdE ) ((u j IdE )(ei )) = (u k IdE ) (0E ) = 0E .
k6=j

k6=j

Ceci tant valable pour tous les vecteurs de la base (e1 , . . . ,en ), on a bien P (u) = 0.
2 1 : On procde par rcurrence : montrons que pour tout entier p > 1, tout endomorphisme
dun espace de dimension finie admettant un polynme scind avec p racines simples, est diagonalisable. On pourra toujours, quitte diviser par le coefficient dominant, supposer que les
polynmes annulateurs non nuls sont unitaires.
Initialisation : si p = 1 et si u L (E) annule un polynme de la forme X 1 , alors
u = 1 IdE . Ainsi, u est diagonalisable.
Hrdit : supposons le rsultat vrai pour un nombre p de racines simples. Soit u un endomorphisme annulant un polynme P scind et ayant p + 1 racines simples, que lon crit sous la
forme
P (X) = (X 1 ) (X p )(X p+1 ).

Notons Q(X) = (X 1 ) (X p ).
tape 1 : montrons que E = Ker(Q(u)) Ker(u p+1 IdE ) : tout dabord, si un vecteur x
appartient Ker(Q(u)) Ker(u p+1 IdE ), alors u(x) = p+1 x et donc
0E = Q(u)(x) = Q(p+1 ) x.

Le scalaire Q(p+1 ) est non nul car les i sont deux deux distincts : on en dduit que x = 0E .
On a donc montr que Ker(Q(u)) Ker(u p+1 IdE ) = {0E }. De plus, effectuons la division
euclidienne de Q par (X p+1 ) : il existe un polynme A et un polynme B de degr strictement
infrieur deg(X p+1 ) = 1, cest--dire que B est un polynme constant que lon notera b K,
tels que
Q(X) = A(X)(X p+1 ) + b.

En valuant cette relation en p+1 , on obtient

Q(p+1 ) = b
et en particulier b 6= 0 car p+1 nest pas racine de Q. On a alors
Q(u) = A(u) (u p+1 IdE ) + b IdE ,
cest--dire

1
1
Q(u) A(u) (u p+1 IdE ) = IdE .
b
b
Soit alors x E. On a daprs la relation prcdente,
x=

1
1
Q(u)(x) (A(u) (u p+1 IdE )) (x).
b
b

De plus, le vecteur
y=

1
Q(u)(x)
b

appartient Ker(u p+1 IdE ) car


((u p+1 IdE ) Q(u))(x) = P (u)(x) = 0E .
De mme,

1
z = (A(u) (u p+1 IdE ))(x)
b
176

appartient Ker(Q(u)). On a donc dcompos x sur la somme Ker(Q(u)) + Ker(u p+1 IdE ),
ce qui achve de prouver que E = Ker(Q(u)) Ker(u p+1 IdE ).

tape 2 : Les endomorphismes u et Q(u) commutent, donc Ker(Q(u)) est stable par u. Soit
v lendomorphisme de Ker(Q(u)) induit par u. Alors Q est un polynme annulateur de v par
dfinition, et Q est scind et possde p racines simples. Daprs lhypothse de rcurrence, v est
diagonalisable et il existe une base de Ker(Q(u)) constitue de vecteurs propres pour v, et donc
pour u.
Si Ker(u p+1 IdE ) = {0E }, on a alors construit une base de E de vecteurs propres pour u.
Sinon, on juxtapose la base de Ker(Q(u)) que lon a construite, une base de Ker(u p+1 IdE ),
qui par dfinition est constitue de vecteurs propres pour u (associs la valeur propre p+1 ).
Comme Ker(u p+1 IdE ) est supplmentaire de Ker(Q(u)) dans E, on a obtient finalement une
base de E constitue de vecteurs propres pour u, qui est donc diagonalisable, et lhrdit est
dmontre.

Exemple Revenons sur lexemple dun endomorphisme u L (E) (E tant de dimension finie)
tel que u2 2u 3 IdE = 0. Alors le polynme
X 2 2X 3 = (X + 1)(X 3)
est annulateur de u, et il est scind dans R, racines simples, donc u est diagonalisable. Il
existe une base de E dans laquelle la matrice de u est diagonale, ses coefficients diagonaux tant
lments de {1; 3} (mais, sans information supplmentaire, on ne peut pas savoir si 1 et 3
sont tous les deux valeurs propres de u, il se peut que seul lun de ces deux nombres le soit).
Corollaire
Soient u L (E) diagonalisable et F un sous espace vectoriel de E stable par u, avec
F 6= {0E }.
Alors u|F est diagonalisable.
Dmonstration En effet, u est diagonalisable donc admet un polynme annulateur scind
racines simples. Ce mme polynme est aussi annulateur de u|F , qui par consquent est diagonalisable.


V.

Endomorphismes et matrices trigonalisables

Bien sr, parvenir diagonaliser un endomorphisme u est la situation la plus favorable. Il


nest pas toujours possible dy arriver, mais on peut dans ce cas essayer de trouver une matrice
de u non pas diagonale, mais au moins triangulaire suprieure.
Dfinition Trigonalisabilit
On dit quun endomorphisme u L (E) est trigonalisable sil existe une base de
E dans laquelle la matrice de u est triangulaire suprieure.
On dit quune matrice A Mn (K) est trigonalisable si elle est semblable une
matrice triangulaire suprieure.
Remarques
Si B = (e1 , . . . ,en ) est une base de E, alors MatB (u) est triangulaire suprieure si et seulement
si pour tout i [[1,n]],
u(ei ) Vect(e1 , . . . ,ei ).
Dans ce cas, e1 est vecteur propre de u, mais pas ncessairement les autres vecteurs de la base
B.
177

En revanche, les coefficients diagonaux dune matrice triangulaire suprieure T = (ti,j ) reprsentant u sont ncessairement les valeurs propres de u : en effet,
u (X) = det(X IdE u) = det(XIn T ).
Or, la matrice XIn T Q
est triangulaire suprieure, donc son dterminant est le produit de ses
lments diagonaux, ici ni=1 (X ti,i ). On en dduit que les coefficients diagonaux de T sont
exactement les valeurs propres de u.
Thorme Lien entre matrices et endomorphismes trigonalisables
Soit A Mn (K) une matrice carre. Les proprits suivantes sont quivalentes :

A est trigonalisable.
Tout endomorphisme dun K-espace vectoriel de dimension n, de matrice A dans
une certaine base, est trigonalisable.

Si A est trigonalisable et scrit A = P T P 1 avec P inversible et T triangulaire suprieure, alors les coefficients diagonaux de T sont les valeurs propres de A.
Dmonstration Lquivalence vient des formules de changement de base. Si A = P T P 1 avec P
inversible et T triangulaire suprieure, alors les colonnes de P constituent une base de Mn,1 (K)
dans laquelle la matrice de uA est T . Ainsi les coefficients diagonaux de T sont les valeurs propres
de A daprs la remarque prcdente. Il ny a pas quun choix possible de P et T .

De la remarque prcdente, on dduit que, si u L (E) est trigonalisable, alors son polynme caractristique est scind sur K. Cette condition ntait pas suffisante pour que u soit
diagonalisable, elle lest pour que u soit trigonalisable :
Thorme
Soit u L (E).
Pour que u soit trigonalisable, il faut et il suffit que u soit scind sur K.
On a un rsultat analogue pour les matrices carres.
Dmonstration (non exigible)
Cest ce que nous avons montr dans la remarque prcdente.
On va prouver le rsultat pour une matrice A Mn (K), celui sur les endomorphismes sen
dduisant, grce au thorme prcdent. On procde par rcurrence sur n. Si n = 1, le rsultat
est vrai car A est trigonalisable et A scind sur K. Supposons le rsultat vrai pour toute matrice
de Mn (K) et soit A Mn+1 (K) telle que A soit scind sur K. Il existe donc Sp(A), et
X E (A) non nul. En choisissant une matrice P1 Gn+1 (K) dont la premire colonne soit X,
la matrice (P1 )1 A P1 est (daprs les formules de changement de bases) de la forme


L
0 B

o L M1,n (K) et B Mn (K). Alors, on a


A (X) = (X )B (X)
et donc B est scind sur K. Par hypothse de rcurrence, il existe une matrice Q Gn (K) telle
que Q1 BQ soit triangulaire suprieure. En effectuant les calculs par blocs, il est immdiat que




1 0
1
0
est inversible, dinverse
,
0 Q
0 Q1
178

et on a




 

1 0

LQ
=
,
0 Q
0 Q1 BQ


1 0
qui est triangulaire suprieure. Finalement, en posant P = P1
, on a P Gn+1 (K) et
0 Q
P 1 AP est triangulaire suprieure, do le rsultat.

1
0
0 Q1

L
0 B

Corollaire
Toute matrice de Mn (C) est trigonalisable.
Dmonstration Le polynme caractristique dune matrice complexe est scind sur C, comme
tout polynme coefficients dans C (thorme de dAlembert-Gauss). Le rsultat vient donc du
thorme prcdent.

Proprit
Soit u L (E). On suppose que u est scind sur K et on note 1 , . . . ,n les valeurs
propres de u, comptes avec multiplicit.
Alors
n
n
X
Y
i .
i et Tr(u) =
det(u) =
i=1

i=1

On a un rsultat analogue pour une matrice carre.

Dmonstration Daprs le thorme prcdent, u est trigonalisable. Il existe donc une base de
E dans laquelle la matrice de u est de la forme

.
0 . . . . . . ..
,

T = .

..
..
.
0
0 n
Alors

det(u) = det(T ) =

n
Y

et

Tr(u) = Tr(T ) =

n
X

i .

i=1

i=1

Rappel Le rsultat concernant le dterminant avait dj t dmontr plus haut en calculant


de deux faons le coefficient constant de u .
Remarque Une mthode numrique de calcul dune valeur propre
Soit A Mn (C) (n > 2). On note 1 , . . . ,n les valeurs propres de A, classes par module
croissant, et on suppose que n est lunique valeur propre de plus grand module (en particulier,
on a n 6= 0). En raisonnant comme ci-dessus, on a, pour tout k N,
Tr(Ak ) = (1 )k + + (n )k ,
et

donc

Tr(Ak ) (n )k

Tr(Ak+1 )
(n )k+1

= n .
Tr(Ak )
(n )k

Ainsi le quotient des traces de deux puissances itres successives de A permet une approximation
numrique, programmable sur ordinateur, de n , valeur propre de plus grand module de A.
Lintrt dune telle mthode est quelle ne ncessite pas le calcul de A puis la rsolution de
lquation polynomiale A () = 0. En revanche, elle ne donne pas toutes les valeurs propres.
179

Testons cette mthode numriquement avec le module numpy de Python :


>>> import numpy as np
>>> import numpy.linalg as npl
>>> B = np.array([[2,0,4],[3,-4,12],[1,-2,5]])
>>> np.trace(npl.matrix_power(B,10))/np.trace(npl.matrix_power(B,9))
1.9980506822612085
>>> np.trace(npl.matrix_power(B,20))/np.trace(npl.matrix_power(B,19))
1.9999980926550052
>>> npl.eigvals(B)
array([ 2.00000000e+00,
5.09314813e-15,
1.00000000e+00])

On a fait appel la fonction eigvals, qui donne un tableau des valeurs propres (approches)
dune matrice, afin de comparer les rsultats. On rappelle que lon avait obtenu, par le calcul de
B , que les valeurs propres de B sont 0, 1 et 2 (voir page 174).
Exemple Suites rcurrentes linaires dordre n > 2
Dans le chapitre Espaces vectoriels et applications linaires, on sest intress aux suites
dlments de K vrifiant la relation de rcurrence :
k N, uk+2 + auk+1 + buk = 0,
et la condition initiale u0 = x, u1 = y. Nous avons entirement dcrit ces suites. La rduction
donne un nouvel clairage ce problme : notons, pour tout entier naturel k,


uk
Xk =
.
uk+1
Alors, pour tout k N, la relation uk+2 + auk+1 + buk = 0 quivaut :

 


uk+1
0
1
uk
Xk+1 =
=
= AXk ,
uk+2
b a
uk+1
o
A=


0
1
.
b a

Lavantage principal de cette prsentation est davoir transform une relation dordre 2 en une
relation dordre 1 : on se ramne une suite gomtrique dont la raison est la matrice A. En
particulier, pour tout entier naturel k,

 

u0
uk
= Ak
.
Xk = Ak X0 , i.e.
uk+1
u1
On en dduira immdiatement uk . Linconvnient est que cette relation na plus lieu dans K
mais dans M2,1 (K) : ltude du problme nest pas vidente car il nous faudrait dterminer les
puissances de la matrice A.
Essayons donc de trouver une forme rduite intressante pour cette matrice. Son polynme
caractristique est


X
1
A (X) =
= X(X + a) + b = X 2 + aX + b.
b X + a
Il sagit du polynme dfinissant lquation caractristique.

En particulier, si lquation caractristique a deux solutions distinctes r1 et r2 dans K, alors


A est diagonalisable et, en notant P la matrice de passage de la base canonique de M2,1 (K)
une base de vecteurs propres de A, on a


r1 0
A=P
P 1 ,
0 r2
180

et donc pour tout entier naturel k,


Ak = P


(r1 )k
0
P 1 .
0
(r2 )k

Aprs avoir fait le produit par P , P 1 et X0 , on retrouve bien le fait quil existe (,) K2 tel
que, pour tout k N,
uk = (r1 )k + (r2 )k ,
o et dpendent de u0 , u1 , r1 et r2 .
Si lquation caractristique a une solution double r dans K, alors A nest pas diagonalisable :
en effet, si A tait diagonalisable, elle serait semblable la matrice rI2 qui commute avec toute
matrice ; A serait donc gale rI2 , ce qui nest pas le cas. En revanche, A est trigonalisable car
A est scind sur K ; montrons quil existe une matrice inversible P telle que


r 1
A=P
P 1 .
0 r
Ceci quivaut lexistence dune base (e1 ,e2 ) de M2,1 (K) telle que
(
(
Ae1 = re1
(A rI2 )e1 = 0
ce qui quivaut
i.e.
Ae2 = e1 + re2
(A rI2 )e2 = e1

(A rI2 )2 e2 = 0

(A rI2 )e2 = e1

Le polynme caractristique de A tant (X r)2 , le thorme de Cayley-Hamilton montre que


(A rI2 )2 = 0, la premire relation du systme prcdent est donc toujours vraie.
Soit donc e2 M2,1 (K) et e1 = (A rI2 )e2 . Pour que e1 soit non nul, on impose de plus que
e2
/ Ker(A rI2 ). Ceci est possible car Ker(A rI2 ) nest pas gal M2,1 (K), la matrice A
ntant pas gale rI2 .
Il reste seulement montrer que (e1 ,e2 ) est une base de M2,1 (K), et par raison de dimension,
quelle est libre. Soit donc (,) K2 tel que e1 + e2 = 0. En multipliant gauche par A rI2 ,
on obtient
(A rI2 )e1 + (A rI2 )e2 = 0 i.e. e1 = 0.

Comme e1 6= 0, on en dduit = 0. La relation initiale donne alors e1 = 0, do = 0 et le


rsultat.




r 1
r 1
Par construction, la matrice de uA dans cette base est
, donc A est semblable
.
0 r
0 r
Or, une rcurrence immdiate montre que pour tout entier naturel k > 1,


k  k
r 1
r kr k1
.
=
0
rk
0 r

On retrouve le fait quil existe (,) K2 tel que, pour tout k N,


uk = r k + kr k = ( + k)r k ,
o et dpendent de u0 , u1 et r.
Cette mthode se gnralise aux relations de rcurrence linaires scalaires dordre n > 2
quelconque : si (a0 , . . . ,an1 ) Kn , une suite (uk )kN vrifie la relation de rcurrence
k N,

uk+n + an1 uk+n1 + + a0 uk = 0

si et seulement si la suite vectorielle (Xk )kN dfinie

uk
..
Xk = .

par

uk+n1

181

vrifie la relation dordre 1


k N, Xk+1 = AXk ,
o

0
..
.
..
.
..
.

1
..
.

.
..

A=

0

a0 a1

..
.
..
.
..
.

..
..

.
0

0
..
.
..
.
0
1
an1

Mn (K).

Dans le cas o A est diagonalisable, on sait en dduire Xk , et donc uk , pour tout k.


Remarque Calcul des puissances dune matrice
Le calcul de puissances ci-dessus (cas dune racine double) est un cas particulier dune mthode
plus gnrale pour calculer les puissances dune matrice triangulaire suprieure A de la forme
In + N , o In est la partie diagonale de A, et N (comme nilpotente ) sa partie triangulaire
strictement suprieure . Dans ce cas, In et N commutent, donc daprs la formule du binme
de Newton, pour tout k N,
k  
X
k
k
kj N j .
A =
j
j=0

Lavantage de cette dcomposition est que N j = 0 pour tout j > n. Le nombre de termes dans
la somme est donc au plus n, quelle que soit la valeur de k. Par exemple, pour tout k N,


2 3
0 2

k


 
k X

j
k  
2 0
0 3
k kj 0 3
=
+
=
2
.
0 2
0 0
j
0 0
j=0

On a donc, pour tout k > 1,




2 3
0 2

k

=2



  k

1 0
2 3k2k1
k1 0 3
+k2
=
0 1
0
2k
0 0

et cette formule est dailleurs aussi valable pour k = 0.


Comme nous lavions expliqu dans le chapitre Matrices, on peut aussi effectuer le calcul
des puissances k-imes dune matrice carre A partir dun polynme annulateur P de A (par
exemple son polynme caractristique), en dterminant le reste de la division euclidienne de X k
par P . Ce calcul est dautant plus simple que le degr de P est petit.

182

Chapitre 9

Espaces probabiliss
Dans de nombreuses situations, une exprience, reproduite plusieurs fois dans des conditions
apparemment identiques, peut fournir des rsultats diffrents et imprvisibles. Lorsque lon lance
une pice en lair, si lon avait une parfaite connaissance de toutes les donnes (sur la pice,
la faon dont elle est lance, la constitution et le mouvement de lair ambiant, les quations
des diffrents mouvements, le moment o la personne rattrape la pice,...) on serait peut-tre en
mesure de prvoir si le rsultat obtenu est pile ou face . En pratique, une telle connaissance
est sans doute impossible, et la moindre variation dans les conditions de lexprience peut avoir
sur le rsultat une influence qui le rend impossible prvoir.
On considre que de tels phnomnes relvent de lalatoire, du hasard (parmi ces phnomnes, on peut aussi citer le comportement de particules physiques, lvolution du cours de la
bourse, la dmographie, les jeux de hasard). Pour les tudier, on ne cherche pas prvoir leur
rsultat mais on sattache mesurer les chances ou le risque quun vnement se ralise.
La thorie des probabilits donne un cadre mathmatique ce que lon entend par exprience
alatoire et dveloppe des outils permettant ltude des phnomnes associs.
Dans tout le chapitre, est un ensemble ; P() dsigne la collection de toutes les parties de .

I.

Ensembles dnombrables

En premire anne ont t tudies des expriences alatoires ayant un nombre fini de rsultats
possibles. De nombreuses expriences alatoires ont un nombre infini de rsultats possibles. Mais
il convient de distinguer plusieurs types dinfinis, ce qui mne dfinir la notion densemble
dnombrable.
Intuitivement, un ensemble est dnombrable si lon peut tiqueter ses lments, cest-dire en dresser une liste exhaustive o chaque lment est repr par un nombre, lensemble de
ces nombres parcourant N. Mathmatiquement, cela scrit ainsi :
Dfinition Ensemble dnombrable
Soit E un ensemble. On dit que E est dnombrable si E est en bijection avec N,
cest--dire sil existe une bijection de N sur E.
Dans ce cas, on peut noter, pour tout n N, xn = (n), et on a donc E = {xn ; n N}.
Cest ce que lon appelle dcrire E en extension.

Exemples
Lensemble N est bien sr dnombrable (choisir = Id), cest en quelque sorte le modle
densemble dnombrable.
Lensemble 2N des entiers naturels pairs est dnombrable : : n 7 2n est une bijection de N
sur 2N.
183

Remarques
Quitte faire un changement dindice, on peut toujours se ramener une bijection de N sur
E dans la dfinition prcdente.
On montre facilement que les ensembles finis ou dnombrables sont les ensembles qui sont
en bijection avec une partie I de N. Dans le cas o E est fini, on peut choisir I = [[1,m]] avec
m = card(E) ; on peut aussi dcrire E en extension sous la forme E = {x1 , . . . ,xm }.
Proprit
Lensemble Z est dnombrable.
Dmonstration Soit lapplication ainsi dfinie : pour tout k N,
(2k) = k, (2k + 1) = k + 1.
Il sagit dune bijection de N sur Z, ce qui prouve le rsultat.

Proprit
Un produit cartsien densembles dnombrables est dnombrable.
Dmonstration Soient E1 et E2 deux ensembles dnombrables, une bijection de N sur E1 ,
une bijection de N sur E2 . Lide est la suivante : si E1 et E2 sont dcrits en extension sous la
forme
E1 = {xn ; n N}, E2 = {yn ; n N},
on peut dcrire E1 E2 en extension sous la forme

E1 E2 = {(x0 ,y0 ),(x0 ,y1 ),(x1 ,y0 ),(x0 ,y2 ),(x1 ,y1 ),(x2 ,y0 ),(x3 ,y0 ), . . .}.
Ce principe est illustr sur le graphique suivant dans le cas de N2 :

4
b

3
b

2
b

1
b

b
b

b
b

Pour construire explicitement une bijection de N sur E1 E2 qui correspond la description


prcdente, on peut procder ainsi : pour tout n N, soit k lunique entier naturel tel que
1 + 2 + + k 6 n < 1 + 2 + + k + (k + 1)
(k = 0 si n = 0, k = 1 si n [[1,2]]), et soient i = n (1 + 2 + + k), j = k i. On pose alors
(n) = (xi ,yj ). On vrifie facilement que convient.

Exemples
Pour tout n N , Nn , Zn sont dnombrables.
Lensemble des matrices de Mn (R) dont les coefficients appartiennent Z est en bijection avec
2
Zn qui est dnombrable, il est donc galement en bijection avec N, et ainsi dnombrable.
Lide mise en oeuvre dans la dmonstration prcdente peut tre utilise pour montrer que Q
est dnombrable. En revanche, R nest pas dnombrable.
184

II.
1.

Espaces probabiliss
Tribu, probabilit

Modliser une exprience alatoire (afin de pouvoir ltudier), cest choisir :


un ensemble qui permet de reprsenter toutes les issues de lexprience, cest--dire
tous les rsultats possibles de lexprience. Lensemble est appel univers.
une probabilit sur , qui est une fonction ayant certaines proprits qui font que cette
fonction peut tre choisie pour mesurer les chances ou le risque quun rsultat ou ensemble
de rsultats possibles de lexprience (ce que lon appelle sous certaines conditions un
vnement), se ralise.
Exemples
Une exprience alatoire ayant deux issues, lune (interprte comme succs) de probabilit p,
et lautre (chec) de probabilit q = 1 p, est appele preuve de Bernoulli de paramtre p. Cest
le cas de lexprience consistant lancer une fois une pice non ncessairement quilibre (avec
par exemple, p la probabilit dobtenir pile , q celle dobtenir face ).
Lexprience alatoire consistant lancer une fois un d quilibr et noter le rsultat obtenu
peut tre modlise de la faon suivante : lensemble des issues est = {1,2,3,4,5,6}, le fait
que le d soit quilibr se traduit par le choix de la probabilit uniforme sur , cest--dire que
chacun des rsultats possibles a la probabilit 1/6 de se raliser. Le sous-ensemble {2,4,6} de
est lvnement que lon peut dcrire en franais comme le rsultat est un nombre pair .
Une personne se lve de faon alatoire 7h00 ou 7h05 ou 7h10 ou 7h15. Pour son petit
djeuner, elle choisit au hasard soit des tartines, soit des crales. En numrotant 1, 2, 3 et 4
les horaires possibles de lever, et en notant T et C les deux petits djeuners possibles, on peut
modliser lexprience alatoire consistant observer, un jour, lheure de rveil et le choix de
petit djeuner de cette personne, par le choix de
= {(1,C),(1,T ),(2,C),(2,T ),(3,C),(3,T ),(4,C),(4,T )},
chaque lment ayant par exemple une probabilit 1/8 de se produire. Selon la connaissance que
lon a de la situation, on peut bien sr tre amen choisir des valeurs de probabilits diffrentes.
On peut bien sr imaginer des expriences alatoires plus complexes, par exemple des lancers
successifs de pices jusqu obtenir pile trois fois de suite, lobservation du dplacement
dun insecte sur une surface plane, la trajectoire dune balle de tennis. Dans ce cas, dterminer
lensemble des issues peut tre trs complexe, cet ensemble peut notamment tre infini. Pour
cette raison, on est amen prciser ce que lon entend par vnement :
Dfinition Tribu
Soit un ensemble. On appelle tribu sur une partie A de P() telle que :
A,

Pour tout A A , le complmentaire de A, i.e. A = \ A, appartient A .


+
[
An appartient A .
Pour toute suite (An )nN dlments de A , la runion
n=0

Lorsque A est une tribu sur , lensemble est appel univers, et les lments de A
(qui sont des parties de ) sont appels les vnements.
Remarques
Les oprations ensemblistes correspondent bien sr des oprations logiques : le passage au
complmentaire traduit la ngation, la runion correspond ou . Une tribu rassemble tous
les vnements observables lors de lexprience alatoire considre, et la dfinition prcdente
fixe les rgles fondamentales de logique permettant de combiner ces vnements.
185

Il est notamment important de savoir passer de la description dun vnement par une phrase en
franais sa description par oprations ensemblistes partir dautres vnements, et inversement.
Daprs les deux premiers points, = est un vnement.
Si (An )nN est une suite dlments de A ,
+
[

n=0

An = { ; n N, An }.

Cest lensemble des lments de qui appartiennent au moins lun des An , i.e., lvnement
lun au moins des vnements An est ralis .
La collection P() des parties de est une tribu sur (tribu triviale). De mme, {,} est
une tribu sur (tribu grossire).
Pour modliser une exprience alatoire ayant un nombre fini de rsultats possibles, on choisit
de sorte que A = P(). Cest aussi souvent le cas lorsque lensemble des rsultats est
dnombrable. Par exemple, considrons un d six faces sur lequel la face portant le numro
1 est grave de faon habituelle, et les autres faces de sorte que le numro ne soit lisible quau
microscope. Si lexprience consistant lancer une fois ce d est ralise avec microscope, on
choisira pour univers = {1, 2, 3, 4, 5, 6}, mais si elle est ralise sans microscope, on choisira
par exemple = {1, A}, o A reprsente lensemble des autres faces que celle numrote 1.
Dans ce cas, par exemple, 2 ne doit pas tre considr comme une issue, sinon {2} serait un
vnement (puisque A = P()), alors que le rsultat 2 nest pas observable dans les conditions
de lexprience.
En revanche, dans le cas gnral, choisir A = P() est possible mais pas toujours adapt.
Proprit Stabilit par intersection dnombrable
Soit A une tribu sur et (An )nN une suite dvnements. Alors
+
\

n=0

An A .

Ainsi, A est stable par intersection dnombrable : une intersection dnombrable dvnements est un vnement.
Dmonstration Notons B =

+
\

An . Alors

n=0

B=

+
[

n=0

An A

car pour tout n N, An A , et A est stable par runion dnombrable. Alors, par passage au
complmentaire, B A .

Remarques
Avec les notations prcdentes,
+
\

n=0

An = { ; n N, An }.

Cest lensemble des lments de qui appartiennent tous les An , i.e., lvnement tous les
vnements An sont raliss .
Si A0 , . . . ,An sont des vnements, en posant Ak = An pour tout k > n + 1, on a
+
[

k=0

Ak =

n
[

Ak

et

k=0

+
\

k=0

186

Ak =

n
\

k=0

Ak .

On voit donc quune tribu est galement stable par runion et intersection finie.
Le tableau suivant dfinit un certain nombre de termes du vocabulaire des probabilits, en
parallle avec le vocabulaire ensembliste :
Vocabulaire ensembliste
Ensemble
lment de
A A (A P() si est fini)
A
Si est fini par exemple : singleton {}
Ensemble vide
Runion A B
S
Runion +
n=0 An
Intersection A B
T
Intersection +
n=0 An
Complmentaire A = \ A
Parties disjointes : A B =

Vocabulaire des probabilits


Univers, vnement certain
Issue (ou rsultat possible, ou ralisation)
vnement A
Lissue ralise lvnement A
vnement lmentaire
vnement impossible (jamais ralis)
vnement A ou B
vnement lun au moins des An est ralis
vnement A et B
vnement tous les An sont raliss
vnement contraire
vnements incompatibles

Dfinition Systme complet dvnements


On appelle systme complet (dnombrable) dvnements toute suite (An )nN
dvnements telle que :
Les vnements An sont deux deux incompatibles,
+
[
An = .

n=0

Remarques
On dfinit comme en premire anne les systmes complets (finis) dvnements, les An tant
en nombre fini.
Un systme complet dvnement permet de partitionner lunivers en plusieurs vnements, ce
qui permet de faire des disjonctions de cas dans les raisonnements.
Exemples
Si A est un vnement, (A,A) est un systme complet dvnements.
On lance un d six faces. Pour n [[1,6]], on note An lvnement le numro obtenu est n .
La famille (Ai )16i66 est un systme complet dvnements.
Dfinition Probabilit
Soient un ensemble et A une tribu sur . On appelle probabilit sur (, A ) une
application P : A [0,1] telle que :
P () = 1,
Pour
P toute suite (An )nN dlments de A deux deux incompatibles, la srie
n>0 P (An ) converge et
P

+
[

n=0

An

+
X

P (An ).

n=0

Lorsque P est une probabilit sur (, A ), on dit que le triplet (, A , P ) est un espace
probabilis.
Deux vnements A et B tels que P (A) = P (B) sont dits quiprobables.

187

Remarques
La probabilit dun vnement A sinterprte comme la mesure de lensemble des issues
constituant A relativement lensemble des issues. Cest, de faon image, le poids relatif , la
proportion de A dans lunivers .
P
Si (An )nN est un systme complet dvnements, n>0 P (An ) converge et a pour somme 1.

Cas des univers finis

Si est un ensemble fini de cardinal N , la dfinition prcdente est quivalente la dfinition


donne en premire anne, dans laquelle le deuxime point tait remplac par la proprit :
si A et B sont deux vnements incompatibles, P (A B) = P (A) + P (B).
Dans ce cas, on choisit toujours A = P(). On dit alors simplement que le couple (,P ) est un
espace probabilis fini. Avec la rgle de calcul ci-dessus, la fonction P est entirement dtermine
par la donne des probabilits des vnements lmentaires : pour tout A P(),
P (A) =

P ({}).

On dfinit la probabilit uniforme sur en posant, pour tout , P ({}) = 1/N , cest-dire que tous les vnements lmentaires sont quiprobables. Cest le cas dans le deuxime
exemple dcrit plus haut (lancer de d). On a alors, pour tout vnement A,
P (A) =

P ({}) = card(A)

card(A)
1
=
,
N
card()

ce que lon rsume souvent ainsi :


P (A) =

nombre de cas favorables


.
nombre de cas possibles

Le fait de choisir la probabilit uniforme est souvent signal par des expressions comme la pice
est quilibre , le d est quilibr , les billes sont indiscernables au toucher et le contenu
de lurne est soigneusement mlang , etc...
On remarque immdiatement que la situation est plus complexe lorsque lunivers est infini :
il nest pas possible de gnraliser la notion prcdente de probabilit uniforme.
Cas des univers dnombrables
Soit un ensemble dnombrable,
avec = {n ; n N}, et soit (pn )nN une suite de nombres
P
positifs telle
que
la
srie
p
soit convergente et de somme 1. Si A P(), on pose
n
n>0
P
P (A) = n A pn . Alors on pourra vrifier que (, P(), P ) est un espace probabilis, pn tant
pour tout n N la probabilit de lvnement lmentaire {n }.
P
Dans ce qui prcde, la notation n A pn est intuitive, mais lorsque est dnombrable, il
convient de lexpliquer. Dans ce cas, A est lui-mme fini ou dnombrable, et peut-tre dcrit en
extension sous la forme ((1)
P, . . . , (m) ) (o m = card(A)) ou {(k) ; k N} (o est une
bijection de N sur N). Alors n A pn sexprime comme une somme finie ou une somme de srie
convergente :
m
+
X
X
X
X
pn =
p(k) ou
pn =
p(k) .
n A

n A

k=1

k=0

Par exemple, si = N et A = 2N = {2k; k N}, alors P (A) =

P+

k=0 P ({2k}).

Exemples
Une personne participe un jeu dans lequel elle remporte une somme dargent (un nombre
entier naturel deuros) dtermine de faon alatoire. On modlise ce jeu de la faon suivante :
188

= N, lvnement la personne gagne n euros est le singleton {n}. On pose p0 = 0 et, pour
tout n N ,
1
pn = P ({n}) = n .
2
P
La srie n>1 pn (srie gomtrique de raison 1/2 et de premier terme 1/2) converge et
+
X

n=0

pn =

+
X
1
1
1
=
= 1.
n
2
2 1 1/2

n=1

Le triplet (N,P(N),P ) est un espace probabilis modlisant cette exprience.


Considrons lvnement A suivant : la personne remporte une somme paire . On a alors
A = { N; k N, = 2k} =

+
[

{2k}.

k=0

Les vnements {2k} sont deux deux incompatibles, donc par dfinition dune probabilit,
P (A) =

+
X

P ({2k}) = p0 +

k=0

+
X

p2k =

k=1

+
X
1
1
1
1
=
= .
2k
2
4 1 1/4
3
k=1

Fixons p N et considrons lvnement Sp suivant : la personne remporte une somme strictement suprieure p euros . On a alors
Sp = { N; n N; n > p, = n} =

+
[

{n}.

n=p+1

Les vnements {n} pour n > p sont deux deux incompatibles, donc
P (Sp ) =

+
X

n=p+1

P ({n}) =

+
X

1
1
1
1
= p.
= p+1
n
2
2
1 1/2
2
n=p+1

La personne a autant de chances de remporter exactement p euros que de remporter une somme
au moins gale p + 1 euros.
Jeu de pile ou face infini. Lexprience consistant lancer indfiniment une pice peut-tre

modlise par le choix de = {0,1}N des suites termes dans {0,1} indexes partir de 1 (0
reprsente face , 1 reprsente pile ). Cet ensemble nest pas dnombrable, il nest alors pas
vident de dfinir une tribu A sur et une probabilit sur (, A ). On peut montrer quil existe
une tribu A sur qui contient toutes les parties de constitues des lments dont les premiers
termes sont imposs, cest--dire les parties
Cu1 ,...,uk = { = (n )n>1 ; 1 = u1 , . . . , k = uk }
o k N et (u1 , . . . , uk ) {0,1}k reprsente les k premiers termes imposs. Ce sont des
vnements naturels. Il existe alors une probabilit P sur (, A ) telle que, avec les notations
prcdentes,
1
P (Cu1 ,...,uk ) = k .
2
Par exemple :
le rsultat du second lancer est pile est un vnement : il sagit
T de C0,1 C1,1 ;
on nobtient jamais pile est un vnement : il sagit de A0 = +
k=1 Cu1 ,...,uk o tous les
un sont nuls ;
pour tout n N , on obtient pile pour la premire fois au n-ime lancer est un vnement : il sagit de An = C0,...,0,1 (0 apparaissant n 1 fois).
189

La famille (An )nN est un systme complet dnombrable dvnements.


Il existe une tribu A sur [0,1] qui contient les segments inclus dans [0,1], et une probabilit P
sur (, A ) telle que pour tout segment [a,b] inclus dans [0,1], on ait P ([a,b]) = b a. Lespace
probabilis ([0,1], A , P ) peut modliser par exemple lexprience consistant noter le moment
o une particule se dsintgre, lintervalle de temps tant ramen [0,1] si lon est sr que la
dsintgration a lieu avant un temps connu.
Remarques
Un vnement peut tout fait avoir une probabilit nulle sans tre impossible. Cest
P le cas de
tous les singletons dans lexemple prcdent. En particulier, la dfinition P (A) = A P ({})
est impossible gnraliser dans ce cadre.
Lorsque nest pas dnombrable, P nest presque jamais dfinie en donnant la probabilit de
tous les vnements ; on peut par exemple donner (en analysant les conditions de lexprience) la
probabilit dvnements fondamentaux partir desquels on peut retrouver toutes les probabilits
souhaites, en utilisant les rgles de calculs imposes. Dans lexemple du jeu de pile ou face infini,
lvnement A : le rsultat du second lancer est pile est la runion des deux vnements
incompatibles C0,1 et C1,1 , chacun de probabilit 1/4 ; on a donc (voir la proprit suivante)
P (A) = 1/2.
Ce raisonnement se gnralise et montre que pour tout k N , la probabilit dobtenir k
rsultats fixs est 1/2k (et en particulier, chaque lancer, la probabilit dobtenir pile est
1/2) : en fait, cette modlisation porte en elle le fait que la pice est quilibre et que chaque
lancer est indpendant de tous les autres (cette notion sera prcise dans la suite).

2.

Proprits lmentaires
Proprit
Soit (, A , P ) un espace probabilis. Alors :
P () = 0.
Pour tout vnement A, P (A) = 1 P (A).
Si n N et A0 , . . . ,An sont des vnements deux deux incompatibles, lvnement
S
n
k=0 Ak vrifie
!
n
n
[
X
P
Ak =
P (Ak ).
k=0

k=0

Si A et B sont des vnements avec A B, alors P (A) 6 P (B).


Si A et B sont des vnements, lvnement A B vrifie
P (A B) = P (A) + P (B) P (A B).
Si n N et A0 , . . . , An sont des vnements,
!
n
n
X
[
P (Ak ).
Ak 6
P
k=0

k=0

Dmonstration
Posons Bn = P
pour tout n N. Les vnements Bn sont deux deux incompatibles donc
P
n>0 P () converge. Cette srie tant termes constant, on a P () = 0.
n>0 P (Bn ) =

Posons B0 = A, B1 = APet Bn = si n > 2. Les Bn sont des vnements deux deux


incompatibles donc la srie n>0 P (Bn ) converge et
P

+
[

n=0

Bn

+
X

P (Bn ), i.e. P () = P (A) + P (A) daprs le point 1.

n=0

190

Sachant que P () = 1, on obtient le rsultat.


Posons Ak = pour tout k > n + 1. Les Ak sont deux deux incompatibles, donc
!
! +
n
+
n
[
[
X
X
P
Ak = P
Ak =
P (Ak ) =
P (Ak ).
k=0

k=0

k=0

k=0

On crit B = A (B A). Les vnements A et B A = B \ A sont incompatibles, donc


P (B) = P (A) + P (B A) > P (A).
Posons B0 = A B, B1 = A B, B2 = A B. Alors B0 , B1 et B2 sont des vnements deux
deux incompatibles et A B = B0 B1 B2 , donc daprs le point prcdent,
P (A B) = P (A B) + P (A B) + P (A B).
Mais on a galement
P (A) = P (A B) + P (A B) et P (B) = P (A B) + P (A B).
Ainsi

P (A B) = P (A) P (A B) + P (B) P (A B) + P (A B)
= P (A) + P (B) P (A B).

On remarquera en particulier que P (A B) 6 P (A) + P (B).


On prouve cette dernire proprit par rcurrence sur n, partir de lingalit ci-dessus.

Proprit Suites monotones dvnements, sous-additivit


Soient (, A , P ) un espace probabilis et (An )nN une suite dvnements.
Continuit croissante : si pour tout n N, An An+1 , alors
!
+
[
P (An ) P
Ak .
n+

k=0

Continuit dcroissante : si pour tout n N, An+1 An , alors


!
+
\
P (An ) P
Ak .
n+

Sous-additivit : si

n>0 P (An )

+
[

k=0

converge, alors
An

n=0

+
X

P (An ).

n=0

Dmonstration
Posons B0 = A0 et pour tout k N , Bk = Ak Ak1 = Ak \ Ak1 . Alors
+
[

k=0

Ak =

+
[

Bk ,

k=0

les vnements Bk tant deux deux incompatibles : sil existait (n,m) N2 tel que n < m et
Bn Bm 6= , on pourrait trouver un lment de An nappartenant pas Am1 , ce qui est
absurde car An Am1 .
191

Mais, daprs la dmonstration de la proprit prcdente, pour tout k N ,


P (Ak Ak1 ) = P (Ak ) P (Ak1 ).
Finalement,
P

+
[

Ak

k=0

+
X

P (Bk ) = P (B0 ) +

k=0

+
X
k=1

P (Ak Ak1 ) = P (A0 ) +

+
X
(P (Ak ) P (Ak1 )).
k=1

On reconnat une somme de srie tlescopique, et on conclut en rappelant que pour tout n N ,
n
X
(P (Ak ) P (Ak1 )) = P (An ) P (A0 ).
k=1

Posons, pour tout k N, Bk = Ak . Alors, pour tout k N, Bk est un vnement et Bk Bk+1 .


Daprs le point prcdent,
!
+
[
P (Bn ) P
Bk ,
n+

cest--dire

k=0

+
\

1 P (An ) 1 P
n+

Bk

k=0

=1P

+
\

k=0

Ak

do le rsultat. On remarquera que la suite (P (An ))nN est dcroissante.


S
Posons, pour tout n N, Bn = nk=0 Ak . Alors pour tout n N, Bn est un vnement et
Bn Bn+1 , donc daprs la proprit de continuit croissante,
!
!
+
+
[
[
P (Bn ) P
Bk = P
Ak .
n+

k=0

k=0

Mais daprs le dernier point de la proprit prcdente, on obtient, pour tout n N,


P (Bn ) 6

n
X

P (Ak ).

k=0

En passant la limite lorsque n +, on obtient lingalit souhaite.

Exemples
Dans le jeu de pile ou face infini, soit A lvnement on obtient pile au moins deux fois , et
pour tout n > 2, An lvnement on obtient pile au moins deux fois au cours des n premiers
lancers . Raliser An revient obtenir pile aucune fois ou une fois exactement au cours des n
premiers lancers : An est la runion des vnements deux deux incompatibles Cu1 ,...,un o les
ui sont tous nuls, ou bien tous nuls sauf un. Ces vnements sont au nombre de n + 1 et ont tous
pour probabilit 1/2n , donc
n+1
P (An ) = 1 n .
2
S+
De plus, pour tout n > 2, An An+1 ; enfin, A = n=2 An . Ainsi,
P (A) = lim P (An ) = 1
n+

par croissances compares.


S+
Soit (Ak )kN une suite dvnements.
Pour
tout
n

N,
notons
B
lvnement
n
k=n Ak ;
T+
notons galement B lvnement n=0 Bn . Ainsi,
!
+
[
\ +
B=
Ak .
n=0

k=n

192

Il sagit de lvnement une infinit des Ak sont raliss . En effet, B si et seulement si


pour tout n N, il existe k > n tel que Ak , ce qui quivaut au fait que appartient une
infinit de Ak .
P
Supposons que la srie k>0 P (Ak ) converge. Pour toutPn N, B Bn , donc P (B) 6 P (Bn ).
Or, daprs la proprit de sous-additivit et le fait que k>0 P (Ak ) converge, on a pour tout
n N,
+
X
P (Ak ),
P (Bn ) 6
k=n

le majorant tendant vers 0 en tant que reste dune srie convergente. Une probabilit tant
positive, on en dduit que P (Bn ) 0, et donc P (B) = 0. Cette proprit scrit ainsi : presque
srement, le nombre des vnements An qui sont raliss est fini.

III.
1.

Probabilits conditionnelles
Conditionnement

Lors dune exprience alatoire, le fait de savoir (ou dimaginer) quun vnement est ralis
revient ajouter de linformation sur lexprience, et peut modifier notre faon de calculer la
probabilit de certains vnements. Cest ce que lon appelle les probabilits conditionnelles. Soit
(, A , P ) un espace probabilis. Supposons que A soit un vnement tel que P (A) > 0. Calculer
la probabilit quun vnement B soit ralis en sachant que lvnement A est ralis revient
considrer, parmi les issues qui ralisent A, celles qui ralisent galement B. Tout se passe comme
si, pour ce calcul, on considrait lexprience alatoire travers le filtre de lvnement A,
comme si lon considrait A comme univers.
Dfinition Probabilit conditionnelle
Soit A un vnement tel que P (A) > 0. Pour tout vnement B, on appelle probabilit
conditionnelle de B sachant A le rel, not PA (B) ou P (B | A), dfini par
PA (B) =

P (A B)
.
P (A)

On a donc P (A B) = P (B | A)P (A).


Remarque Sachant que A B A, on a P (A B) 6 P (A), et donc avec le fait que P (A) > 0,
on a PA (B) [0,1].
Exemple Reprenons lexemple du petit djeuner expos au dbut de ce chapitre, avec la probabilit dfinie par le tableau suivant :

(1,C) (1,T ) (2,C) (2,T ) (3,C) (3,T ) (4,C) (4,T )


P ({}) 0,2
0,05
0,1
0,15 0,05
0,3
0,05
0,1
Notons A lvnement la personne se lve 7h00 (i.e., lensemble des issues dont la
premire composante est 1) et B lvnement la personne choisit des crales (i.e., lensemble
des issues dont la deuxime composante est C). Alors on a
P (A) = 0,2 + 0,05 = 0,25,
P (B | A) =

P (B) = 0,2 + 0,1 + 0,05 + 0,05 = 0,4

P (A B)
0,2
4
=
= ,
P (A)
0,25
5

P (A | B) =

P (A B)
0,2
1
=
= .
P (B)
0,4
2

On notera que le calcul dune probabilit conditionnelle nest pas confondre avec un lien
de cause effet, on peut calculer P (A | B) mme si la personne se lve avant de djeuner !
Simplement, quelquun arrivant chez cette personne aprs son djeuner, voyant un bol vide sur
193

la table (et disposant du tableau prcdent), peut affirmer quil y a une chance sur deux que
la personne se soit leve 7h00. Sans cette information, on pouvait donner une probabilit
P (A) = 0,25, deux fois moindre !
Proprit/Dfinition Probabilit conditionnelle
Soit A un vnement tel que P (A) > 0. Lapplication

A [0,1]
PA :
B 7 PA (B)
est une probabilit sur (, A ), appele probabilit conditionnelle sachant A.
Dmonstration On a remarqu plus haut que PA est valeurs dans [0,1]. On a
PA () =

P ( A)
P (A)
=
= 1.
P (A)
P (A)

Enfin, si (Bn )nN est une suite dvnements deux deux incompatibles, on a
!
!
!
+
+
+
[
[
[
1
1
Bn =
(A Bn ) .
P A
P
Bn =
PA
P (A)
P (A)
n=0
n=0
n=0
Les vnements Bn sont deux deux incompatibles, donc les vnements A Bn galement ; P
tant une probabilit, on a alors
!
+
+
+
+
[
X
1 X
P (A Bn ) X
Bn =
PA
PA (Bn ).
P (A Bn ) =
=
P
(A)
P
(A)
n=0
n=0
n=0
n=0
On a vrifi les diffrentes proprits qui font de PA une probabilit sur (, A ).

Remarque Si P (A) = 0, afin que lgalit P (A B) = P (B | A)P (A) reste valable, on pose par
convention P (B | A)P (A) = 0 (mais le terme P (B | A) seul nest pas dfini dans ce cas).

2.

Proprits et utilisation des probabilits conditionnelles


Proprit Formule des probabilits composes
Soient A1 , . . . ,Ap des vnements (p > 2) tels que P (A1 Ap1 ) > 0. Alors
P (A1 Ap ) = P (A1 ) P (A2 | A1 ) P (A3 | A1 A2 ) P (Ap | A1 Ap1 ).

Dmonstration On procde par rcurrence sur le nombre p > 2 dvnements :


Initialisation (p = 2) : cela rsulte de la dfinition de P (A2 | A1 ) (on a P (A1 ) > 0 par hypothse).
Hrdit : supposons le rsultat vrai pour un nombre p > 2 dvnements, et considrons
A1 , . . . ,Ap+1 des vnements tels que P (A1 Ap ) > 0. Alors, par dfinition
P (A1 Ap+1 ) = P (Ap+1 | A1 Ap ) P (A1 Ap ).
Or on a galement P (A1 Ap1 ) > 0, et donc par hypothse de rcurrence,
P (A1 Ap ) = P (A1 ) P (A2 | A1 ) P (A3 | A1 A2 ) P (Ap | A1 Ap1 ).
Des deux galits prcdentes, on dduit le rsultat au rang p + 1 et finalement pour tout p > 2
par principe de rcurrence.

194

Remarque On ralise parfois des arbres pour reprsenter une exprience alatoire. La formule
des probabilits composes traduit le fait que la probabilit dun chemin est le produit des
probabilits des artes qui le composent.
Exemple Une personne qui se rend au restaurant prend uniquement un plat une fois sur trois,
un menu sinon (vnement M ). Lorsquelle prend un menu, elle choisit de la viande (vnement
V ) une fois sur deux. Dans ce cas, elle prend un caf (vnement C) trois fois sur quatre.
Les donnes du problme se traduisent de la manire suivante :
P (M ) = 1

2
1
3
1
= , P (V | M ) = , P (C | M V ) = .
3
3
2
4

La probabilit pour que la personne choisisse un menu avec viande puis caf est, daprs la
formule des probabilits composes,
P (M V C) = P (M )P (V | M )P (C | M V ) =

2 13
1
= .
3 24
4

Proprit Formule des probabilits totales


Soient
(An )nN un systme complet dvnements et B un vnement. Alors la srie
P
P
n>0 (B An ) converge, et on a
P (B) =

+
X

n=0

P (B An ) =

+
X

n=0

P (B | An )P (An ).

Le rsultat prcdent reste valable dans le cas plus gnral suivant :


(An )nN est une suite dvnements deux deux incompatibles tels que

+
X

P (An ) = 1.

n=0

Dmonstration Il suffit de faire la dmonstration sous la deuximeP


hypothse, puisquelle est
plus gnrale. On se place donc dans ce cadre. Tout dabord, la srie n>0 P (B An ) converge,
car S
les vnements B An sont deux deux incompatibles. De plus, notons N lvnement
\ +
n=0 An . Les An tant deux deux incompatibles,
P

+
[

An

n=0

+
X

P (An ) = 1

n=0

et donc P (N ) = 0. En particulier, P (B N ) = 0. On a alors


B =B=B

+
[

An

n=0

= (B N )

+
[

(B An ).

n=0

Les An et N forment une famille dvnements deux deux incompatibles, donc cest aussi le
cas des B An et de B N , et on a finalement
P (B) = P (B N ) +

+
X

n=0

P (B An ) =

+
X

n=0

P (B An ) =

+
X

n=0

P (B | An )P (An ).

Cas particulier Lorsque A est un vnement, (A, A) est un systme complet dvnements,
donc pour tout vnement B,
P (B) = P (B | A)P (A) + P (B | A)P (A).
195

Proprit Formules de Bayes


Soient A et B deux vnements tels que P (B) > 0. Alors
P (A | B) =

P (B | A)P (A)
.
P (B)

Soient B un vnement tel que P (B) > 0 et (An )nN une suite dvnements deux
+
X
P (An ) = 1. Alors, pour tout j N,
deux incompatibles tels que
n=0

P (Aj | B) =

P (B |Aj )P (Aj )

+
X

n=0

P (B |An )P (An )

Dmonstration
Sachant que P (B) > 0, on peut crire
P (A B)
P (B | A)P (A)
=
= P (A |B).
P (B)
P (B)
Il suffit de reprendre la mme ide en crivant de plus que P (B) =
la formule des probabilits totales.

+
X

n=0

P (B |An )P (An ) daprs




Exemple On prsente un candidat trois coffres ferms. Lun des coffres contient un lingot dor,
les deux autres sont vides. Le candidat choisit un coffre ; lorganisateur, qui connat lemplacement
du lingot, dvoile, parmi les coffres non choisis, un coffre vide (de faon quiprobable lorsque le
candidat a choisi le bon coffre). On propose alors au candidat de maintenir son choix ou de
changer de coffre, puis douvrir le coffre choisi. Quelle est la meilleure stratgie ?
Numrotons 1 le coffre choisi par le candidat au dbut du jeu, et 2, 3 les deux autres coffres.
Pour i {2,3}, notons Ci lvnement lorganisateur ouvre le coffre i et pour i {1,2,3}, Li
lvnement le lingot se trouve dans le coffre i .
Le problme revient comparer P (L1 | C2 ) et P (L1 | C2 ) = 1 P (L1 | C2 ). Daprs la seconde
formule de Bayes,
P (C2 | L1 )P (L1 )
P (C2 | L1 )P (L1 ) + P (C2 | L2 )P (L2 ) + P (C2 | L3 )P (L3 )
1 1

1
2 3
=
= .
1
1
1 1
3
+0 +1
2 3
3
3

P (L1 | C2 ) =

On obtient le mme rsultat pour P (L1 | C3 ). La meilleure stratgie est donc de changer de
coffre !
On remarquera que lon na pas eu besoin de prciser pour rpondre la question, mais
simplement de traduire les conditions de lexprience. On peut souvent admettre lexistence de
(, A , P ).

196

IV.

vnements indpendants

Dans de nombreuses situations, le fait de savoir quun vnement A est ralis napporte rien
pour le calcul de la probabilit dun vnement B. Cest la notion dvnements indpendants :
Proprit/Dfinition : vnements indpendants
Soient A et B deux vnements. On dit que A et B sont indpendants si
P (A B) = P (A) P (B).
Si P (A) > 0, ceci quivaut : P (B | A) = P (B).
Lquivalence des deux proprits lorsque P (A) > 0 est immdiate car
P (B | A) =

P (A B)
.
P (A)

On remarquera cependant que la deuxime formulation nest pas symtrique en A et B, alors


que la premire lest.
Dfinition vnements mutuellement indpendants
Soient A1 , . . . ,Ap des vnements. On dit que A1 , . . . ,Ap sont mutuellement indpendants si pour tout sous-ensemble J de [[1,p]], on a
!
Y
\
P (An ).
An =
P
nJ

nJ

Proprit Indpendance mutuelle / indpendance deux deux


Des vnements A1 , . . . ,Ap mutuellement indpendants sont deux deux indpendants.
La rciproque est fausse en gnral : si n > 3, lindpendance de n vnements deux
deux nentrane pas leur indpendance mutuelle.
Dmonstration Si A1 , . . . ,Ap sont mutuellement indpendants, alors pour tout (i,j) [[1,p]] tels
que i 6= j, en choisissant J = {i,j} dans la dfinition, on obtient
P (Ai Aj ) = P (Ai )P (Aj ).
Donc A1 , . . . ,Ap sont deux deux indpendants.
En revanche, considrons lexemple suivant : on dispose de quatre livres, un livre de mathmatiques, un livre de physique, un livre de chimie, et un livre mathmatiques-physique-chimie.
On choisit au hasard, avec la probabilit uniforme, un livre parmi les quatre. Notons M , et C
les vnements le livre choisi traite notamment de mathmatiques (respectivement physique,
chimie). On a
1
P (M ) = P (M C) = P ( C) =
4
 2
1
2
=
P (M )P () = P (M )P (C) = P ()P (C) =
4
4

donc les vnements M , et C sont deux deux indpendants. Pourtant, ils ne sont pas mutuellement indpendants car
 3
2
1
1
et P (M )P ()P (C) =

= .
P (M C) =
4
4
8
197

Remarque Si A et B sont indpendants, alors A et B sont indpendants : en effet,


P (A) = P (A B) + P (A B) = P (A)P (B) + P (A B)
et donc
P (A B) = P (A)(1 P (B)) = P (A)P (B).
Plus gnralement, si A1 , . . . ,Ap sont mutuellement indpendants, et si pour tout i [[1,p]],
Bi = Ai ou Bi = Ai , alors B1 , . . . ,Bp sont mutuellement indpendants.
Exemples
Lors dun parcours vlo, les vnements le trajet est parcouru en moins de n minutes et
lvnement il y a un vent de face de 40 km/h ne sont sans doute pas toujours indpendants !
Lindpendance entre vnements relve parfois de la modlisation : on postule que certains
vnements fondamentaux sont indpendants.
Par exemple, dans un jeu de pile ou face, on considre dans la plupart des cas que les lancers
sont mutuellement indpendants. Ce type dexprience sera dailleurs plutt modlis ainsi, en
faisant lhypothse qu chaque lancer, pile et face ont des probabilits dapparition
respectives p et q = 1 p, et lhypothse dindpendance mutuelle des lancers.
Lorsque p = q = 1/2, le fait que pour tout n N , les vnements consistant fixer les
rsultats des n premiers lancers aient pour probabilit 1/2n , est alors une consquence de cette
modlisation, ce qui est une dmarche peut-tre plus naturelle que de postuler ces probabilits.
Par exemple, lvnement pile apparat pour la premire fois au n-ime lancer a pour
probabilit 1/2n (car il correspond n1 premiers rsultats face suivis dun rsultat pile ).
De plus, lvnement tous les lancers donnent face est de probabilit nulle : pour tout n N ,
cet vnement est inclus dans un vnement de probabilit 1/2n , celui consistant fixer n premiers
rsultats face . Il suffit alors de faire tendre n vers +.

198

Chapitre 10

Intgrales gnralises
Le but de ce chapitre est de dfinir lintgrale dune fonction continue par morceaux sur un
intervalle quelconque de R ; a et b dsignent deux lments de R {} tels que a < b (avec
des conventions videntes si a et/ou b est infini), et I dsigne un intervalle dextrmits a et
b. Lintervalle I peut donc tre de lune des quatre formes suivantes : [a,b] (avec a et b finis),
[a,b[ (avec a fini), ]a,b] (avec b fini), ou ]a,b[. On remarquera que le premier cas correspond
lintgrale sur un segment, et a donc t tudi dans le chapitre Drivation et intgration
des fonctions de R dans K. Enfin, K dsigne R ou C.

I.

Convergence des intgrales gnralises

1.

Dfinitions
Dfinition Convergence dune intgrale gnralise
Soit f : I K une fonction continue par morceaux.
Z b
Si I = [a,b[, on dit que lintgrale gnralise
f (t) dt est convergente si la fonction
a
Z x
f (t) dt possde une limite dans K lorsque x b .
x 7
a
Z b
Si I = ]a,b], on dit que lintgrale gnralise
f (t) dt est convergente si la fonction
a
Z b
f (t) dt possde une limite dans K lorsque x a+ .
x 7
x
Z b
f (t) dt.
Dans les deux cas prcdents, en cas de convergence, la limite est note
a
Z b
f (t) dt est convergente sil existe
Si I = ]a,b[, on dit que lintgrale gnralise
a
Z c
Z b
c ]a,b[ tel que les deux intgrales gnralises
f (t) dt et
f (t) dt soient convera

gentes. Dans ce cas, on pose


Z

f (t) dt =

f (t) dt +
a

f (t) dt = lim

xa+

f (t) dt + lim

yb

f (t) dt.
c

Dans tous les cas, on dit que lintgrale est divergente si elle nest pas convergente.
Remarques
On appelle nature dune intgrale gnralise son caractre convergent ou divergent.
Par dfinition, f est continue par morceaux sur I si elle est continue par morceauxR sur tout
x
segment de I. Ainsi, lorsque I = [a,b[ par exemple, alors pour tout x [a,b[, lintgrale a f (t) dt
apparaissant dans la dfinition est lintgrale usuelle de f sur le segment [a,x].
199

Ces dfinitions sont trs similaires celles de srie et de somme de srie convergente.
P
En revanche, pour les sries, on distinguait les notations
n>0 un (la suite des sommes
P+
partielles) et, en cas de convergence, n=0 un (la somme de la srie). Ici, la mme notation est
utilise pour dsigner lintgrale gnralise de f avant de savoir si elle converge ou diverge , et
sa valeur en cas de convergence. Il faut donc tre particulirement vigilant sur le sens des objets
utiliss, et notamment, ne pas faire de calculs ou de majorations sur des intgrales gnralises
avant davoir prouv la convergence de tous les termes.
Lintervalle I nest Rpas toujours directement donn : lorsque lon tudie la convergence dune
b
intgrale gnralise a f (t) dt, il y a trois formes possibles pour I. En pratique, on identifie le
plus grand intervalle I dextrmits a et b sur lequel f est continue par morceaux, et on commence
toujours la rdaction par une phrase du type f est continue par morceaux sur I .

2.

Intgrales de rfrence

Les intgrales gnralises suivantes sont dutilisation trs frquente. Leur nature est explicitement au programme, mais pas la valeur des deux dernires en cas de convergence.
Z +
dt
, o R.
Intgrales de Riemann sur [1, + [ :
t
1
La fonction t 7 1/t est continue (et donc continue par morceaux) sur [1, + [. Pour x > 1,
Z



x


1
1
t1

=
si 6= 1
1 1
dt
1 1
1
x
=

t
ln(x)
si = 1.

On en dduit que lintgrale est convergente si et seulement si > 1, et dans ce cas


Z

La fonction t 7

Intgrales de Riemann sur ]0,1] :


1/t

1
dt
.
=
t
1
dt
, o R.
t

est continue sur ]0,1]. Pour x ]0,1],


Z


1


t1
1

dt
=
1 x1
si 6= 1
=
1 x 1

t
ln(x)
si = 1.

On en dduit que lintgrale est convergente si et seulement si < 1, et dans ce cas


Z

+
0

1
0

1
dt
=
.

t
1

et dt o R. La fonction t 7 et est continue sur [0, + [. Pour tout x > 0,


Z

x
0

x

1 et = 1 (1 ex ) si 6= 0

et dt =
0

x
si = 0

On en dduit que lintgrale converge si et seulement si > 0, et dans ce cas


Z

et dt =

200

1
.

ln(t) dt. La fonction ln est continue sur ]0,1]. Pour tout x ]0,1], une intgration par parties

(les fonctions t 7 t et t 7 ln(t) tant de classe C 1 sur [x,1]) montre que


Z 1
ln(t) dt = [t ln(t) t]1x = x ln(x) + x 1 1.
x0+

Lintgrale est donc convergente et

3.

ln(t) dt = 1.

Lien avec lintgrale sur un segment

Lorsque f est continue par morceaux sur le segment [a,b] (a et b finis), la notion dintgrale
gnralise concide avec la notion usuelle dfinie dans le chapitre Drivation et intgration
des fonctions de R dans K.
Proprit
Soit f : [a,b] K une application continue par morceaux (a est b sont finis).
Alors les trois intgrales
R de f sur [a,b[, ]a,b] et ]a,b[ sont convergentes, et leur valeur est
lintgrale usuelle [a,b] f.
Dmonstration La fonction f est continue par morceaux sur [a,b], elle est donc borne, do,
pour x [a,b[,
Z
Z

Z

x
b



f (t) dt 6 (b x)kf k 0.
f =
f (t) dt

a
xb
x
[a,b]

On en dduit le rsultat dans le cas de lintgrale sur [a,b[. On procde de faon similaire pour
lintgrale sur ]a,b], puis, pour lintgrale sur ]a,b[, on dcoupe les intgrales sur [x,y] ]a,b[ et
sur [a,b] en deux, grce une borne c ]a,b[ quelconque, et on applique les rsultats des deux
autres cas.

On en dduit en particulier le rsultat suivant :
Proprit
Si b est fini, soit f : [a,b[ K une fonction continue qui admet une limite dans K en
Z b

f (t) dt est convergente. On parle de faux problme en b.


b . Alors
a

Dmonstration Dans ce cas, f est prolongeable par continuit en b en une fonction f continue
sur [a,b]. Alors, pour x [a,b[,
Z x
Z b
Z x

f (t) dt
f (t) dt =
f(t) dt.
a

xb

Lintgrale est donc convergente.



Z 2
sin(t)
dt est convergente : t 7 sin(t)/t est continue sur ]0,1] et
Exemple Lintgrale
t
0
sin(t)
sin (0) = 1. Il y a un faux problme en 0.
t t0
Attention ! Il ny a pas de faux problme en +. Par exemple, ce nest pas parce quune
fonction f : [a, +
[ K continue par morceaux possde une limite dans K en +, mme nulle,
R +
que lintgrale a f (t) dt converge. On la bien vu avec lexemple de la fonction inverse, dont
lintgrale sur [1, + [ diverge.
201

Il ny a pas non plus de condition ncessaire de convergence pour les intgrales (et cest l une
Rb
diffrence avec les sries) : du fait que a f (t) dt converge, on ne peut pas dduire que f possde
des limites dans K aux bornes de I. On a dj montr que la fonction logarithme nprien,
qui possde une limite infinie en 0+ , a une intgrale convergente sur ]0,1]. On construit mme
facilement des fonctions continues non bornes sur [0, + [ qui ont une intgrale convergente :
penser une fonction en triangles pour laquelle la somme des aires des triangles est la somme
dune srie convergente.
Il ne faut donc pas croire que les problmes de convergence se traitent uniquement en examinant les limites ventuelles de f aux bornes.

4.

Proprits lmentaires
On peut facilement se ramener des fonctions valeurs relles :
Proprit
Soit f : I C une fonction continue par morceaux.
Z b
f (t) dt converge si et seulement si les deux intgrales
Lintgrale
a

b
a

Re(f (t)) dt

et

b
a

Im(f (t)) dt

convergent. Dans ce cas,


Z

f (t) dt =

Re(f (t)) dt + i

b
a

Im(f (t)) dt.

Les proprits lmentaires de lintgrale sont galement valables pour les intgrales gnralises :
Proprit Linarit de lintgration
Soient f et g deux fonctions continues par morceaux sur I valeurs dans K, et K.
Z b
Z b
Z b
Si
f (t) dt et
g(t) dt convergent, alors
(f (t) + g(t)) dt converge et
a

(f (t) + g(t)) dt =

f (t) dt +
a

g(t) dt.
a

Proprit Positivit et croissance de lintgrale


Soient f et g deux fonctions continues par morceaux sur I valeurs dans R telles que
Z b
Z b
g(t) dt convergent. On rappelle que a < b.
f (t) dt et
a

Alors :

Si f > 0 sur I,
Si f 6 g sur I,

Za b
a

f (t) dt > 0.
Z b
g(t) dt.
f (t) dt 6
a

202

Dmonstration des trois proprits prcdentes Il suffit dcrire la proprit correspondante (donne dans le chapitre Drivation et intgration des fonctions de R dans K) sur un segment
inclus dans I ([a,x], [x,b] ou [x,y] selon la forme de I) puis, en cas de convergence, de passer
la limite. Pour la premire proprit, on utilise la caractrisation de la limite laide des parties
relle et imaginaire, pour la deuxime, une combinaison linaire de limites, et pour la troisime,
un passage la limite dingalits larges.


Proprit Relation de Chasles


Soit f : I K une fonction continue par morceaux, et soit c I.
Z b
Z b
Si I = [a,b[, alors
f (t) dt converge si et seulement si
f (t) dt converge.
a
c
Z c
Z b
f (t) dt converge.
f (t) dt converge si et seulement si
Si I = ]a,b], alors
a
a
Z b
Z c
Z b
f (t) dt
f (t) dt et
f (t) dt converge si et seulement si
Si I = ]a,b[, alors

f (t) dt =

f (t) dt +
a

convergent.
Dans les trois cas, en cas de convergence, on a

f (t) dt.
c

Dmonstration
Les deux premiers points sont similaires, on ne traite que le premier. Soit x I ; daprs la
relation de Chasles pour les segments,
Z
Le terme

f (t) dt =
a

f (t) dt +

f (t) dt.

f (t) dt tant indpendant de x, les deux autres termes sont de mme nature, et en
a

cas de convergence, on a la formule annonce en faisant tendre x vers b par valeurs infrieures.
Z b
Z c
f (t) dt convergent, alors
f (t) dt et
Dans le cas o I = ]a,b[, si les deux intgrales
c
a
Z b
f (t) dt converge et on a la formule annonce, par dfinition.
a

f (t) dt
f (t) dt et
f (t) dt converge, il existe d I tel que
d
aZ
a
Z c
b
f (t) dt convergent.
f (t) dt et
convergent. Daprs les deux premiers points, pour tout c I,
Rciproquement, si

Remarques
Le premier point montre bien que le problme de convergence ne vient que du voisinage de b
(resp. a) dans le cas dune intgrale gnralise sur [a,b[ (resp ]a,b]).
Dans le cas I = ]a,b[, on notera bien la diffrence entre la proprit ci-dessus (nonce avec un
quantificateur universel : pour tout c I, ... ), et la dfinition (nonce avec un quantificateur
existentiel : il existe c I tel que ... ). La proprit prcdente est donc indispensable, pour
Rb
prouver que a f (t) dt ne dpend pas du dcoupage de lintervalle.
203

Pour les fonctions valeurs positives, on a un critre de convergence :


Proprit
Soit f une fonction continue par morceaux sur I valeurs relles positives.
Z x
Z b
f (t) dt soit
f (t) dt converge, il faut et il suffit que x 7
Si I = [a,b[, pour que
Si I = ]a,b], pour que

majore sur ]a,b].

majore sur [a,b[.

b
a

f (t) dt converge, il faut et il suffit que x 7

Dmonstration Dans le premier cas, la fonction x 7

f (t) dt soit

f (t) dt est croissante sur [a,b[, le rsultat


a

vient donc du thorme de la limite monotone. Le deuxime cas est similaire.

II.

Intgrales absolument convergentes, fonctions intgrables

On rappelle que I est un intervalle quelconque de R dextrmits a et b, ventuellement


infinies.

1.

Dfinition, lien avec la convergence


Dfinition Convergence absolue
Soit f : I K une fonction continue par morceaux.
Z b
f (t) dt est absolument convergente si lintgrale
On dit que lintgrale
a
Z b
|f (t)| dt est convergente.
a

Remarque Pour les fonctions de signe constant, les notions dintgrale convergente et absolument
convergente concident.

Pour une fonction de signe quelconque, lintrt majeur de cette notion est que, comme pour
les sries, la convergence absolue entrane la convergence :
Thorme
Soit f : I K une fonction continue par morceaux.
Z b
f (t) dt est absolument convergente, alors elle est convergente.
Si lintgrale
a

Dans ce cas, on a

Z b
Z b



f (t) dt 6
|f (t)| dt.

a

Dmonstration On raisonne dans le cas o I = [a,b[, les autres cas sont similaires. Lide est
exactement la mme que pour les sries. Posons g = Re(f ) et
1
g+ = max{0,g} = (|g| + g),
2

g = max{0, g} =

1
(|g| g).
2

Les fonctions g+ et g sont continues par morceaux sur I et vrifient


p
0 6 g+ 6 |g| 6 Re(f )2 + Im(f )2 = |f |, 0 6 g 6 |g| 6 |f |.
204

Pour x [a,b[ par croissance de lintgrale, on a


Z
Z x
+
g (t) dt 6
a

x
a

|f (t)| dt.

Rx
Rb
La fonction x 7 a |f (t)| dt
R xest+ majore sur [a,b[ +car a |f (t)| dt converge. Il en est donc de
mme pour la fonction x 7 a g (t) et la fonction g tant positive, on en dduit que lintgrale
Rb +
Rb
a g (t) dt converge. On obtient de mme la convergence de a g (t) dt.
Rb
On remarque enfin que lon a g = g+ g , et donc, par diffrence, a g(t) dt converge. On
Rb
procde de mme avec la partie imaginaire Im(f ), do la convergence de a f (t) dt.
En utilisant lingalit triangulaire sur les segments, puis en passant la limite, on obtient
lingalit souhaite.

Dfinition
Soit f : I K une fonction continue par morceaux.
Z b
f (t) dt est absolument convergente.
On dit que f est intgrable sur I si
a

La valeur de cette intgrale est bien dfinie daprs le thorme prcdent. Elle pourra
tre note
Z
Z
Z b
f.
f (t) dt ou
f (t) dt (notation dj dfinie), mais aussi
I

2.

Thormes de comparaison
Thorme de comparaison
Soient f : [a,b[ K et g : [a,b[ K deux fonctions continues par morceaux.
Si |f | 6 |g| sur [a,b[, et si g est intgrable sur [a,b[, alors f est intgrable sur [a,b[.

On a la mme conclusion si lingalit |f | 6 |g| est remplace par lune des conditions
f (t) = O(g(t))
tb

ou f (t) = o(g(t)).
tb

Si f (t) g(t), alors f est intgrable sur [a,b[ si et seulement si g est intgrable sur
tb

[a,b[.

Remarque On adaptera facilement ce thorme au cas dune intgrale gnralise sur ]a,b], et
on peut combiner ces rsultats pour traiter une intgrale gnralise sur ]a,b[.
Dmonstration
On reprend une ide dj utilise ci-dessus. Pour x [a,b[ par croissance de lintgrale, on a
Z x
Z x
|g(t)| dt.
|f (t)| dt 6
a

Rx
La fonction g est intgrable sur [a,b[, donc
R x la fonction x 7 a |g(t)| est majore sur [a,b[. Il en
est donc de mme pour la fonction x 7 a |f (t)|, ce qui montre que f est intgrable sur [a,b[.

Dans ce cas, il existe M > 0 et a0 [a,b[ tel que pour tout t [a0 ,b[, |f (t)| 6 M |g(t)|. On
prouve alors le rsultat de la mme faon que le premier point, lintgrale de |f | et |g| sur [a0 ,b[
et lintgrale sur [a,b[ tant de mme nature. Le cas dun petit o sen dduit car il est contenu
dans celui dun grand O .
205

Si f (t) g(t), alors on a f (t) = O(g(t)) et g(t) = O(f (t)). Le rsultat vient donc du
tb

point prcdent.

tb

tb

Remarque Ces rsultats sont trs frquemment utiliss en association avec les proprits suivantes que nous avons dj donnes :
Z b
f (t) dt.
Pour des fonctions positives, lintgrabilit de f sur I quivaut la convergence de
a
Z b
f (t) dt.
Lintgrabilit de f sur I entrane la convergence de
a

Exemples
La fonction t 7

sin(t)
est continue sur [1, + [. Pour tout t > 1,
t2


sin(t)
1


t2 6 t2 ,

et t 7 1/t2 est intgrable sur [1, + [ (critre des intgrales de Riemann sur [1, + [, exposant
2 > 1).
sin(t)
Par comparaison, la fonction t 7
est intgrable sur [1, + [.
t2
Z +
sin(t)
dt converge.
En particulier, lintgrale
t2
1
et
est continue sur [1, + [ et valeurs positives. Pour tout t > 1,
La fonction t 7
t
06

et
6 et
t

et t 7 et est intgrable sur R+ (intgrale de rfrence) donc sur [1, + [. Par comparaison,
et
t 7
est intgrable sur [1, + [.
t
t cos(t)
La fonction t 7 t
est continue sur ]0, + [. Examinons la convergence ventuelle de
e 1
Z +
t cos(t)
dt. Tout dabord, il y a un faux problme en 0 car
et 1
0
t
t cos(t)

= 1.
t
+
e 1 t0 t
De plus, pour t > 0


t cos(t)
t


et 1 6 et 1

avec

et

t
1

t+

t et

t+

O(et/2 )

car t et/2 0.
t+

t
La fonction t 7 et/2 est intgrable sur [1,+[, donc par comparaison, t 7 t et puis t 7 t
e 1
Z +
t cos(t)
t cos(t)
sont intgrables sur [1, + [. Finalement,
dt converge absolument,
et t 7 t
e 1
et 1
0
et donc converge.
1
est continue sur [0,1[, valeurs positives. On a
La fonction t 7
1 t2
1
1
1

.
=
1 t2
(1 + t)(1 t) t1 2(1 t)
206

Or t 7

1
nest pas intgrable sur [0,1[, car elle est valeurs positives et pour tout x [0,1[,
1t
Z x
1
dt = ln(1 x) avec ln(1 x) +.
x1
0 1t

1
nest pas intgrable sur [0,1[, et comme elle est valeurs positives,
Par comparaison, t 7
1 t2
Z 1
dt
diverge.
2
0 1t
ln(t)
est continue sur [3, + [, valeurs positives. Pour tout t > 3,
La fonction t 7
t
ln(t)
1
> > 0,
t
t
et t 7 1/t nest pas intgrable sur [3, + [.

ln(t)
nest pas intgrable sur [3,+[,
Par la contrapose du premier rsultat de comparaison, t 7
t
Z +
ln(t)
dt diverge.
et comme elle est valeurs positives,
t
3

Attention ! De mme que pour les sries, la convergence nentrane pas la convergence absolue.
Si un thorme de comparaison amne la conclusion que f nest pas intgrable sur [a,b[, il se
Z b
f (t) dt converge.
peut malgr tout que
a

Dans les deux derniers exemples ci-dessus, nous pouvions conclure la divergence des intgrales
car les fonctions compares taient positives.

III.
1.

Mthodes de calcul des intgrales gnralises


Utilisation dune primitive

Bien sr, la premire mthode essayer est dutiliser une primitive : si f est continue sur
[a,b[ et si F en dsigne une primitive, alors pour tout x [a,b[,
Z x
f (t) dt = [F (t)]xa = F (x) F (a).
a

On en dduit que lintgrale


finie en b , et dans ce cas

Rb
a

f (t) dt est convergente si et seulement si F possde une limite


Z

b
a

f (t) dt = lim F (x) F (a).


xb

On raisonne de mme pour les autres formes de I.


Cest la mthode que nous avons mise en oeuvre pour les intgrales de rfrence.

2.

Intgration par parties

Il faut tre trs vigilant dans les intgrations par parties pour les intgrales gnralises, car
on peut facilement crire une intgrale convergente comme somme de deux termes divergents...
Par exemple, lintgrale
Z 2
sin(t)
dt
t
0

converge (la fonction t 7 sin(t)/t est prolongeable en une fonction continue sur [0,2]).


Z 2
cos(t) 2
cos(t)
Pourtant, ni le crochet gnralis
ni lintgrale
dt ne convergent.
t
t2
0
0

Pour viter cela, on revient lintgrale sur un segment, on fait une intgration par parties
usuelle, puis on essaie de passer la limite. Cela conduit immdiatement au thorme suivant :
207

Thorme Intgration par parties dans une intgrale gnralise


Soient f et g deux fonctions de classe C 1 sur I. Si la fonction f g a une limite dans K
en a+ et b , alors les intgrales
Z

et

f (t) g(t) dt
a

f (t) g (t) dt

sont de mme nature.


En notant
[f (t) g(t)]ba = lim (f (y) g(y)) lim (f (x) g(x)),
yb

xa+

on a, en cas de convergence,
Z

f (t) g(t) dt =
a

[f (t) g(t)]ba

f (t) g (t) dt.

Remarque Si I = [a,b[, alors f g a une limite en a+ car elle est continue en a. Il suffit donc de
vrifier lhypothse sur la limite de f g en b . De mme, si I = ]a,b], il suffit de vrifier lhypothse
sur la limite de f g en a+ .
Z +
tx1 et dt. La fonction ainsi dfinie
Exemple On pose, sous rserve dexistence, (x) =
0

est appele fonction dEuler.

Commenons par tudier la convergence de lintgrale. Soit x R ; la fonction t 7 tx1 et


est continue sur ]0, + [. Par croissances compares, tx+1 et 0 lorsque t +, donc
 
1
x1 t
t e
= o 2 .
t+
t
La fonction t 7 1/t2 est intgrable sur [1, + [ (critre des intgrales de Riemann
sur [1, + [,
R +
exposant 2 > 1) ; par comparaison, t 7 tx1 et est intgrable sur [1, + [, donc 1 tx1 et dt
converge. De plus,
1
tx1 et 1x ,
+
t0 t
R 1 x1 t
donc, les deux termes tant positifs, 0 t e dt converge si et seulement si lintgrale de RieR1
mann 0 dt/t1x converge, ce qui quivaut 1 x < 1, i.e. x > 0. Lensemble de dfinition de
la fonction est donc ]0, + [.

Fixons x > 0. Les fonctions f : t 7 et et g : t 7 tx sont de classe C 1 sur ]0, + [,


tx et 0 lorsqueZt 0+ car x > 0, et tx et 0 lorsque t + par croissances compares.
+

f (t)g(t) dt est convergente daprs ce qui prcde. Daprs le thorme


0
Z +
f (t)g (t) dt est convergente et on a
dintgration par parties,
Enfin, lintgrale

cest--dire,

x t

t e


+
dt = tx et 0 +

xt

x1 t

dt = x

tx1 et dt,

(x + 1) = x (x).
Cest ce que lon appelle une quation fonctionnelle vrifie par la fonction . Elle permet en
particulier de dfinir de proche en proche sur R \ (N). De plus, on a
Z +

A
et dt = lim et 0 = lim (1 eA ) = 1.
(1) =
0

A+

A+

On montre alors facilement par rcurrence que pour tout n N, (n + 1) = n!


La fonction gnralise donc la factorielle aux valeurs non entires.
208

3.

Changement de variable
Thorme Changement de variable dans une intgrale gnralise
Soit f : ]a,b[ K une fonction continue par morceaux, et soit : ],[ ]a,b[ une
bijection de classe C 1 de ],[ sur ]a,b[. Alors les intgrales
Z

f (t) dt

et

f ((u)) (u) du

sont de mme nature, et en cas de convergence :


Si est strictement croissante,
Z

f (t) dt =

f ((u)) (u) du.

Si est strictement dcroissante,


Z

f (t) dt =

f ((u)) (u) du.

Attention ! Ne pas oublier le signe dans la formule, qui prend en compte la monotonie de . En
cas de convergence des deux intgrales, les deux cas ci-dessus peuvent tre runis dans la formule
Z
Z b
f ((u)) | (u)| du.
f (t) dt =

Remarques
Sous les hypothses du thorme, la fonction est continue et bijective de ],[ sur ]a,b[, et
on peut montrer quelle est soit strictement croissante, soit strictement dcroissante. Les deux
cas considrs ci-dessus sont donc les seuls possibles. De plus, la fonction 1 est strictement
monotone, de mme monotonie que .
Le thorme prcdent est formul avec des intervalles ouverts, mais on peut avoir traiter le
cas dintervalles semi-ouverts. Cest bien sr possible, puisque pour une fonction f : [a,b[ K
continue par morceaux, les intgrales de f sur [a,b[ et sur ]a,b[ sont de mme nature et gale en
cas de convergence (la situation est analogue pour ]a,b]). Ceci se prouve en adaptant un rsultat
donn plus haut sur la cohrence des diffrentes notions dintgrale, pour une fonction continue
par morceaux sur un segment.
Dmonstration du thorme Soient r et s deux lments de ],[, x et y deux lments de ]a,b[.
En utilisant la formule usuelle pour les segments, on a
Z

(s)

f (t) dt =

f ((u)) (u) du

et

(r)

f (t) dt =

1 (y)

f ((u)) (u) du.

1 (x)

Si est strictement croissante,


(r) a+ , (s) b ,
r+

On en dduit que

1 (x) +
xa+

f (t) dt converge si et seulement si

et 1 (y) .
yb

f ((u)) (u) du converge, ainsi que

la formule annonce en cas de convergence.


Si est strictement dcroissante, on reprend le raisonnement, les bornes a et b sont changes
dans les limites de et 1 , et en cas de convergence,
Z b
Z a
f (t) dt.

f (t) dt =
a

209

Exemple On souhaite calculer

I=

/2

La fonction

1
dt.
1 + cos2 (t)

1
1 + cos2 (t)
est continue et positive sur le segment [0,/2], il ne sagit en fait pas dune intgrale gnralise,
mais on peut bien sr la considrer comme une intgrale gnralise convergente sur ]0,/2[.
f : t 7

On effectue le changement de variable t = arctan(u). La fonction = arctan est une bijection


strictement croissante de classe C 1 de ]0,+[ sur ]0,/2[. Le thorme de changement de variable
montre donc que
Z /2
Z +
1
1
1
dt =
du
2
2
1 + cos (t)
1 + cos ((u)) 1 + u2
0
0
Z +
1
1
=
du,
1
1
+
u2
0
1+
1 + tan2 ((u))
la convergence de cette dernire intgrale faisant partie des conclusions du thorme. Or, sur
]0,/2[, tan concide avec 1 , do
Z +
1
1
I=
du
1
1 + u2
0
1+
1 + u2
Z +
1
=
du
2 + u2
0

A

u

1
= .
= lim arctan
A+
2
2 0
2 2

IV.

Comparaison entre une srie et une intgrale

P
Reprenons lide dencadrement des sommes partielles dune srie n>0 f (n) mise en oeuvre
dans le chapitre Sries numriques : soit f : [0,+[ R+ une fonction continue par morceaux
et dcroissante. Si n N , on a pour tout t [n 1,n], f (n) 6 f (t) et donc, aprs intgration
sur [n 1,n],
Z
n

f (t) dt.

f (n) 6

n1

De la mme faon, pour tout n N,

n+1

f (t) dt 6 f (n).

On rappelle que ceci est illustr sur le graphique suivant :


Cf

f (n)

n1

210

n+1

En additionnant la premire ingalit pour n entre 1 et p > 1 puis en ajoutant f (0), et en


additionnant la seconde pour n entre 0 et p, on obtient
Z

p+1

f (t) dt 6

p
X

f (n) 6 f (0) +

n=0

f (t) dt.
0


Rp
On en dduit que la suite 0 f (t) dt pN est majore si et seulement si la suite des sommes
P
P
partielles de la srie n>0 f (n) est majore. Or, la srie n>0 f (n) est terme positifs, donc la
suite de ses sommes partielles est majore
R p si et seulement si elle converge. De plus, la fonction
f tant valeurs positives, la suite 0 f (t) dt pN est majore si et seulement si la fonction
Rx
x 7 0 f (t) dt (dfinie sur [0, + [) est majore : en effet, pour tout x > 0,
Z p
Z x
f (t) dt
f (t) dt 6
0

avec p = x + 1. Pour la mme raison (f valeurs positives), la fonction x 7


majore si et seulement si f est intgrable sur [0, + [.
Finalement, nous venons de dmontrer le rsultat suivant :

Rx
0

f (t) dt est

Thorme Comparaison entre une srie et une intgrale


Soit f : [0, + [ R+ une fonction continue par morceaux, dcroissante, valeurs
positives.
X
Pour que la srie
f (n) converge, il faut et il suffit que f soit intgrable sur [0, + [.
n>0

Remarques
R +
La fonction f tant positive, le fait que f soit intgrable quivaut la convergence de 0 f (t) dt.
Bien sr, on adapte facilement
ce rsultat
au cas des fonctions dfinies sur [n0 , + [, pour
R +
P
comparer les natures de n0 f (t) dt et n>n0 f (n).
Dans le chapitre Sries numriques, on avait montr comment tudier, par encadrement,
le comportement asymptotique de sommes partielles, ou de restes de sries convergentes. La
mthode dencadrement avait t expose dans le cadre des fonctions continues, mais elle reste
valable dans le cadre de lintgrale des fonctions continues par morceaux.
On peut donner des encadrements semblables de sommes partielles lorsque f est croissante.
Exemples
Nous avons dj mis en oeuvre cette technique pour prouver la convergence des sries de
X 1
1
Riemann
pour > 1. En effet, dans ce cas, la fonction f : t 7 est continue, positive,
n
t
n>1

dcroissante et intgrable sur [1, + [.

On peut galement obtenir des quivalents de sommes de sries de fonctions par cette mthode :
dfinissons, pour tout n N et x > 0,
un (x) =

1
.
n + n2 x

P
La srie de fonctions n>1 un converge normalement sur tout intervalle de la forme [a, + [
avec a > 0, car pour tout x > a et n N ,
0 6 un (x) 6

1
,
n2 a

le majorant tant le terme gnral dune srie convergente. De plus, chaque fonction un est
continue sur R+ . En particulier, la somme f de la srie de fonctions est dfinie et continue sur
211

R+ . On cherche dterminer un quivalent de f (x) lorsque x tend vers 0+ . Pour cela, posons,
x > 0 tant fix,
1
g : t 7
.
t + t2 x
La fonction g est continue et dcroissante sur [1, + [. Pour tout n > 2, on a donc
Z n
Z n+1
g(t) dt.
g(t) dt 6 g(n) 6
n1

En ajoutant ces ingalits pour n entre 2 et p > 2, on obtient donc


Z p+1
Z p
p
X
1
g(t) dt 6
g(t) dt
6
n + n2 x
2
1
n=2

puis, en ajoutant le terme correspondant n = 1,


Z p+1
Z p
p
X
1
1
1
+
g(t) dt 6
6
+
g(t) dt.
1+x
n + n2 x
1+x
2
1

(10.1)

n=1

Or, pour tout (a,b)

R2

avec 1 6 a 6 b,

 
b
Z b
Z b
1
x
t
g(t) dt =

dt = ln
t
1 + tx
1 + tx a
a
a

Lorsque b +, on a donc, pour tout a > 1, la convergence de lintgrale


 


Z +
1
a
g(t) dt = ln
ln
.
x
1 + ax
a

R +
a

g(t) dt avec

Finalement, en faisant tendre p vers + dans (10.1), on obtient, pour tout x > 0,




2
1
1
1
ln(x) ln
ln(x) ln
6 f (x) 6
.
1+x
1 + 2x
1+x
1+x
Il est alors immdiat, par encadrement, que f (x) ln(x) lorsque x 0+ .

V.

Espaces fonctionnels et fonctions intgrables


Dfinition
On note L1 (I,K) lensemble des fonctions continues par morceaux et intgrables sur
I, valeurs dans K.
Si f est continue par morceaux sur I valeurs dans K, on dit que f est de carr
intgrable sur I si |f |2 est intgrable sur I.
On note L2 (I,K) lensemble des fonctions continues par morceaux sur I, valeurs dans
K, de carr intgrable sur I.

Proprit
Lensemble L1 (I,K) est un K-espace vectoriel.
Dmonstration On montre que L1 (I,K) est un sous-espace vectoriel de lespace vectoriel des
fonctions continues par morceaux sur I valeurs dans K : la fonction nulle appartient L1 (I,K).
De plus, si f et g sont deux lments de L1 (I,K) et K, on a |f + g| 6 |||f | + |g|. Les
fonctions |f | et |g| ont une intgrale convergente sur I, il en est donc de mme pour |||f | + |g|
par combinaison linaire de limites. La fonction positive |||f | + |g| est donc intgrable sur I, et
par comparaison, il en est de mme pour f + g.

212

Proprit
Soit f : I K une fonction continue et intgrable sur I, telle que
Z
|f (t)| dt = 0.
I

Alors f = 0.
Dmonstration On fait la dmonstration dans le cas o I = [a,b[, les autres cas sont similaires.
Si J dsigne un segment de [a,b[, alors pour x [a,b[ assez proche de b, on a J [a,x] et donc
Z x
Z b
Z
|f (t)| dt
|f (t)| dt 6
|f (t)| dt = 0,
06
do

xb

|f (t)| dt = 0. Sachant que J est un segment et que |f | est continue et positive, on a

f|J = 0. Ceci tant vrai pour tout segment J [a,b[, on a f = 0.

Proprit
Le produit de deux lments de L2 (I,K) est un lment de L1 (I,K).
Lensemble L2 (I,K) est un K-espace vectoriel.
Soit H = L2 (I,R) C 0 (I,R). Lapplication

HH Z
R
( | ) :
fg
(f,g) 7
I

dfinit un produit scalaire sur H, dont la norme associe est dfinie par
f H, kf k2 =

Z

1/2

Dmonstration
Si f et g sont deux lments de L2 (I,K), alors daprs la majoration
|f g| 6

|f |2 + |g|2
,
2

on obtient par comparaison que f g L1 (I,K) car |f |2 et |g|2 sont deux lments de L1 (I,K), qui
est un K-espace vectoriel.
Montrons alors que L2 (I,K) est un sous-espace vectoriel de lespace vectoriel des fonctions
continues par morceaux sur I valeurs dans K, la seule difficult tant la stabilit par somme ;
or, si f et g sont deux lments de L2 (I,K), alors
|f + g|2 = |f |2 + 2 Re(f g) + |g|2 6 |f |2 + 2 |f g| + |g|2 .
Les fonctions |f |2 et |g|2 sont intgrables, et en particulier il en rsulte que f g est intgrable,
daprs le premier point. Par comparaison, |f +g|2 est intgrable, cest--dire que f +g L2 (I,K).
Les proprits dun produit scalaire sont immdiates vrifier, la dfinie positivit tant une
consquence de la proprit prcdente. Le fait que k k2 soit une norme est alors clair : cest la
norme associe ce produit scalaire. On rappelle que dans ce cadre, lingalit triangulaire est
une consquence de lingalit de Cauchy-Schwarz,
sZ
Z
sZ


f g 6
f2
g2 ,


I

que nous dmontrerons dans le chapitre Espaces prhilbertiens, espaces euclidiens.


213

214

Chapitre 11

Interversions pour les intgrales


gnralises
Intgrales paramtre
I.

Les thormes dinterversion pour les intgrales gnralises

Nous allons complter les rsultats du chapitre Suites et sries de fonctions par deux
thormes dinterversion dans le cadre des fonctions intgrables. On a tout dabord :
Thorme de convergence domine (admis : dmonstration hors programme)
Soit (fn )nN une suite de fonctions dfinies sur un intervalle I valeurs dans K. On
suppose que :
Pour tout n N, fn est continue par morceaux sur I.
(fn )nN converge simplement sur I vers une fonction f .
La fonction f est continue par morceaux sur I.
Il existe une fonction : I R+ continue par morceaux, positive et intgrable
sur I, telle que
n N, t I, |fn (t)| 6 (t).
Alors toutes les fonctions fn et f sont intgrables sur I et
Z
Z
f.
fn
I

n+

Remarques
Lhypothse n N, t I, |fn (t)| 6 (t) est appele hypothse de domination, elle
donne son nom au thorme. Sous cette hypothse, on a en passant la limite simple, |f (t)| 6 (t)
pour tout t I. On sait donc que les fonctions fn et f sont intgrables, par comparaison.
Vrifier cette hypothse revient tablir une majoration des fonctions fn par une fonction
intgrable sur I et indpendante de n.
Lhypothse f est continue par morceaux ne peut pas tre enleve : rien ne garantit que les
mmes subdivisions sont adaptes toutes les fonctions fn . la limite, il se pourrait donc que
f ne soit pas continue par morceaux, et donc que son intgrale nait pas de sens pour nous. Cela
dit, cette hypothse est impose par le cadre de travail des fonctions continues par morceaux.
Elle na pas limportance de lhypothse de domination.
Exemple On pose, pour tout n > 2 et t R+ ,
fn (t) =

1
.
1 + ntn

215

La suite de fonctions (fn )n>2 converge simplement sur R+ vers


(
1 si t [0,1[
f = 1[0,1[ : t 7
0 si t > 1
Toutes les fonctions fn , et f , sont continues par morceaux sur R+ . Enfin, pour tout n > 2 et
t R+ ,

1
si t [0,1[
|fn (t)| 6 (t) =
1

si t > 1,
1 + 2t2
la fonction tant continue par morceaux, positive et intgrable sur R+ (par comparaison
immdiate). Daprs le thorme de convergence domine, toutes les fonctions fn , et f , sont
intgrables sur R+ et
Z +
Z +
dt
f (t) dt = 1.


1 + ntn n+ 0
0
Pour les sries de fonctions, on a de plus le rsultat suivant :
Thorme Intgration terme terme pour les intgrales gnralises
P
Soit n>0 fn une srie de fonctions dfinies sur un intervalle I valeurs dans K. On
suppose que :
Pour tout n N, fn est continue par morceaux sur I.
X

fn converge simplement sur I.


n>0

La fonction

+
X

fn est continue par morceaux sur I.

n=0

Pour tout n N, fn est intgrable sur I.


X Z
|fn | converge.
La srie
n>0

Alors

+
X

fn est intgrable sur I et

n=0

Z X
+

fn =

I n=0

+ Z
X

fn .

n=0 I

Ce rsultat est admis (dmonstration hors programme).


Exemples
Soit, pour tout n > 1, fn : t 7

X
ent
. Les fonctions fn sont continues sur R+ et la srie
fn
2
n

converge normalement sur R+ car, pour tout n > 1 et t > 0,


nt
e

1


n2 6 n2

et la srie

+
X
X 1
fn est continue sur R+ .
converge.
En
particulier,
n2

n>1

n>1

n=1

De plus, pour tout n > 1, fn est intgrable sur R+ (multiple dune fonction intgrable de
rfrence) avec
Z + nt
Z +
1
e
dt = 3 ,
|fn (t)| dt =
2
n
n
0
0
216

et la srie

X 1
converge.
n3

n>1

+ nt
X
e

Daprs le thorme prcdent, la fonction t 7


Z

+
0

+ nt
X
e

n=1

n2

n=1

n2

est intgrable sur R+ et

+
X
1
.
dt =
n3
n=1

Ce thorme a lavantage de sappliquer dans le cadre des fonctions continues par morceaux, et
avec
P+convergence simple. Mais on pourrait avoir limpression que, pour justifier la rgularit de
n=0 fn , on devra recourir au thorme de continuit pour les sries de fonctions, qui sapplique
dans le cadre des fonctions continues, avec convergence au moins uniforme sur tout segment.
Ctait le cas dans lexemple prcdent, mais ce nest pas toujours le cas, comme va le montrer
lexemple suivant.
Soit S la fonction dfinie sur ]0,1[ par
ln(1 + x)
.
x

S(x) =

On peut montrer (voir le chapitre Sries entires) que pour tout x ]0,1[,
+
X

X
xn
fn (x)
(1)
=
S(x) =
n + 1 n=0
n=0
n

o :
n N, x ]0,1[,

fn (x) = (1)n

xn
.
n+1

Pour tout n N, fn est continue, donc continue par morceaux, sur ]0,1[. La srie de fonctions
P
n>0 fn converge simplement sur ]0,1[ daprs le dveloppement effectu ci-dessus, et la fonction
P+
n=0 fn est continue, donc continue par morceaux, sur ]0,1[, car il sagit de la fonction S.
Enfin, pour tout n N, fn est intgrable sur ]0,1[ (fonction polynomiale sur un intervalle born)
et
X
XZ 1
1
|fn (x)| dx =
,
(n + 1)2
0
n>0

n>0

srie de Riemann dexposant 2 > 1, donc convergente. Daprs le thorme dintgration terme
terme pour les intgrales gnralises, S est intgrable sur ]0,1[ (ce que lon aurait pu prouver
directement) et
Z 1
+
X
(1)n
ln(1 + x)
dx =
.
x
(n + 1)2
0
n=0

Dans le cas dune srie de fonctions, le thorme prcdent nest pas le seul moyen dintervertir
somme et intgrale gnralise. Parexemple, il ne sapplique pas dans le cas o fn est dfinie sur
I = ]0, + [ par fn (x) = (1)n e n x , pour tout n > 1. Toutes les fonctions fn sont continues
par morceaux et intgrables sur ]0, + [, mais
X Z

n>1

+
0

|fn (x)| dx =

X Z

n>1

nx

dx =

X 1
,
n
n>1

qui est une srie divergente.


Dans ces cas, on pourra parfois utiliser avec profit, notamment :
P
le thorme de convergence domine pour la suite des sommes partielles ( pn=0 fn )pN .
P
des estimations des restes de la srie n>0 fn , pour des sries alternes par exemple.
217

P
Dans lexemple ci-dessus, pour tout x > 0, la srie n>1 fn (x) P
est une srie alterne dont la
valeur absolue du terme gnral dcrot vers 0. On sait donc que n>1 fn (x) converge, et que
pour tout m N,


+

X



(x)
f
(11.1)
6 |fm+1 (x)| = e m+1 x .

n


n=m+1

En particulier, pour tout a > 0 et x > a,



+

X



fn (x) 6 e m+1 x 6 e m+1 a 0,

m+


n=m+1
P
le majorant tant indpendant de x. La srie n>1 fn converge donc uniformment sur tout
P
segment de I, et comme chaque fonction fn est continue sur I, on en dduit que +
n=1 fn est
continue sur I.
Notons, pour tout p N ,

Sp =

p
X

fn .

n=1

Pour tout p N , Sp est continue par morceaux sur I, (Sp )p>1 converge simplement sur I vers
P
+
n=1 fn qui est continue (et donc continue par morceaux) sur I daprs ce qui prcde. Enfin,
pour tout x > 0 et p N ,

+
p

+
X
X
X



fn (x)
fn (x)
fn (x) =
|Sp (x)| =



n=p+1
n=1
n=1




+
+
X
X



fn (x)
6
fn (x) +



n=p+1

n=1

6 ex + e

p+1 x

6 2 ex ,

ce qui donne lhypothse de domination pour la suite des sommes partielles (Sp )pN car la
fonction x 7 2 ex est continue par morceaux et intgrable sur ]0, + [.
Daprs le thorme de convergence domine, S =

+
X

n=1

+
0

Sp (x) dx

p+

fn est intgrable sur ]0, + [ et

S(x) dx,

ce qui est le rsultat voulu, car pour tout p N ,


!
Z +
Z + X
p Z
p
X
Sp (x) dx =
fn (x) dx =
0

fn (x) dx

n=1 0

n=1

par linarit de lintgrale : il y a un nombre fini de termes, qui correspondent tous des intgrales
convergentes (de rfrence).
Remarque On peut aussi conclure de la faon suivante : lingalit (11.1) prouve, par compa+
X
fn est intgrable sur ]0, + [. De plus, pour tout p N ,
raison, que pour tout m N,
n=m+1

p Z
Z +
X +

fn (x) dx


0
0
n=1

+
X

fn (x)

n=1



Z
+


+ X



fn (x) dx
dx 6


0
n=p+1

Z +
e p+1 x dx
6
0

1
0.
=
p + 1 p+

218

On a donc bien

II.

+
X

+
0

fn (x)

n=1

dx =

+ Z
X

n=1

fn (x) dx.
0

Intgrales paramtre
Dans la premire partie, nous
Z avons donn des rsultats de convergence pour des suites dfinies

fn (t) dt o la suite de fonctions (fn ) converge simplement vers

par une intgrale de la forme


une fonction f .

crivons fn (t) = f (n,t) et remplaons la variable discrte n par une variable continue x : on
considre alors des intgrales du type
Z
F (x) = f (x,t) dt,
I

vues comme fonctions du paramtre x. On peut alors trs naturellement se demander, comme
on la fait dans le cas discret, comment se comporte cette intgrale en fonction de x.
En sciences, les intgrales paramtres sont utilises notamment pour crer des transformations sur les fonctions : si f est une fonction, on dfinit (sous certaines conditions) :
La transforme de Laplace de f , qui est la fonction dfinie par
Z +
f (t)ept dt.
Lf (p) =
0

Elle est trs utilise en sciences industrielles.


La transforme de Fourier de f , qui est la fonction dfinie par
Z +
Ff (x) =
f (t) eixt dt.

Elle joue un rle fondamental en physique et mathmatiques.


Dans cette partie, A et I dsignent deux intervalles de R (A pour la variable x, I pour la
variable dintgration t).

1.

Thorme de continuit
Thorme Continuit pour les intgrales paramtre
Soit f : A I K une fonction. On fait les hypothses suivantes :

Pour tout x A, la fonction t 7 f (x,t) est continue par morceaux sur I.


Pour tout t I, la fonction x 7 f (x,t) est continue sur A.
Il existe une fonction : I R+ continue par morceaux et intgrable sur I telle
que pour tout (x,t) A I,
|f (x,t)| 6 (t).

Alors la fonction F : x 7

f (x,t) dt est dfinie et continue sur A.

Remarques
R
On fait souvent rfrence ce thorme comme thorme de continuit sous le signe .
La dernire hypothse est appele hypothse de domination, comme dans le cas discret.
Comme dans le cas discret, il est bien entendu essentiel que ne dpende pas du paramtre,
ici x.
219

Dmonstration (non exigible) Tout dabord, F est bien dfinie car pour tout x A, t 7 f (x,t) est
continue par morceaux et intgrable sur I, par comparaison et daprs lhypothse de domination.
Daprs la caractrisation squentielle de la limite, il suffit de montrer que pour tout a A, et
toute suite (an ) dlments de A convergeant vers a, on a
Z
Z
f (a,t) dt.
f (an ,t) dt
n+

Par cette remarque, on est donc ramen au cadre dapplication du thorme de convergence
domine. Notons en effet, pour tout n N, gn : t 7 f (an ,t). Alors gn est continue par morceaux
sur I pour tout n, la suite (gn ) converge simplement vers la fonction continue par morceaux
g : t 7 f (a,t), par continuit de f par rapport sa premire variable. Enfin, (gn ) est domine
par la fonction continue par morceaux et intgrable sur I. On en dduit le rsultat.

Cette dmonstration nest pas difficile, mais il faut garder lesprit quelle utilise le thorme
de convergence domine, que nous avons admis, et qui est un rsultat dlicat.
Remarque La continuit tant une notion locale, les hypothses portant sur la premire variable
x peuvent tre localises aux segments de A, ce qui peut viter des problmes dus aux extrmits
de A. Dans le thorme prcdent, on peut ainsi remplacer lhypothse de domination par :
pour tout segment J A, il existe une fonction : I R+ continue par morceaux et
intgrable sur I telle que pour tout (x,t) J I,
|f (x,t)| 6 (t).
La conclusion reste valide.
Exemples
Pour tout x > 0, la fonction t 7

1
est continue et intgrable sur [1, + [ car
x + t3
t > 1, 0 6

1
1
6 3,
3
x+t
t

et t 7 1/t3 est continue et intgrable sur [1, + [ (critre des intgrales de Riemann sur [1, + [,
exposant 3 > 1). De plus cette dernire fonction est indpendante de x, ce qui prouve lhypothse
1
de domination. Enfin, pour tout t [1, + [, x 7
est continue sur [0, + [. On en dduit
x + t3
que la fonction
Z +
1
dt
F : x 7
x
+
t3
1
est continue sur [0, + [.

Dans le chapitre prcdent, nous avons dfini la fonction par la relation


(x) =

tx1 et dt

pour tout x > 0. Examinons la continuit de . La fonction


f:

]0, + []0, + [ R
(x,t) 7 tx1 et

est continue par rapport ses deux variables. Pour tout t > 0,
t
e
si t ]0,1]
x1 t
sup t
e =
t

x>0
+ si t > 1.
220

Il ny a donc pas dhypothse de domination sur ]0, + [. En revanche, restreignons-nous


x [a,A] avec 0 < a < A. Alors
(
ta1 et si t ]0,1]
x1 t
sup t
e = A1 t
t
e
si t > 1.
x[a,A]
La fonction dfinie sur ]0,+[ par la formule prcdente est continue par morceaux sur ]0,+[
et intgrable (mmes arguments que pour lexistence de (x) pour x > 0), elle vrifie lhypothse
de domination sur [a,A]. On en dduit que est continue sur ]0, + [.

2.

Classe C 1

Dfinition

Soit f : A I K une fonction. Si, pour un certain t I, la fonction x 7 f (x,t) est


de classe C 1 sur A, alors pour tout x0 A, le nombre driv de x 7 f (x,t) en x0 est
f
not
(x0 ,t). Si cela est vrai quel que soit t I, on obtient ainsi une fonction
x
f
f
: (x,t) 7
(x,t),
x
x
appele drive partielle de f par rapport x.
On dfinit de faon analogue la drive partielle de f dordre k > 2 par rapport x,
k f
.
note
xk
Exemple Soit f : R2 R dfinie par : pour tout (x,t) R2 , f (x,t) =

la fonction

xt
. Pour tout t R,
1 + x2

xt
1 + x2
est de classe C 1 sur R comme fraction rationnelle dont le dnominateur ne sannule pas. La
fonction f admet donc une drive partielle par rapport x ; de plus, pour tout (x,t) R2 ,
x 7

t(1 + x2 ) xt 2x
t(1 x2 )
f
(x,t) =
=
.
x
(1 + x2 )2
(1 + x2 )2
Thorme Classe C 1 pour les intgrales paramtre

Soit f : A I K une fonction. On fait les hypothses suivantes :

Pour tout x A, t 7 f (x,t) est continue par morceaux et intgrable sur I.

Pour tout t I, x 7 f (x,t) est de classe C 1 sur A.


f
(x,t) est continue par morceaux sur I.
x
Il existe une fonction : I R+ continue par morceaux et intgrable sur I telle
que pour tout (x,t) A I,



f
(x,t) 6 (t).

x

Pour tout x A, t 7

Alors la fonction F : x 7

x A,

f (x,t) dt est dfinie et de classe C 1 sur A et pour tout

F (x) =

f
(x,t) dt.
x

221

Remarques
R
On fait souvent rfrence ce thorme comme thorme de drivation sous le signe .
On a fait en sorte que les hypothses fondamentales du thorme prcdent soient vrifies par
f
.
la fonction
x
f
nouveau, on peut remplacer lhypothse de domination pour t 7
(x,t) par une version
x
locale sur tout segment pour la variable x.
Dmonstration (non exigible) Tout dabord, la fonction F est dfinie sur A car t 7 f (x,t) est
continue par morceaux et intgrable sur I pour tout x A. Soit a A ; pour montrer que F est
drivable en a avec
Z
f
(a,t) dt,
F (a) =
I x
il suffit de montrer que pour toute suite (an ) dlments de A distincts de a convergeant vers a,
F (an ) F (a)

n+
an a

f
(a,t) dt,
x

f
(a,t) est continue par morceaux et intgrable
cette dernire intgrale tant convergente car t 7
x
sur I, par comparaison et daprs lhypothse de domination. Par linarit de lintgrale, ce taux
de variations est gal
Z
f (an ,t) f (a,t)
dt.
an a
I

Dfinissons donc, pour tout n N,

gn : t 7

f (an ,t) f (a,t)


.
an a

La suite (gn ) de fonctions continues par morceaux sur I converge simplement sur I vers la fonction
f
t 7
(a,t) par dfinition dune drive partielle, cette fonction tant continue par morceaux
x
sur I.
De plus, pour tout n N et t I,


f

|gn (t)| 6 sup (x,t) ,
xJn x

daprs lingalit des accroissements finis, Jn dsignant le segment [an ,a] ou [a,an ]. Ainsi, pour
tout n N et t I, |gn (t)| 6 (t), ce qui prouve lhypothse de domination du thorme de
convergence domine. On en dduit finalement que
Z
Z
f
(a,t) dt,
gn (t) dt
n+
I x
I
ce qui est le Rrsultat voulu. Enfin, F est de classe C 1 sur A daprs le thorme de continuit
sous le signe .

Exemple Calculons, pour tout x > 0,

I(x) =

+
0

sin(t) xt
e
dt.
t

Pour cela, dfinissons pour tout (x,t) ]0, + [ 2 ,


f (x,t) =

sin(t) xt
e .
t
222

Pour tout x > 0, t 7 f (x,t) est continue, et intgrable sur ]0, + [ : si t > 1,


sin(t) xt


6 ext
t e

lapplication t 7 ext tant intgrable sur [1, + [ ; on a de plus un faux problme en 0 car
sin(t) xt
e
1.
t
t0+
Pour tout t > 0, lapplication x 7 f (x,t) est de classe C 1 sur ]0, + [, et pour tout x > 0,
f
(x,t) = sin(t) ext .
x
f
Fixons a > 0 et restreignons-nous x > a. Lapplication t 7
(x,t) est continue sur ]0, + [
x
et pour tout t > 0 et x > a,



f
(x,t) 6 |sin(t)| eat 6 eat .

x

Ce majorant dfinit une fonction intgrable sur ]0, + [ et indpendante de x > a, ce qui
montre que lhypothse de domination locale est satisfaite. Le thorme de drivation sous le
signe intgral montre alors que I est de classe C 1 sur [a, + [. Ceci tant valable pour tout a > 0,
I est de classe C 1 sur ]0, + [. De plus pour tout x > 0,
Z +

I (x) =
sin(t) ext dt.
0

Soit A R+ . On a

avec
Z

(ix)t

xt

sin(t) e
0

"

e(ix)t
dt =
ix

#A
0

dt = Im
=

Z

(ix)t

dt

e(ix)A 1
x+i
1

=
.
A+ x i
ix
1 + x2

Daprs la caractrisation de la limite laide des parties relle et imaginaire, on obtient


Z +
1
sin(t) ext dt =
1
+
x2
0
(pour le calcul de lintgrale prcdente, on aurait aussi pu effectuer deux intgrations par parties
successives).
Finalement, pour tout x de lintervalle ]0, + [,
I (x) =

1
.
1 + x2

On en dduit quil existe une constante k R telle que pour tout x > 0,
I(x) = arctan(x) + k.
On remarque galement que I(x) 0 lorsque x +. En effet, lapplication
t 7

sin(t)
t

est borne sur ]0, + [, car elle est prolongeable en une fonction continue sur R+ et tend vers 0
en +. Soit M un majorant de sa valeur absolue sur ]0, + [. Alors pour tout x > 0,
Z +
M
0.
ext dt =
|I(x)| 6 M
x x+
0
223

Sachant de plus que

on en dduit que k =

arctan(x) ,
x+
2

, do, pour tout x > 0,


2
Z +
sin(t) xt

e
dt = arctan(x).
t
2
0

La fonction I est la transforme de Laplace de la fonction sinus cardinal. Grce ce calcul, on


peut montrer, en faisant tendre x vers 0+ , que
Z +
sin(t)

dt = .

t
2
0

3.

Classe C k

On peut gnraliser le rsultat du paragraphe prcdent aux drives dordre suprieur, en


raisonnant par rcurrence :
Thorme Classe C k pour les intgrales paramtre

Soit f : A I K une fonction et k > 2 un entier. On fait les hypothses suivantes :


Pour tout x A, t 7 f (x,t) est continue par morceaux et intgrable sur I.

Pour tout t I, x 7 f (x,t) est de classe C k sur A.


j f
Pour tout j [[1,k 1]], pour tout x A, t 7
(x,t) est continue par morceaux
xj
et intgrable sur I.
k f
(x,t) est continue par morceaux sur I.
xk
Il existe une fonction : I R+ continue par morceaux et intgrable sur I telle
que pour tout (x,t) A I,
k

f


6 (t).
(x,t)
xk

Pour tout x A, t 7

Alors la fonction F : x 7

j [[1,k]], pour tout x A,

f (x,t) dt est dfinie et de classe C k sur A et pour tout

(j)

(x) =

j f
(x,t) dt.
xj

k f
(x,t) par une version locale
On peut remplacer lhypothse de domination pour t 7
xk
sur tout segment pour la variable x.

224

Chapitre 12

Espaces prhilbertiens
Espaces euclidiens
Dans ce chapitre, H dsigne un R-espace vectoriel, et E un R-espace vectoriel de dimension
finie.

I.

Produit scalaire
Dfinition
Un produit scalaire sur H est une forme bilinaire symtrique dfinie positive sur
H, cest--dire, une application f : H H R vrifiant les proprits suivantes :
Bilinarit : pour tout (a,b) H H, les applications x 7 f (x,b) et y 7 f (a,y)
sont linaires.
Symtrie : pour tout (x,y) H H, f (x,y) = f (y,x).
Dfinie positivit pour tout x H, f (x,x) > 0, et on a lquivalence :
f (x,x) = 0 x = 0.
Si f est un produit scalaire sur H, on note le plus souvent, pour (x,y) H2 ,
f (x,y) = (x | y) ,

ou hx, yi, ou x y.

Si H est muni dun produit scalaire ( | ), on dit que (H, ( | )) (ou simplement H sil
ny a pas dambiguit sur le produit scalaire) est un espace prhilbertien (rel).
Un espace euclidien est un espace prhilbertien de dimension finie.
Remarques
Du fait de la symtrie, il suffit en fait dimposer la linarit par rapport une seule des deux
variables.
Si ( | ) est un produit scalaire sur H, alors pour tout (a,b) H2 , (a | 0) = (0 | b) = 0.
Si E est un sous-espace vectoriel de dimension finie de H, et si ( | ) est un produit scalaire sur
H, alors ( | ) induit par restriction un produit scalaire sur E qui est donc un espace euclidien.
Exemples
Lapplication f1 dfinie sur R2 R2 par f1 ((x1 ,x2 ),(y1 ,y2 )) = x1 y1 +2x2 y2 est un produit scalaire
sur R2 , mais pas lapplication f2 dfinie sur R2 R2 par f ((x1 ,x2 ),(y1 ,y2 )) = x1 y1 2x2 y2 , cette
dernire ne vrifiant pas la proprit de dfinie positivit : en effet, f2 ((0,1),(0,1)) = 2 < 0.
225

Lapplication ( | ) dfinie sur Rn Rn par


(x | y) =

n
X

xi yi

i=1

(o x = (x1 , . . . ,xn ) et y = (y1 , . . . ,yn )) est un produit scalaire sur Rn . Il est appel produit
scalaire canonique sur Rn .
En fait, si E est un R-espace vectoriel de dimension finie, on peut toujours munir E dune
structure despace euclidien. En effet, soit B = (e1 , . . . ,en ) une base de E ; on dfinit alors, pour
x = x1 e1 + + xn en et y = y1 e1 + + yn en lments de E,
(x | y) =

n
X

xi y i .

i=1

Ceci dfinit un produit scalaire sur E.


Lapplication g dfinie sur Mn (R)2 par g(A,B) = Tr (tAB) est un produit scalaire sur Mn (R).
Si A = (ai,j ) et B = (bi,j ), alors, pour tout (i,j) [[1,n]]2 , le coefficient en position (i,j) de la
matrice tAB est
n
X
ak,i bk,j ,
k=1

et donc

g(A,B) =

n
n X
X

ak,i bk,i =

n
X

ai,j bi,j

i,j=1

i=1 k=1

aprs changement dindices muets. On est donc dans la situation du point prcdent, pour le
choix de la base canonique de Mn (R).
Soit : [a,b] R+ une application continue. Lapplication ( | ) dfinie sur C 0 ([a,b],R)2 par
Z b
f (x)g(x) (x) dx,
(f | g) =
a

est un produit scalaire sur C 0 ([a,b],R) (qui, munit de ce produit scalaire, est un espace prhilbertien rel, mais pas un espace euclidien).
Soit I un intervalle de R et H = L2 (I,R) C 0 (I,R). Lapplication

HH Z
R
( | ) :
fg
(f,g) 7
I

est un produit scalaire sur H.


Lapplication ( | ) dfinie sur Rn [X]2 par

(P | Q) =

n
X

P (i)Q(i),

i=0

est un produit scalaire sur Rn [X]. Pour la dfinie positivit, on remarque quun polynme P de
Rn [X] vrifie (P | P ) = 0 si et seulement si P (i) = 0 pour tout i [[0,n]], ce qui quivaut P = 0
(si P (i) = 0 pour tout i [[0,n]], P possde au moins n + 1 racines, or P est de degr au plus n).
Thorme Ingalit de Cauchy-Schwarz
Soit ( | ) un produit scalaire sur H. Alors, pour tout (x,y) H2 ,
p
p
| (x | y) | 6 (x | x) (y | y),

avec galit si et seulement si x et y sont colinaires.

226

Dmonstration Fixons x et y dans H et dfinissons sur R lapplication


P : 7 (x + y | x + y) .
Pour tout R, par bilinarit et symtrie,
P () = 2 (x | x) + (x | y) + (y | x) + (y | y) = 2 (x | x) + 2 (x | y) + (y | y) .
La fonction P ne prend que des valeurs positives daprs la proprit de dfinie positivit.
Si x 6= 0, (x | x) 6= 0 pour la mme raison, et P est une fonction polynomiale de degr 2 ; on
en dduit que le discriminant du polynme P est ngatif ou nul, cest--dire
(2 (x | y))2 4 (x | x) (y | y) 6 0,

do

(x | y)2 6 (x | x) (y | y) .

Le rsultat suit en composant cette ingalit par la fonction croissante racine carre.
Si x = 0, P est une fonction affine partout positive, donc le coefficient directeur associ est
nul, cest--dire (x | y) = 0. Lingalit est galement vrifie dans ce cas.
En ce qui concerne le cas dgalit : si x et y sont colinaires, il est immdiat que lgalit est
vrifie ; par exemple sil existe R tel que y = x, on a
(x | y) = (x | x) = (x | x) ,
et

(x | x)

(y | y) =

(x | x)

p
p
(x | x) = || (x | x) (x | x) = || (x | x) ,

donc on a galit dans lingalit de Cauchy-Schwarz (on procde de mme


p sil existe
p R
tel que x = y). Rciproquement, supposons que x 6= 0 et que | (x | y) | = (x | x) (y | y). En
reprenant la dmonstration prcdente, on voit que le discriminant de P est nul, donc P possde
une racine relle (double) , et on a donc P () = (x + y | x + y) = 0. Par dfinie positivit, il
sensuit que x+ y = 0 et donc x et y sont colinaires. Si x = 0, x et y sont galement colinaires.

Proprit/Dfinition
p
Si ( | ) est un produit scalaire sur H, lapplication k k : x 7 (x | x) est une norme
sur H, dite norme associe ( | ). Une norme associe un produit scalaire sur H
est appele norme euclidienne.
Lapplication d dfinie sur H2 par d(x,y) = kx yk est appele distance associe
( | ) .
Dmonstration du fait que k k est une norme.
Lapplication k k est bien dfinie car (x | x) > 0 pour tout x H.
Homognit : pour tout x H et R,
p
p
p
kxk = (x | x) = 2 (x | x) = || (x | x) = || kxk.
Sparation : pour tout x H,

kxk = 0

(x | x) = 0

x = 0,

car ( | ) est dfinie positive.


Ingalit triangulaire : comme on la remarqu dans le chapitre Espaces vectoriels norms,
elle rsulte de lingalit de Cauchy-Schwarz, qui se rcrit
(x,y) H2 , | (x | y) | 6 kxk kyk.
227

Pour tout (x,y) H2 , on a en effet

kx + yk2 = (x + y | x + y) = kxk2 + 2 (x | y) + kyk2

6 kxk2 + 2kxkkyk + kyk2

= (kxk + kyk)2 .

Le rsultat suit en prenant la racine carre car les deux membres sont positifs.

On peut galement caractriser le cas dgalit dans lingalit triangulaire :


Proprit Cas dgalit dans lingalit triangulaire
Soit ( | ) un produit scalaire sur H et k k la norme associe. Pour tout (x,y) H2 , on
a lquivalence :
kx + yk = kxk + kyk

il existe R+ tel que x = y ou y = x.

Dmonstration Si y = x avec R+ ,
kx + yk = k(1 + )xk = (1 + )kxk,
et
kxk + kyk = kxk + kxk = kxk + kxk = (1 + )kxk.

On procde de mme si x = y avec R+ .


Rciproquement, si kx + yk = kxk + kyk, alors en reprenant lingalit de la dmonstration
prcdente, on a
(x | y) = kxkkyk.

En particulier, il y a galit dans lingalit de Cauchy-Schwarz, donc x et y sont colinaires. Si


x est non nul, on peut crire y = x avec R, et on a
(x | y) = (x | x) = kxk2 ,

et
kxkkyk = || kxk2 .

Sachant que x 6= 0, kxk =


6 0 donc = ||, cest--dire que R+ . Si x = 0, la relation x = y
est vrifie avec = 0.

Exemples
La norme associe au produit scalaire canonique sur Rn est dfinie par
!1/2
n
X
x2i
x Rn , kxk =
i=1

Elle est appele norme euclidienne canonique sur Rn .


La norme associe au produit scalaire dfini sur Mn (R)2 par (A | B) = Tr (tAB) est donne
par :
1/2

n
X

1/2
(ai,j )2
=
A = (ai,j ) Mn (R), kAk = Tr(tAA
i,j=1

La norme associe au produit scalaire dfini sur C 0 ([a,b],R) par (f | g) =


donne par :
1/2
Z b
2
0
.
f (x) dx
f C ([a,b],R), kf k =

Rb
a

f (t) g(t) dt est

Le rsultat suivant montre quune norme euclidienne provient dun unique produit scalaire,
que lon peut retrouver partir delle.
228

Proprit Identit de polarisation


Soit ( | ) un produit scalaire sur H et kk la norme associe. Alors, pour tout (x,y) H2 ,
(x | y) =

1
1
(kx + yk2 kx yk2 ) = (kx + yk2 kxk2 kyk2 ).
4
2

Dmonstration Pour (x,y) H2 , on a, par bilinarit et symtrie,


kx + yk2 = (x + y | x + y) = kxk2 + 2 (x | y) + kyk2 ,
et de mme
kx yk2 = (x y | x y) = kxk2 2 (x | y) + kyk2 .

On en dduit facilement le premier rsultat en retranchant la seconde galit la premire, et le


second rsultat en utilisant la premire galit.

2
Remarque Pour tout (x,y) H , on a en additionnant les deux galits de la dmonstration
prcdente,

kx + yk2 + kx yk2 = 2 kxk2 + kyk2 .

Cette galit est appele identit du paralllogramme. Gomtriquement, cette identit signifie
que la somme des carrs des longueurs des diagonales dun paralllogramme est gale la somme
des carrs de ses cts.

II.

Orthogonalit
Dans cette partie, (H, ( | )) dsigne un espace prhilbertien rel.

1.

Familles orthogonales de vecteurs


Dfinition
Si x H, on dit que x est unitaire (ou norm) si kxk = 1.
Si x et y appartiennent H, on dit que x et y sont orthogonaux si (x | y) = 0.
Si (xi )iI est une famille de vecteurs de H (I tant un ensemble dindices), on dit
que cette famille est :
norme si pour tout i I, kxi k = 1.
orthogonale si pour tout (i,j) I tel que i 6= j, (xi | xj ) = 0.
orthonormale (ou orthonorme) si elle est orthogonale et norme.
Ceci quivaut au fait que (xi | xj ) = i,j pour tout (i,j) I 2 .
Proprit
Une famille orthogonale finie de vecteurs tous non nuls de H est libre.

Dmonstration Soit (x1 , . . . ,xp ) une famille orthogonale de vecteurs tous non nuls de H et
(1 , . . . ,p ) une famille de scalaires telle que
1 x1 + + p xp = 0H .
Alors pour tout i [[1,p]],
(xi | 1 x1 + + p xp ) = 0

i.e. 1 (xi | x1 ) + + p (xi | xp ) = 0,


et donc i = 0 car la famille est orthogonale et xi 6= 0, do (xi | xi ) 6= 0.
229

Exemple Dfinissons sur R, pour tout k N, la fonction ck : x 7 cos(kx). Alors, pour tout
n N, la famille (c0 , . . . ,cn ) est libre dans C 0 ([0,2],R), car est elle compose de vecteurs tous
non nuls, et orthogonale pour le produit scalaire usuel sur C 0 ([0,2],R). En effet, pour tous p et
q distincts dans N, on a p q 6= 0 et p + q 6= 0, donc
Z

1
(cos((p + q)x) + cos((p q)x)) dx
2
0


1 sin((p + q)x) sin((p q)x) 2
+
= 0.
=
2
p+q
pq
0

cos(px) cos(qx) dx =
0

Thorme de Pythagore
Soit (x1 , . . . ,xp ) une famille orthogonale de vecteurs de H.
Alors
kx1 + + xp k2 = kx1 k2 + + kxp k2 .
Dmonstration Cest immdiat puisque les termes 2 (xi | xj ) dans le dveloppement de
kx1 + + xp k2 sont nuls par orthogonalit de la famille (x1 , . . . ,xp ).

Dfinition Base orthonorme
Soit E un espace euclidien et B = (e1 , . . . ,en ) une famille de vecteurs de E.
On dit que B est une base orthonorme de E si B est une base de E et une famille
orthonormale.

Proprit Calculs dans une base orthonorme


Soit (E, ( | )) un espace euclidien, et B = (e1 , . . . ,en ) une base orthonorme de E.
Soient x = x1 e1 + + xn en et y = y1 e1 + + yn en deux vecteurs de E.
Alors :
!1/2
n
n
X
X
.
|xi |2
xi yi et kxk =
(x | y) =
i=1

i=1

Si X = t x1 xn et Y = t y1 yn sont les vecteurs-colonnes des coordonnes de x et y dans la base B, on a (en identifiant une matrice de M1 (R) son unique
coefficient)
(x | y) = tX Y et kxk = (tXX)1/2 .
Dmonstration Il suffit de montrer le premier point. Or, par bilinarit de ( | ),
(x | y) = (x1 e1 + + xn en | y1 e1 + + yn en )
n
X
xi yj (ei | ej )
=
=

i,j=1
n
X

xi yi ,

i=1

car la base B est orthonorme.

Remarque Dans Mn,1 (R), lexpression du produit scalaire canonique entre deux vecteurs X et
Y scrit simplement (X | Y ) = tX Y.
230

Proprit Matrice dune application linaire dans une base orthonorme


Soit (E, ( | )) un espace euclidien, u L (E) et B = (e1 , . . . ,en ) une base orthonorme
de E. Alors

MatB (u) = (ei | u(ej )) 16i,j6n
Dmonstration Notons ai,j les coefficients de la matrice MatB (u). Pour tout j [[1,n]], on a
donc
n
X
u(ej ) =
ak,j ek .
k=1

Le produit scalaire (ei | u(ej )) est donc gal


!
n
n
X
X
ak,j (ei | ek ) = ai,j
ak,j ek =
ei |
k=1

k=1

car B est une famille orthonorme. Do le rsultat.

Les rsultats prcdents montrent lintrt, pour la simplicit des calculs, de travailler dans
des bases orthonormes. On va donc chercher construire de telles bases orthonormes.

2.

Orthonormalisation
Thorme Procd dorthonormalisation de Gram-Schmidt
Soit (e1 , . . . ,ep ) une famille libre de vecteurs de H et F = Vect(e1 , . . . ,ep ).
Alors il existe une base orthonorme (1 , . . . ,p ) de F telle que pour tout i [[1,p]],
Vect(1 , . . . ,i ) = Vect(e1 , . . . ,ei ).

Dmonstration On procde par rcurrence sur p.


Initialisation : pour p = 1, on remarque que e1 6= 0 car la famille (e1 ) est libre. Il suffit alors
de poser
e1
1 =
.
ke1 k

On a videmment k1 k = 1 et Vect(1 ) = Vect(e1 ).


Hrdit : supposons la proprit vraie pour un entier p et considrons une famille libre
(e1 , . . . ,ep+1 ). Par hypothse de rcurrence, on peut supposer 1 , . . . ,p construits.
Analyse : le vecteur p+1 doit vrifier p+1 Vect(e1 , . . . ,ep+1 ) = Vect(1 , . . . ,n ,ep+1 ), donc il
doit exister (1 , . . . ,p+1 ) Rp+1 tel que
p+1 = 1 1 + + p p + p+1 ep+1 .
Alors pour tout i [[1,p]],
0 = (i | p+1 ) =

p
X
j=1

j (i | j ) + p+1 (i | ep+1 ) = i + p+1 (i | ep+1 ) ,

car la famille (1 , . . . ,p+1 ) doit tre orthonorme. On en dduit que


!
p
X
(i | ep+1 ) i .
p+1 = p+1 ep+1
i=1

Synthse : on sait que Vect(1 ,P


. . . , p ) = Vect(e1 , . . . ,ep ) ; de plus, la famille e1 , . . . ,ep+1 tant
libre, le vecteur fp+1 = ep+1 pi=1 (i | ep+1 ) i est non nul. On peut donc poser
p+1 =

fp+1
.
kfp+1 k

231

Tout dabord, la famille (1 , . . . ,p+1 ) est norme. Elle est galement orthogonale : en effet, soit
(j,k) [[1,p + 1]]2 avec j 6= k. Si j 6 p et k 6 p, alors (j | k ) = 0 par hypothse de rcurrence.
Si j 6 p et k = p + 1, alors
!
p

X
1

(i | ep+1 ) i
j ep+1
(j | p+1 ) =
kfp+1 k
i=1
!
p
X
1
=
(i | ep+1 ) (j | i )
(j | ep+1 )
kfp+1 k
i=1

kfp+1 k

((j | ep+1 ) (j | ep+1 )) ,

car seul le terme correspondant i = j est ventuellement non nul, et (i | i ) = 1. Donc


(j | p+1 ) = 0.
Ensuite, montrons que pour tout i [[1,p + 1]],
Vect(1 , . . . ,i ) = Vect(e1 , . . . ,ei ).
Cest vrai si i 6 p par hypothse de rcurrence. Il suffit donc de le montrer pour i = p + 1. Or
p+1 =

1
kfp+1 k

ep+1 + y

avec y Vect(1 , . . . ,p ) = Vect(e1 , . . . ,ep ). On en dduit le rsultat par double inclusion immdiate.

Illustrons les diffrentes tapes de ce procd dans le plan :
e2
f2

e1

2
1

(1 | e2 ) 1

Remarques
On peut aussi montrer que lon peut imposer que (i | ei ) R+ pour tout i. La famille (1 , . . . ,p )
est alors unique.
Cette dmonstration est constructive : elle donne un algorithme qui permet de construire
explicitement une famille (1 , . . . ,p ). En particulier, elle est programmable sur ordinateur. En
pratique, on pourra procder ainsi : on remarque qu chaque tape, si f1 , . . . ,fi sont construits,
fi+1 est de la forme
fi+1 = ei+1 + i fi + + 1 f1

o 1 , . . . ,i sont des scalaires. Il suffit alors dimposer les conditions


(fi+1 | f1 ) = = (fi+1 | fi ) = 0

pour dterminer ces scalaires. la fin de la procdure, on pose alors i = fi /kfi k et lon obtient
une famille qui rpond au problme. Avec cette faon de faire, on peut ainsi ne normer les vecteurs
qu la fin de la procdure, ce qui vite des erreurs de calculs.
On peut procder de mme en cherchant fi+1 sous la forme ei+1 + i ei + + 1 e1 , car
Vect(e1 , . . . ,ei ) = Vect(f1 , . . . ,fi ).
232

Exemple Soit B = (e0 ,e1 ,e2 ) la base canonique de R2 [X], muni du produit scalaire dfini par
(P | Q) =

P (x) Q(x) dx.

Orthonormalisons la base B.
On pose f0 = e0 = 1.
On choisit f1 de la forme f1 = e1 + f0 ( rel) de sorte que (f1 | f0 ) = 0, ce qui quivaut
Z

1
= .
2

(t + ) dt = 0

1
On pose donc f1 = X .
2
On choisit f2 de la forme f2 = e2 + f1 + f0 ( et rels) de sorte que (f2 | f0 ) = 0 et
(f2 | f1 ) = 0, ce qui quivaut

i.e.



1
+ dt = 0
t + t
2
0




Z 1

1
1

+
t
dt = 0
t + t

2
2
0

= 1

+ =0
3
i.e.
= 1

1 1 + 1 =0
3
4 6
12
Z

1

1
1
On pose donc f2 = X 2 f1 f0 = X 2 X + .
3
6
On norme enfin les vecteurs f0 , f1 et f2 :
kf0 k = 1
kf1 k =

kf2 k =

1

1
t
2

2

dt

1

1
t2 t +
6

!1/2

2

dt

!1/2

1
1
=
12
2 3

1
.
180

On obtient une famille (0 ,1 ,2 ) qui convient.


Corollaire
Soit (E, ( | )) un espace euclidien.
Il existe des bases orthonormes de E.
Toute famille orthonormale de E peut tre complte en une base orthonorme de E.

Dmonstration Pour le premier point, il suffit dappliquer le procd dothonormalisation de


Gram-Schmidt une base quelconque de E. On obtient alors une famille gnratrice de E et
libre (car orthonormale), cest--dire une base de E. Pour le second, on sait que toute famille
orthonormale est libre, on peut la complter en une base de E puis orthonormaliser cette base
par le procd de Gram-Schmidt, ce qui ne modifie pas la famille initiale.

233

3.

Sommes orthogonales
Dfinition Sous-espaces orthogonaux
Soient F et G deux sous-espaces vectoriels de H.
On dit que F et G sont orthogonaux si :
(x,y) F G,

(x | y) = 0.

Ceci se note galement : F G.


Proprit
Soient F1 , . . . ,Fp des sous-espaces vectoriels de H, deux deux orthogonaux.
Alors la somme F1 + + Fp est directe.
Dmonstration Soit (x1 , . . . ,xp ) F1 Fp tel que x1 + + xp = 0. En faisant le produit
scalaire de cette expression avec xi pour i [[1,p]], on obtient
0 = (xi | x1 + + xp ) = (xi | x1 ) + + (xi | xp ) .
Les Fj tant deux deux orthogonaux, on en dduit que (xi | xi ) = 0 et donc xi = 0, et ce pour
tout i. Do le rsultat.

Dfinition
Soient F1 , . . . ,Fp des sous-espaces vectoriels de H, deux deux orthogonaux.
L
La somme pi=1 Fi est appele somme directe orthogonale des Fi (on dit aussi que
les Fi sont en somme directe orthogonale).
Soient F et G deux sous-espaces vectoriels de H.
On dit que F et G sont supplmentaires orthogonaux si F G et F G = H.
Ceci se note parfois H = F G.
Remarques
Soient F1 , . . . ,Fp des sous-espaces vectoriels deux deux orthogonaux dun espace euclidien
E. Alors leur somme est directe, donc daprs un rsultat du chapitre Espaces vectoriels et
applications linaires, on a
dim(F1 Fp ) = dim(F1 ) + + dim(Fp )
et pour que E = F1 Fp , il faut et il suffit que
dim(E) = dim(F1 ) + + dim(Fp ).
Si F et G sont deux sous-espaces vectoriels de H, pour montrer que F et G sont supplmentaires
orthogonaux, il suffit de montrer que F G et H F + G. En effet, daprs la proprit
prcdente, si F G, laspect direct de la somme F + G est acquis (notamment, F G = {0E }).

4.

Orthogonal dun sous-espace vectoriel


Proprit/Dfinition
Soit F un sous-espace vectoriel de H. On appelle orthogonal de F lensemble
F = {y H; x F, (x | y) = 0}.
Cest un sous-espace vectoriel de H, orthogonal F .

234

Dmonstration On a F H, et le vecteur nul de H est orthogonal tout vecteur donc


appartient F . Si y et z appartiennent F et si R, alors pour tout x F ,
(x | y + z) = (x | y) + (x | z) = 0
donc y + z F . Ainsi F est un sous-espace vectoriel de H. Il est orthogonal F , car par
dfinition, si x F et y F , (x | y) = 0.


Exemple Dans Rn (n > 1) muni du produit scalaire canonique, soit a = (a1 , . . . ,an ) un vecteur
non nul. Alors Vect(a) est lensemble des vecteurs x = (x1 , . . . ,xn ) tels que
n
X

ai xi = 0.

i=1

Il sagit du noyau de la forme linaire dfinie sur Rn par


(x1 , . . . ,xn ) =

n
X

ai xi ,

i=1

qui est non nulle car a est non nul. En particulier, Vect(a) est un hyperplan de Rn .
Remarque Si F et G sont deux sous-espaces vectoriels de H, alors on a les quivalences
F G

F G

G F .

Par contre, lorsque F G on na pas toujours les galits F = G et G = F .


Proprit
On a H = {0H } et {0H } = H.
Dmonstration En effet, si y H vrifie (x | y) = 0 pour tout x H, alors pour le choix de x = y
on obtient (y | y) = 0 et donc y = 0H . Lautre inclusion (et la seconde galit) vient simplement
du fait que (x | 0H ) = 0 pour tout x H.


Remarque Soient x et y deux lments de H tels que pour tout z H, (x | z) = (y | z). Alors
x = y.
En effet, lhypothse entrane que (x y | z) = 0 pour tout z H, et donc xy H = {0H }.
Do le rsultat.
Proprit
Soit F un sous-espace vectoriel de dimension finie de H et (e1 , . . . ep ) une famille gnratrice de F .
Pour tout x H, on a lquivalence :
x F

i [[1,p]], (ei | x) = 0.

Dmonstration Si x F , alors pour tout i [[1,p]], (ei | x) = 0, car ei F . Rciproquement,


si (ei | x) = 0 pour tout i [[1,p]], alors pour tout (1 , . . . ,p ) Rp ,
p
X
i=1

i (ei | x) = 0, i.e.

n
X
i=1



i ei x

= 0,

par linarit gauche de ( | ). Comme F = Vect(e1 , . . . ,ep ), on a bien x F .


235

Proprit
Soit F un sous-espace vectoriel de H. Alors :
F (F ) .
F et F sont en somme directe orthogonale. En particulier, F F = {0H }.
Si G est un supplmentaire orthogonal de F , alors G = F .
Dmonstration
Soit x F . Alors, pour tout y F , (x | y) = 0, donc x (F ) .
Cest une consquence de la proprit du paragraphe prcdent, car F F .
Soit G un supplmentaire orthogonal de F . Montrons que G = F . Tout dabord, F G donc
G F . Rciproquement, soit x F . On peut dcomposer x sous la forme y + z avec y F
et z G. Alors y = x z F car x F et z G F . Donc y F F = {0H } et
x = z G. Do lgalit G = F . Ainsi, F a au plus un supplmentaire orthogonal, qui ne peut
tre que F .

Remarque Il est important de remarquer que linclusion rciproque du premier point est fausse
en gnral. Par exemple, soit H = C 0 ([0,1],R) muni du produit scalaire usuel dfini par
Z 1
f (t)g(t) dt.
(f | g) =
0

Considrons le sous-espace vectoriel F = {f E; f (0) = 0} de H. Soit f F ; alors, la


fonction g : t 7 t f (t) tant un lment de F , on a (f | g) = 0, i.e.
Z 1
t f (t)2 dt = 0.
0

t f (t)2

La fonction t 7
tant de plus continue et positive, elle est nulle, donc f (t) = 0 pour tout
t ]0,1]. Par continuit de f , on a galement f (0) = 0, et finalement, f = 0H . On en dduit que
F = {0H }. Ainsi, dans ce cas, on a (F ) = {0H } = H =
6 F.

On remarque galement que la somme F F nest pas toujours gale H : dans lexemple
prcdent, on a F F = F 6= H. En gnral, F et F ne sont donc pas toujours supplmentaires
orthogonaux.
En revanche, les rsultats sont vrais lorsque F est de dimension finie :
Thorme Supplmentaire orthogonal dun sous-espace de dimension finie
Soit F un sous-espace vectoriel de dimension finie de H. Alors :
H = F F .
(F ) = F .
Remarque Daprs le premier point, si F est un sous-espace vectoriel de dimension finie de H,
F est un supplmentaire orthogonal de F , et on sait daprs la proprit prcdente que cest
alors lunique supplmentaire orthogonal de F .
Dmonstration
On sait dj que la somme est directe, il suffit de montrer que H F +F . Soit B = (1 , . . . ,n )
une base orthonorme de F (qui existe daprs le procd de Gram-Schmidt). Pour tout x H,
on cherche crire x = y + z avec y F et z F .
P
Analyse : supposons quune telle dcomposition existe, et soit y = ni=1 i i la dcomposition
de y dans la base B. Alors x y = z F , donc pour tout j [[1,n]], (j | x y) = 0, cest--dire
(j | x) = (j | y) =

n
X
i=1

236

i (j | i ) = j

car B est orthonorme. Ainsi y est ncessairement donn par : y =

Pn

i=1 (i | x) i .

Synthse : dfinissons donc y par cette formule. Alors y F et xy F car pour tout j [[1,n]],
(j | x y) = 0 en reprenant le calcul prcdent. On a donc bien la dcomposition souhaite avec
z = x y.
Le premier point montre que F a un supplmentaire orthogonal, savoir F . Le dernier point
de la proprit prcdente (appliqu avec F la place de F et F la place de G) montre alors
que F = (F ) .

Thorme/Dfinition Projection orthogonale
Soit F un sous-espace vectoriel de dimension finie de H.
La projection pF sur F paralllement F est bien dfinie car H = F F , elle est
appele projection orthogonale sur F .
Si (1 , . . . ,n ) est une base orthonorme de F , alors pour tout x H,
pF (x) =

n
X
i=1

(i | x) i .

Le vecteur pF (x) est appel le projet orthogonal de x sur F .


Dmonstration La formule donnant pF (x) a t dmontre dans le thorme prcdent.

Remarques
Pour dterminer le projet orthogonal de x sur F , il nest pas ncessaire de disposer dune base
orthonorme de F . En effet, il suffit de remarquer que pF (x) est entirement caractris par :
pF (x) F et x pF (x) F . Si lon dispose dune famille gnratrice quelconque (e1 , . . . ,ep )
de F , alors daprs une proprit prcdente, x pF (x) F si et seulement si
i [[1,p]],

(ei | x pF (x)) = 0,

ce qui peut scrire comme un systme linaire dont les inconnues sont les scalaires dune dcomposition de pF (x) sur la famille (e1 , . . . ,ep ).
En revanche, pour que la formule explicite de pF (x) de la proprit prcdente soit vraie, il
est essentiel que (1 , . . . ,n ) soit une base orthonorme de F .
Si F est un sous-espace vectoriel de dimension finie de H, on appelle symtrie orthogonale par
rapport F la symtrie sF par rapport F , paralllement F . On a la relation IdH +sF = 2pF .
Si E est euclidien et F est un hyperplan de E, on dit que sF est la rflexion par rapport F .
Proprit
Soit B = (1 , . . . ,n ) une base orthonorme dun espace euclidien (E, ( | )).
Alors, la dcomposition dun vecteur x E dans la base B est
x=

n
X
i=1

(i | x) i .

Dmonstration Cest une consquence immdiate de la formule du thorme prcdent, avec


le choix particulier de F = E; dans ce cas, bien sr, le projet orthogonal de x sur E est x
lui-mme.

Remarque En particulier, pour tout (x,y) E 2 ,
(x | y) =

n
X
i=1

(i | x) (i | y)

et kxk =
237

n
X
i=1

(i | x)2

!1/2

Thorme
Soit F un sous-espace vectoriel dun espace euclidien E.
Alors E = F F . En particulier,
dim(F ) + dim(F ) = dim(E).
Si F et G sont deux sous-espaces vectoriels de E, pour que F et G soient supplmentaires orthogonaux, il faut et il suffit que
F G et

dim(F ) + dim(G) = dim(E).

Dmonstration
On a montr que le rsultat E = F F est toujours vrai si F est de dimension finie, ce qui
est le cas dans la situation prsente, E tant de dimension finie. La formule des dimensions vient
de la premire remarque du paragraphe prcdent.
Cela vient aussi de la premire remarque du paragraphe prcdent.

Remarque Si F est un sous-espace vectoriel de E, F et F sont de dimension finie, les projections


orthogonales sur F et F sont bien dfinies et on a la relation pF + pF = Id, cest--dire que
pour tout x E, x pF (x) = pF (x).

III.

Distance

tant donn un vecteur x de H et F un sous-espace vectoriel de H de dimension finie, on


cherche un vecteur de F qui soit le plus proche de x au sens de la distance associe au produit
scalaire ( | ) sur H.
Thorme/Dfinition
Soit x H et F un sous-espace vectoriel de dimension finie de H.
Alors la fonction

F R+
y 7 kx yk

a un minimum sur F , qui est atteint en pF (x) et uniquement en ce point.


Autrement dit, il existe un unique vecteur y0 de F tel que
kx y0 k = min kx yk,
yF

et ce vecteur est pF (x).


Le rel positif kx pF (x)k est appel distance de x F , not d(x,F ) :
d(x,F ) = kx pF (x)k = min kx yk.
yF

Dmonstration Comme F est de dimension finie, on sait que H = F F . On peut donc crire
x = pF (x) + z avec pF (x) F et z F . Alors pour tout y F, pF (x) y F et donc
x pF (x) = z est orthogonal pF (x) y. Daprs le thorme de Pythagore, on a donc
kx yk2 = k(x pF (x)) + (pF (x) y)k2 = kx pF (x)k2 + kpF (x) yk2 > kx pF (x)k2 ,
avec galit si et seulement si kpF (x) yk2 = 0 cest--dire y = pF (x).
238

Proprit
Soit F un sous-espace vectoriel de dimension finie de H et (1 , . . . ,n ) une base orthonorme de F .
La distance de x F est donne par les formules
2

d(x,F ) = kxk kpF (x)k = kxk

n
X
i=1

(i | x)2 .

Dmonstration La famille (1 , . . . ,n ) est une base orthonorme de F , donc pour tout x H,


on connat lexpression explicite de pF (x) :
n
X

pF (x) =

i=1

et on a galement

(i | x) i ,

2

n
n

X
X


(i | x) i =
(i | x)2 .
kpF (x)k2 =


i=1

i=1

De plus, les vecteurs pF (x) et xpF (x) sont orthogonaux, donc daprs le thorme de Pythagore,
kxk2 = kpF (x) + (x pF (x))k2 = kpF (x)k2 + kx pF (x)k2 = kpF (x)k2 + d(x,F )2 .
On en dduit les deux formules.

Corollaire Ingalit de Bessel


Soit F un sous-espace vectoriel de dimension finie de H et (1 , . . . ,n ) une base orthonorme de F .
Pour tout x H, on a
kpF (x)k 6 kxk.
Dmonstration En effet, la diffrence kxk2 kpF (x)k2 est gale d(x,F )2 > 0.

Exemple Dterminons le polynme de degr au plus 2 qui soit le plus proche de X 3 au sens de
la norme associe au produit scalaire dfini sur R[X] par
(P | Q) =

P (x) Q(x) dx.

Nous avons dtermin ci-dessus une base orthonorme (0 ,1 ,2 ) de R2 [X] pour ce produit scalaire. Lunique polynme qui rpond au problme est le projet orthogonal de X 3 sur R2 [X],
cest--dire le polynme



P (X) = 0 | X 3 0 + 1 | X 3 1 + 2 | X 3 2





 
Z 1
2 Z 1
1 3
1
3
t
t dt
X
t dt + 2 3
=
2
2
0
0
Z 1 



1
1
+ 180
t3 dt
X2 X +
t2 t +
6
6
0






1 1 1
1 1 1 1
1
1
1
2

+
X
+ 180
X X +
.
= + 12
4
5 2 4
2
6 5 6 4
6
3
1
3
Aprs simplifications, on obtient P (X) = X 2 X + .
2
5
20
239

Comme indiqu dans une remarque de la partie prcdente, on peut aussi dterminer P (X)
en rsolvant le systme


3
2
X

aX

bX

c
|
1
=0


3
2
X aX bX c | X = 0

X 3 aX 2 bX c | X 2 = 0
ce qui aboutit bien sr la mme valeur de P (X), et ne ncessite pas de disposer de la famille
(0 ,1 ,2 ).
On peut alors dterminer la distance de X 3 R2 [X], cest--dire la racine carre de la quantit
Z 1
2
inf
t3 at2 bt c dt;
(a,b,c)R3

3
1
3
et
en effet cette borne infrieure est un minimum, qui est atteint pour a = , b = et c =
2
5
20
uniquement pour ces valeurs.
Daprs la proprit ci-dessus, on peut galement calculer cette valeur en utilisant la formule
inf

(a,b,c)R3

IV.

2
X
2
2
3 2
i | X 3 .
t at bt c dt = kX k
3

i=0

Formes linaires sur un espace euclidien

Dans cette partie, (E, ( | )) dsigne un espace euclidien.


Thorme Reprsentation des formes linaires sur un espace euclidien
Soit f une forme linaire sur E. Alors il existe un unique vecteur a E tel que :
x E, f (x) = (a | x) .
On dit parfois que le vecteur a reprsente f via le produit scalaire ( | ) .
Dmonstration Soit B = (e1 , . . . ,en ) une base orthonorme de E, et soit x = x1 e1 + + xn en
un vecteur de E. Alors
n
X
xi f (ei ),
f (x) =
i=1

qui est le produit scalaire entre x et le vecteur a = f (e1 )e1 + + f (en )en car B est orthonorme.
Ceci prouve lexistence de a.
Quant lunicit, supposons que deux vecteurs a et b vrifient, pour tout x E,
f (x) = (a | x) = (b | x) .
Alors, pour tout x E, (a b | x) = 0 et donc a b E = {0E }. On en dduit que a = b. 

Remarque Rciproquement, si a E, lapplication x 7 (a | x) est linaire, par linarit


droite du produit scalaire. Le rsultat prcdent signifie donc que dans un espace euclidien, on
sait dcrire entirement les formes linaires : il sagit exactement des applications de la forme
x 7 (a | x) o a est un vecteur de E, chaque forme linaire f sur E tant associe un unique
vecteur a.
Exemples
Dans le cas de la forme linaire dfinie sur R3 (muni du produit scalaire canonique) par
f (x,y,z) = x + 2y + 3z, a est le vecteur (1,2,3).
Les formes linaires sur Mn (R) sont exactement les applications de la forme M 7 Tr(AM ) o
A Mn (R).
240

Proprit/Dfinition Vecteur normal un hyperplan


Soit H un hyperplan de E et f une forme linaire non nulle sur E telle que H = Ker(f ).
Il existe a E non nul tel que f : x 7 (a | x). Ainsi, pour x E, on a lquivalence
xH

(a | x) = 0.

On dit que a est un vecteur normal H.


Avec les notations prcdentes, en notant a = a1 e1 + + an en la dcomposition de a
dans la base orthonorme B, on a
(a | x) = a1 x1 + + an xn .
Ainsi, H a pour quation
a1 x1 + + an xn = 0
dans la base B.
Remarque Avec les notations prcdentes, lensemble des formes linaires caractrisant H est
Vect(f ) \ {0}. De la mme faon, lensemble des vecteurs normaux H est Vect(a) \ {0}. Il est
en effet vident que pour tout R , f est reprsente par le vecteur a. Les quations de H
sont donc exactement les quations (a | x) = 0 o R .
Si lon travaille dans une base orthonorme B = (e1 , . . . ,en ), et si H a pour quation
a1 x1 + + an xn = 0
dans la base B, les vecteurs normaux H sont exactement les vecteurs (a1 e1 + + an en ) o
R .
Proprit Distance dun vecteur un hyperplan ou une droite
Soit H un hyperplan de E et a un vecteur normal H. Alors, pour tout x E, la
distance de x H est donne par
d(x,H) =

| (x | a) |
.
kak

Soit D une droite vectorielle de E et a un vecteur non nul de D. Alors, pour tout
x E, la distance de x D est donne par
s
(x | a)2
.
d(x,D) = kxk2
kak2
Dmonstration
La distance de x H est donne par d(x,H) = kx pH (x)k, le vecteur pH (x) tant entirement
caractris par : pH (x) H et x pH (x) H = Vect(a). Ainsi, pH (x) est lunique vecteur de
la forme x a, o R, qui appartienne H, i.e. tel que (x a | a) = 0, ce qui quivaut :
(x | a) kak2 = 0. On a alors
d(x,H) = kx pH (x)k = kak =

| (x | a) |
.
kak

Daprs le thorme de Pythagore, on a d(x,D)2 = kxk2 d(x,D )2 , la distance d(x,D ) tant


donne par le premier point, car a est un vecteur normal lhyperplan D . On en dduit la
formule.


241

242

Chapitre 13

Sries entires
Nous avons dj montr laide du thorme de drivation terme terme des sries de
fonctions, que pour tout x ]1,1[,
arctan(x) =

+
X

(1)n

n=0

x2n+1
.
2n + 1

Nous avons galement prouv dans le chapitre Sries numriques que la srie

X zn
n>0

n!

converge

absolument pour tout z C. Lun des raisonnements que nous avions faits, bas sur la formule
de Taylor avec reste intgral, montrait mme que pour tout x R,
x

e =

+ n
X
x
n=0

n!

P
Il semble donc que les sries de la forme n>0 an z n jouent un rle particulier et que des fonctions
usuelles se reprsentent comme somme de telles sries ; cest ce que nous allons tudier dans ce
chapitre.

I.

Dfinition et convergence des sries entires

1.

Dfinition, rayon de convergence


Dfinition Srie entire
P
n
Une srie entire
est
une
srie
de
la
forme
n>0 an x o x est une variable relle,
P
ou de la forme n>0 an z n o z est une variable complexe, les coefficients an tant des
nombres complexes.
On dit que cette srie est associe la suite (an )nN , ou quelle a pour coefficients les
nombres an .
Ltude de la convergence des sries entires est base sur le lemme suivant :
Lemme dAbel
P
Soit n>0 an z n une srie entire et z0 C tel que la suite (an z0n )nN soit borne.
X
Alors, pour tout z C tel que |z| < |z0 |, la srie
an z n converge absolument.
n>0

Dmonstration Si z0 = 0, il ny a rien dmontrer. Sinon, soit z C tel que |z| < |z0 |. Alors
pour tout n N,
n

n
n z
|an z | = |an z0 | .
z0
243

La suite (an z0n ) tant borne, on en dduit que


 n 
z
an z = O .
z0
n

De
X plus, la srie gomtrique de raison |z/z0 | [0,1[ est convergente. Par comparaison, la srie
an z n converge absolument.

n>0

Dfinissons alors
I = { > 0; (an n ) est borne} et R = sup I [0, + ].
Ce nombre est bien dfini car la suite (an n ) est borne par exemple pour = 0, donc I est non
vide. La borne suprieure est calcule dans R, et notamment, R peut tre infini ; cest le cas si
et seulement si la partie I nest pas majore.
On remarque de plus que R ne dpend que de (an ) et notamment, il est le mme, que la srie
entire soit de la variable relle, ou de la variable complexe.
Enfin, il est tout fait possible que R
/ I, mme lorsque R est fini : cela correspond la
situation o (an Rn ) nest pas borne.
Exemples
P
La srie gomtrique n>0 z n est une srie entire. Pour > 0, la suite (n ) est borne si et
seulement si 6 1. On a donc ici I = [0,1], do R = 1.
P
Dans le cas de la srie n>0 nz n , pour > 0, la suite (nn ) est borne si et seulement si < 1 :
on a I = [0,1[ et ici aussi R = 1.
Proprit
On utilise les notations prcdentes. Soit z C.
X
Si |z| < R, alors la srie
an z n converge absolument.
n>0

Si |z| > R, alors la srie

an z n diverge grossirement.

n>0

Dmonstration
Si |z| < R, alors par dfinition de la borne suprieure,
P il existe I tel que |z| < . Alors la
suite (an n ) est borne et daprs le lemme dAbel, n>0 an z n converge absolument.
Si |z| > R, alors |z|
/ I et doncP
(an |z|n ) nest pas borne, ce qui entrane que an z n ne tend
pas vers 0. En particulier, la srie n>0 an z n diverge grossirement.

Dfinition Rayon de convergence, disque/intervalle ouvert de convergence
X
X
On appelle R le rayon de convergence de la srie entire
an z n ou
an xn .
n>0

n>0

Dans le cas dune variable complexe, lensemble D(0,R) = {z C; |z| < R} est
appel disque ouvert de convergence de la srie entire.
Si R = +, il sagit de C tout entier.
Dans le cas dune variable relle, lintervalle ]R,R[ est appel intervalle ouvert
de convergence de la srie entire. Si R = +, il sagit de R tout entier.

Remarque En fait, R est entirement caractris par les deux premiers points de la proprit
prcdente : si R et R sont deux rels vrifiant cette proprit, et si par exemple R < R , alors
244

P
pour R < r < R , la srie n>0 an r n doit tre la fois convergente et divergente, ce qui est
absurde. On a donc R > R et de mme R 6 R .

Mthode On a plusieurs moyens pour minorer et majorer le rayon de convergence R, notamment,


pour tout r > 0 et z0 C :
Si la suite (an n ) est borne pour tout tel que 0 6 < r, alors R > r.

Si la suite (an n ) est non borne pour tout > r, alors R 6 r.


P
Si la srie n>0 an z n converge pour tout z C tel que |z| < r, alors R > r.
P
Si la srie n>0 an z n diverge pour tout z C tel que |z| > r, alors R 6 r.
P
Si la srie n>0 an z0n converge ou si la suite (an z0n ) est borne, alors R > |z0 |.
P
Si la srie n>0 an z0n diverge, alors R 6 |z0 |.

Ces points proviennent, suivant les cas, de la dfinition de R, de la proprit prcdente, ou


se dmontrent comme le rsultat de la remarque prcdente.
La proprit suivante, base sur le thorme de comparaison, permet de comparer les rayons
de convergence de deux sries entires :
Proprit Comparaison de rayons de convergence
P
P
Soient n>0 an z n et n>0 bn z n deux sries entires de rayons de convergence respectifs
Ra et Rb .
Si an = O(bn ), alors Ra > Rb .
Si an bn , alors Ra = Rb .
Dmonstration
Sachant que an = O(bn ), on a, pour tout z C,
an z n = O(|bn z n |).
P
P
Si |z| < Rb , n>0 bn z n converge absolument, donc par comparaison, n>0 an z n converge absolument, et donc converge. On en dduit que Ra > Rb daprs le troisime point de la mthode
prcdente.
Si an bn , alors an = O(bn ) et bn = O(an ), donc daprs le point prcdent, Ra > Rb et
Rb > Ra , do le rsultat.

Exemples
P
La srie gomtrique n>0 z n est une srie entire de rayon de convergence gal 1 et pour
tout z C tel que |z| < 1,
+
X
1
.
zn =
1z
n=0
La srie

X zn
n>1

est une srie entire de rayon de convergence R gal 1. En effet, on a

1/n = O(1), donc daprs le point prcdent et la proprit ci-dessus, R > 1. De plus, pour
z = 1, la srie obtenue est la srie harmonique, divergente. On en dduit que R 6 1.
Remarquons au passage que pour z = 1, de module 1, la srie obtenue est la srie harmonique alterne, convergente. On retiendra donc de ces exemples quaux points du bord du
disque
P de convergence, on peut avoir convergence comme divergence de la srie. En revanche,
si n>0 |an |Rn converge, alors par dfinition mme, la srie converge absolument en tout point
du bord du disque de convergence. En dehors de ce cas particulier, on ne donnera dans ce cours
aucun rsultat gnral de convergence au bord du disque de convergence, qui devra donc tre
examine au cas par cas.
245

La srie

n>1



1
z n a pour rayon de convergence 1 daprs le point prcdent et la
ln 1 +
n

proprit ci-dessus, car

1
ln 1 +
n
La srie

X zn

n>0

n!

1
.
n

est une srie entire de rayon de convergence infini : daprs la rgle de dAlem-

bert, elle converge pour tout z C.

2.

La rgle de dAlembert pour les sries entires

Pour tudier la convergence des sries, nous disposons de la rgle de dAlembert, dont on sait
quelle permet de conclure des convergences absolues ou des divergences grossires, ce qui est
le cas des sries entires en dehors du bord du disque de convergence. Il parat donc judicieux de
tester cette rgle dans le cadre des sries entires.
X
an z n . Supposons que an 6= 0 pour n
Soit R le rayon de convergence de la srie entire
n>0

assez grand. Pour z = 0, la srie converge toujours. Si z 6= 0, le quotient apparaissant dans la


rgle de dAlembert est (pour n assez grand)



an+1 z n+1 an+1

=

an z n an |z|.


an+1
possde une limite (ventuellement infinie). Alors

Supposons que
an


an+1 z n+1
|z|.

an z n n+
Daprs la rgle de dAlembert :
Si = 0, la srie converge absolument quel que soit z et R = +.
Si = +, elle ne converge que pour z = 0 et R = 0.
P
Si ]0, + [, alors : si |z| < 1, la srie n>0 an z n converge absolument, et si |z| > 1, elle
diverge grossirement. Ainsi R = 1/.
On vient donc de dmontrer le rsultat suivant :

Thorme Rgle de dAlembert pour les sries entires


P
Soit n>0 an z n une srie entire. On suppose que an 6= 0 pour n assez grand, et quil
existe R+ ou = + tel que


an+1


an .
P
Alors le rayon de convergence R de la srie entire n>0 an z n est donn par :

si ]0, + [

R = + si = 0

0
si = +

Remarque Comme pour la rgle de dAlembert usuelle, il nexiste pas de rciproque : le quotient
|an+1 /an | peut ne pas avoir de limite, voire ne pas tre dfini, alors que le rayon de convergence
existe toujours. En particulier, lorsque cette rgle ne sapplique pas, il faut penser aux autres
moyens que nous avons exposs pour dterminer un rayon de convergence.
246

Exemples
La srie entire
La srie entire

nz n a pour rayon de convergence 1 car

n+1
1.
n

n! z n a pour rayon de convergence 0 car

(n + 1)!
= (n + 1) +. Elle ne
n!

n>0

n>0

converge que pour z = 0.


X 2n
La srie entire
z n a pour rayon de convergence + car
n!2
n>0

2n+1 /(n + 1)!2


2
=
0.
n
2
2 /n!
(n + 1)2
Elle converge pour tout z C.
Attention aux sries dites lacunaires , dans lesquelles tous les exposants napparaissent pas,
comme la srie
X
2n ln(n) z 2n .
n>1

Pour cette srie, on a, pour tout p N, a2p = 2p ln(p) si p > 1, mais a2p+1 = 0. Il ne faut pas
faire lerreur de dire que an = 2n ln(n) pour tout n > 1, ce qui donnerait un rayon de convergence
(faux) de 1/2. Pour n > 2, et z 6= 0,


2n+1 ln(n + 1) z 2(n+1)
ln(n + 1) 2


|z| 2|z|2 .

=2
n
2n
n+


2 ln(n) z
ln(n)

2
2
On en dduit que la srie
converge absolument si 2|z| < 1 et diverge si 2|z| > 1. Le rayon de
convergence est donc 1/ 2. On retiendra que pour appliquer la rgle de dAlembert de telles
sries, il faut revenir la rgle de dAlembert pour les sries numriques.

3.

Convergence normale sur tout segment de lintervalle de convergence

Nous savons dj que la convergence des sries entires est absolue sur le disque ouvert de
convergence. Quen est-il de la convergence uniforme ou normale ?
Thorme
P
n
Soit
n>0 an x une srie entire dune variable relle, de rayon de convergence R.
Posons, pour tout n N, fn : x 7 an xn .
P
Alors n>0 fn converge normalement sur tout segment inclus dans lintervalle ouvert
de convergence ]R,R[.
Dmonstration Soit [a,b] un segment inclus dans ]R,R[ et r = max{|a|,|b|} [0,R[. Alors,
pour tout x [a,b], pour tout n N,
|an xn | 6 |an |r n .
La srie

n>0 an r

converge absolument car r [0,R[, do le rsultat.

Attention ! Il ny a pas ncessairement convergence normale


ouvert de convergence
Psur lintervalle
n ne converge pas normalement
tout entier : par exemple,
la
srie
de
fonctions
associe

x
n>0
P
sur ]1,1[, car la srie n>0 1 diverge.
247

II.

Oprations sur les sries entires


Thorme Somme de sries entires
P
P
Soient n>0 an z n et n>0 bn z n deux sries entires de rayons de convergence respectifs
Ra et Rb .
X
Alors le rayon de convergence R de la srie entire
(an + bn )z n vrifie
n>0

R > min{Ra ,Rb },


avec galit si Ra 6= Rb .

Pour tout z C vrifiant |z| < min{Ra ,Rb }, on a alors


+
X

(an + bn )z n =

+
X

an z n +

bn z n .

n=0

n=0

n=0

+
X

P
P
DmonstrationP Si |z| < min{Ra ,Rb }, alors les deux sries n>0 an z n et n>0 bn z n convergent,
donc la srie n>0 (an + bn )z n converge, ce qui implique que R > min{Ra ,Rb }.
P
n
Si Ra 6= Rb (par exemplePRa < Rb ), alors pour r vrifiant RP
a < r < Rb , la srie
n>0 an r
n
n
diverge tandis que la srie n>0 bn r converge, donc la srie n>0 (an + bn )r diverge. On a
donc, dans ce cas, R 6 min{Ra ,Rb }.
Si |z| < min{Ra ,Rb }, la formule sur la somme est une consquence des rsultats sur les sries
(linarit de la somme).

P
Remarque
On na pas toujours R = min{Ra ,Rb } si Ra = Rb . Par exemple, les sries n>0 z n
P
et n>0 z n ont toutes les deux pour rayon de convergence 1, mais la srie somme a un rayon
de convergence infini.
Thorme Produit de Cauchy de sries entires
P
P
Soient n>0 an z n et n>0 bn z n deux sries entires de rayons de convergence respectifs
Ra et Rb .
Alors leur produit de Cauchy est la srie entire
!
X X
ap bq z n ,
n>0

p+q=n

dont le rayon de convergence R vrifie


R > min{Ra ,Rb }.
Pour tout z vrifiant |z| < min{Ra ,Rb }, on a alors

!
+
+
+
X
X
X
X
ap z p
bq z q .
ap bq z n =
n=0

p+q=n

p=0

q=0

Dmonstration Le produit de Cauchy des deux sries est la srie


!
!
X X
X X
ap bq z n .
(ap z p )(bq z q ) =
n>0

p+q=n

n>0

p+q=n

P
n
n
Si |z| < min{Ra ,Rb }, alors les deux sries
n>0 bn z convergent absolument,
n>0 an z et
donc daprs le thorme de convergence du chapitre Sries numriques, on a convergence du
produit de Cauchy, ainsi que la formule annonce. En particulier R > min{Ra ,Rb }.

248

Attention ! Il ny a pas de cas dgalit


P pour les rayons de convergence de produits de sries
entires : les sries entires 1 z et n>0 z n ont pour rayons de convergence respectifs + et
1, qui sont distincts, mais leur produit de Cauchy est la srie constante gale 1, de rayon de
convergence + > min{1, + }. En effet, avec les notations du thorme, on a ici
X
ap bq = a0 b0 = 1 1 = 1,
p+q=0

n > 1,

p+q=n

ap bq = a0 bn + a1 bn1 = 1 1 1 1 = 0.

Exemple Le produit de Cauchy des sries entires

z n et

X zn
n

est la srie entire

Hn z n

n>1
n>0
n>1
P
o, pour tout n > 1, Hn = nk=1 1/k. Son rayon de convergence R vrifie R > 1 (on peut en fait
montrer que R = 1 partir de lquivalent Hn ln(n)).

III.

Rgularit de la somme dune srie entire

Continuit sur le disque ouvert de convergence


Thorme
P
Soit n>0 an xn une srie entire dune variable relle, de rayon de convergence R.
+
X
an xn est continue sur ]R,R[ .
Alors la fonction somme S : x 7
P

n=0

n
n>0 an z une srie entire dune variable complexe, de rayon de convergence
+
X
an z n est continue sur D(0,R).
R. Alors la fonction somme S : z 7

Soit

n=0

Dmonstration
P
Pour tout n N, fn : x 7 an xn est continue sur ]R,R[. De plus, la srie de fonctions n>0 fn
converge normalement (et donc uniformment) sur tout segment de ]R,R[. Daprs le thorme
de continuit pour les sries de fonctions, S est continue sur ]R,R[.
Conformment au programme, ce rsultat est admis.


Sries entires de la variable relle : drivation et intgration


P
P
La srie des drivesP
dune srie entire n>0 an z n est la srie n>1 nan z n1 . un facteur
prs, on obtient la srie n>0 nan z n . On sintresse donc au rayon de convergence de cette srie
entire.
Proprit
P
Soit n>0 an z n une srie entire de rayon de convergence R.
Alors la srie entire
X
nan z n
n>0

a pour rayon de convergence R.

Dmonstration Notons R le rayon de convergence de la srie


an = O(nan )
donc R > R .
249

n>0 nan z

n.

On a tout dabord

Si |z| < R, soit r vrifiant |z| < r < R. Alors pour n N,


nan z n = n

zn
an r n .
rn

z
  z n 

La suite n
est borne par croissances compares, car < 1. On en dduit que
r
r
nan z n = O (|an r n |) .

P
P
Or r < R, donc la srie n>0 an r n converge absolument. Par comparaison, la srie n>0 nan z n
converge absolument, et donc converge. Ainsi R > R, ce qui termine la dmonstration.

Thorme Primitivation terme terme des sries entires
P
Soit n>0 an xn une srie entire de rayon de convergence R > 0.
Alors, lunique primitive de sa fonction somme f sur ]R,R[ qui sannule en 0 est la
fonction somme de la srie entire
X an
xn+1 ,
n+1
n>0

qui a pour rayon de convergence R.


On peut donc primitiver terme terme les sries entires sur leur intervalle ouvert de
convergence.
Dmonstration Daprs leRthorme fondamental, lunique primitive de f sur ]R,R[ qui sannule
x
en 0 est la fonction
x 7 0 f (t) dt. Par continuit des fonctions fn : t 7 an tn et convergence
P
normale de n>0 fn sur tout segment de ]R,R[, on peut appliquer le thorme dintgration
terme terme pour les sries de fonctions : si x ]R,R[,
Z

f (t) dt =

+ Z
X

n=0

an t dt

+
X
an n+1
x
.
=
n+1
n=0

Cette srie entire a pour rayon de convergence R, on le montre en raisonnant comme dans la
proprit prcdente.

Thorme Drivation terme terme des sries entires
P
Soit n>0 an xn une srie entire de rayon de convergence R > 0.

Alors sa fonction somme f est de classe C 1 sur ]R,R[ et pour tout x ]R,R[,

f (x) =

+
X

nan xn1 ,

n=1

la srie entire associe ayant pour rayon de convergence R.


On peut donc driver terme terme les sries entires sur leur intervalle ouvert de
convergence.
Dmonstration Pour tout n > 0, la fonction fn : x 7 an xn est P
de classe C 1 sur ]R,R[ avec

n1

pour tout n > 1 et x ]R,R[. La srie n>0 fn converge simplement


f0 = 0 et fn (x) = nan x
sur ]R,R[. Pour appliquer le thorme de P
drivation terme terme des sries de fonctions, il

suffit de vrifier que la srie des drives,


n>1 fn , converge uniformment sur tout segment
de ]R,R[. Or, cette dernire srie est une srie entire de rayon de convergence R daprs la
proprit prcdente (le facteur x ne modifie pas le rayon de convergence), do le rsultat. 
250

On peut alors ritrer ce raisonnement avec la srie des drives k-imes. On en dduit le
rsultat suivant :
Thorme
P
Soit n>0 an xn une srie entire de rayon de convergence R > 0.
Alors sa fonction somme f est de classe C sur lintervalle ]R,R[ et pour tout k N,
pour tout x ]R,R[,
+
X

f (k) (x) =

n=k

n(n 1) (n k + 1) an xnk =

+
X

n=k

n!
an xnk .
(n k)!

Corollaire Expression des coefficients dune srie entire


P
Soit n>0 an xn une srie entire de rayon de convergence R > 0.
Alors, pour tout k N,
f (k) (0)
.
ak =
k!
Dmonstration Pour tout x ]R,R[, on a daprs le thorme prcdent,
f (k) (x) =

+
X

n=k

n!
an xnk .
(n k)!

En valuant en x = 0 (ce qui est possible car R > 0), on obtient f (k) (0) = k! ak , car seul le terme
correspondant n = k fournit un terme ventuellement non nul. Do le rsultat.

On en dduit en particulier que
P les coefficients an sont entirement dtermins par la donne
de la somme de la srie entire n>0 an xn de rayon de convergence non nul. Par exemple, et
cest intuitif, si la somme dune srie entire ne prend que des valeurs relles, alors on sait que
tous les coefficients de cette srie entire sont rels, mme si lexpression de ces coefficients ne le
fait pas clairement apparatre.
Du corollaire prcdent, on dduit immdiatement :
Thorme Unicit du dveloppement en srie entire
P
P
Soient n>0 an xn et n>0 bn xn deux sries entires de rayons de convergence suprieurs ou gaux un certain r > 0. On suppose que pour tout x ]r,r[,
+
X

an xn =

n=0

+
X

bn xn .

n=0

Alors an = bn pour tout n N.


Application Soit
somme. Alors :

n
n>0 an x

une srie entire de rayon de convergence R > 0 et f sa fonction

f est paire si et seulement si pour tout k N, a2k+1 = 0.


f est impaire si et seulement si pour tout k N, a2k = 0.

Dmonstration Il suffit de traiter le cas o f est paire, lautre est similaire. Si f est paire, alors
pour tout x ]R,R[,
+
+
+
X
X
X
(1)n an xn .
an (x)n =
an xn =
n=0

n=0

n=0

Par unicit du dveloppement en srie entire, on a donc an = (1)n an pour tout n N, ce qui
entrane le rsultat. La rciproque est claire.

251

IV.
1.

Dveloppements en sries entires


Srie de Taylor

Dfinition Fonction dveloppable en srie entire


Soit I un intervalle de R auquel 0 est intrieur, et soit r > 0 tel que ]r,r[ I. Soit
f : I C une fonction.
On dit que f est dveloppable en srie entire sur ]r,r[P
si f est la somme dune
srie entire sur ]r,r[, cest--dire, sil existe une srie entire n>0 an xn de la variable
relle, de rayon de convergence au moins gal r, telle que
x ]r,r[, f (x) =
+
X

+
X

an xn .

n=0

x2n+1
.
2n + 1
n=0
Ce dveloppement en srie entire de arctan est explicitement au programme, il est connatre.
On remarque au passage que le rayon de convergence de la srie entire prcdente est 1,
mme si la fonction arctan est dfinie sur R tout entier. On ne demande pas la fonction somme
de la srie entire de concider avec f , ni mme dtre dfinie, sur I tout entier. Cest pour cela
quon a introduit le paramtre r dans la dfinition, qui permet de se placer au voisinage de 0.
Exemple Pour tout x ]1,1[, arctan(x) =

(1)n

Remarque Si f est dveloppable en srie entire sur ]r,r[, par unicit du dveloppement en
srie entire, les ventuels coefficients an sont alors entirement dtermins : f est de classe C
sur ]r,r[ et on a ncessairement, pour tout n N,
an =

f (n) (0)
.
n!

Dfinition Srie de Taylor


Soit f : ]r,r[ C une fonction de classe C avec r > 0. On appelle srie de Taylor
de f (en 0) la srie entire
X f (n) (0)
xn .
n!
n>0

Si f est dveloppable en srie entire sur ]r,r[, elle ne peut tre somme que de sa srie de
Taylor. Le problme de la recherche des coefficients an ne se pose donc presque pas, en revanche,
se pose le problme de la convergence de la srie de Taylor, seule candidate avoir pour
somme f , et le problme de lgalit entre sa somme et f .
Commenons par donner des contre-exemples qui prouvent que ces deux problmes ne sont
pas anodins.
On peut prouver quil existe une fonction f de classe C au voisinage de 0 telle que pour tout
2
n N, f (n) (0) = (n!)
P . Alorsn la srie de Taylor de f a un rayon de convergence nul car il sagit
de la srie entire n>0 n! x .

Considrons la fonction f dfinie sur R par f (0) = 0 et f (x) = exp(1/x2 ) si x 6= 0. On prouve


facilement que f est de classe C sur R avec, pour tout n N, f (n) (0) = 0. En effet, le seul
problme est videmment en 0, mais on montre facilement par rcurrence que pour tout n N,
il existe un polynme Pn tel que pour tout x 6= 0,
 
1
2
(n)
f (x) = Pn
e1/x .
x
252

Par croissances compares, f (n) (x) tend vers 0 lorsque x tend vers 0. On obtient alors le rsultat
par applications successives du thorme de la limite de la drive.
La srie de Taylor de f en 0 est la srie nulle : elle a videmment un rayon de convergence
infini, mais sa somme ne concide avec f quen 0 puisque f (x) 6= 0 si x 6= 0.

2.

Lien avec les formules de Taylor

Bien sr, la srie de Taylor dune fonction f nest pas sans rapport avec les formules de Taylor
f (n) (0) n
x .
pour la fonction f : on voit bien quelles font toutes intervenir les termes
n!
Tout dabord, supposons que f est dveloppable en srie entire sur ]r,r[ ; on a donc, pour
tout x ]r,r[,
+ (n)
X
f (0) n
x .
f (x) =
n!
n=0

Soit k N. Alors, daprs la formule de Taylor-Young lordre k, on a


f (x) =

x0

k
X
f (n) (0)

n!

n=0

xn + o(xk ).

Ainsi, le dveloppement limit lordre k de f en 0 est obtenu par troncature lordre k de son
dveloppement en srie entire.
crivons maintenant la formule de Taylor avec reste intgral lordre k en 0 pour une fonction
f de classe C sur un intervalle I contenant 0 :
Z x
k
X
f (n) (0) n
(x t)k (k+1)
x I, f (x) =
x +
f
(t) dt.
n!
k!
0
n=0

Si lon est capable de prouver que le reste intgral converge vers 0 lorsque k + pour tout x
dans un intervalle de la forme ]r,r[ I, alors on obtiendra un dveloppement en srie entire
de f sur ]r,r[. En utilisant cette ide, on va prouver le rsultat suivant :
Proprit
Pour tout z C,
z

e =

+ n
X
z

n=0

n!

Dmonstration Daprs la formule de Taylor avec reste intgral lordre k pour la fonction
f : t 7 ezt , de classe C sur [0,1], on a
Z 1
k
X
(1 t)k (k+1)
f (n) (0)
z
+
f
(t) dt
e = f (1) =
n!
k!
0
n=0
Z 1
k
X
(1 t)k k+1 zt
zn
+
z
e dt.
=
n!
k!
0
n=0

Or

1
0

Z 1
(1 t)k k+1 zt
(1 t)k k+1 zt
z
e dt 6
|z
||e | dt
k!
k!
0
Z 1
(1 t)k k+1 Re(z)t
=
|z
|e
dt
k!
0
Z 1
(1 t)k
dt
6 |z|k+1 e|Re(z)|
k!
0
1
= |z|k+1 e|Re(z)|
.
(k + 1)!
253

Ce dernier terme tend vers 0 lorsque k +, par croissances compares. On en dduit le


rsultat par passage la limite dans la formule de Taylor ci-dessus.


3.

Autres dveloppements en srie entire de rfrence

Nous allons donner quelques dveloppements en srie entire usuels, en plus de ceux de arctan
et exp. On peut alors en construire beaucoup dautres par :
Combinaison linaire,
Produit de Cauchy,
Intgration et drivation terme terme.

Bien sr, commenons par rappeler le dveloppement en srie entire correspondant la srie
gomtrique :
Proprit
Pour tout z C tel que |z| < 1,
+

X
1
zn
=
1z
n=0

Remarque On a en particulier, pour tout x ]1,1[,


+

X
1
xn ,
=
1x

X
1
(1)n xn ,
=
1+x

n=0

X
1
nxn1 ,
=
(1 x)2

n=0

n=1

ce dernier dveloppement tant obtenu par drivation du premier (on lavait dj prouv par
produit de Cauchy dans le chapitre Sries numriques).
En intgrant terme terme le deuxime dveloppement de la remarque prcdente, on obtient :
Proprit
Pour tout x ]1,1[,
ln(1 + x) =

+
X

(1)n1

n=1

xn
.
n

Remarque Bien sr, en changeant x en x, on a aussi, pour tout x ]1,1[ ,


ln(1 x) =

+ n
X
x

n=1

En prenant parties relle et imaginaire de exp(ix) =

+
X

in

n=0

on a galement :

+ n
X
xn
x
et en utilisant exp(x) =
,
n!
n!
n=0

Proprit
Pour tout x R,
cos(x) =
ch(x) =

+
X

x2n
(1)
(2n)!

n=0
+
X
n=0

x2n

(2n)!

sin(x) =
sh(x) =

+
X

n=0
+
X

n=0

254

(1)n

x2n+1
(2n + 1)!

x2n+1
(2n + 1)!

Enfin, donnons le dveloppement en srie entire de la fonction x 7 (1 + x) :


Proprit
Pour tout R, pour tout x ]1,1[,
(1 + x) = 1 +

+
X
( 1) ( n + 1)

n!

n=1

xn .

Lgalit est valable pour tout x R lorsque N, auquel cas on reconnat la formule
du binme de Newton.
Dmonstration Pour N, le rsultat est connu, il sagit de la formule du binme (et cest
en fait une somme finie). Sinon, en posant f (x) = (1 + x) pour tout x ]1,1[, alors f est de
classe C sur ]1,1[ et pour tout n N,
(
1
si n = 0,
f (n) (0) =
( 1) ( n + 1) sinon.
La srie de Taylor de f en 0,
1+

X f (n) (0)
n!

n>1

xn ,

a un rayon de convergence gal 1 daprs la rgle de dAlembert : en effet, ntant pas entier
naturel, ( 1) ( n + 1) 6= 0 pour tout n > 1 et



( 1) ( n)/(n + 1)! n

1.

( 1) ( n + 1)/n! = n + 1 n+

Notons S la fonction somme de cette srie. Alors S est de classe C 1 sur ]1,1[ et pour tout
x ]1,1[,
+
X
( 1) ( n + 1) n1
x
S (x) =
(n 1)!
n=1

=+
=+

+
X
( 1) ( n)
n=1
+
X

n!

( n)

n=1

xn

( 1) ( n + 1) n
x .
n!

En sparant ce dernier terme en deux, on a pour tout x ]1,1[,


S (x) = +

+
X
( 1) ( n + 1)

n=1

n!

xn

+
X
( 1) ( n + 1) n
x ,
n
n!
n=1

toutes les sries entires dans lgalit prcdente ayant pour rayon de convergence 1. On reconnat
alors lgalit
S (x) = S(x) xS (x).

La fonction S est donc solution de lquation diffrentielle (1 + x)S = S sur ]1,1[.

La fonction x 7 ln(1 + x) est une primitive sur ]1,1[ de la fonction continue x 7

donc il existe R tel que pour tout x ]1,1[,

,
1+x

S(x) = exp ( ln(1 + x)) = (1 + x) .


En remarquant de plus que S(0) = 1, on obtient = 1, donc f = S sur ]1,1[, ce qui est le
rsultat souhait.

255

256

Chapitre 14

Variables alatoires
Trs souvent, on peut associer chaque issue dune exprience alatoire un rsultat, notamment numrique, qui correspond lobservation dun des aspects de lexprience. Par exemple, si
on lance deux ds, un rouge et un vert, on peut sintresser au rsultat du d rouge, celui du d
vert, la somme des deux, la couleur de celui (ou ceux) qui donne(nt) le plus grand rsultat.
Si lon observe le dplacement alatoire dune particule dans lespace, on peut sintresser la
position, chaque seconde, de la particule, mais aussi sa vitesse, au temps ncessaire pour que
la particule atteigne, ventuellement, une position fixe, etc...
Dans tout le chapitre, (,A ,P ) est un espace probabilis.

I.

Dfinitions, premires proprits


Dfinition Variable alatoire
Une variable alatoire discrte sur (,A ) est une application dfinie sur , et
vrifiant les conditions suivantes :
Limage X() de X est finie ou dnombrable,
Pour tout x X(), X 1 ({x}) A .

Pour tout x X(), lvnement X 1 ({x}) est not {X = x} ou (X = x).


Lorsque X est valeurs dans R, on dit que X est une variable alatoire relle.

Remarques
On parle aussi souvent de variable alatoire sur (,A ,P ), mais la dfinition dune variable
alatoire nutilise pas la probabilit P .
Dans ce cours, toutes les variables alatoires seront implicitement supposes discrtes.

On rappelle que X 1 ({x}) = { ; X() = x}. Plus gnralement, si U est un sousensemble de X(), X 1 (U ) = { ; X() U }. Le fait demployer cette notation ne signifie
absolument pas que X est bijective !

Si X est une variable alatoire sur (,A ), X() est fini ou dnombrable, donc on peut le
dcrire en extension sous la forme X() = {xn ; n I}, o I est une partie de N.
Alors la famille ((X = xn ))nI est un systme complet dvnements.

Lorsque est fini, si X est une application dfinie sur , X() est galement fini. Sachant
de plus que A = P(), la deuxime condition de la dfinition ci-dessus est aussi remplie. Une
variable alatoire est donc tout simplement, dans ce cadre, une application dfinie sur . On
parle de variable alatoire sur , au lieu de (,P()).
257

Proprit
Soit X une variable alatoire sur (,A ) et U un sous-ensemble de X() : U X().
Alors X 1 (U ) A . Lvnement X 1 (U ) est not {X U } ou (X U ).
Dmonstration Lensemble U est fini ou dnombrable en tant que sous-ensemble de X(), on
peut le dcrire en extension sous la forme U = {xn ; n I}, o I est une partie de N. Alors
[
X 1 (U ) =
X 1 ({xn });
nI

cest un lment de A en tant que runion finie ou dnombrable dlments de A .

Notation Soit X une variable alatoire relle sur (,A ) et x R. Lorsque U = ],x]X(),
lvnement (X U ) est not plus simplement (X 6 x). On dfinit de faon analogue les
vnements (X < x), (X > x) et (X > x).
Exemple On modlise le lancer de deux ds, un rouge et un vert, par le choix de = [[1,6]]2 ,
muni de la probabilit uniforme. Pour tout (i,j) , i est le rsultat du d rouge, j celui du d
vert. La fonction X qui (i,j) associe i + j est une variable alatoire sur . Elle prend toutes
les valeurs de [[2,12]]. Par exemple,
1
,
36
3
avec P (X = 4) =
=
36
6
avec P (X = 7) =
=
36
avec P (X = 2) =

(X = 2) = {1,1}
(X = 4) = {(1,3),(2,2),(3,1)}
(X = 7) = {(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)}

1
,
12
1
,
6

Proprit/Dfinition
Soit X une variable alatoire sur (,A ) et f une fonction dfinie sur X().
Alors f X est une variable alatoire sur (,A ), plus souvent note f (X).
Dmonstration Limage de X est finie ou dnombrable, donc celle de f (X) galement. De plus,
soit a un lment de f (X()) (image de f (X)) ; alors
(f X)1 ({a}) = (X f 1 ({a})).
Or f 1 ({a}) X(), donc daprs la proprit prcdente, (f X)1 ({a}) A , ce qui prouve
le rsultat.

Exemple Si X est une variable alatoire relle, X 2 est une variable alatoire. Si X est valeurs
strictement positives, ln(X) est une variable alatoire.

II.
1.

Loi dune variable alatoire


Gnralits
Dfinition Loi dune variable alatoire
Soit X une variable alatoire sur (,A ,P ).
On appelle loi de la variable alatoire X la fonction dfinie sur X() par :
x X(), PX (x) = P (X = x).

Remarque La loi de X permet de dfinir une probabilit sur (X(),P(X())).


258

Proprit
Soit X une variable alatoire sur (,A ,P ). On dcrit X() en extension sous la forme
X() = {xn ; n I} o I est une partie de N.
Alors, pour tout U X(), on a
X
P (X U ) =
P (X = xn ).
xn U

Rappel Lorsque X() est dnombrable et dcrit en extension sous la forme {xn ; n N}, U
est fini ou dnombrable, et peut-tre dcrit en extension sous la forme {x(1)
P , . . . ,x(m) } (o
m = card(U )) ou {x(k) ; k N} (o est une bijection de N sur N). Alors xn U P (X = xn )
sexprime comme une somme finie, ou une somme de srie convergente :
X

P (X = xn ) =

xn U

m
X

P (X = x(k) ) ou

P (X = xn ) =

xn U

k=1

+
X

P (X = x(k) ).

k=0

Par exemple, si X() = N et U = 2N = {2k; k N}, alors P (X U ) =

P+

k=0 P (X

= 2k).

Dmonstration de la proprit Lvnement (X U ) est la runion des vnements deux


deux disjoints (X = xn ) pour les xn de U , do le rsultat par dfinition dune probabilit (et
notamment, la somme prcdente ne dpend pas de la faon de dcrire U en extension).

P
Remarque Dans le cas dnombrable, la srie n>0 P (X = xn ) converge et a pour somme 1. De
plus, pour tout vnement A A , on a daprs la formule des probabilits totales,
P (A) =

+
X

n=0

P (A | X = xn )P (X = xn ).

Dfinition Fonction de rpartition


Soit X une variable alatoire relle sur (,A ,P ).
On appelle fonction de rpartition de X la fonction FX dfinie sur R par :
x R, FX (x) = P (X 6 x).
Proprit
Soit X une variable alatoire relle sur (,A ,P ) et FX sa fonction de rpartition. Alors :
FX est croissante sur R.
FX (x) 0 et FX (x) 1.
x

x+

Dmonstration
Soit (x,y) R2 tel que x 6 y ; alors (X 6 x) (X 6 y), et donc P (X 6 x) 6 P (X 6 y), i.e.,
FX (x) 6 FX (y) : la fonction FX est croissante.
Daprs le premier point, FX a une limite en +, et donc FX (n) . Or on remarque
n+
S
que +
(X
6
n)
=
,
donc
par
proprit
de
continuit
croissante,
n=0
FX (n) = P (X 6 n) P () = 1.
n+

On a donc = 1.
On procde
de mme pour la limite en en utilisant la proprit de continuit dcroissante
T+
et le fait que n=0 (X 6 n) = avec P () = 0.

259

Remarques
La fonction de rpartition dune variable alatoire relle X est une fonction en escalier (pas
tout fait au sens mathmatique), chaque marche correspondant au passage en abscisse dune
valeur prise par X. Ci-dessous, on donne la fonction de rpartition correspondant au rsultat du
lancer dun d quilibr.

PX (2)

1
5/6
2/3
1/2
1/3
1/6

y = FX (x)
b

Les fonctions FX et PX sont lies : si X() = N par exemple, on a, pour tout n N,


FX (n) =

n
X

P (X = k) =

n
X

PX (k)

k=0

k=0

et pour n > 1,
PX (n) = P (X 6 n) P (X 6 n 1) = FX (n) FX (n 1).
Les valeurs de PX correspondent aux hauteurs des marches , sur le dessin prcdent, PX (n)
est la hauteur de la marche au point dabscisse n.
Comme on la vu plus haut, si X est une variable alatoire sur (,A ), la donne dune
probabilit sur (,A ) dfinit la loi de X, qui sidentifie la donne des P (X = x) pour x X().
Inversement, il est en fait possible de choisir des lois, ce qui peut tre trs utile lors de ltape
de modlisation :
Proprit (admise : dmonstration hors programme)
Soit X une variable alatoire sur (,A ). On dcrit X() en extension sous la forme
X() = {xn ; n I}, o I est une partie de N.
Soit (pn )nI une famille ou une suite de rels positifs vrifiant
X

pn converge

n>0
X
(si X() est dnombrable)
pn = 1 (si X() est fini) ou
+
X

nI

pn = 1

n=0

Alors il existe une probabilit P sur (,A ) telle que, pour tout n I, P (X = xn ) = pn .
Remarque En pratique, trs souvent, une exprience alatoire est en fait dcrite par des donnes
sur une ou plusieurs variables alatoires. La modlisation par le choix de (,A ) vient aprs, et
elle nest parfois pas ncessaire, ou admise. Par exemple :
Lvolution dun arbre gnalogique peut tre dcrite par le nombre alatoire de descendants
directs de chaque individu, mais un choix de (,A ) nest pas du tout vident.
Imaginons un systme dont les tats diffrentes dates sont reprs par les entiers naturels ou
relatifs (on pourra penser la position une particule, un stock de marchandises). Lvolution
du systme est dcrite par les probabilits de transition de ltat i ltat j. Supposons que les
260

transitions se font entre tats voisins dans Z (de k k + 1 ou k 1), et notons Xn ltat du
systme au rang n. La description du systme se fait en donnant, pour tout (n,k) N Z, la
probabilit
P (Xn+1 = k + 1 | Xn = k).
On peut choisir

= {(un )nN ZN ; n N, |un+1 un | = 1},

mais ce nest pas ncessairement utile de le prciser pour tudier le systme.

2.

Lois usuelles

La proprit prcdente permet de dfinir des lois par la simple vrification quune srie est
termes positifs, convergente et de somme 1 (ou quune famille finie de nombres positifs a pour
somme 1). Ceci permet de dfinir les lois fondamentales suivantes ; pour chaque exemple, on
donne un exemple de situation ainsi modlise.
a. Loi uniforme
Dfinition
On dit quune variable alatoire X sur (,A ,P ) suit la loi uniforme si X() est fini
et si les vnements (X = x) pour x X() sont quiprobables.
Exemples
La loi uniforme modlise par exemple le rsultat dun lancer de d quilibr.
Dans la modlisation du jeu de pile ou face infini faite dans le chapitre Espaces probabiliss,
la variable alatoire X qui donne le rsultat des n premiers lancers suit la loi uniforme : pour
tout (u1 , . . . ,un ) {0, 1}n (qui est de cardinal 2n ),
P (X = (u1 , . . . ,un )) =

1
.
2n

b. Loi de Bernoulli
Dfinition
Soit p [0,1]. On dit quune variable alatoire X sur (,A ,P ) suit la loi de Bernoulli
de paramtre p si X() = {0, 1} et si
P (X = 1) = p, P (X = 0) = 1 p.
Ceci se note X B(p).
Remarque On note trs souvent q = 1 p.
Exemples
La loi de Bernoulli modlise un lancer de pice, p reprsentant par exemple la probabilit
dobtenir pile .
Plus gnralement, la loi de Bernoulli modlise toutes les preuves de Bernoulli, cest--dire
ayant deux rsultats possibles ; celui de probabilit p est souvent interprt comme succs.
En Python, on peut simuler ainsi une exprience de Bernoulli de paramtre p (on supposera
import le module random) :
1
2
3
4
5
6

def sim_bernoulli(p):
x = random.random()
if x < p:
return 1
else:
return 0

261

Proprit Lien avec les fonctions indicatrices


Soit A un vnement de probabilit p, avec A 6= et A 6= . Alors 1A est une
variable alatoire sur (,A ,P ) qui suit la loi de Bernoulli de paramtre p.
Inversement, soit X une variable alatoire sur (,A ,P ) qui suit la loi de Bernoulli
de paramtre p. Alors X = 1A , avec A = (X = 1) de probabilit p.
Dmonstration
La fonction 1A prend les valeurs 0 et 1, et P (1A = 1) = P (A) = p.
Les deux fonctions X et 1(X=1) prennent la valeur 1 sur (X = 1) et 0 sur (X = 0), avec
(X = 0) (X = 1) = , donc ces fonctions sont gales. On a P (X = 1) = p par dfinition. 
c. Loi binomiale
Dfinition
Soient n N et p [0,1]. On dit quune variable alatoire X sur (,A ,P ) suit la loi
binomiale de paramtres n et p si X() = [[0,n]] et si
 
n k
k [[0,n]], P (X = k) =
p (1 p)nk .
k
Ceci se note X B(n,p).
Remarque On dfinit bien ainsi une loi, car daprs la formule du binme de Newton,
n  
X
n k
p (1 p)nk = (p + 1 p)n = 1.
k
k=0

Interprtation Le nombre S de succs lors dune succession de n preuves de Bernoulli de


paramtre p mutuellement indpendantes suit la loi binomiale de paramtres n et p. En effet,
la variable alatoire S est valeurs dans [[0,n]] et, pour k [[0,n]], lvnement (S = k) est la
runion des vnements consistants fixer k succs
et n k checs. Ces vnements sont deux

deux incompatibles, sont au nombre de nk , et chacun est de probabilit pk (1 p)nk par
indpendance mutuelle. On a donc
 
n
P (S = k) =
pk (1 p)nk .
k
Exemples
Le nombre de pile obtenus lors de n lancers successifs mutuellement indpendants dune
pice suit la loi binomiale de paramtres n et p, o p est la probabilit dobtenir pile un
lancer donn.
On effectue n tirages avec remise dans une urne contenant des boules indiscernables, rouges
en proportion p et vertes en proportion q = 1 p. La variable alatoire donnant le nombre de
boules rouges tires suit la loi binomiale de paramtres n et p.
En Python, on peut simuler ainsi une suite de n preuves de Bernoulli de paramtre p :
1
2
3
4
5
6
7
8
9

def sim_tirages(n,p):
L = []
for i in range(n):
x = random.random()
if x < p:
L.append(1)
else:
L.append(0)
return L

262

On peut simuler la variable alatoire S de la faon suivante :


1
2
3
4
5
6
7

def sim_nb_succes(n,p):
S = 0
for i in range(n):
x = random.random()
if x < p:
S += 1
return S

On peut alors simuler la loi B(n,p) de la faon suivante : on rpte N fois la simulation ci-dessus,
et on calcule, pour tout k [[0,n]] la frquence relative du rsultat k lors de ces N exepriences :
1
2
3
4
5
6

def loi_binomiale(n,p,N):
L = []
for i in range(N):
S = sim_nb_succes(n,p)
L.append(S)
return [L.count(k)/float(N) for k in range(n+1)]

d. Loi gomtrique
Dfinition
Soit p ]0,1[. On dit quune variable alatoire X sur (,A ,P ) suit la loi gomtrique
de paramtre p si X() N et si
k N , P (X = k) = p (1 p)k1 .
Ceci se note X G (p).
Remarques
Cest le premier exemple que lon rencontre de variable alatoire prenant un nombre infini de
valeurs.
On dfinit bien une loi car la srie gomtrique de raison (1 p) ]0,1[ est termes positifs,
elle converge, et
+
+
X
X
p
k1
p (1 p)
=p
(1 p)k =
= 1.
1 (1 p)
k=1

k=0

Exemples
Considrons le jeu de pile ou face infini, avec p la probabilit dobtenir pile . Pour k N ,
lvnement pile apparat pour la premire fois au rang k a pour probabilit p (1 p)k1
(k 1 checs suivis dun succs).
Plus gnralement, la loi gomtrique peut tre interprte comme loi du rang du premier
succs dans une suite illimite dpreuves de Bernoulli mutuellement indpendantes et de mme
paramtre p.
Il est parfois utile dautoriser que X prenne dautres valeurs que celles de N , avec probabilit
nulle, notamment, en lien avec linterprtation prcdente, si aucun succs ne survient.
La loi gomtrique est aussi souvent utilise pour modliser des dures de fonctionnement de
composants, machines, etc...
Remarque On peut remplacer X() = N par X() = N avec :
k N, P (X = k) = p (1 p)k .
Dans ce cas, cette loi sinterprte comme loi du nombre dchecs avant le premier succs.
263

e. Loi de Poisson
Dfinition
Soit R+ . On dit quune variable alatoire X sur (,A ,P ) suit la loi de Poisson
de paramtre si X() = N et si
k N, P (X = k) = e

k
.
k!

Ceci se note X P().


Remarque On dfinit bien ainsi une loi, car on reconnat la srie exponentielle de , qui est
termes positifs, convergente, avec
+
X
k=0

k
= e e = 1.
k!

Le thorme suivant tablit un lien asymptotique entre loi binomiale et loi de Poisson :
Thorme Approximation de la loi binomiale par la loi de Poisson
Soient (pn )nN une suite dlments de [0,1], (Xn )nN une suite de variables alatoires
sur (,A ,P ) et R+ . On fait les hypothses suivantes :
Pour tout n N, Xn suit la loi binomiale de paramtres n et pn ,
n pn .
n+

Alors, pour tout k N,

P (Xn = k) e
n+

k
k!

Dmonstration Soit k N. Alors, pour n > k assez grand, pn ]0,1[ et on a


 
n(n 1) (n k + 1) k
n k
P (Xn = k) =
p (1 pn )nk =
pn (1 pn )nk
k n
k!

n+

nk k
p (1 pn )nk .
k! n

Tout dabord, (npn )k k . De plus, n pn , donc pn 0+ et, lorsque n +,


n+

(1 pn )nk = exp ((n k) ln (1 pn )) = exp ((n k)(pn + o(pn ))) .


Or
(n k)(pn + o(pn )) = n pn + o(n pn )

n+

n pn .
n+

Par continuit de lexponentielle et daprs ce qui prcde, on a bien


P (Xn = k) e
n+

k
k!

Remarques
 
(np)k
n k
p (1 p)nk par enp
Dans les calculs, on peut donc approcher
.
k
k!

Cela permet dviter des calculs de coefficients du binme, qui font intervenir des quotients de
grands nombres.
On considre que lapproximation est intressante lorsque p 6 0,1, n > 30 et np < 15.
264

Exemple On lance 100 fois un d quilibr 20 faces et on compte le nombre N de 20 obtenus.


Ce nombre suit une loi binomiale B(100,1/20), on a donc, pour tout k [[0,100]],
 100k
 
19
1
100
P (N = k) =
k
k
20
20
On est dans les conditions de lapproximation avec np = 100/20 = 5, on peut donc approcher
P (N = k) par e5 5k /k!. Pour k = 2 par exemple, on a
 
 98
19
1
100
0,081
2
2
20
20

et e5

52
0,084.
2!

Le programme suivant permet dutiliser cette approximation :


1
2
3
4

from math import exp, factorial


def approx_poisson(n,p):
return [exp(-n*p)*(n*p)**k/factorial(k) for k in range(n+1)]

On peut alors tester par exemple lapproximation de B(30,0.1) par P(3) (listes B et A), ainsi
quune simulation de cette approximation (liste L) ; dans ce qui suit, on naffiche que les 10
premires valeurs, en arrondissant 4 dcimales pour B et A :
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

from scipy.special import binom


# Loi binomiale B(30,0.1)
B = [ binom(30,k)*(0.1**k)*(0.9**(30-k)) for k in range(31) ]
B = [ float("%.4f" % x) for x in B ]
# Approximation par P(3)
A = approx_poisson(30,0.1)
A = [ float("%.4f" % x) for x in A ]
# Simulation de B(30,0.1)
L = loi_binomiale(30,0.1,10000)
for k in range(10):
print "P( X =",k,") :",B[k],",",A[k],",",L[k]

Voici un rsultat possible :


P(
P(
P(
P(
P(
P(
P(
P(
P(
P(

X
X
X
X
X
X
X
X
X
X

=
=
=
=
=
=
=
=
=
=

0
1
2
3
4
5
6
7
8
9

)
)
)
)
)
)
)
)
)
)

:
:
:
:
:
:
:
:
:
:

0.0424 , 0.0498 , 0.0424


0.1413 , 0.1494 , 0.139
0.2277 , 0.224 , 0.2332
0.2361 , 0.224 , 0.2358
0.1771 , 0.168 , 0.1743
0.1023 , 0.1008 , 0.1014
0.0474 , 0.0504 , 0.047
0.018 , 0.0216 , 0.0187
0.0058 , 0.0081 , 0.006
0.0016 , 0.0027 , 0.0019

Remarque On sintresse la loi du nombre doccurrences dun phnomne dans un intervalle


de temps [0,T ]. On fait les hypothses suivantes :
il existe a R tel que la probabilit que le phnomne se produise une fois dans un intervalle
de temps de petite longueur h est ah ;
la probabilit quil se produise plus dune fois est ngligeable (en fait, un o(h)) ;
les nombres doccurrences du phnomne dans des intervalles disjoints sont mutuellement
indpendants.
265

On subdivise [0,T ] en intervalles de longueur T /n. Daprs les hypothses prcdentes, on


peut considrer que le nombre doccurrences du phnomne dans lintervalle [0,T ] suit la loi
binomiale B(n,aT /n). Daprs le rsultat dapproximation prcdent, pour n grand, on peut
approcher cette loi par la loi de Poisson P(aT ) (le paramtre sidentifie donc aT ).
Pour cette raison, la loi de Poisson est dite loi des vnements rares ; elle est souvent
utilise pour modliser le nombre doccurrences dun phnomne dans un intervalle de temps
fix, ce phnomne tant rare dans un court intervalle de temps, mais observ sur un grand
nombre de tels intervalles. Par exemple, on peut modliser ainsi le nombre de vhicules passant
devant un point dobservation, de clients entrant dans un magasin, de catastrophes naturelles,
de dsintgrations de noyaux radioactifs (lorsque la source est loigne, les mesures faites par un
compteur Geiger font effectivement apparatre une loi de Poisson).

III.
1.

Familles de variables alatoires


Couple de variables alatoires

Proprit/Dfinition
Soient X et Y deux variables alatoires sur (,A ).
Lapplication 7 (X(),Y ()) est une variable alatoire sur (,A ), appele couple
(X,Y ).
Dmonstration Les ensembles X() et Y () sont finis ou dnombrables, donc X() Y () est
fini ou dnombrable. Limage de (X,Y ) est contenue dans X() Y (), elle est donc aussi finie
ou dnombrable. Notons Z = (X,Y ). Pour tout (x,y) de Z(),
Z 1 ({(x,y)}) = { ; (X(),Y ()) = (x,y)} = X 1 (x) Y 1 (y);
cest un vnement en tant quintersection de deux vnements.

Notation
Lvnement ((X,Y ) = (x,y)), cest--dire (X = x) (Y = y) est plus souvent not
(X = x, Y = y).
Si A X() et B Y (), lvnement ((X,Y ) A B), cest--dire (X A) (Y B), est
plus souvent not (X A, Y B).
Corollaire
Lensemble des variables alatoires sur (,A ) valeurs dans K (K = R ou C) est un
K-espace vectoriel (pour les lois daddition et de multiplication par un scalaire).
Dmonstration Cest un sous-ensemble de lespace vectoriel des applications de dans K, qui
est non vide (la fonction nulle est une variable alatoire) Enfin, soient X et Y deux variables
alatoires sur (,A ) valeurs dans K et soit K. On dfinit la fonction f : (x,y) 7 x + y sur
K2 . Alors X + Y = f (X,Y ), qui est une variable alatoire car le couple (X,Y ) est une variable
alatoire.

Dfinition
Soit (X,Y ) un couple de variables alatoires sur (,A ). On appelle :
loi conjointe de X et Y la loi du couple (X,Y ).
lois marginales du couple (X,Y ) les lois de X et de Y .

266

Proprit
Soit (X,Y ) un couple de variables alatoires sur (,A ).
La loi du couple (X,Y ) dtermine entirement ses lois marginales par les relations
X
x X(), P (X = x) =
P (X = x, Y = y),
yY ()

y Y (), P (Y = y) =

P (X = x, Y = y).

xX()

En revanche, les lois marginales du couple (X,Y ) ne dterminent pas la loi conjointe
de X et Y .
Dmonstration La premire galit est immdiate en remarquant que ((Y = y))yY () est un
systme complet dnombrable dvnements ; de mme pour la seconde, avec ((X = x))xX() .
En revanche, considrons lexemple suivant, o
et (X2 ,Y2 ) :
(x,y)
(0,0)
P (X1 = x,Y1 = y) 0,25
P (X2 = x,Y2 = y) 0,3

lon dfinit les lois de deux couples (X1 ,Y1 )


(0,1) (1,0) (1,1)
0,25 0,25 0,25
0,2
0,2
0,3

Dans les deux cas, les lois marginales sont les mmes, car pour i {1,2},
P (Xi = 0) = P (Xi = 1) = P (Yi = 0) = P (Y1 = 1) = 0,5
mais les lois conjointes ne sont pas les mmes (car P (X1 = 0,Y1 = 0) 6= P (X2 = 0,Y2 = 0) par
exemple).
Les lois marginales du couple (X,Y ) ne dterminent donc pas la loi conjointe de X et Y . 

2.

Conditionnement et indpendance
Dfinition Loi conditionnelle
Soient X et Y deux variables alatoires sur (,A ,P ) et y Y () tel que P (Y = y) > 0.

On appelle loi conditionnelle de X sachant (Y = y) la fonction



X() [0,1]
x 7 P (X = x | Y = y)
Cest la loi de X dans lespace probabilis (,A ,P(Y =y) ).
On rappelle que pour tout x X(),
P (X = x | Y = y) =

P (X = x, Y = y)
.
P (Y = y)

Exemple Dans lexemple de la proprit prcdente, on a


P (Y2 = 0) = P (X2 = 0, Y2 = 0) + P (X2 = 1, Y2 = 0) = 0,3 + 0,2 = 0,5 > 0.
La loi de X2 sachant (Y2 = 0) est caractrise par les deux nombres
P (X2 = 0 | Y2 = 0) =

0,3
= 0,6
0,5

et P (X2 = 1 | Y2 = 0) =
267

0,2
= 0,4.
0,5

Dfinition Indpendance de variables alatoires


Soient X et Y deux variables alatoires sur (,A ,P ).
On dit que X et Y sont indpendantes si pour tout (x,y) X() Y (), les
vnements (X = x) et (Y = y) sont indpendants, i.e.
P (X = x, Y = y) = P (X = x)P (Y = y).
Soit I un ensemble dindices. Pour tout i I, soit Xi une variable alatoire sur
(,A ,P ).
On dit que les variables alatoires Xi , pour i I, sont mutuellement indpendantes
si, pour toute famille (xi )iI telle que pour tout i I, xi Xi (), les vnements
(Xi = xi ) pour i I sont mutuellement indpendants, i.e. : pour toute partie finie
J I,

\
Y
P (Xj = xj ) =
P (Xj = xj ).
jJ

jJ

Proprit (admise : dmonstration hors programme)


Soient X et Y deux variables alatoires indpendantes sur (,A ,P ), A un sousensemble de X() et B un sous-ensemble de Y ().
Alors les vnements (X A) et (Y B) sont indpendants, i.e.
P (X A, Y B) = P (X A) P (Y B).
Soit (Xi )iI une famille de variables alatoires mutuellement indpendantes sur
(,A ,P ).
Alors, pour toute famille (Ai )iI telle que pour tout i I, Ai Xi (), les vnements
(Xi Ai ) pour i I sont mutuellement indpendants, i.e. : pour toute partie finie
J I,

\
Y
P (Xj Aj ) =
P (Xj Aj ).
jJ

jJ

Proprit
Soient X et Y deux variables alatoires indpendantes sur (,A ,P ).
Soient f et g des fonctions dfinies respectivement sur X() et Y ().
Alors les variables alatoires f (X) et g(Y ) sont indpendantes.

Dmonstration Soit a f (X()) et b g(Y ()). Alors


P (f (X) = a, g(Y ) = b) = P (X f 1 ({a}), Y g1 ({b})).
Par indpendance de X et Y , et daprs la proprit prcdente,
P (f (X) = a, g(Y ) = b) = P (X f 1 ({a})) P (Y g1 ({b})) = P (f (X) = a) P (g(Y ) = b),
do le rsultat.


268

3.

Quelques proprits des lois usuelles


Proprit Somme de variables de Bernoulli
Soient X1 , . . . ,Xn des variables alatoires mutuellement indpendantes sur (,A ,P ),
suivant chacune la loi de Bernoulli B(p).
Alors la variable alatoire X1 + + Xn suit la loi binomiale B(n,p).

Dmonstration La dmonstration est identique celle donne plus haut en interprtation de la


loi B(n,p).

Remarque Des sommes de variables de Bernoulli, comme dans la proprit prcdente, sont trs
utiles pour compter le nombre de succs dans une succession dpreuves de Bernoulli. On rappelle
de plus que de telles variables de Bernoulli peuvent tre vues comme des fonctions indicatrices.
Proprit Caractrisation des lois gomtriques comme lois sans mmoire
Soit X une variable alatoire sur (,A ,P ) telle que X() = N .
Les proprits suivantes sont quivalentes :
1. Il existe p ]0,1[ tel que X G (p).
2. P (X = 1) > 0, P (X > n) > 0 pour tout n N et
(n,k) N2 , P (X > n + k | X > n) = P (X > k).
La loi dune variable alatoire vrifiant 2 est dite loi sans mmoire (ou sans vieillisement).
Ainsi, les lois gomtriques sont exactement les lois sans mmoire.
Dmonstration
1 2 : supposons que X G (p) avec p ]0,1[. Alors P (X = 1) = p > 0 et, pour tout n N,
P (X > n) =

+
X

P (X = j) =

+
X

j=n+1

j=n+1

p(1 p)j1 = p

(1 p)n
= (1 p)n .
1 (1 p)

En particulier, P (X > n) > 0 pour tout n N. Soit (n,k) N2 . Alors


P (X > n + k, X > n)
P (X > n)
(1 p)n+k
P (X > n + k)
=
= (1 p)k = P (X > k).
=
P (X > n)
(1 p)n

P (X > n + k | X > n) =

2 1 : posons p = P (X = 1) > 0. On a aussi p = 1 P (X > 1) < 1. Soit, pour tout n N,


xn = P (X > n). Daprs la proprit dabsence de mmoire,
xn+1 = P (X > n + 1) = P (X > n + 1 | X > n) P (X > n) = P (X > 1)P (X > n) = (1 p) xn .
La suite (xn )nN est donc gomtrique de raison 1 p et de premier terme x0 = P (X > 0) = 1,
donc pour tout n N, xn = (1 p)n . Alors, pour tout n N ,
P (X = n) = P (X > n 1) P (X > n) = (1 p)n1 (1 p)n

= (1 p)n1 (1 (1 p))

= p (1 p)n1 .
Finalement, p ]0,1[ et X G (p).


269

Remarque Comme on la dit plus haut, la loi G (p) modlise souvent une dure de fonctionnement, ou plus gnralement un temps dattente avant quun phnomne se produise. La proprit
dabsence de mmoire signifie que ce temps dattente est indpendant de ltape laquelle on
commence attendre.

4.

Indpendance et modlisation

Comme nous lavons dj vu, la modlisation dune exprience alatoire par le choix de
(,A ,P ) nest pas toujours vidente. En fait, elle nest parfois pas utile, le fait de prciser les
conditions de lexprience, ce qui est plus intuitif, tant souvent suffisant. Cest ce que permet
de faire le rsultat suivant :
Thorme (admis : dmonstration hors programme)
Soit I un ensemble dindices fini ou dnombrable. Pour tout i I, on se donne une loi
discrte Li (ce qui revient se donner une famille ou une suite de nombres positifs de
somme 1).
Alors il existe un espace probabilis (,A ,P ) et une famille (Xi )iI de variables alatoires sur (,A ,P ), mutuellement indpendantes, tels que pour tout i I, Xi suit la
loi Li .
Il est ainsi possible de modliser une succession, finie ou infinie, dexpriences alatoires
mutuellement indpendantes, par le choix des lois de variables alatoires, sans avoir prciser
(,A ,P ).
Exemples
Un jeu de pile ou face, fini ou infini, avec indpendance mutuelle des diffrents lancers, pourra
tre modlis par le choix dune suite (Xi )iI , finie ou infinie, de variables de Bernoulli mutuellement indpendantes de mme paramtre p. Pour tout i I, Xi reprsente le rsultat du i-ime
lancer (1 pour pile , de probabilit p, 0 pour face , par exemple).
On considre la situation suivante : une urne contient des jetons rouges en proportion p, et
blancs en proportion 1 p ; N personnes tirent successivement, avec remise, n jetons dans lurne,
le gain de chaque personne tant li au nombre de jetons rouges tirs.
On pourra modliser cette situation par une famille (X1 , . . . ,XN ) de N variables alatoires
mutuellement indpendantes, suivant chacune la loi binomiale B(n,p). Pour tout i [[1,N ]], Xi
reprsente le nombre de jetons rouges tirs par le i-ime participant.

IV.

Esprance

Dfinition
Soit X une variable alatoire relle sur (,A ,P ), avec X() dnombrable ; on dcrit
X() en extension sous la forme {xn ; n N}.
On dit que X est desprance finie si la srie
X
xn P (X = xn )
n>0

est absolument convergente.


Dans ce cas, la somme de cette srie est appele esprance de X, et note E(X),
cest--dire,
+
X
xn P (X = xn ).
E(X) =
n=0

270

Remarques
Lesprance de X est interprter comme moyenne pondre des valeurs de X. Par exemple
en physique, elle reprsente lnergie moyenne de systmes spectre discret (comme un atome
confin dans une bote).
La notion desprance de X dpend de X uniquement travers sa loi.
La dfinition prcdente semble dpendre du choix des xn (cest--dire de lordre dnumration
des lments de X()). On admettra que lorsque X est desprance finie, la somme dfinissant
E(X) ne dpend pas de lordre dnumration.
Si X() est fini avec X() = {x1 , . . . ,xm }, alors X est desprance finie, et E(X) est simplement dfinie par :
m
X
E(X) =
xn P (X = xn ).
n=1

Sil existe a R tel que P (X = a) = 1, alors X est desprance finie gale a.


X
Si est fini, on a la relation E(X) =
X() P ({}).

Proprit Esprance correspondant aux lois usuelles


Soit X une variable alatoire sur (,A ,P ).
Si X suit la loi uniforme avec X() = {x1 , . . . ,xm }, alors X est desprance finie avec
m

1 X
xn .
E(X) =
m
n=1

Si X B(p), alors X est desprance finie et E(X) = p.

Si X B(n,p), alors X est desprance finie et E(X) = np.


1
Si X G (p), alors X est desprance finie et E(X) = .
p
Si X P(), alors X est desprance finie et E(X) = .
Dmonstration
Pour tout n [[1,m]], P (X = xn ) = 1/m, do le rsultat.
Si X B(p), on a E(X) = 0 (1 p) + 1 p = p.
Si X B(n,p),
 


n
n
X
X
n k
n1 k
nk
E(X) =
k
p (1 p)
=
n
p (1 p)nk .
k
k1
k=0

k=1

Avec le changement dindice j = k 1, on obtient


E(X) = n


n1 
X
n1
j

j=0

= np

pj+1 (1 p)(n1)j

n1
X
j=0


n1 j
p (1 p)(n1)j = np (p + (1 p))n1 = np.
j

P
Supposons que X G (p). La srie n>1 n p(1p)n1 est convergente : on reconnat la drive
de la srie gomtrique value en 1 p avec |1 p| < 1. On a ainsi
E(X) = p

1
1
= .
(1 (1 p))2
p
271

Supposons que X P(). La srie


X
k>0

k e

X j
X
k
k
=
e
= e
k!
(k 1)!
j!
j>0

k>1

est convergente (srie exponentielle) et


E(X) = e

+ j
X

j=0

j!

= e e = .


Proprit
Soit X une variable alatoire sur (,A ,P ) valeurs dans N.
P
La variable alatoire X est desprance finie si et seulement si la srie n>1 P (X > n)
converge, et dans ce cas on a
E(X) =

+
X

P (X > n).

n=1

Dmonstration Pour tout n N, on a


(X > n) = (X = n) (X > n + 1),
ces deux vnements tant incompatibles, et donc
P (X = n) = P (X > n) P (X > n + 1).
Alors, pour tout p N ,
p
X

n P (X = n) =

n=0

p
X

n=0
p
X

n=0

n (P (X > n) P (X > n + 1))


n P (X > n)

p+1
X

(n 1) P (X > n)

n=1

aprs sparation des sommes et changement dindice dans la deuxime somme. Finalement,
!
p
p
X
X
P (X > n) p P (X > p + 1).
(14.1)
n P (X = n) =
n=0

n=1

Si X est desprance finie, alors on peut crire


0 6 p P (X > p + 1) = p

+
X

P (X = n) 6

+
X

n=p+1

n=p+1

n P (X = n) 0
p+

P
en tant que reste dune srie convergente. On en dduit que n>1 P (X > n) converge ainsi que
lgalit souhaite en faisant tendre p vers +.
P
Par positivit des termes, et daprs (14.1), si n>1 P (X > n) converge, alors
X

n P (X = n)

n>1

converge (la suite de ses sommes partielles est majore) donc X est desprance finie. On conclut
comme prcdemment.

272

Thorme de transfert (admis : dmonstration hors-programme)


Soit X une variable alatoire sur (,A ,P ) avec X() dnombrable ; on dcrit X() en
extension sous la forme {xn ; n N}. Soit f : X() R une fonction.
La variable alatoire f (X) est desprance finie si et seulement si la srie
P
n>0 f (xn ) P (X = xn ) converge absolument, et dans ce cas, on a
E(f (X)) =

+
X

f (xn ) P (X = xn ).

n=0

Remarque Si lon appliquait la dfinition de lesprance pour f (X), on devrait dterminer la loi
de f (X) : on devrait dcrire f (X()) en P
extension sous la forme {yn ; n I} (I fini ou I = N)
puis considrer la somme finie ou la srie nI yn P (f (X) = yn ).
Limmense avantage du thorme de transfert est de montrer quil suffit en fait de considrer la
loi de X. On a transfr le calcul de E(f (X)) sur la variable alatoire X. Ceci est particulirement
intressant lorsque f nest pas injective.
Exemple Soit X une variable alatoire suivant la loi gomtrique de paramtre p. Daprs le
thorme de transfert, si la srie
X
(1)n p (1 p)n1
n>1

converge absolument, alors (1)X est desprance finie et la somme de cette srie est E((1)X ).
On reconnat ( un facteur p prs) la srie gomtrique de raison p 1 avec |p 1| < 1, donc
absolument convergente. On en dduit que (1)X est desprance finie avec
X

E((1) ) =

+
X

(1)n p (1 p)n1 = p

n=1

p
1
=
.
1 (p 1)
p2

Thorme Quelques proprits de lesprance


Soient X et Y deux variables alatoires desprance finie sur (,A ,P ) et R. Alors :
Linarit : X + Y est desprance finie et E(X + Y ) = E(X) + E(Y ).
Positivit : si P (X > 0) = 1, alors E(X) > 0.
Croissance : si P (X 6 Y ) = 1, alors E(X) 6 E(Y ).
Dmonstration
La dmonstration de la linarit de lesprance nest pas exigible.
Considrons le couple (X,Y ) et lorsque X() Y () est dnombrable, dcrivons-le en extension
sous la forme {(xn ,yn )}; n N}. Soit f uneP
fonction dfinie sur X() Y (), valeurs dans
R ; daprs le thorme de transfert, la srie n>0 f (xn ,yn ) P (X = xn , Y = yn ) est absolument
convergente si et seulement si f (X,Y ) est desprance finie, et dans ce cas
E(f (X,Y )) =

+
X

f (xn ,yn ) P (X = xn , Y = yn ).

n=0

Nous allons utiliser ce rsultat avec f : (x,y) 7 x, f : (x,y) 7 y et f : (x,y) 7 x + y. Les sries
X
X
xn P (X = xn , Y = yn ) et
yn P (X = xn , Y = yn )
n>0

n>0

sont absolument convergentes car X et Y sont desprance finie. Par combinaison linaire, la
srie
X
(xn + yn ) P (X = xn , Y = yn )
n>0

273

est absolument convergente, donc X + Y est desprance finie ; on a alors


E(X + Y ) =

+
X

xn P (X = xn , Y = yn ) +

+
X

yn P (X = xn , Y = yn ) = E(X) + E(Y ).

n=0

n=0

On adapte la dmonstration avec des sommes finies si X() Y () est fini.


On dcrit X() en extension sous la forme {xn ; n I}. On a P (X < 0) = 0, donc pour tout
n tel que xn < 0, xn P (X = xn ) = 0. Donc on peut crire E(X) comme somme dune srie (ou
somme finie) termes positifs, do E(X) > 0.
Cela rsulte des deux points prcdents.


Application On retrouve facilement lesprance dune variable alatoire suivant la loi B(n,p)
en utilisant la linarit de lesprance : soient X1 , . . . ,Xn des variables alatoires mutuellement
indpendantes suivant la mme loi B(p) (on sait quil existe un espace probabilis portant de
telles lois). Alors on sait que S = X1 + + Xn suit la loi B(n,p). Par linarit de lesprance,
on a donc
n
X
E(S) =
E(Xk ) = np
k=1

car E(Xk ) = p pour tout k. Lesprance ne dpendant que de la loi, on obtient ainsi lesprance
de toutes les variables alatoires suivant la loi B(n,p).
Proprit
Soient X et Y deux variables alatoires indpendantes sur (,A ,P ), desprance finie.
Alors XY est desprance finie et
E(XY ) = E(X)E(Y ).
La rciproque est fausse en gnral.

La dmonstration est hors-programme dans le cas gnral. Dans le cas des univers finis, elle
a t donne en premire anne.

Exemple Marche alatoire
Reprenons un exemple dcrit plus haut : une particule peut occuper diffrentes positions repres
par les entiers relatifs. intervalle rgulier, la particule peut passer de la position i la position
i + 1 avec probabilit p ]0,1[, ou la position i 1 avec probabilit q = 1 p. On suppose quun
mouvement ne dpend que de la position partir de laquelle il est fait. Pour n > 1, on note
Xn la variable alatoire reprsentant la position de la particule aprs n mouvements ; X0 est la
variable alatoire nulle (la position initiale est 0). On admet lexistence dun espace probabilis
(,A ,P ) modlisant cette exprience.
On cherche tudier diffrents aspects de cette marche alatoire.
Loi de X1 et X2 : X1 prend les valeurs 1 et 1, avec P (X1 = 1) = p, P (X1 = 1) = q. On
en dduit que X2 prend les valeurs 2, 0 et 2. Daprs la formule des probabilits totales,
P (X2 = 2) = P (X2 = 2 | X1 = 1)P (X1 = 1) + P (X2 = 2 | X1 = 1)P (X1 = 1)
= p P (X1 = 1) + 0 P (X1 = 1) = p2 ,

P (X2 = 0) = P (X2 = 0 | X1 = 1)P (X1 = 1) + P (X2 = 0 | X1 = 1)P (X1 = 1) = 2pq,


P (X2 = 2) = P (X2 = 2 | X1 = 1)P (X1 = 1) + P (X2 = 2 | X1 = 1)P (X1 = 1)
= 0 P (X1 = 1) + q P (X1 = 1) = q 2 .

La particule ne peut revenir en 0 quaprs un nombre pair de mouvements, ainsi, pour tout
n N, P (X2n+1 = 0) = 0. Pour n N, la particule est lorigine aprs 2n mouvements si et
274

seulement si elle a effectu n mouvements droite et n mouvements gauche. Le nombre de


mouvements droite parmi les 2n premiers suit la loi B(2n,p), donc
P (X2n

 
(2n)!
2n n
(p(1 p))n .
= 0) =
p (1 p)2nn =
n
(n!)2

Daprs la formule de Stirling,

(2n)!

(n!)2
et finalement,


2n 2n
4n
4n
e
=
 n 2n
n
2n
e

1
P (X2n = 0) (4p(1 p))n .
n
La variable alatoire 1(X2 =0) + + 1(X2n =0) reprsente le nombre de retours lorigine au
cours des 2n premiers mouvements. Par linarit de lesprance (pour tout A A , la variable
alatoire 1A est desprance finie gale P (A)),
E(1(X2 =0) + + 1(X2n =0) ) =

n
X

P (X2k = 0).

k=1

Remarquons que lon a calcul cette esprance sans dterminer la loi du nombre de retours.
Si p 6= 1/2, 0 < 4p(1 p) < 1, et par comparaison de sries termes positifs, la srie de
terme gnral P (X2n = 0) converge. Lesprance du nombre de retours lorigine est majore
indpendamment du nombre de mouvements.
1
et la srie de terme gnral P (X2n = 0) ( termes positifs)
Si p = 1/2, P (X2n = 0)
n
diverge par comparaison avec une srie de Riemann dexposant 1/2 < 1. Un rsultat sur les
sommes partielles de sries termes positifs divergentes, puis une comparaison srie/intgrale
(que nous ne dtaillons pas ici), montrent alors que
n
X

P (X2k

k=1

n
X

r
1
n

2
= 0)
.

k
k=1

Cette esprance tend vers + lorsque n + : en un temps illimit, il y a en moyenne une


infinit de retours lorigine !

V.

Sries gnratrices des variables alatoires valeurs dans N


Proprit/Dfinition
Soit X une variable alatoire sur (,A ,P ), valeurs dans N.
Alors, pour tout t [1,1], la variable alatoire tX est desprance finie. On pose, pour
tout t [1,1],
GX (t) = E(tX ),

et on a GX (t) =

+
X

P (X = n) tn .

n=0

La fonction GX est la somme dune srie entire de rayon de convergence au moins gal
1. Elle est appele srie gnratrice (ou fonction gnratrice) de X.

275

Dmonstration On peut considrer que X() = N. Soit t [1,1]. Daprs le thorme de


transfert, tX est desprance finie si et seulement si la srie
X
P (X = n) tn
n>0

P
converge absolument. Or, pour tout n N, |P (X = n) tn | 6 P (X = n), et n>0 P (X = n)
converge (et sa somme vaut 1). Par comparaison, on en dduit lexistence de E(tX ) ; la formule
donnant E(tX ) provient aussi du thorme de transfert.
Sachant que la srie entire dfinissant GX converge absolument en tout point de [1,1], son
rayon de convergence est au moins gal 1.

Remarques
On a GX (1) =

+
X

P (X = n) = 1.

n=0

Lorsque X() est fini, GX est un polynme (et R = +).


Proprit
La loi dune variable alatoire valeurs dans N est caractrise par sa srie gnratrice :
soient X et Y deux variables alatoires sur (,A ,P ), valeurs dans N, telles que
X() = Y () et GX (t) = GY (t) pour tout t ] r,r[ (pour un certain r ]0,1]).
Alors X et Y ont la mme loi.
Dmonstration Si GX (t) = GY (t) pour tout t [1,1], alors par unicit du dveloppement en
srie entire, P (X = n) = P (Y = n) pour tout n N.

Remarque La srie gnratrice de X contient donc toute linformation sur la loi de X. On a en
fait, daprs lexpression des coefficients dune srie entire : pour tout n N,
(n)

P (X = n) =

GX (0)
n!

Proprit
Soit X une variable alatoire sur (,A ,P ), valeurs dans N.
Alors, pour que X soit desprance finie, il faut et il suffit que GX soit drivable
gauche en 1. Dans ce cas, on a
E(X) = GX (1).
Dmonstration (non exigible)
P
Posons, pour tout n N, fn : t 7 P (X = n) tn . La srie de fonctions n>0 fn converge
simplement sur [1,1] ; pour tout n N, fn est de classe C 1 sur [1,1] avec pour tout n N et
t [1,1],
|fn (t)| = |n P (X = n) tn1 | 6 n P (X = n).

Le majorant est le terme gnral dune srie convergente car X est desprance finie. Daprs
le thorme de la classe C 1 pour les sries de fonctions, GX est de classe C 1 sur [1,1], et en
particulier drivable gauche en 1. On a de plus
GX (1) =

+
X

n=0

Soit p N . Pour tout t [0,1[,

fn (1) =

+
X

n P (X = n) = E(X).

n=1

n=0

n=1

tn 1 X
GX (t) GX (1) X
P (X = n)
P (X = n) (1 + t + + tn1 ),
>
=
t1
t1
276

lingalit tant valable par positivit des termes. Lorsque t 1 , on en dduit que
p
X

n P (X = n) 6 GX (1).

n=1

P
pour tout p N . La srie termes positifs n>0 n P (X = n) est donc sommes partielles
majores indpendamment de p, donc convergente, ce qui entrane ( nouveau par positivit des
termes) que X est desprance finie.

Proprit Sries gnratrices correspondant aux lois usuelles
Soit X une variable alatoire sur (,A ,P ).
Si X B(p), alors pour tout t R, GX (t) = 1 p + pt.

Si X B(n,p), alors pour tout t R, GX (t) = (1 p + pt)n .


Si X G (p), alors pour tout t tel que |(1 p)t| < 1, GX (t) =
Si X P(), alors pour tout t R, GX (t) = e(t1) .

pt
.
1 (1 p)t

Dmonstration
Si X B(p), on a pour tout t R, GX (t) = P (X = 0) + P (X = 1)t = 1 p + pt.
Si X B(n,p), on a pour tout t R,
GX (t) =

n  
X
n
k=0

nk k

p (1 p)

t =

n  
X
n
k=0

(pt)k (1 p)nk = (1 p + pt)n

daprs la formule du binme de Newton.


Supposons que X G (p). La srie gnratrice de X est la fonction somme de la srie entire
X
p (1 p)n1 tn .
n>1

On reconnat une srie gomtrique de raison (1p)t. Elle converge si et seulement si |(1p)t| < 1,
et dans ce cas
+
X
pt
((1 p)t)n =
GX (t) = pt
.
1 (1 p)t
n=0

Supposons que X P(). La srie gnratrice de X est la fonction somme de la srie entire
X

n>0

n n
t .
n!

On reconnat une srie exponentielle ; elle converge pour tout t R, et


t R, GX (t) = e

+
X
(t)n
n=0

n!

= e et = e(t1) .

Proprit Somme de deux variables alatoires indpendantes


Soient X et Y deux variables alatoires indpendantes sur (,A ,P ), valeurs dans N.
Alors, pour tout t [1,1],
GX+Y (t) = GX (t) GY (t).

277

Dmonstration La variable X + Y est valeurs dans N de mme que X et Y . Les variables X


et Y sont indpendantes, donc pour tout t [1,1], tX et tY sont indpendantes. On en dduit
que
GX+Y (t) = E(tX+Y ) = E(tX tY ) = E(tX )E(tY ) = GX (t) GY (t).

Remarque Soit n N ; on a
(X + Y = n) =

n
[

(X = k, Y = n k),

k=0

ces vnements tant deux deux incompatibles, do, par indpendance,


P (X + Y = n) =

n
X
k=0

P (X = k, Y = n k) =

n
X
k=0

P (X = k) P (Y = n k).

On connat donc la loi de X + Y . Par produit de Cauchy de deux sries entires absolument
convergentes, on a pour tout t [1,1],
GX (t) GY (t) =

+ X
n
X

n=0

k=0

P (X = k) P (Y = n k)

tn =

+
X

P (X + Y = n) tn = GX+Y (t),

n=0

ce qui donne une autre dmonstration de la proprit prcdente.


Corollaire
Soient X et Y deux variables alatoires indpendantes sur (,A ,P ) et , deux rels
strictement positifs. On suppose que X P() et Y P().
Alors X + Y P( + ).
Dmonstration Pour tout n N, P (X = n, Y = 0) = P (X = n) P (Y = 0) par indpendance,
donc P (X + Y = n) > 0. On en dduit que (X + Y )() = N. De plus, pour tout t [1,1] (en
fait pour tout t R),
GX+Y (t) = GX (t) GY (t) = e(t1) e(t1) = e(+)(t1) .
La srie gnratrice caractrisant la loi, on en dduit que X + Y P( + ).

VI.
1.

Variance
Gnralits

Lesprance de X correspond la moyenne pondre des valeurs de X, mais ne dcrit pas


comment sont rparties les valeurs de X autour de cette moyenne. Cest lintrt des notions de
variance et dcart-type.
Proprit
Soit X une variable alatoire relle sur (,A ,P ). On suppose que X 2 est desprance
finie. Alors :
X est desprance finie.
(X E(X))2 est desprance finie.

278

Dmonstration
Le problme ne se pose que si X() est dnombrable. On crit X() = {xnP
; n N}. La variable
alatoire X 2 est desprance finie, donc daprs le thorme de transfert, n>0 x2n P (X = xn )
converge et sa somme est E(X 2 ). Pour tout p N, on a daprs lingalit de Cauchy-Schwarz,
p
X

n=0

|xn | P (X = xn ) =
6

p 
X

n=0

|xn |

p
X

P (X = xn )

x2n P (X

= xn )

x2n P (X

car

P+

n=0 P (X

= xn )

+
X

E(X 2 )

!1/2

P (X = xn )

!1/2

P (X = xn )

n=0

n=0

p
X

P (X = xn )

n=0

n=0
+
X

p

= xn ) = 1.
P
Les sommes partielles de la srie termes positifs
n>0 |xn | P (X = xn ) sont majores
indpendamment de p, donc cette srie converge, ce qui prouve
ple rsultat. En passant la limite
dans les ingalits prcdentes, on obtient mme : E(|X|) 6 E(X 2 ).
On a (X E(X))2 = X 2 2E(X)X + E(X)2 . Si X 2 est desprance finie, X galement, et
donc par combinaison linaire, (X E(X))2 est desprance finie.

Cette proprit permet de donner la dfinition suivante :
Proprit/Dfinition
Soit X une variable alatoire relle sur (,A ,P ). On dit que X admet une variance
(ou admet un moment dordre 2) si X 2 est desprance finie. Dans ce cas :
On appelle variance de X le rel positif
V (X) = E((X E(X))2 ).
On a aussi V (X) = E(X 2 ) E(X)2 .
p
On appelle cart-type de X le rel positif (X) = V (X).
Dmonstration de la seconde expression de V (X)
Daprs la proprit prcdente, (X E(X))2 = X 2 2E(X)X + E(X)2 est desprance finie ;
par linarit de lesprance,
V (X) = E(X 2 ) 2E(X)2 + E(X)2 = E(X 2 ) E(X)2 .

Remarques
Si X 2 est desprance finie, le moment dordre 2 de X est le rel positif E(X 2 ).
Si X() = {xn ; n N},
le thorme de transfert, X a une variance si et seulement si
Pdaprs
2
la srie termes positifs n>0 xn P (X = xn ) converge, et dans ce cas,
V (X) =

+
X

(xn E(X))2 P (X = xn ).

n=0

Si X admet une variance et m = E(X), on a V (X) = 0 si et seulement si P (X = m) = 1.


Exemple Soit X une variable alatoire prenant les valeurs 1 et 1 et suivant la loi uniforme, et
soit Y la variable alatoire nulle. Alors X et Y sont toutes les deux desprance nulle. Pourtant,
elles se comportent trs diffremment ; la variance est un moyen de mesurer cette diffrence : on
a
V (X) = E((X 0)2 ) = E(X 2 ) = 1 et V (Y ) = 0.
279

Proprit
Soit X une variable alatoire relle sur (,A ,P ) admettant une variance, et (a,b) R2 .
Alors aX + b admet une variance et on a : V (aX + b) = a2 V (X).
Dmonstration On a (aX +b)2 = a2 X 2 +2abX +b2 et X 2 est desprance finie donc X galement.
Par combinaison linaire, aX + b a une variance et par linarit de lesprance,
E((aX + b)2 ) = a2 E(X 2 ) + 2abE(X) + b2
(E(aX + b))2 = (aE(X) + b)2 = a2 E(X)2 + 2abE(X) + b2 .
Par diffrence, on en dduit que
V (aX + b) = a2 (E(X 2 ) E(X)2 ) = a2 V (X).

Remarque Cette proprit est cohrente avec linterprtation de V (X) et (X) comme indicateurs de dispersion des valeurs de X autour de son esprance : ajouter une mme valeur b
toutes les valeurs de X ne modifie pas la variance et lcart-type, multiplier toutes les valeurs de
X par un rel a multiplie lcart-type par |a|.
Proprit (dmonstration non exigible)
Soit X une variable alatoire sur (,A ,P ), valeurs dans N.
Pour que X admette une variance, il faut et il suffit que GX soit deux fois drivable
gauche en 1. Dans ce cas,
V (X) = GX (1) + GX (1) GX (1)2 .
Ce rsultat est admis. Il sagit dadapter la dmonstration faisant le lien entre lexistence de
E(X) et celle de GX (1). Expliquons simplement comment retrouver la formule donnant V (X) :
en cas dexistence, on montre que GX (t) et GX (t) se calculent, pour t [1,1], par drivation
terme terme avec
GX (t) =
GX (1) =

+
X

n=1
+
X

n P (X = n) tn1 , GX (t) =

+
X

n=2

n P (X = n) = E(X),

n(n 1) P (X = n) tn2

GX (1) =

+
X

n=0

n=0

n(n 1) P (X = n) = E(X(X 1)).

Daprs le thorme de transfert, et par linarit de lesprance,


V (X) = E(X 2 ) E(X)2 = E(X(X 1)) + E(X) E(X)2 = GX (1) + GX (1) GX (1)2 . 
Proprit Variance correspondant aux lois usuelles
Soit X une variable alatoire sur (,A ,P ).
Si X B(p), alors X admet une variance et V (X) = p(1 p).

Si X B(n,p), alors X admet une variance et V (X) = np(1 p).


1p
Si X G (p), alors X admet une variance et V (X) =
.
p2
Si X P(), alors X admet une variance et V (X) = .

280

Dmonstration
Si X B(p), on a E(X 2 ) = 02 (1 p) + 12 p = p. Alors
V (X) = E(X 2 ) E(X)2 = p p2 = p(1 p).
Si X B(n,p), on sait que GX (t) = (1 p + pt)n pour tout t R. La fonction GX est deux
fois drivable en 1, donc X admet une variance, et
V (X) = GX (1) + GX (1) GX (1)2 = n(n 1)p2 + np n2 p2 = np(1 p).
pt
notamment pour tout t [1,1].
1 (1 p)t
est deux fois drivable sur [1,1], avec

Supposons que X G (p). On sait que GX (t) =


La fonction GX

t [1,1],

GX (t) =

p
2p(1 p)
, GX (t) =
.
2
(1 (1 p)t)
(1 (1 p)t)3

En particulier, X admet une variance, et


V (X) = GX (1) + GX (1) GX (1)2 =

1
1p
2p(1 p) 1
+ 2 =
.
p3
p p
p2

Supposons que X P(). On sait que GX (t) = e(t1) pour tout t R. La fonction GX est
deux fois drivable en 1, donc X admet une variance, et
V (X) = GX (1) + GX (1) GX (1)2 = 2 + 2 = .

Remarque On peut calculer toutes ces variances directement partir du thorme de transfert.

2.

Covariance et corrlation
Proprit Ingalit de Cauchy-Schwarz
Soient X et Y deux variables alatoires sur (,A ,P ) admettant une variance.
Alors XY est desprance finie et
p
|E(XY )| 6 E(X 2 )E(Y 2 ).

Dmonstration On a |XY | 6 X 2 + Y 2 ; en adaptant la dmonstration de la linarit de lesprance, on en dduit que XY est desprance finie. Quant lingalit de Cauchy-Schwarz, on
procde comme pour un produit scalaire, en considrant la fonction polynomiale de degr au
plus 2
7 E((X + Y )2 ) = 2 E(X 2 ) + 2E(XY ) + E(Y 2 ),
valeurs positives.

Dfinition
Soient X et Y deux variables alatoires sur (,A ,P ) admettant une variance.
On appelle covariance de X et Y le rel

Cov(X,Y ) = E [X E(X)] [Y E(Y )] = E(XY ) E(X)E(Y ).

Si (X) et (Y ) sont non nuls, on appelle coefficient de corrlation de X et Y le


rel
Cov(X,Y )
(X,Y ) =
.
(X) (Y )

281

Dmonstration de lexistence de Cov(X,Y ), et de la seconde formule


On a [X E(X)] [Y E(Y )] = XY E(X)Y E(Y )X + E(X)E(Y ). Les variables alatoires
X et Y ont une variance, donc le produit XY est desprance finie et par combinaison linaire,
[X E(X)] [Y E(Y )] est desprance finie. Par linarit de lesprance, on a
Cov(X,Y ) = E(XY ) E(X)E(Y ) E(Y )E(X) + E(X)E(Y ) = E(XY ) E(X)E(Y ). 
Remarques
Si X admet une variance, Cov(X,X) = V (X).
Si X et Y admettent une variance, Cov(X,Y ) = Cov(Y,X).
Proprit
Soient X et Y deux variables alatoires indpendantes sur (,A ,P ) admettant une
variance.
Alors Cov(X,Y ) = 0.
Dmonstration On a Cov(X,Y ) = E(XY ) E(X)E(Y ) = 0 par indpendance.

Remarque La rciproque de la proprit prcdente est fausse comme le montre lexemple


suivant : soit X une variable alatoire dimage {1,0,1}, de loi uniforme, et soit Y = X 2 . Alors
E(XY ) = E(X) = 0 (on a XY = X 3 = X) donc Cov(X,Y ) = 0, mais X et Y ne sont pas
indpendantes car
1
P (Y = 0 | X = 1) = 0 6= = P (Y = 0).
3
Exemple Soit (Xn )nN une suite de variables alatoires mutuellement indpendantes suivant
la loi B(p) avec p ]0,1[. Posons, pour tout n N , Yn = Xn Xn+1 . Pour tout n, Xn est la
fonction indicatrice de lvnement (Xn = 1), et Yn est la fonction indicatrice de lvnement
(Xn = 1) (Xn+1 = 1), de probabilit p2 ]0,1[ par indpendance. En particulier, Yn B(p2 ).
La variable Yn indique deux succs conscutifs aux rangs n et n + 1.
De la mme faon, pour tout n N , Yn Yn+1 = Xn Xn+1 Xn+2 B(p3 ), donc
Cov(Yn ,Yn+1 ) = E(Yn Yn+1 ) E(Yn )E(Yn+1 ) = p3 p4 = p3 (1 p).
Notamment, Yn et Yn+1 ne sont pas indpendantes.
En revanche, si j > i + 2, on remarque que Yi Yj est la fonction indicatrice de
(Yi Yj = 1) = (Xi = 1) (Xi+1 = 1) (Xj = 1) (Xj+1 = 1),
de probabilit p4 par indpendance, et donc E(Yi Yj ) = p4 , puis
Cov(Yi ,Yj ) = E(Yi Yj ) E(Yi )E(Yj ) = p4 p2 p2 = 0.
Attention, on ne peut pas en dduire que Yi et Yj sont indpendantes (cest vrai, mais il faudrait
le prouver en revenant par exemple la dfinition).
Proprit
Soient X et Y deux variables alatoires sur (,A ,P ) admettant une variance.
Alors
|Cov(X,Y )| 6 (X) (Y ),
En particulier, si (X) 6= 0 et (Y ) 6= 0,
(X,Y ) [1,1].

282

Dmonstration Daprs lingalit de Cauchy-Schwarz,


1/2
|Cov(X,Y )| = |E([XE(X)][Y E(Y )])| 6 E((X E(X))2 )E((Y E(Y ))2 )
= (X) (Y ).

Lencadrement de (X,Y ) sensuit directement.

Remarque Le coefficient de corrlation mesure en quelque sorte la dpendance entre X et Y .


Lorsque |(X,Y )| est proche de 1, une information sur X apporte une information sur Y . Lorsque
X et Y sont indpendantes, (X,Y ) = 0, mais la rciproque est fausse.
Proprit
Soient X1 , . . . ,Xn des variables alatoires sur (,A ,P ) admettant une variance.
Alors :
P
nk=1 Xk admet une variance et
!
n
n
X
X
X
V
Xk =
V (Xk ) + 2
Cov(Xi ,Xj ).
k=1

i<j

k=1

Si de plus X1 , . . . ,Xn sont deux deux indpendantes, on a


!
n
n
X
X
V
Xk =
V (Xk ).
k=1

Dmonstration
On a

n
X

Xk

k=1

!2

k=1

n
X

Xk2 + 2

Xi Xj .

i<j

k=1

Les Xk ont toutes une variance, donc les Xi Xj sont desprance finie, et par combinaison linaire
P
P
( nk=1 Xk )2 est desprance finie (i.e., nk=1 Xk admet une variance). De plus, par linarit de
lesprance,

!2
n
n
X
X
X
E
Xk =
E(Xk2 ) + 2
E(Xi Xj ).
k=1

i<j

k=1

Dautre part,

n
X
k=1

Xk

!!2

n
X

!2

E(Xk )

k=1

n
X
X
(E(Xk ))2 + 2
E(Xi )E(Xj ).
=
k=1

i<j

On en dduit le rsultat par diffrence.


Si les Xk sont deux deux indpendantes, on a, pour tout (i,j) [[1,n]]2 tel que i < j,
Cov(Xi ,Xj ) = 0, do lgalit souhaite.

Application Soient X1 , . . . ,Xn des variables alatoires mutuellement indpendantes suivant
la mme loi B(p) et soit S = X1 + + Xn . Daprs la proprit prcdente, S a une variance et
V (S) =

n
X
k=1

V (Xk ) = np(1 p).

On sait aussi que S suit la loi B(n,p). La variance ne dpendant que de la loi, on en dduit que
pour toute variable alatoire X qui suit la loi B(n,p), on a V (X) = np(1 p). On retrouve donc
la valeur de V (X) dtermine plus tt par un calcul direct.
283

3.

Estimations de la dispersion

La variance sinterprte comme indicateur de dispersion. Dans ce paragraphe, nous allons


montrer plus prcisment comment la variance (ou lcart-type) permet de mesurer cette dispersion.
Thorme Ingalit de Markov
Soit X une variable alatoire sur (,A ,P ), positive, desprance finie.
Alors, pour tout > 0,
E(X)
P (X > ) 6
.

Dmonstration Soit > 0 fix. On dcrit X() en extension sous la forme {xn ; n I}. Soit
U = [, + [. Par positivit de X,
X
X
E(X) >
xn P (X = xn ) >
P (X = xn )
xn U

xn U

car xn > si xn U . Alors


E(X) > P (X U ) = P (X > ),
do le rsultat.

Thorme Ingalit de Bienaym - Tchebychev


Soit X une variable alatoire sur (,A ,P ) admettant une variance.
Alors, pour tout > 0,
(X)2
.
P (|X E(X)| > ) 6
2
Dmonstration Soit > 0 fix. La variable alatoire X admet une variance donc est desprance
finie et, en posant Y = (X E(X))2 , alors Y est une variable alatoire positive desprance finie.
De plus, on remarque que
(|X E(X)| > ) = (Y > 2 ).
Alors, daprs lingalit de Markov,
P (|X E(X)| > ) = P (Y > 2 ) 6

(X)2
E(Y )
=
.
2
2

Remarque Lingalit de Bienaym - Tchebychev permet de majorer la probabilit que X scarte


dau moins de son esprance, i.e., de sa moyenne. On voit que cette majoration fait intervenir
lcart-type de X ; plus prcisment, plus (X) est petit, plus la probabilit prcdente est faible,
cest--dire, plus grande est la probabilit que X soit proche de son esprance. Cela confirme
linterprtation de (X) et V (X) comme indicateurs de dispersion.
Exemple Notons m = E(X) et = (X). Pour = 2, on obtient
1
P (|X m| > 2) 6 ,
4
ou de faon quivalente,

3
P (m 2 < X < m + 2) > .
4
La probabilit que X soit au plus 2 carts-types de son esprance est donc au moins 3/4. En
revanche, pour = , lingalit ne donnerait pas de rsultat intressant.
284

Thorme Loi faible des grands nombres


Soit (Xn )nN une famille de variables alatoires sur (,A ,P ). On suppose que les
variables alatoires Xn
sont deux deux indpendantes,
ont la mme loi et admettent une variance.

On note m = E(X1 ), = (X1 ) et pour tout n N , Sn = X1 + + Xn .


Alors, pour tout > 0,



1

2


P S n m > 6
,
n
n 2
et en particulier,





1


0.
P S n m >
n+
n

Dmonstration Les variables alatoires Xn admettent une variance donc galement une esprance. Sachant quelles ont la mme loi, elles ont la mme esprance et la mme variance (par
exemple celles de X1 , m et 2 ). De plus, par linarit de lesprance, on a pour tout n N ,


1
1
Sn = n E(X1 ) = m,
E
n
n
et daprs les proprits de la variance,


1
1
1
V
Sn = 2 V (Sn ) = V (X1 )
n
n
n



Sn 2 2
.
par indpendance deux deux des Xk . Ainsi,
=
n
n
Soit > 0 fix. Daprs lingalit de Bienaym-Tchebychev applique Sn /n, on a




1
2
(Sn /n)2


=
0.
P S n m > 6
n
2
n 2 n+

Remarques
Imaginons que lon rpte indfiniment une mme exprience alatoire en observant, chaque
tape, un certain rsultat ; cette situation est modlise par une suite (Xn )nN de variables
alatoires mutuellement indpendantes et de mme loi, Xn reprsentant le rsultat observ la
n-ime tape. Alors Sn /n reprsente la moyenne empirique des rsultats au cours des n premires
expriences.
Notons m lesprance commune toutes les variables Xn . La loi faible des grands nombres affirme
que pour tout > 0, la probabilit que Sn /n scarte de m dau moins tend vers 0 lorsque
le nombre dexpriences tend vers +. De faon quivalente, la probabilit que cette moyenne
vrifie m < Sn /n < m + tend vers 1.
Par exemple, considrons un jeu de pile ou face infini (ou toute autre exprience de Bernoulli
reproduite indfiniment) et notons Xn lindicatrice de lvnement le n-ime lancer donne
pile . Pour tout n N , Xn B(p), E(Xn ) = p et V (Xn ) = p(1 p). Si les Xn sont deux
deux indpendantes, le thorme prcdent affirme que la moyenne Sn /n du nombre de piles
au cours des n premiers tirages sera proche de p ( prs) avec une probabilit tendant
vers 1 lorsque n +. En un certain sens, la moyenne se stabilise vers p lorsque le nombre
dexpriences augmente.
Ci-dessous, on a reprsent les frquences relatives dapparition de pile au cours des n
premiers lancers, pour n [[1,200]] puis pour n [[1,1000]]. Dans chaque cas, on a effectu trois
simulations (courbes des diffrentes couleurs).
285

1.0

0.8

0.8
Frequences relatives

Frequences relatives

1.0

0.6

0.4

0.2

0.0
0

0.6

0.4

0.2

50

100
Nombre de tirages

150

200

0.0
0

200

400
600
Nombre de tirages

800

1000

Il faut bien comprendre que ce thorme ne dicte pas une exprience concrte comment
elle va se drouler pour assurer lquilibre. Le thorme sinscrit lintrieur du modle, mais
est cohrent avec lapproche intuitive des probabilits comme frquence relative de ralisation
lors dun grand nombre de rptitions.
Ce thorme peut jouer un rle dans la validation du modle : si on suppose une pice quilibre
et que toutes les observations montrent une convergence vers p 6= 1/2, alors le modle est sans
doute revoir. Il permet destimer certains paramtres (par observation dun chantillon, comme
par exemple lors dun sondage), lingalit du thorme permettant de mesurer le risque derreur.
Ces deux remarques relvent de la thorie des Statistiques.
Le thorme prcdent naffirme pas que Sn ()/n tend vers m pour toute issue (ce qui est
faux en gnral) ; il ne faudrait donc pas stonner dune issue pour laquelle (Sn ()/n)nN
ne converge pas vers m, ou mme, ne converge pas : dans le jeu de pile ou face infini avec une
pice quilibre, il est possible dobtenir pile chaque tirage (mme si lvnement associ est de
probabilit nulle), et pour cette issue de lexprience, (Sn ()/n) est constante gale 1.
Exemple On fait un test de qualit dans une production de N articles. Soit p la proportion
darticles dfectueux. On vrifie n articles pris au hasard dans le stock, ce que lon modlise
par une famille (X1 , . . . ,Xn ) de variables alatoires de Bernoulli mutuellement indpendantes de
paramtre p (Xk prend la valeur 1 si le k-ime article test est dfectueux). Avec les notations
prcdentes, Sn /n est la proportion darticles dfectueux dans lchantillon test. On sait que
pour tout > 0,




1
1
p(1 p)


6
,
P Sn p > 6
2
n
n
4n2
la dernire ingalit provenant de ltude de la fonction trinme p 7 p(1 p). Choisissons par
exemple = 102 ; alors le majorant vaut 2500/n. Ainsi, en testant n pices, on peut affirmer
avec un risque derreur dau plus 2500/n, que la proportion observe est une valeur approche
de p 102 prs. On voit que, avec la prcision voulue, minimiser le risque derreur implique de
tester un nombre assez grand darticles : la convergence du majorant nest pas trs rapide.

286

Le tableau suivant rcapitule certaines caractristiques des lois usuelles :

Nom

Notation

Condition

Image

P (X = k)

E(X)

V (X)

GX (t)

Bernoulli

B(p)

p [0,1]

{0,1}

P (X = 1) = p

p(1 p)

1 p + pt

[[0,n]]

 
n k
p (1 p)nk
k

np

np(1 p) (1 p + pt)n

p (1 p)k1

1
p

1p
p2

pt
1 (1 p)t

e(t1)

N , p

Binomiale

B(n,p)

Gomtrique

G (p)

p ]0,1[

Poisson

P()

>0

[0,1]

287

k
k!

288

Chapitre 15

Endomorphismes remarquables des


espaces euclidiens
Dans ce chapitre, sauf indication contraire, (E, ( | )) dsigne un espace euclidien de dimension
n et k k la norme associe.

I.

Isomtries vectorielles

1.

Dfinition, proprits, caractrisations


Dfinition
Soit u L (E). On dit que u est une isomtrie vectorielle si u conserve la norme,
cest--dire si
x E, ku(x)k = kxk.

Exemple Dans R2 [X] muni du produit scalaire dfini par :



aX 2 + bX + c | X 2 + X + = a + b + c,
soit u lendomorphisme dfini par :

b+c
bc
u(aX 2 + bX + c) = X 2 + aX + .
2
2
Alors u est une isomtrie vectorielle car, pour tout P = aX 2 + bX + c R2 [X],
1
1
ku(P )k2 = (b2 + 2bc + c2 ) + a2 + (b2 2bc + c2 ) = a2 + b2 + c2 = kP k2 ,
2
2
donc en prenant la racine carre, on obtient que u conserve la norme.
Proprit
Une isomtrie vectorielle est un automorphisme.
Dmonstration Lespace E tant de dimension finie, il suffit de montrer que u est injectif. Or,
si u(x) = 0E , alors par conservation de la norme, kxk = ku(x)k = 0 et donc x = 0E , do le
rsultat.

Remarque Les isomtries vectorielles sont galement appeles automorphismes orthogonaux.
Attention ! En gnral, une projection orthogonale nest pas un automorphisme orthogonal : elle
ne conserve pas la norme et nest pas bijective.
289

Proprit/Dfinition
Lensemble des isomtries vectorielles de E est appel groupe orthogonal de E, et
not O(E).
On a notamment :
Si u et v sont deux lments de O(E), alors u v O(E).
Si u O(E), u1 O(E).
Dmonstration
Pour tout x E, kxk = kv(x)k = k(u v)(x)k car u et v sont des isomtries vectorielles
donc conservent la norme. On en dduit que u v conserve la norme, cest donc une isomtrie
vectorielle.
Pour tout x E, kxk = k(u u1 )(x)k = ku1 (x)k car u conserve la norme. On en dduit que
u1 conserve la norme, cest donc une isomtrie vectorielle.

Proprit
Soit u L (E). Pour que u soit une isomtrie vectorielle, il faut et il suffit que u
conserve le produit scalaire, cest--dire, que
(x,y) E 2 , (u(x) | u(y)) = (x | y) .
Dmonstration
Si u conserve le produit scalaire, pour tout x E,
ku(x)k2 = (u(x) | u(x)) = (x | x) = kxk2

et donc ku(x)k = kxk.

On en dduit que u est une isomtrie vectorielle.


Si u conserve la norme, on montre que u conserve le produit scalaire laide de lidentit de
polarisation : pour tout (x,y) E 2 ,
(u(x) | u(y)) =

 1

1
ku(x) + u(y)k2 ku(x) u(y)k2 =
ku(x + y)k2 ku(x y)k2 ,
4
4

par linarit de u. Comme u conserve la norme, on a donc


(u(x) | u(y)) =


1
kx + yk2 kx yk2 = (x | y) .
4

Do la conservation du produit scalaire.

Proprit
Soit u L (E) et B une base orthonorme de E.
Les proprits suivantes sont quivalentes :
u est une isomtrie vectorielle.
Limage par u de la base orthonorme B de E est une base orthonorme de E.
Dmonstration On note B = (e1 , . . . ,en ).
Si u est une isomtrie vectorielle, alors u conserve le produit scalaire, et donc pour tout
(i,j) [[1,n]]2 ,
(u(ei ) | u(ej )) = (ei | ej ) = i,j .
La famille u(B) est donc une base orthonorme de E : elle est orthonorme, donc libre, et est
compose de n vecteurs en dimension n.
290

On suppose que u(B) = (u(e1 ), . . . ,u(en )) est une base orthonorme de E. Si


x = x1 e1 + + xn en

et y = y1 e1 + + yn en

sont deux vecteurs de E, alors


u(x) = x1 u(e1 ) + + xn u(en ) et u(y) = y1 u(e1 ) + + yn u(en ),
donc les coordonnes de u(x) et u(y) dans la base u(B) sont les mmes que celles de x et y
dans la base B. Lexpression du produit scalaire dans une base orthonorme montre donc que
(u(x) | u(y)) = (x | y) . Donc u est une isomtrie vectorielle.

Proprit
Soit u une isomtrie vectorielle de E et F un sous-espace vectoriel de E stable par u.
Alors F est stable par u.
Dmonstration Lapplication u est un isomorphisme, donc dim(u(F )) = dim(F ). Sachant de
plus que u(F ) F car F est stable par u, on a u(F ) = F .
Soit x F ; on veut montrer que u(x) F . Soit donc y F ; daprs ce qui prcde, il existe
z F tel que y = u(z). Alors, par conservation du produit scalaire,
(u(x) | y) = (u(x) | u(z)) = (x | z) = 0
car x F et z F. Donc u(x) est orthogonal tout vecteur de F : u(x) F . Ceci tant vrai
pour tout x F , on a le rsultat voulu.


2.

Matrices orthogonales
Dfinition
Soit M Mn (R) une matrice carre relle.
On dit que M est orthogonale si lendomorphisme uM canoniquement associ M
est une isomtrie vectorielle pour la norme associe au produit scalaire canonique sur
Mn,1 (R).

Proprit
Soit M Mn (R). Les proprits suivantes sont quivalentes :
1. M est une matrice orthogonale.
2. tM M = In .
3. M tM = In .
4. M est inversible et M 1 = tM.
5. Les colonnes de M forment une famille orthonorme de Mn,1 (R) muni du produit
scalaire canonique. Dans ce cas, elles en forment une base orthonorme.
6. Les lignes de M forment une famille orthonorme de M1,n (R) muni du produit
scalaire canonique. Dans ce cas, elles en forment une base orthonorme.
Dmonstration Soit ( | ) le produit scalaire canonique sur Mn,1 (R).
1 2 : La matrice M est orthogonale si et seulement si uM conserve le produit scalaire, ce qui
quivaut au fait que pour tout (X,Y ) Mn,1 (R)2 ,
(uM (X) | uM (Y )) = (X | Y ) .
291

Or, pour tout (X,Y ) Mn,1 (R)2 ,

(uM (X) | uM (Y )) = t (M X)(M Y ) = tX(tM M )Y

et

(X | Y ) = tXY.

Si tM M = In , M est donc orthogonale ; rciproquement, si M est orthogonale, en choisissant


pour X et Y les vecteurs de la base canonique de Mn,1 (R), on obtient tM M = In .
2 3 4 : Cest un rsultat du chapitre Matrices.
2 5 : Notons C1 , . . . ,Cn les colonnes de M . Le coefficient en position (i,j) dans la matrice
tM M est t C C , cest--dire (C | C ). On en dduit que tM M = I si et seulement si pour tout
i j
i
j
n
(i,j), (Ci | Cj ) = i,j , cest--dire, si et seulement si (C1 , . . . ,Cn ) est une famille orthonorme de
Mn,1 (R). Dans ce cas, sachant de plus que cette famille est compose de n = dim(E) vecteurs,
cest une base orthonorme de Mn,1 (R).
3 6 : On raisonne de la mme faon, le coefficient en position (i,j) dans la matrice M tM tant
(Li | Lj ), o L1 , . . . ,Ln sont les lignes de M .

Exemple La matrice

1 1 0
1
M = 1 1 0
2 0 0
2

est orthogonale, car la famille (C1 ,C2 ,C3 ) de ses colonnes vrifie les relations (Ci | Cj ) = i,j pour
tout (i,j) [[1,3]]2 .
Proprit Lien entre isomtries vectorielles de E et matrices orthogonales
Soit u L (E) et B une base orthonorme de E.
Les proprits suivantes sont quivalentes :
u est une isomtrie vectorielle.
La matrice M de u dans la base orthonorme B est orthogonale.
Dmonstration Lendomorphisme u est une isomtrie vectorielle si et seulement si pour tout
(x,y) E 2 ,
(u(x) | u(y)) = (x | y) .
Si X et Y sont les vecteurs-colonnes des coordonnes de x et y dans la base orthonorme B, alors
(u(x) | u(y)) = t (M X)(M Y ) = tX(tM M )Y

et

(x | y) = tXY.

Or, lorsque x et y parcourent E, X et Y parcourent Mn,1 (R), et rciproquement. Ainsi, u est


une isomtrie vectorielle si et seulement si pour tout (X,Y ) Mn,1 (R)2 ,
t

X(tM M )Y = tXY,

cest--dire, si et seulement si M est orthogonale (voir la dmonstration prcdente).

Proprit
Les matrices orthogonales sont exactement les matrices de changement de base orthonorme : si B est une base orthonorme de E et P Mn (R) est la matrice dune famille
F de vecteurs de E dans la base B, alors P est une matrice orthogonale si et seulement
si F est une base orthonorme de E.
Dmonstration Avec les notations de la proprit, soit u lendomorphisme de E ayant P pour
matrice dans la base B. La matrice P est orthogonale si et seulement si u est une isomtrie
vectorielle, ce qui quivaut au fait que u(B), i.e. F, soit une base orthonorme de E.

Remarque En particulier, si B et B sont deux bases orthonormes de E, et si P dsigne la
matrice de passage de B vers B , alors pour tout u L (E),
MatB (u) = tP MatB (u) P.
292

Proprit/Dfinition
Lensemble des matrices orthogonales dordre n est appel groupe orthogonal dordre
n, et not O(n) ou On (R) :
O(n) = {M Mn (R); tM M = In }.
Lensemble O(n) est stable par produit et passage linverse.
Dmonstration Si M O(n) et N O(n),
t

(M N )(M N ) = tN tM M N = tN N = In ,

donc M N O(n). De plus,


t

(M 1 )M 1 = (tM )1 M 1 = (M tM )1 = In ,

donc M 1 O(n).

Proprit
Si M O(n), alors det(M ) = 1.
De mme, si u O(E), alors det(u) = 1.
Dmonstration Une matrice orthogonale M vrifie tM M = In donc det(tM ) det(M ) = 1. Or
det(tM ) = det(M ), donc det(M )2 = 1 et det(M ) = 1.
Si u O(E), on raisonne matriciellement dans une base orthonorme.


Remarque Bien sr, la rciproque est fausse, comme le montre lexemple de la matrice


1 1
;
0 1

elle a pour dterminant 1 mais nest pas orthogonale : ses deux colonnes ne sont pas orthogonales
pour le produit scalaire canonique.
Proprit/Dfinition
Lensemble des matrices orthogonales de Mn (R) de dterminant 1, est appel groupe
spcial orthogonal dordre n, not SO(n) ou SOn (R).
Il est stable par produit et passage linverse.
Dmonstration On sait dj que On (R) est stable par produit et passage linverse. De plus, si
M SOn (R) et N SOn (R), on a
det(M N ) = det(M ) det(N ) = 1 et

det(M 1 ) = (det(M ))1 = 1,

do le rsultat.

Dfinition
Si E est de dimension 2 ou 3, un lment de O(E) de dterminant 1 est appel rotation
de E.

293

II.

Endomorphismes symtriques
Dfinition
Soit u L (E). On dit que u est symtrique si
(x,y) E 2 ,

(u(x) | y) = (x | u(y)) .

Proprit Lien entre endomorphismes symtriques et matrices symtriques


Soit u L (E) et B une base orthonorme de E.
Les proprits suivantes sont quivalentes :
u est symtrique.
La matrice M de u dans la base orthonorme B est symtrique, cest--dire vrifie
tM = M .
Dmonstration Lendomorphisme u est symtrique si et seulement si pour tout (x,y) E 2 ,
(u(x) | y) = (x | u(y)) .
Si X et Y sont les vecteurs-colonnes des coordonnes de x et y dans la base orthonorme B, alors
(u(x) | y) = t (M X)Y = tX tM Y

et

(x | u(y)) = tX(M Y ) = tXM Y.

Or, lorsque x et y parcourent E, X et Y parcourent Mn,1 (R), et rciproquement. Ainsi, u est


symtrique si et seulement si pour tout (X,Y ) Mn,1 (R)2 ,
t

X tM Y = tXM Y,

cest--dire, si et seulement si tM = M .

Exemple La projection orthogonale p sur un sous-espace vectoriel F de E est symtrique. En


effet, dans une base orthonorme de E adapte la dcomposition
E = Im(p) Ker(p) = Im(p) Im(p) ,
la matrice de p est (en notant r = rg(p))


Ir

0r,nr

0nr,r 0nr,nr

elle est symtrique.


Attention ! Pour utiliser ce rsultat, il est essentiel que B soit orthonorme, de mme que dans
la proprit sur le lien entre isomtries vectorielles et matrices orthogonales.
Les endomorphismes symtriques ont des proprits remarquables vis--vis de la rduction
des endomorphismes :
Thorme spectral
Soit u L (E) un endomorphisme symtrique.
Alors u est diagonalisable dans une base orthonorme : il existe une base orthonorme
de E constitue de vecteurs propres pour u.

294

Dmonstration (non exigible)


On procde par rcurrence sur n = dim(E). Le rsultat est vrai pour n = 1 car tout vecteur
de E de norme 1 est vecteur propre de u. Si le rsultat est vrai en dimension n, soit u un
endomorphisme symtrique de E, espace euclidien de dimension n + 1.
Soit M la matrice de u dans une base orthonorme quelconque. Sachant que u est symtrique
et que M est sa matrice dans une base orthonorme, M est symtrique. La matrice M est relle,
mais on peut la considrer comme matrice complexe et ce titre, M possde une valeur propre
C. Soit X Mn,1 (C) un vecteur propre associ ; on va calculer tXM X de deux faons : tout
dabord, M tant relle,
t
XM X = tXM X = tXX = tXX.
De plus, M tant symtrique,
t

XM X = tX tM X = t (M X)X = t (X)X = tXX.

Mais, en notant x1 , . . . ,xn les coefficients de X, on a


t

XX =

n
X

xi xi =

i=1

n
X
i=1

|xi |2 6= 0

car X 6= 0. On en dduit que = , i.e., R. Ainsi, u possde une valeur propre relle .
Soit e1 un vecteur propre associ. Quitte diviser e1 par sa norme (qui est non nulle), on peut
supposer e1 unitaire.
Notons F = Vect(e1 ) ; il sagit dun sous-espace vectoriel de E de dimension n. De plus, F
est stable par u : en effet, si x F , alors
(u(x) | e1 ) = (x | u(e1 ))
car u est symtrique. Or u(e1 ) = e1 , donc
(u(x) | e1 ) = (x | e1 ) = 0
car x F = Vect(e1 ) . On a finalement (u(x) | e1 ) = 0, et donc u(x) Vect(e1 ) = F.
On peut donc considrer lendomorphisme u|F de F induit par u ; F est bien sr un espace
euclidien par restriction du produit scalaire de E, et u|F est symtrique de mme que u. Par
hypothse de rcurrence, il existe une base orthonorme (e2 , . . . ,en+1 ) de F constitue de vecteurs
propres pour u|F , et donc pour u. Alors, sachant que E = Vect(e1 ) F (cette somme tant
orthogonale), on obtient que (e1 , . . . ,en+1 ) est une base orthonorme de E de vecteurs propres
pour u, ce qui prouve lhrdit.

Remarques
En particulier, si u L (E) est symtrique, u possde n valeurs propres relles (u est scind
dans R). Ces valeurs propres ne sont pas ncessairement distinctes.
Si u L (E) est un endomorphisme symtrique, les sous-espaces propres de u sont deux
deux orthogonaux.
En effet, soient et deux valeurs propres distinctes de u, x et y deux vecteurs propres
associs respectivement ces valeurs propres. Alors
(u(x) | y) = (x | y) = (x | y) .
Mais u tant symtrique, on a aussi
(u(x) | y) = (x | u(y)) = (x | y) = (x | y) .
Sachant que 6= , on en dduit que (x | y) = 0, et donc E (u) E (u).
295

Matriciellement, le thorme spectral sinterprte de la faon suivante :


Thorme spectral (matriciel)
Soit M Mn (R) une matrice symtrique relle.
Alors M est diagonalisable au moyen dune matrice orthogonale, cest--dire quil
existe :
une matrice diagonale D Mn (R) dont les coefficients diagonaux sont les valeurs
propres de M ,
une matrice orthogonale P O(n) dont les colonnes constituent une base orthonorme de Mn,1 (R) (pour le produit scalaire canonique) de vecteurs propres pour
M,
telles que
M = P D tP.
Dmonstration On applique le thorme spectral lendomorphisme uM canoniquement associ
M : il existe une base orthonorme B de Mn,1 (R) constitue de vecteurs propres pour M .
Soit P la matrice de passage de la base canonique de Mn,1 (R) la base B ; P est une matrice
orthogonale car cest une matrice de changement de bases orthonormes, donc P 1 = tP . La
formule M = P D tP est alors une consquence des formules de changement de base.

Attention ! Une matrice symtrique complexe nest pas toujours diagonalisable, comme le montre
lexemple de la matrice


1 i
i 1

de polynme caractristique X 2 ; si elle tait diagonalisable, elle serait nulle.


Exemple La matrice

1 1 1
A = 1 1 1
1 1 1

est symtrique relle, elle est donc diagonalisable au moyen dune matrice orthogonale. Comme
de plus elle est de rang 1, on sait que 0 est valeur propre double de A. Une base orthonorme de
E0 (A), qui est le plan dquation x + y + z = 0, est

1
1
1
1
2 , 0 .
6
2 1
1
Dans ce cas particulier, on sait alors que
vectorielle dirige par le vecteur normal t
propre pour A associ la valeur propre
somme des coefficients de chaque ligne de

le second
 espace propre est E0 (A) , cest une droite
1 1 1 E0 (A), dont on constate quil est vecteur
3 (ce que lon pouvait remarquer directement car la
A est 3). En posant

1
1
1

1
6

0
12

P = 26

3
1
,
3
1

on obtient une matrice orthogonale telle que

0 0 0
A = P 0 0 0 tP.
0 0 3

On remarquera que dans ce cas, on na pas calculer P 1 , il suffit de transposer P . Attention


cependant, pour pouvoir affirmer ceci, il faut bien prendre soin de vrifier que P est effectivement
296

orthogonale. Dans cet exemple, il tait indispensable de choisir une base de E0 (A) qui soit
orthonorme.
Application : en Sciences Industrielles, la matrice dinertie dun solide dans un repre orthonorm est une matrice symtrique relle, elle est donc diagonalisable au moyen dune matrice
orthogonale. Les droites propres pour cette matrice sont appeles axes principaux dinertie du
solide.

III.
1.

Espaces euclidiens orients de dimension 2 et 3


Orientation

Soient B et B deux bases orthonormes de E, et P la matrice de passage de B B . On sait


que P On (R), et donc det(P ) = 1, cest--dire, detB (B ) = 1. De plus,
detB (B) = det(P 1 ) = det(P ) = detB (B ).
Ceci permet de donner la dfinition suivante :
Dfinition Orientation, bases orthonormes directes
On dit que B et B ont la mme orientation si detB (B ) = 1.
On dit que B et B ont des orientations opposes si detB (B ) = 1.
Orienter E, cest choisir lensemble des bases orthonormes qui ont la mme orientation quune base orthonorme fixe, de rfrence. Ces bases sont alors dites bases
orthonormes directes.
Les autres bases orthonormes sont dites bases orthonormes indirectes.
Remarques
Les matrices de passage entre bases orthonormes directes de E sont exactement les matrices
orthogonales de dterminant 1, i.e., les lments de SO(n) : si B est une base orthonorme
directe de E et P Mn (R) est la matrice dune famille F de vecteurs de E dans la base B, alors
P SO(n) si et seulement si F est une base orthonorme directe de E.

changer deux vecteurs dune base orthonorme, ou changer le sens dun de ses vecteurs,
change son orientation (cest--dire son caractre direct ou indirect), daprs les proprits du
dterminant.
On dfinit une relation entre bases orthonormes de E de la faon suivante : si B et B sont
deux bases orthonormes de E, on a B B si, par dfinition, B et B ont la mme orientation. Le
fait que SOn (R) contienne In et soit stable par produit et passage linverse permet de montrer
que est une relation dquivalence. Il y a exactement deux classes dquivalence ; orienter E
revient choisir lune de ces deux classes, ses lments sont les bases orthonormes directes de
E.
Dfinition Orientation dune droite ou dun plan
Soit E un espace euclidien orient de dimension 3.
Si F est une droite vectorielle ou un plan vectoriel de E, on peut orienter F comme
tout espace euclidien, par le choix dune base orthonorme de F .
Si P est un plan vectoriel, on peut aussi orienter P par le choix dun vecteur unitaire
a normal P : une base orthonorme (i,j) de P est dite directe si (i,j,a) est une base
orthonorme directe de E, sinon, elle est dite indirecte.

297

2.

Produit mixte, produit vectoriel


Proprit/Dfinition Produit mixte
Soient B et B deux bases orthonormes directes dun espace euclidien orient E de
dimension n = 2 ou n = 3.
Alors, pour toute famille (x1 , . . . ,xn ) de vecteurs de E, on a
detB (x1 , . . . ,xn ) = detB (x1 , . . . ,xn ).
Autrement dit, le dterminant de (x1 , . . . ,xn ) ne dpend pas de la base orthonorme
directe choisie pour le calculer.
Ce dterminant est appel produit mixte de la famille (x1 , . . . ,xn ), et not [x1 , . . . ,xn ].

Dmonstration Soit M la matrice de (x1 , . . . ,xn ) dans la base B, M sa matrice dans la base
B et P la matrice de passage de B B . Alors, daprs les formules de changement de bases,
M = P M , do
det(M ) = det(P ) det(M ) = det(M )
car P est une matrice de passage entre bases orthonormes directes, donc P SOn (R). On en
dduit le rsultat car
detB (x1 , . . . ,xn ) = det(M ) et detB (x1 , . . . ,xn ) = det(M ).

Interprtation gomtrique


Si u et v sont deux vecteurs de R2 , [u,v] est laire du paralllogramme form sur u et v.


De mme, si u, v et w sont trois vecteurs de R3 , [u,v,w] est le volume du paralllpipde
rectangle form sur u, v et w.

On a immdiatement :
Proprit

Soit E un espace euclidien orient de dimension 3. Alors :


changer deux vecteurs dans un produit mixte change le signe du produit mixte.
Le produit mixte [u,v,w] est nul si et seulement si la famille (u,v,w) est lie.
Une base orthonorme (e1 ,e2 ,e3 ) de E est directe si et seulement si [e1 ,e2 ,e3 ] = 1.
On a les proprits analogues en dimension 2.

Proprit/Dfinition Produit vectoriel


Soit E un espace euclidien orient de dimension 3.
Pour tout (u,v) E 2 , il existe un unique vecteur de E, not u v, tel que
x E, [u,v,x] = (u v | x) .

(1)

Le vecteur u v est appel produit vectoriel de u et v.


Dmonstration Par linarit du dterminant par rapport sa troisime variable, lapplication
x 7 [u,v,x] est une forme linaire sur E. Le thorme de reprsentation des formes linaires sur
un espace euclidien entrane lexistence et lunicit du vecteur vrifiant (1).

298

Proprit
Soit E un espace euclidien orient de dimension 3 et B = (e1 ,e2 ,e3 ) une base orthonorme directe de E. Soient u = u1 e1 + u2 e2 + u3 e3 E et v = v1 e1 + v2 e2 + v3 e3 E.
Alors
u v = (u2 v3 u3 v2 )e1 + (u3 v1 u1 v3 )e2 + (u1 v2 u2 v1 )e3 .
En particulier, dans E = M3,1 (R),

u1
v1
u2 v3 u3 v2
u2 v2 = u3 v1 u1 v3 .
u3
v3
u1 v2 u2 v1

On peut toujours se ramener ce cas en raisonnant en coordonnes dans une base


orthonorme directe de E.
Dmonstration Pour tout x = x1 e1 + x2 e2 + x3 e3 E,


u1 v1 x1


[u,v,x] = detB (u,v,x) = u2 v2 x2 .
u3 v3 x3

En dveloppant ce dterminant par rapport la dernire colonne, on a


[u,v,x] = (u2 v3 u3 v2 )x1 (u1 v3 u3 v1 )x2 + (u1 v2 u2 v1 )x3 .
La base B tant orthonorme, on reconnat le produit scalaire entre
(u2 v3 u3 v2 )e1 + (u3 v1 u1 v3 )e2 + (u1 v2 u2 v1 )e3
et x. Cette galit tant vraie pour tout x, et u v tant lunique vecteur la vrifier pour tout
x, on a le rsultat.

Proprit
Soit E un espace euclidien orient de dimension 3 et (u,v) E 2 .
Alors :
1. u v = v u.
2. Les applications x 7 u x et x 7 x v sont des endomorphismes de E.
3. La famille (u,v) est libre si et seulement si u v 6= 0E .
4. Le vecteur u v est orthogonal u et v.
Si u et v sont indpendants, u v est un vecteur normal au plan vectoriel Vect(u,v).
5. Si (e1 ,e2 ,e3 ) est une base orthonorme directe de E, on a
e1 e2 = e3 , e2 e3 = e1 , e3 e1 = e2 .
Si (e1 ,e2 ) est une famille orthonorme de E, alors (e1 ,e2 ,e1 e2 ) est une base orthonorme directe de E.
6. Pour tout w E, on a la formule : u (v w) = (u | w) v (u | v) w.
Dmonstration
1. Pour tout x E, par antisymtrie du dterminant,
[u,v,x] = [v,u,x] = (v u | x) = ( v u | x) .
Ceci tant vrai pour tout x E, on a u v = v u.
299

2, 6 et premire partie de 5. Cest immdiat en revenant aux coordonnes dans une base orthonorme directe.
Quant la deuxime partie du point 5, compltons (e1 ,e2 ) en base orthonorme directe (e1 ,e2 ,e3 )
de E (ce qui est possible en compltant dabord en base orthonorme de E puis ventuellement
en changeant le sens du troisime vecteur choisi). Daprs ce qui prcde, on a e1 e2 = e3 , do
le rsultat.
3. Si (u,v) est lie, alors pour tout x E, [u,v,x] = 0, et donc (u v | x) = 0. On en dduit que
u v = 0E .
Si (u,v) est libre, on peut la complter en une base (u,v,w) de E, et donc [u,v,w] 6= 0, cest--dire,
(u v | w) 6= 0, ce qui entrane que u v 6= 0E .
4. On a
(u v | u) = [u,v,u] = 0
car la famille (u,v,u) contient deux fois le mme vecteur. Donc u v est orthogonal u. On
procde de mme pour v.
Si (u,v) est libre, u v est un vecteur non nul orthogonal u et v, donc orthogonal au plan
Vect(u,v). Cest donc un vecteur normal Vect(u,v).


3.

Classification des isomtries vectorielles en dimension 2


Thorme Dtermination des lments de O2 (R) et SO2 (R)
On a
O2 (R) =


|


 


cos() sin()
cos() sin()
; R
; R .
sin() cos()
sin() cos()
{z
} |
{z
}
= SO2 (R)

={M O2 (R); det(M )=1}

Dmonstration Il est immdiat que les matrices ci-dessus sont lments de O2 (R), car leurs
colonnes forment une famille orthonorme de M2,1 (R) pour le produit scalaire canonique, daprs
la formule cos2 + sin2 = 1. De plus, pour tout R,




cos() sin()
cos() sin()
det
= 1 et det
= 1.
sin() cos()
sin() cos()
Rciproquement, soit
M=

a c
b d

O2 (R).

2 = 1. En particulier, a2 6 1, donc a [1,1],


Sa premire colonne est de norme 1, donc a2 + b
et il existe R tel que a = cos(). Alors b = 1 a2 = sin(), mais quitte changer en
, ce qui ne modifie pas la valeur de cos(), on peut supposer que b = sin().
La deuxime colonne de M est orthogonale la premire. Or, (a,b) = (cos(), sin()) 6= (0,0),
donc



cos()
Vect
sin()


sin()
, et ainsi
est une droite vectorielle ; or elle contient le vecteur non nul
cos()






cos()
sin()
Vect
= Vect
.
sin()
cos()
En particulier, il existe R tel que
 


c
sin()
=
.
d
cos()
300

Enfin,


cos() sin()
det(M ) = det
= .
sin() cos()

Or det(M ) = 1 ; on obtient les formes indiques dans chaque cas.

Dfinition
Soit R. La matrice

R() =


cos() sin()
sin() cos()

est appele matrice de rotation dangle de mesure .

On remarquera que, pour (, ) R2 , R() = R( ) si et seulement si 2Z. Ainsi,


SO2 (R) = {R(); R} = {R(); ],]} .

Proprit
Pour tout (, ) R2 , R()R( ) = R( + ).
SO2 (R) est commutatif pour le produit matriciel : pour tout (A,B) (SO2 (R))2 , on
a AB = BA.
Dmonstration
On a

R()R( ) =



cos() sin()
cos( ) sin( )
sin() cos()
sin( ) cos( )


cos() cos( ) sin() sin( ) cos() sin( ) sin() cos( )
=
sin() cos( ) + cos() sin( ) sin() sin( ) + cos() cos( )


cos( + ) sin( + )
=
= R( + ).
sin( + ) cos( + )

Soit (A,B) (SO2 (R))2 . Daprs le thorme prcdent, il existe (, ) R2 tel que A = R()
et B = R( ). Alors daprs le premier point,
AB = R()R( ) = R( + ) = R( + ) = R( )R() = BA.
Thorme Classification des isomtries vectorielles en dimension 2
Soit E un plan euclidien orient.
1. Soit u O(E) vrifiant det(u) = 1 (i.e., une rotation de E).
Alors, il existe R tel que la matrice de u dans toute base orthonorme directe de
E soit R(). Le rel nest pas unique, mais unique modulo 2.
On dit que est une mesure de langle de la rotation u.
On retrouve facilement les mesures de langle dune rotation u de E laide des
formules suivantes, valables pour tout vecteur unitaire x0 E :
cos() =

1
Tr(u) = (x0 | u(x0 ))
2

et

sin() = [x0 ,u(x0 )].

2. Soit u O(E) vrifiant det(u) = 1.


Alors u est la symtrie par rapport Ker(u Id) paralllement Ker(u Id) (i.e.,
la rflexion par rapport Ker(u Id)).
Dans toute base adapte la dcomposition E = Ker(u Id) Ker(u Id) , la matrice
de u est


1 0
.
0 1

301

Dmonstration
1. Si u O(E) vrifie det(u) = 1, sa matrice dans une base orthonorme directe B = (e1 ,e2 ) est
un lment de SO2 (R), donc il existe R tel que MatB (u) = R(). Si B = (1 ,2 ) est une
autre base orthonorme directe de E, alors la matrice de passage P de B B est un lment de
SO2 (R), donc daprs les formules de changement de base et la commutativit de SO2 (R),
MatB (u) = P 1 MatB (u)P = P 1 P MatB (u) = MatB (u) = R().
La matrice de u dans toute base orthonorme directe de E est donc R(). Le rel est unique
modulo 2 car R() = R( ) si et seulement si 2Z.
On a alors
1
Tr(u) = Tr(R()) = 2 cos(), do cos() = Tr(u).
2
Soit x0 = e1 + e2 un vecteur unitaire de E. Alors la matrice colonne des coordonnes de u(x0 )
dans la base B est
  


cos() sin()
R()
=
.

sin() + cos()

La base B tant orthonorme,

(x0 | u(x0 )) = ( cos() sin()) + ( sin() + cos()) = (2 + 2 ) cos() = cos()


car x0 est unitaire et B orthonorme. De plus,


cos() sin()
= ( sin() + cos()) ( cos() sin()) = sin().
[x0 ,u(x0 )] =
sin() + cos()

2. Si u O(E) vrifie det(u) = 1, sa matrice dans la base orthonorme directe B est un lment
de O2 (R) de dterminant 1, donc il existe R tel que


cos() sin()
MatB (u) =
.
sin() cos()

Alors
2

MatB (u) =

2
cos() sin()
= I2 ,
sin() cos()

donc u est une symtrie. On sait que u est diagonalisable avec Sp(u) {1,1}, mais sachant
que dim(E) = 2 et que det(u) = 1, on a Sp(u) = {1,1}, les valeurs propres 1 et 1 tant
simples. Les espaces propres Ker(u Id) et Ker(u + Id) sont donc des droites vectorielles. Enfin,
ils sont orthogonaux, car si x Ker(u Id) et y Ker(u + Id), alors par conservation du produit
scalaire,
(x | y) = (u(x) | u(y)) = (x | y) = (x | y) ,

et donc (x | y) = 0. Ainsi, u est la symtrie par rapport la droite Ker(u Id) paralllement
la droite Ker(u + Id) = Ker(u Id) . Lcriture matricielle dans toute base adapte la
dcomposition E = Ker(u Id) Ker(u Id) est alors immdiate.

Proprit
Soit E un plan euclidien orient et (, ) R2 . Soit u la rotation dangle de mesure
et u la rotation dangle de mesure .
Alors u u = u u est la rotation dangle de mesure + .

Dmonstration Il suffit de raisonner matriciellement dans une base orthonorme directe de E.


La matrice de u dans cette base est R(), celle de u , R( ). Or, daprs une proprit donne
plus haut,
R()R( ) = R( )R() = R( + ),
do le rsultat.


302

Proprit criture complexe dune rotation


Soit E un plan euclidien orient et B = (e1 ,e2 ) une base orthonorme directe de E. On
identifie E C, grce lapplication bijective

E C
:
e1 + e2 7 + i
Alors la rotation u dangle de mesure a pour expression complexe
z 7 ei z,
cest--dire que pour tout x E, (u(x)) = ei (x).
Dmonstration Pour tout x = e1 + e2 E, le vecteur-colonne des coordonnes de u(x) dans
la base B est
  


cos() sin()
R()
=
,

sin() + cos()

et donc

De plus,

(u(x)) = [ cos() sin()] + i[ sin() + cos()].


ei (x) = [cos() + i sin()][ + i],

ce qui donne le mme rsultat aprs dveloppement.

4.

Rduction des isomtries vectorielles en dimension 3


Thorme Rduction des isomtries vectorielles en dimension 3
Soit E un espace euclidien orient de dimension 3. Soit u O(E) ; on note = det(u)
( = 1 ou = 1).
On est dans lun et un seul des cas suivants :
1. u = Id.
2. Lensemble Ker(u Id) est une droite vectorielle. En notant D cette droite, alors
le plan D est stable par u et lendomorphisme de D induit par u est une rotation.
Si a est un vecteur unitaire dirigeant la droite D, alors en orientant D par le choix
du vecteur normal a, on peut considrer une mesure de langle de cette rotation. La
matrice de u dans toute base orthonorme directe de E de la forme (e1 ,e2 ,a) est alors

cos() sin() 0
sin() cos() 0 .
0
0

Pour les rotations ( = 1) : D est lensemble des vecteurs invariants par u ; on dit
que u est une rotation daxe D, et, D tant orient par a, que est une mesure de
langle de u.
On dtermine alors entirement (modulo 2) par les formules suivantes, dans lesquelles x0 dsigne un vecteur unitaire orthogonal a :
Pour dterminer cos() :

Tr(u) = 2 cos() + 1,

Pour dterminer sin() :

cos() = (x0 | u(x0 )) ,

x0 u(x0 ) = (sin()) a,

sin() = [x0 ,u(x0 ),a].

Enfin, pour tout x E, limage de x par u est donne explicitement par la formule
u(x) = cos()[x (a | x) a] + sin() a x + (a | x) a.

303

Dmonstration Si u O(E), u est un polynme unitaire de degr 3, donc dfinit une fonction
continue de limite en et + en +. Daprs le thorme des valeurs intermdiaires,
u possde (au moins) une racine relle, cest--dire que u possde (au moins) une valeur propre
relle. Soit Sp(u) et x un vecteur propre associ. Par conservation de la norme, ku(x)k = kxk,
cest--dire, || kxk = kxk. Le vecteur x est non nul, donc || = 1, et = 1.
Le polynme caractristique de u est scind sur C, de degr 3 et coefficients rels, donc, sil
possde des racines complexes non relles, elles sont au nombre de 2 et complexes conjugues,
on les notera et . On a alors = ||2 > 0.
Cas = 1 : Le dterminant de u, qui vaut 1, est le produit des racines complexes de u , donc 1
doit tre valeur propre de u (les diffrents triplets possibles de racines de u sont, lordre prs,
(1,1,1), (1, 1, 1), (1,,) avec C \ R).
Soit a un vecteur propre unitaire de u associ a valeur propre 1. On note D = Vect(a)
et P = D . Sachant que D est stable par u et que u O(E), on sait que P est stable par u.
De plus, u conserve le produit scalaire sur E et donc par restriction, sur P . Ainsi, u|P est une
isomtrie vectorielle du plan P . De plus, dans toute base B = (e1 ,e2 ,a) adapte la dcomposition
E = P D,


Mat(e1 ,e2 ) (u|P ) 0
MatB (u) =
,
0
1

donc

1 = det(u) = det(u|P ) 1,

ce qui entrane finalement que u|P est une rotation de P .


On oriente P par le choix du vecteur normal a. Daprs le paragraphe prcdent, il existe
R tel que dans toute base orthonorme directe de P , la matrice de u|P soit R(). La matrice
de u dans toute base orthonorme directe de E de dernier vecteur a est donc

cos() sin() 0
M = sin() cos() 0 .
0
0
1

Le polynme caractristique de u est alors



(X cos())2 + sin()2 (X 1) = (X 2 2 cos()X + 1)(X 1).

Si cos() = 1, M = I3 et u = Id. Sinon, 1 est valeur propre simple de u et en particulier,


Ker(u Id) est une droite vectorielle. Dans ce cas, on a D = Ker(u Id) (inclusion et mme
dimension) et la description annonce.
De plus,
Tr(u) = Tr(M ) = 2 cos() + 1,
et on dmontre les autres formules en raisonnant en coordonnes dans une base orthonorme
directe (e1 ,e2 ,a) de E : soit x0 = e1 + e2 un vecteur unitaire orthogonal a ; les coordonnes
de u(x0 ) dans la base (e1 ,e2 ,a) sont



cos() sin()
cos() sin() 0

M = sin() cos() 0 = sin() + cos() ,


0
0
0
1
0
0

donc

(x0 | u(x0 )) = ( cos() sin()) + ( sin() + cos()) = (2 + 2 ) cos() = cos()


car 2 + 2 = kx0 k2 = 1. De plus, la matrice colonne des coordonnes de x0 u(x0 ) dans la base
(e1 ,e2 ,a) est

cos() sin()
0
0
sin() + cos() = (2 + 2 ) 0 = 0 ,
0
0
sin()
sin()
304

donc x0 u(x0 ) = (sin()) a. Par dfinition, on a alors


[x0 ,u(x0 ),a] = (x0 u(x0 ) | a) = sin() (a | a) = sin().
Enfin, la formule
u(x) = cos()[x (a | x) a] + sin() a x + (a | x) a

est vraie pour x = e1 , x = e2 et x = a : par exemple,


u(e1 ) = cos()e1 + sin()e2

= cos()[e1 (a | e1 ) a] + sin() a e1 + (a | e1 ) a
car (a | e1 ) = 0 et a e1 = e2 ; on procde de mme pour u(e2 ) et u(a). Sachant que (e1 ,e2 ,a)
est une base de E et que les deux membres de lgalit dmontrer dfinissent des applications
linaires, lgalit est vraie pour tout x E.
Cas = 1 : On raisonne de faon analogue en remplaant la valeur propre 1 par 1 ; avec
des notations semblables, il existe R tel que dans toute base orthonorme directe de E de
dernier vecteur a, la matrice de u soit

cos() sin() 0
0 .
M = sin() cos()
0
0
1

Si cos() = 1, M = I3 et u = Id. Sinon, 1 est valeur propre simple de u, Ker(u + Id) est
une droite vectorielle.


Remarques
Dans le cas dune rotation, changer lorientation de laxe revient changer en .
Si u O(E) vrifie det(u) = 1 avec u 6= Id, u est soit la rflexion par rapport D
(symtrie par rapport D , paralllement D), soit la compose (commutative) dune rotation
daxe D et dune rflexion par rapport D .
Exemple Lespace R3 tant orient et muni du produit scalaire canonique, soit

R3 R3
u:
(x,y,z) 7 (y,z,x)
La matrice de u dans la base canonique (qui est

M= 0
1

orthonorme) est

1 0
0 1 .
0 0

Elle est orthogonale de dterminant 1, donc u est une rotation. Pour dterminer son axe D, on
rsout lquation u(x) = x, ce qui quivaut
x Vect(a),

1
o a = (1,1,1).
3

On oriente D par le choix du vecteur normal a. Alors, si est une mesure de langle de u,
0 = Tr(u) = 2 cos() + 1,
donc cos() = 1/2. Il reste dterminer le signe de sin(). Soit x = (1, 1,0) D . Alors la
matrice colonne des coordonnes de x u(x) dans la base canonique est

1
1
1 0 ,
0
1

dont le premier coefficient est 1. Donc x u(x), dont on sait quil est colinaire a, est de sens
oppos a. On en dduit que sin() < 0, et donc, on peut choisir = 4/3 (ou 2/3).
305

306

Chapitre 16

Fonctions vectorielles
Arcs paramtrs
Dans ce chapitre, n est un entier strictement positif, I dsigne un intervalle de R (non vide et
non rduit un point), et (sauf indication contraire) f dsigne une application dfinie sur I,
valeurs dans Rn .

I.

Drivation des fonctions valeurs vectorielles

1.

Dfinition et premires proprits


Dfinition Drivabilit en un point
Soit a I. On dit que f est drivable en a si la fonction
x 7

f (x) f (a)
,
xa

dfinie sur I \ {a}, possde une limite en a.


Dans ce cas, cette limite, qui est un vecteur de Rn , est appele vecteur driv de f
en a, not
df
(a).
f (a) ou
dx
Remarque La drivabilit de f en a quivaut au fait que la fonction
h 7

f (a + h) f (a)
,
h

dfinie sur {h 6= 0 ; a + h I}, possde une limite en 0.


Dfinition
Soit a I. On dit que f est :

f (x) f (a)
xa
possde une limite gauche en a. Dans ce cas, cette limite est note f (a ).
f (x) f (a)
drivable droite en a si a est intrieur I ou a = inf I, et si x 7
xa
possde une limite droite en a. Dans ce cas, cette limite est note f (a+ ).
drivable gauche en a si a est intrieur I ou a = sup I, et si x 7

Remarque Si n = 1, on retrouve la dfinition dj connue pour les fonctions valeurs relles.


Le quotient
f (x) f (a)
xa
307

est le taux daccroissement de f entre a et x, et f (a) est le coefficient directeur de la tangente


la courbe reprsentative de f dans un repre au point dabscisse a.
Cette tangente a pour quation y = f (a)(x a) + f (a).
Exemple La fonction f : x 7 (x,x2 ,x3 ) est drivable en tout point de R, et pour tout a R,
f (a) = (1,2a,3a2 ).

On remarque que pour f : I Rn , former le quotient


f (x) f (a)
xa
revient former le vecteur contenant les taux daccroissement de chaque fonction-coordonne de
f . Ceci suggre une formule de drivation composante par composante, dont la dmonstration
est immdiate :
Proprit Drivation composante par composante
crivons f = (f1 , . . . ,fn ) o les fi : I R sont les fonctions-coordonnes de f dans la
base canonique.
Soit a I. Pour que f soit drivable en a, il faut et il suffit que pour tout i [[1,n]],
fi soit drivable en a. Dans ce cas,
f (a) = (f1 (a), . . . ,fn (a)).
La proprit suivante montre le lien entre la drivabilit en un point a et le fait de possder
un dveloppement limit lordre 1 en a :
Proprit Lien avec lexistence dun dveloppement limit
Soit a I et b Rn . Les proprits suivantes sont quivalentes :
f est drivable en a et f (a) = b.
f admet le dveloppement limit f (x) = f (a) + b(x a) + o(x a) en a.
Notation La notation o(x a) reprsente une fonction x 7 (x a) (x) o : I Rn a pour
limite (0, . . . ,0) en a.
Dmonstration La fonction f est drivable en a avec f (a) = b si et seulement si
f (x) f (a)
b,
xa
xa
cest--dire, si et seulement si
f (x) f (a)
= b + o(1).
xa
xa

Ceci quivaut au fait que f (x) = f (a) + b(x a) + o(x a) lorsque x a.

Corollaire
Si f est drivable en a, elle est continue en a. La rciproque est fausse.
Dmonstration Si f est drivable en a, elle possde un dveloppement limit lordre 1 en a :
f (x) = f (a) + f (a)(x a) + o(x a). Lorsque x tend vers a, f (x) tend vers f (a), do le rsultat.
Lexemple de la fonction t 7 (|t|,0, . . . ,0) montre que la rciproque est fausse.

308

2.

Oprations sur les fonctions drivables


Proprit Combinaison linaire et produit
Soient f : I Rn , g : I Rn et : I R trois fonctions drivables en a I. Soit
R. Alors :
La fonction f + g est drivable en a et (f + g) (a) = f (a) + g (a).
La fonction f est drivable en a et (f ) (a) = (a)f (a) + (a)f (a).

Dmonstration
Le premier point est vident par combinaison linaire de limites.
Le cas du produit f est une consquence dune proprit plus gnrale (voir ci-dessous) sur
la drivation des fonctions du type B(f1 ,f2 ) o B est une application bilinaire (dans notre cas,
le produit), et f1 , f2 sont deux fonctions drivables en a I.

Proprit Composition par une application linaire ou bilinaire
Soient p N et L : Rn Rp une application linaire.
Si f : I Rn est drivable en a I, alors L f : I Rp est drivable en a et
(L f ) (a) = L(f (a)).
Soient (m,p) (N )2 , f : I Rn et g : I Rm deux fonctions, et B : Rn Rm Rp
une application bilinaire.
Si f et g sont drivables en a I, alors B(f, g) : I Rp est drivable en a et
B(f, g) (a) = B(f (a), g(a)) + B(f (a), g (a)).
Dmonstration
Pour tout x I diffrent de a, par linarit de L, on a


(L f )(x) (L f )(a)
f (x) f (a)
=L
.
xa
xa
Or, f tant drivable en a,

f (x) f (a)
f (a).
xa
xa
De plus, L est une application linaire sur un espace de dimension finie, elle est donc continue.
Il en rsulte que
(L f )(x) (L f )(a)
L(f (a)),
xa
xa
do le rsultat.
Pour tout x I diffrent de a, par bilinarit de B, on a
B(f (x), g(x)) B(f (a), g(x)) + B(f (a), g(x)) B(f (a), g(a))
B(f, g)(x) B(f, g)(a)
=
xa
xa




f (x) f (a)
g(x) g(a)
=B
, g(x) + B f (a),
.
xa
xa

Or, f et g tant drivables (et en particulier continues) en a,

f (x) f (a)
g(x) g(a)
f (a) et
g (a).
xa
xa
xa
xa
Lapplication B est bilinaire sur Rn Rm , elle est donc continue, do
g(x) g(a),
xa

B(f, g)(x) B(f, g)(a)


B(f (a), g(a)) + B(f (a), g (a)),
xa
xa
ce qui prouve le rsultat.
309

Corollaire Cas dun produit scalaire et dun dterminant


Soit ( | ) un produit scalaire sur Rn . Soient f : I Rn et g : I Rn deux fonctions
drivables en a I. Alors :
La fonction (f | g) est drivable en a avec


(f | g) (a) = f (a) | g(a) + f (a) | g (a) .

La fonction kf k2 est drivable en a avec


(kf k2 ) (a) = 2 f (a) | f (a) .

Si n = 2 et B est une base de R2 , la fonction detB (f,g) est drivable en a avec


(detB (f,g)) (a) = detB (f (a),g(a)) + detB (f (a),g (a)).
Dmonstration Le premier et le troisime point sont immdiats car un produit scalaire et le
dterminant sont bilinaires. Pour le second point, il suffit de remarquer que kf k2 = (f | f ) et
dappliquer le premier point ainsi que la symtrie du produit scalaire.

Proprit Composition
Soit : J I une fonction o J est un intervalle de R. Soit f : I Rn une fonction.
Si est drivable en a J et si f est drivable en (a), alors f est drivable en a
et
(f ) (a) = (a) (f )(a).
Dmonstration On raisonne laide dun dveloppement limit lordre 1 de en a,
(x) = (a) + (a)(x a) + (x a) (x),
et de f en (a),
f (y) = f ((a)) + f ((a))(y (a)) + (y (a)) (y).
En appliquant cette dernire galit avec y = (x), on obtient, pour x J,

f ((x)) = f ((a)) + f ((a)) (a)(x a) + (x a) (x)


+ (a)(x a) + (x a)(x) (a) + (a)(x a) + (x a) (x) .

Lorsque x tend vers a, (a) + (a)(x a) + (x a) (x) (a) et donc



(a) + (a)(x a) + (x a) (x) 0.

En rassemblant les termes, on obtient donc une fonction h : J Rn telle que h(x) (0, . . . ,0)
xa
et
f ((x)) = f ((a)) + f ((a)) (a) (x a) + (x a)h(x).
On en dduit le rsultat.

3.

Fonction drive
Dfinition
Si f est drivable sur I (cest--dire en tout point de I), la fonction x 7 f (x) est
appele fonction drive de f , note f .

310

Bien sr, la proprit de drivation composante par composante, et les oprations sur les
fonctions drivables en un point se traduisent pour les fonctions drivables sur un intervalle.
En raisonnant composante par composante, on obtient :
Proprit Drivation et fonctions constantes
Soit f : I Rn une fonction drivable.
Pour que f soit constante sur I, il faut et il suffit que f = 0.

II.

Drives dordre suprieur


Dfinition Classe C k , drives dordre k

Sous rserve dexistence, on dfinit par rcurrence les drives successives de f par :
f (0) = f et f (k+1) = (f (k) ) , pour k N.
Pour k N , on dit que f est de classe C k sur I si f (k) existe et est continue sur I.
On dit que f est de classe C sur I si f est de classe C k sur I pour tout k > 1.
dk f
La fonction f (k) se note aussi
.
dxk

Proprit Classe C k composante par composante


crivons f = (f1 , . . . ,fn ) o les fi : I R sont les fonctions-coordonnes de f dans la
base canonique. Soit k N .
Alors, pour que f soit de classe C k (resp. C ) sur I, il faut et il suffit que pour tout
i [[1,n]], fi soit de classe C k (resp. C ) sur I. Dans ce cas, pour tout j [[1,k]] (resp.
j N ),
(j)
f (j) = (f1 , . . . ,fn(j) ).

Proprit Combinaison linaire


Soient f : I Rn et g : I Rn deux fonctions de classe C k (resp. C ) sur I, et R.
Alors f + g est de classe C k (resp. C ) sur I et pour tout j [[1,k]] (resp. j N ),
(f + g)(j) = f (j) + g(j) .
En particulier, lensemble C k (I,Rn ) (resp. C (I,Rn )) des fonctions de classe C k (resp.
C ) sur I valeurs dans Rn , est un R-espace vectoriel.

Proprit Composition par une application linaire


Soient p N et L : Rn Rp une application linaire. Si f : I Rn est de classe C k
(resp. C ) sur I, alors L f est de classe C k (resp. C ) sur I et pour tout j [[1,k]]
(resp. j N ),
(L f )(j) = L f (j) .
Dmonstration des trois proprits prcdentes - Elle se fait par rcurrences immdiates partir
des proprits correspondantes de drivation premire, donnes plus haut.

311

Thorme Formule de Leibniz


Soient (m,p) (N )2 , f : I Rn et g : I Rm deux fonctions, et B : Rn Rm Rp
une application bilinaire.
Si f et g sont de classe C k (resp. C ) sur I, alors B(f, g) est de classe C k (resp. C )
sur I et pour tout j [[1,k]] (resp. j N ),
(j)

B(f, g)

j  
X
j

i=0

B(f (i) , g(ji) ).

Dmonstration Elle est en tout point semblable la dmonstration de la formule du binme


de Newton ; elle se fait par rcurrence sur k. Tout dabord, B est bilinaire sur Rn Rm , donc
continue. Pour k = 1, le rsultat est immdiat daprs la proprit de drivation de B(f, g), et
car B(f, g) = B(f , g) + B(f, g ) est continue par composition et somme. De plus, on a bien

B(f, g) =

1  
X
1
i=0

B(f (i) , g(1i) ).

Supposons le rsultat vrai pour un certain entier k, et supposons f et g de classe C k+1 . Alors par
hypothse de rcurrence,
k  
X
k
B(f, g)(k) =
B(f (i) , g(ki) ).
i
i=0

Cette fonction est drivable sur I par oprations sur les fonctions drivables. De plus, par linarit
de la drivation et daprs la formule donnant la drive dune fonction de la forme B(u,v),
(k+1)

B(f, g)

k  
X
k

i=0
k 
X

(B((f (i) ) , g(ki) ) + B(f (i) , (g(ki) ) ))


k  
X
k
k
(i+1) (ki)
B(f (i) , g(ki+1) )
B(f
,g
)+
=
i
i
i=0
i=0


k+1
k  
X
X
k
k
(p) (kp+1)
=
B(f (i) , g(ki+1) )
B(f , g
)+
i
p1
p=1

i=0

grce au changement dindice p = i + 1 dans la premire somme. En rassemblant les termes


communs aux deux sommes, on a donc
(k+1)

B(f, g)

  
k 
X
k
k
+
B(f (i) , g(ki+1) ) + B(f, g(k+1) )
= B(f
, g) +
i1
i
i=1

k 
X
k+1
(k+1)
B(f (i) , g(ki+1) ) + B(f, g(k+1) )
= B(f
, g) +
i
i=1


k+1
X k+1
=
B(f (i) , g(k+1i) ),
i
(k+1)

i=0

qui est une fonction continue par composition et combinaison linaire. Ceci prouve le rsultat au
rang k + 1 et termine la dmonstration.

Remarque En reprenant cette dmonstration, il est immdiat que le rsultat est vrai pour les
fonctions valeurs complexes, lorsque B dsigne le produit : on retrouve la formule connue du
programme de premire anne.
312

Proprit Composition
Soit : J I une fonction avec J intervalle de R. Soit f : I Rn une fonction.
Si est de classe C k (resp. C ) sur J et si f est de classe C k (resp. C ) sur I, alors
f est de classe C k (resp. C ) sur J.
Dmonstration nouveau, cest une rcurrence immdiate base sur la formule donnant la
drive dune compose. En effet, si et f sont de classe C k+1 sur I, alors
(f ) = (f )
est de classe C k comme produit et compose dapplications de classe C k , et par hypothse de
rcurrence. Donc f est de classe C k+1 .

Remarque Les proprits concernant la combinaison linaire et la composition dapplications ont
leurs quivalents pour des fonctions valeurs dans C (lorsque cela a un sens, en ce qui concerne
la composition). On peut galement donner une proprit analogue sur le quotient de fonctions
valeurs dans C dont le dnominateur ne sannule pas. Pour tous ces rsultats, on renvoit au
cours de premire anne.

III.
1.

Arcs paramtrs
Dfinitions

Dfinition
Soit k N .
On appelle arc paramtr de classe C k (trac dans Rn ) tout couple = (I,f ) o I
est un intervalle de R et f : I Rn une fonction de classe C k .
Limage C = f (I) de f est aussi appele support de larc paramtr .
Dans toute la suite, sauf indication contraire, = (I,f ) dsigne un arc paramtr de classe C k
(k N ), de support C.

Sans soulever de question thorique, on notera M (t) le point de Rn tel que OM (t) = f (t), o O
dsigne lorigine du repre canonique de Rn . On identifie vecteur f (t) et point M (t).
Remarque Si le paramtre dcrivant lintervalle I est le temps, reprsente le mouvement dun
point dans Rn . La courbe C est alors la trajectoire de ce mouvement.

Cas particulier Lorsque pour tout t I, f (t) = (t,x(t)) o x : I R est une fonction de
classe C k , C est le graphe de la fonction x.
Exemple Les deux arcs paramtrs par

2
R R


1 t2 2t
f:
,
t 7
1 + t2 1 + t2

et

g:

],[ R2
7 (cos(), sin())

ont pour support le cercle unit de R2 priv du point (1,0). Deux arcs diffrents peuvent donc
avoir le mme support. Il faut bien distinguer un arc et son support.


Un point M de C peut tre associ plusieurs paramtres : on peut avoir OM = f (t1 ) = f (t2 )
avec t1 6= t2 . Pour cette raison, on distingue les notions de point de paramtre t, indissociable
de son paramtre, et de point gomtrique, qui dsigne llment de C correspondant. On parlera
plutt de point de dans le premier cas, et de point de C dans le second.
313

Dfinition

Un point M (t) de est dit simple sil existe un unique t I tel que OM (t) = f (t).
Sinon, il est dit multiple. Larc est dit simple si tous ses points sont simples, ce qui
quivaut au fait que f soit injective.
Larc est dit ferm si I est un segment [a,b] et si f (a) = f (b).
Dfinition Point rgulier
Un point M (t) de est dit rgulier si f (t) 6= (0, . . . ,0). Sinon, il est dit stationnaire
(ou singulier). Si tous les points de sont rguliers, on dit que est rgulier.
Attention ! Dans le cas dun point multiple, par exemple f (t1 ) = f (t2 ) avec t1 6= t2 , le point
M (t1 ) peut tre rgulier sans que M (t2 ) le soit.
Exemple Larc paramtr par
f:

[0,2] R2
7 (cos(), sin())

a pour support le cercle unit de R2 . Il est ferm et rgulier. Tous les points de son support
except (1,0) sont simples.
Il est important de comprendre que cet arc est diffrent de celui paramtr par

[0,4] R2
g:
7 (cos(), sin())
mme si ces deux arcs ont le mme support (dans le deuxime cas, le cercle est parcouru deux
fois).
Remarque Un arc (I,f ) de classe C 1 avec f de la forme t 7 (t, x(t)) ou t 7 (t, x(t), y(t)) est
toujours rgulier :
t I, f (t) = (1, x (t)) 6= (0,0) (ou f (t) = (1, x (t), y (t)) 6= (0,0,0)).
Proprit/Dfinition : Tangente en un point rgulier
Soit M (a) un point rgulier de et k k la norme euclidienne usuelle sur Rn . Alors

M (a)M (t)
f (a)

M (a)M (t) ta kf (a)k

et

t>a

M (a)M (t)
f (a)

.
M (a)M (t) ta kf (a)k
t<a

La droite passant par M (a) et dirige par le vecteur f (a) (ou par tout vecteur non nul
colinaire f (a)) est appele tangente en M (a).
Dmonstration Pour t voisin de a, on peut crire
f (t) = f (a) + f (a) (t a) + o(t a)
avec f (a) 6= (0, . . . ,0), et donc


M (a)M (t) = f (t) f (a) = f (a) (t a) + o(t a) = (t a) f (a) + o(1) .

En particulier, pour t > a assez proche de a, M (t) 6= M (a), et en utilisant lhomognit de la


norme, on a

f (a)
t a f (a) + o(1)
f (a) + o(1)
M (a)M (t)
=
=

.
M (a)M (t)
t a kf (a) + o(1)k
kf (a) + o(1)k ta kf (a)k
t>a

314

De mme, pour t < a, on a

f (a)
t a f (a) + o(1)
f (a) + o(1)
M (a)M (t)

=
=

.
M (a)M (t)
a t kf (a) + o(1)k
kf (a) + o(1)k ta kf (a)k

t<a

Remarques
Du point de vue cinmatique, f (t) est le vecteur vitesse (instantane) du point mobile M au
temps t. La proprit prcdente montre donc qu un instant t o la vitesse du point mobile est
non nulle, la trajectoire admet une tangente en M (t) dirige par le vecteur vitesse en ce point.
De mme, si est de classe C 2 , f (t) est le vecteur acclration de M au temps t.

La dmonstration prcdente montre que la tangente en un point rgulier M (a) est la
limite de la droite (M (a)M (t)) lorsque t a avec t 6= a.

2.

tude locale des arcs plans

La situation est donc assez simple concernant les points rguliers. On cherche maintenant
dcrire plus prcisment lallure de la courbe au voisinage dun point. Pour cela il est naturel de
pousser le dveloppement limit aux ordres suivants.
On suppose que n = 2 (on considre un arc plan). Notons f = (x,y), cest--dire que x et
y sont les fonctions-coordonnes de f . Alors x et y sont de classe C k sur I de mme que f . La
formule de Taylor-Young permet dcrire un dveloppement limit de x et y en a I lordre
k, et donc dobtenir un dveloppement limit de f de la forme
f (t) =

ta

k
X
f (j) (a)
j=0

j!

(t a)j + (t a)k (t),

o : I R2 a pour limite (0,0) en a.


Supposons maintenant quil existe deux entiers p et q avec 1 6 p < q 6 k tels que :
Pour tout j [[1,p 1]], f (j) (a) = (0,0),
Pour tout j [[p + 1,q 1]], (f (p) (a),f (j) (a)) est lie.
(f (p) (a),f (q) (a)) est libre.

Les entiers p et q sont alors uniques, on dit que p et q sont les entiers caractristiques de
en a.
On a alors ncssairement f (p) (a) 6= (0,0). Daprs la seconde condition, il existe donc (lorsque
p + 1 6 q 1) des scalaires p+1 , . . . ,q1 tels que pour tout j [[p + 1,q 1]],
f (j) (a) = j f (p) (a).
En tronquant le dveloppement limit prcdent lordre q, on obtient un dveloppement limit
de la forme
!
q1
X
(t a)jp
(t a)q
(t a)p
(p)
j
1+
+ f (q) (a)
+ (t a)q (t);
f (t) = f (a) + f (a)
ta
p!
j!
q!
j=p+1
|
{z
}
= o(1)

notamment, pour t 6= a proche de a, on a M (t) 6= M (a) car f (p) (a) 6= (0,0). De plus

M (a)M (t)
f (p) (a)

,
(t a)p ta
p!

kf (p) k(a)
M (a)M (t)

|t a|p ta
p!

t6=a

et donc

f (p) (a)
M (a)M (t)
,
(p)
M (a)M (t) ta kf (a)k
t>a

t6=a

M (a)M (t)
f (p)(a)
.
(1)p (p)
M (a)M (t) ta
kf (a)k
t<a

315

La droite passant par M (a) et dirige par le vecteur f (p) (a) est ici aussi appele tangente
en M (a). Le cas dun point rgulier correspond au cas o p = 1.
De plus, pour tout t I, le vecteur (t) peut tre dcompos sur la base (f (p) (a), f (q) (a)) de
R2 . Finalement, dans le repre (M (a),f (p) (a),f (q) (a)), et pour t I proche de a, le point M (t)
a pour coordonnes



1
(t a)p
p
p
+ o(1)
+ o((t a) ) (t a)
p!
p!
=





(t a)q
1
q
q
(t a)
+ o(1)
+ o((t a) )
q!
q!

Pour t 6= a assez proche de a, la premire coordonne est du signe de (t a)p , la seconde, du


signe de (t a)q .

Finalement, en dterminant p et q, on peut dcrire lallure de la courbe au voisinage de M (a),


selon la parit de p et q :
Si p est impair, q pair :

Si p est impair, q impair :

On dit que M (a) est un point ordinaire.

On dit que M (a) est un point dinflexion.

f (q) (a)

f (q) (a)

f (p) (a)

f (p) (a)

Si p est pair, q pair :

Si p est pair, q impair :

On dit que M (a) est un point de rebroussement de premire espce.

On dit que M (a) est un point de rebroussement de deuxime espce.

f (q) (a)

f (q) (a)

f (p) (a)

f (p) (a)

Exemple Soit larc paramtr par



R R2

f:
t 7 t2 + cos(t), t sin(t)
La fonction f est de classe C sur R. Pour tout t R,

f (t) = (2t sin(t), 1 cos(t)) .


On en dduit facilement que tous les points sont rguliers, sauf le point (1,0) de paramtre 0.
316

Effectuons un dveloppement limit des fonctions-coordonnes de f en 0 :

1
1 + t2 + o(t3 )

2
f (t) =
=

1
3
3
t sin(t)
t + o(t )
6
M (0)

!
1
0
1
+ 2 t2 + 1 t3 + o(t3 ).
=
0
0
6




1
1
, 0 et 0,
sont indpendants, donc p = 2 et q = 3. Il sagit dun point de
Les vecteurs
2
6
rebroussement de premire espce.

Remarque Avec les notations prcdentes, supposons que x(p) (a) 6= 0. Le vecteur M (a)M (t) a
pour coordonnes
(x(t) x(a), y(t) y(a))
t2 + cos(t)

avec

x(p) (a)
(t a)p
ta
p!
y (p) (a)
y(t) y(a) =
(t a)p + o((t a)p ).
ta
p!
x(t) x(a)

On a notamment x(t) 6= x(a) pour t 6= a assez proche de a, et la droite (M (a)M (t)) a pour pente
y(t) y(a)
y (p) (a)
(p) ,
x(t) x(a) ta x (a)
qui est la pente de la tangente en M (a). De mme, daprs la formule de Taylor-Young,
x (t)

ta

y (t) =

ta

x(p) (a)
(t a)p1
(p 1)!

y (p) (a)
(t a)p1 + o((t a)p1 ).
(p 1)!

On a notamment x (t) 6= 0 pour t 6= a assez proche de a, et la tangente en M (t) a pour pente


y (p) (a)
y (t)
.

x (t) ta x(p) (a)


On retiendra que lorsque les entiers caractristiques existent avec x(p) (a) 6= 0, la considration
de lun des quotients
y(t) y(a)
y (t)
ou
x(t) x(a)
x (t)

permet de dterminer la pente de la tangente en M (a). Si x(p) (a) = 0 alors y (p) (a) 6= 0 et on
peut raisonner de mme avec les quotients inverses pour obtenir linverse de la pente.

3.

Branches infinies

On suppose que n = 2 ; on note f = (x,y). On sintresse aux droites qui donnent la direction de la courbe C lorsque le paramtre t tend vers a, point adhrent I ou .
Dfinition Branche infinie
On dit que possde une branche infinie en a si kf (t)k +.
ta

On peut distinguer t a et t a+ .

317

Premier cas : x ou y a une limite finie en a.


Si x(t) m R et y(t) , on dit que possde une asymptote verticale
ta
ta
dquation x = m en a.
Si x(t) et y(t) m R, on dit que possde une asymptote horizontale
ta
ta
dquation y = m en a.
Deuxime cas : x et y ont une limite infinie en a.
Si

y(t)
0, on dit que possde une branche parabolique de direction (Ox) en a.
x(t) ta

Si

y(t)
, on dit que possde une branche parabolique de direction (Oy) en a.
x(t) ta

Si

y(t)
m R :
x(t) ta

(i) si y(t)m x(t) p R, on dit que possde une asymptote dquation y = mx+p
ta
en a.
(ii) si y(t) m x(t) , on dit que possde une direction asymptotique dquata
tion y = mx en a.
Remarque La liste de cas ci-dessus nest pas exhaustive : il se peut par exemple que y nait pas
de limite en a, comme dans le cas du graphe de la fonction sinus lorsque t +, qui ne rentre
dans aucun de ces cas.

4.

Construction darcs plans


On se donne un arc plan = (I,f ) avec f = (x,y).

1. On commence par dterminer lensemble de dfinition de la fonction f et les simplifications


ventuelles de lensemble dtude dues par exemple aux symtries de la courbe. Par exemple :
Si x et y sont T -priodiques, il suffit de restreindre ltude un intervalle de longueur T .
Si I est symtrique par rapport 0, il suffit de restreindre ltude I R+ , puis de complter la
courbe par symtrie, dans les cas suivants :
si x et y sont paires : la courbe C est entirement obtenue partir de I R+ .

si x et y sont impaires : la courbe C est symtrique par rapport lorigine.

si x est paire et y impaire : la courbe C est symtrique par rapport laxe (Ox).
si x est impaire et y paire : la courbe C est symtrique par rapport laxe (Oy).

si pour tout t I, x(t) = y(t) et y(t) = x(t) : la courbe C est symtrique par rapport la
premire bissectrice dquation y = x.
2. On donne la classe de f , on tudie les variations et les limites aux bornes de x et y.
On en dduit les tangentes horizontales ou verticales.
3. On identifie les points rguliers, les points stationnaires, et on tudie leur nature.
4. On tudie les branches infinies. Pour connatre la position de la courbe par rapport une
asymptote dquation y = mx + p, il peut tre utile dtudier le signe de la diffrence
y(t) mx(t) p.
5. On peut galement rechercher les ventuels points doubles, cest--dire tels quil existe t1 6= t2
avec x(t1 ) = x(t2 ) et y(t1 ) = y(t2 ).
6. On effectue le trac.
318

Exemple tudions larc paramtr par

x(t) = ln(t)
t2

y(t) =
2(t 1)

pour t D = R+ \ {1} (on peut le considrer comme runion de deux arcs).

Il ny a pas de symtrie vidente. Les fonctions x et y sont de classe C sur D (y est en fait
de classe C sur R \ {1}). De plus, pour tout t D,
ln(t) 1
ln2 (t)
2t(t 1) t2
t(t 2)
y (t) =
=
.
2
2(t 1)
2(t 1)2

x (t) =

On en dduit le tableau de variations suivant :


t
x (t)

0
0

x(t)

e
0

2
ln(2)

+
+
+

y(t)
y (t)

2
0

e2
2(e 1)

En particulier, est rgulier, possde une tangente horizontale au point




e2
2, et une tangente verticale au point e,
de paramtre e.
2(e 1)


2
, 2 de paramtre
ln(2)

Larc admet trois branches infinies, en 1 , 1+ et +, qui ne sont pas des asymptotes horizontales ou verticales, car x et y ont des limites infinies. Pour tout t D,
y(t)
t ln(t)
=
.
x(t)
2(t 1)
Lorsque t +,

1
y(t)
ln(t) +,
x(t)
2

donc admet une branche parabolique de direction (Oy) en +.


Pour t 6= 1 proche de 1, posons t = 1 + h, avec h non nul voisin de 0. Alors
y(t)
1
1 + h ln(1 + h)
=

h0 2
x(t)
2
h
car ln est drivable en 1 avec ln (1) = 1. Alors
(1 + h)2
1+h
1
h 1+h
1

=
+1+
y(t) x(t) =
2
2h
2 ln(1 + h)
2h
2
2

319

1
.
h3
3
+
+ o(h )
h
2
3
h2

Or

1
1
1
=
3
h
h
h h2
+
+ o(h3 )
+ o(h2 )
h
1 +
2
3
2
3


1
h h2 h2
2
=
+
+ o(h )
1+
h
2
3
4


h h2
1
+ o(h2 ) ,
1+
=
h
2 12
h2

do



1
1
h 1+h
h h2
2
y(t) x(t) =
+1+
+ o(h )
1+
2
2h
2
2h
2 12


h
1
h2
h h2
1
2
+1+
+h+
+ o(h )
1+
=
2h
2 2h
2 12
2
1
7
= +
h + o(h).
4 24
1
1
On en dduit notamment que possde une asymptote dquation y = x + en 1 .
2
4
Pour connatre la position de la courbe par rapport cette asymptote, on tudie le signe de
1
1
y(t) x(t)
2
4
qui est donn, pour t voisin de 1, par le dveloppement limit prcdent. On en dduit que la
courbe est au-dessous de son asymptote pour t < 1 proche de 1, et au-dessus pour t > 1 proche
de 1. On remarque lintrt davoir effectu le dveloppement limit un ordre suffisant ds le
dpart.

Lorsque t 0, x(t) 0. On peut prolonger x par continuit en 0 en posant x(0) = 0. En


remarquant que x (t) 0 lorsque t 0+ , le thorme de la limite de la drive montre que x est
de classe C 1 en 0 avec x (0) = 0 ; de plus y(0) = y (0) = 0. Lorigine nest pas un point rgulier
du prolongement de ; mais, en remarquant que
y(t)
t ln(t)
y(t) y(0)
=
=
0,
x(t) x(0)
x(t)
2(t 1) t0+
on voit que le prolongement de a une tangente horizontale au point (0,0) de paramtre 0.

+
+

320

5.

Longueur dun arc


Dans ce paragraphe, k k dsigne la norme euclidienne usuelle sur Rn .
Dfinition
Soit = (I,f ) un arc paramtr de classe C 1 .
Si I est un segment [a,b], on appelle longueur de le rel

kf (t)k dt.

Si I est un intervalle quelconque, on appelle longueur de le rel


Z
kf (t)k dt
I

lorsque lintgrale

kf (t)k dt est convergente.

Remarque On peut considrer les intgrales crites dans la dfinition prcdente car la fonction
kf k est continue sur I.
Exemple On considre la cyclode paramtre par
(
x(t) = t sin(t)

y(t) = 1 cos(t)

pour t R. Il sagit dun arc de classe C , et on remarque que pour tout t R,


(
x(t + 2) = t + 2 sin(t) = x(t) + 2
y(t + 2) = 1 cos(t) = y(t)

Il suffit donc dtudier la portion (appele arche) de larc correspondant t [0,2], puis de
complter le trac par translations horizontales. La longueur de cette arche est donne par
Z 2 p
Z 2 p

2
(x ) (t) + (y ) (t) dt =
(1 cos(t))2 + (sin(t))2 dt
L=
0
0
Z 2 p
2(1 cos(t)) dt
=
0
Z 2 q
=2
sin2 (t/2) dt
0
Z 2
sin(t/2) dt = 8
=2
0

(on a utilis que pour tout t [0,2], sin(t/2) > 0).


Le support de la cyclode est la courbe dcrite par un point fixe sur un cercle qui roule sans
glisser sur une droite, par exemple un point dune roue de vlo. La longueur dune arche de
cyclode est gale quatre fois le diamtre du cercle correspondant (ci-dessus ce diamtre vaut
2 car le primtre du cercle correspondant est 2). En revanche, videmment, larc complet
nest pas de longueur finie.

321

322

Chapitre 17

quations diffrentielles
Dans ce chapitre, I dsigne un intervalle de R, non vide et non rduit un point, K dsigne
R ou C, et n N .

Les notions de fonction drivable, de drivation composante par composante, de classe C k ,


dfinies pour les fonctions de I dans Rn dans le chapitre Fonctions vectorielles Arcs paramtrs, sadaptent de faon vidente aux fonctions de I dans Mn,1 (K).

I.

Rsultats thoriques sur les systmes diffrentiels


Un systme diffrentiel de n quations n inconnues

x (t) = a1,1 (t)x1 (t) + + a1,n (t)xn (t) + b1 (t)

1
..
.


xn (t) = an,1 (t)x1 (t) + + an,n (t)xn (t) + bn (t)

peut se mettre sous la forme dune seule quation, X (t) = A(t)X(t) + B(t), dans Mn,1 (K), avec

x1 (t)

X(t) = ... ,
xn (t)

a1,1 (t) . . .
..
A(t) = .
an,1 (t) . . .

a1,n (t)
..
.

an,n (t)

b1 (t)

et B(t) = ... .
bn (t)

Une telle quation est appele quation diffrentielle linaire. La fonction inconnue X et le
second membre B sont dfinis sur I et valeurs dans Mn,1 (K), la fonction A est dfinie sur
I valeurs dans Mn (K). Pour n = 1, on retrouve les quations linaires scalaires dordre 1,
x (t) = a(t)x(t) + b(t). Pour n > 2, on identifie souvent le systme diffrentiel et lquation
diffrentielle qui lui est associe.
Notation Une quation diffrentielle du type prcdent est souvent note X = A(t)X + B(t).
On ne note la variable t que pour les coefficients de lquation, pas pour la fonction inconnue.
Ce nest quune notation, qui dsigne lquation que lon cherche rsoudre.
Dfinition
Soient A : I Mn (K) et B : I Mn,1 (K) deux fonctions continues.
Une solution sur I de lquation diffrentielle linaire
X = A(t)X + B(t)
est une fonction X : I Mn,1 (K) drivable sur I telle que
t I, X (t) = A(t)X(t) + B(t).

323

(L )

Remarques

Si K = R et X = t x1 xn est une solution sur I de (L ), larc paramtr (I,(x1 , . . . ,xn ))
(qui est trac dans Rn ) est une courbe intgrale de (L ).
Une solution sur I de (L ) est ncessairement de classe C 1 ; en effet, pour tout t I, on a
X (t) = A(t)X(t) + B(t). Or, lapplication B est continue, ainsi que lapplication t 7 A(t)X(t),
en raisonnant composante par composante et par oprations sur des fonctions continues. Par
somme, X est continue, donc X est de classe C 1 , sur I.
Thorme de Cauchy linaire (admis : dmonstration hors programme)
Soient A : I Mn (K) et B : I Mn,1 (K) deux fonctions continues.
Alors lquation diffrentielle linaire
(L ) :

X = A(t)X + B(t)

possde des solutions sur I.


Pour tout t0 I et X0 Mn,1 (K), le problme de Cauchy
(
X (t) = A(t)X(t) + B(t) t I
X(t0 ) = X0

possde une unique solution.


Consquence importante Si B = 0 (on parle dquation sans second membre), il est immdiat que la fonction nulle est solution sur I de lquation diffrentielle X = A(t)X. Lunicit du
thorme prcdent montre alors quaucune autre solution de cette quation ne peut sannuler
sur I.
Exemple Soit a K. Lunique solution sur I de lquation diffrentielle x = ax qui prend la
valeur x0 K en t0 I est la fonction
x : t 7 x0 ea (tt0 ) .

Bien sr, en gnral, la rsolution nest pas aussi simple et se pose le problme de la recherche
des solutions, ou de la solution du problme de Cauchy (que la dmonstration du thorme ne
donne pas explicitement).
Supposons que lon dispose dune solution particulire Xp de (L ). Soit X : I Mn,1 (K)
une fonction ; X est drivable sur I si et seulement si X Xp est drivable sur I et dans ce cas,
X est solution sur I de (L ) si et seulement si
t I, X (t) = A(t)X(t) + B(t)

ce qui quivaut t I, X (t) = A(t)X(t) + [Xp (t) A(t)Xp (t)]


ce qui quivaut t I, [X Xp ] (t) = A(t)[X Xp ](t).

Ainsi, X est solution sur I de (L ) si et seulement si X Xp est solution sur I de lquation


diffrentielle
Y = A(t) Y.
(H)
Dfinition
Lquation (H) est dite quation homogne associe (L ).
Proprit Forme des solutions de (L )
On obtient toutes les solutions de (L ) sous la forme
Solution particulire de (L ) + solution gnrale de lquation homogne (H)

324

Il est donc judicieux de sintresser la fois la recherche de solutions particulires de (L ),


et lensemble des solutions de (H).
En ce qui concerne les solutions particulires, commenons par rappeler le principe de superposition, trs utile pour simplifier leur recherche lorsque le second membre est somme de
plusieurs termes :
Proprit
Soient B1 , . . . ,Bk des fonctions continues sur I valeurs dans Mn,1 (K), et soit
B = B1 + + Bk . Soit, pour tout i [[1,k]], Xi une solution sur I de lquation
diffrentielle linaire
Xi = A(t)Xi + Bi .
Alors X = X1 + +Xk est solution de lquation diffrentielle linaire X = A(t)X +B
sur I.
Dmonstration La fonction X est drivable sur I comme somme de fonctions drivables, et B est
continue sur I comme somme de fonctions continues. Pour tout t I, en sommant les relations
Xi (t) = A(t)Xi (t) + Bi (t), on obtient
X (t) = A(t)X1 (t) + + A(t)Xk (t) + B1 (t) + + Bk (t)
= A(t)X(t) + B(t)

par dfinition de B. Do le rsultat.

Donnons maintenant la structure de lensemble des solutions de lquation homogne (H) :


Thorme
Lensemble S des solutions sur I de lquation homogne (H) est un K-espace vectoriel.
Pour tout t0 I fix, lapplication

S Mn,1 (K)
t0 :
X 7 X(t0 )
est un isomorphisme.
En particulier, S est de dimension finie gale n.
Dmonstration
Nous avons remarqu plus haut que S est un sous-ensemble de lensemble des fonctions de
classe C 1 sur I valeurs dans Mn,1 (K), qui est clairement un K-espace vectoriel. De plus, S est
non vide car la fonction nulle est solution de (H). La stabilit de S par combinaison linaire est
un calcul immdiat.
Soit t0 I ; il est vident que t0 est linaire. De plus, le thorme dexistence et unicit dune
solution au problme de Cauchy associ (H) et t0 montre que t0 est bijective. Donc t0 est un
isomorphisme. Les isomorphismes prservent la dimension, donc S est de dimension finie avec
dim(S) = dim(Mn,1 (K)) = n.

Exemple Considrons le systme diffrentiel sans second membre
(
x = y
y = x

dquation diffrentielle linaire associe

X =


0 1
X.
1 0
325

On vrifie facilement que


X1 =

cos
sin

et X2 =


sin
cos

sont deux solutions sur R de cette quation. Elles sont linairement indpendantes car les fonctions cos et sin ne sont pas proportionnelles. Ainsi, (X1 ,X2 ) est une base de lespace vectoriel
des solutions ; on obtient donc toutes les solutions de lquation sous la forme


cos(t) sin(t)
t 7 X1 (t) + X2 (t) =
sin(t) + cos(t)
o (,) K2 .

II.

Systmes coefficients constants sans second membre

Lorsque A : R Mn (K) est une fonction constante, on peut lidentifier une matrice
A Mn (K), et on obtient ce que lon appelle un systme diffrentiel (ou quation diffrentielle)
linaire coefficients constants X = AX.
Le thorme de Cauchy, dans ce cas, assure lexistence et lunicit dune solution au problme
de Cauchy sur R tout entier.
Commenons par une remarque gnrale :
Proprit
Soit A Mn (K) et Sp(A) une valeur propre de A.
Alors, pour tout X0 E (A), la fonction
X : t 7 et X0
est solution sur R du systme diffrentiel X = AX.
Dmonstration La fonction X est drivable sur R (ses composantes sont des fonctions exponentielles). Pour tout t I,
X (t) = et X0 = et (X0 ) = et AX0 = A(et X0 ) = AX(t).

Ltude du systme diffrentiel X = AX est donc lie la rduction de la matrice A.


Premier cas : A est diagonalisable
Il existe alors une matrice inversible P Gn (K) et une matrice diagonale D dont les coefficients diagonaux sont les valeurs propres de A, notes 1 , . . . ,n , telles que A = P DP 1 . Soit
X : R Mn,1 (K) une fonction et Y = P 1 X; X est drivable sur R si et seulement si Y est
drivable sur R et dans ce cas, on a les quivalences suivantes :
X = AX

X = P DP 1 X

P 1 X = DP 1 X
(P 1 X) = D(P 1 X)

Y = DY.

Dans ce raisonnement, il est essentiel que P ne dpende pas de t. En notant y1 , . . . ,yn les
fonctions-coordonnes de Y , la dernire galit quivaut
i [[1,n]],

yi = i yi ,

ce qui quivaut : i [[1,n]], ki K; t R, yi (t) = ki ei t .


On retrouve alors trs simplement X par la relation X = P Y . On remarquera que lon a pas
besoin dexpliciter P 1 , qui nintervient que thoriquement.
326

On a donc dmontr le rsultat suivant :


Thorme Rsolution de X = AX avec A diagonalisable
Avec les notations prcdentes, si A est diagonalisable, la solution gnrale du systme
diffrentiel coefficients constants X = AX sur R scrit

k1 e1 t

t 7 P ...
kn en t

o (k1 , . . . ,kn ) Kn .

Remarque Le signe de la partie relle des i permet dtudier le comportement asymptotique


des solutions du systme diffrentiel : pour quune solution X ait une limite en + par exemple,
il faut et il suffit que pour tout i [[1,n]], t 7 ki ei t ait une limite dans K en +. En particulier,
si Re(i ) < 0 pour tout i, alors
|ei t | = eRe(i ) t 0
t+

et X(t) 0 dans Mn,1 (K).


t+

Deuxime cas : A est relle, diagonalisable dans Mn (C)


En appliquant la mthode prcdente, on obtient les solutions complexes de lquation. Pour
en retrouver les solutions relles, on cherche, parmi les solutions complexes, les solutions qui sont
gales leur conjugue, ce qui donne des conditions sur les constantes ki .
Troisime cas : A est trigonalisable
Il existe alors une matrice inversible P Gn (K) et une matrice triangulaire suprieure
T = (ti,j ) dont les coefficients diagonaux sont les valeurs propres de A, notes 1 , . . . ,n , telles
que A = P T P 1 . Avec le mme changement de fonction inconnue Y = P 1 X, on se ramne au
systme Y = T Y , que lon peut rsoudre en commenant par la dernire quation yn = n yn ,
dont la solution gnrale sur R scrit t 7 kn en t , o kn K. Lavant-dernire quation est alors

yn1
= n1 yn1 + tn1,n yn (t),

i.e. yn1
= n1 yn1 + tn1,n kn en t .

On est amen rsoudre une quation du type


y y = k et ,
et lon poursuit la rsolution de bas en haut .
Exemple On considre le systme diffrentiel

x = x + 2z
y = x + y 5z


z = y + 5z
Il est associ la matrice

1 0 2
A = 1 1 5
0 1 5

de polynme caractristique (X 2)2 (X 3). On dtermine facilement




2
1

E2 (A) = Vect 3
et E3 (A) = Vect 2 .
1
1
327

En particulier, dim(E2 (A)) 6= m(2), donc A nest pas diagonalisable (ni dans M3 (R) ni dans
M3 (C)). Elle est en revanche trigonalisable dans M3 (R) car son polynme caractristique est
scind dans R. Cherchons une matrice semblable A de la forme

2 0
T = 0 2 0 .
0 0 3

2
Pour construire une base de M3,1 (R) dans laquelle la matrice de uA soit T , on choisit e1 = 3
1

1
et e3 = 2 . Pour le choix de e2 , il suffit que (e1 ,e2 ,e3 ) soit libre et que :
1
R; (A 2I3 )e2 = e1

i.e. (A 2I3 )e2 Vect(e1 ) = E2 (A)

i.e. (A 2I3 )2 e2 = 0.


2
On montre facilement que e2 = 1 convient, avec (A 2I3 )e2 = e1 . En posant
0

2 2 1
P = 3 1 2 ,
1
0
1
on a donc

2 1 0
A = P 0 2 0 P 1 .
0 0 3


y1
1

En posant Y = P X = y2 , le systme original quivaut donc


y3

y1 = 2y1 + y2
y2 = 2y2


y3 = 3y3

Les deux dernires quations quivalent lexistence de (k2 , k3 ) K2 tels que pour tout t R,
y2 (t) = k2 e2t et y3 (t) = k3 e3t . La premire quation scrit alors y1 = 2y1 + k2 e2t ; en posant
y : t 7 y1 (t) e2t ,
cette quation quivaut : y = k2 , donc lexistence de k1 K tel que pour tout t R,
y1 (t) = (k2 t + k1 ) e2t .
Les solutions du systme diffrentiel X = AX sont donc donnes par

t R,

x1 (t)
(k2 t + k1 ) e2t

x2 (t) = P
k2 e2t
3t
k3 e
x3 (t)

o k1 , k2 et k3 sont des scalaires quelconques.


328

III.

quations scalaires dordre 1

On sintresse au cas dune quation de la forme


x + a(t)x = b(t)
o a et b sont deux fonctions continues sur I valeurs dans K. Cest bien sr un cas particulier
de la thorie prcdente avec n = 1, mais on peut tre plus explicite dans ce cas.
quation homogne
 Z t

Fixons t0 I et considrons la fonction x0 : t 7 exp
a(s) ds .
t0

La fonction a est continue sur I donc x0 est bien dfinie et drivable sur I avec, pour tout t I,
 Z t


x0 (t) = a(t) exp


a(s) ds = a(t) x0 (t),
t0

donc x0 est une solution sur I de lquation x + a(t)x = 0. De plus, x0 ne sannule pas sur I.
Pour quune fonction x drivable sur I soit solution de cette quation, il faut et il suffit que
 
x x0 + axx0
x

= 0.
x + ax = 0, i.e.
= 0, i.e.
x0
x20
Ceci quivaut lexistence dune constante K telle que x = x0 . Lensemble des solutions
de lquation homogne est donc la droite vectorielle engendre par x0 .
quation complte : la mthode de variation de la constante
On obtient toutes les solutions de (H) sous la forme x0 o K. Pour rsoudre lquation
complte (L ), lide est de faire varier la constante , cest--dire de voir comme une
fonction de I dans K, et de chercher quelle condition la fonction x0 est solution de (L ).
Tout dabord, toute fonction x : I K peut scrire sous la forme x0 , car x0 ne sannule
pas sur I. De plus, sur I, x0 tant drivable, x est drivable si et seulement si est drivable.
Dans ce cas, on a x = x0 + x0 , et donc, pour que x soit solution de (L ) sur I, il faut et
il suffit que
[ x0 + x0 ] + a [ x0 ] = b, i.e. x0 + [x0 + ax0 ] = b.
Or x0 est solution de (H), donc x0 + ax0 = 0. Ainsi, x est solution de (L ) si et seulement si
pour tout t I,
(t) x0 (t) = b(t).
La mthode de variation de la constante se rsume donc ainsi : les solutions de lquation complte
x + a(t)x = b(t) sur I sont exactement les fonctions x0 , o : I K est drivable et vrifie
x0 = b. Il sufit donc de dterminer une primitive de la fonction b/x0 sur I.
Finalement, on obtient toutes les solutions de lquation complte sous la forme

 Z t

Z t
b(s)
ds + k exp
a(s) ds ,
x : t 7
t0
t0 x0 (s)
o k K. Une condition initiale (problme de Cauchy) dtermine entirement k.

Remarque La solution gnrale de (L ) se met donc sous la forme


x0 + k x0

o est une primitive de b/x0 sur I, et k K. Le premier terme correspond une solution
particulire de lquation complte (L ), le second, la solution gnrale de lquation homogne.
On retrouve donc la structure de lensemble des solutions de (L ) ; la mthode de variation
de la constante permet de trouver des solutions particulires non videntes.
329

Exemple Rsolvons, sur I = R+ , lquation diffrentielle


2
1
x+ .
t
t
Pour rsoudre lquation homogne, on dtermine une primitive sur I de la fonction continue
t 7 2/t, par exemple t 7 2 ln(t). La solution gnrale de lquation homogne scrit donc
x =

x0 : t 7 exp (2 ln(t)) = t2

o K.

Pour rsoudre lquation complte, on peut remarquer que la fonction constante gale 1/2
en est solution.
Cest une vrification quil faut penser faire en gnral : si lquation ordinaire
t I, a(t)x + b(t) = 0

possde une solution (indpendante de t), alors la fonction constante y : t 7 x vrifie lquation
complte (L ) car dans ce cas on a y (t) = 0 = a(t)y(t) + b(t) pour tout t I.
Dans notre cas, la solution gnrale de lquation complte scrit
1
x : t 7 + kt2
2
o k K.

Si lon ne remarque pas quil existe une solution constante, on peut bien sr appliquer la
mthode variation de la constante : on obtient toutes les solutions de lquation complte sous
la forme t 7 (t) t2 o : R+ K est une fonction drivable telle que
t > 0, (t) t2 =

1
, ce qui quivaut :
t

t > 0,

(t) =

1
,
t3

1
et donc lexistence dune constante k K telle que pour tout t > 0, (t) = 2 + k, et lon
2t
obtient la solution gnrale de lquation complte sous la forme


1
1
x : t 7 2 + k t2 = + k t2 ,
2t
2

ce qui donne bien sr le mme rsultat.

Remarque Comme nous lavons remarqu loccasion de la rsolution des systmes diffrentiels
coefficients constants X = AX, on est souvent amen rsoudre des quations scalaires du
premier ordre de la forme
y y = P (t)et

o (,) K2 et P est une fonction polynomiale. La solution gnrale de lquation homogne


scrit sous la forme t 7 et . La mthode de variation de la constante conduit chercher les
fonctions drivables : I K telles que
ce qui quivaut

t I, (t)et = P (t)et ,

t I, (t) = P (t)e()t .

Si = , on peut choisir pour la primitive de P qui sannule en 0 ; elle se met sous la forme
t 7 tQ(t) avec Q de mme degr que P . Si 6= , on peut trouver sous la forme
t 7 Q(t)e()t

o Q est une fonction polynomiale de mme degr que P .


Finalement, la solution gnrale de lquation complte scrit
t 7 ket + tm() Q(t) et

o k K,

avec Q une fonction polynomiale de mme degr que P , et m() = 0 si 6= , m() = 1 si


= .
330

IV.

quations scalaires dordre 2

On sintresse ici au cas dune quation diffrentielle linaire scalaire dordre 2, de la forme
x + a(t)x + b(t)x = c(t),

(L2 )

o a, b et c sont trois fonctions continues sur I valeurs dans K.

1.

Systme diffrentiel dordre 1 associ

Nous allons montrer comment se ramener au cadre dapplication de la thorie prcdente.


Tout dabord, on appelle solution sur I de (L2 ) toute fonction x : I K deux fois drivable sur
I, telle que pour tout t I,
x (t) + a(t)x (t) + b(t)x(t) = c(t).

Une telle solution est alors ncessairement de classe C 2 sur I.


Soit x : I K une solution de (L2 ) sur I et


x(t)
X : t 7
.
x (t)

Alors X est drivable sur I, valeurs dans M2,1 (K), et vrifie : pour tout t I,

 

 
  
0
x(t)
0
1
x (t)
x (t)
.
+
=
=
X (t) =
c(t)
x (t)
b(t) a(t)
a(t)x (t) b(t)x(t) + c(t)
x (t)

Posons, pour tout t I,






0
0
1
M2,1 (K);
M2 (K) et B(t) =
A(t) =
c(t)
b(t) a(t)

les fonctions A et B sont continues sur I, et X est solution du systme diffrentiel


X = A(t)X + B(t).
 
x
Rciproquement, soit X =
une solution de X = A(t)X + B(t) sur I. Alors on a, pour tout
y
t I,
  

 
 

x (t)
0
1
x(t)
0
y(t)
=
+
=
.
y (t)
b(t) a(t)
y(t)
c(t)
a(t)y(t) b(t)x(t) + c(t)

Daprs la premire galit, on a y = x ; en particulier x est deux fois drivable sur I. De plus,
pour tout t I,
x (t) = a(t)x (t) b(t)x(t) + c(t).
Finalement, x est solution de x + a(t)x + b(t)x = c(t) sur I.
On a donc montr le rsultat suivant :
Proprit
Avec les notations prcdentes, les solutions sur I du systme diffrentiel
X = A(t)X + B(t)
sont exactement les fonctions de la forme
 
x
x
o x est solution de x + a(t)x + b(t)x = c(t) sur I.
En particulier, on obtient exactement les solutions de (L2 ) en prenant la premire
fonction-coordonne des solutions de X = A(t)X + B(t).

331

On se ramne ainsi, quitte passer dans M2,1 (K), un systme diffrentiel du premier ordre.
Exemple Lquation diffrentielle linaire scalaire dordre 2
x + t x + t2 x = t3
se met sous la forme du systme diffrentiel

X =


 
0
1
0
X+ 3
2
t t
t

 
x
o X =
.
x

La thorie de la premire partie (le thorme de Cauchy linaire et ses consquences) sapplique
et donne le rsultat suivant :
Thorme
Soient a, b et c trois fonctions continues sur I valeurs dans K.
Alors lquation diffrentielle linaire scalaire dordre 2
x + a(t)x + b(t)x = c(t)

(L2 ) :

possde des solutions.


Pour tout t0 I, x0 K et x1 K, le problme de Cauchy

x (t) + a(t)x (t) + b(t)x(t) = c(t) t I


x(t0 ) = x0


x (t0 ) = x1

possde une unique solution.

Lensemble S des solutions de lquation homogne


x + a(t)x + b(t)x = 0

(H2 )

est un plan vectoriel de C 2 (I,K).

On obtient toutes les solutions de (L2 ) sous la forme

Solution particulire de (L2 ) + solution gnrale de lquation homogne (H2 ) .

Dmonstration Avec les notations prcdentes, le thorme de Cauchy linaire sapplique


lquation X = A(t)X + B(t) pose dans M2,1 (K), car les applications A et B sont continues
sur I. Il existe des solutions de cette quation, et donc des solutions de x + a(t)x + b(t)x = c(t).

Pour 
toutt0 I et (x0 ,x1 ) K2 , il existeune
 solution X de X = A(t)X + B(t) telle que
x
x0
; X se met alors sous la forme
X(t0 ) =
avec x solution de x + a(t)x + b(t)x = c(t)
x1
x
et

  
x(t0 )
x0
=
x (t0 )
x1

do lexistence
dune
au problme de Cauchy. Si x et y en sont deux solutions, alors
 
 solution

x
y
X =
et Y =
sont deux solutions du problme de Cauchy matriciel correspondant,
x
y
donc par unicit pour ce problme, X = Y , do x = y.
Lensemble S des solutions de lquation homogne
x + a(t)x + b(t)x = 0
332

est un sous-espace vectoriel de C 2 (I,K) (vrification immdiate), il est de dimension 2 car, daprs
lexistence et unicit pour le problme de Cauchy (que lon vient de prouver), lapplication

S M2,1 (K)


t0 :
x(t0 )

x 7
x (t0 )

est un isomorphisme, pour tout t0 I.

Contrairement au premier ordre, il nexiste pas de mthode gnrale pour dterminer lensemble des solutions de lquation (H2 ) ou (L2 ). Dans la suite, nous allons indiquer un cas que
lon sait traiter, ainsi quune mthode daide la recherche de solutions dans le cas gnral.

2.

Cas o lquation homogne associe est coefficients constants


On considre le cas particulier des quations de la forme
x + ax + bx = c(t)

o (a,b) K2 .
Dans ce cas, le cours de premire anne permet de dterminer deux solutions indpendantes
de lquation homogne via la rsolution de lquation caractristique
x2 + ax + b = 0.

(E)

Thorme
Si (E) possde deux racines distinctes r1 et r2 dans K, t 7 er1 t et t 7 er2 t constituent
une base de lespace des solutions de (H2 ) sur R.
Pour toute solution x de (H2 ), il existe un unique couple (,) K2 tel que, pour tout
t R,
x(t) = er1 t + er2 t .
Si (E) possde une racine double r dans K, t 7 ert et t 7 t ert constituent une base
de lespace des solutions de (H2 ) sur R.
Pour toute solution x de (H2 ), il existe un unique couple (,) K2 tel que, pour tout
t R,
x(t) = ert + t ert = ( + t)ert .
Si K = R et (E) possde deux racines complexes conjugues z et z dans C, alors
il existe r R et R tels que z = r + i. Les fonctions t 7 ert cos(t) et
t 7 ert sin(t) constituent une base de lespace des solutions de (H2 ) sur R.
Pour toute solution x de (H2 ), il existe un unique couple (,) R2 tel que, pour tout
t R,
x(t) = ert cos(t) + ert sin(t) = ert ( cos(t) + sin(t)).

La forme matricielle de lquation homogne x + ax + bx = 0 est le systme diffrentiel


coefficients constants X = AX o


0
1
A=
.
b a
On remarquera que le polynme X 2 + aX + b apparaissant dans lquation caractristique est le
polynme caractristique de la matrice A, phnomne semblable celui que nous avions observ
lors de ltude des suites rcurrentes linaires dordre 2.
333

Nous avions montr dans le chapitre Rduction des endomorphismes et des matrices
carres que la matrice A est :
diagonalisable si (E) possde deux racines distinctes r1 et r2 dans K ; il existe P G2 (K)
tel que


r1 0
P 1 ;
A=P
0 r2
trigonalisable si (E) possde une racine double r dans K ; il existe P G2 (K) tel que


r 1
A=P
P 1 .
0 r

On rsout ce systme en posant Y = P 1 X = t y1 y2 , ce qui revient rsoudre le systme
(


y1 = r1 y1
r1 0

Y =
Y, i.e.
0 r2
y2 = r2 y2
dans le premier cas, et le systme


r 1

Y =
Y,
0 r

i.e.

y1 = ry1 + y2
y2 = ry2

dans le deuxime cas. Aprs rsolution de ce systme, en prenant la premire coordonne de


X = P Y , on retrouve bien la forme gnrale des solutions prsente dans le thorme prcdent.
En ce qui concerne lquation complte :
Lorsque le second membre est de la forme P (t) et avec P K[X] et K, on pensera
chercher une solution particulire sous la forme t 7 tm() Q(t) et o Q K[X] est de mme
degr que P et m() est la multiplicit de comme racine de lquation caractristique (E)
associe lquation homogne (m() peut valoir 0, 1 ou 2).
On pourra aussi utiliser le changement de fonction inconnue consistant poser y : t 7 x(t) et .
En particulier, lorsque b 6= 0 et le second membre est polynomial, on pourra chercher une
solution particulire polynomiale de mme degr. En effet, on est dans la situation prcdente
avec = 0 et m() = 0.
Lorsque K = R et le second membre est de la forme A cos(t) ou A sin(t) avec (A,) R2
et 6= 0, on pourra chercher une solution particulire sous la forme t 7 cos(t) + sin(t) o
(,) R2 si i nest pas racine de (E), ou sous la forme t 7 t( cos(t) + sin(t)) sinon.
En effet, on se ramne au premier point en considrant lquation
x + ax + bx = Aeit .
Si xp en est une solution particulire, alors Re(xp ) (resp. Im(xp )) est une solution particulire
de
x + ax + bx = A cos(t) (resp. x + ax + bx = A sin(t)),
car a et b sont rels. Or, ces fonctions sont de la forme indique ci-dessus, selon que i est racine
ou non de lquation caractristique (il ne peut pas en tre racine double, car a et b sont rels).
Enfin, on pourra utiliser le principe de superposition lorsque le second membre est somme de
plusieurs termes.
Exemples
Lvolution dun oscillateur amorti en rgime libre est rgie par lquation diffrentielle
x + 2 x + 02 x = 0,
qui regroupe par exemple les systmes masse-ressort, les pendules de torsion, les circuits RLC.
Le coefficient > 0 est le coefficient damortissement du systme, 0 > 0 en est la pulsation
propre.
334

Lquation caractristique associe cette quation diffrentielle linaire du second ordre


coefficients constants sans second membre est
r 2 + 2 r + 02 = 0,
de discriminant rduit 2 02 .

Si = 0 (amortissement nul), on obtient deux solutions indpendantes,


t 7 cos(0 t) et t 7 sin(0 t).

On crit la solution gnrale de lquation sous la forme t 7 C cos(0 t + ), o C est lamplitude des oscillations du systme, et la phase lorigine. On comprend bien ainsi lexpression
pulsation propre : cest la pulsation du systme en labsence damortissement et de force ou
signal extrieur.
p
Si 0 < < 0 , les racines de lquation caractristique sont i 02 2 ; on obtient deux
solutions indpendantes,
t 7 et cos(t) et t 7 et sin(t),
p
o = 02 2 (appele pseudo-pulsation, lorsque lamortissement est faible). On crit la
solution gnrale de lquation sous la forme t 7 Cet cos(t + ), o Cet est lamplitude,
exponentiellement dcroissante, des oscillations du systme.
p
Si > 0 , les racines de lquation caractristique sont r = 2 02 ; leur produit
vaut 02 > 0, leur somme 2 < 0 : r+ et r sont donc strictement ngatifs. On obtient deux
solutions indpendantes,
t 7 er+ t et t 7 er t .
Il ny a pas doscillations, on parle de rgime apriodique.
Si = 0 , la racine double de lquation caractristique est r = . On obtient deux solutions
indpendantes,
t 7 et et t 7 t et .
On parle de rgime critique. Cest celui pour lequel le retour lquilibre est le plus rapide.
On peut alors soumettre loscillateur une force ou un signal extrieur (rgime forc), par
exemple de la forme F0 cos(t) o > 0 est la pulsation et F0 lamplitude de cette force ou de
ce signal : lquation rgissant lvolution du systme est alors
x + 2 x + 02 x = F cos( t),
o F est fonction de F0 et des caractristiques du systme (inductance ou masse, notamment).
On a
(i)2 + 2 (i) + 02 = 02 2 + 2i .
Si > 0 ou 6= 0 , i nest pas racine de lquation caractristique, on peut trouver une
solution particulire de lquation complte sous la forme t 7 cos(t + ).
Si = 0 et = 0 , i est racine de lquation caractristique, on peut trouver une solution
particulire de lquation complte sous la forme t 7 t cos(t + ).

La solution gnrale de lquation complte est alors somme de la solution gnrale de lquation homogne et de cette solution particulire. La premire est amortie, elle correspond au rgime
transitoire ; la seconde nest pas amortie, elle correspond au rgime tabli ou permanent. On
peut galement rechercher pour quelle pulsation la rponse du systme a une amplitude maximale ; on montre facilement que pour un amortissement assez faible, cette pulsation existe, on
parle de phnomne de rsonance (pour = 0, on a immdiatement = 0 ).
335

Rsolvons sur R lquation diffrentielle x + 6x + 9x =

e3t
.
1 + t2

Lquation caractristique associe lquation homogne est r 2 + 6r + 9 = 0, elle admet une


racine double r = 3. La solution gnrale de lquation homogne scrit donc sous la forme
t 7 (at + b) e3t o (a,b) K2 .

On va chercher la solution gnrale de lquation complte sous la forme t 7 b(t) e3t (ce qui
revient en fait faire varier la constante b). Cela est possible car e3t 6= 0 pour tout t R.

La fonction x : t 7 b(t) e3t est deux fois drivable sur R si et seulement si b lest, et dans ce
cas, pour tout t R,
x (t) = (b (t) 3b(t)) e3t

x (t) = (b (t) 6b (t) + 9b(t)) e3t .

et

Alors, pour tout t R,


x (t) + 6x (t) + 9x(t) =

e3t
1 + t2



b (t) 6b (t) + 9b(t) + 6 b (t) 3b(t) + 9b(t) =

b (t) =

1
1 + t2

1
.
1 + t2

Ainsi, pour que x soit solution de lquation complte sur R, il faut et il suffit quil existe k1 K
tel que pour tout t R,
b (t) = arctan(t) + k1 .
On dtermine une primitive de arctan sur R par intgration par parties (les fonctions s 7 s et
s 7 arctan(s) sont de classe C 1 sur R) : pour tout t R,
Z

arctan(s) ds =
0

[s arctan(s)]t0

t
0

1
s
ds = t arctan(t) ln(1 + t2 ).
2
1+s
2

Finalement, pour que x soit solution de lquation complte sur R, il faut et il suffit quil existe
(k1 ,k2 ) K2 tel que pour tout t R,


1
2
x(t) = t arctan(t) ln(1 + t ) + k1 t + k2 e3t .
2
Remarque La mthode utilise dans lexemple prcdent est inspire de la mthode de variation
de la constante.
quations dEuler
Il sagit des quations diffrentielles de la forme at2 x + btx + cx = 0 sur R+ , o a, b et c
sont des constantes (a 6= 0).
Le thorme de Cauchy linaire sapplique, car lquation quivaut sur R+
x +

c
b
x + 2 x = 0,
at
at

qui est une quation diffrentielle linaire scalaire dordre 2 coefficients continus sur R+ .
Le changement de variable t = eu (pour t R+ ) permet de rsoudre ces quations, car il les
transforme en quations coefficients constants. En effet, si lon pose y : u 7 x(eu ) pour u R,
alors pour tout t > 0, x(t) = y(ln(t)). Pour que x soit deux fois drivable sur R+ , il faut et il
suffit que y soit deux fois drivable sur R et dans ce cas, pour tout t > 0,
x (t) =

1
y (ln(t)),
t

x (t) =
336

1
1
y (ln(t) + 2 y (ln(t)).
2
t
t

La fonction x est solution de lquation originale si et seulement si pour tout t > 0,


ay (ln(t)) ay (ln(t)) + by (ln(t)) + cy(ln(t)) = 0,
Limage de la fonction ln est R, donc ceci quivaut au fait que y soit solution sur R de
ay + (b a)y + cy = 0.

(L )

Lquation caractristique associe cette quation est ar 2 + (b a)r + c = 0. Soient 1 et 2


les racines dans C de cette quation.
Si 1 6= 2 , la solution gnrale de (L ) scrit
y : u 7 e1 u + e2 u
avec (,) K2 , et donc la solution gnrale sur R+ de lquation dorigine scrit
x : t 7 e1 ln(t) + e2 ln(t) = t1 + t2 .
Si 1 = 2 = , la solution gnrale de (L ) scrit
y : u 7 eu + u eu
avec (,) K2 , et donc la solution gnrale sur R+ de lquation dorigine scrit
x : t 7 e ln(t) + ln(t) e ln(t) = t + ln(t) t .
En particulier, il est donc judicieux de chercher des solutions sur R+ sous la forme t 7 t avec
C. Soit on trouve de telles solutions pour deux valeurs distinctes de , soit on en trouve
pour une seule valeur de , et alors t 7 (ln(t)) t est une autre solution de lquation. Dans les
deux cas, on en dduit la solution gnrale par combinaison linaire des deux solutions obtenues.
Enfin, x est solution de lquation sur R+ si et seulement si t 7 x(t) en est solution sur
On en dduit la solution gnrale de lquation sur R .

R .

Exemple Rsolvons lquation t2 x 4tx + 6x = 0 sur R+ par la mthode prcdente, qui


conduit lquation
( 1) 4 + 6 = 0

2 5 + 6 = 0

= 2 ou = 3.

La solution gnrale de lquation prcdente scrit donc


t 7 t2 + t3

3.

o (,) K2 .

Utilisation des sries entires

Pour une quation diffrentielle linaire scalaire dordre 2 (la mthode peut sappliquer aussi
pour lordre 1)
x + a(t)x + b(t)x = c(t)
dont les coefficients a, b, et c sont polynomiaux ou dveloppables en sries entires, il est intressant de chercher les solutions de ces quations qui sont dveloppables en srie entire. Donnons
un exemple de telle rsolution.
On cherche rsoudre lquation diffrentielle (1 + t2 )x + 4tx + 2x = 0. Cette quation entre
dans le cadre de ce chapitre, car pour tout t R, 1 + t2 6= 0, et donc lquation quivaut
x +

2
4t
x +
x = 0,
2
1+t
1 + t2

qui est coefficients continus (et elle est sans second membre). En particulier, le thorme de
Cauchy linaire sapplique et montre que lensemble des solutions sur R est un plan vectoriel.
Pour le dterminer, on va chercher les solutions dveloppables en srie entire.
337

Soit

n>0 an t

une srie entire de rayon de convergence R > 0. On pose, pour tout t ]R,R[,
f (t) =

+
X

an tn .

n=0

On a les quivalences suivantes :


La fonction f est solution de lquation (1 + t2 )x + 4tx + 2x = 0 sur ]R,R[
t ]R,R[ , (1 + t2 )
+
X

t ]R,R[ ,

n=2
+
X

+
X

n(n 1)an tn2 + 4t

n=2

n(n 1)an t

n2

+
X

n=2

n=0
+
X

t ]R,R[ ,

n=0

nan tn1 + 2

n(n 1)an t +
+
X

n=0

+
X

an tn = 0

n=0

n=1

(n + 2)(n + 1)an+2 tn +

t ]R,R[ ,

+
X

+
X

4nan t + 2

an tn = 0

n=0

n=1

n(n 1)an tn +

+
X

+
X

4nan tn + 2

n=0

+
X

an tn = 0

n=0

[(n + 2)(n + 1)an+2 + (n(n 1) + 4n + 2)an ] tn = 0.

Par unicit du dveloppement en srie entire (sachant que R > 0), ceci quivaut
n N,

i.e. n N,

(n + 2)(n + 1)an+2 + (n2 + 3n + 2)an = 0


an+2 = an .

Ceci quivaut au fait que pour tout p N,


a2p = (1)p a0

et a2p+1 = (1)p a1 .

Dfinissons la suite (an )nN par les relations prcdentes, a0 et a1 tant des scalaires quelconques.
Pour tout t ]1,1[ et p N,
|a2p t2p | = |a0 |(t2 )p

et |a2p+1 t2p+1 | = |a1 t| (t2 )p ,

la srie gomtrique de raison t2 [0,1[ tant convergente. Ainsi, les deux sries entires
X
X
a2p t2p et
a2p+1 t2p+1
p>0

p>0

P
convergent, et par somme, n>0 an tn converge. Donc le rayon de convergence R de cette srie
entire vrifie R > 1. De plus, pour tout t ]1,1[,
+
X

n=0

an tn =

+
X
p=0

a2p t2p +

+
X

a2p+1 t2p+1 = a0

p=0

+
+
X
X
a0 + a1 t
(1)p t2p + a1 t
(1)p t2p =
.
1 + t2
p=0
p=0

Daprs la srie dquivalences ci-dessus, les solutions dveloppables en srie entire autour de 0
de
(1 + t2 )x + 4tx + 2x = 0
sont exactement les fonctions de la forme
t 7

at + b
t2 + 1

avec (a,b) K2 .
On vrifie immdiatement quune telle fonction est en fait solution sur R tout entier, mme si
son dveloppement en srie entire nest pas toujours valable sur R.
338

Les deux fonctions

t
1
et t 7 2
+1
t +1
sont clairement linairement indpendantes ; on a donc obtenu un plan vectoriel de solutions, et
daprs le thorme de Cauchy linaire, on a en fait la solution gnrale de lquation.
t 7

t2

Remarques
Dans lexemple prcdent, on a pu rsoudre entirement lquation car toutes ses solutions sont
dveloppables en srie entire, mais ce nest pas toujours le cas.
La dmarche prcdente fait souvent apparatre des relations de rcurrence entre les coefficients
an . On peut parfois en dduire explicitement les coefficients an , voire une forme simple pour f
comme dans lexemple prcdent, mais nouveau, ce nest pas toujours le cas. En revanche,
la rgle de dAlembert peut permettre de dterminer le rayon de convergence R partir dune
relation de rcurrence entre les an , mme si ces coefficients ne sont pas connus explicitement.
Par exemple, en imaginant une quation diffrentielle qui aboutisse la relation
a0 = 1 et : n N, an+1 =

n2 + n + 1
an ,
2(n + 1)(n + 2)

il nest pas du tout vident dobtenir une formule explicite pour an . Pourtant, pour tout n N,
an 6= 0 et


an+1
n2 + n + 1
1
n2

= .
an = 2(n + 1)(n + 2) n+
2n2
2
P
La srie entire n>0 an tn a donc un rayon de convergence gal 2 daprs la rgle de dAlembert.

339

340

Chapitre 18

Fonctions de plusieurs variables


Calcul et gomtrie diffrentiels
Dans ce chapitre, p dsigne un entier naturel non nul et U dsigne un ouvert de Rp . On notera
k k une norme quelconque sur Rp et B = (e1 , . . . ,ep ) la base canonique de Rp .

Dans le chapitre Espaces vectoriels norms, nous nous sommes intresss notamment
la continuit des applications de Rp dans R. Dans ce chapitre, nous nous intressons laspect
diffrentiel. Bien sr, on ne peut pas procder comme pour les fonctions de la variable relle, car
la notion de taux daccroissement na pas de sens si p > 2. On souhaite malgr tout gnraliser
la notion de drive, qui permet notamment lapproximation f (a + h) = f (a) + f (a)h + o(h).
Lune des principales difficults est la gnralisation du terme f (a)h lorsque p > 2.

I.

Fonctions de classe C 1

1.

Drives partielles

Soit f : U R une fonction. On peut facilement se ramener des fonctions dune variable
en considrant les fonctions obtenues partir de f en fixant toutes les variables sauf une.
Plus prcisment, fixons a = (a1 , . . . ,ap ) Rp et i [[1,p]]. La fonction
fa,i : t 7f (a1 , . . . , ai1 , t, ai+1 , . . . , ap )
est appele i-ime application partielle de f en a. On remarquera quen fait elle ne dpend pas
de ai . Pour tout a U , pour tout i [[1,p]], soit Ua,i lensemble des rels t tels que
(a1 , . . . , ai1 , t, ai+1 , . . . , ap ) U.
Lapplication partielle fa,i est alors dfinie sur Ua,i .
x2
U

Ua,2

a2

a1

Ua,1
341

x1

Montrons que Ua,i est un ouvert de R : soit t0 Ua,i ; alors


(a1 , . . . , ai1 , t0 , ai+1 , . . . , ap ) U.
Comme U est ouvert, il existe r > 0 tel quon ait limplication
[ |t t0 | < r

et k 6= i, |xk ak | < r ]

(x1 , . . . , xi1 , t, xi+1 , . . . , xp ) U.

En particulier, en choisissant xk = ak pour tout k 6= i, on a montr que ]t0 r,t0 + r[ Ua,i ,


do le rsultat, qui est illustr sur la figure ci-dessus.
Par un raisonnement analogue, on montre facilement le rsultat suivant :
Proprit
Si f est continue sur U , alors pour tout a U , toutes les applications partielles de f
en a sont continues : pour tout i [[1,p]], fa,i est continue sur Ua,i .
Attention ! La rciproque est fausse : toutes les applications partielles de f peuvent tre continues
sans que f le soit. Ceci tient au fait que la continuit de f signifie que pour tout a U ,
f (x) f (a) lorsque x tend vers a de faon arbitraire. La continuit de la i-ime application
partielle de f en a signifie que f (x) f (a) lorsque x tend vers a le long de la droite a + R ei , ce
qui est plus restrictif, mme lorsque cela a lieu pour tout i.
Par exemple, soit f : R2 R dfinie par
xy

f (x,y) = x2 + y 2
0

si (x,y) 6= (0,0)
si (x,y) = (0,0)

Les deux applications partielles fa,1 et fa,2 de f sont continues sur R pour tout a R2 . Pourtant,
f nest pas continue en 0 car pour x 6= 0,
f (x,x) =

1
x2
= ,
2x2
2

qui ne tend pas vers f (0,0) lorsque x 0.


Ltude des applications partielles de f ne suffit donc pas faire ltude de f .
Dfinition Drives partielles
Soient a = (a1 , . . . ,ap ) U et i [[1,p]]. On dit que f admet une drive partielle en
a par rapport la i-ime variable si lapplication partielle
fa,i : t 7 f (a1 , . . . , ai1 , t, ai+1 , . . . , ap )
est drivable en ai , cest--dire, si
h 7

1
(f (a1 , . . . , ai1 , ai + h, ai+1 , . . . , ap ) f (a1 , . . . , ai1 , ai , ai+1 , . . . , ap ))
h

a une limite finie lorsque h 0 avec h 6= 0.


(a ), est note
Dans ce cas, cette limite, qui est le nombre driv fa,i
i
f
(a) ou i f (a).
xi
Elle est appele drive partielle de f en a par rapport la i-ime variable.

342

Remarque Pour p = 2 ou p = 3, les variables sont souvent notes x, y ou x, y, z.


Exemple Considrons lapplication
f:

R3 R
(x,y,z) 7 (x2 + y 2 ) sin(z)

Les trois applications


x 7 f (x,y,z),

y 7 f (x,y,z), z 7 f (x,y,z)

sont drivables sur R. La fonction f admet donc des drives partielles par rapport ses trois
variables en tout point de R3 ; pour tout (x,y,z) R3 ,
f
(x,y,z) = 2x sin(z),
x

f
(x,y,z) = 2y sin(z),
y

f
(x,y,z) = (x2 + y 2 ) cos(z).
z

Dfinition Fonctions drives partielles


Si f admet une drive partielle sur U (i.e., en tout point de U ) par rapport la i-ime
variable, alors la fonction
f
a 7
(a)
xi
(qui est dfinie sur U , valeurs dans R) est appele drive partielle de f par rapport
la i-ime variable.

2.

Classe C 1

Dfinition

Soit f : U R une fonction.


On dit que f est de classe C 1 sur U si f admet des drives partielles sur U par rapport
toutes ses variables, et si toutes ces drives partielles sont continues sur U .
Attention ! Si f est de classe C 1 sur U , alors pour tout a U , toutes les applications partielles
de f en a sont de classe C 1 (chacune sur louvert Ua,i de R correspondant) ; la rciproque est
fausse, le mme contre-exemple que dans le cas de la continuit le prouve.
Thorme (admis : dmonstration non exigible)
Soit f : U R une fonction de classe C 1 . Alors f admet en tout point a U le
dveloppement limit lordre 1
f (a + h) = f (a) +

f
f
(a) h1 + +
(a) hp + o(khk),
x1
xp

lorsque h = (h1 , . . . ,hp ) (0, . . . ,0).


Remarque La notation prcdente signifie que lon peut crire, pour h tel que a + h U,
f (a + h) = f (a) +

f
f
(a) h1 + +
(a) hp + khk (h),
x1
xp

o a pour limite 0 en (0, . . . ,0).


343

Dfinition Diffrentielle
Soient f : U R de classe C 1 et a U . On appelle diffrentielle de f en a la forme
linaire

Rp R

f
f
df (a) :
(a) h1 + +
(a) hp
(h1 , . . . ,hp ) 7
x1
xp
Limage de h Rp par lapplication df (a) sera note df (a) h.

Remarque Le thorme prcdent se rinterprte donc ainsi : si f : U R est de classe C 1 ,


alors pour tout a U ,
f (a + h) = f (a) + df (a) h + o(khk).
khk0

Ceci est bien sr mettre en relation avec le dveloppement limit


g(a + h) = g(a) + g (a)h + o(h)
h0

pour une fonction g : I R R de classe C 1 . Ici, le terme


df (a) h =

f
f
(a) h1 + +
(a) hp
x1
xp

correspond au terme g (a)h, mais il prend en compte, du fait de la prsence de plusieurs variables,
les accroissements de f dans toutes les directions.
Proprit
Si f est de classe C 1 sur U , elle est continue sur U .
Dmonstration La fonction f est de classe C 1 sur U , donc pour tout point a U ,
f (a + h)

khk0

f (a) + df (a) h + o(khk)

h(0,...,0)

f (a)

car df (a) est continue. Do le rsultat.

Proprit
Toute application polynomiale dfinie sur un ouvert est de classe C 1 .
En particulier, toute application linaire de Rp dans R est de classe C 1 .
Toute fraction rationnelle dont le dnominateur ne sannule pas est de classe C 1 .
Dmonstration On considre les applications partielles et on applique les rsultats analogues
pour les fonctions dune variable, do lexistence des drives partielles ; elles sont elles-mmes
soit polynomiales soit des fractions rationnelles dont le dnominateur ne sannule pas, donc
continues.


3.

Oprations sur les fonctions de classe C 1


Proprit Combinaison linaire
Soient f : U R et g : U R deux fonctions de classe C 1 , et R.
Alors f + g est de classe C 1 sur U et pour tout a U,
et : i [[1,p]],

d(f + g)(a) = df (a) + dg(a),


(f + g)
f
g
(a) =
(a) +
(a).
xi
xi
xi

344

Corollaire
Lensemble C 1 (U,R) des fonctions de classe C 1 sur U valeurs dans R est un R-espace
vectoriel.
Proprit Produit
Soient f : U R et g : U R deux fonctions de classe C 1 .
Alors f g est de classe C 1 sur U et pour tout a U,
et : i [[1,p]],

d(f g)(a) = (df (a))g(a) + f (a)(dg(a)),


f
g
(f g)
(a) =
(a) g(a) + f (a)
(a).
xi
xi
xi

Proprit Inverse
Soit f : U R une fonction de classe C 1 .
Alors 1/f est de classe C 1 sur U et pour tout a U,
d(1/f )(a) =
et : i [[1,p]],

1
f 2 (a)

df (a),

(1/f )
1 f
(a) = 2
(a).
xi
f (a) xi

Dmonstration des trois proprits Cest immdiat en considrant les applications partielles : les
rsultats sur les fonctions de la variable relle prouvent lexistence des drives partielles ; elles
sont continues par oprations sur les fonctions continues.


4.

Composition : rgle de la chane


Thorme Rgle de la chane
Soient I un intervalle de R et x1 , . . . ,xp des fonctions de classe C 1 sur I, valeurs dans
R. Soit f : U R de classe C 1 . On suppose que pour tout t I,
(x1 (t), . . . ,xp (t)) U.
Alors la fonction
g : t 7 f (x1 (t), . . . ,xp (t))

est dfinie et de classe C 1 sur I, avec, pour tout t I,

p
X
f
(x1 (t), . . . ,xp (t)) xi (t).
g (t) =
xi

i=1

Dmonstration La fonction g est bien dfinie car (x1 , . . . ,xp ) est valeurs dans U. Soit t I ;
pour tout i [[1,p]], xi : I R est de classe C 1 , donc il existe une fonction i qui a pour limite
0 en 0, telle que
xi (t + h) = xi (t) + xi (t)h + h i (h)
lorsque t + h I. De plus, f est de classe C 1 sur U , donc en notant a = (x1 (t), . . . ,xp (t)), il
existe une fonction qui a pour limite 0 en (0, . . . ,0), tel que
f (a + k) = f (a) +

n
X
f
(a) ki + kkk (k)
xi
i=1

345

pour k = (k1 , . . . ,kp ) tel que a + k U. On crit cette galit avec



k = x1 (t)h + h 1 (h), . . . , xp (t)h + h p (h)

lorsque h 0 avec t + h I ; on a alors k (0, . . . ,0), donc a + k U pour h assez proche de


0, do :
g(t + h) = f (x1 (t + h), . . . , xp (t + h))
= f (x1 (t) + x1 (t)h + h 1 (h), . . . , xp (t) + xp (t)h + h p (h))
n
X

f
(a) xi (t)h + hi (h) + kkk (k)
= f (x1 (t), . . . ,xp (t)) +
xi
i=1
!
!
n
n
X
X
f
f

= g(t) +
(a) xi (t) h +
(a) h i (h) + kkk (k)
xi
xi
i=1

i=1

Pour conclure, il suffit donc de prouver que le terme dans la dernire parenthse est un o(h)
lorsque h 0. Or, en choisissant la norme 1 (k k = k k1 ), on a, pour h =
6 0,


n

1 X f

(a)
h

(h)
+
kkk
(k)


i

|h|
xi
i=1


p 
X
f



6
0.
xi (a) i (h) + |xi (t) + i (h)| |(k)|
h0
i=1

On en dduit que g est drivable sur I avec la formule annonce pour g ; de plus, cette formule

montre que g est continue sur I, car f et tous les xi sont de classe C 1 . Do le rsultat.
Remarques
Si I est semi-ouvert ou ferm, la formule prcdente doit tre interprte, aux extrmits de I,
en termes de drives de g gauche ou droite.
Dans la formule donnant g (t), xi apparat avec deux sens diffrents quil ne faut pas confondre :
f
est une notation qui dsigne la drive partielle de f par rapport sa i-ime variable ; xi
xi
apparaissant dans xi (t) ou xi (t) dsigne la fonction xi . Il ny a pas de confusion possible si lon
crit, de faon quivalente,

g (t) =

p
X

i f (x1 (t), . . . ,xp (t)) xi (t).

i=1

La formule prcdente scrit aussi, par dfinition de la diffrentielle,


t I, g (t) = df ((t)) (t),
o = (x1 , . . . ,xp ).
Avec les notations prcdentes, (I,) est un arc paramtr de classe C 1 , et g reprsente la
drive de f le long de cet arc.

Dans la proprit suivante, on sintresse au cas de la composition

g:

V R2
(u,v)

(x,y)

R
U R2
(x(u,v),y(u,v)) 7 f (x(u,v),y(u,v))
346

Proprit Application aux fonctions de deux variables


Soient V un ouvert de R2 , x et y deux fonctions dfinies sur V , valeurs dans R, de
classe C 1 sur V . Soient U un ouvert de R2 et f : U R de classe C 1 . On suppose que
pour tout (u,v) V ,
(x(u,v), y(u,v)) U.
Alors lapplication
g : (u,v) 7 f (x(u,v), y(u,v))

est dfinie et de classe C 1 sur V , avec, pour tout (u,v) V ,


g
(u,v) =
u
g
(u,v) =
v

f
x
f
y
(x(u,v), y(u,v))
(u,v) +
(x(u,v), y(u,v))
(u,v),
x
u
y
u
f
x
f
y
(x(u,v), y(u,v))
(u,v) +
(x(u,v), y(u,v))
(u,v).
x
v
y
v

Dmonstration Il suffit dappliquer le thorme prcdent en faisant jouer t le rle de u


v fix, puis celui de v u fix. La variable t dcrit alors un ouvert de R (pas ncessairement
un intervalle) comme on la montr au dbut de ce chapitre. On peut appliquer le thorme au
voisinage de chaque point de cet ouvert.

Exemple Passage en coordonnes polaires
Pour tout (x,y) R2 , il existe r R+ et R tels que (x,y) = (r cos(), r sin()). On dit que
r, sont des coordonnes polaires de (x,y). Il ny a pas unicit de telles coordonnes : par
exemple si (x,y) = (0,0), r = 0 et tout R conviennent. De mme, si r, sont des coordonnes
polaires de (x,y), alors pour tout k Z, r et + 2k en sont galement.
On dfinit, pour (r,) R2 ,

x(r,) = r cos() et y(r,) = r sin().


Si f : R2 R est une fonction de classe C 1 , on pose
g(r,) = f (x(r,), y(r,)) = f (r cos(), r sin()).

Par exemple, g( 2, /4) = f (1, 1). Daprs la proprit prcdente, g est de classe C 1 sur
R2 et pour tout (r,) R2 ,
g
f
x
f
y
(r,) =
(r cos(), r sin()) (r,) +
(r cos(), r sin()) (r,)
r
x
r
y
r
f
f
(r cos(), r sin()) cos() +
(r cos(), r sin()) sin()
=
x
y
g
f
x
f
y
(r,) =
(r cos(), r sin()) (r,) +
(r cos(), r sin()) (r,)

f
f
(r cos(), r sin())(r sin()) +
(r cos(), r sin()) r cos().
=
x
y

Proprit Caractrisation des fonctions constantes


Soit f : U R une fonction de classe C 1 sur un ouvert U convexe.
Pour que f soit constante, il faut et il suffit que pour tout i [[1,p]],

347

f
= 0.
xi

Dmonstration
vident, car toutes les applications partielles de f , qui sont des fonctions dune variable,
sont constantes et de classe C 1 .
Soient a = (a1 , . . . ,ap ) U , b = (b1 , . . . ,bp ) U et

[0,1] R
g:
t 7 f (a + t (b a)) = f (a1 + t (b1 a1 ), . . . , ap + t (bp ap ))
Cette application est bien dfinie, car lorsque t parcourt [0,1], a + t(b a) parcourt le segment
[a,b], qui est contenu dans U car U est convexe. Daprs la rgle de la chane, g est de classe C 1
sur lintervalle [0,1] et pour tout t [0,1],
g (t) =

n
X
f
(a + t(b a)) (bi ai ) = 0.
xi
i=1

La fonction dune variable g est donc constante, et en particul