Vous êtes sur la page 1sur 378

Cours Concis

de

Mathmatiques

Ce travail est mis disposition selon les termes


de la licence Creative Commons Paternit - Pas
dUtilisation Commerciale - Pas de Modification
3.0 non transcrit. Pour plus dinformation, voir
http ://creativecommons.org/licenses/bync-nd/3.0/ ou crire Creative Commons, 444
Castro Street, Suite 900, Mountain View, California,
94041, USA.

Pierre Guillot

Chapitres
Une table des matires dtaille se trouve la fin du livre

1 Ensembles

2 Nombres

22

3 Polynmes

44

4 Suites

62

5 Matrices

84

6 Continuit

108

7 Dterminants

126

8 Compacit

146

9 Drives

154

10 Lexponentielle

176

11 Espaces vectoriels

195

12 Formules de Taylor

220

13 Applications linaires

235

14 Intgrale de Riemann

262

15 Fractions rationnelles

298

16 Diagonalisation

317

17 quations diffrentielles linaires

342

Chapitre 1

Ensembles
Premire lecture
Ensembles et appartenance
Les objets mathmatiques peuvent tre rangs dans des ensembles, que lon crit avec des accolades. Par exemple,
E = {1, 2, 3} et

F = {19, 11}

sont des ensembles. On note x X pour signifier que x appartient X, et dans le cas contraire on emploie le symbole < ; par
exemple, on a 2 E et 3 < F.
Un ensemble ne comprend jamais de rptition , et nest
pas ordonn : ainsi
{2, 2, 2, 3, 3} = {2, 3} et

{3, 2, 1} = {1, 2, 3} .

Il existe bien sr des ensembles infinis, comme lensemble N


des nombres entiers, dont nous reparlerons au chapitre suivant. Il y a galement un ensemble vide, qui ne contient aucun
lment : on le note ou, plus rarement, {}.
Lorsque tous les lments dun ensemble A sont aussi dans
lensemble B, on dit que A est une partie de B, ou quil est inclus
dans B, et on note A B. Par exemple
{2, 4, 6, 8} {1, 2, 3, 4, 5, 6, 7, 8, 9} .
3

Les ensembles sont souvent dessins comme des bulles, et pour


reprsenter linclusion on place ces bulles les unes dans les
autres, comme ci-dessous :

Fixant B, on peut considrer lensemble P (B) dont les lments sont toutes les parties de B ; ainsi dans le cas o B =
{1, 2, 3}, on a
P (B) = {, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}} .
(On noublie ni la partie vide, ni B lui-mme.)
Enfin, tant donns deux ensembles A et B, on peut former leur produit cartsien not A B, dont les lments sont les
paires (a, b) avec a A et b B. Lorsque A = {1, 3} et B = {2, 4, 6}
par exemple, on a
A B = {(1, 2), (1, 4), (1, 6), (3, 2), (3, 4), (3, 6)} .
On notera que pour les paires, lordre est important : ainsi llment (1, 2) de N N est diffrent de llment (2, 1).
Quelques constructions
Lorsquon dispose dun ensemble E, on peut sintresser
aux lements de E qui vrifient une certaine proprit P. Ceuxci forment nouveau un ensemble, que lon note ainsi :
{x E | P(x)} .
(Parfois le | est remplac par deux points, ou par lexpression
complte tels que . Il y a de nombreuses variantes et il faut
shabituer des notations qui changent de temps en temps, en
gnral pour viter les lourdeurs.)

Par exemple, supposons que A E. Alors le complmentaire


de A dans E est par dfinition
{x E | x < A} .
On le note gnralement E A ou E r A.
Autre exemple, si A et B sont deux parties de E, alors leur
intersection est
A B = {x E | x A et x B} ,
leur union est
A B = {x E | x A ou x B} .
Exemple 1.1 Prenons E = N N, puis
A = {(n, m) N N | n = 0} ,
et enfin
B = {(n, m) N N | m = 0} .
Alors A B = {(0, 0)}. On peut galement crire
A B = {(n, m) N N | nm = 0} .
Note : en pratique, on crirait plutt A = {(0, m) N N} ou
encore A = {(0, m) | m N}, lessentiel tant de se faire comprendre.
Il est trs important de comprendre ds maintenant que la
lettre x qui est employe ci-dessus dans la description des ensembles peut tre remplace par nimporte quelle autre : on
obtient rigoureusement les mmes ensembles. Par exemple si
A = {x N | il existe y N tel que x = 2y} ,
et si
B = {a N | il existe b N tel que a = 2b} ,
alors A = B = les nombres entiers pairs.
5

Propositions mathmatiques
On ne peut pas utiliser tout et nimporte quoi pour dcrire
les ensembles. Pour se convaincre que les proprits P comme
ci-dessus ne peuvent pas tre compltement arbitraires, voir
lencadr Deux paradoxes . Pour bien faire les choses, il
conviendrait de dfinir prcisment quelles sont les proprits
acceptables, ou en dautres termes, dfinir ce quest un nonc
mathmatique .
Cette thorie existe, et il existe mme plusieurs systmes
concurrents. Cependant il serait compltement hors de pro-

Deux paradoxes
Lnonc selon lequel {x E | P(x)}
est un ensemble lorsque E est un
ensemble peut paratre anodin. En
ralit il est bien plus fin quon pourrait le croire. Nous allons voir deux
paradoxes clbres, dont llucidation fait intervenir de manire subtile cette construction.
Voici le premier. Pour un entier n,
considrons la proprit n ne
peut pas tre dcrit en moins de
16 mots . Appelons cette proprit P(n), et soit

Notre deuxime exemple utilise


pour P(x) la proprit x < x .
Celle-ci est parfaitement acceptable. Cest sa signification intuitive
proche de zro qui donne un parfum de paradoxe au raisonnement
suivant, pourtant correct.
Montrons la chose suivante : pour
tout ensemble E, il existe un ensemble A tel que A < E. En effet, soit
A = {x E | x < x} .
Si on avait A E, alors on constaterait que A A exactement
lorsque A < A, par dfinition. Cest
absurde, donc A < E.
On nonce souvent ce rsultat sous la forme suivante : il
nexiste pas densemble de tous
les ensembles. Nous venons bien
de le dmontrer. Sil est tentant
dcrire quelque chose comme U =
{x | x est un ensemble} pour essayer
de le dfinir malgr tout, on se rend
compte que cette expression nest
pas de la forme {x E | P(x)}, et
donc ne dsigne pas un ensemble.
La prsence de lensemble E pour
chapeauter les x est essentielle.

A = {n N | P(n)} .
Les mots de la langue franaise
sont en nombre fini, donc en 16
mots on ne peut dcrire quun
nombre fini de nombres. Ainsi, A est
infini et en particulier, non-vide. Soit
alors a le plus petit lment de A. Ce
nombre est le plus petit nombre qui
ne peut pas tre dcrit en moins de
16 mots . On vient tout juste de dcrire a en 15 mots !
Cest absurde. Et pour cause, la
proprit P(n) ne fait pas partie
des proprits mathmatiques acceptables.

pos de donner une description prcise de lun de ces systme


ds maintenant (les dtails sont parfois donns en troisime ou
quatrime anne, et encore). Nous allons nous contenter dune
discussion informelle qui suit les grandes lignes de ce que lon
appelle la logique du premier ordre (pour des raisons que lon
nexpliquera pas).
Nous avons rencontr des propositions mathmatiques :
x A par exemple, et on pourrait citer aussi les galits comme
x = y. La ngation dune proposition en est une, ainsi x < A est
un nonc mathmatique.
On peut crer de nouveaux noncs laide de ou et de
et : nous lavons fait dans la dfinition des intersections et
des unions. On peut aussi relier deux noncs P et Q par le
symbole , qui se lit implique . On obtient lnonc P Q,
qui est faux lorsque P est vrai et Q est faux ; dans tous les autres
cas P Q est vrai. Voyons un exemple :
A = {(x, y) N N | x , 0 y = 0} .
Les lments de A sont les paires (x, 0) avec x entier, ainsi que
les paires (0, y) avec y entier.
Le symbole est surtout pertinent lorsquon lutilise en
conjonction avec le quantificateur universel, cest--dire le petit
symbole qui signifie pour tout . Nous pouvons par exemple
utiliser ce symbole pour montrer que A B est un nonc mathmatique : en effet il revient dire
x, x A x B.
Lautre quantificateur notre disposition est le quantificateur existentiel, qui scrit et signifie il existe . On a dj observ que, pour un nombre entier n, la proprit n est pair
scrit
m N tel que n = 2m .
(En toute rigueur, en logique du premier ordre on crit plutt m, m N et n = 2m. On sautorise un peu de souplesse
pour plus de clart.)
En rgle gnrale, un nonc mathmatique est une
phrase que lon peut rduire une suite de symboles combinant , , , =, , des ngations, des ou et des et . En
7

pratique cependant, la moindre dfinition, le moindre thorme, occuperaient des milliers de symboles si on voulait les
dcortiquer compltement. En consquence, il faut veiller en
permanence ce que les noncs que lon produit soient thoriquement remplaables par des symboles, sans jamais effectuer
concrtement ce remplacement. Notons tout de mme qu
laide dun ordinateur, on peut parfois rdiger certaines dmonstrations jusquau moindre dtail : cest ce quon appelle
les preuves automatiques .
Ajoutons enfin que dans certaines situations, nous utiliserons les symboles , ou autres, lorsque lon souhaite lever toute ambigit. Ainsi de la dfinition des limites, par
exemple.
Fonctions
tant donns deux ensembles A et B, une fonction f de A
vers B associe tout lment x A un lment f (x) B et
un seul. On peut traduire cette dfinition (un peu vague) en
termes densembles. Si lon souhaite tre extrmement prcis,
on dira :
Dfinition 1.2 Une fonction, ou application, est un objet f dtermin par trois ensembles :
1. un ensemble A, appel le domaine de dfinition de f , ou
parfois la source de f ;
2. un ensemble B, appel le but de f ;
3. un ensemble , qui est une partie de A B et que lon
appele le graphe de f , ayant la proprit suivante : pour
chaque x A, il existe un unique y B tel que (x, y) .
Ce y est not f (x).
On utilise la notation
f : A B
pour indiquer que f est une fonction dont le domaine de dfinition est A et dont le but est B.

On reprsente typiquement une fonction A B de la manire suivante :
8

Chaque flche sur ce dessin part dun lment x A et pointe


sur f (x). La caractristique importante est que chaque point
de A marque le dbut dune flche, et dune seule.
Voyons quelques exemples.
Exemple 1.3 Il y a une (et une seule) fonction f : N N telle
que f (n) = 2n2 + 1. On utilise parfois la notation
f : N
n 7

N
2n2 + 1

pour dsigner cette fonction. Cest trs souvent par des formules, telles que 2n2 + 1, que lon va dfinir les fonctions.
Ici le domaine de dfinition est A = N, le but est B = N, et le
graphe de f est = {(n, 2n2 + 1) | n N}.
Exemple 1.4 Soit p : N r {0} N la fonction telle que p(n) =
le n-ime nombre premier. Ainsi p(1) = 2, p(2) = 3, p(3) = 5,
p(4) = 7 et ainsi de suite. Cette fonction p est bien dfinie,
mme si on na pas utilis de formule. (Cela dit, il en existe.)
Exemple 1.5 Nous allons anticiper un peu et supposer que
vous connaissez un minimum lensemble R. On le reprsente
par une droite, et R R par un plan. Une fonction A B
avec A R et B R est donne par son graphe, qui ressemble
de prs ou de loin une courbe dans le plan. Par exemple la
figure suivante reprsente un tel graphe.
9

La proprit caractristique des graphes se voit bien sur le


dessin. Si maintenant on fait subir une rotation cette figure,
obtient-on encore le graphe dune fonction ?

La rponse est visiblement non : pour le x indiqu, il y a deux


nombres couples (x, y1 ) et (x, y2 ) qui appartiennent la courbe.
Ce nest donc pas un graphe. On retiendra la traduction gomtrique simple : lorsque A R et B R, une partie de A B est
le graphe dune fonction A B si et seulement si chaque droite
verticale dquation x = a (avec a A) coupe exactement en
un point.
Dans la suite du chapitre nous allons tudier la proprit
correspondante en utilisant cette fois des droites horizontales.

10

Deuxime lecture
Fonctions injectives
Dfinition 1.6 Soit f : A B une fonction. Supposons que,
pour tout choix de deux lments distincts x1 , x2 dans lensemble A, on ait galement f (x1 ) , f (x2 ). On alors dit que f est
injective, ou encore que f est une injection.

Il existe bien des faons de reformuler ceci. Par exemple,
f est injective si et seulement si lgalit f (x1 ) = f (x2 ) entrane x1 = x2 . galement, il est bon de noter que f est injective
si et seulement si lquation
f (x) = b ,
dont linconnue est x A et qui comporte le paramtre b B,
possde au maximum une solution.
Exemple 1.7 La fonction d : N N dfinie par d(n) = 2n, est
injective : en effet si 2x1 = 2x2 , alors x1 = x2 . Lquation d(x) = b
scrit 2x = b ; elle a une solution x = 2b si b est pair, et aucune
solution si b est impair.
Exemple 1.8 La fonction c : Z N dfinie par c(n) = n2 , nest
pas injective (ici Z est lensemble de tous les nombres entiers,
positifs ou ngatifs). En effet c(n) = c(n), de sorte que lquation c(x) = b, qui scrit x2 = b, peut possder deux solutions,
comme par exemple 2 et 2 qui sont solutions pour b = 4.
Voici comment on reprsente une fonction injective :

11

Cette fois-ci, les flches pointent toutes vers des lments


diffrents.
Exemple 1.9 Revenons au cas particulier o f : A B avec A
et B des parties de R. Lquation f (x) = b possde une solution x
lorsque le graphe de f comporte un point (x, f (x)) qui est galement sur la droite horizontale dquation y = b. La condition
pour que f soit injective est donc que les droites horizontales
rencontrent le graphe de f en un point au maximum.
Soit le graphe de f . Faisons subir ce graphe une symtrie
par rapport la droite dquation y = x (cette symtrie envoie
le point (x, y) sur (y, x)). On obtient un ensemble 0 . Lorsque f
est injective, ce 0 ne rencontre les droites verticales quen un
point au plus. Cest--dire que 0 est le graphe dune fonction !
Cette discussion est illustre sur la figure suivante.

gauche en bleu, le graphe dune fonction injective ;


droite en vert, son symtrique.

12

Soyons plus prcis. Pour dfinir une fonction g dont le


graphe serait 0 , il lui faut un ensemble de dfinition et un
but. Les points de 0 sont ceux de la forme (f (x), x). Notons
donc
f (A) = {f (x) | x A} B.
(Nous reviendrons sur cette notation (abrge) dans le paragraphe suivant.) Alors on peut dfinir une fonction g : f (A)
A dont le graphe est 0 . Concrtement, on a g(f (a)) = a, ce qui
a un sens puisque f est injective.
Cette fonction g est essentiellement ce quon appelle la rciproque de f , qui se note f 1 . Toutefois il nous reste un peu de
vocabulaire introduire avant de dtailler ceci.
Fonctions surjectives et bijectives
Dfinition 1.10 Soit f : A B une fonction. On note f (A),
ou encore =(f ), lensemble
{b B | x A tel que b = f (x)} .
(En plus concis f (A) = {f (x) | x A}.) On dit que f (A) est
limage de A par f .
Lorsque f (A) = B, on dit que f est surjective, ou encore que f
est une surjection.

Ainsi f est surjective lorsque lquation f (x) = b possde au
minimum une solution.
Exemple 1.11 La fonction f : N N N dfinie par f (n, m) =
n + m est surjective. En effet, si on se donne b N, alors f (b, 0) =
b. On a aussi f (0, b) = b, et mme f (1, b 1) = b, de sorte que f
est loin dtre injective, par contre.
Exemple 1.12 La fonction d : N N telle que d(n) = 2n nest
pas surjective. En fait lensemble image d(N) est lensemble des
nombres pairs.
Voici la reprsentation typique dune fonction surjective :

13

Ici chaque lment de B est lextrmit dau moins une flche.


Dfinition 1.13 Lorsquune fonction est la fois injective et
surjective, on dit quelle est bijective, ou encore que cest une
bijection.

Lorsque f : A B est bijective, lquation f (x) = b possde
une solution et une seule. Cette solution est note f 1 (b).
On obtient ainsi une fonction f 1 : B A, que lon appelle
la rciproque de f . On a alors :
Proposition 1.14 Lorsque f est bijective, la fonction f 1 vrifie
1. f 1 (f (a)) = a pour a A,
2. f (f 1 (b)) = b pour b B.
Rciproquement si on a une paire de fonctions f : A B
et g : B A telles que g(f (a)) = a pour a A et f (g(b)) = b
pour b B, alors f est une bijection et g = f 1 .
Enfin, f 1 est galement une bijection lorsquelle existe, et
(f 1 )1 = f .
Dmonstration.
1. tant donn a, soit b = f (a) ; puisque f est
injective a est le seul lment de A qui vrifie cette quation, et cest cet lment que lon note f 1 (b). Donc a =
f 1 (b) = f 1 (f (a)).

14

2. Cest la dfinition mme de f 1 (b).


Montrons la rciproque. Soient f et g comme dans la proposition. Si f (a1 ) = f (a2 ), alors on a aussi g(f (a1 )) = g(f (a2 )),
donc a1 = a2 . Ainsi f est injective. De plus, si b B on a b =
f (g(b)) donc b est bien dans limage de f , ce qui montre que f
est surjective. Finalement f est une bijection.
Partant de f (f 1 (b)) = b = f (g(b)), on applique g pour obtenir
g[f (f 1 (b))] = g[f (g(b))] .
Puisque g(f (a)) = a pour tout a A (et donc en particulier
pour a = f 1 (b) ou pour a = g(b)), cette dernire galit se simplifie et donne f 1 (b) = g(b). Donc f 1 = g.
Par symtrie, on peut inverser les rles de f et de g. Donc g
est bijective et g 1 = f , cest--dire que f 1 est bijective et
que (f 1 )1 = f .
Exemple 1.15 La fonction s : N N dfinie par s(n) = n est
une bijection. De plus, s1 = s.
Galerie dexemples
Nous allons passer en revue quelques exemples clbres de
paires de bijections rciproques. Nous nallons pas dmontrer
que ces fonctions sont des bijections, et dailleurs nous nallons
pas les dfinir prcisment pour linstant : en effet ce sont des
exemples largement traits au lyce. Au fur et mesure que
vous progresserez dans ce livre, vous trouverez les dfinitions
et les dmonstrations correspondantes.
Exponentielle & logarithme. Voici en bleu le graphe de la
fonction exponentielle. Cest une fonction exp : R R>0 (o R>0
dsigne lensemble des nombres rels strictement positifs), et
nous reviendrons longuement sur sa dfinition dans ce livre.
En vert, le graphe de sa rciproque, que lon appelle le logarithme nprien ; il sagit donc dune fonction ln : R>0 R.

15

Notez qu ct du graphe bleu on a indiqu y = exp(x) : cest


le raccourci habituel pour indiquer quun point (x, y) du plan
se trouve sur le graphe si et seulement si y = exp(x). On aurait
aussi bien pu inscrire x = ln(y). ct du deuxime graphe, les
rles de x et y sont inverss.
Sinus & arcsinus. La fonction sinus est ici vue comme une
fonction sin : [ 2 , + 2 ] [1, 1] (le nombre , qui doit vous
tre familier, sera tudi plus en dtail dans la suite). Cest
une bijection dont la rciproque sappelle arcsinus ; on crit
arcsin : [1, 1] [ 2 , + 2 ].

Attention, si lon sintresse dautres intervalles, la fonction sinus ne sera pas forcment une bijection : par exemple ce
16

nest pas le cas sur [0, 2].


Cosinus & arccosinus. Le cosinus, vu comme une fonction
cos : [0, ] [1, 1], est une bijection. Sa rciproque arccos : [1, 1]
[0, ] est appele arccosinus.

Tangente & arctangente. Rappelons que lon note tan(x) =


lorsque x nest pas de la forme 2 + n avec n Z. Ce

faisant, on obtient une fonction tan : ]


2 , 2 [ R qui est une
bijection. Sa rciproque, appele arctangente, est une fonc
tion arctan : R ]
2 , 2 [.
sin(x)
cos(x)

17

Carr & racine. La fonction f : [0, +[ [0, +[ dfinie


1 sappelle
par f (x) = x2 est une bijection. Sa rciproque
f
1
la fonction racine carre et se note f (x) = x.

Attardons-nous un instant sur ce dernier exemple. Que


sommes-nous capables de vritablement dmontrer ? Commenons par linjectivit de f . Si f (x1 ) = f (x2 ), on a x21 = x22 ,
do
x21 x22 = (x1 x2 )(x1 + x2 ) = 0 .
Or puisquon se restreint x1 0 et x2 0, on ne peut avoir x1 +
x2 = 0 que lorsque x1 = x2 = 0. Dans les autres cas, on simplifie
par x1 + x2 et on en conclut que x1 = x2 , l encore. Donc f est
injective.
La fonction f , dont le but est [0, +[ est-elle bien surjective ? Cest une question bien plus difficile ! Il sagit de savoir
si tout nombre rel b possde une racine carre , cest--dire
sil existe x tel que b = x2 . En dautres termes,
est-ce quon peut

toujours donner un sens la notation b ? Bien sr nous venons daffirmer ci-dessus que la rponse est oui, mais comment
le dmontrer ?
Cest lobjet du chapitre suivant, et cest aussi notre premire rencontre avec un nonc considr comme vident jusquau lyce et quil va falloir lucider. Les exemples ci-dessus
en contiennent bien dautres (quest-ce que lexponentielle, au
juste ? quest-ce quun cosinus ? etc)

18

La mthode axiomatique
Sil existe une distinction essentielle entre les mathmatiques (en tout cas dans la vision idalise quon peut en avoir)
et la plupart des autres disciplines, cest sans doute quon y a
tout le loisir de poser des questions. Quon essaie de demander un physicien la dfinition dune force, ou la dfinition de
lnergie (et non pas la formule qui calcule telle ou telle incarnation de lnergie), et on rencontrera rapidement des difficults, qui sont profondes et invitables. Richard Feynman dans
son Cours de Physique donne une belle dfinition de lnergie, par ailleurs trs mathmatique et sans doute dcevante par
certains gards pour les physiciens. Il ne parvient pas en faire
autant pour les forces, et il est intressant de lire ses explications.
En thorie, ceci narrive jamais en mathmatiques. Vous
pouvez demander votre professeur de dfinir ce quest le
logarithme, il le fera (par exemple) en disant que cest une intgrale ; vous pouvez demander ce quest une intgrale, vous
aurez une rponse qui fait intervenir des limites ; vous pouvez ensuite demander ce que signifie un passage la limite ,
etc. Mais que va-til arriver lorsquon en finit par demander ce
quest un ensemble, ce que sont les nombres entiers, et pourquoi 2 + 2 = 4 ? Il va bien falloir trouver une rponse.
Cependant, a-t-on vraiment le dsir de traiter cette question maintenant, dans le premier chapitre dun livre destin aux
tudiants en premire anne ? Nous affrontons un vritable dilemme. Dun ct, par simple honntet (et pas seulement pour
avoir des rponses disposition dun tudiant rcalcitrant qui
aurait lide incongrue de demander la dfinition des choses
videntes ), on a bien envie de commencer par le commencement, et de dfinir tous les objets que lon rencontre en partant
de rien . Dun autre ct, on peut objecter que cette exigence
serait aussi draisonnable que dimposer chaque candidat au
permis de conduire de connatre entirement la mcanique automobile avant mme sa premire heure de conduite.
De fait, la vaste majorit des mathmaticiens de profession
ne connaissent pas et ne souhaitent pas connatre les dtails des
19

Richard
Feynman, Le
cours de
Physique de
Feynman,
Dunod, 1999.

fondements logiques des mathmatiques. Ils en connaissent cependant les grands principes, que nous allons exposer dans la
fin de ce chapitre.
Le principe de dpart de la mthode axiomatique est
simple. On postule lexistence de certains objets, vrifiants certaines proprits appeles axiomes. Par postuler , il faut
comprendre quil sagit de se donner des rgles du jeu, que
lon accepte sans les questionner. Ensuite, les rsultats que lon
peut dmontrer partir de ces axiomes sont considrs comme
vrais dans la thorie .
Le premier exemple remonte lAntiquit, cest celui des
axiomes dEuclide pour la gomtrie. Euclide postule lexistence dobjets appels points et droites (et dautres encore), sachant quun point peut appartenir une droite. Ceci dans
le respect de certaines proprits, comme deux droites parallles une mme troisime sont parallles (et bien sr,
dans cette thorie lexpression tre parallles est elle-mme
dfinie, laide de concepts premiers comme lappartenance
dun point une droite). Toute la gomtrie est dduite de ces
axiomes.
En principe, comme le disait Hilbert, on pourrait remplacer
point par table , droite par chaise , et appartenir
par nimporte quel verbe, et on pourrait toujours dvelopper
la thorie, de manire purement formelle. Ceci est vrai ; ce ne
sont que des mots. Toutefois, il faut se garder de prendre ceci
trop au srieux : les axiomes ont t choisis parce quEuclide a
lintuition que le monde rel comporte des points et des droites
(ou au moins des segments), et parce quil souhaite considrer
chaque rsultat vrai dans la thorie comme une assertion
vraie sur le monde rel.
Lavantage de la mthode axiomatique est de couper court
aux dbats sur lexistence des objets de dpart. On suppose
quils existent, vrifiant certaines proprits, le reste nest que
dduction. Celui qui doute de lexistence de ces objets peut
entrer dans un dbat philosophique, par ailleurs intressant,
mais il ne peut pas critiquer le travail mathmatique de ceux
qui ont choisi ces axiomes (sauf montrer que les axiomes
sont contradictoires et que lon peut en dduire des choses ab-

20

surdes, comme un nonc et son contraire simultanment, par


exemple).
On continue de nos jours employer la mthode axiomatique, mme si les mathmatiques modernes ne reposent
plus sur les axiomes dEuclide. Il existe plusieurs systmes
daxiomes possibles, et dans loptique de ce livre il nest absolument pas utile den comprendre les diffrences, ni mme
den dcrire un en dtail. Citons tout de mme :
1. Le systme de larithmtique de Peano. On choisit ici de
prendre les nombres entiers comme objets de dpart, et
on suppose quils vrifient certaines proprits comme
tout nombre n possde un successeur n + 1 . On dduit
tout le reste.
2. La thorie des ensembles de Zermelo & Fraenkel. Les objets
de dparts sont les ensembles et les axiomes sont, en gros,
les proprits dcrites dans la premire partie de ce chapitre.
3. Il existe aussi un systme qui part des fonctions comme
objets primaires.
Les thormes que lon peut obtenir dans un systme sont
en gnral dmontrables dans les autres systmes. Ce nest pas
exactement vrai, et on obtient des rsultats un peu plus forts
avec la thorie des ensembles quavec larithmtique ; mais les
diffrences sont subtiles et nous nen parlerons pas plus. Ceci
signifie qutant donn un systme de dpart, disons la thorie des ensembles, il faut pouvoir dfinir les objets des autres
systmes, comme les nombres entiers ou les fonctions.
Dans ce cours, on ne va pas sencombrer de telles considrations, et nous considrerons comme connus aussi bien les
ensembles que les nombres entiers.

21

Chapitre 2

Nombres
Premire lecture
Les premiers nombres
Le premier ensemble de nombres notre disposition est celui des nombres naturels :
N = {0, 1, 2, 3, . . .} .
Puis vient lensemble des nombres relatifs Z, qui contient N,
et comprend galement les nombres ngatifs comme 4. Enfin
nous avons lensemble des nombres rationnels Q, cest--dire
p
lensemble des fractions q avec p, q Z et q , 0. Noter les inclusions N Z Q.
Dans le chapitre prcdent nous avons expliqu que nous
ne dfinirons pas lensemble N, considr comme naturel (do
son nom). Par contre on peut parfaitement donner une dfinition des ensembles Z et Q partir de N : voir lencadr Une
dfinition de Q . Quoi quil en soit, nous pouvons considrer
que nous sommes laise avec les nombres rationnels.
A-ton besoin dautres nombres que des rationnels ? La question remonte aux Grecs de lAntiquit. Les difficults apparaissent peu prs ainsi. Les nombres doivent au minimum

22

tre capables de mesurer les aires et les longueurs des objets


qui nous entourent (cest un petit anachronisme car les Grecs
ne pensaient pas (encore) aux aires comme des nombres, mais

Une dfinition de Q
Imaginons quelquun qui connaisse
lensemble Z mais pas Q : comment le lui dcrire ? ( titre dexercice vous pourrez ensuite dcrire Z
quelquun qui connait N).
On peut facilement imaginer dfinir
une fraction comme tant une paire
de nombres (p, q) Z Z avec q ,
0, avec la convention que (p, q)
et (a, b) reprsentent la mme fraction lorsque bp = aq, puisque
p a
= bp = aq .
q b
En tant tout--fait prcis, on est
amen la dfinition suivante,
tonnamment complique : tant
donne une paire (p, q) de nombres
avec q , 0, la fraction dfinie par ce
couple est lensemble
Fp,q = {(a, b) ZZ | b , 0 et pb = aq} .

cet argument est visiblement symtrique, donc de la mme manire on


a Fa,b Fp,q , et on conclut que Fp,q =
Fa,b comme on le souhaitait.
Rciproquement, comme (a, b)
Fa,b , lgalit Fp,q = Fa,b entrane pb = aq.
Nous avons donc donn une dfip
nition du symbole q qui obit au
moins une rgle que nous attendons, la rgle du produit en croix .
Pour dfinir Q, il reste du travail : il
faut expliquer laddition et la multiplication.
On pourrait croire que cest facile. Soient F1 et F2 deux fractions.
p
Choisissons (p, q) tels que F1 = q
(cest possible par dfinition dune
fraction), puis choisissons (a, b) tels
que F2 = ba .
On pose alors

On dcide dcrire q au lieu de Fp,q ,


par simplicit.
Maintenant si (a, b) vrifie pb = aq,
on peut dmontrer que
p a
= .
q b
Faisons-le : montrons que Fp,q = Fa;b .
Cest une galit densembles ! Soit
donc (x, y) un couple de nombres entiers avec y , 0. Si (x, y) Fp,q , on
a py = xq. Multipliant par b, on obtient pby = xbq. Or on a suppos
que pb = aq, donc on a aqy = xbq. En
simplifiant par q qui est non-nul, on
en tire ay = xb, cest--dire (x, y)
Fa,b . Ceci montre que Fp,q Fa,b ;

F1 + F2 =

pb + aq
,
qb

et
F1 F2 =

pa
.
qb

(On fait ceci videmment en penp


p
sant aux formules pour q + ba et q
a. )
b
Malheureusement il reste des vrifications faire : il faut bien sassurer
que le rsultat ne dpend pas des
choix que nous sommes obligs de
faire pour (p, q) et (a, b), qui ne sont
pas les seuls reprsentants de leur
fraction. Nous laissons ces dtails
au lecteur.

23

lide est la mme). Imaginons donc un triangle rectangle et


isocle, dont le petit ct est de longueur 1, comme ci-dessous.

Le dessin suivant doit nous convaincre, si lon sait que laire


dun rectangle sobtient en multipliant les longueurs de ses cts, que laire de notre triangle est 21 :

Maintenant, notons ` la longueur de lhypotnuse (le grand


ct du triangle), et considrons ce dernier dessin, obtenu
partir de 4 copies du triangle initial :

24

Laire du carr est `2 ; manifestement, cest 4 fois laire du


triangle, donc 4 21 = 2. On doit donc avoir
`2 = 2 .
Cest ici que les problmes commencent :
Proposition 2.1 Il nexiste aucun nombre rationnel ` Q tel
que `2 = 2.
Dmonstration. Supposons par labsurde que lon ait ` =
`2

p2

p
q

tel

2q2 .

que
= 2, donc
=
Quitte simplifier la fraction un
certain nombre de fois par 2, on peut supposer que p et q ne
sont pas tous les deux pairs.
Maintenant si lon observe la relation p2 = 2q2 , on voit
que p2 est pair ; donc p est pair galement, ce que lon va
crire p = 2r. Par suite p2 = 4r2 = 2q2 , donc q2 = 2r2 .
On en conclut que q2 est pair, donc q aussi. Cest une contradiction.
Que faut-il en conclure ? Tout simplement que les nombres
rationnels ne sont pas assez comptents pour dcrire le monde
rel. Pour tre plus prcis, si lon veut assigner des nombres
aux longueurs et aux aires, de sorte que certaines proprits
souhaitables soient satisfaites (par exemple en sassurant que
laire dun rectangle est le produit des longueurs), alors on ne
peut pas utiliser (seulement) les nombres rationnels.
La proprit de la borne suprieure
Nous venons de montrer
quil ny a pas de nombre rationnel digne dtre appel 2, et on pourrait avoir envie de rajouter simplement ce nombre au lyce on vous a bien appris
rajouter un nombre i tel que i 2 = 1. (Plus loin dans ce chapitre lexpression rajouter prendra un sens tout--fait
prcis

et simple.) Mais nous aurions pu faire de mme avec 3 ou 5,


de sorte quil semble y avoir une infinit de lacunes dans ce
systme de nombres quest Q.
Nous allons maintenant dcrire une proprit un peu abstraite des sous-ensembles de Q. Cest un peu dlicat, mais nous
25

allons mettre le doigt exactement sur le phnomne qui empche, entre bien dautres choses, les racines carres de certains
nombres dexister dans Q.
Dfinition 2.2 Soit A Q.
 Soit M Q. On dit que M est un majorant de A si a
A, a M.
 Soit M Q. On dit que M est le plus grand lment de A si
cest un majorant de A et si M A.
 En remplaant par , on obtient les notions de minorant
et de plus petit lment.
 Soit
B = {M Q | M est un majorant de A} .
Si B possde un plus petit lment b, on dit que cest la
borne suprieure de A et on note b = sup A.
 De mme, si lensemble des minorants de A possde un
plus grand lment, celui-ci est appel la borne infrieure
de A, note inf A.

On retient que le sup est le plus petit des majorants , de
mme que linf est le plus grand des minorants . Nous allons
voir que le sup et linf nexistent pas toujours, et cest bien l le
problme. Voyons quelques exemples.
Exemple 2.3 Soit
A = {x Q | 0 x < 1} .
Les minorants de A, pour commencer, sont tous les nombres m
tels que m 0, cest--dire quils forment lensemble
C = {m Q | m 0} .
Cet ensemble possde un plus grand lement, savoir 0. Cest
donc le plus grand minorant de A, et par dfinition on peut
crire inf A = 0. Ce nombre est galement le plus petit lment
de A.
Nous affirmons que lensemble des majorants de A est
B = {M Q | M 1} .
26

Montrons-le. Il est clair que les lments de B sont des majorants de A, et il faut montrer quil ny en a pas dautres. Soit
donc M un majorant quelconque, et supposons par labsurde
que M < 1. On a M 0 puisque 0 A, donc 0 M < 1. Considrons alors a = 21 (M + 1). On a M < a < 1, donc ce nombre sest
gliss entre M et 1, ce qui est absurde : on a a A donc on devrait avoir a M. Ainsi M 1 comme on souhaitait le montrer.
Lensemble B possde un plus petit lment, savoir 1. Cest
le plus petit majorant de A, de sorte que sup A = 1. Par contre A
na pas de plus grand lment.
Les bornes infrieure et suprieure de A sont donc 0 et 1
respectivement, et nous voyons sur cet example quil sagit
bien des bornes naturelles de A au sens intuitif. La diffrence sup A inf A = 1 0 = 1 donne une mesure de la taille
de A.
Exemple 2.4 Soit maintenant
A = {x Q | x2 2} .
Intressons-nous aux majorants de A, et notons comme dhabitude B lensemble quils forment. Cet ensemble est non-vide :
on a par exemple 10 B puisque tous les lments de A sont
10. En effet, un nombre x > 10 satisfait x2 > 102 = 100 > 2 et ne
peut pas tre dans A.
Pour les mmes raisons, on a 3 B puisque 32 = 9 > 2. Approchons nous encore : on voit que 32 B puisque ( 32 )2 = 94 > 2.
Bien. Supposons que B possde un plus petit lment ` ;
en dautres termes, supposons que A possde une borne suprieure. Que peut-on dire de `2 ? En particulier, ce nombre est-il
plus grand ou plus petit que 2 ?
Examinons lventualit `2 > 2. Notons = `2 2 > 0, et

prenons = 2`
. Si on calcule
(` )2 = `2 + 2 2` ,
on saperoit de la chose suivante : lingalit
2` 2 < 2` = = `2 2

27

entrane (` )2 > `2 + (2 `2 ) = 2. Le nombre M = ` est


donc un majorant de A puisque son carr est > 2, par le mme
raisonnement qui nous a servi montrer que 100, 3 et 32 sont
des majorants.
Mais cest absurde puisque M < ` et que ` est cens tre
le plus petit majorant ! Cette contradiction rfute lhypothse
selon laquelle `2 > 2, et on en tire `2 2.
On peut maintenant se demander si `2 < 2. Dans cette
hypothse, notons = 2 `2 > 0. Choisissons nimporte quel

nombre > 0 tel que lon ait la fois < 2` et < 4`


. On note
2
alors que < 2` et donc que
2 + 2` < 4` < .
Par suite, (` + )2 < `2 + = 2. Donc a = ` + est un lment
de A. Cest de nouveau absurde puisque a > ` alors que ` est un
majorant.
Il ne nous reste pas dautre choix que denvisager que `2 = 2.
Mais cest galement impossible en vertu de la proposition 2.1 !
Finalement, cette borne suprieure ` ne pourrait satisfaire
ni `2 < 2, ni `2 > 2, ni `2 = 2. On en arrive la conclusion que
lensemble A ne possde pas de borne suprieure.
Lensemble des rels
Voici un thorme (trs long !) qui affirme que lon peut corriger les dfauts de Q.
Thorme 2.5 Il existe un ensemble R, et un seul, ayant les proprits suivantes.
1. Proprits arithmtiques. R possde une addition et une
multiplication, et deux lments distingus nots 0 et 1, tels
que :
(a) x + y = y + x,
(b) 0 + x = x,
(c) (x + y) + z = x + (y + z),
(d) pour chaque x il existe un nombre not (x) tel que x +
(x) = 0,
28

(e) xy = yx,
(f) 1x = x,
(g) (xy)z = x(yz),
(h) x(y + z) = xy + xz.
(i) pour tout y , 0 il existe un nombre not y 1 ou
que

yy 1

1
y

tel

= 1.

2. Proprits dordre. Les lments de R peuvent tre compars. Plus prcisment, il y a une relation note telle que :
(a) tant donns x et y dans R, on a soit x y, soit y x,
(b) pour tout x on a x x,
(c) si x y et si y z, alors x z,
(d) si x y et y x alors x = y,
(e) si x y alors x + z y + z,
(f) si x y et si 0 z, alors xz yz.
De plus, on a la proprit fondamentale de la borne suprieure : si A R est une partie non-vide de R possdant au
moins un majorant, alors elle possde une borne suprieure.
De mme toute partie non-vide minore possde une borne
infrieure.
3. Relation avec Q. On a Q R, et les oprations usuelles daddition, de multiplication et dordre dans Q concident avec
celles calcules dans R.
De plus, pour tout a, b dans R tels que a < b, il existe x Q
tel que a < x < b.
Nous allons commenter ce thorme point par point. Mais
la premire chose remarquer, cest quil sagit dun rsultat
trs abstrait : on affirme quil existe un ensemble un peu plus
gros que Q, ayant toutes les qualits de ce dernier, et possdant
en plus toutes les bornes suprieures que lon puisse dsirer.
Pourquoi noncer lexistence de cet objet plutt que lexhiber
directement ?
Tout simplement, parce que cest trs difficile, et dailleurs
nous ne parlerons pas de la dmonstration du thorme (qui
29

donne une construction explicite, mais longue et pnible). Par


contre le thorme est facile utiliser, et vous le faites depuis
longtemps.
Ce systme de nombres appel R tait inconnu des Grecs,
mme sils avaient conscience de limperfection de Q. Il faut
considrer la construction de cet objet, si abstrait et pourtant si
concrtement utile, comme un exploit de la pense humaine.
Nous allons voir tout au long de ce livre que les nombres
rels (les lments de R) sont parfaitement adapts la
description du monde rel : ils peuvent mesurer les longueurs
et les aires sans mener des contradictions, par exemple. Nous
allons commencer par montrer que 2 possde une racine carre
dans R, bien sr.
Avant a, voici quelques remarques supplmentaires :
1. Les proprits arithmtiques vous sont familires. Il ny
a rien retenir vraiment, puisque vous les appliqueriez
sans rflchir. Mais puisque R est un ensemble abstrait, il
faut bien lister ces choses.
2. Mme remarque avec les proprits dordre. Notez bien
que nous avons employ les termes de majorants, bornes
suprieures, etc, dans R, et il est entendu quon donne
ces expressions le mme sens que dans la dfinition 2.2.
3. La troisime srie de proprits est essentielle pour lunicit de R (en effet il existe des systmes de nombres encore plus gros ayant encore toutes les autres proprits).
On dit parfois que Q est dense dans R pour exprimer
le fait quentre deux rels a et b, aussi proche que lon
veut, il y aura toujours un rationnel x.
Voici enfin le rsultat qui indique que les racines carres
existent dans R.
Proposition 2.6 Soit a R un nombre positif, cest--dire a 0.
2
Alors il existe un nombre
x R, et un seul, tel que x 0 et x = a.
On note ce nombre a et on lappelle la racine carre de a.
Dmonstration. Dans cette dmonstration, nous allons de
nombreuses reprises indiquer quelles proprits du thorme
2.5 nous sont utiles, mme les plus videntes, pour que vous
30

Pour la
dmonstration,
voir le trs bon
article
Construction
des nombres
rels sur
Wikipedia.

voyiez bien que les raisonnements habituels reposent toujours


sur ces quelques rgles. Par la suite on ne donnera pas tant
de dtails, videmment. Dailleurs vous allez voir que lon ne
va pas indiquer toutes les proprits que lon utilise : a serait
long et pnible suivre, aussi vous laisse-t-on le soin de vrifier
toutes les tapes.
Voyons dabord lunicit. Soit donc x0 0 tel que x20 = a, et
cherchons tous les x 0 tels que x2 = a. On a
x2 = a

x2 x20 = 0 ,
(x x0 )(x + x0 ) = 0 .

(Pourquoi cette factorisation est-elle valide ?) Lorsquun produit ab de deux nombres rels a et b vaut 0, lun de ces nombres
doit tre nul : en effet si a , 0, alors 1a existe daprs le (1)(i) du
thorme 2.5, et en multipliant par 1a on obtient 1a (ab) = ( 1a a)b =
1b = b = 1a 0 = 0 (nous avons utilis les proprits (1)(g), puis
(1)(i), puis (1)f ; le fait que x0 = 0 pour tout x se montre partir
des proprits : faites-le !) Donc b = 0.
Ici (avec a = x x0 et b = x + x0 ) on voit que x = x0 ou x =
x0 . Comme 0 x0 , on observe en ajoutant x0 de chaque ct
que x0 0 (proprit (2)(e) du thorme). Ainsi, dans le cas
o x = x0 , on constate que x est la fois 0 et 0 ; cest donc
que x = 0 par la proprit (2)(d), do x = x0 = 0. Finalement x =
x0 quoi quil arrive, et lunicit est dmontre.
Passons lexistence. Sans surprise, on pose
A = {x R | x2 a} .
Si lon trouve un nombre M tel que M2 > a, alors ce sera un
majorant de A. (Pour vrifier ceci, dmontrez que si x M,
alors x2 M2 lorsque M 0.) Or on peut tout simplement
prendre M = a si a > 1, et M = 1 si a < 1 (pour le cas a = 1,
la proposition est videmment vraie). .
Puisque lon est dans R, on sait que A possde une borne
suprieure, en tant quensemble non vide (il contient 0) et major ; posons donc x = sup A. Il faut montrer que x2 = a. Nous
avons dj fait le raisonnement dans lexemple 2.4 dans le
cas o a = 2 ; en procdant exactement de la mme manire,
31

on trouve que x2 < a et x2 > a mnent des contradictions.


Donc x2 = a.
Par la suite, nous montrerons mme que tout nombre posi
1
tif a possde une unique racine n-ime note n a ou a n , cest-dire quil existe un unique nombre positif x tel que xn = a.
Vous pouvez essayer de dmontrer ce rsultat maintenant sur
le mme modle : cest un peu fastidieux, mais on y arrive.
Nous allons prfrer dduire le rsultat du trs utile thorme des valeurs intermdiaires (6.8), qui montrera tout son
intrt.
Terminons avec les rels en montrant la trs utile ingalit triangulaire . On dfinit, pour x R, sa valeur absolue |x|
par |x| = x si x 0 et |x| = x sinon. Autrement dit, |x|
est le plus
grand des deux nombres x et x (ou encore, |x| = x2 comme
vous pouvez maintenant le montrer).
Lemme 2.7 (Ingalit triangulaire) Si a et b sont des rels, on
a
|a + b| |a| + |b| .
Dmonstration. Comme a |a| et pareil pour b, en additionnant
on trouve a + b |a| + |b|. De mme a |a| et pareil pour b,
do (a + b) |a| + |b|. Comme |a + b| est soit a + b soit (a + b),
linegalit est assure dans tous les cas.
Corollaire 2.8 (Deuxime ingalit triangulaire) Si a et b
sont des rels, on a
| |a| |b| | |a b| .
Dmonstration. En appliquant lingalit triangulaire classique
a et b a, on obtient
|b| = |a + (b a)| |a| + |b a| ,
do |b| |a| |b a|. En inversant les rles de a et b, on obtient |a| |b| |a b|. Ceci donne bien le rsultat puisque |b a| =
|a b|, et | |a| |b| | = (|a| |b|).

32

Les nombres complexes


Nous navons pas encore toutes les racines carres que lon
pourrait souhaiter : il manque encore les racines des nombres
ngatifs. En effet si x R, alors x2 0, et donc par exemple il
ny a pas de nombre rel dont le carr serait 1. Il nous faut
donc un systme de nombres encore plus tendu.
Cette fois-ci, les choses sont beaucoup plus simples. Nous
allons voir quil suffit de rajouter un nombre i tel que i 2 =
1, et toutes les racines carres imaginables sont obtenues et
mme bien plus.
Comment donc rajouter ce i ? Si notre nouveau systme
de nombres contient R et un tel nombre i, alors il doit contenir
des nombres de la forme x+iy avec x, y R. De plus si les rgles
usuelles de calcul sappliquent (ce que lon souhaite), on doit
avoir
(x + iy) + (x0 + iy 0 ) = (x + x0 ) + i(y + y 0 ) ,
ainsi que
(x + iy)(x0 + iy 0 ) = (xx0 yy 0 ) + i(xy 0 + x0 y) .
Ceci motive la dfinition suivante.
Dfinition 2.9 Sur le produit cartsien R R, on dfinit une
addition par
(x, y) + (x0 , y 0 ) = (x + x0 , y + y 0 ) ,
et une multiplication par
(x, y)(x0 , y 0 ) = (xx0 yy 0 , xy 0 + x0 y) .
Muni de ces deux oprations, lensemble R R est not C, et
appel ensemble des nombres complexes.

Voyons pourquoi cette dfinition est la bonne. Si x, x0 sont
rels, on a
(x, 0) + (x0 , 0) = (x + x0 , 0)

et

(x, 0)(x0 , 0) = (xx0 , 0) .

Donc lensemble des nombres complexes de la forme (x, 0) se


comporte exactement comme lensemble R. On peut identifier
33

ces deux ensembles sans risque de confusion, et lorsque x R


on crira galement x pour le nombre complexe (x, 0). (Le lecteur qui a pris connaissance de la dfinition 1.13 parlera plutt
dune bijection x 7 (x, 0), qui se trouve tre compatible avec les
opration arithmtiques.)
Ensuite, posons i = (0, 1). On a bien
i2

= (0, 1)(0, 1)
= (1, 0)
= 1 .

Enfin, pour tout rel y, on a iy = (0, 1)(y, 0) = (0, y). Finalement tout nombre complexe (x, y) peut scrire (x, y) = (x, 0) +
(0, y) = x + iy.
On vient de montrer que R C, que C contient une racine
de 1, et visiblement C ne pouvait pas tre plus petit. Tout se
passe dcidment bien, puisquon a le rsultat suivant :
Proposition 2.10 Lensemble C satisfait les neuf proprits (1)
(a-b-c-d-ef-g-h-i) du Thorme 2.5. En dautres termes, les rgles
de calcul usuelles sappliquent.
Dmonstration. Ce sont des vrifications videntes, sauf la (1)(i).
tant donn z = x + iy un nombre complexe non-nul, il faut
trouver un nombre complexe w tel que zw = 1. Un tel nombre,
sil existe, serait videmment unique, et ce serait z1 .
On appelle conjugu de z le nombre z = x iy. On a zz =
x2 + y 2 ; pce dernier nombre est un rel positif, on peut noter |z| = x2 + y 2 , que lon appelle le module de z. Notons que
1
lorsque z , 0, on a |z| > 0 ; en particulier |z|
existe.
Soit alors
w=

y
z
x
= 2
i 2
.
2
2
|z|
x +y
x + y2

Cest bien un nombre complexe, et on a zw =


z1 .

zz
zz

= 1. Donc w =

Remarque 2.11. Lopration de conjugaison que nous venons


dutiliser possde de bonnes proprits : en effet z + w = z + w
34

et zw = zw pour tout z, w C, comme on le vrifie facilement.


Par suite on a
|zw|2 = zwzw = zzww = |z|2 |w|2 .
En prenant les racines carres de ces nombres rels, on a galement |zw| = |z| |w|.
Nous naurons plus besoin de chercher de systme de nombres
plus grand pour obtenir des racines carres. En effet :
Proposition 2.12 Tout nombre complexe w C non-nul possde
exactement deux racines carres, qui sont opposes.
Opposes signifie que lon a deux racines z et z, et aucune autre.
Dmonstration. Il est trs facile de voir que si w possde une
racine z0 , alors il en possde exactement deux : en effet
z2 = w

z2 z02 = 0
(z z0 )(z + z0 ) = 0
z = z0 ou z = z0 .

Pour lexistence, crivons w = a+ib, et cherchons un nombre z =


x + iy tel que z2 = w. Ceci revient rsoudre
(
x2 y 2 = a
(1)
2xy = b
(2) .
Il est astucieux ici de regarder les modules : on doit avoir |z|2 =
|z2 | = |w|, et donc

(3) .
x2 + y 2 = a 2 + b 2
En faisant (1) + (3) on tire

a + a2 + b2
x =
.
2
Le membre de droite est un rel 0, donc cette dernire quation a bien des solutions, ce qui donne deux choix opposs
pour x. De mme en faisant (3) (1) on obtient

a + a2 + b2
2
.
y =
2
2

35

L encore on a deux possibilits pour y.


Quels que soient les choix, lquation (1) est satisfaite ;
quant lquation (2), on est seulement assur davoir 4x2 y 2 =
b2 et donc 2xy = b. Il suffit alors dajuster le signe de x ou de y
pour satisfaire (2).
Exemple 2.13 Soit w = 12i, et cherchons z = x+iy tel que z2 =
w. Comme dans la dmonstration, on constate que lon doit
avoir
2

x y2 =
1

2xy
=
2

x2 + y 2 =
5.
Toujours en suivant le modle de la dmonstration, on en dduit

1+ 5
1 + 5
2
2
x =
et y =
.
2
2
Lquation 2xy = 2 nous dit que x et y doivent tre de signes
opposs. On peut donc prendre
s
s

1+ 5
1 + 5
et y =
.
x=
2
2
Les deux solutions sont alors x + iy et x iy.
On sait mme rsoudre dans C des quations un peu plus
compliques :
Proposition 2.14 Soient a, b et c trois nombres complexes avec a ,
0, soit = b2 4ac, et enfin soit C tel que 2 = .
Alors lquation
az2 + bz + c = 0
possde exactement deux solutions lorsque , 0, donnes par :
z=

b
.
2a

Dans le cas o = 0, ces deux solutions se confondent et il ny en


a pas dautres.

36

Dmonstration. On crit simplement


az2 + bz + c = 0

4a2 z2 + 4ab z + 4ac = 0


(2az + b)2 + 4ac b2 = 0
(2az + b)2 = ,

et donc 2az + b doit tre .


ce stade, vos souvenirs de Terminale vous poussent sans
doute attendre une description de la forme polaire , la fameuse criture z = ei . En ralit, pour expliquer rigoureusement ce quil se passe, il va falloir patienter : il nous faut
dabord voir une quantit dautres rsultats. En contrepartie,
quand nous arriverons enfin criture, nous aurons des vraies
dfinitions du cosinus et du sinus, entre autres choses.
Vous pouvez toutefois aller voir tout de suite le passage
intitul Forme polaire et racines n-imes , dans le chapitre
Lexponentielle (page 185). Vous pourrez ainsi vous rappeler vos notations de Terminale, qui vous seront peut-tre ncessaires trs vite en Physique.

Deuxime lecture
Calculs sur machine et corps
Les systmes de nombres R et C semblent rpondre tous
nos besoins en thorie. En pratique par contre, les choses ne
sont pas aussi simples. Ds que lon commence faire des calculs un peu longs, le besoin de confier la tche un ordinateur se fait sentir. Or, les nombres rels sont trs abstraits, nous
lavons dit ; tout ce quune machine va savoir faire, cest utiliser
des approximations, comme par exemple
x = 1.414213 =

1414213
1000000

pour approcher 2. En fait les machines ne connaissent que Q


(et encore, avec des limitations sur la taille des nombres entiers employs en fonction de la mmoire, mais on peut laisser
37

ce problme de ct). Ces approximations sont une source derreur importante. Ainsi si lon calcule
x32 = 65535, 1660562286
32
on est bien loin de 2 = 216 = 65536. Mme en sachant
que x32 est cens approcher un nombre entier, arrondir lentier le plus proche ne donne pas la bonne rponse ! Aussi, notons que 7 chiffres de x sont corrects, alors que seulement 4
chiffres de x32 sont corrects.
Cependant, admettons que lon entreprenne une srie de
calculs, dans lesquelson est certains de nutiliser que des
nombres rationnels et 2, mais rien dautre. On peut tout simplement apprendre
lordinateur manipuler les nombres de

la forme a + b 2 avec a, b Q. En effet il suffit de stipuler les


rgles suivantes :

(a + b 2) + (a0 + b0 2) = (a + a0 ) + (b + b0 ) 2 ,
et

(a + b 2)(a0 + b0 2) = (aa0 + 2bb0 ) + (ab0 + a0 b) 2 .

On conoit bien comment un ordinateur peut considrer ces


nombres commes des paires (a, b) de rationnels et oprer les
additions et multiplications directement sur ces paires (un peu
comme dans notre dfinition de C avec des paires de rels).
Voil un nouveau systme de nombres qui apparat naturellement, et sur le mme modle on en entrevoit une infinit. Il est
temps de leur donner des noms prcis.
Dfinition 2.15 On dit que lensemble K est un anneau lorsquil est muni dune addition
K K
(x, y) 7

K
x+y

et dune multiplication
K K
(x, y) 7
38

K
xy

Anneau est
une mauvaise
traduction de
lAllemand
Ringe, qui
signifie
cercle , dans le
sens de
communaut .

ainsi que de deux lments nots 0 et 1, tels que les proprits


suivantes sont satisfaites :
(a) x + y = y + x,
(e) x(y + z) = xy + xz
(b) 0 + x = x,
et (x + y)z = xz + yz,
(c) (x + y) + z = x + (y + z),
(f) 1x = x1 = x,
(d) x (x) tel que x + (x) = 0, (g) (xy)z = x(yz).
Lorsque de plus on a
(h)

xy = yx ,

on dit que K est un anneau commutatif.


Finalement, si en plus des proprits (a-b-c-d-e-f-g-h) on a
galement
(i) x , 0 x1 tel que xx1 = 1 ,
on dit que K est un corps.
En dautres termes, dans un corps les rgles usuelles darithmtique doivent sappliquer.

Exemple 2.16 Les ensembles Q, R et C, avec les oprations
usuelles, sont des corps.

Exemple 2.17 Soit K = {a + b 2 | a, b Q} avec les oprations


dfinies ci-dessus. On va montrer que K est un corps. En fait
les oprations sont hrites de celles de R (notez que lon
a K R), et par consquent les proprits a-b-c-d-e-f-g-h sont
automatiquement satisfaites. Mais il en manque
une !
En effet, il nest pas vident que si x = a+b 2 K, alors x1
K lorsque x , 0 (on est simplement certain que x1 existe
dans R). Cependant un petit calcul nous rassure :

ab 2
1
1
=
=

x a+b 2
(a + b 2)(a b 2)

a
b
=
+
2 K.
a2 2b2 a2 2b2
Un avertissement.Nous avons multipli numrateur
et dnominateur par a b 2, et ceci na un sens que si a b 2 , 0. Or
39

Lexpression
corps
lorigine tait
comprise dans le
sens dun corps
de mtier, ou
dun corps
darme.


dans le cas contraire, on aurait 2 = ba avec a et b rationnels, ce
qui est impossible daprs la proposition
2.1.
Ce corps est not gnralement Q[ 2].
Exemple 2.18 Lensemble Z est un anneau commutatif, mais
ce nest pas un corps. En effet la proprit (i) de linverse nest
pas satisfaite, par exemple 12 < Z.
Il va falloir attendre le chapitre 5 pour avoir un exemple
danneau non-commutatif.
Arithmtique de lhorloge
Nous allons donner dautres exemples de corps, qui ne
possdent quun nombre fini dlments. Ils sont utilis extrmement souvent en thorie des nombres, en informatique,
en cryptographie, etc.
Lide de dpart est simple. Lorsquil est 23h et quon attend un vnement qui doit se drouler 4h plus tard, on calcule
rapidement quil aura lieu 3h du matin. Sil est 19h et que lon
a 7h attendre, on sait bien que cela va nous amener 2h du
matin. Le raisonnement que lon fait sans y penser consiste
additionner les deux nombres (on obtient 27 dans le premier
cas, et 26 dans le deuxime), puis retrancher 24 puisque les
journes reprennent 0 ce moment-l.
On dit que lon calcule modulo 24. Vous savez aussi spontanment calculer modulo 12 : il suffit de ne pas diffrencier
le matin et laprs-midi, comme lorsquon vous demande dattendre pendant 5h partir de 11h et que vous savez presque
immdiatement que vous en avez jusqu 4h (de laprs-midi).
L encore on fait 11 + 5 = 16 puis 16 12 = 4 puisque lon veut
un rsultat entre 0 et 12.
On va dfinir maintenant des oprations modulo N, pour
tout entier N 2, sur le mme modle. Rappelons avant de
commencer ce quest une division euclidienne : tant donns
deux nombres entiers a et b, vous savez que lon peut trouver
deux nombres entiers q (le quotient) et r (le reste), uniques, tels
que
a = bq + r ,
40

et 0 r < b. Par exemple, en faisant la division de 16 par 12 on


crit 16 = 12 1 + 4 donc q = 1 et r = 4.
Dfinition 2.19 Sur lensemble {0, 1, 2, . . . , N1} on dfinit une
addition par
x y = le reste dans la division euclidienne de x + y par N ,
et une multiplication par
x y = le reste dans la division euclidienne de xy par N .
On crit Z/NZ pour dsigner lensemble {0, 1, 2, . . . , N 1} muni
de ces oprations.

Exemple 2.20 Prenons N = 24. Si lon voit 23 et 4 comme des
lments de Z/24Z, on peut calculer 23 4. Comme
23 + 4 = 27 = 24 1 + 3 ,
on a 23 4 = 3. De mme :
23 4 = 92 = 24 3 + 20 ,
donc 23 4 = 20.
Exemple 2.21 Prenons N = 2 ; on a maintenant Z/2Z = {0, 1}.
Le seul calcul un peu tonnant est 1 1 = 0 : en effet
1 + 1 = 2 = 2 1 + 0.
Sinon on a sans surprise 0 0 = 0, et 0 1 = 1 0 = 1. La multiplication ne vous tonnera pas non plus. crivons les rsultats
complets sous forme de tableaux :
0
0 0
1 1

1
1
0

et

0
0 0
1 0

1
0
1

Peut-on appliquer les rgles de calcul usuelles avec Z/NZ ?


Pour vrifier ceci, dfinissons la fonction reste :
R:Z
x

Z/NZ
R(x) = le reste dans la division de x par N .
41

Proposition 2.22 On a
R(x + y) = R(x) R(y)

et

R(xy) = R(x) R(y) .

Dmonstration. crivons les divisions euclidiennes x = Nq1 +


R(x) et y = Nq2 + R(y). En additionnant on trouve
x + y = N(q1 + q2 ) + (R(x) + R(y)) .
Il se peut que R(x) + R(y) soit N ; crivons donc une nouvelle
division
R(x) + R(y) = Nq3 + r .
Ici par dfinition le reste r = R(x) R(y). En regroupant :
x + y = N(q1 + q2 + q3 ) + r ,
et 0 r < N, donc r est bien le reste dans la division euclidienne
de x + y par N. Cest--dire que r = R(x + y) = R(x) R(y).
On procde de mme pour la multiplication.
Corollaire 2.23 Les proprits de calcul (a-b-c-d-e-f-g-h) sont
valables dans Z/NZ, pour laddition et la multiplication .
(En dautres termes, Z/NZ est un anneau commutatif.)
Dmonstration. Soit x, y et z des entiers. Puisque x(yz) = (xy)z,
en appliquant la fonction R on a R(x(yz)) = R((xy)z), ce qui
donne en utilisant la proposition
R(x) R(yz) = R(xy) R(z) ,
puis
R(x) (R(y) R(z)) = (R(x) R(y)) R(z) .
Par suite, la multiplication est associative (proprit (g)). On
fait pareil pour les autres proprits.
Lensemble Z/NZ est-il un corps ? En dautres termes, que
peut-on dire de la rgle (i) de linverse ? Voyons des exemples.
Exemple 2.24 Pour N = 2, le seul lment non-nul de Z/2Z
est x = 1. On a x x = 1, donc x1 existe et on a mme x1 = x.
Ainsi Z/2Z est un corps.
42

Exemple 2.25 Prenons N = 24. Comme


3 8 = 24 = 24 1 + 0 ,
on a 3 8 = 0. On en dduit que linverse de 3 nexiste pas : en
effet si lon avait un lment 31 tel que 31 3 = 1, on aurait
31 (3 8) = (31 3) 8 = 1 8 = 8 = 0 .
Or 8 , 0. Donc Z/24Z nest pas un corps.
Dans le chapitre suivant nous allons dterminer les valeurs
de N telles que Z/NZ est un corps. Vous pouvez essayer de deviner la rponse.
Nous allons conclure ce chapitre par une simplification des
notations. Il est clair qucrire x y et x y va devenir fatigant
trs vite, donc on va noter x + y et xy. Ceci introduit quelques
ambiguts (penser au fait que 8 + 4 = 0 dans Z/12Z . . . ), mais
une autre convention va compenser. On va en effet utiliser la
notation x = R(x). Il ne faut pas confondre avec la conjugaison
complexe, mais puisque la proposition 2.22 nous dit que
x+y = x+y

et

xy = x y ,

la notation se comporte comme prvu. On va alors sastreindre


mettre la barre systmatiquement sur les nombres, et donc
crire
8 + 4 = 0,
dans Z/12Z. Et ce, mme si 8 = 8. . . Cest la prsence des barres
qui, par convention, signifie que les calculs sont faits avec un
modulo. Dailleurs on devrait penser 8 et 8 comme des
objets totalement diffrents, lun dans Z/12Z, lautre dans Z.

43

Chapitre 3

Polynmes
Dans ce chapitre, la lettre K dsigne Q, R ou C.

Premire lecture
Dfinitions & Notations
Dfinition 3.1 Donnons-nous un symbole X. Un polynme
en X coefficients dans K est une expression formelle
a0 + a1 X + a2 X2 + + an Xn
avec an , 0. Lentier n est appel le degr du polynme.
Lensemble de ces polynmes est not K[X], et le sousensemble des polynmes de degr n est not Kn [X].

Les termes symbole et expression formelle sont
comprendre de manire intuitive : disons quun polynme est
une criture. Si vous trouvez a insatisfaisant, essayez lencadr
Dfinition complte des polynmes .
Par exemple, P = 3X2 5X + 1 est un polynme de Q[X],
et Q = X3 + iX2 7 C[X].
Lorsque lon dispose dun polynme P K[X] et dun lement x K, on peut donner un sens P(x). Sans surprise, si
P = a0 + a1 X + + an Xn ,
44

Le lecteur ayant
assimil la
dfinition 2.15
peut prendre
pour K
nimporte quel
corps.

alors

P(x) = a0 + a1 x + + an xn .

On dit que lon value P en x. Si P = X2 +1, alors P(2) = (2)2 +

Dfinition complte des polynmes


En deux mots, un ordinateur nous
dirions quun polynme est dfini
par ses coefficients, et puis nous indiquerions les rgles de calcul sur
ces coefficients. Voici les dtails.
Considrons les fonctions N K.
Une telle fonction a sera note

X3 = X X2 = (0, 0, 0, 1, 0, . . .) ,
et de mme on constate que Xn est
reprsent par une suite de 0, sauf
la position n o lon trouve un 1.
Finalement, soient a0 , a1 , . . . , an des
lments de K. Si lon calcule a0
a1 X an Xn , on trouve

a = (a0 , a1 , a2 , . . .) ,

(a0 , a1 , . . . , an , 0, 0, 0, . . .) .

avec an = a(n).
On dfinit une addition le plus
simplement du monde : si b =
(b0 , b1 , . . .), alors nous dfinissons
a b = (a0 + b0 , a1 + b1 , a2 + b2 , . . .) .
Dfinissons maintenant une multiplication , qui parat bien plus tordue : a b = (c0 , c1 , c2 , . . .), o
cn =

n
X

On peut finalement dfinir K[X]


comme tant lensemble des
suites a : N K telles que a(k) = 0
pour tous les k suprieurs un certain n N appel le degr. Les oprations sont celles ci-dessus, et on
va crire P+Q et PQ au lieu de PQ
et P Q, pour simplifier. On vrifie
alors que tout polynme P scrit de
manire unique

ap bnp .

P = a0 + a1 X + + an Xn .

p=0

(On appelle ceci la formule de Cartan .)


On peut vrifier directement que
lensemble des fonctions N K,
avec ces oprations, est un anneau
commutatif (cf dfinition 2.15).
Premire remarque : en identifiant x K avec la suite (x, 0, 0, 0, . . .),
on peut considrer que K est
contenu dans cet ensemble de
suites.
Soit maintenant X = (0, 1, 0, 0, 0, . . .),
cest--dire X(n) = 0 sauf si n = 1,
et X(1) = 1. Essayons quelques calculs :
X2 = X X = (0, 0, 1, 0, 0, . . .) ,

Par analogie, une suite quelconque a : N K peut tre note


X
an Xn ,
n0

et appele une srie formelle, lorsquon veut faire rfrence aux oprations daddition et de multiplication que lon vient de dfinir. Attention cependant : cette notation
ne doit pas donner lillusion dune
somme infinie ou dun passage
la limite (dailleurs nous navons pas
encore tudi les limites !).
On note K[[X]] lensemble des sries formelles.

45

1 = 5, par exemple. Cette opration est tellement commune que


lon note souvent P(X) (au lieu de P tout simplement) pour un
lment de K[X], afin de rappeler cette possibilit dvaluer.
Un polynme donne naissance plusieurs fonctions. Prenons P = 7X5 12X3 ; on peut considrer la fonction
R
x 7

R
P(x) = 7x5 12x3 .

Mais on peut aussi regarder


C
z

C
P(z) = 7z5 12z3 ,

et il y aurait aussi la fonction [0, 1] R qui x associe P(x), etc


etc.
La division Euclidienne
On peut additionner et multiplier les polynmes de faon
naturelle. Il ne vous aura pas chapp quon ne peut pas toujours diviser : par exemple si P = X2 1 et Q = X + 2, il ny a pas
P
de polynme R qui mriterait de sappeler Q
, cest--dire quil
ny a pas de polynme R tel que QR = P. Pour montrer ceci, on
note que si R existait, il serait de degr 1, disons R = aX + b. Or
lquation QR = P donne en dveloppant :
aX2 + (2a + b)X + 2b = X2 1 ,
et en comparant les coefficients, on obtient a = 1, b = 1
2 , et 2a +
3
b = 2 = 0, contradiction.
Parfois, on peut avoir de la chance : pour le mme P, et
pour Q = X + 1, on a P = X2 1 = (X 1)(X + 1) = (X + 1)Q
P
donc Q
= X 1.
En gnral on dit que Q divise P lorsquil existe un polynme R tel que P = QR. Dans ce cas, et dans ce cas seulement,
P
on pourra noter R = Q
. On utilise la notation Q | P pour indiquer que Q divise P. Il faut se mfier de cette notation (standard malheureusement) qui apparat symtrique alors que les
rles de P et Q sont trs diffrents.
46

La situation des polynmes est trs similaire celle des


nombres entiers : on peut parfois diviser un entier par un autre,
parfois a ne tombe pas juste . Dans tout ce chapitre on va insister sur les similarits, et nous commenons par les divisions
Euclidiennes.
Rappelons que, si a et b sont des nombres entiers, il existe
deux nombres entiers q (le quotient) et r (le reste), uniques, tels
que
a = bq + r ,
avec 0 r < b.
Proposition 3.2 Soit A et B deux polynmes de K[X]. Alors il
existe deux polynmes Q (le quotient) et R (le reste), uniques, tels
que
A = BQ + R ,
avec deg R < deg B.
Dmonstration. Montrons lunicit. Si A = BQ + R et A = BQ0 +
R0 , en faisant la diffrence on obtient
B(Q Q0 ) = R0 R .
Le degr de R0 R est < deg B. On en dduit que Q Q0 = 0,
sinon le degr de B(Q Q0 ) serait deg B. Donc Q = Q0 et par
suite R = R0 .
Pour lexistence de Q et R, nous allons donner directement
une mthode de calcul.
Exemple 3.3 Prenons A = 4X3 2X2 + 1 et B = X2 + X + 1. On
commence par prsenter la division comme pour les nombres
entiers :

47

Puis on value en 4X3 , combien de fois X2 ? Rponse,


4X. On calcule alors 4X B = 4X3 + 4X2 + 4X, et lon soustrait ce
rsultat au polynme A. On prsente ces calculs de la manire
suivante :

On recommence avec en 6X2 , combien de fois X2 ? , rponse 6 :

Cest termin : lorsque lon obtient gauche un polynme


de degr infrieur celui de B, cest le reste, ici R = 2X + 7. Le
quotient est Q = 4X 6. On peut vrifier directement que A =
BQ + R.
Exemple 3.4 Les divisions Euclidiennes vont tre dune grande
utilit par la suite, mais pour linstant vous vous demandez
peut-tre quel intrt on pourrait bien avoir diviser des polynmes. Voici alors une petite astuce de calcul qui les fait
intervenir. Soit

1 + i 3
j=
.
2
Cest une solution de X2 + X + 1 = 0, cest--dire que j 2 + j +
1 = 0 (proposition 2.14). Combien
vaut 4j 3 2j 2 + 1 ? Si lon

commence par dvelopper ( 1+i2 3 )3 de manire nave, on va


perdre pas mal de temps. Alors que nous venons de dmontrer
que
4X3 2X2 + 1 = (4X 6)(X2 + X + 1) + 2X + 7 ,
48

3
2
ce qui donne
en valuant en X = j la rponse 4j 2j + 1 =
2j + 7 = 6 + i 3.
Notez bien que la division Euclidienne
ne fait intervenir

que des nombres entiers (et aucune 3), et quelle seffectue


trs vite, avec lhabitude. Vous aviez peut-tre russi calculer 4j 3 2j 2 + 1 rapidement en crivant j 2 = 1 j, donc j 3 =
jj 2 = 1. Bravo, mais la mthode de la division Euclidienne ne
fait rien dautre que dorganiser ces calculs. Avec des nombres
encore plus compliqus que ce j, il devient trs difficile de trouver des astuces au coup doeil.

Racines
Dfinition 3.5 Soit P K[X] un polynme, et soit r K. On
dit que r est une racine de P lorsque P(r) = 0. (Parfois on dit
que r est une solution de P, et parfois on dit (assez curieusement, dailleurs) que r est un zro de P.)

Proposition 3.6 Le nombre r K est une racine de P si et seulement si le polynme X r divise P dans K[X].
Dmonstration. On crit la division Euclidienne de P par X r :
P = (X r)Q + R .
Ici le degr de R doit tre < 1, donc R est de degr 0 (on dit que
cest une constante ). En faisant X = r, ceci devient P(r) = R,
donc finalement
P = (X r)Q + P(r) .
Il est alors clair que P(r) = 0 (X r) | P.
La dmonstration indique clairement que pour trouver exP
plicitement le polynme Xr
, le plus simple est deffectuer une
division Euclidienne.
Exemple 3.7 Soit P = 5X2 15X + 10. Ce polynme a deux
racines, savoir 1 et 2. Il doit donc tre divisible par X 1 en
particulier, et en faisant la division Euclidienne on obtient
5X2 15X + 10 = (X 1)(5X 10) = 5(X 1)(X 2) ,
ce qui confirme que P est galement divisible par X 2.
49

Dune manire gnrale, si P a une racine r1 on peut crire


P = (X r1 )Q1 , et si Q1 a une racine r2 on peut crire Q1 =
(X r2 )Q2 donc P = (X r1 )(X r2 )Q2 ; si Q2 a une racine r3
on aboutit P = (X r1 )(X r2 )(X r3 )Q3 . . . Peut-on continuer
comme a indfiniment ? En dautres termes, est-ce que chaque
polynme de K[X] va toujours possder au moins une racine
dans K ?
La rponse est non, tout dabord parce que les polynmes
constants, de la forme P(X) = c, avec c K, nont aucune racine si c , 0. Si maintenant deg P = n 1, on observe que les
degrs successifs de Q1 , Q2 , . . . , ne font que diminuer, donc si
lon peut trouver n racines succesivement comme ci-dessus le
polynme Qn sera de degr 0 donc constant et non-nul. On ne
peut alors pas continuer avec Qn .
Au passage nous avons presque dmontr le rsultat suivant :
Proposition 3.8 Un polynme de degr n ne possde pas plus
de n racines distinctes.
Dmonstration. Supposons en effet que lon ait n + 1 racines
distinctes, disons r1 , r2 , . . . , rn+1 . On commence par crire P =
(Xr1 )Q1 comme ci-dessus. Ensuite, puisque P(r2 ) = 0, on crit
P(r2 ) = (r2 r1 )Q1 (r2 ) = 0 ,
et comme r1 , r2 par hypothse, on doit bien avoir Q1 (r2 ) = 0.
On peut donc factoriser et obtenir Q1 = (X r2 )Q2 . On recommence avec Q2 , et ainsi de suite on aboutit
P = (X r1 )(X r2 ) (X rn+1 )Qn+1 .
Cette dernire galit est absurde puisque le membre de droite
a un degr n + 1.
Mais il ny a pas que les polynmes constants qui nont pas
de racines. Lexemple le plus fameux est P = X2 + 1 R[X] et
qui ne possde pas de racine dans R, puisque le carr dun rel
est toujours positif et ne saurait valoir 1. Dans le mme ordre
dide, le polynme Q = X2 2 Q[X] na pas de racine dans Q
daprs la proposition 2.1.
50

Dans un cas comme dans lautre, on peut considrer ces


polynmes comme des lments de C[X], et ils ont bien sr
des racines dans C. Rappelez-vous quen parlant de C nous
avions prdit que nous gagnerions bien plus que des racines
carres supplmentaires en travaillant avec les complexes. Le
thorme suivant affirme en effet que toute quation polynomiale P(z) = 0 a une solution dans C !
Thorme 3.9 (Thorme fondamental de lalgbre) Tout
polynme de degr 1 dans C[X] possde une racine dans C.
On dit que C est algbriquement clos . Nous montrerons
le thorme fondamental de lalgbre plus loin, dans un chapitre danalyse. On peut dj en tirer des consquences.
Corollaire 3.10 Tout polynme de C[X] de degr n peut scrire
de manire unique
P = (X r1 )(X r2 ) (X rn+1 ) .
Dmonstration. Lexistence de cette criture est claire ce stade,
mais comme nous nonons lunicit aussi on va prudemment
faire une rcurrence. Supposons le rsultat vrai pour les polynmes de degr n 1 (pour n = 0 cest vident). Soit P de
degr n.
On peut trouver une racine r1 pour P daprs le thorme,
donc P = (X r1 )Q. Par rcurrence on sait que Q = (X r2 )(X
r3 ) (X rn ), do lcriture annonce pour P.
Vrifions quelle est unique. Si
P = (X y1 )(X y2 ) (X ym ) ,
on sait dj que m = n = deg P et que = = le coefficient de Xn
dans P. Comme P(r1 ) = 0, on peut crire
(r1 y1 )(r1 y2 ) (r1 yn ) = 0 ,
donc r1 yi = 0 pour un certain indice i ; quitte renumroter,
on peut supposer que i = 1, donc y1 = r1 .

51

Le quotient dans la division de P par (X r1 ), qui est uniquement dtermin, peut donc tre calcul de deux faons diffrentes, ce qui donne lgalit
Q = (X y2 )(X y3 ) (X yn ) .
Par rcurrence, on sait que cette criture est unique, cest--dire
que (quitte renumroter) on a xi = yi pour tous les indices i.
La situation pour les polynmes de R[X] est peine plus
complique. Faisons une remarque simple :
Lemme 3.11 Soit P R[X], et soit r C une racine de P. Alors le
nombre conjugu r est galement racine de P.
Dmonstration. Si P(r) = 0, on a aussi P(r) = 0 = 0. Mais comme
P(r) = a0 + a1 r + + an rn
avec ai = ai (puisque ai R), on constate que
P(r) = a0 + a1 r + + an rn = P(r) = 0 .
Proposition 3.12 Soit P un polynme de R[X]. On peut crire de
manire unique
P = (X x1 )(X x2 ) (X xi )Q1 Q2 Qj
avec xk R et Qk un polynme de degr 2 dans R[X] sans racine
relle.
Dmonstration. Daprs le corollaire, on peut crire
P = (X r1 )(X r2 ) (X rn ) ,
avec rk C. Si certains de ces nombres sont en fait dans R,
appelons-les x1 , x2 , . . . xi . Les autres racines rk qui ne sont pas
relles sont regroupes en paires : en effet daprs le lemme,
si rk est une racine de P, alors rk aussi (et rk , rk dans ce cas). Le
facteur
(X rk )(X rk ) = X2 2<(rk ) X + |rk |2
est un polynme de R[X] de degr 2, sans racine relle. La proposition sen dduit.
Lunicit est laiss en exercice.
52

Diviseurs dans C[X]


Que peut-on dire de lensemble des diviseurs dun polynme P donn ? Tout dabord, notons que si P = QR, on peut
crire pour tout scalaire , 0 que P = (Q)( 1 R) ; en dautres
termes, si Q divise P, alors Q divise aussi P, et en particulier P
a un nombre infini de diviseurs.
Pour viter cette complication inutile, nous dirons quun
polynme a0 + a1 X + a2 X2 + + an Xn est unitaire si an = 1. Une
meilleure question est donc : que peut-on dire de lensemble
des diviseurs unitaires dun polynme donn ? Notons que,
regarder les dfinitions, il nest pas a priori vident de savoir
sil en existe un nombre fini ou non.
Grce au corollaire 3.10 cependant, on va pouvoir tudier
facilement lensemble des diviseurs dun polynme complexe.
Introduisons la notation suivante : pour un nombre complexe z
et un polynme P C[X], le nombre mz (P) est le plus grand entier tel que (X z)mz (P) divise P. On va lappeler la multiplicit
de z comme racine de P. On remarque que mz (P) > 0 si et seulement si z est racine de P, ce qui narrive que pour un nombre
fini de nombres z. Le corollaire 3.10 peut scrire
Y
P=
(X z)mz (P) ,
zC

sachant que ce produit ne comporte quun nombre fini de


termes (les autres sont gaux 1). Le lemme suivant est alors
vident.
Lemme 3.13 Les multiplicits ont les proprits suivantes.
1. mz (P1 P2 ) = mz (P1 ) + mz (P2 ).
2. Q divise P si et seulement si mz (Q) mz (P) pour tout nombre
complexe z.
3. P ne possde quun nombre fini de diviseurs unitaires.
Dmonstration. La dmonstration (trs simple) des points (1) et
(2) est laisse en exercice. Pour le (3) notons quun polynme
unitaire Q scrit
Y
Q=
(X z)mz (Q) ,
zC

53

et lorsque Q divise P le nombre entier mz (Q) vrifie 0 mz (Q)


mz (P) daprs le point (2). Il ny a quun nombre fini de nombres
complexes z pour lesquels mz (P) , 0, donc au total il ny a quun
nombre fini de choix pour Q.
On peut alors poser la dfinition suivante.
Dfinition 3.14 Soit P et Q deux polynmes de C[X]. Le polynme pgcd(P, Q) est par dfinition
Y
pgcd(P, Q) =
(X z)min(mz (P),mz (Q)) .
zC


Lemme 3.15 Le polynme pgcd(P, Q) divise P et divise Q. De plus
si D est un polynme qui divise P et Q, alors D divise pgcd(P, Q).
En particulier pgcd(P, Q) est lunique diviseur unitaire de P et de Q
de degr maximal.
On comprend donc pourquoi pgcd(P, Q) est appel le plus
grand diviseur commun de P et Q.
Dmonstration. Daprs le (2) du lemme prcdent, il est clair
que si D | P et D | Q, alors D | pgcd(P, Q), et donc que deg(D)
deg(pgcd(P, Q)).
Vrifions lunicit. Soit D un diviseur unitaire de P et de Q
dont le degr est maximal. On a D | pgcd(P, Q) donc deg(D)
deg(pgcd(P, Q)) do par maximalit deg(D) = pgcd(P, Q). Par
suite D = pgcd(P, Q) puisquils sont tous les deux unitaires.
Cette approche des pgcds a pas mal de dfauts. Tout dabord,
il est difficile de calculer pgcd(P, Q) par la dfinition ci-dessus :
il faut dabord factoriser entirement P et Q ! Ensuite, si K nest
pas C, on ne sait rien dire. Vous arrivez certainement traiter
le cas K = R laide de la proposition 3.12 (en lieu et place du
corollaire 3.10), mais pour K = Q on est dans une impasse.
Dans la suite du chapitre on va indiquer une toute autre
mthode, plus gnrale et entranant des calculs assez faciles.
Par contre les dfinitions sont moins directes.

54

Deuxime lecture
Plus grand diviseur commun
Dfinition 3.16 Soient A et B deux polynmes. Lensemble
des diviseurs communs A et B est not div(A, B).

Notez que div(A, 0) est lensemble des diviseurs de A (tout
polynme P divise le polynme nul, puisque 0 = 0 P).
Lemme 3.17 Soient A et B des polynmes (ou des nombres entiers). crivons la division euclidienne A = BQ + R. Alors
div(A, B) = div(B, R) .
Dmonstration. Si D divise A et B, alors il divise R = A BQ (en
effet si A = A0 D et B = B0 D alors R = (A0 + B0 Q)D). Rciproquement si D divise R et B, alors il divise A, par le mme raisonnement. Donc les diviseurs considrer pour la paire (A, B) sont
les mmes que pour la paire (B, R).
Pourquoi est-ce utile ? Tout simplement parce quen passant
(B, R), les degrs (ou les nombres) sont plus petits. On peut
ensuite recommencer avec (B, R), et recommencer encore, et on
va finir par obtenir une paire de la forme (P, 0) : en effet tant
que le deuxime terme nest pas nul, on fait une nouvelle division euclidienne, et on obtient un nouveau terme strictement
plus petit. En fait on a :
Proposition 3.18 Soient A et B des polynmes.
1. Il existe un unique polynme unitaire P tel que
div(A, B) = div(P, 0) .
On le note pgcd(A, B).
2. Si D divise A et B, alors D divise galement leur pgcd.
3. Le polynme pgcd(A, B) est galement caractris comme
lunique diviseur unitaire commun A et B dont le degr est maximal.

55

4. Si on effectue une division euclidienne A = BQ + R, alors


pgcd(A, B) = pgcd(B, R) .
Cette dfinition du pgcd est cohrent avec la dfinition 3.14
lorsque K = C ( cause du point (3)).
Dmonstration. (1) Nous venons dexpliquer comment, en appliquant le lemme prcdent suffisamment souvent, on trouve
un polynme P tel que div(A, B) = div(P, 0) ; on peut supposer P unitaire. Montrons lunicit. Si div(P, 0) = div(P0 , 0), alors
comme P | P on a aussi P | P0 ; et rciproquement comme P0 | P0
on a P0 | P. Finalement P et P0 se divisent lun lautre, et sont
unitaires, donc P = P0 . Le polynme P est bien unique, et on
peut le noter pgcd(A, B).
(2) Lassertion sur D nest quune traduction de lgalit
entre div(A, B) et div(P, 0).
(3) Soit D div(A, B) de degr maximal. On a D | pgcd(A, B),
donc deg(D) deg(pgcd(P, Q)) do par maximalit deg(D) =
pgcd(P, Q). Par suite, on a bien D = pgcd(P, Q) puisquils sont
tous les deux unitaires.
(4) Daprs le lemme prcdent, on a div(A, B) = div(B, R),
donc cest vident.
Avant de donner des exemples, remarquons que la situation
avec les nombres entiers est exactement similaire. En fait on a :
Proposition 3.19 Soient a et b des nombres entiers.
1. Il existe un unique entier positif p tel que
div(a, b) = div(p, 0) .
On le note pgcd(a, b).
2. Si d divise a et b, alors d divise galement leur pgcd.
3. Le nombre pgcd(a, b) est galement caractris comme le plus
grand diviseur commun a et b ( !).
4. Si on effectue une division euclidienne a = bq + r, alors
pgcd(a, b) = pgcd(b, r) .
56

La dmonstration est la mme. Voyons des exemples.


Exemple 3.20 Commenons par des nombres entiers, disons a =
77 et b = 91. On crit
91 = 77 1 + 14 ,
donc pgcd(91, 77) = pgcd(77, 14). Puis
77 = 14 5 + 7 ,
donc pgcd(77, 14) = pgcd(14, 7). Finalement
14 = 7 2 + 0 ,
donc pgcd(14, 7) = pgcd(7, 0) = 7. Au total pgcd(77, 91) = 7.
Exemple 3.21 Prenons A = X3 +7X2 +2X+14 et B = X4 +4X2 +4,
dans R[X]. On calcule
B = (X 7) A + (51X2 + 102) ,
donc pgcd(B, A) = pgcd(A, R) avec R = 51X2 + 102 (on passe les
dtails du calcul de la division euclidienne). Puis on effectue
A=(

1
7
X + ) R + 0,
51
51

donc pgcd(A, R) = pgcd(R, 0). Attention, comme le pgcd est un


polynme unitaire par dfinition, ici la rponse nest pas R =
51(X2 + 2) mais X2 + 2 : on divise simplement par le coefficient
du terme en X2 . Finalement pgcd(A, B) = X2 + 2.
Le thorme de Bzout
Cest le suivant :
Thorme 3.22 Soient a et b deux nombres entiers. Alors il existe
deux nombres u et v tels que
au + bv = pgcd(a, b) .
Soient A et B deux polynmes de K[X]. Alors il existe deux polynmes U, V K[X] tels que
AU + BV = pgcd(A, B) .
57

Dmonstration. Dans lalgorithme deuclide, on passe dune


paire la suivante en ajoutant des multiples de a et des multiples de b.
Exemple 3.23 Revenons lexemple 3.20, avec a = 77 et b =
91 ; on a vu que d = pgcd(a, b) = 7.
Reprenons les divisions euclidiennes que nous avons faites,
en exprimant systmatiquement les restes en fonction de a et b.
Nous sommes partis de
91 = 77 1 + 14

donc

14 = b a .

Puis nous avons effectu


77 = 14 5 + 7

donc

7 = a 5(b a) = 6a 5b .

Enfin la dernire division nous a montr que le pgcd tait


bien d = 7. On a donc d = 6a 5b, ce qui est bien la formule
annonce avec u = 6 et v = 5.
Exemple 3.24 Cette fois, reprenons lexemple 3.21. La premire division tait
B = (X 7) A + 51D,
avec D = pgcd(A, B) = X2 + 2. On a donc bien
D=

1
1
(X 7)A + B,
51
51

1
qui est la forme annonce avec U = 51
(X 7) et V =

1
51 .

Premiers
Un nombre ou un polynme va tre appel premier lorsquil na aucun diviseur part ceux qui sont vidents. Prcisons :
Dfinition 3.25 Soit p Z un nombre , 1. On dit que p est
premier lorsque la seule faon dobtenir une factorisation p = ab
(avec a, b Z) est de prendre a = 1 ou b = 1.
58

Soit P K[X] un polynme de degr 1. On dit que P


est premier, ou plus souvent irrductible, lorsque la seule faon dobtenir une factorisation P = AB (avec A, B K[X]) est
de prendre A constant ou B constant.

Exemple 3.26 Un nombre p est donc premier si et seulement si la liste complte de ses diviseurs est {1, 1, p, p}. Les
nombres 17, 71, 277, 733 et 953 sont ainsi premiers. On
adopte souvent la convention de ne parler que des nombres
premiers positifs, de sorte que leur liste commence par 2, 3, 5,
7, 11, 13 . . .
Exemple 3.27 Un polynme de degr 1 est toujours irrductible (premier). Pour un polynme P K[X] de degr 2, la situation est encore assez simple. Si P = AB et si ni A, ni B nest
constant, alors deg A = deg B = 1. Comme un polynme de degr 1 possde toujours une racine dans K, le polynme P en
possde aussi une. Mais la rciproque est vraie : si P(r) = 0,
alors en posant A = X r on peut crire P = AB avec B de degr 1 (proposition 3.6).
On retiendra quun polynme de K[X] de degr 2 est irrductible si et seulement si il ne possde pas de racine dans K.
a reste vrai pour un polynme de degr 3 (vrifiez-le).
Par exemple P = X2 +1 est irrductible dans R[X]. Par contre
dans C[X] on a P = (X i)(X + i).
Le thorme de Bzout va permettre de dmontrer des
choses sur les nombres premiers et les polynmes irrductibles
qui paraissent intuitives, mais quon ne saurait pas prouver
autrement. Voici le meilleur exemple.
Lemme 3.28 (Lemme de Gauss) Soit P un premier. Si P | AB,
alors P | A ou P | B.
Ce rsultat est valable pour les entiers comme pour les polynmes.
Dmonstration. Supposons que P ne divise pas A, et montrons quil divise alors B. Notons que lon a pgcd(P, A) = 1,

59

et donc UA + PV = 1 par Bzout. Par hypothse on a AB = PR,


donc UAB = UPR, et comme UA = 1 PV, on en tire
(UA)B = B PVB = UPR .
Ceci montre que B = P(VB + UR) est bien divisible par P.
Nous pouvons finalement apporter une rponse la question souleve la fin du chapitre 2 (cf corollaire 2.23) : quand
est-ce que Z/NZ est un corps ?
Proposition 3.29 Soit p un entier 2. Alors Z/pZ est un corps
si et seulement si p est un nombre premier.
Dmonstration. Si p nest pas premier, on a p = ab avec a et b
des nombres qui ne sont pas divisibles par p. En rduisant modulo p, on obtient
ab = p = 0,
avec a , 0 et b , 0. Il est donc impossible que a ait un inverse
(argumenter comme dans lexemple 2.25).
Rciproquement, supposons que p soit premier, et soit a , 0
un lment de Z/pZ. Lentier a est alors premier avec p, cest-dire que pgcd(p, a) = 1 puisque lon suppose que p ne divise
pas a. Par Bzout, on a au + pv = 1, et en rduisant modulo p on
a
au + pv = au = 1
(tant donn que p = 0). Cest donc bien que (a)1 = u. Tout
nombre non-nul de Z/pZ possde un inverse, et on a bien affaire un corps.
Factorisation
Le thorme suivant gnralise le corollaire 3.10 et la proposition 3.12.
Thorme 3.30 Soit P K[X]. On peut crire de manire unique
P = P1 P2 Pk ,
o chaque Pi est irreductible et unitaire.
60

Dmonstration. Montrons lexistence de cette criture, par rcurrence sur le degr de P (cest vident si deg(P) = 0). On peut
supposer que P est unitaire. Si P est lui-mme irreductible,
alors il ny a rien dire. Dans le cas contraire, on crit P = QR
avec deg(Q) < deg(P) et galement deg(R) < deg(P). Par rcurrence on peut factoriser Q et R en produit dirrductibles,
donc P aussi.
Montrons lunicit (cest plus fin). On doit donc montrer
que si on a deux critures
P1 P2 Pk = Q1 Q2 Q` ,

(*)

avec chaque Pi et chaque Qi unitaire et irrductible, alors = ,


k = `, et les polynmes Pi sont les mmes que les Qi . On procde
par rcurrence sur le degr des deux membres de (*) (les choses
sont videntes si le degr est 0).
Tout dabord en regardant le coefficient de plus haut degr,
on voit de suite que = . Ensuite, on constate que P1 divise
le produit Q1 Q2 Q` . En consquence du lemme de Gauss, P1
doit diviser lun des Qi , disons Q1 pour simplifier les notations.
On simplifie (*) par P1 = Q1 pour obtenir
P2 P3 Pk = Q2 Q3 Q` .

(**)

Lgalit (**) est de degr plus petit que (*), donc par rcurrence
on sait que k = ` et que les polynmes P2 , . . . , Pk sont les mmes
que les polynmes Q2 , . . . , Q` . Ceci termine la dmonstration.
Une fois de plus, ce thorme existe pour les nombres entiers, essentiellement avec la mme dmonstration, et vous le
connaissez probablement dj :
Thorme 3.31 Soit n Z. On peut crire de manire unique
n = p1 p2 pk ,
o chaque pi est un nombre premier positif.

61

Chapitre 4

Suites
Premire lecture
Suites de rels
Dfinition 4.1 Une suite de nombres rels est simplement
une fonction u : N R. En gnral on crit un au lieu de u(n),
et on crit (un )n0 pour dsigner la suite elle-mme.

Exemple 4.2 La suite dfinie par un = n2 commence par
0, 1, 4, 9, 16, 25, 36, . . .
On emploie souvent une formule directe pour un en fonction
de n, et dans ce cas on parlera directement de la suite (n2 )n0 .
On sautorise aussi parler de suites qui ne sont dfinies
que pour des valeurs de n suffisamment grandes ; ainsi de la
suite ( n1 )n1 par exemple. On veillera toujours indiquer le
domaine de dfinition, ici lensemble des entiers 1. videm1
ment ltude de cette suite se ramne celle de ( n+1
)n0 : dans
les deux cas il sagit de comprendre la squence de nombres
1,

1 1 1 1
, , , ,...
2 3 4 5

Lcriture ( n1 )n1 est donc juste une notation commode.


62

Exemple 4.3 Une autre faon commune de dcrire une suite


est dutiliser une relation de rcurrence : par exemple, on peut
considrer la suite (un )n0 dfinie par u0 = 1 et un+1 = 2un . Elle
commence par
1, 2, 4, 8, 16, 32, 64, 128, . . .
Dans cet exemple on voit tout de suite que un = 2n . Pour
le dmontrer, sans surprise on procde par rcurrence : on a
bien u0 = 20 = 1 et si un = 2n alors un+1 = 2 2n = 2n+1 .
Les choses sont en gnral bien plus compliques. Que lon
considre la suite (vn )n0 dfinie par peu prs nimporte
quelle formule de rcurrence choisie au hasard, disons vn+1 =
cos(vn ) + (sin(vn ))3 , et lon verra la difficult quil peut y avoir
trouver une formule pour vn .
Exemple 4.4 On peut aussi utiliser une relation de rcurrence
qui fait intervenir plusieurs termes antrieurs. La clbre suite
de Fibonacci est dfinie par u0 = u1 = 1 et par un+2 = un+1 + un .
Elle commence donc par
1, 1, 2, 3, 5, 8, 13, 21, . . .
Dans les exercices nous verrons comment trouver une expression pour un dans le cas de cette suite.
Exemple 4.5 Soit (an )n0 une premire suite. On dfinit (un )n0
par
n
X
un = a0 + a1 + + an =
ak .
k=0

On dit alors que (un )n0 est la srie de terme gnral an .


Par exemple lorsque an = rn pour un rel r, de sorte que un =
1+r+r2 + +rn , on dit que (un ) est une srie gomtrique (de raison r). On peut trs facilement trouver une expression pour un
en remarquant
un (1 r) = (1 + r + + rn ) (r + r2 + rn+1 ) = 1 rn+1 .
Si r , 1, on en dduit
un =

n
X

rk =

k=0

63

1 rn+1
.
1r

Cest une formule qui sert tout le temps, elle est donc savoir.
Convergence
Cest laide des suites que lon va pouvoir traduire mathmatiquement diverses notions de rapprochement : quantit qui
sapproche infiniment prs de 0, courbes qui se rapprochent
linfini , droites et cercles tangents une courbe, et tant
dautres ides intuitives vont dune faon ou dune autre se ramener des questions de suites.
La dfinition ci-dessous est au coeur de nombreux concepts
dans ce livre. Il est donc normal quelle paraisse un peu difficile
saisir au dbut, et il faut prendre le temps de lapprivoiser.
Il sagit de donner un sens lide dune suite qui se rapprocherait aussi prs que lon souhaite dune valeur donne. La
formulation finale est due Cauchy.
Dfinition 4.6 Soit (un )n0 une suite de nombres rels, et
soit ` R. On dit que (un ) converge vers `, ou admet ` pour limite, lorsque la condition suivante est satisfaite : pour tout > 0
il doit y avoir un entier N tel que |un `| < ds que n N .
En dautres termes, pour toute marge derreur donne, la
distance entre un et ` va devenir infrieure pour peu que
lon prenne des indices suffisamment grands.
Dans ce cas on note
un `
n

ou

lim un = ` .


Essayons de comprendre cette dfinition graphiquement,
pour commencer. Et dabord, comment dessiner une suite ?
Nous allons procder comme sur la figure ci-dessous. Les
points reprsents sont ceux de la forme (n, un ), cest--dire
que le diagramme se lit de la gauche vers la droite mesure que les indices augmentent. On a trac les axes dans le
plan R R, ainsi quune droite dquation y = ` vers laquelle la
suite semble saccumuler. Cest une bonne faon de visualiser
la convergence vers un nombre `.

64

Revenons la dfinition. tant donn un rel , la condition |un `| < est vrifie lorsque (n, un ) se trouve dans une
bande horizontale dlimite par les droites y = ` + et y = ` .
Le nombre N existe lorsquon peut tracer une droite verticale
comme ci-dessous, dquation x = N , la droite de laquelle
tous les points (n, un ) sans exception sont dans la bande.

Ce N doit exister pour tout , et bien sr les difficults arrivent lorsque devient de plus en plus petit. La bande devient
65

plus troite et la droite verticale se dplace vers la droite.

Voyons maintenant des exemples.


Exemple 4.7 Considrons la suite ( n1 )n1 , et montrons quelle
converge vers 0. Notons un = n1 . Soit donc > 0 comme dans la
dfinition. Pour avoir |un 0| = n1 < , il faut et il suffit que n > 1 .
Soit donc N nimporte quel entier tel que N > 1 . On constate
bien que lorsque n N , alors on a aussi n > 1 et donc |un | < .
Par dfinition, ceci montre que un 0.
n

(Voir lencadr R est archimdien pour quelques commentaires sur cet exemple.)
Exemple 4.8 Maintenant voyons (n )n0 pour un rel 0 <
1. Montrons que la suite tend encore vers 0. Puisque |n 0| =
|n | = n , il sagit de majorer les termes de la suite par quelque
chose de facile comprendre.
p
p
Prenons un nombre rationnel q tel que < q < 1 (voir (3)
du thorme 2.5). On a q > p et comme il sagit dentiers, on est
mme sr que q p + 1 ; ainsi
n <

pn
pn
<
.
qn (p + 1)n
66

Remarquons que
(p + 1)n

On a donc

(p+1)n
pn

= (p + 1)(p + 1) (p + 1)
= pn + npn1 + (termes 0)
> pn + npn1 .

> 1 + np > np , et par suite


p
.
n

n <
p

La suite ( n )n1 tend vers 0, exactement comme la suite ( n1 )n1


(la constante p ne change rien laffaire). Donc tant donn >
p
0, il existe bien N tel que n < pour n N ; pour ces mmes
valeurs de n, on a donc aussi n < , et finalement n 0.
n

Exemple 4.9 On note n! = n(n1)(n2) 321, et on appelle


cette quantit factorielle n . Cest le produit de n termes qui
sont tous 2 sauf le dernier ; on a donc n! 2n1 .
1
Si lon tudie la suite ( n!
)n1 , il suffit de remarquer
0<

1
1
1
= ( )n1

n! 2n1
2

et donc

1
0 .
n! n

R est archimdien
Dans lexemple 4.7, on utilise le fait
suivant : tant donn un rel x,
il existe un entier N tel que N >
x (dans lexemple on avait x = 1
et N = N ).
Dabord, pourquoi est-ce vrai ? Le (3)
du thorme 2.5 affirme quil existe
p
p
un rationnel q tel que x < q < x + 1 ;
il suffit alors de prendre N = p.
Cest Archimde qui le premier avait
nonc : Pour deux grandeurs ingales, il existe toujours un multiple entier de la plus petite, suprieur la plus grande. En
clair, tant donn a et b rationnels ou rels (mais Archimde pen-

sait seulement aux rationnels), tels


que 0 < a < b, alors il existe un entier n tel que n a > b. (Ce qui revient prendre n > ba .) En particulier, la distance Terre-Lune peut
tre couverte par des allumettes
mises bout--bout. Ou mme cte
cte. Cest pour ces raisons historiques que lon dit que R est archimdien quand on veut faire rfrence cette proprit.
titre dexercice, vous montrerez
que le (3) du thorme 2.5 est en
fait quivalent lnonc selon lequel R est archimdien ce qui signifie que cest une proprit fondamentale de R.

67

En effet lexemple prcdent avec = 12 montre que 21n converge


vers 0 ; or si on a une suite un qui tend vers 0, et si 0 vn un ,
alors vn tend aussi vers 0. Vrifiez ceci partir de la dfinition, puis habituez-vous faire ce genre de petit raisonnement
rapidement.
Combiner les limites
Les exemples prcdents sont presque les seuls pour lesquels vous verrez un cette anne. La quasi-totalit des suites
que lon va rencontrer vont tre des combinaisons de ces limites, pour lesquelles on va appliquer le rsultat suivant.
Proposition 4.10 Soit (un )n0 et (vn )n0 deux suites. On suppose que un ` et que vn `0 . Alors on a :
n

n
0

1. (somme) un + vn ` + ` ;
n

2. (produit) un vn ` `0 ;
n

1
1
3. (inverse)
lorsque ` , 0.
un n `
Avant de donner la dmonstration, montrons un petit rsultat intermdiaire :
Lemme 4.11 Toute suite qui converge est borne. En dautres
termes, si (un )n0 admet une limite, alors il existe un nombre C tel
que pour tout entier n, on a |un | C.
De plus, si la limite est > 0, alors il existe une constante > 0
telle que un > pour tous les n assez grands.
Dmonstration. Soit ` la limite. On crit
|un | = |(un `) + `| |un `| + |`| .
Soit > 0, par exemple = 1. Il existe un entier N tel que pour
tous les n N , on a |un `| < . Il suffit alors de prendre C
plus grand que + |`|, et plus grand que tous les nombres |un |
pour n < N (qui sont en nombre fini).

68

Si maintenant ` > 0, posons = 2` . Pour n N , on a |un `| <


ce quon va rcrire
`
= ` < un < ` + .
2
On peut donc prendre = = 2` .
Dmonstration de la proposition. Commenons par la formule
pour le produit. Une astuce que vous reverrez souvent est
dcrire un vn ``0 = un (vn `0 ) + `0 (un `). Par suite
|un vn ``0 | |un | |vn `0 | + |`0 | |un `| .

(*)

Soit donc > 0. Par hypothse il existe N1 tel que


(1)

|un `| <
ds que n N1 ; de mme on a un N2 tel que
|vn `0 | <

(2)

ds que n N2 .
Si nous prenons N nimporte quel nombre la fois plus
grand que N1 et plus grand que N2 , alors on a la fois (1) et
(2) lorsque n N . Prenons une constante C comme dans le
lemme. Alors en reportant ces ingalits dans (*), on aboutit
|un vn ``0 | (C + |`0 |)

pour n N .

(**)

Avec lhabitude, vous vous rendrez compte que ce genre dargument est suffisant, et que lon a essentiellement dj montr
que un vn a pour limite ``0 . Pourquoi ?
Simplement parce que pour tout > 0, on vient de montrer que lon sait trouver N tel que lingalit (**) est valable.

En particulier on peut faire ce travail pour = C+|`


0 | ; donc il
existe N tel que pour les entiers n N on a effectivement
|un vn ``0 | (C + |`0 |) = .
Vous montrerez la formule pour la somme sur le mme modle, en plus facile.
69

Pour linverse on crit





1 1 = ` un < 1 |u `| ,
un ` un ` |`| n
o est comme dans le lemme (appliqu la suite |un | qui
converge vers |`| > 0 (vrifiez-le)). Ainsi pour tout > 0, on
trouve un N tel que pour n N on a


1 1 < .
un ` |`|
L encore, cest suffisant pour affirmer que

1
un

converge vers 1` .

Exemple 4.12 Voyons comment cette proposition nous simplifie la vie. Admettons que lon souhaite connatre la limite
de
4n2 + 1
un = 2
.
5n n + 2
On commence par diviser par n2 au numrateur comme au dnominateur :
4 + n12
un =
.
5 n1 + n22
On a vu dans lexemple 4.7 que n1 0. Grce la formule pour
le produit, on sait dsormais que n12 = ( n1 )( n1 ) converge galement vers 00 = 0. De mme n22 20 = 0 et n1 (1)0 = 0,
encore par la formule pour le produit.
Maintenant, la formule pour la somme nous dit que 4 +
1
4 et que 5 n1 + n22 5 , 0. On peut donc utiliser la
2
n
formule pour linverse qui donne finalement
un
n

4
.
5

Suites croissantes et dcroissantes


Dfinition 4.13 On dit que la suite (un )n0 est croissante
lorsque un un+1 pour tout n ; on dit quelle est dcroissante
lorsque un+1 un .
70

On dit que (un ) est majore lorsquil existe M R tel que un


M, pour tout n ; on dit quelle est minore lorsquil existe m tel
que m un .

Thorme 4.14 Toute suite croissante et majore est convergente.
Toute suite dcroissante et minore est convergente.
Dmonstration. Soit (un )n0 une suite croissante et majore. On
pose
` = sup{un | n N} ,
ce qui a un sens puisque cet ensemble est major par hypothse.
Soit > 0 et considrons `0 = ` < `. Alors `0 ne peut pas
tre un majorant de lensemble ci-dessus, puisque ` est le plus
petit. Ce qui revient dire quil y a au moins un lment de
lensemble, disons uN , tel que uN > `0 .
Or la suite est croissante, donc un uN > `0 pour tous les n
N. On a donc ` < un ` pour ces valeurs de n, et finalement |un `| < . On peut donc prendre N = N et la suite
converge vers le sup de ses valeurs.
Si (un ) est dcroissante et minore, on applique le rsultat
ci-dessus (un ), qui est croissante et majore.
Exemple 4.15 Voici une deuxime faon, plus facile, de monter que n 0 lorsque 0 < 1. Posons un = n . Alors uun+1 =
n
< 1, donc un+1 < un : la suite est dcroissante. Tous les termes
sont > 0, donc elle est minore. Par le thorme, (un ) admet une
certaine limite `. Montrons que ` = 0.
Soit vn = n+1 . Dun ct nous avons vn = n = un . Par la
formule pour les produits de suites, on en dduit vn `.
n

Dun autre ct, nous avons vn = un+1 . Il est donc clair


que vn a la mme limite que un puisque cest la mme suite
avec simplement les termes dcals dun cran. Donc vn `.
n

On doit donc avoir ` = `. Si on avait ` , 0, on en dduirait = 1 ce qui contredit les hypothses. Donc ` = 0.

71

Convergence vers
Dfinition 4.16 On crit
un + ou

lim un = + ,

lorsque la condition suivante est remplie. Pour tout M > 0, il


doit exister un entier N = NM tel que un > M pour tous les
entiers n N.
De mme on dit que un lorsque pour tout m < 0, il
existe un entier N = Nm tel que un < m ds que n N.

En dautres termes, quand un + les termes de la suite
deviennent arbitrairement grands lorsque les indices sont suffisamment grands.
Les exemples vont provenir du rsultat suivant. Cest une
variante de la proposition 4.10, mais les choses ne marchent
pas aussi bien.
Proposition 4.17 Soient (un )n0 et (vn )n0 deux suites. On suppose que un + et que vn `, o lon peut avoir aussi
n

bien ` R que ` = . Alors :

1. (somme) si ` , alors un + vn + ;
2. (produit)
(a) si ` > 0 alors un vn +, et
n

(b) si ` < 0 alors un vn ;


n

3. (inverse)
1
(a)
0 ;
un n
1
+ ;
vn n
1
(c) si ` = 0, et si n on a vn < 0, alors
.
vn n

(b) si ` = 0, et si n on a vn > 0, alors

Vous montrerez cette proposition titre dexercice. Avant


de passer aux exemples, notons que ce dernier nonc ne couvre
pas tous les cas : que dire de un + vn lorsque ` = ? Que dire
72

de un vn lorsque ` = 0 ? Rponse : rien en gnral. On dit que


ce sont les formes indtermines . Toutes les situations sont
envisageables.
1
0 pour tout entier k , le 3(b) de
nk n
que nk +. On peut videmment
n

Exemple 4.18 Puisque


la proposition nous dit

vrifier trs facilement ceci partir de la dfinition.


De la mme manire, n + si > 1 : en effet posons =
1
n
< 1, alors 0, et on applique encore le 3(b). Toujours
pour les mmes raisons, on a n! +.
Enfin, nous avons vu un exemple de forme indtermine
+
dans lexemple 4.12, en loccurence une forme +
. Nous
avions montr dans ce cas prcis quil y avait bien une limite,
savoir 4/5 .
Il y a certaines formes indtermines que lon peut rsoudre, et il est utile den mmoriser quelques unes au fur
et mesure quon les rencontre. En voici une premire.
Lemme 4.19 Soit un rel tel que 0 < 1, et k un entier. Alors
nk n 0 .
n

Dmonstration. Cest une forme indtermine + 0 . Soit un =


nk n . On fait lestimation suivante :
un+1
1
= (1 + )k .
n
un
n
Prenons = 1
2 > 0 ; alors pour tous les n N, pour un certain N = N , on a
<

+1
un+1
< + =
< 1.
un
2

En posant = +1
2 , on voit dabord que uN+1 < uN ; puis uN+2 <
uN+1 < 2 uN ; et une rcurrence nous mne immdiatement
uN+n < n uN ,
73

TO DO : ajouter
la comparaison
factorielle/puissances

pour tous les n 0. Comme n uN 0 (le terme uN nest


n

quune constante !), on en dduit bien que un converge vers 0.

Deuxime lecture
Convergence absolue
Partant dune premire suite (an )n0 , on peut considrer la
srie de terme gnral an , cest--dire la suite
un = a0 + a1 + a2 + + an =

n
X

ak .

k=0

(Cf lexemple 4.5.)


Le thorme suivant peut paratre surprenant : il dit que
pour montrer la convergence de un , il suffit de montrer la
convergence de la srie de terme gnral |an | :
Thorme 4.20 Soit (an )n0 une suite. Si la limite
lim

n
X

existe, alors la limite


lim

|ak |

k=0
n
X

ak

k=0

existe galement. On dit alors que la srie de terme gnral an


converge absolument.
Dmonstration. On pose
Sn =

n
X

|ak | et

k=0

un =

n
X
k=0

74

ak .

Par hypothse Sn `. Soit > 0, alors pour tous les n suffisamment grands on aura |Sn `| < 2 , et donc
|Sn Sm | = |(Sn `) + (` Sm )| |Sn `| + |Sn `| <
lorsque n et m sont tous les deux suprieurs un certain N. On
en dduit pour la suite (un ) que


n
n
X
X



|un um | =
ak
|ak | = Sn Sm < ,
k=m+1 k=m+1
lorsque n m N. On dit souvent que (un ) est une suite de
Cauchy pour exprimer cette proprit ( savoir que |un um | <
pour n et m suffisamment grands). La fin de la dmonstration
va tablir quune suite de Cauchy de nombres rels converge
toujours.
En effet, soient
n = inf{uk | k n} et

n = sup{uk | k n} ,

de sorte que n un n . Par construction la suite n est


croissante et majore ; donc elle admet une limite `1 daprs le
thorme 4.14. De mme n converge vers une limite `2 parce
quelle est dcroissante et minore.
Mais nous avons montr que pour tout > 0, il existe un
rang N au-del duquel |un uN | < ; pour ces valeurs de n, le
nombre un est dans lintervalle ]uN ; uN +[ de longueur 2, et
on en dduit que n n 2 pour n N. Ceci montre que n
n 0 et donc que `1 = `2 . Finalement lencadrement n
un n garantit que un converge galement vers cette limite.
Notez bien que la dmonstration
ne dit pas du tout comP
P
ment calculer la limite de ak , mme si on connat celle de |ak |.
Notez galement que ce thorme serait faux si on travaillait
sur Q ; dailleurs la dmonstration utilise des bornes suprieures et infrieures, qui sont propres R.

75

Dornavant, nous utiliserons la notation suivante, plus suggestive, pour les limites de sommes. On crit :
+
X

ak = lim

k=0

n
X

ak ,

k=0

lorsque cette limite existe.


Exemple 4.21 (Lexponentielle) Soit x R fix. Posons
un =

n
X
xk
.
k!
k=0

Montrons que cette suite converge absolument. Nous devons


donc montrer que
n
X
|x|k
Sn =
k!
k=0

admet une limite. La suite (Sn ) est croissante, donc daprs le


thorme 4.14 il suffit de montrer quelle est majore.
Pour k suffisamment grand, disons k K, on a |x| < k ; on
peut mme choisir < 1 tel que |x|
k < pour k K. On a alors
|x|K+1
|x| |x|K
|x|K
=

<
.
(K + 1)! K + 1 K!
K!
De mme on a
|x|K+2
|x|
|x|K+1
|x|K+1
|x|K
=

<
< 2
.
(K + 2)! K + 2 (K + 1)!
(K + 1)!
K!
Par rcurrence on obtient
|x|K+k
|x|K
< k
.
(K + k)!
K!
Ceci va nous suffire, puisquen posant C = SK1 on peut crire

76

pour n K :
Sn

C+

nK
X
k=0
|x|K

|x|K+k
(K + k)!

(1 + + 2 + + kK )
K!
|x|K 1 n+1K
C+
K! 1
|x|K 1
C+
.
K! 1
C+

La suite (SN ) est donc bien majore en plus dtre croissante,


elle est donc convergente ; par suite (un ) est absolument convergente, et donc elle-mme convergente daprs le thorme. Sa
limite, qui dpend de x, est note exp(x) ou ex , et appele lexponentielle du nombre x. En clair
ex =

+ k
X
x
k=0

k!

Cette dfinition de lexponentielle concide, heureusement,


avec les dfinitions qui vous sont esquisses au lyce. Nous
montrerons a en tant voulu.
Exemple 4.22 Certaines sries convergent, mais sans converger absolument : il faut donc faire attention. Par exemple,
nous pourrons montrer plus loin que pour ak =
rie converge et on a mme

(1)k+1
k+1 ,

la s-

+
X
(1)k+1
1 1 1 1
= 1 + + + = ln(2) .
k+1
2 3 4 5
k=0

Par contre en prenant les valeurs absolues, nous montrerons


que lon a en fait
+
X
k=0

1
1 1 1 1
= 1 + + + + + = + ,
k+1
2 3 4 5

cest--dire quil ny a pas de limite finie.


77

Suites de complexes
Lorsque lon se donne pour chaque entier n un nombre
complexe zn = an + ibn , et lorsque an `1 et bn `2 , on dit
que (zn )n0 converge vers ` = `1 + i`2 , et on note zn `. Par
n

exemple

3n2
2n + 5
2i
+
i .
n
n
2
7n 12
7
Cette dfinition a le mrite dtre simple. Cependant on peut
donner une dfinition plus directe, sans rfrence aux suites
relles, en remplaant simplement les valeurs absolues par les
modules ; en clair :
Proposition 4.23 La suite (zn )n0 converge vers ` exactement
lorsque la condition suivante est remplie. Pour chaque rel > 0, il
doit y avoir un entier N tel que |zn `| < ds que n N .
Ici |zn `| est le module du nombre complexe zn `. part
a, la condition est la mme que pour les suites relles.
Dmonstration. crivons zn = an + bn . Pour commencer, supposons que an `1 et bn `2 . tant donn > 0, on trouve N1 tel
que |an `1 | < pour n N1 , et de mme pour tous les n plus
grands quun certain entier N2 on a |bn `2 | < . Lorsque n est
la fois plus grand que N1 et que N2 , on a
q

|zn (`1 + i`2 )| = (an `1 )2 + (bn `2 )2 2 + 2 2 .


Ceci montre bien (en recommenant avec = ) que la condi2
tion donne est remplie pour ` = `1 + i`2 .
Rciproquement, supposons cette condition remplie pour
un certain ` = `1 +i`2 , et tudions la convergence des suites (an )
et (bn ). Soit > 0. En notant simplement que
|an `1 | |zn `| ,
on constate que si |zn `| < , alors |an `1 | < , et ceci tablit
que an `1 , clairement. De mme (bn ) converge vers `2 .

78

La convergence absolue fonctionne encore avec les complexes :


Thorme 4.24 Soit (zn )n0 une suite de nombres complexes. Si
la limite
n
X
|zk |
lim
n

k=0

existe, alors la limite


lim

n
X

zk

k=0

existe galement. On dit que la srie converge absolument.


Dmonstration. crivons zn = an + ibn . On a |an | |zn | et donc
Sn =

n
X

|ak |

k=0

n
X

|zk |

k=0

+
X

|zk | .

k=0

La suite Sn est donc majore. Elle est visiblement croissante,


donc elle converge. Daprs le thorme 4.20, on en dduit
lexistence de
+
X
ak ;
k=0

de mme on montre lexistence de


+
X

bk .

k=0

Mais bien sr on a

n
n
X X

<
zk =
ak ,
k=0

k=0

n
n
X X

=
zk =
bk .
k=0

k=0

Puisque ces parties relles et imaginaires convergent, cest bien


que la somme elle-mme converge.

79

Exemple 4.25 (Lexponentielle complexe) Soit z C fix. On


pose
n
X
zk
un =
.
k!
k=0

Soit x = |z| ; cest un nombre rel 0, et on a montr dans


lexemple 4.21 la convergence de
+ k
X
x
.
k!
k=0

Cest donc que (un ) converge absolument. Daprs le thorme,


elle converge. La limite dpend de z, on la note exp(z) ou ez . En
clair
+ k
X
z
ez =
.
k!
k=0

Lorsque z = i avec R, la notation ei concide avec celle


que vous connaissiez au lyce, comme nous le montrerons plus
loin.
Sur cette exemple on peut apprcier le secours qui nous est
apport par le thorme sur la convergence absolue : tudier
les parties relles et imaginaires de (un ) directement serait bien
difficile.
Pour travailler directement avec les complexes sans passer
par les parties relles et imaginaires, il nous manque encore un
ingrdient : cest la trs utile ingalit triangulaire, que nous
avons vu dans le cas de R dans le lemme 2.7. Elle reste vraie
sur C :
Lemme 4.26 Si a et b sont des nombres complexes, on a
|a + b| |a| + |b| ,
et
| |a| |b| | |a b| .
Nous allons donner une dmonstration trs gnrale dans
le paragraphe suivant (voir le lemme 4.30).
80

Suites de vecteurs
Lensemble C des nombres complexes peut tre identifi
avec lensemble R R, que lon va noter R2 , en voyant a +
ib comme la paire (a, b). De mme, on peut considrer lensemble R R R des triplets (a, b, c) de nombres rels ; on va
noter cet ensemble R3 . Lensemble R4 est compos des quadriplets (a, b, c, d).
Rien de nous enpche de continuer : tant donn un entier r, lensemble Rr est constitu des r-uplets (a, b, c, d, . . .)
(squence de r nombre rels). Ces lments sont appels vecteurs.
Dfinition 4.27 La norme (ou norme euclidienne) dun vecteur est :

k(a, b, c, d, . . .)k = a2 + b2 + c2 + d 2 + .

En particulier, si z = a + ib, alors |z| = k(a, b)k. La norme est
donc une gnralisation du module.
Une suite de vecteurs est une fonction N Rr , cest--dire
que pour tout entier n on se donne un vecteur
un = (an , bn , cn , dn , . . .) Rr .
Exactement comme dans le cas des complexes, on a :
Proposition 4.28 Soit un = (an , bn , cn , dn , . . .) une suite de vecteurs de Rr . Les deux noncs ci-dessous sont quivalents :
1. Chacune des suites (an )n0 , (bn )n0 , (cn )n0 , . . . , converge
respectivement vers `1 , `2 , `3 , . . .
2. Soit ` = (`1 , `2 , . . . , `r ). Pour chaque rel > 0, il existe un
entier N tel que pour n N on a kun `k < .
Thorme 4.29 Soit (an )n0 une suite de vecteurs dans Rr . Si la
limite
n
X
lim
kak k
n

k=0

81

existe (dans R), alors la limite


lim

n
X

ak

k=0

existe galement (et cest un vecteur de Rr ). On dit que la srie


converge absolument.
Les dmonstrations sont les mmes que dans le cas des
complexes, et sont laisses en exercice. Nous avons galement :
Lemme 4.30 Si a et b sont des vecteurs de Rr , alors
ka + bk kak + kbk ,
et
| kak kbk | ka bk .
Montrons-le (ceci va tablir le lemme 4.26 du mme coup).
Commenons par une ingalit clbre :
Lemme 4.31 (Ingalit de Cauchy-Schwarz) Soient x1 , x2 ,
. . . , xr , y1 , y2 , . . . , yr des nombres rels. Alors :

2
r

r
r
X

X
X

xi yi
x2i
yi2 .
i=1

i=1
i=1
Supposons de plus que les nombres y1 , y2 , . . . , yr ne sont pas tous
nuls ; alors cette ingalit est une galit exactement lorsquil existe
un rel t tel que xi + tyi = 0 pour tous les indices i la fois.
Dmonstration. Si tous les yi sont nuls, les deux membres de
lingalit sont nuls, et lingalit est donc satisfaite. On suppose maintenant quil ne sont pas tous nuls.
Pour t R, considrons
P(t) =

r
X

(xi + tyi )2 = At2 + Bt + C,

i=0

avec
A=

r
X
i=0

yi2 ,

B=2

r
X
i=0

82

xi y i ,

C=

r
X
i=0

x2i .

Faisons quelques observation sur P(t). Dabord, puisque P(t) est


une somme de carrs, on a P(t) 0 ; de plus P(t) = 0 exactement
lorsque xi +tyi = 0 pour tous les indices i la fois. Par hypothse
il y a un indice i0 tel que yi0 , 0, donc une seule valeur de t au
x
maximum peut convenir, savoir t = yi0 .
i0

Concluons. Ou bien le polynme P(t) a une racine relle et


une seule, et donc son discriminant B2 4AC = 0 ; ou bien il
na pas de racine relle du tout, et donc son discriminant B2
4AC < 0. tant donnes les valeurs de A, B et C, on a exactement ce que dit le lemme.
Dmonstration du lemme 4.30 . Notons a = (x1 , x2 , . . . , xr ) et b =
(y1 , y2 , . . . , yr ). On calcule directement
ka + bk2 =

r
X

(xi + yi )2 = kak2 + kbk2 + 2(a, b) ,

i=0

avec
(a, b) =

r
X

xi yi kak kbk ,

i=0

daprs lingalit de Cauchy-Schwartz. Finalement


ka + bk2 kak2 + kbk2 + 2kak kbk = (kak + kbk)2 .
Ceci montre la premire ingalit triangulaire ka+bk kak+
kbk. La deuxime se dduit de la premire, exactement comme
dans le corollaire 2.8.
On en dduit enfin :
Lemme 4.32 Si (un )n0 est une suite de vecteurs de Rr qui converge
vers ` Rr , alors on a galement
kun k k`k .
n

Dmonstration. On utilise la deuxime ingalit triangulaire :


| k`k kun k | k` un k .
Le membre de droite tend vers 0 daprs le (2) de la proposition 4.28.

83

Chapitre 5

Matrices
Dans ce chapitre, la lettre K dsigne Q, R ou C.

Premire lecture
Introduction
Une matrice nest rien dautre quun tableau de nombres. Si
lon sintresse mathmatiquement aux tableaux, cest toujours
de prs ou de loin parce quils interviennent dans les systmes
linaires, cest--dire les quations du genre
(
3x 7y + 9z = 1
2x +
y
= 3
Ici on pourra associer ce systme la matrice
!
3 7 9 1
.
2
1 0 3
Il est clair que toutes les informations concernant le systme
sont contenues dans cette matrice, mais de plus on va voir (et
vous en avez sans doute eu un aperu au lyce) que la rsolution du systme gagne mme en clart lorsquelle est faite partir de manipulations sur la matrice. Lobservation clef que nous
84

Le lecteur ayant
lu la dfinition
2.15 peut
prendre pour K
nimporte quel
corps.

allons voir tout de suite est que les matrices peuvent tre multiplies entre elles. Il en rsulte des notations simples et puissantes.
Dans les chapitres suivants, nous montrerons que les systmes linaires, sous des formes plus sophistiques, sont omniprsents en mathmatiques, un point qui devrait vous surprendre. Dans ce chapitre le but est simplement de se familiariser avec les matrices, et dapprendre rsoudre les systmes.
Commenons par les dfinitions.
Dfinition 5.1 Une matrice de type nm coefficients dans K
est un tableau dlments de K comprenant n lignes et m colonnes. Lensemble des matrices nm est not Mn,m (K). On utilise parfois la notation Mn (K) au lieu de Mn,n (K), dans le cas
des matrices carres .

Par exemple,
3 7 9 1
2
1 0 3

!
M2,4 (K)

et

2
3i
17

4
2
3

!
M2 (C) .

Les lments de M1,n (K) sont appels matrices-lignes et ceux


de Mn,1 (K) sont les matrices-colonnes.
Notez bien la convention suivante. partir de maintenant,
nous allons identifier les matrices-colonnes avec les vecteurs
de Kn ; cest--dire que lon identifie Kn et Mn,1 (K). On se permet donc dcrire

x1
x
2
.. Kn .
.

xn
On fait ce choix particulier dans le but de simplifier (normment) certaines formules qui vont apparatre dans la suite.
Dans dautres chapitres de ce livre, vous lavez sans doute dj
remarqu, les lments de Kn sont nots (x1 , . . . , xn ), donc en
ligne : il faut voir a comme une notation que lon sautorise ds
quil ny a pas dambigut, dans le but dconomiser la place.
Mais ds lors quil y a des matrices en vue, et des oprations
sur ces matrices, les vecteurs sont des colonnes.
85

On utilise parfois la notation


(aij ) 1 i n

1jm

ou plus simplement (aij )i,j lorsque n et m sont entendus, pour


dsigner la matrice de Mn,m (K) donc le coefficient sur la ligne i,
dans la colonne j, est le nombre aij . Par exemple dans le cas de
matrices 2 3, la matrice (aij )i,j est
!
a11 a12 a13
.
a21 a22 a23
Autre exemple, avec des matrices 3 3, la matrice donne
par (cos(i) sin(j))i,j est

cos(1) sin(1)
cos(2) sin(1)

cos(3) sin(1)

cos(1) sin(2)
cos(2) sin(2)
cos(3) sin(2)

cos(1) sin(3)
cos(2) sin(3)
cos(3) sin(3)

Dfinition 5.2 Si A = (aij )i,j est une matrice n m, alors sa


transpose est la matrice t A, de type m n, donne par
t

A = (aji ) 1 i m
1jn

(Noter linversion de i et de j : sur la ligne i dans la colonne j,


on trouve cette fois aji .)

Par exemple si A est la matrice 2 3 ci-dessus, alors

a11 a21

t
A = a12 a22 .

a13 a23
Si B est la matrice 3 3 ci-dessus, alors

cos(1) sin(1) cos(2) sin(1)

t
B = cos(1) sin(2) cos(2) sin(2)

cos(1) sin(3) cos(2) sin(3)

cos(3) sin(1)
cos(3) sin(2)
cos(3) sin(3)

La transpose dune matrice-ligne est une matrice-colonne, et


vice-versa.
86

Addition et multiplication
Pour commencer, on peut additionner deux matrices de
mme type coefficient par coefficient : par exemple
!
!
!
1 2 3
1
1
1
1 3 4
+
=
.
4 5 6
1 1 1
3 4 5
(En dautres termes (aij )i,j + (bij )i,j = (aij + bij )i,j .)
On peut aussi multiplier une matrice par un scalaire ,
cest--dire un lment de K, en multipliant tous les coefficients par ce nombre : par exemple
!
!
1
3
2
6
2
=
.
9 27
18 54
(En dautres termes (aij )i,j = (aij )i,j .)
Multiplier deux matrices entre elles est plus compliqu.
Commenons par un cas simple.
Dfinition 5.3 Donnons-nous une matrice-ligne de type 1
m, disons


A = a1 a2 am ;
prenons galement une matrice-colonne de type m 1, disons

b1
b
2
B = . .
..

bm
Alors le produit AB est par dfinition la matrice 1 1 dont
lunique coefficient est
a1 b1 + a2 b2 + + am bm .
(Si le nombre de coefficients de A ntait pas gal au nombre de
coefficients de B, le produit AB ne serait pas dfini.)

Par exemple


 1 
 

4 1 10 0 = 4 (1) + (1) 0 + 10 1 = 6 ;

1
87

ou encore


2 3

x
y

!
=

2x 3y

Dans le cas gnral, on dfinit la multiplication de la manire suivante.


Dfinition 5.4 Soit A une matrice n m, et soit B une matrice m p. Alors le produit AB est la matrice n p dont le coefficient sur la ligne i, dans la colonne j, est le produit de la
ligne i de A par la colonne j de B.

Exemple 5.5 Admettons que lon souhaite multiplier

1 4

1
2
A =

1
1
par
B=

3 14
5
1
1
0 19 7

!
.

Le produit est bien dfini puisque le nombre de colonnes de A


est gal au nombre de lignes de B. Le produit AB va avoir autant
de lignes que A et autant de colonnes que B ; ce sera donc une
matrice 3 4.
Pour faire le calcul, il est utile de prsenter les choses
comme ci-dessous.

Pour calculer, par exemple, le coefficient sur la premire


ligne, dans la colonne 3, du produit AB, on regarde la ligne
et la colonne correspondantes. Ensuite on les multiplie par la
mthode dj donne, donc ici
!



 

5
1 4
= 1 (5) + (4) (19) = 71 .
19
88

On procde de mme pour tous les autres coefficients. Aprs


un certain temps, le calcul termin ressemble ceci :

La matrice en bas droite est AB.


Exemple 5.6 Voyons comment la multiplication des matrices
permet dcrire les systmes. Considrons par exemple
(
2x + 6y = 9
4x + 3y =
1
Posons alors
A=

2
4

6
3

!
,

x
y

X=

!
et

B=

9
1

!
.

On calcule facilement que


AX =

2x + 6y
4x + 3y

!
.

Ainsi le systme de dpart est quivalent une seule galit de


matrices-colonnes, savoir :
AX = B.
Cette notation trs compacte fait ressortir le plus important :
on a bien envie de diviser par A des deux cts, puisquon
cherche X. Nous allons voir rapidement si oui ou non on peut
donner un sens prcis cette intuition.
Il faut shabituer multiplier les matrices relativement vite
et sans se tromper.

89

Rgles de calcul
Il y a deux matrices qui jouent des rles particuliers dans
les oprations arithmtiques. Tout dabord la matrice dont tous
les coefficients sont nuls : on la note simplement 0, quelle que
soit sa taille. Dans le cas des matrices carres de taille n, on a
galement la matrice identit ci-dessous :

1 0 0
0 1 0

.
.

0 0 . . 0

0 0 1
On la note Idn ou Id ou encore I.
Proposition 5.7 Les rgles de calcul suivantes sont valables
dans Mn (K) :
(a) A + B = B + A,
(e) A(B + C) = AB + AC
(b) 0 + A = A,
et (A + B)C = AC + BC,
(c) (A + B) + C = A + (B + C),
(f) Id A = A Id = A,
(d) A (A) tel que A + (A) = 0, (g) (AB)C = A(BC).
(En dautres termes, Mn (K) est un anneau, les rles de 0 et 1
tant jous par les matrices nulle et identit. Cet anneau nest pas
commutatif.)
De plus lopration de multiplication par un scalaire vrifie
A = ( Id)A = A( Id) .
La dmonstration est facile et vous est laisse titre dexercice. Par exemple examinez bien lgalit Id A = Id A = A. Cest
cause de cette rgle que lon crit parfois 1 pour la matrice
identit.
Cet nonc signifie que les rgles de calcul habituelles sappliquent aux matrices, sauf les deux suivantes. Dabord la commutativit : on na pas toujours AB = BA, par exemple pour
!
!
0
3
2 1
A=
et B =
,
1 1
2 1
on a
AB =

6 3
0
2

!
et

90

BA =

1 5
1
7

!
.

Lautre chose laquelle il faut shabituer, cest quon ne peut


pas toujours obtenir linverse dune matrice. En dautre
termes, tant donne A, il nexiste pas toujours de matrice A1
telle que AA1 = Id, mme si A , 0 (rappelons que le rle de 1
est jou par Id !). En effet il suffit de prendre
!
1 0
A=
;
0 0
il est clair quun produit AB donne toujours une matrice dont
la deuxime ligne est nulle, donc on nobtiendra jamais lidentit. Ce phnomne est trs important pour la suite, donc
soyons plus prcis.
Dfinition 5.8 (et Proposition) Soit A Mn (K). On dit que A
est inversible lorsquil existe une matrice B Mn (K) telle que
AB = Id

et

BA = Id .

Une telle matrice B, lorsquelle existe, est unique. On la note A1


et on lappelle linverse de A.

Dmonstration. Nous devons montrer lunicit de B. Supposons donc que AB = BA = Id dune part, et AC = CA = Id
dautre part. En multipliant AB = Id par C gauche, on obtient
C(AB) = (CA)B = Id B = B = CId = C.
On a donc bien B = C.
On vient de voir un exemple de matrice non-inversible.
Dans le cas des matrices 2 2, on peut dcrire les matrices
inversibles trs facilement :
Proposition 5.9 Soit
A=

a
c

b
d

!
.

Alors A est inversible si et seulement si ad bc , 0. Dans ce cas


linverse est donne par
!
1
d b
A1 =
.
a
ad bc c
91

La quantit ad bc sappelle le dterminant de A. Dans le


chapitre du mme nom, nous verrons comment tendre ceci
aux matrices n n.
Dmonstration. Soit
=
A

d b
c
a

!
.

Alors
ad bc
0

=
AA

0
ad bc

!
.

= 0. Dans ce cas la matrice A ne peut


Si ad bc = 0, alors AA
=A
= 0,
pas tre inversible : si elle ltait, on aurait A1 AA
donc a = b = c = d = 0, donc A = 0, et donc AA1 = 0 = Id,
contradiction !
Supposons maintenant que ad bc , 0. On a
= (ad bc) Id ,
AA
donc en multipliant par le scalaire

A

1
adbc ,

on obtient


1
= Id .
A
ad bc

De la mme manire, vous vrifirez que dans lautre sens on a


aussi


1
A = Id ,
A
ad bc
1
donc linverse de A existe et cest bien adbc
A, comme annonc
dans la proposition.
Exemple 5.10 Revenons lexemple 5.6. On y trouvait la matrice
!
2 6
A=
.
4 3
Son dterminant est 2 3 + 4 6 = 30, donc A est inversible et
!
1/
1/
A1 = 2 10 1 5 .
/15 /15
92

Le systme tudi tait AX = B, et nous pouvons maintenant


multiplier par A1 pour obtenir
!
!
11/
1
1
1
1 9
10
.
= 17
A (AX) = (A A)X = Id X = X = A B = A
1
/15
En dautres termes x =

11/

10

et y =

17/

15 .

Matrices chelonnes
Dfinition 5.11 Soit A une matrice. On dit que A est chelonne, ou parfois chelonne en lignes, lorsque les trois conditions
suivantes sont satisfaites :
1. Dans chaque ligne de A, le premier coefficient non-nul
(en partant de la gauche) est un 1. On lappelle le pivot de
la ligne.
2. mesure que lon descend dans les lignes, les pivots se
dcalent vers la droite.
3. Les lignes nulles de A sont situes en-dessous des lignes
non-nulles.
De plus, on dit que A est bien chelonne lorsquelle est chelonne et que les pivots sont les seuls coefficients non-nuls dans
leur colonne.

Exemple 5.12 Les matrices suivantes sont chelonnes (les pivots sont encadrs) :

!
1 4 0 3

1
2

0 0 1
,
.
0

0
1
0 0 0
0
La premire est bien chelonne, mais pas la deuxime (il faudrait que le 2 soit un 0).
Les matrices Ai ci-dessous ne sont pas chelonnes, car elles
violent les rgles 1, 2, 3 respectivement :

!
1
2 0 0
1 1
0
1

0 .
A1 = 0 5 1 ,
A2 =
,
A3 = 0 0

1 2

0 0 0
0 1 10
93

Pourquoi prter attention aux matrices (bien) chelonnes ?


Tout simplement parce que les systmes linaires correspondants sont les plus simples possibles, en fait leurs solutions
sont donnes sur un plateau.
Exemple 5.13 Prenons la matrice suivante, qui est bien chelonne :

1 4 0 3

A = 0 0 1
0 .

0 0 0
0
Elle a quatre colonnes, elle peut donc dcrire un systme
quatre inconnues sur le modle de lexemple 5.6. En clair, posons

x
4
y
et, par exemple, B = 2 ,
X =

0
t
alors le systme AX = B scrit

x + 4y

3t

= 4
= 2
0 = 0

Ici les inconnues x et z sont encore appeles pivots , on les a


dailleurs encadres. La matrice tant bien chelonne, les solutions sont sous nos yeux :
 les inconnues qui ne sont pas des pivots vont servir de
paramtres,
 les pivots vont tre exprimes en fonction de ces paramtres.
Les paramtres sont donc y et t, et on a z = 2 et x = 4 4y + 3t.
En dautres termes lensemble des solutions est

4 4y + 3t

avec
y,
t

K
K4 .

94

Il est souvent plus lisible dcrire cet ensemble sous la forme


suivante :

4
4
3

0
1
0

+
y
+
t
avec
y,
t

K
.

0
2
0

0
1
Cette mthode aurait fonctionn tout aussi bien pour nimporte quel second membre B, sauf dans les cas o cest encore
plus facile. Imaginons en effet que le dernier coefficient de B ne
soit pas nul, disons

1
1
B =
,

1
alors le systme devient

x + 4y

3t

= 1
= 1
0 = 1

Lquation 0 = 1 tant impossible satisfaire, le systme na pas


de solution du tout.
On vient de voir un systme avec une infinit de solutions,
puis un systme sans solution. Sans changer la matrice A, il
est clair que lon tombe dans lune ou lautre de ces situations,
selon le second membre B.
Mais il existe aussi des systmes possdant une solution
unique, par exemple avec
!
!
!
1 9
x
b1
0
A =
, X=
, B=
,
0
1
y
b2
alors le systme A0 X = B scrit
(
x 9y
y

= b1
.
= b2

On a donc y = b2 et x = b1 + 9y = b1 + 9b2 . Notez bien quici


la matrice A0 est chelonne mais pas bien chelonne ( cause
95

du 9), et on a russi rsoudre le systme quand mme. Ceci


dit, on a d faire une substitution supplmentaire (insrer la
valeur de y dans x).
Il est clair que si un systme AX = B avec A bien chelonne
na pas une infinit de solutions (donc pas de paramtres), alors
il y a un pivot dans chaque colonne ; la matrice A ressemble
donc la matrice identit laquelle on a rajout des lignes
de zros. Ainsi, selon B, on a soit une solution unique (si les
dernires quations sont toutes 0 = 0), soit aucune (sil y en a
une du type 0 = 1 comme ci-dessus).
En particulier, avec une matrice bien chelonne, on nobtient jamais de systme ayant, disons, six solutions. On va voir
que toutes ces observations faites sur les matrices chelonnes
se gnralisent aux matrices quelconques.
Oprations sur les lignes
Puisquil est si facile de rsoudre les systmes correspondant aux matrices chelonnes, on aimerait pouvoir se ramener
toujours ce cas. Cest effectivement possible.
Dfinition 5.14 Nous allons nous autoriser trois types doprations sur les lignes dune matrice :
1. multiplier une ligne par un scalaire non-nul,
2. permuter deux lignes,
3. ajouter une ligne un multiple dune autre ligne.

Exemple 5.15 Prenons la matrice

0
1 1 2

3
1
1 1 ,

1
1 1
5
et faisons quelques oprations. Retranchons la premire ligne
la dernire ligne (oprations de type (3)) :

0
1 1 2

3
1
1 1
L3 L3 L1

0
2
1
5
96

On a not L3 L3 L1 pour indiquer lopration effectue ;


dautres abbrviations sont possibles mais en tout cas il est bon
dindiquer au lecteur comment on a obtenu la nouvelle matrice. Poursuivons par une autre opration de type (3) :

0
1 1 2

0
4
7 1

0
2
1
5

L2 L2 3L1

Essayons une opration de type (1), puis une de type (2) :

1 1
0
4

0
1

2
0
7 1
1/
5/
2
2
0
5/
2
1

1 2
1 1/2
4
7

L3 1/2 L3

L2 L3

Essayons dobtenir une matrice aussi simple que possible. Dbarrassonsnous de ce 4 :

0
1 1 2

1
5
L3 L3 4L2
1 /2
/2
0

0
0
5 11

1
1
0

0
5/
2
11/
5

2
1/
2
1

L3

1
L
5 3

Cest dj une matrice chelonne. On peut mme poursuivre


notre effort et obtenir une matrice bien chelonne :

0
1 1 2
1
0
18/

1
0
L2 L2 L3

2
0
0
1 11/5

1 1 0

1 0
0

0
0 1

22/
18/
11/

5
5
5

97

L1 L1 + 2L3

et enfin

0
1
0

0
0
1

18/

11/
5
4/

L1 L1 + L2

Thorme 5.16 En faisant des oprations sur les lignes dune


matrice A, on peut toujours obtenir une matrice bien chelonne,
et une seule.
On notera EA la matrice bien chelonne associe A.
Lunicit de la matrice EA sera dmontre dans la deuxime
moiti de ce chapitre. Pour lexistence, il suffit de procder
comme dans lexemple 5.15. On peut garder en tte les lignes
directrices suivantes :
 On choisit une ligne avec un coefficient non-nul dans la
premire colonne, on met cette ligne en premire position, puis avec des oprations de type (3) on fait apparatre des 0 dans la premire colonne sur les autres lignes.
On divise la premire ligne par son premier coefficient
pour que celui-ci devienne un 1.
 On oublie la premire colonne et la premire ligne compltement, et on continue avec le reste de la matrice. On
obtient alors une matrice chelonne.
 Pour obtenir une matrice bien chelonne, on commence
par le dernier pivot. Avec des oprations de type (3), on
fait apparatre des 0 au-dessus de ce pivot. Puis on recommence avec les pivot prcdent.
Ou alors, relisez lexemple 5.15 soigneusement.
Toutes ces considrations nauraient pas un grand intrt
vis--vis des systmes si lon navait pas le rsultat suivant, qui
affirme que les oprations sur les lignes ne changent pas les
solutions :
Proposition 5.17 Considrons un systme de la forme AX = B,
o X et B sont des colonnes, et X contient les inconnues.
Soit A0 obtenue partir de A en faisant des oprations sur les
lignes, et soit B0 obtenue en faisant les mmes oprations sur B.
Alors le systme A0 X = B0 a les mmes solutions que AX = B.
98

L encore, la dmonstration sera donne plus loin dans ce


chapitre (elle nest pas difficile).
Exemple 5.18 Considrons le systme

x y 2z =
0

3x
+
y
+
z
=
1

x + y
z =
5
Il est de la forme AX = B en posant

1 1 2
x

1
1 , X = y ,
A = 3

1
1 1
z

B = 1 .

Daprs la proposition, on ne change pas les solutions en faisant des oprations sur A et B en mme temps. Il sagit de faire
les mmes oprations sur ces deux matrices, et en pratique de
nombreux tudiants prfrent ajouter B comme colonne A,
de sorte que lon fait des oprations sur la matrice

0
1 1 2

3
1
1 1 .

1
1 1
5
(La ligne verticale est juste l pour rappeler do vient la dernire colonne.) Cest la matrice sur laquelle nous avons travaill dans lexemple 5.15. Nous avons vu quaprs quelques
oprations, on arrive

4/
1
0
0
5

18/
.
0
1
0
5

11
0
0
1
/5
En faisant la traduction inverse,
est particulirement simple :

on retrouve un systme, qui


=
=
=

4/
5
18/
5
11/
5

Ces trois valeurs de x, y et z sont les solutions du systme initial AX = B, comme vous pouvez le vrifier.
99

Calcul de linverse dune matrice


Nous allons donner une mthode pour calculer linverse
dune matrice quand elle existe (ou dmontrer que linverse
nexiste pas lorsque cest le cas). Nous ne dirons rien de la dmonstration ici : cest encore un rsultat tabli plus loin dans
ce chapitre.
La mthode va paratre un peu magique. Donnons simplement lindication suivante : nous venons dexpliquer comment
rsoudre les systmes linaires en faisant des oprations sur
les lignes, alors que dans lexemple 5.10 nous indiquions comment rsoudre un systme si lon connait linverse de sa matrice. Cest en comparant ces deux mthodes, qui doivent bien
donner le mme rsultat, quon en dduit la mthode de calcul.
Voici le principe.
Proposition 5.19 Soit A Mn (K). Alors :
1. A est inversible si et seulement si sa matrice bien chelonne EA est lidentit.
2. tant donne une suite doprations sur les lignes qui transforment A en EA = Id, on obtient A1 en faisant les mmes
oprations (dans le mme ordre) sur la matrice identit.
Exemple 5.20 Voyons comment mettre ceci en pratique. Admettons que lon sintresse linverse de la matrice

1 1
1

0 1
1 .
A =

1
2
3
On va faire des oprations sur les lignes de A pour trouver sa
forme bien chelonne, et chaque opration est faite en parallle sur la matrice identit. On commence donc par prsenter
les matrices cte cte :

1 1
1
1 0 0

0 1

0 1 0
1

1
2
3
0 0 1

100

On commence :

1 1
1

0 1
1

0
3
2

1 1
1

0 1
1

0
0
5

1
1 1

0
1 1

0
0
1

1 1 0

0
1 0

0
0 1

1 0 0

0 1 0

0 0 1

1
0

0
1
0

0
0
1

L3 L3 + L1

1
0

0
1
3

0
0
1

L3 L3 + L2

0
1
0 1

1
/5 3/5
6/
5
1/
5
1/
5

3/
2/

1
1/
5
1/
5

2/

3/

5
5
5

1
3/

5
5

0
0
1/
5
1/

L1 L1
L2 L2
L3 15 L3

L L + L
2
3
1/
2
5

1/ L1 L1 L3
5

0
1/

L1 L1 + L2
5

1/
5
5

On a obtenu une matrice bien chelonne, cest donc EA . Ici on


a EA = Id, donc A est inversible daprs la proposition. Cette
mme proposition affirme aussi que la matrice A1 est la dernire matrice crite droite, cest--dire

0
1 1

A1 = 1/5 2/5 1/5 .

1
3
1
/5
/5 /5
Prenons un autre exemple, disons

1
2 1

B = 6 16 2

11
6
3
Cest reparti :

2 1
1
0 28 8

0 28 8

1 0 0

6 1 0

11 0 1
101

L3 L3 + 6L1
L2 L2 + 11L1


1
0

2 1

28 8

0
0

0 0
1
6
1 0

5 1 1

L3 L3 L2

Arrtons-nous : on vient dobtenir une ligne de zros. En effet, si lon poursuivait le calcul on obtiendrait une matrice bien
chelonne qui elle-mme aurait une ligne de zros, donc EB ,
Id. Daprs la proposition, la matrice B nest pas inversible. Les
calculs que lon a fait sur la matrice identit nauront servi
rien : cest lun des petits dfauts de la mthode.

Deuxime lecture
Un autre point de vue sur les oprations sur les lignes
Lobservation suivante est riche de consquences : faire une
opration sur les lignes revient multiplier gauche par une
matrice inversible. Plus prcisment :
Proposition 5.21 Soit A une matrice, et A0 obtenue en faisant
une opration sur les lignes de A. Alors il existe une matrice inversible P telle que A0 = PA.
De plus, on peut trouver une matrice P unique qui convient
pour toutes les matrices A la fois.
Dmonstration. Cherchons P qui convient pour toutes les matrices A. On na pas beaucoup de choix, puisquen faisant A =
Id, on a A0 = P Id = P : en dautres termes, la matrice P ellemme doit tre obtenue en faisant lopration en question sur
les lignes de la matrice identit.
Par exemple, pour multiplier la premire ligne par , 0,
on doit prendre

0 0
0 1 0

P = M = 0 0 1 .

.
0 0 0 ..

102

Or on vrifie que pour toute matrice A, le produit M A est effectivement obtenu en multipliant la premire ligne de A par .
De plus M est bien inversible, dinverse M1 . Donc la proposition est vraie pour cette opration. Pour multiplier une autre
ligne, dplacer le long de la diagonale.
Pour permuter la premire ligne et la deuxime, on doit
prendre

0 1 0 0
1 0 0 0

0
0
1
0

P =

0 0 0 1

0 0 0 0 ..
On vrifie que cette matrice convient effectivement. Elle est inversible, et mme gale on inverse.
Pour ajouter fois la deuxime ligne la premire, prendre

1 0
0 1 0

0 0 1 .
P = C12
=

. .
.
0 0 0
Cette matrice convient, et son inverse est C12
.
Les autres cas sont similaires.
Corollaire 5.22 Pour chaque matrice A, il existe une matrice P
inversible telle que EA = PA.
Attention, cette matrice P dpend de A fortement !
Dmonstration. On peut obtenir EA en faisant des oprations
sur les lignes de A ; disons que cela ncessite k tapes. Si la
premire opration correspond la matrice P1 , alors aprs une
tape on travaille avec P1 A. Si la deuxime opration est donne par P2 , on se retrouve avec P2 P1 A. Aprs k oprations, on
a Pk Pk1 P1 A = EA . La matrice P = Pk Pk1 P1 est inversible et
son inverse est P11 P21 Pk1 .
On peut maintenant dmontrer trs facilement la proposition 5.17 :
103

Dmonstration de la proposition 5.17 . Pour toute matrice inversible P, on a


AX = B PAX = PB,
puisquon passe de lgalit de gauche celle de droite en multipliant par P, et dans lautre sens en multipliant par P1 . Or
faire des oprations sur les lignes revient bien multiplier par
une matrice inversible.
Justification de la mthode de calcul de linverse
Commenons par un petit lemme utile.
Lemme 5.23 Soit A et B deux matrices carres telles que
AB = Id .
Alors A et B sont toutes les deux inversibles, et inverses lune de
lautre.
Rappelez-vous que dans la dfinition 5.8, on donnait deux
conditions vrifier : AB = Id et galement BA = Id. Donc ce
rsultat affirme quune seule de ces conditions entrane lautre.
Dmonstration. Soit P inversible telle que PA = EA . On a donc
PAB = EA B = P Id = P .
En particulier la matrice EA B = P est inversible. On en conclut
quil ne peut pas y avoir de lignes nulles dans EA , sinon il en
serait de mme dans EA B, et cette matrice ne pourrait pas tre
inversible.
Puisque EA est bien chelonne sans lignes nulles, et carre, on doit avoir EA = Id. Ainsi EA B = Id B = B = P, et B est
inversible. En multipliant AB = Id par B1 droite, on obtient A = B1 , donc A est inversible galement, et cest linverse
de B.
Dmonstration de la propositon 5.19. Si A est inversible, on a EA =
Id comme on vient de le voir dans la dmonstration du lemme.
Rciproquement si EA = Id, alors on prend P inversible telle
104

que PA = EA = Id. Daprs le lemme A est inversible et son


inverse est A1 = P. Ceci tablit dj le (1) de la proposition
5.19.
Puisque P = A1 , on a P Id = A1 . Or multiplier gauche
par P revient faire des opration sur les lignes, et on constate
bien que A1 sobtient en faisant sur la matrice identit les
mmes oprations que lon a faites sur A. Cest ce que dit le
(2) de la proposition.
Lunicit de la matrice bien chelonne
Proposition 5.24 Soient E1 et E2 des matrices bien chelonnes
de mme dimension. On suppose quil existe une matrice P inversible telle que E2 = PE1 . Alors E1 = E2 . De plus les coefficients de P
sous la diagonale sont nuls, et les coefficients sur la diagonale sont
tous des 1.
Dmonstration. Supposons que E1 commence par k colonnes
nulles (avec ventuellement k = 0). La k + 1-me colonne est
donc

1
0

. ,
.
.

0
puisque E1 est bien chelonne. En consquence, la matrice PE1
commence galement par k colonnes de 0, et sa k + 1-me colonne est la k + 1-me colonne de P. Mais PE1 = E2 est chelonne, donc cette colonne de P est elle aussi de la forme

1
0

. .
.
.

0
On voit donc dj que E1 et E2 sont identiques dans les k + 1

105

premires colonnes. Plus prcisment on notera


0 0 1
0 0 0

Ei = 0 0 0
Fi
.. ..
..
. .
.

0 0 0

pour i = 1 ou 2. On notera que la matrice Fi est bien chelonne.


De mme on note

a2 a3 an
1

0
P =

0
P

..

0
Cette matrice P0 est inversible ; en fait si P est de dimension n
n, alors linverse de P0 est le bloc (n 1) (n 1) en bas droite
de P1 .
partir de lgalit E2 = PE1 , on tire facilement F2 = P0 F1 .
Faisons une rcurrence sur la taille des matrices. Comme Fi
est strictement plus petite que Ei , on peut supposer que lon
connait la proposition dans ce cas, et donc que F1 = F2 et que P0
est de la forme annonce. On voit dj que P est aussi de la
forme annonce. Reste montrer que E1 et E2 ont la mme
premire ligne.
Si E1 a un pivot dans la ligne i > 1, alors E2 aussi puisque F1 =
F2 . Un pivot tant seul dans sa colonne, on constate que, dans
la mme colonne de PE1 , on trouve ai sur la premire ligne.
Puisque PE1 = E2 est bien chelonne avec un pivot dans cette
colonne, on doit avoir ai = 0 dans ce cas.
Si par contre la ligne i de E1 na pas de pivot, cest quelle
est nulle. Peu importe alors la valeur de ai pour cet indice i : la
premire ligne de PE1 est gale la premire ligne de E1 .
Dmonstration du thorme 5.16 . Si E1 et E2 sont deux matrices
bien chelonnes obtenues partir de A, alors il existe des matrices inversibles P1 et P2 telles que P1 A = E1 et P2 A = E2 (pro106

position 5.21). Ainsi E2 = P2 P11 E1 , donc la proposition prcdente montre que E2 = E1 . La matrice chelonne associe A
est bien unique.

107

Chapitre 6

Continuit
Premire lecture
Introduction & Dfinitions
Une fonction continue, intuitivement, est une fonction que
lon peut dessiner sans lever le stylo, comme celle-ci :

Ci-dessous, un dessin dune fonction qui nest pas continue. On a mme lintuition, plus prcisment, quelle nest pas
continue au point x0 :

108

Figure 6.1 Le graphe dune fonction qui nest pas continue en x0 .


Les crochets sont simplement l pour indiquer que la valeur de la
fonction au point x0 est celle indique sur la branche droite du
graphe.

Pourquoi sintresser aux fonctions continues ? La proprit


cruciale dune fonction continue est la suivante : puisque le
graphe est trac dun seul tenant, alors si la fonction prend
des valeurs positives et des valeurs ngatives, on est sr quelle
prend galement la valeur 0. Sur le premier graphe ci-dessus,
la fonction est dabord positive, puis prend quelques valeurs
ngatives ; et bien sr elle passe par la valeur 0 (comment viter cela si on ne peut pas lever le stylo ?). De mme, puisque
cette fonction reprend des valeurs positives, elle sannule une
deuxime fois.
En dautres termes, si lon sait quune fonction f est continue, alors on peut prdire lexistence de solutions de lquation f (x) = 0. De nombreuses quations qui nous concernent
peuvent se mettre sous cette forme, donc la notion de continuit va tre trs utile.
Oui mais comment traduire mathmatiquement lide de
continuit ? Il y a plusieurs faons de le faire, toutes assez
abstraites au premier abord, et nous devrions avoir un seul
critre pour juger du bien-fond dune dfinition : elle doit
nous permettre de dmontrer rigoureusement la proprit ci109

dessus. Nous allons prendre la dfinition qui nous parat la


plus simple, et nous allons effectivement dmontrer le clbre
thorme des valeurs intermdiaires , qui en est la version
prcise.
Dfinition 6.2 Soit I R, et soit f : I R une fonction.
On dit que f est continue au point x0 I lorsque, pour toute
suite (un )n0 qui converge vers x0 , la suite f (un )n0 converge
vers f (x0 ).

(Le lettre I est pour intervalle , puisque la plupart de nos
exemples sont sur un intervalle, et certains thormes ne fonctionnent que dans ce cas ; ceci dit, en toute gnralit I peut
tre nimporte quoi.)
Voyons un exemple :
Lemme 6.3 Soit P R[X] un polynme. Alors la fonction x 7
P(x) est continue (en tout point x0 ).
Dmonstration. Soit donc une suite (un )n0 telle que un
n

x0 . Puisque P est un polynme, la suite (P(un )) est obtenue


partir de (un ) en faisant une srie dadditions et de multiplications. Les limites de suites sont compatibles avec les
sommes et les produits, comme la proposition 4.10 nous laffirme, donc P(un ) P(x0 ). Ce qui signifie par dfinition
n
que P est continue.
Exemple 6.4 Le premier graphe de ce chapitre est celui de x 7
x4 + x3 x2 5x + 1. Dire que cette fonction est continue en x0
revient dire que, si un x0 , alors un4 + un3 un2 5un + 1
x40 +x30 x20 5x0 +1, ce qui est clair. Le dessin a t obtenu laide
dun ordinateur, qui procde toutes sortes dapproximations
pendant le trac, donc on ne peut pas conclure grandchose de
laspect de ce graphe. Toutefois, il est rassurant que le rsultat
ne soit pas contraire notre intuition des fonctions continues.
Exemple 6.5 Voici un exemple de fonction qui nest pas continue. Dfinissons f sur lintervalle [0, 2] par :
(
0 si x < 1
f (x) =
1 si x 1 .
110

Le graphe de f fait donc un saut autour de la valeur 1. Pour


montrer que f nest pas continue, on va considrer la suite un =
1 n1 . On a bien un 1, mais f (un ) = 0 pour tout n, donc (f (un ))
ne risque pas de converger vers f (1) = 1. Par dfinition, f nest
pas continue.
Le thorme des valeurs intermdiaires
Avant dnoncer ce thorme, un petit rappel sur les intervalles. Jusqu prsent nous avons utilis le mot intervalle
en nous basant sur les souvenirs du lyce. Voici une dfinition
simple :
Dfinition 6.6 Soit I R. On dit que I est un intervalle
lorsque, pour tous nombres a, b et c tels que a < b < c avec a I
et c I, on a aussi b I.

Exemple 6.7 On a les exemples suivants :
 Les intervalles ouverts, de la forme
]a, b[= {x | a < x < b} ,
avec a, b R ou mme a = , b = +.
 Les intervalles ferms, qui peuvent tre compacts cest-dire de la forme
[a, b] = {x | a x b} avec a, b R ,
ou bien non-compacts , cest--dire de la forme :
[a, +[

ou

] ; b] .

 Les intervalles semi-ouverts, qui sont de la forme


]a, b]

ou

[a, b[ .

En fait, cette liste est complte. Vous montrerez titre


dexercice que tout intervalle I est de lun des types ci-dessus,
et que de plus a = inf I et b = sup I, lorsque lune ou lautre de
ces bornes existe.

111

Voyons un contre-exemple. Lensemble


I = [0, 1] [3, 4]
nest pas un intervalle. Dabord, il nest pas dans la liste cidessus, et surtout on voit tout de suite que 1 I, que 3 I mais
que 2 < I, ce qui contredit bien la dfinition.
Nous pouvons maintenant noncer :
Thorme 6.8 (Thorme des valeurs intermdiaires) Soit I
un intervalle, et f : I R une fonction continue. Soient a < b
deux lments de I. Alors si y est un nombre quelconque compris
entre f (a) et f (b), il existe (au moins) un nombre x avec a x b,
tel que f (x) = y.
(En dautres termes, limage dun intervalle par une fonction
continue est encore un intervalle.)
Dmonstration. Supposons par exemple que f (a) < f (b), de
sorte que f (a) y f (b). Posons
A = {t | a t b et f (t) y} .
Cest un ensemble non-vide (a A) et major (par b), donc il
possde une borne suprieure x = sup A.
Soit n un entier 1. Considrons dune part le nombre x
1
n < x. Ce nest pas un majorant de A (puisque x est le plus
petit), donc il existe tn A avec x n1 < tn x. On a tn
x. La fonction f tant continue, on a galement f (tn ) f (x).
Puisque f (tn ) y, on a f (x) y.
Dautre part, le nombre sn = x + n1 > x ne peut appartenir
A, donc f (sn ) > y. On a sn x et, par continuit de f , il
vient f (sn ) f (x) et f (x) y.
Notez bien que x nest pas unique. Sur le dessin suivant on
a reprsent les lments de la dmonstration, et on voit quon
avait trois choix dans ce cas pour x, celui retenu tant le plus
grand.

112

Exemple 6.9 (Racine n-imes) Prenons lexemple de la fonction f : [0; +[ R dfinie par f (x) = xn , pour un entier n. Cest
une fonction polynomiale, donc continue.
Prenons un nombre rel y 0, et choisissons un nombre b
tel que bn > y. On a donc f (0) y f (b), et le thorme
des valeurs intermdiaires affirme donc lexistence dun x tel
que f (x) = y, cest--dire xn = y. On constate que tout nombre
rel positif possde une racine n-ime.
De plus, si 0 x1 < x2 , on a xn1 < xn2 ; cette remarque simple
entrane lunicit du x 0 tel que xn = y. La racine n-ime po
sitive de y est bien dfinie, on la note n y.
Nous avions dmontr ce rsultat pour n = 2, avec pas mal
defforts (proposition 2.6). Le thorme des valeurs intermdiaires, maintenant quil est dmontr, simplifie considrablement ce genre de questions.
Il nous reste considrer les racines n-imes dans C, ce qui
ncessite de nouveaux outils.
Autres exemples de fonctions continues
Les fonctions usuelles sont toutes continues :
Proposition 6.10 Les fonctions suivantes sont continues en tout
point de leur domaine de dfinition :
 x 7 ex sur R,
113










x 7 sin(x) sur R,
x 7 cos(x) sur R,
x 7 tan(x) sur R r { 2 + k avec k Z},
x 7 ln(x) sur ]0; +[,
x 7 arcsin(x) sur [1, 1],
x 7 arccos(x) sur [1, 1],
x 7 arctan(x)
sur R,

x 7 n x sur [0; +[ pour n N.

Pour linstant, on ne risque pas de donner une dmonstration de cette proposition : on na mme pas de dfinition rigoureuse de la plupart de ces fonctions !Toutefois, dans le reste
de ce chapitre, on va tablir que x 7 n x est continue, et montrer galement quil suffit de montrer la continuit des quatre
premires fonction dans la liste ci-dessus pour obtenir automatiquement la continuit des autres. Grce certaines formules
de trigonomtrie quil faudra tablir et que vous devinez peuttre, on se ramnera montrer seulement la continuit de lexponentielle. Pour cela, on travaillera directement avec la dfinition donne dans lexemple 4.21. Nous traiterons ceci dans le
chapitre intitul Lexponentielle .
Pour construire encore plus de fonctions continues, on utilise le rsultat suivant :
Proposition 6.11 Soient f et g deux fonctions dfinies sur I et
continues en x0 I. Alors
 (somme) x 7 f (x) + g(x) est continue en x0 ,
 (produit) x 7 f (x)g(x) est continue en x0 ,
1
 (inverse) si f (x) , 0 sur I, alors x 7 f (x)
est continue en x0 .
En effet, ceci dcoule directement de la proposition 4.10.
Exemple 6.12 Si lon admet que le sinus et le cosinus sont des
fonctions continues, alors
x 7 tan(x) =

sin(x)
cos(x)

est galement continue l o elle est dfinie, cest--dire l ou


le cosinus ne sannule pas.
114

Par rapport aux suites, une nouveaut trs simple :


Proposition 6.13 Soit f : I J continue en x0 I, et soit g : J
R continue en f (x0 ) J. Alors la fonction g f : I R, qui x
associe g(f (x)), est continue en x0 .
Dmonstration. Soit donc (un )n0 une suite qui converge vers x0 .
Posons vn = f (un ). La suite (vn ) converge vers f (x0 ) car f est
continue en x0 . La suite (g(vn )) converge vers g(f (x0 )) car g
est continue en f (x0 ). Donc g f , par dfinition, est continue
en x0 .
Exemple 6.14 Considrons une expression comme
x 7

ecos(x) ln(x)
.
1 + (arctan(x))2

Les propositions ci-dessous permettent daffirmer en un clin


doeil que cette fonction est continue sur ]0; +[. En effet, commenons par
x 7 1 + (arctan(x))2 ;
la fonction arctan est continue (6.10), donc son carr aussi
(6.11) ; la fonction constante gale 1 est continue, donc la
somme 1 + (arctan(x))2 est continue (6.11 encore).
Ce dnominateur ne sannule pas, donc
x 7

1
1 + (arctan(x))2

est continue (6.11).


Ensuite x 7 ecos(x) est continue puisque cest une composition de fonctions continues (6.13) ; lexpression x 7 ln(x) est
le produit du logarithme et de la fonction constante gale 1,
cest donc une fonction continue. La somme des deux aussi : le
numrateur est continu.
Enfin, toute lexpression de dpart tant le produit de deux
fonctions continues, il est continu.
Il faut sentraner reconnaitre trs vite que ce genre dexpression donne une fonction continue.

115

Le langage des limites


Dfinition 6.15 Soit f : I R une fonction et x0 R, ou
mme x0 = . On dit que f admet ` pour limite en x0 , et on
note
lim f (x) = ` ,
xx0

lorsque pour toute suite (un )n0 qui converge vers x0 , avec un
I, la suite (f (un )) converge vers `.

Dans un premier temps, cette notion apparat comme une
reformulation de la continuit, notamment cause du rsultat
suivant :
Proposition 6.16 Soit f : I R et x0 I. Alors
f est continue en x0

f admet une limite en x0 .

De plus, la limite est automatiquement f (x0 ).


Dmonstration. Si f est continue en x0 , alors par dfinition
lim f (x) = f (x0 ) ,

xx0

donc on a limplication . Pour montrer , supposons que f


admette la limite ` en x0 . Il suffit de prendre la suite constante
un = x0 pour constater que (f (un )) converge vers f (x0 ) (cette
suite est elle-mme constante). Donc ` = f (x0 ). Il est alors clair
que f est continue en x0 .
Mais il ne faut pas sy mprendre. Les limites apportent une
souplesse nouvelle, puisque lon ne suppose pas que f est dfinie
en x0 dans la dfinition des limites. Voyons des exemples.
Exemple 6.17 Considrons la fonction f : ]0; +[ R dfinie
par f (x) = 1x .
Regardons la limite en 0. Si (un )n0 converge vers 0 avec un
dans le domaine de dfinition de f , cest--dire un > 0, on
a f (un ) = u1 +. Cest donc que
n

lim f (x) = + .

x0

116

Le mme raisonnement donne


lim f (x) = 0 .

x+

En fait le graphe a lallure suivante :

Lexemple suivant illustre ce quon appelle le prolongement par continuit .


Exemple 6.18 Soit f : R r {0} R dfinie par
1
f (x) = x sin( ) .
x
Cette fonction est continue en tout x0 , 0 comme on le voit
facilement partir des rsultats ci-dessus.
Regardons la limite en 0, donc prenons (un ) qui tend vers 0
avec un , 0. Alors |f (un )| |un | puisque | sin( u1 )| 1. On en
n
dduit f (un ) 0, et donc
lim f (x) = 0 .

x0

Dfinissons alors
(
f(x) =

f (x) si x , 0 ,
0 sinon .

Les fonctions f et f ont la mme limite en tout point x0 R


(prenez le temps de vous en convaincre). De plus cette limite
vaut toujours f(x0 ). On conclut que f est continue.
117

On dit que f prolonge f par continuit, puisquelle concide


avec f sur le domaine de dfinition de cette dernire, et quelle
est continue. Vue la limite de f en 0, on naurait pas pu prendre
une autre valeur pour f(0), donc le prolongement est unique.
Voici le graphe de f sur [0, 2; 0, 2] :

Pour linstant nous ne sommes pas capables de calculer


beaucoup de limites (pas plus quau lyce). Dans le chapitre
Formules de Taylor nous verrons une mthode rapide et
facile, qui fonctionne dans beaucoup de cas.
Continuit et ingalits
Le rsultat suivant est trs utile. Il affirme que si une fonction continue satisfait une ingalit en un point, alors ceci reste
vrai au voisinage du point :
Proposition 6.19 Soit f : I R une fonction continue en x0 I.
On suppose que f (x0 ) > 0. Alors il existe un intervalle ouvert J =
]a, b[ avec x0 J tel que f (x) > 0 pour tout x J.
Dmonstration. On va mme montrer quon peut prendre a =
x0 n1 et b = x0 + n1 pour un certain entier n. En effet, si ce ntait
pas le cas, par labsurde on trouverait pour chaque n un xn tel
que
1
1
x0 < x n < x 0 +
n
n
118

et tel que f (xn ) 0. La suite (xn ) converge vers x0 , et par


continuit de f la suite (f (xn )) converge vers f (x0 ) : on en dduit f (x0 ) 0 ce qui est absurde.
En guise dapplication nous allons montrer le thorme suivant, qui donne des dfinitions alternatives de la notion de
continuit. Le (3) en particulier est utilis dans de nombreux
livres.
Thorme 6.20 Soit f : I R et x0 I. Les conditions suivantes
sont quivalentes.
1. f est continue en x0 ;
2. pour tout intervalle ouvert J contenant f (x0 ), il existe un intervalle ouvert I0 contenant x0 tel que f (I0 ) J ;
3. pour tout > 0, il existe > 0 tel que |f (x) f (x0 )| < pour
tous les x tels que |x x0 | < .
Dmonstration. Montrons que (1) (2). Lintervalle J tant
donn, il existe m et M tels que f (x0 ) ]m, M[ J. Soit alors g(x) =
f (x) m ; cest une fonction continue telle que g(x0 ) > 0, donc
daprs la proposition prcdente on a aussi g(x) > 0 pour
tous les x dans un intervalle ]a1 , b1 [. De mme en considrant h(x) = M f (x), on obtient h(x) > 0 pour x dans un intervalle ]a2 , b2 [. Sur lintervalle I0 =]a1 , b1 []a2 , b2 [, on a m < f (x) <
M, donc f (I0 ) ]m, M[ J.
Montrons (2) (3). Prenons J =]f (x0 ) , f (x0 ) + [, alors
le (2) donne un intervalle I0 , qui lui-mme contient un intervalle de la forme ]x0 , x0 + [. Linclusion f (I0 ) J donne la
conclusion du (3).
Montrons (3) (1). Soit donc (un )n0 une suite qui converge
vers x0 ; on doit montrer que (f (un )) converge vers f (x0 ). On
prend donc > 0, et un comme dans le (3). Pour n suffisamment grand, on a |un x0 | < , et donc |f (un ) f (x0 )| < .

Deuxime lecture

119

Continuit et fonctions monotones


Dfinition 6.21 Une fonction f est dite croissante lorsque,
pour tout x et y dans son domaine de dfinition, lingalit x <
y entrane f (x) f (y). Elle est dite dcroissante si x < y entrane
au contraire f (x) f (y). (Ainsi f ne peut tre la fois croissante
et dcroissante que si elle est constante.)
On dit dune fonction f quelle est monotone si elle est ou
bien croissante, ou bien dcroissante.

Nous verrons beaucoup dexemples dans le chapitre sur la
drivabilit. Notons simplement que lexponentielle est croissante, la fonction cosinus est dcroissante sur [0, ], et la mme
fonction cosinus vue comme une fonction dfinie sur R tout
entier nest pas monotone.
Le comportement des fonctions monotones vis--vis de la
continuit est particulirement simple. Commenons par une
sorte de rciproque au thorme des valeurs intermdiaires :
Proposition 6.22 Soit I un intervalle et f : I R une fonction
monotone. Alors f est continue si et seulement si f (I) est un intervalle.
Par exemple, la fonction sur la figure 6.1 est croissante. Elle
nest pas continue, et son ensemble image est en deux morceaux.
Dmonstration. Le thorme des valeurs intermdiaires affirme
que si f est continue, alors f (I) est un intervalle. Supposons
que f est croissante et montrons la rciproque (le cas o f est
dcroissante est similaire). Prenons x0 I et supposons pour
linstant que f (x0 ) nest pas une borne de lintervalle f (I).
Soit J un intervalle ouvert contenant f (x0 ). Alors J f (I)
est un intervalle contenant f (x0 ), donc contenant un intervalle [m, M] avec m < f (x0 ) < M. Par dfinition m = f (a) et M =
f (b) pour a, b I. Comme f est croissante, on a a < x0 < b dune
part, et dautre part pour a < x < b on a m < f (x) < M. En posant I0 =]a, b[, on a en particulier f (I0 ) J. Daprs le (2) du
thorme 6.20, ceci montre que f est continue en x0 .
Lorsque f (x0 ) est une borne de f (I), on a m = f (x0 ) ou M =
f (x0 ), et selon le cas, f (x0 ) est un minimum ou un maximum
120

de la fonction croissante f . On peut adapter facilement la dmonstration (laiss en exercice).


Dans le reste de ce chapitre, nous aurons besoin des notions de fonction injective, surjective, et bijective (dfinitions
1.6, 1.10, 1.13).
Proposition 6.23 Soit I un intervalle, et f : I R une fonction
continue. Alors f est monotone si et seulement si elle est injective.
Dmonstration. Si f est croissante (disons), alors en prenant
deux lments x1 , x2 I on doit avoir x1 < x2 ou x2 < x1 ,
donc f (x1 ) < f (x2 ) ou f (x2 ) < f (x1 ) selon le cas, et certainement f (x1 ) , f (x2 ). Donc f est injective.
Voyons la rciproque. Supposons que f est continue et injective, et prenons a I. On va montrer que f est monotone
sur [a, +[ ; comme a est arbitraire, on aura bien tabli que f
est monotone.
Soit g(x) = f (x) f (a), que lon voit comme une fonction
dfinie sur lintervalle I]a; +[. Par injectivit de f , la fonction g ne sannule pas. Daprs le thorme des valeurs intermdiaires, elle ne peut pas changer de signe, donc disons
par exemple que lon a g(x) > 0 pour tous les x > a, cest-dire f (x) > f (a). Dans ce cas on va montrer que f est croissante
sur ]a; +[.
En effet, si ce ntait pas le cas, on aurait deux valeurs b
et c avec a < b < c telles que f (b) > f (c). Mais alors, prenons
nimporte quelle valeur y telle que f (c) < y < f (b) et f (a) < y <
f (b). En appliquant le thorme des valeurs intermdiaires sur
lintervalle [a; b], on trouve x1 < b tel que f (x1 ) = y. En faisant
de mme sur [b, c] on trouve x2 > b tel que f (x2 ) = y. Ceci est
absurde puisque f est injective.
La fin de la dmonstration est illustre sur la figure suivante.

121

Thorme 6.24 Soit f : I J une bijection continue, o I et J


sont des intervalles de R. Alors sa rciproque f 1 est galement
continue.
Dmonstration. La fonction f tant continue et injective, elle
est monotone par la proposition prcdente. Donc f 1 est galement monotone. De plus f 1 (J) = I, qui est un intervalle par
hypothse, donc f 1 est continue daprs la proposition 6.22.
Exemple 6.25 Lorsque nous aurons (enfin) montr que la
fonction exponentielle est continue, nous dduirons du thorme ci-dessus que sa rciproque le logarithme est galement
continue. De mme les fonctions arccosinus, arcsinus, et arctangente sont continues parce que les fonctions cosinus, sinus,
et tangentes sont continues, comme nous le montrerons.
Pour linstant, nous pouvons dj tablir fermement que x 7

n
x est continue sur [0; +[ : en effet, cest la rciproque de la
fonction x 7 xn , qui est continue puisquelle est polynomiale.

122

Fonctions de plusieurs variables


Puisque la continuit sexprime en termes de convergence
de suites, et que nous savons ce que signie converger pour
une suite de vecteurs (voir proposition 4.28), nous pouvons
tendre sans problme la dfinition principale de ce chapitre :
Dfinition 6.26 Soit X Rn , et f : X Rm une fonction. On
dit que f est continue en x X lorsque pour toute suite (un )n0
qui converge vers x (dans Rn ), la suite (f (un )) converge vers f (x)
(dans Rm ).
On dit que f admet ` pour limite en x0 Rn lorsque pour
toute suite (un )n0 qui converge vers x0 , la suite (f (un )) converge
vers ` (ceci mme si x0 < X).

Notons quune telle fonction est de la forme
(x1 , x2 , . . . , xm ) 7 (f1 (x1 , . . . xn ), . . . , fm (x1 , . . . , xn )) .
Chaque fonction fi est dfinie sur X et prend ses valeurs dans R.
On appelle ces fonctions les composantes de f .
Le rsultat suivant se dmontre exactement comme les
noncs correspondants pour les fonctions dune seule variable.
Proposition 6.27 Les sommes, produits et inverses de fonctions
continues, lorsquelles sont dfinies, sont continues. La composition
de deux fonctions continues est encore continue.
Avec les notations ci-dessus, la fonction f est continue si et
seulement si chaque composante fi est continue.
De plus, f est continue en x X si et seulement si elle admet la
limite f (x) en ce point.
Enfin, une fonction f est continue en x0 si et seulement si, pour
tout > 0, il existe > 0 tel que kf (x) f (x0 )k < pour tous les x
tels que kx x0 k < .
Attention, par contre la rciproque dune fonction continue
de plusieurs variables nest pas toujours continue, contrairement au cas trait dans le thorme 6.24.

123

Exemple 6.28 La projection pi , dfinie sur Rn par


pi (x1 , x2 , . . . , xn ) = xi ,
est continue : on le vrifie directement partir des dfinitions.
Partant de l, on peut utiliser des sommes et produits, par
exemple
(x1 , x2 , x3 ) 7 2x1 x3 x52
est continue sur R3 daprs la proposition prcdente.
On peut aussi composer avec des fonctions usuelles :
(x1 , x2 ) 7 sin(x1 x2 )
est continue, ainsi que
2

(x1 , x2 , x3 ) 7 ex1 x3 arctan(x2 1) .


Exemple 6.29 Voici un exemple plus sophistiqu. On va iden2
tifier lensemble des matrices Mn (R) avec Rn pour toutes les
questions de continuit (le fait de disposer les nombres en
tableau ne change rien laffaire). De mme on va identi2
fier Mn (R) Mn (R) avec R2n .
Ceci tant fait, il est lgitime de demander si la fonction
suivante est continue :
f : Mn (R) Mn (R)
(A, B) 7

Mn (R)
f (A, B) = AB.

Et la rponse est oui : si A = (aij )i,j et B = (bij )i,j , alors sur la


ligne i, dans la colonne j de f (A, B) on trouve
n
X

ai,k bk,j .

k=0

Cette expression est continue (elle est obtenue partir des projections en faisant des produits et des sommes). Puisque les
composantes de f sont continues, cest que f est elle-mme
continue.
Notons maintenant GLn (R) lensemble des matrices inversibles de Mn (R) ; cest une notation standard qui fait rfrence
124

lexpression groupe linaire . Que dire de la continuit de


la fonction suivante ?
g : GLn (R)
A 7

GLn (R)
A1 .

Cest loin dtre une question abstraite ou inutile. Lorsque vous


confiez un ordinateur la tche de calculer linverse dune
matrice A coefficients rels, dans de nombreux cas vous allez entrer une approximation B de la matrice A (disons en ne
donnant quune dizaine de chiffres aprs la virgule). Lordinateur vous donne la valeur de B1 . Est-ce que, du fait que B
tait proche de A, on peut sattendre ce que B1 soit proche
de A1 ? Cest ce quon demande lorsque la continuit de g est
tudie.
Dans le cas n = 2, nous pouvons rpondre : en effet daprs
la proposition 5.9, la fonction g scrit dans ce cas
!
!
1
a b
d b
7
.
c d
a
ad bc c
(La mme proposition affirme que sur GL2 (R), la quantit ad
bc ne sannule pas.) Cette expression est visiblement continue.
Nous allons voir que g est continue pour tout n, mais pour
cela il va nous falloir dvelopper la thorie des dterminants,
qui font lobjet du prochain chapitre.

125

Chapitre 7

Dterminants
Dans ce chapitre, la lettre K dsigne Q, R ou C.

Premire lecture
Mthode de calcul
Lobjectif de ce chapitre est de montrer une gnralisation
de la proposition 5.9. Plus prcisment, on cherche associer
toute matrice carre un nombre, son dterminant, qui soit facilement calculable et qui permette de dcider si la matrice est
inversible ou non. On aimerait aussi avoir une formule pour
linverse (bien que lon sache dj calculer les inverses efficacement).
Cest dans la deuxime partie de ce chapitre que nous montrerons le thorme suivant :
Thorme 7.1 Il existe une unique fonction
det : Mn (K)
A 7

K
det(A)

ayant les proprits suivantes :


1. Si A1 est obtenue partir de A en multipliant une ligne
par K, alors det(A1 ) = det(A).
126

Le lecteur ayant
lu la dfinition
2.15 peut
prendre pour K
nimporte quel
corps.

2. Si A2 est obtenue partir de A en changeant deux lignes,


alors det(A2 ) = det(A).
3. Si A3 est obtenue partir de A en ajoutant une ligne un
multiple dune autre ligne, alors det(A3 ) = det(A).
4. det(Id) = 1.
De plus, pour toute matrice A, on a det(A) = det(t A). Par suite, on
peut remplacer ligne par colonne dans ce qui prcde.
Enfin, si : Mn (K) K est une fonction ayant les proprits (1), (2) et (3) ci-dessus (mais pas forcment (4)), alors il existe
un nombre K telle que (A) = det(A).
Cest tout ce que nous avons besoin de savoir sur cette fonction, et le fait de rejeter la dfinition du dterminant plus
tard ne va nous empcher ni de les calculer, ni de montrer leur
utilit.
Commenons par quelques calculs. Ensuite nous montrerons que les dterminants ont bien quelque chose voir avec
les inverses.
Exemple 7.2 Pour les matrices 22, la fonction que lon a dj
vue
!
a b
7 ad bc
c d
vrifie les quatre conditions : vrifiez-le ! Donc par unicit, cest
bien la fonction dterminant :
!
a b
det
= ad bc .
c d
Exemple 7.3 Prenons

M = 3
1
2

2
3
1
2

2
3
12

et calculons det(M). On va utiliser les proprits ci-dessus pour


se ramener une matrice chelonne, comme nous savons le
faire.

127

Dabord une notation : on va crire



2
2 2
2

3 3 3 = det 3

1 1
1
1
2
2 2
2

2
3
1
2

2
3
12

La proprit (1) est souvent interprte lenvers par


les tudiants, au dbut. Il sagit bien de la chose suivante : la
matrice M est obtenue en multipliant par 2 la premire ligne
de

1
1 1

N = 3 3 3 .
1 1
1
2
2 2
On a donc det(M) = 2 det(N). La rgle est simple : on sort
le 2 du dterminant. On va crire les choses comme ceci (on
continue avec les autres lignes) :




2
1
2 2
1 1

3 3 3 = 2 3 3 3
1 1
1 1
1
1
2
2 2
2
2 2




1
1
1 1
1 1

1
= 2 3 1 1 1 = 2 3 1 1 1 .
1 1

2
1
1 1 1
2
2 2
Maintenant faisons une opration de type (3) :



1
1 1 1
1 1
1 1 1 = 0 2
0
L2 L2 + L1 .



1 1 1
1 1 1
Ces oprations ne changent pas le dterminant. On continue :



1 1 1
1
1 1
0 2
0
0 = 0 2
L3 L3 L1 .



0 0 2
1 1 1
Avec lhabitude, vous verrez immdiatement que ce dernier dterminant vaut 4. Pourquoi ? Voyons :




1
1 1
1 1 1
0 2
0 = 2 (2) 0 1 0




0 0 2
0 0 1
128


1
= 4 0

0

1
1
0

0
0
1




1
= 4 0


0

0
1
0

0
0
1

Pour les deux dernires galits, on a fait successivement


les oprations L1 L1 L3 puis L1 L1 L2 .
Le dterminant de la matrice identit vaut 1 daprs le thorme, donc


1
1 1
0 2
0 = 4 ,


0 0 2
comme annonc. Quand au dterminant de M, il vaut finalement
1
det(M) = 2 3 (4) = 12 .
2
Exemple 7.4 Avec des oprations sur les lignes, on peut toujours se ramener au calcul du dterminant dune matrice bien
chelonn. Que dire sil ne sagit pas de lidentit ? Par exemple
que vaut det(A) lorsque

1 0 0
0 1 0
A =
?

0 0 0
Cest bien simple : en multipliant la troisme ligne de A par 0,
on obtient encore la matrice A. Donc det(A) = 0 det(A) = 0. Le
dterminant dune matrice ayant une ligne nulle est nul. Et pareil
avec les colonnes.
Le rsultat suivant est alors facile :
Proposition 7.5 Une matrice carre est inversible si et seulement
si son dterminant est non-nul.
Dmonstration. Si A0 est obtenue partir de A en faisant une
opration sur les lignes, on a det(A0 ) , 0 det(A) , 0 (on
se rappellera que les oprations autorises pour chelonner
une matrice, donnes dans la dfinition 5.14, comprennent la
multiplication dune ligne par un scalaire non-nul). Si EA dsigne comme dhabitude la matrice bien chelonne associe
A, on constate que det(A) , 0 si et seulement si det(EA ) , 0.
129

De plus, pour une matrice bien chelonne telle que EA , on


constate que son dterminant vaut 0 sil y a une ligne nulle,
et 1 sinon, puisque le seul cas dans lequel il ny a pas de ligne
nulle dans EA se produit pour EA = Id.
Pour finir on sait que A est inversible si et seulement si EA =
Id (proposition 5.19), donc si et seulement si det(EA ) = 1, ce qui
se produit si et seulement si det(A) , 0.
Par exemple, la matrice M de lexemple 7.3 est inversible
puisque son dterminant vaut 12 , 0. Pour montrer a, nous
avons en fait chelonn la matrice et trouv au passage que EM =
Id, ce qui tablit directement que M est inversible. On se demande si lon y gagne. Il est vrai quavec lhabitude, on calcule
les dterminants assez rapidement en multipliant les astuces et
les raccourcis lorsquon reconnat certaines matrices a sera
particulirement vrai lorsque nous donnerons la deuxime mthode de calcul, qui se prte au calcul mental rapide.
Il ne faut pas trop prendre a au srieux, cependant : calculatoirement, les dterminants ne sont pas un outil rvolutionnaire. Pour une matrice un peu grosse (quelques milliers
de lignes), dont on veut savoir si elle est inversible laide dun
ordinateur, la meilleure mthode consiste faire des oprations
sur les lignes pour obtenir la matrice chelonne, et les raccourcis que les dterminants permettent de prendre nont pas
une influence sensible sur la dure du calcul.
Les dterminants ont pourtant de nombreuses applications.
Donnons-en une simple.
Exemple 7.6 Soit t K. Quand-est-ce que la matrice
!
2 t
1 9
est inversible ? Son dterminant vaut 18 + t, donc la condition
est prcisment t , 18. On peut retrouver cette condition sans
passer par le dterminant, mais cest moins facile suivre.
Pour un exemple plus compliqu, soit un paramtre rel.
Quand-est-ce que la matrice
!
cos() sin()
sin()
cos()
130

est inversible ? En prenant le dterminant, on obtient cos()2 +


sin()2 = 1, donc la matrice est toujours inversible. En faisant
des oprations sur les lignes pour trouver la matrice chelonne, on se retrouve dans une discussion trs pnible.
La proposition suivante rend souvent service.
Proposition 7.7 Soit A et B deux matrices carres de mme taille.
Alors
det(AB) = det(A) det(B) .
De plus si A est inversible alors
det(A1 ) =

1
.
det(A)

Dmonstration. La matrice B tant fixe, considrons la fonction dfinie par (A) = det(AB). On voit tout de suite quelle
vrifie les proprits (1), (2) et (3) du thorme 7.1. (Noter que
faire des oprations sur les lignes de AB revient faire des oprations sur les lignes de A, puis multiplier par B.) Daprs le
thorme, il existe une constante tel que (A) = det(A).
En prenant A = Id, on observe (Id) = det(Id B) = det(B) =
det(Id) = , cest--dire = det(B). Ceci montre que det(AB) =
det(A) det(B).
Si A1 existe, on calcule det(AA1 ) = det(A) det(A1 ) =
det(Id) = 1.
Dveloppements des dterminants
Dfinition 7.8 Soit A une matrice n n. On appelle mineur
en i, j, et on note ij , le dterminant de la matrice (n1)(n1)
obtenue en supprimant la ligne i et la colonne j de A.

Exemple 7.9 Soit

A = 4

2
5
8

3
6
9

Alors

5
11 =
8

6
9



, = 1
22

7
131

3
9


, =
23

1
7

2
8

!
.

Dfinition 7.10 Notons A = (aij )i,j . Le dveloppement de det(A)


par la ligne i est
deti (A) =

n
X

(1)i+j aij ij .

j=1

Le dveloppement de det(A) par la colonne j est


detj (A) =

n
X

(1)i+j aij ij .

i=1

(Cette fois cest lindice i qui varie dans la somme.)

Exemple 7.11 Prenons

A = 2

1 1

0
5 .

0 1

Pour grer le signe (1)i+j , le plus simple est de former un tableau :

+ +
+

+ +
La rgle est simple : on commence par + en haut gauche, et on
alterne de sorte quil ny a jamais deux signes identiques cte
cte.
Pour dvelopper par rapport la premire ligne, disons, on
prend les mineurs et les coefficients dans la matrices, les signes
dans le tableau, et on ajoute :






2 0
0
5
2
5

+ (1)
(1)
det1 (A) = +0
3 0
3 1
0 1
= 0 + 17 + 0 = 17 .
Par rapport la troisime colonne, on a



0 1
2 0

3
5
det (A) = +(1)
3 0
3 1



+ (1)

= 0 5 (3) (2) = 17 .
Ce nest pas un hasard si on trouve le mme rsultat.
132

0
2

1
0

Proposition 7.12 Pour tout i et tout j, on a


deti (A) = detj (A) = det(A) .
En dautre termes, le dveloppement donne une formule pour calculer le dterminant, en fonction de dterminants plus petits.
Dmonstration. Pour linstant nous allons nous contenter dune
esquisse de dmonstration. Dans la suite du chapitre un argument complet sera donn.
Lide simple est que A 7 deti (A), vue comme une fonction Mn (K) K, vrifie les proprits (1), (2), (3) et (4) du thorme 7.1. Daprs ce thorme, une telle fonction est unique,
donc deti (A) = det(A). On procde de mme pour detj (A).
Il faut donc vrifier soigneusement ces quatre proprits.
Ce nest pas difficile (cest mme un bon exercice), mais cest
un peu long.
On a donc une nouvelle mthode, compltement diffrente,
pour calculer les dterminants. Est-elle meilleure ? En thorie
la rponse est cinglante : non, elle est mme bien pire. Pour sen
convaincre, comptons le nombre de multiplications ncessaires
pour calculer un dterminant de taille n n. En chelonnant la
matrice, on peut montrer quil faut quelque chose de lordre
de n2 multiplications pour avoir le dterminant. En dveloppant par une ligne, puis en dveloppant les dterminants plus
petits, etc, jusqu en arriver des dterminants 2 2, on fait
plus de n! oprations.
Prenons n = 50. laide dun ordinateur qui effectuerait
un milliard de milliards doprations par seconde (1018 ), il
faudrait plus de 1038 ans pour complter le calcul par la mthode des dterminants. Lunivers selon les dernires estimations existe depuis 15 109 ans. En chelonnant la matrice, les
2500 multiplications ncessaires sont faites presque instantanment.
En pratique, pour des matrices de trs petite taille (n 6)
comme vous en rencontrerez dans les exercices, et sans ordinateur, on combine souvent diffrentes mthodes : oprations
sur les lignes, sur les colonnes, et quelques dveloppements.
Voyons un exemple.
133

Exemple 7.13 Prenons

1
0
2 1

A =
7
2

2
0

0
1
9
0
.
4 5

1 1

Pour calculer det(A), on peut commencer par retrancher la


deuxime colonne la dernire, ce qui ne change pas le dterminant. On obtient


1
0
0
0

2 1
9
1
det(A) =
.
7
4 12
2
2
0 1
1
Maintenant on dveloppe par la premire
puisquelle a tellement de zros :

9
1
2
4 12
det(A) = 2

2 1
1

ligne, videmment,


,

en noubliant pas le signe qui vient du tableau de signes correspondant.


On retranche la pemire ligne aux suivantes :


9
1
2
5 13 ,
det(A) = 0


0 10
2
puis on effectue L3 L3 2L2 :

9
2
det(A) = 0 5

0
0

1
13
24

Nous sommes dj habitus aux dterminants de cette forme


triangulaire . On peut mentalement faire le dveloppement
suivant par la premire colonne :




9
1
2
0 5 13 = 2 5 13 = 2 (5) 24 = 240 .
0
24


0
0
24
134

(Dune manire gnrale, le dterminant dune matrice triangulaire est le produit des coefficients sur la diagonale). Finalement det(A) = 240.
Les formules de Cramer
Nous allons maintenant voir une formule pour calculer linverse dune matrice, qui est une gnralisation de celle donne
dans la proposition 5.9.
Soit A = (aij ) une matrice. On pose
= ((1)i+j ij )ij ,
A
et on lappelle la comatrice de A. (On rappelle que le mineur ij a t introduit dans la dfinition 7.8).
Proposition 7.14 On a
= det(A) Id .
A tA

Dmonstration. Sur la ligne i, dans la colonne j du produit A t A,


on a par dfinition le nombre
cij =

n
X

aik (1)k+j jk .

k=0

Lorsque i = j, on reconnat la formule pour le dveloppement


de det(A) par la ligne i, donc cii = det(A). Lorsque i , j par
contre, on obtient le dveloppement de det(A0 ) par la ligne j,
o A0 est la matrice obtenue partir de A en recopiant la ligne i
dans la ligne j ; comme A0 se retrouve avec deux lignes identiques, sont dterminant est nul, donc cij = 0 pour i , j.
na de coefficients non-nuls que sur la diaFinalement A t A
gonale, o lon trouve det(A), comme annonc.
Corollaire 7.15 (Formules de Cramer) Soit A une matrice
inversible. Alors
1 t
A1 =
A.
det(A)

135

Dmonstration. Daprs la proposition, on a


!
1 t
A
A = Id ,
det(A)
ce qui donne le rsultat (voir lemme 5.23).
Exemple 7.16 Prenons

1 3 1

1 4
0 .
A =

0
1
2
Pour calculer la comatrice, on commence par le coefficient en
haut gauche, qui doit tre


4 0 = 8 .
1 2
Le coefficient sur la ligne 1, dans la colonne 2, est


1 0

= 2 .

0 2
(On noublie pas le signe.) Ainsi de suite, on finit par obtenir

1
8 2

= 5
2 1 .
A

4 1 1
On calcule det(A) = 3. Finalement

5 4
8
1

2 1 =
A1 = 2

3
1 1 1

8/
3
2/
3
1/
3

5/
3
2/
3
1/
3

4/

.
1/

3
1/
3
3

Cette mthode de calcul de linverse est draisonnablement


populaire auprs des tudiants. Pourtant, elle est beaucoup
moins efficace que la mthode de la proposition 5.19 (on peut
de nouveau compter le nombre doprations effectues, et il
est largement suprieur avec les formules de Cramer). Cest
pourquoi nous ninsisterons pas sur les exemples.
Par contre les formules de Cramer ont des consquences
plus thoriques, par exemple :
136

Lemme 7.17 Soit A une matrice coefficients dans Z. Alors A


possde une inverse coefficients dans Z si et seulement si det(A) =
1.
Dmonstration. Si det(A) = 1, la formule pour A1 montre
bien que ses coefficients sont des nombres entiers.
Rciproquement, si A1 est coefficients dans Z, on note
que det(A) det(A1 ) = 1 alors que det(A) et det(A1 ) sont des
nombres entiers. Ceci entrane bien sr que det(A) = 1.
Autre application, nous pouvons maintenant rpondre la
question pose dans lexemple 6.29 :
Lemme 7.18 La fonction
GLn (R)
A 7

GLn (R)
A1

est continue.
Daprs lexpression pour A1 , cest vident.

Deuxime lecture
Unicit du dterminant
Nous allons nous tourner vers la dmonstration du thorme 7.1. La partie unicit est en fait trs simple, et en ralit nous lavons presque dj vue.
En effet, si : Mn (K) K vrifie les fameuses proprits (1), (2), (3) et (4), alors pour calculer (A), on peut faire
des oprations sur les lignes dont on sait prcisment comment elles changent la quantit (A), et se ramener une matrice chelonne. Mais pour une matrice chelonn, on constate
que prend la valeur 0 sil y a une ligne nulle, ou 1 sinon (voir
la discussion dans lexemple 7.4 et la dmonstration de la proposition 7.5). Finalement, on na tout simplement pas le choix
pour la valeur de (A). Do lunicit dune fonction qui vrifierait les quatre proprits.

137

Si ne vrifie pas la proprit (4), on pose = (Id). Si ,


0, on travaille avec (A) = (A)/ qui vrifie les quatre proprits, et donc (A) = det(A) ce qui donne bien (A) = det(A). Si
par contre = 0 on voit facilement que (A) = 0 pour toute
matrice A en raisonnant comme ci-dessus ; l encore (A) =
det(A) = 0.
Toute la difficult rside dans lexistence de la fonction
dterminant. Avec la formule pour le dveloppement du dterminant, on pourrait donner une dfinition par rcurrence,
en partant des matrices 2 2. Cest possible, mais certaines
choses vont tre difficiles montrer, comme par exemple le fait
que det(A) = det(t A). Nous allons utiliser une autre approche,
qui est plus instructive.
Faisons une observation sur les matrices 3 3. En dveloppant par les lignes ou les colonnes, on obtient

a11
a21

a31

a12
a22
a32

a13
a23
a33



= a13 a22 a31 + a12 a23 a31 + a13 a21 a32

a11 a23 a32 a12 a21 a33 + a11 a22 a33 .

On constate que le dterminant (sil existe !) est une somme


de termes de la forme a1i1 a2i2 an in prcds de signes convenables. Mme si a parat compliqu, nous allons partir de l
pour donner une dfinition gnrale.
Permutations
Dfinition 7.19 Soit X un ensemble. Une permutation de X
est une bijection : X X.
Nous allons particulirement nous intresser au cas X =
{1, 2, 3, . . . , n}. On notera Sn lensemble des permutations de
ce X, et on appelle Sn le n-ime groupe symtrique.

On trouve bien dautres notations
pour le groupe symP
trique, comme par exemple Sn ou n .
Exemple 7.20 Nous allons avoir besoin dune notation pour
138

le symbole S est
un S majuscule
en criture
gothique
allemande.

donner des exemples. Nous allons crire


=

1
2

(1) (2)

n
(n)

!
;

cest--dire que, par exemple,


=

1
3

2
2

3
1

est un raccourci pour dsigner la fonction , de lensemble {1, 2, 3}


vers lui-mme, telle que (1) = 3, (2) = 2 et (3) = 1.
Pour vfifier que est bien une bijection, et donc un lment de S3 , le plus simple est de constater que ((i)) = i
pour i = 1, 2, 3, donc 1 = .
Voyons un lement de S5 :
!
1 2 3 4 5
=
.
2 3 1 5 4
Pour montrer que est une bijection, donnons directement sa
rciproque :
!
1 2 3 4 5
1 =
.
3 1 2 5 4
On vrifie que (1 (i)) = i et 1 ((i)) = i, ce qui justifie la
notation 1 . Pour trouver ce 1 , la recette que nous venons
dappliquer est simple : pour chaque i on cherche le nombre j
tel que (j) = i, qui doit exister et tre unique (sinon nest pas
une bijection) ; cest ce nombre que lon crit en dessous de i,
cest--dire que j = 1 (i).
Voici une faon encore plus simple de le dire : changeons
les deux lignes de la matrice de , puis dplaons les colonnes
pour que sur la premire ligne on ait 1, 2, 3, 4, 5 dans cet ordre.
On obtient la matrice de 1 .
Dfinition 7.21 Soit Sn . Pour deux entiers distincts i et j
entre 1 et n, on pose
qij =

(j) (i)
.
ji
139

On a qij = qji , de sorte que qij ne dpend que de la paire {i, j}.
On pose ensuite
Y
() =
qij .
{i,j}

On appelle () la signature de .

Exemple 7.22 Prenons


=

1
2

2
3

3
1

!
S3 .

Les paires considrer sont {1, 2}, {1, 3}, {2, 3}. On trouve
q12 =

32
= 1,
21

q13 =

12
1
= ,
31
2

q23 =

13
= 2 .
32

Finalement () = 1 12 (2) = 1.
Notons que la quantit qij est positive si (i) et (j) sont
dans le mme ordre que i et j, et ngative sinon : on dit
alors quil y a une inversion en i, j.
Lemme 7.23 Pour toute permutation , on a () = 1.
Dmonstration. Montrons que |()| = 1. En posant dij = |j i|,
de sorte que dij = dji , on peut crire () = N/D avec
Y
Y
d(i)(j) et D =
dij .
N=
{i,j}

{i,j}

On doit donc montrer que N = D. Or cest une vidence : dans


les deux cas, il sagit du produit de tous les nombres dij pour
toutes les paires {i, j}. Voici une autre formulation : pour chaque
terme dij du produit D, considrons i 0 = 1 (i) et j 0 = 1 (j).
Alors N contient le terme d(i 0 )(j 0 ) = dij . Ainsi chaque terme du
produit D correspond un terme et un seul du produit N, et
vice-versa, do N = D.
Corollaire 7.24 Soit N le nombre dinversions pour . Alors
() = (1)N .
140

Dmonstration. Seul le signe de qij compte, dans le calcul de (),


puisquen valeur absolue on sait dj que |()| = 1. Ce signe
vaut (1) si et seulement si on a une inversion en i, j, donc au
total le signe est (1)N .
Exemple 7.25 Fixons i et j et considrons la transposition ij
Sn , dfinie par ij (i) = j, ij (j) = i et ij (x) = x si x , i, j. En
dautres termes, ij change i et j et fixe les autres lments.
Par exemple dans S5 on a
!
1 2 3 4 5
24 =
.
1 4 3 2 5
Calculons la signature de ij . En comptant les inversions,
on constate que lon en obtient une pour la paire {i, j}, une pour
chaque paire {i, x} avec i < x < j, et une pour chaque paire {x, j}
avec i < x < j. On peut regrouper ces dernires inversions par
deux en associant {i, x} et {x, j}, ce qui rassemble un nombre pair
de signes (1) dans le calcul de (). Linversion pour {i, j} reste
seule, et au total
(ij ) = 1 .
Dfinition 7.26 Soit et des lments de Sn . La composition dfinie par (i) = ((i)) est encore un lment
de Sn , que lon va noter par simplicit. La composition est
parfois appele le produit de et .

Proposition 7.27 Pour , Sn , on a
() = () () .
Dmonstration. crivons
(j) (i) (j) (i) (j) (i)
=

.
ji
(j) (i)
ji
Multiplions ces galits pour toutes les paires {i, j}, on obtient

Y (j) (i)

() =
() .

(j) (i)
{i,j}

141

Il ne reste qu montrer que le produit entre parenthses est (),


cest--dire que
Y (j) (i)
{i,j}

(j) (i)

Y (j) (i)
{i,j}

j i

Or chaque terme dun de ces produits se retrouve une fois


et une seule dans lautre (comme dans la dmonstration du
lemme 7.23), donc ils sont bien gaux.
La dfinition du dterminant
La voici enfin :
Dfinition 7.28 Soit A = (aij ) Mn (K). Son dterminant est
X
det(A) =
() a1(1) a2(2) an(n) .
Sn


Nous allons montrer toutes les proprits (attendues depuis
lnonc du thorme 7.1) sous forme de lemmes.
Lemme 7.29 On a det(A) = det(t A).
Dmonstration. On doit vrifier que
X
X
() a1(1) a2(2) an(n) =
() a(1)1 a(2)2 a(n)n .
Sn

Sn

Fixons , et observons les nombres a(i)i . En prenant i = 1 (j),


pour un entier j quelconque, on obtient a(i)i = aj1 (j) ; et en
prenant le produit on a
a(1)1 a(2)2 a(n)n = a11 (1) a21 (2) an1 (n) .
De plus, de la relation 1 = Id (la permutation identit), on
dduit ()(1 ) = 1 et donc () = (1 ).
Finalement, le terme correspondant dans le membre de
droite ci-dessus est prcisment le terme correspondant 1
dans le membre de gauche. Donc les sommes sont gales.
142

Lemme 7.30 Si A1 est obtenue partir de A en multipliant une


ligne par , alors det(A1 ) = det(A).
Celui-ci est vident !
Lemme 7.31 Si A2 est obtenue partir de A en permutant deux
lignes, alors det(A2 ) = det(A).
Dmonstration. Soient k et ` les lignes qui sont permutes.
Si A = (aij ), alors A2 = (a(i)j ), o = k` est la transposition
comme dans lexemple 7.25. Le dterminant de cette matrice
est
X
det(A2 ) =
() a(1)(1) a(2)(2) a(n)(n) .
Sn

Notons que a(i)(i) = aj((j)) avec j = (i), ou ce qui revient au


mme i = (j). On en tire
a(1)(1) a(2)(2) a(n)(n) = a1((1)) a2((2)) an((n)) .
Combinons a avec () = ()() = () encore daprs
lexemple 7.25. Finalement
X
det(A2 ) =
() a1((1)) a2((2)) an((n)) .
Sn

Il reste observer que la somme ci-dessus est det(A) : en effet le terme correspondant dans la dfinition de det(A) se
retrouve dans cette somme correspondant 1 .
Pour le reste des dmonstrations, fixons une matrice A,
et choisissons une ligne i. Pour x1 , x2 , . . . , xn K, on va noter f (x1 , . . . , xn ) le dterminant de la matrice obtenue en remplaant la ligne i de A par (x1 , . . . , xn ). Par exemple si A = (aij )
est une matrice 3 3 et que lon regarde la ligne 2, cela signifie
que


a11 a12 a13
f (x1 , x2 , x3 ) = x1 x2 x3 .


a31 a32 a33
En particulier on a det(A) = f (ai1 , ai2 , . . . , ain ).
143

Daprs la dfinition 7.28, il est clair quil existe des nombres


que lon va noter 1 , 2 , . . . , n tels que
f (x1 , . . . , xn ) = 1 x1 + 2 x2 + + n xn .

(*)

En consquence, on note que f (x1 +y1 , . . . , xn +yn ) = f (x1 , . . . , xn )+


f (y1 , . . . , yn ).
Lemme 7.32 Les formules de dveloppement du dterminant par
une ligne ou une colonne sont valides.
Dmonstration. Puisque det(A) = det(t A), il suffit de montrer
ceci pour les lignes. Daprs la dfinition 7.10, nous devons
donc montrer que j = (1)i+j ij , avec les notations ci-dessus.
Notons que j = f (0, 0, . . . , 1, . . . , 0), avec le 1 en j-ime position, daprs (*). On peut donc voir j comme le dterminant
dune certaine matrice ; en permutant i lignes et j colonnes,
cette matrice devient

..

M
.

0 0
1
o M est obtenue partir de A en supprimant la ligne i et la
colonne j. Vous montrerez titre dexercice que le dterminant
de cette matrice est det(M) (cest un cas archi-particulier de
dveloppement par une ligne, qui se dduit directement de la
formule de la dfinition 7.28).
Par dfinition ij = det(M), et les oprations sur les lignes et
colonnes ont introduit le signe (1)i+j , donc le dterminant j
est bien (1)i+j ij .
Lemme 7.33 Lorsque la matrice A possde deux lignes identiques,
on a det(A) = 0.
Dmonstration. En permutant ces deux lignes, on ne change
pas A ; donc det(A) = det(A). On en dduit que det(A) = 0.
Les plus observateurs auront not que cet argument ne
fonctionne que parce que 1 , 1, on encore 2 , 0. Or il se peut
144

trs bien que 2 = 0 si lon travaille avec K = Z/2Z, ce qui nest


pas exclu ! Pour couvrir ce cas, on peut faire une dmonstration
du lemme par rcurrence, en partant des matrices 2 2 et en
dveloppant par une ligne laide du lemme prcdent.
Voici finalement la dernire proprit :
Lemme 7.34 Si A3 est obtenue partir de A en ajoutant un multiple de la ligne j la ligne i, alors det(A3 ) = det(A).
Dmonstration. On a
det(A3 )

= f (ai1 + aj1 , ai2 + aj2 , . . . , ain + ajn )


= f (ai1 , ai2 , . . . , ain ) + f (aj1 , aj2 , . . . , ajn )
= det(A) + 0 .

En effet f (aj1 , aj2 , . . . , ajn ) = 0, puisque cest le dterminant de


la matrice obtenue en recopiant la ligne j dans la ligne i (et qui
possde donc deux lignes identiques).

145

Chapitre 8

Compacit
Premire lecture
Le thorme de Bolzano et Weierstrass
Dfinition 8.1 Soit (un )n0 une suite. Une sous-suite de (un )
est une suite de la forme (u(n) )n0 o : N N est une fonction strictement croissante.

Les exemples typiques sont (u2n )n0 et (u2n+1 )n0 .
Thorme 8.2 (Bolzano & Weierstrass) Soit (un )n0 une suite
de nombre rels. On suppose quil existe deux nombres a et b tels
que un [a, b] pour chaque indice n. Alors il existe une soussuite (u(n) )n0 qui possde une limite ` [a, b].
Souvent on nonce : de toute suite de rels borne on peut
extraire une sous-suite convergente .
0
Dmonstration. Posons a0 = a, b0 = b, et m = a0 +b
2 , le milieu
de [a0 , b0 ]. Soit A N lensemble des entiers n tels que un
[a0 , m], et soit B lensemble des entiers n tels que un [m, b0 ].
Les ensembles A et B ne peuvent pas tre tous les deux finis,
puisque A B = N. Si A est infini, on pose a1 = a0 et b1 = m ;
dans le cas contraire on pose a1 = m et b1 = b0 .

146

Par rcurrence, on construit an+1 et bn+1 partir de an et bn


de la mme manire, en sarrangeant pour quil y ait une infinit de termes de la suite dans lintervalle [an+1 , bn+1 ].
On finit avec deux suites (an ) et (bn ) telles que |bn an | = |ba|
2n
(puisque lon divise la longueur de lintervalle par 2 chaque
tape), et en particulier bn an 0. De plus (an ) est croissante et majore, donc converge vers `1 , alors que (bn ) est dcroissante et minore et donc converge vers `2 . On en conclut
que `1 = `2 .
Pour chaque entier n, choisissons maintenant un entier (n)
tel que an u(n) bn en sarrangeant pour que soit croissante
(cest possible par construction). Il est clair que u(n) `1 =
`2 .
Les applications sont plus thoriques que pratiques, au
moins dans un premier temps. Elles sont par contre fondamentales, et vont prendre de plus en plus dimportance au fur
et mesure de vos tudes en mathmatiques.
Fonctions continues et intervalles compacts
Nous avons vu avec le thorme des valeurs intermdiaires
(6.8) que limage dun intervalle par une fonction continue est
encore un intervalle. Il y a plusieurs types dintervalles : ouverts, ferms, semi-ouverts. . . Est-ce que limage dun intervalle
est du mme type que celui-ci ? La rponse est non, comme sur
la figure ci-dessous.

147

Ici on voit une portion du graphe dune fonction continue


dfinie sur lintervalle semi-ouvert [0, +[, et son image est visiblement lintervalle ouvert ] , +[ (il reste imaginer la
suite du graphe, videmment). Mfiance donc.
Par contre on a le rsultat suivant, qui est notre permire
application de Bolzano & Weierstrass.
Proposition 8.3 Soit f une fonction continue dfinie sur lintervalle compact I = [a, b]. Alors f (I) est aussi un intervalle compact.
Dmonstration. Soit J = f (I), on sait que cest un intervalle
daprs le thorme des valeurs intermdiaires. Soit m = inf(J)
ou m = si linf nexiste pas ; de mme soit M = sup(J)
ou M = + si le sup nexiste pas. On a donc J = (m, M) o les
parenthses signifient quon ne sait pas encore sil sagit de [
ou ].
Prenons une suite (yn ) telle que yn M, avec yn J. Par
dfinition on a yn = f (xn ) pour un certain xn I = [a, b]. Daprs
le thorme de Bolzano et Weierstrass, on peut extraire une
sous-suite (x(n) ) qui converge vers ` [a, b]. Par continuit
de f , on a f (x(n) ) = y(n) f (`). Comme (y(n) ) est une soussuite de (yn ), elle doit converger vers M, et donc M = f (`).
On en conclut que M , +, et que M J. On procde de
mme pour montrer que m , et que m J. Finalement J =
[m, M].
Notons bien, en particulier, que lon a le rsultat suivant :
Corollaire 8.4 Soit f une fonction continue dfinie sur un intervalle compact. Alors f atteint son maximum et son minimum.
Lexpression f atteint son maximum et son minimum
contient plusieurs choses, qui sont toutes des consquences du
fait que limage de f est de la forme [m, M], mais quil est bon
dnoncer sparment. Tout dabord le sup des valeurs prises
par la fonction, que lon note M, nest pas + ; mais plus prcisment, on sait aussi quil existe un x dans lensemble de dfinition tel que f (x) = M. Cest pour cette raison que lon parle
du maximum de f et pas seulement de son sup, pour insister.
De mme avec le minimum m.
148

Il peut y avoir plusieurs valeurs pour lesquelles les extrema


sont atteints, bien sr. Sur la figure ci-dessous, le maximum
de la fonction est atteint en x1 et x2 , et le minimum est atteint
en x3 .

On comparera la situation avec celle de la fonction x 7 1x ,


dfinie sur lintervalle ]0; +[ (qui nest pas compact) : elle ne
possde ni maximum ni minimum. Linf des valeurs de cette
fonction est 0, mais cette valeur nest pas atteinte.
Le corollaire prdit donc lexistence de valeurs maximales
et minimales sous des hypothses assez simples. Il est bien
utile, comme on va le voir.

Deuxime lecture
Parties compactes
Les arguments utilisant le thorme de Bolzano et Weierstrass sont tellement efficaces que lon en vient donner un nom
aux ensembles sur lesquels on peut ladapter.
Dfinition 8.5 Soit X Rn . On dit que X est compact lorsque
de toute suite (un )n0 avec un X on peut extraire une soussuite (u(n) )n0 qui converge vers ` X.


149

Avec ce vocabulaire, le thorme de Bolzano et Weierstrass


peut tre interprt comme affirmant que les ensembles que
nous avions dores et dj appels intervalles compacts
sont effectivement compacts au sens de cette dfinition. Ce
sont dailleurs les seuls intervalles ayant cette proprit. Par
exemple [0, +[ nest pas compact, puisque la suite (2n )n0 na
pas de sous-suite convergente ; de mme ]0, 1[ nest pas compact, puisque la suite ( n1 )n1 ne possde que des sous-suites
qui convergent vers 0, et 0 <]0, 1[ (noter la condition ` X, trs
importante, dans la dfinition).
Ltude des compacts se fera plus en dtails en deuxime
voire troisime anne. Nous allons cependant voir un exemple
riche de consquences.
Proposition 8.6 Soit R R2 un rectangle de la forme
R = [a, b] [c, d] .
Alors R est compact.
Dmonstration. Soit (un )n0 une suite dlments de R, et notons un = (xn , yn ).
Daprs le thorme de Bolzano et Weierstrass, on peut
trouver une sous-suite (x(n) ) qui converge vers ` [a, b]. Appliquons le mme thorme la suite (zn ) dfinie par zn = y(n) : il
existe une sous-suite (z(n) ) qui converge vers `0 [c, d]. Notons
que z(n) = y((n)) .
Considrons la suite (x((n)) ) : cest une sous-suite de (x(n) )
donc elle converge vers `. Donc finalement u((n)) converge
vers (`, `0 ).
Citons un exemple de rsultat dont la dmonstration se dduit immdiatement de celle que nous avons donne pour les
intervalles compacts.
Proposition 8.7 Soit f : X R une fonction continue, o X
Rn est un compact. Alors f atteint son maximum et son minimum.
titre dexercice vous montrerez ceci en adaptant largument donn pour le corollaire 8.4 : vous verrez quil ny a essentiellement rien changer.
150

Autres tudes de minima et maxima


Pour montrer lexistence dun maximum ou dun minimum
dune fonction f dont on ne sait pas grandchose, ou avec laquelle on ne souhaite pas faire de calculs compliqus (comme
les drives du chapitre suivant), on essaie souvent de se ramener au corollaire 8.4. Lorsque la fonction en question nest
pas dfinie sur un compact, il faut faire des efforts supplmentaires. Voici un exemple simple.
Proposition 8.8 Soit f : R2 R une fonction continue.
1. Supposons que pour toute suite (un )n0 telle que kun k +,
on a f (un ) +. Alors f atteint son minimum sur R2 .
2. Supposons que pour toute suite (un )n0 telle que kun k +,
on a f (un ) 0. Alors f atteint son maximum sur R2 .
Dmonstration. Montrons le (1), le (2) tant similaire. Soit
Rn = [n, n] [n, n] .
Ce rectangle est compact daprs la proposition 8.6, donc sur Rn
la fonction f atteint un minimum en un (proposition 8.7).
Puisque Rn Rn+1 , on a f (un+1 ) f (un ) (le minimum diminue quand on le prend sur une partie plus grande). Montrons
maintenant quil existe un entier N tel que tous les termes un
appartiennent RN . Par labsurde, si ce ntait pas le cas, on
aurait une sous-suite (u(n) )n0 telle que ku(n) k + : il
suffit de prendre u(n) lextrieur du rectange Rn . Par hypothse f (u(n) ) +, ce qui est absurde puisque (f (u(n) ))
est dcroissante. Donc N existe.
Si maintenant x R2 , on a x Rn pour un certain n, et
donc f (x) f (un ) ; mais un RN , donc f (un ) f (uN ). Finalement f (uN ) est le minimum de f .
Continuit uniforme
La prochaine application du thorme de Bolzano et Weierstrass concerne une proprit fine des fonctions continues. Rappelons que dans le (3) du thorme 6.20, nous avons montr
quune fonction f tait continue au point x0 si et seulement
151

si la condition suivante tait satisfaite : pour tout > 0 on


doit trouver un > 0 de telle sorte que |f (x) f (x0 )| < ds
que |x x0 | < . Voyons a sur un exemple.
Exemple 8.9 Prenons f (x) = 1x sur lintervalle ]0, 1], et soit x0
dans cet intervalle. Montrons que f est continue en x0 directement partir de la dfinition (cest--dire sans utiliser le fait
quil sagit de linverse dune fonction continue qui ne sannule
pas). Soit donc > 0. Calculons :



1 1 x x0

.
|f (x) f (x0 )| = =
x x0
xx0
On a donc |f (x) f (x0 )| < ds que |x x0 | < xx0 . Mais on ne
peut certainement pas prendre = xx0 , puisque ne doit pas
dpendre de x, par dfinition.
Par contre, choisissons un nombre > 0 tel que < x0 , et
prenons 0 = 2 . Pour tous les x dans lintervalle [, 1], on a 0 <
xx0 donc lingalit |x x0 | < 0 entrane bien |f (x) f (x0 )| < .
Pour finir, nous devons prendre tel que 0 < 0 dune
part, et < x0 dautre part. Avec ce , lingalit |x x0 | <
entrane x = x0 (x0 x) > x0 > , cest--dire que x [, 1] ;
largument ci-dessus donne donc |f (x) f (x0 )| < ds que |x
x0 | < .
Une chose retenir de ce calcul, cest que sur un intervalle
de la forme [, 1] on peut prendre le mme 0 pour tous les
points x0 la fois ( savoir 0 = 2 ). Alors que sur ]0, 1], nous
venons de la voir, il faut chosir un qui dpend de x0 .
Ce phnomne porte un nom :
Dfinition 8.10 Soit I R, et soit f : I R. On dit que f est
uniformment continue sur I lorsque pour tout > 0, il existe >
0 tel que |f (x)f (x0 )| < ds que lon choisit x, x0 I tels que |x
x0 | < .

Avec ce langage, nous pouvons dire que la fonction x 7 1x
est uniformment continue sur chaque intervalle compact de la
forme [, 1] pour 0 < < 1. Par contre, sur lintervalle ]0, 1], la
fonction dfinie par la mme formule nest pas uniformment
continue. Cest lessence de lexemple 8.9.
152

On peut se demander pourquoi rentrer dans des considrations si prcises. La rponse arrivera avec le chapitre sur les
intgrales : il se trouve que, pour dfinir rigoureusement lintgrale dune fonction, nous aurons besoin de savoir que ladite fonction est uniformment continue. Heureusement, nous
naurons pas refaire un travail comme ci-dessus pour chaque
fonction, puisque le thorme suivant nous pargne toutes les
difficults.
Thorme 8.11 (Heine) Soit f une fonction continue sur un
intervalle compact. Alors elle est uniformment continue.
Dmonstration. Par labsurde. Si f nest pas uniformment continue, alors il existe un > 0 tel que pour chaque > 0, on peut
choisir x et y tels que |x y| < et cependant |f (x) f (y)| .
Prenons n = n1 pour chaque entier n 1, et notons xn et yn nos
choix pour n .
Soit I = [a, b] lintervalle sur lequel f est dfinie. Daprs
la proposition 8.6, le rectangle R = I I est compact. La suite
dfinie par un = (xn , yn ) possde donc une sous-suite u(n) =
(x(n) , y(n) ) qui converge vers (`, `0 ) R. En dautres termes on
a x(n) ` et y(n) `0 , et donc x(n) y(n) ` `0 . De plus,
puisque


1
x(n) y(n) < (n) =
0 ,
(n) n
on constate ` = `0 .
Enfin, par continuit de f , on a f (x(n) ) f (`) et f (y(n) )
f (`), donc
f (x(n) ) f (y(n) ) 0 .
Mais dans la mesure o


f (x(n) ) f (y(n) ) > 0 ,
cette dernire convergence vers 0 est impossible. Cette conclusion absurde montre que f est uniformment continue.

153

Chapitre 9

Drives
Premire lecture
Dfinitions & Premires proprits
Dfinition 9.1 Soit f une fonction dfinie sur un intervalle I.
On dit que f est drivable au point x0 I lorsque le taux daccroissement, cest--dire la fonction dfinie par
Tx0 (x) =

f (x) f (x0 )
x x0

(pour x , x0 ) possde une limite (finie). Lorsque cest le cas,


cette limite est note f 0 (x0 ), et ce nombre est appele le nombre
driv en x0 .
La fonction x 7 f 0 (x), lorsquelle est dfinie en tout point
de I, est appele la drive de f .

Le taux daccroissement Tx0 (x) ci-dessus est la pente de
la droite qui passe par (x0 , f (x0 )) et par (x, f (x)). En faisant varier x, avec x0 fix, on obtient toute une famille de droites.
Lorsque f est drivable en x0 , ces droites atteignent une position limite lorsque x se rapproche de x0 . La droite passant
par (x0 , f (x0 )) et dont la pente est cette valeur limite f 0 (x0 ) est
appele la tangente au graphe de f au point x0 . La situation est
illustre sur le dessin suivant.
154

Lorsque f 0 (x0 ) > 0, la droite tangente est le graphe dune


fonction croissante ; il est raisonnable de penser alors f ellemme comme une fonction croissante au voisinage de x0 ,
et dans ce chapitre nous allons rendre cette intuition prcise.
Puisque vous connaissez le rsultat (sans dmonstration !) depuis le lyce, inutile de vous faire patienter : nous verrons que
lorsque f 0 (x0 ) > 0 pour tous les x0 , alors la fonction est croissante.
Le plus tonnant avec les drives reste la facilit avec laquelle on peut les calculer.
Exemple 9.2 Prenons f (x) = x, sur R tout entier par exemple.
Pour tout x0 , on a
Tx0 (x) =

x x0
= 1.
x x0

Cette fonction a donc certainement une limite, qui vaut 1.


Cest--dire que f 0 (x0 ) = 1, pour tout x0 R.
Autre exemple simple, si g(x) = c est une fonction constante,
alors le taux dacroissement est
cc
= 0,
x x0
155

et donc g 0 (x0 ) = 0.
Un peu plus compliqu, prenons h(x) = 1x sur R . Alors le
taux daccroissement est
!
h(x) h(x0 )
1 1
1
1
=
=
.

x x0
x x0 x x0
xx0
Cette expression tend vers 12 lorsque x x0 , donc h est drivable et h0 (x0 ) = 12 .

x0

x0

Avant mme de donner dautres exemples, notons la chose


suivante :
Lemme 9.3 Soit f une fonction drivable en x0 . Alors f est galement continue en x0 .
Dmonstration. On crit simplement
f (x) f (x0 ) = (x x0 )

f (x) f (x0 )
0 f 0 (x0 ) = 0 ,
x x0

donc f admet pour limite f (x0 ) lorsque x x0 , ce qui signifie


bien quelle est continue.
Exemple 9.4 Donnons maintenant quelques exemples de fonctions qui ne sont pas drivables. Le plus simple est de prendre
une fonction qui nest pas continue : daprs le lemme, elle ne
peut pas tre drivable non plus.
Mais il existe des fonctions continues qui ne sont pas drivables. Prenons par exemple la valeur absolue , cest--dire
la fonction x 7 |x|, dfinie sur R. Prenons x0 = 0 et examinons
le taux daccroissement :
(
|x| |0|
1 si x > 0 ,
=
T0 (x) =
1 si x < 0 .
x0
Cette expression na pas de limite en 0, puisque par exemple
on a T0 ( n1 ) 1 alors que T0 ( n1 ) 1. Donc la fonction
n

valeur absolue nest pas drivable en 0. (Et en x0 , pour x0 , 0 ?)

156


Autre exemple, la fonction dfinie sur [0, +[ par x 7
En x0 = 0, le taux daccroissement est

x 0
1
T0 (x) =
= ,
x0
x

x.

dfini sur ]0; +[. On a donc T0 (x) + lorsque x 0, et il


ny a pas de limite finie : la fonction nest pas drivable en 0 (et
ailleurs ?).
Proposition 9.5 Soient f et g deux fonctions dfinies sur I et
drivables en x0 I. Alors
 (somme) x 7 f (x) + g(x) est drivable en x0 , et sa drive en
ce point est f 0 (x0 ) + g 0 (x0 ).
 (produit) x 7 f (x)g(x) est drivable en x0 , et sa drive en
ce point est f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ).
Dmonstration. Montrons la formule pour le produit (celle
pour la somme est facile et laisse en exercice). On tudie le
taux daccroissement :
!
!
f (x)g(x) f (x0 )g(x0 )
g(x) g(x0 )
f (x) f (x0 )
= f (x)
+g(x0 )
.
x x0
x x0
x x0
Puisque f est continue en x0 en vertu du lemme prcdent,
cette expression a bien pour limite f (x0 )g 0 (x0 ) + f 0 (x0 )g(x0 ),
comme annonc.
Exemple 9.6 Prenons f (x) = g(x) = x. Alors la proposition indique que la drive de x 7 x2 est x 7 1 x + x 1 = 2x. Continuons : la drive de x 7 x3 = x2 x est, toujours daprs la
formule sur le produit, donne par x 7 (2x) x + x2 1 = 3x2 .
En continuant de cette manire, on montre par rcurrence
(faites-le) que la drive de x 7 xn est x 7 nxn1 .
Si on se donne une constante c, et que lon applique encore
et toujours la formule pour le produit, on constate que la drive de x 7 c xn est x 7 0 xn + c nxn1 = cnxn1 .
Enfin, grce la formule pour la somme, on constate que
toute fonction polynomiale, cest--dire de la forme
x 7 a0 + a1 x + a2 x2 + + an xn
157

est drivable, de drive


x 7 a1 + 2a2 x + 3a3 x2 + + nan xn1 .
Voici une autre dfinition de la drivabilit, qui va paratre
artificielle pour linstant mais dont on comprendra le caractre
naturel dans le chapitre sur les formules de Taylor.
Lemme 9.7 f est drivable en x0 si et seulement si il existe deux
nombres a0 et a1 tels quon peut crire
f (x0 + h) = a0 + a1 h + h(h) ,
o (h) 0 quand h 0. De plus, lorsque ces nombres existent,
on a a0 = f (x0 ) et a1 = f 0 (x0 ).
Lisez soigneusement la dmonstration ci-dessous, qui est
particulirement simple, afin de comprendre quil sagit juste
dune reformulation des choses. Gomtriquement, le lemme
affirme que la fonction h 7 f (x0 ) + f 0 (x0 ) h, dont le graphe est
une droite (la droite tangente), est une bonne approximation de la fonction h 7 f (x0 + h), puisque la diffrence entre
les deux, qui vaut h (h), est le produit de deux fonctions qui
tendent vers 0.
Dmonstration. Supposons dabord que f est drivable en x0 ,
et posons (nous navons gure le choix)
(h) =

f (x0 + h) f (x0 ) f 0 (x0 ) h f (x0 + h) f (x0 )


=
f 0 (x0 ) ,
h
h

pour h , 0, et (0) = 0. Par dfinition, on a bien (h) 0


lorsque h 0, et on a tout fait pour que f (x0 + h) = f (x0 ) +
f 0 (x0 )h + h(h).
Montrons la rciproque ; supposons que a0 et a1 existent,
tels que f (x0 + h) = a0 + a1 h + h(h) avec (h) 0. Tout dabord
en faisant tendre h vers 0, on constate que
lim f (x) = lim f (x0 + h) = a0 .

xx0

h0

Mais alors, la proposition 6.16 nous dit que a0 = f (x0 ).


158

Par suite le taux daccroissement en x0 vaut


f (x) f (x0 ) f (x0 + h) f (x0 )
=
= a1 + (h) ,
x x0
h
en posant h = x x0 . Lorsque x x0 , ce taux daccroissement
tend donc vers a1 , ce qui par dfinition signifie que f est drivable en x0 et que f 0 (x0 ) = a1 .
Avec cette nouvelle formulation, il devient facile de montrer un rsultat sur la composition des fonctions :
Proposition 9.8 Soit g : I J une fonction drivable en x0 I,
et soit f : J R une fonction drivable en g(x0 ) J. Alors f g est
drivable en x0 , et de plus
(f g)0 (x0 ) = f 0 (g(x0 )) g 0 (x0 ) .
Dmonstration. Daprs le lemme, on peut crire
g(x0 + h) = g(x0 ) + g 0 (x0 ) h + h(h) ,
avec (h) 0 lorsque h 0, et de mme en posant y0 = g(x0 ),
f (y0 + u) = f (y0 ) + f 0 (y0 ) u + u(u) ,
avec (u) 0 lorsque u 0. On commence donc par crire
f g (x0 + h)

= f [g(x0 + h)]
= f [g(x0 ) + g 0 (x0 ) h + h(h)]
= f (y0 + u) ,

en posant u = g 0 (x0 ) h + h(h). On peut donc poursuivre :


f g (x0 + h)

= f (y0 ) + f 0 (y0 ) u + u(u)


= f (y0 ) + f 0 (y0 ) [g 0 (x0 )h + h(h)] + u(u)
= f (y0 ) + f 0 (y0 )g 0 (x0 )h + h(h) ,

o lon a rassembl tous les termes manquants dans (h), cest-dire que lon a pos


(h) = f 0 (y0 )(h) + (g 0 (x0 ) + (h)) h(g 0 (x0 ) + (h)) .
159

Cette expression est peut-tre complique, mais lon retiendra


simplement que (h) 0 lorsque h 0.
On donc trouv a0 = f (y0 ) et a1 = f 0 (y0 )g 0 (x0 ) comme dans
le lemme, et on conclut que f g est drivable en x0 comme
annonc.
Exemple 9.9 Prenons f (t) = 1t sur J = R . Nous avons vu dans
lexemple 9.2 que f 0 (t) = t12 .
Si on se donne maintenant une fonction g dfinie sur I telle
que g(x) , 0 pour tout x I, alors on peut la voir comme une
fonction I J. On peut donc considrer f g, et on a tout sim1
plement f g (x) = g(x)
.
La proposition affirme que cette fonction est drivable, et
que sa drive en x est
f 0 (g(x)) g 0 (x) =

g 0 (x)
1
g 0 (x) =
.
2
g(x)
g(x)2

Ce rsultat est savoir, donc nous allons lnoncer sparment.


Proposition 9.10 Soit g : I R une fonction drivable qui ne
1
sannule pas. Alors la fonction x 7 g(x)
est drivable, de drig 0 (x)

ve x 7 g(x)2 .
Proposition 9.11 Les fonctions suivantes sont drivables sur le
domaine indiqu :
 x 7 ex sur R, et sa drive est x 7 ex ,
 x 7 sin(x) sur R, et sa drive est x 7 cos(x),
 x 7 cos(x) sur R, et sa drive est x 7 sin(x),
 x 7 tan(x) sur R r { 2 + k avec k Z}, et sa drive est x 7
1 + (tan(x))2 ,
 x 7 ln(x) sur ]0; +[, et sa drive est x 7 1x ,
 x 7 arcsin(x) sur [1, 1], et sa drive est x 7 1 2 ,
1x
1
,
1x2

 x 7 arccos(x) sur [1, 1], et sa drive est x 7

1
 x 7 arctan(x) sur R, et sa drive est x 7 1+x
2,

1/
n
 x 7 x = x n sur ]0; +[ pour n 1, et sa drive est x 7
n
1
1n = 1 x 1/n 1 .
n ( x)
n

160

Ce nest pas la premire fois que nous sommes dans cette


situation : nous navons pas de (vraie) dfinition des fonctions
exponentielle, sinus et cosinus, donc aucun espoir de faire cette
dmonstration pour linstant. Dans le chapitre suivant nous allons (enfin !) remdier cela.
On peut par contre calculer la drive de la fonction tangente laide des formules pour cosinus et sinus : faites-le.
Dans la deuxime partie de ce chapitre, nous verrons un rsultat sur la drive de la rciproque dune fonction, partir
duquel nous pourrons dmontrer les formules ci-dessus pour
les cinq derniers exemples.
Le thorme des accroissements finis
Le thorme des accroissements finis est aux fonctions drivables ce que le thorme des valeurs intermdiaires est aux
fonctions continues : cest ce rsultat qui justifie les dfinitions.
Commenons par une remarque simple et importante :
Lemme 9.12 Soit f : [a, b] R une fonction. On suppose quil
existe c ]a, b[ tel que f est drivable en c, et tel que f atteint un
extremum (maximum ou minimum) en c. Alors f 0 (c) = 0.

Dmonstration. Supposons que f atteint un minimum en c,

161

donc que f (x) f (c) 0 pour tout x [a, b]. Alors


f (x) f (c)
0 pour x > c .
xc
En passant la limite, on obtient f 0 (c) 0. Mais
f (x) f (c)
0 pour x < c ,
xc
et en passant la limite on obtient f 0 (c) 0.
Finalement f 0 (c) = 0, comme annonc. On procde de manire similaire dans le cas dun maximum.
Attention ne pas faire dire ce lemme plus que ce quil
ne dit vraiment. Tout dabord il ne faut pas oublier la condition c ]a, b[ : penser la fonction f (x) = x sur [0, 1], elle atteint
un minimum en 0 et un maximum en 1, mais sa drive de sannule pas. Ensuite, noter que la rciproque du lemme est fausse :
par exemple la fonction f (x) = x3 sur R vrifie f 0 (0) = 0, mais
on ne peut trouver aucun intervalle [a, b] comme dans lnonc.
Thorme 9.13 (Accroissements finis) Soit f : [a, b] R une
fonction continue. On suppose que f est drivable sur ]a, b[.
Alors il existe un nombre c avec a < c < b tel que
f 0 (c) =

f (b) f (a)
.
ba

Bien sr le nombre c nest pas unique.

162

Dmonstration. Posons
A=

f (b) f (a)
,
ba

et g(x) = f (x) Ax, pour x [a, b]. La fonction g est drivable


et g 0 (x) = f 0 (x) A. Nous allons montrer le thorme pour la
fonction g ; puisque g(b) g(a) = f (b) f (a) A(b a) = 0, on a
g(b) g(a)
= 0,
ba
et il sagit de montrer quil existe c tel que g 0 (c) = 0. Mais
alors g 0 (c) = f 0 (c)A = 0 et on a bien f 0 (c) = A, donc le thorme
est montr pour f galement.
(La fonction g vrifie g(b) = g(a), et dans ce cas particulier
le thorme sappelle thorme de Rolle .)
Daprs la proposition 8.3, on a g([a, b]) = [m, M], puisque g
est continue. Si g est constante, alors g 0 (x) = 0 pour tout x, et
il ny a rien montrer ; on peut donc supposer que m < M.
Soit x1 [a, b] tel que g(x1 ) = m et soit x2 tel que g(x2 ) = M.
Si x1 ]a, b[, on prend c = x1 . Puisque g atteint alors un minimum en c, on a g 0 (c) = 0 daprs le lemme.
Si au contraire x1 = a ou b, on a g(a) = g(b) = m. Mais
alors x2 ]a, b[ puisque m , M. Dans ce cas on pose c = x2 ,
et puisque g atteint un maximum en c, le mme lemme donne
encore g 0 (c) = 0.
La plus importante consquence est bien sr :
Corollaire 9.14 Soit f une fonction drivable dfinie sur lintervalle I. Alors
 si f 0 (x) 0 pour tous les x I, alors la fonction f est croissante ;
 si f 0 (x) > 0 pour les x, alors f est strictement croissante ;
 si f 0 (x) 0, resp. f 0 (x) < 0, alors f est dcroissante, resp.
strictement dcroissante ;
 si f 0 (x) = 0 pour tous les x I, alors f est constante.
Dmonstration. Montrons le premier point, les autres tant similaires (le dernier est mme une consquence des autres).
163

Supposons donc que f 0 (x) 0 pour x I. Si a < b sont deux


lments de I, alors daprs le thorme il existe c tel que
f (b) f (a)
= f 0 (c) 0 .
ba
On en dduit que f (b) f (a).
En Terminale vous avez normalement pass beaucoup de
temps tudier des fonctions laide de ce rsultat, ce qui ncessite un certain entranement. Nous allons donner un exemple
archi-simple pour rappeler un peu la mthode ; dans les exercices vous tes invits vous refaire la main. Dans le chapitre
suivant nous verrons quelques exemples supplmentaires.
Exemple 9.15 Regardons la fonction f dfinie sur R par
f (x) = ax2 + bx + c ,
o a, b, c R. Soit C un nombre tel que 2 = b2 4ac ; nous
savons que les racines de f , qui peuvent tre relles ou complexes, sont
x1 =

b
2a

et

x2 =

b +
.
2a

Regardons la drive : f 0 (x) = 2ax + b. Supposons que a > 0. On


b
b
a donc f 0 (x) > 0 pour x > 2a
, et f 0 (x) < 0 pour x < 2a
, ainsi
b
0
que f (x) = 0 pour x = 2a . La fonction est donc dcroissante
b
b
sur ] , 2a
] et croissante sur [ 2a
, +[ ; on en dduit quelle
b
atteint un minimum en 2a , ce qui est cohrent avec le fait que
la drive sannule en ce point.
b
est la moyenne des deux raNoter que ce nombre 2a
1
cines 2 (x1 + x2 ). De plus, la valeur minimale prise par f est
f (

b
b2
) = + c,
2a
4a

et cette valeur est ngative si et seulement si b2 4ac 0.


laide du thorme des valeurs intermdiaires, on retrouve le
fait que les racines sont relles si et seulement si le discriminant b2 4ac est positif.
164

Deuxime lecture
Le thorme du point fixe
Dfinition 9.16 Soit f : I R une fonction et soit k 0. On
dit que f est k-lipschitzienne sur I lorsque
|f (x) f (y)| k |x y| ,
pour tous x, y I.

Lorsque 0 < k < 1, on dit parfois dune fonction lipschitzienne quelle est contractante , cest--dire quelle rduit les
distances.
Vous montrerez titre dexercice trs facile que si f est klipschitzienne, alors elle est continue, et mme uniformment
continue (dfinition 8.10).
Il est important de garder en tte que lorsque f est drivable, alors cette notion nouvelle se ramne un critre trs
simple :
Lemme 9.17 Soit f : I R une fonction drivable. Alors f est klipschitzienne si et seulement si |f 0 (x)| k pour tout x I.
165

Pour lintuition il est donc raisonnable, ds lors quon a affaire une fonction lipschitzienne, de penser une fonction
drivable de drive borne.
Dmonstration. Si f est k-lipschitzienne, on crit




f (x) f (x0 ) k x x0 = k ,
x x0
x x0
do |f 0 (x0 )| k en passant la limite.
Rciproquement si |f 0 (x0 )| k pour chaque x0 , alors on utilise le thorme des accroissements finis pour crire


f (x) f (y) = |f 0 (c)| k
xy
pour tous x, y. Le rsultat en dcoule.
Thorme 9.18 (Thorme du point fixe) Soit f : I I une
fonction k-lipschitzienne, pour 0 < k < 1. Alors f possde un
unique point fixe dans I, cest--dire quil existe un unique x0 I
tel que f (x0 ) = x0 .
De plus, si u0 I est choisi arbitrairement, et si lon dfinit une
suite (un )n0 par un+1 = f (un ), alors (un ) x0 .
n

Dmonstration. Commenons par lunicit. Si x0 et x1 sont


deux points fixes de f , alors |f (x1 ) f (x0 )| = |x1 x0 | dune
part, mais par hypothse on a aussi |f (x1 ) f (x0 )| k |x1 x0 |.
On a donc |x1 x0 | = 0 puisque k < 1, do x1 = x0 .
Prenons maintenant u0 et dfinissons (un ) comme dans
lnonc. Si on peut montrer que (un ) possde une limite `,
alors la suite (f (un )) doit converger vers f (`) par continuit
de f ; mais f (un ) = un+1 , donc (f (un )) est une sous-suite de (un ),
et ce titre elle converge vers `. Donc ` = f (`) et par unicit,
` = x0 .
Il faut donc montrer que (un ) converge. crivons
un = u0 + (u1 u0 ) + (u2 u1 ) + + (un un1 ) .

166

En dautres termes en posant an = un un1 on a


un = u0 +

n
X

ai .

i=1

Nous allons montrer que la srie de terme gnral ai converge


absolument, et donc converge daprs le thorme 4.20. Pour
cela, notons que
|ai | = |ui ui1 | = |f (ui1 ) f (ui2 )|
k |ui1 ui2 | = k |f (ui2 ) f (ui3 )|
k2 |ui2 ui3 |
k3 |ui3 ui4 |

ki1 |u1 u0 | .
Ceci montre que
n
X

|ai | |u1 u0 | (1 + k + k2 + + kn1 ) = |u1 u0 |

i=1

1 kn
1k

|u1 u0 |
On a donc bien

+
X

1
.
1k

|ai | < + ,

i=1

cest--dire que la srie est absolument convergente.


Il est trs facile de rprsenter la situation sur un dessin.
Prenons I = [0, 1], et traons le graphe dune fonction drivable, telle que la pente de la tangente reste petite : daprs
le lemme 9.17, elle est lipschitzienne. On fait en sorte que la
fonction prenne ses valeurs dans [0, 1], bien sr. Ajoutons au
dessin un point u0 et son image f (u0 ), ainsi que la diagonale
(lensemble des points {(x, x) | x [0, 1]}).

167

Pour dessiner les points suivants de la suite, on doit reporter f (u0 ) sur laxe des abscisses. Pour cela, nous devons en fait
prendre le symtrique du point (0, f (u0 )), qui se trouve dj sur
la figure sur laxe des ordonnes, par rapport la diagonale.

Nous allons poursuivre en conservant uniquement les segments indiqus en traits pleins. La recette est simple : on part
dun point du graphe, on rejoint la diagonale, puis on vire
angle droit en direction du graphe. On obtient une figure en
forme de spirale, qui montre bien la convergence de la suite

168

vers le point lintersection du graphe et de la diagonale, cest-dire le point fixe.

titre dexercice, tentez lexprience suivante : essayez de


faire le mme dessin mais avec un graphe tel que la drive au
point fixe est 2 ou 3. Que se passe-til ?
Exemple 9.19 (Calcul numrique de racines carres) Il arrive parfois que lintrt du thorme ne soit pas dans lexistence et lunicit du point fixe, qui peuvent tre videntes pour
dautres raisons, mais dans la mthode de calcul de ce point
fixe qui est propose, laide de la suite (un ).
Voici un exemple. Considrons la fonction f dfinie par f (x) =
1

2 (x+ x ) pour x > 0, o est un rel positif. Lquation f (x0 ) = x0


est quivalente x20 = , qui pour x0 > 0 possde la solu
tion unique
x0 = . Oui, mais comment valuer numrique
ment ? Il existe plusieurs faons de procder videmment,
mais le thorme du point fixe en fournit dj une qui est efficace.

Pour
se
ramener
au
cadre
du
thorme,
prenons
a
=

et b > quelconque, et posons I = [a, b]. La drive est donne par f 0 (x) = 12 (1 2x2 ), et on vrifie alors que 0 f 0 (x) 12
pour x I. On en dduit que f est 12 -lipschitzienne sur I. De
plus, f est croissante sur cet intervalle ; comme f (a) = a, et
169

puisquon voit de suite que f (b) b, lintervalle I vrifie f (I)


I.
partir de maintenant, on voit f comme une fonction I I
laquelle le thorme sapplique. En prenant par exemple u0 =
b, nous savons maintenant que la suite dfinie
par rcurrence
par un+1 = f (un ) = 12 (un + u ) converge vers .
n
Essayons pour = 2. En prenant b = 2, on en dduitque la
suite vrifiant u0 = 2 et un+1 = 12 (un + u2 ) converge vers 2. Les
n
premiers termes sont
u0 = 2 ,

u1 =

3
= 1, 5 ,
2

u2 =

17
= 1, 41666 . . .
12

puis
u3 =

577
665857
= 1, 4121568627 . . . , u4 =
= 1, 41421356237 . . .
408
470832

La mthode est trs bonne puisquon peut calculer la prcision


du rsultat. En effet, on a
|un+1 x0 | = |f (un ) f (x0 )| k |un x0 | ,
et on en dduit (un peu comme dans la dmonstration du thorme) que
|un x0 | kn |u0 x0 | .
Dans notre exemple, on a pris k =

1
2

et donc on sait que

1
1
|un 2| n |2 2| n .
2
2

Comme 210 > 1000, on en dduit que lcart entre u10 et 2


est infrieur 0, 001, par
exemple ; puisque u10 commence
par 1, 414, on en dduit que 2 commence galement par 1, 414.
(Et sachant ceci, on en dduit a posteriori que u4 commence
dj par les 3 bons chiffres aprs la virgule. Mais il fallait bien
le dmontrer.)

170

Drives et rciproques
Proposition 9.20 Soit f : I J une bijection, et soit f 1 : J I
sa rciproque. On suppose que f est continue, et quelle est drivable au point x0 I, avec f 0 (x0 ) , 0. Alors en notant y0 = f (x0 ),
la fonction f 1 est drivable au point y0 et
(f 1 )0 (y0 ) =

1
.
f 0 (x0 )

Dmonstration. Le taux daccroissement pour f 1 au point y0


est la fonction Ty0 dfinie par
Ty0 (y) =

f 1 (y) f 1 (y0 )
,
y y0

pour y , y0 . On a donc
Ty0 (f (x)) =

f 1 (f (x)) f 1 (f (x0 ))
x x0
=
,
f (x) f (x0 )
f (x) f (x0 )

et cette expression a un sens pour x , x0 puisqualors f (x) ,


1
f (x0 ). Par drivabilit de f , on en dduit que Ty0 (f (x)) f 0 (x
0)
lorsque x x0 .
Comme la fonction f 1 est continue daprs le thorme 6.24,
on a f 1 (y) f 1 (y0 ) = x0 lorsque y y0 . Par composition,
h
i
1
Ty0 (y) = Ty0 f (f 1 (y)) 0
f (x0 )
lorsque y y0 , ce qui signifie bien que f 1 est drivable en y0 ,
et que le nombre driv est celui annonc.
En combinant plusieurs rsultats dj obtenus, on en arrive
au thorme suivant, qui est facile mmoriser.
Thorme 9.21 Soit f une fonction continument drivable sur
lintervalle I, telle que f 0 (x) , 0 pour tout x I.
Alors f ralise une bijection I J. Sa rciproque f 1 est galement continument drivable, et
(f 1 )0 (y) =

1
,
f 0 (f 1 (y))

171

pour tout y J.
Enfin, si I est ouvert, alors J lest aussi.
Notez que lon dit dune fonction f quelle est continument
drivable pour indiquer quelle est drivable et que f 0 est continue. On parle aussi parfois de fonction de classe C1 .
Dmonstration. Puisque la fonction f 0 est continue et ne sannule pas, elle ne peut pas changer de signe en vertu du thorme des valeurs intermdiaires : ainsi, ou bien f 0 (x) > 0 pour
tout x I et f est croissante, ou bien f 0 (x) < 0 et f est dcroissante. Dans tous les cas, f est monotone. En notant J = f (I), qui
est un intervalle encore daprs le thorme des valeurs intermdiaires, on a donc tabli que f : I J est une bijection.
La proposition prcdente montre que f 1 est drivable en
tout point de J, et montre galement la formule pour (f 1 )0 . Le
thorme 6.24 montre que f 1 est continue, et on en conclut
que (f 1 )0 = f 0 f1 1 est elle-mme continue.
Enfin, une fonction (strictement) monotone ne peut pas
avoir de minimum ni de maximum sur un intervalle ouvert
(vrifiez-le), donc J doit tre ouvert si I est ouvert.
Exemple 9.22 On peut retrouver certains des rsultats de la
proposition 9.11. Par exemple, sachant que la fonction exponentielle est drivable, et que cest mme sa propre drive, on
peut calculer la drive de sa rciproque, le logarithme, partir
du thorme :
ln0 (x) =

1
1
1
=
= .
exp0 (ln(x)) exp(ln(x)) x

Autre exemple, sachant que la fonction tangente est drivable


et que
tan0 (x) = 1 + (tan(x))2 > 0 ,
on en dduit que sa rciproque arctangente est drivable et que
arctan0 (x) =

1
1
1
=
=
.
tan0 (arctan(x)) 1 + tan(arctan(x))2 1 + x2

172

Avant 1990,
lorthographe
recommande
tait
continment .

Sur le mme modle, vous pourrez traiter arcsinus et arccosinus.


Enfin, prenons f (x) = xn (pour n 1), de sorte que f 0 (x) =
n1
nx . Cette drive sannule en 0 (pour n 2), donc pour appliquer le thorme il faut se restreindre ]0; +[. On
en dduit que la rciproque, cest--dire la fonction f 1 (x) = n x, est
drivable pour x > 0 et que
(f 1 )0 (x) =

1
1
1
1
n
= ( x)1n .
=
=
f 0 (f 1 (x)) n(f 1 (x))n1 n( n x)n1 n

En 0, cette fonction nest pas drivable, voir lexemple 9.4.


Fonctions valeurs vectorielles
Soit I R, et soit f : I Rn , qui est donc de la forme
t 7 f (t) = (f1 (t), f2 (t), , fn (t)) .
Pour dfinir la drive dune telle fonction, deux choses peuvent
venir lesprit ; et la proposition suivante affirme quelles concident.
Proposition 9.23 Avec les notations ci-dessus, les deux proprits suivantes sont quivalentes :
1. chaque fonction fi est drivable au point t0 ;
2. la fonction
f (t) f (t0 )
t 7
t t0
possde une limite lorsque t t0 .
Dans ce cas, la limite en question est
(f10 (t0 ), . . . , fn0 (t0 )) ,
que lon appelle le vecteur driv de f en t0 ; on le note f 0 (t0 ).
Rappelons que la notion de limite de fonction valeurs vectorielles a t donne dans la dfinition 6.26. Il faut bien comprendre que lorsque lon forme
f (t) f (t0 )
,
t t0
173

le numrateur est une diffrence de vecteurs (ou de matricescolonnes, si lon veut), alors que le dnominateur est un scalaire. Cest--dire que

f1 (t) f1 (t0 )
f (t) f (t0 )
1

..
=
.

t t0
t t0
fn (t) fn (t0 )
Ayant ralis ceci, la dmonstration est facile.
Exemple 9.24 Une fonction de la forme : I R2 , donc de la
forme
t 7 (t) = (x(t), y(t)) ,
est appele une courbe. La drive, lorsquelle existe, est
t 7 0 (t) = (x0 (t), y 0 (t)) ,
et 0 (t) est appel le vecteur-vitesse linstant t : en effet on peut
penser comme un point qui se dplace dans le plan. La
vitesse linstant t est
q
k0 (t)k = x0 (t)2 + y 0 (t)2 .
Par abus de langage, limage de , cest--dire lensemble
(I) = {(t) | t I} ,
est parfois galement appel une courbe. Au point (t), on peut
tracer la droite de vecteur directeur 0 (t), qui est appele la
tangente la courbe linstant t. Nous allons tudier quelques
courbes dans les exercices. a se fait simplement en tudiant
sparment les fonctions t 7 x(t) et t 7 y(t).
Les proprits usuelles des drives restent vraies pour les
fonctions valeurs vectorielles, par exemple il est clair que (f +
g)0 = f 0 + g 0 . Il ny a pas de formule pour le produit, puisque le
produit de deux vecteurs nest pas en gnral dfini.
Par contre, on peut considrer les fonctions dont les valeurs sont des matrices, cest--dire les fonctions du type I
Mn,m (R). On peut identifier Mn,m (R) avec Rnm , et ce qui prcde sapplique. On a alors sans surprise :
174

Lemme 9.25 Si f : I Mn,m (R) et g : I Mm,` (R) sont drivables, alors f g : I Mn,` (R) est drivable et
(f g)0 (t) = f 0 (t)g(t) + f (t)g 0 (t) .
La dmonstration peut se faire directement par le calcul,
en se basant sur la formule pour les fonctions valeurs relles
(voir la proposition 9.5).
Par contre, il faut faire attention une chose : le thorme
des accroissements finis concerne strictement les fonctions
valeurs relles, et na pas dquivalent pour les fonctions vectorielles. Il reste nanmoins vrai que si une fonction drivable f
sur un intervalle I vrifie f 0 (t) = 0 pour tout t I, alors f est
constante : en effet il suffit de le vrifier pour chaque composante de f .
Enfin, concluons en indiquant que ces dernires remarques
sur les fonctions valeurs vectorielles ou matricielles restent
vraies en remplaant R par C.

175

Chapitre 10

Lexponentielle
Premire lecture
Lexponentielle complexe
Dfinition 10.1 Soit z C. On note exp(z) ou ez le nombre
+ k
n
X
X
z
zk
= lim
.
k! n
k!

ez =

k=0

Le nombre complexe

ez

k=0

est appel lexponentielle de z.

Lexistence de la limite a t montre dans lexemple 4.25.


La plus importante proprit de lexponentielle est sans
conteste la suivante :
Thorme 10.2 Soient a et b deux nombres complexes. Alors
ea+b = ea eb .
e0

En particulier, pour tout nombre complexe z, on a ez ez =


= 1. On constate donc que ez , 0.

Dmonstration. On a ea+b = lim un , en posant


n
X
(a + b)k
un =
.
k!
k=0

176

En utilisant la formule de Newton pour le binme, on peut dvelopper et obtenir :


!
n X
k
X
k ap bkp
un =
p
k!
k=0 p=0

n X
k
X
ap bkp
=
.
p! (k p)!
k=0 p=0

Si maintenant on pose p,q =

ap bq
p! q! ,

et si on note

Tn = {(p, q) N N | 0 p + q n} ,
alors le calcul prcdent scrit
X
un =
p,q .
(p,q)Tn

De mme, on a ea eb = lim vn o

n
n
X
ap X bq

vn =

p!
q!
p=0

q=0

On peut dvelopper le produit :


vn =

n X
n
X
ap bq
.
p! q!
p=0 q=0

Si on pose cette fois-ci


Cn = {(p, q) N N | 0 p n et 0 q n} ,
alors on a
vn =

p,q .

(p,q)Cn

On souhaite montrer que (un ) et (vn ) ont la mme limite, ou


encore que vn un 0. Cette diffrence scrit
n
X
vn un =
p,q .
(p,q)Cn rTn

177

On a donc la majoration
|vn un |

|p,q | ,

(p,q)Cn rTn
p

et |p,q | = |a|p! |b|q! . On en tire la conclusion suivante : si on avait


dmontr le thorme pour |a| et |b| la place de a et b, alors
on saurait que le membre de droite de cette dernire ingalit
tend vers 0, donc le membre de gauche aussi. Ainsi, il est suffisant de montrer le thorme pour tous les nombres rels 0,
largument ci-dessus montre quil est alors vrai pour tous les
complexes.
Nous poursuivons donc en supposant que a 0 et b 0. Il
suffit alors dobserver que CN T2N C2N pour en dduire que
vn u2n v2n .
Ces trois suites sont convergentes, il est donc clair quelles ont
la mme limite.
Le rsultat suivant va tre utile pour calculer des drives.
Proposition 10.3 Pour tout nombre complexe z0 , on a
ez ez0
= ez0 .
zz0 z z0
lim

Cest bien une limite dans les complexes, pas seulement


dans R. Donc strictement parler ce nest pas un nombre driv.
Dmonstration. Prenons dabord z0 = 0. On crit
z z2
zn
ez 1
= 1 + + + +
+
z
2! 3!
(n + 1)!
!
1
z
zn
= 1+z
+ + +
+ .
2! 3!
(n + 2)!

178

On dit parfois
que la fonction
z 7 ez est
holomorphe .

Lorsque |z| 1, on a la majoration



!


1

z
zn
1 + 1 + + 1 +
z
+
+

+
+

|z|



2! 3!
2! 3!
(n + 2)!
n!
= |z|(e 1) 0 .
z0

ez 1

On a donc bien z 1 = e0 lorsque z 0.


Maintenant si z0 est quelconque, on pose h = zz0 et daprs
le thorme prcdent,
!
ez ez0 ez0 +h ez0
eh 1
=
= e z0
ez0 ,
z z0
h
h
en utilisant le cas particulier dj trait.
Lexponentielle relle
Lorsque x R, il est clair que ex R. Nous allons nous tourner vers ltude de x 7 ex , vue comme une fonction R R, et
bien sr lun de nos objectifs est de vrifier quil sagit bien de
la fonction aborde en Terminale.
Voici de quoi sen convaincre :
Lemme 10.4 La fonction exp : R R est drivable, et exp0 =
exp. De plus, il sagit de lunique fonction ayant cette proprit et
prenant la valeur 1 en 0.
Le mot-clef est peut-tre unique : au Lyce on vous a certainement prsent lexponentielle comme une fonction gale
sa drive, et telle que exp(0) = 1, sans pouvoir dmontrer son
existence. Daprs le lemme, la fonction exponentielle que nous
avons prsente est la bonne.
Dmonstration. Le fait que exp0 = exp dcoule directement de
la proposition 10.3.
Soit maintenant une fonction f : R R telle que f 0 = f
et f (0) = 1. On considre la fonction g dfinie par g(x) =
ex f (x). On a alors g 0 (x) = ex f (x)+ex f 0 (x) = 0 puisque f 0 (x) =
f (x). Par suite, la fonction g est constante, disons g(x) = c.
179

Mais alors f (x) = ex g(x) puisque ex ex = e0 = 1, donc f (x) =


Si nous prenons en compte f (0) = 1, on en dduit c = 1, et
finalement f (x) = ex .

cex .

Proposition 10.5 La fonction exponentielle ralise une bijection R R>0 . Sa rciproque, que lon appelle le logarithme nprien et que lon note ln : R>0 R, est drivable. De plus, on a
ln0 (x) = 1x .
Dmonstration. On a vu que lexponentielle ne sannulait pas.
Daprs le thorme des valeurs intermdiaires, elle ne peut
pas changer de signe sur R, et comme e0 = 1, on conclut que ex >
0 pour x R.
Comme exp0 = exp > 0, lexponentielle est croissante. On a
donc ex 1 pour x 0. En considrant g(x) = ex x 1, qui
satisfait g(0) = 0 et g 0 (x) = ex 1 0 pour x 0, on saperoit que g est croissante et donc reste positive pour x 0. En
dautres termes ex x + 1 pour x 0, et en particulier
lim ex = + .

x7+

On en dduit
lim ex = lim ex = lim

x7

x7+

x7+ ex

= 0.

Daprs le thorme des valeurs intermdiaires, limage


de R par la fonction exponentielle est un intervalle, contenu
dans ]0, +[. Vues les limites que nous venons de calculer, cette
image doit tre ]0, +[ tout entier.
On a donc montr que lexponentielle tait une bijection
comme annonc. Les assertions sur la rciproque se montrent
avec la proposition 9.20, et vrai dire, nous lavons dj fait
dans lexemple 9.22.
Voici une dernire proprit qui tait familire au lyce.
Proposition 10.6 Soit N un entier. Alors
ex
= + ,
x7+ xN
lim

180

et

lim xN ex = 0 .

x7

Enfin
lim t ln(t) = 0 .
t0

Dmonstration. Posons Pn (x) = 1 + x + x2 + + xn! , de sorte


que ex = limn Pn (x). Pour x 0, on a ex Pn (x) pour tout n ;
or pour n > N on a dj
lim

x+

Pn (x)
= + ,
xN

pour des raisons de degrs. La deuxime limite se calcule


en prenant linverse, puisque ex = e1x . Pour la troisime, on
pose x = x(t) = et , de sorte que t ln(t) = xex avec x(t)
lorsque t 0, do le rsultat.
Le cercle et le nombre
Nous allons maintenant dudier la fonction dfinie sur R
par (t) = eit . En identifiant C et R2 , on pense comme une
courbe dans le plan. Commenons par une remarque.
Lemme 10.7 Soit z C. Alors ez = ez .
Dmonstration. Il faut noter que si (un ) est une suite de complexes telle que un = an +ibn ` = `1 +i`2 , alors un = an ibn
` = `1 i`2 (puisque an `1 et bn `2 ).
On obtient le lemme en appliquant cette remarque
n
X
zn
,
un =
n!
k=0

qui converge vers

ez ,

alors que
n
X
zn
un =
n!
k=0

converge vers ez .
181

Puisque it = it quand t R, nous avons eit = eit , et donc


|eit |2 = eit eit = e0 = 1 .
Par suite |(t)| = 1 : la courbe prend ses valeurs dans
C = {z C tel que |z| = 1} ,
cest--dire le cercle de centre (0, 0) et de rayon 1. Lun de nos
grands objectifs est de montrer que passe par chaque point
du cercle C.
Lemme 10.8 La fonction est drivable et 0 (t) = ieit .
Dmonstration. On calcule
eit eit0
eit eit0
=i
ieit0 ,
t t0
it it0
daprs la proposition 10.3 applique en z0 = it0 .
On a notamment |0 (t)| = |ieit | = 1. En termes plus gomtriques : le point (t) se dplace vitesse constante le long
du cercle. Intuitivement, cest peut-tre dj suffisant pour se
convaincre que va faire tout le tour de C.
Dfinition 10.9 On dfinit une fonction cos sur R par la formule
eit + eit
cos(t) = <(eit ) =
.
2
On lappelle le cosinus. De mme on dfinit une fonction sin
sur R par la formule
sin(t) = =(eit ) =
et on lappelle le sinus.

eit eit
,
2i


On a donc eit = cos(t) + i sin(t). De plus la relation |eit |2 = 1


donne cos(t)2 + sin(t)2 = 1.
partir des dfinitions et du lemme prcdent, on obtient
tout de suite :
182

Lemme 10.10 La fonction cos est drivable et cos0 = sin. De


mme la fonction sin est drivable et sin0 = cos.
Voici un rsultat fondamental.
Thorme 10.11 Il existe un unique nombre rel positif, not ,
tel que
eit = 1 t = 2n avec n Z .
De plus, on a ei + 1 = 0.
Dmonstration. Commenons par une petite tude du sinus au
voisinage de 0. Puisque e0 = 1, on a sin(0) = 0 et sin0 (0) =
cos(0) = 1. Comme la fonction cosinus est continue (et mme
drivable), la proposition 6.19 nous assure quil existe un intervalle ]a, b[ avec a < 0 < b tel que cos(t) > 0 pour t ]a, b[.
La fonction sinus est donc strictement croissante sur cet intervalle, et en particulier sin(t) , 0 si t , 0 et t ]a, b[ ; on en dduit
galement que eit , 1 pour t , 0 et t ]a, b[.
Montrons maintenant que la fonction cosinus peut sannuler. Procdons par labsurde : si cos(t) , 0 pour tout t, alors
on aurait cos(t) > 0 daprs le thorme des valeurs intermdiaires, et sin serait croissante sur tout R. En particulier, on aurait sin(t) sin(b) > 0 pour t b. Mais alors, regardons la fonction g dfinie par g(t) = cos(t) + sin(b) t 1 qui vrifie g(0) = 0
et g 0 (t) = sin(t) + sin(b) 0. Elle est donc dcroissante, et par
suite g(t) 0 pour t 0, ce qui donne cos(t) 1 sin(b) t. Cest
absurde, puisquon en dduit que cos(t) lorsque t +,
alors que bien sr le cosinus prend ses valeurs dans [1, 1]
cause de la relation cos(t)2 + sin(t)2 = 1.
On peut donc trouver t0 tel que cos(t0 ) = 0. On a alors sin(t0 )2 =
1 donc sin(t0 ) = 1 et eit0 = i. Comme i 4 = (i)4 = 1, on
a e4it0 = (eit0 )4 = 1.
Passons au thorme proprement dit. Posons
K = {t R | eit = 1} ,
et
A = {t K et t > 0} .
Nous avons prouv que A , , puisque cet ensemble contient
llment 4t0 > 0. Nous avons galement prouv que A ne
183

contient aucun lment dans lintervalle ]a, b[. On peut donc


poser ` = inf A, ce nombre est alors bien dfini et ` b > 0.
Enfin, on pose = 2` (cest la dfinition du nombre ).
Il faut commencer par vrifier que 2 = ` appartient K (et
mme A). En effet, par dfinition de linf il existe une suite (tn )
qui converge vers ` avec tn A, donc eitn = (tn ) = 1. Par continuit de , on a (tn ) (`), et donc (`) = 1, ce qui signifie
bien que ` K.
Soit maintenant t K quelconque, et soit n lunique nombre
entier tel que
t
n
< n + 1,
2
de sorte que 0 t 2n < 2. On note que
ei(t2n) = eit e2ni = eit (e2i )n = 1 1n = 1 .
Ainsi t 2n K, mais par dfinition de 2 = ` = inf A, le seul
lment de K dans [0, 2[ est 0. On en conclut bien que t = 2n,
comme on souhaitait le montrer.
Enfin, le nombre ei vrifie (ei )2 = e2i = 1, donc ei = 1.
Mais < 2 donc ei = 1 est exclu. Finalement on a bien ei =
1, ce qui achve la dmonstration.
Proposition 10.12 Sur lintervalle [0, 2 ], la fonction cosinus est
dcroissante. Son image est lintervalle [0, 1] entier.
Sur le mme intervalle, la fonction sinus est croissante. Son
image est galement lintervalle [0, 1] entier.

Dmonstration. Le nombre x = ei 2 vrifie x2 = ei = 1, donc x =


i. On a donc cos( 2 ) = 0 et sin( 2 ) = 1. (Dans un instant nous
allons trouver le bon signe.)
Le nombre 2 est le plus petit nombre rel pour lequel le
cosinus sannule : en effet si t0 est un tel nombre, nous avons
vu au cours de la dmonstration du thorme que 4t0 vrifie e4it0 = 1 ; nous savons alors que 4t0 est un multiple de 2,
donc t0 est un multiple de 2 . Ainsi la fonction cosinus ne sannule pas sur [0, 2 [, et donc elle ne change pas de signe (valeurs
intermdiaires). Comme cos(0) = 1, on en dduit cos(t) 0 sur
cet intervalle.
184

La fonction sinus est donc croissante sur le mme intervalle


puisque sin0 = cos, et puisque sin(0) = 0, on a sin(t) 0 pour t
[0, 2 ]. En particulier sin( 2 ) = +1.
Enfin, la relation cos0 = sin montre que la fonction cosinus
est dcroissante, toujours sur le mme intervalle.
Pour conclure, cest le thorme des valeurs intermdiaires
qui garantit que les deux fonctions en question prennent bien
toutes les valeurs entre 0 et 1.
Nous avons atteint notre objectif :
Proposition 10.13 Tout point du cercle unit C est de la forme eit
pour au moins un nombre t R. De plus, deux nombres t et u
vrifient eit = eiu si et seulement si t = u + 2n avec n Z.
Dmonstration. Si eit = eiu , alors ei(tu) = 1, donc la dernire
partie de lnonc est une consquence du thorme.
Soit maintenent x + iy un nombre complexe de module 1,
cest--dire que x2 + y 2 = 1. Dans un premier
temps, suppo
sons que x 0 et y 0, de sorte que y = 1 x2 . Le nombre x
appartient [0, 1], il est donc de la forme x = cos(t) pour un
unique nombre t [0, 2 ], daprs la proposition prcdente. On
ap alors sin(t) 0 et bien sr cos(t)2 + sin(t)2 = 1, donc sin(t) =
1 cos(t)2 = 1 x2 = y. Finalement eit = x + iy, ce qui prouve
le rsultat dans ce cas.
Si y 0, on prend dabord un t tel que eit = x iy (cas prcdent), et alors eit = x + iy (lemme 10.7). Et enfin, si x 0, on
prend t tel que eit = x iy, et alors ei(t) = eit = x + iy.
Forme polaire et racines n-imes
Proposition 10.14 Tout nombre complexe non-nul z C peut
scrire z = ei avec > 0 et R. Le nombre est unique, et en
fait = |z| ; le nombre est dtermin un multiple de 2 prs.
En consquence, tout nombre complexe non-nul z peut scrire z =
ew pour w C.
Dmonstration. Il suffit de considrer
dule 1, donc

z
|z|

z
|z|

: cest complexe de mo-

= ei daprs la proposition 10.13. Ainsi z =

185

|z|ei . La mme proposition indique que est dtermin un


multiple de 2 prs.
En prenant x = ln(|z|), et w = x + i, nous avons bien ew =
x
i
e e = |z|ei = z.
Voici une application importante :
Corollaire 10.15 Soit n 1 un entier. Tout nombre complexe z
possde des racines n-imes.
Plus prcisment, si z , 0, il existe exactement n nombres (distincts) 0 , 1 , . . . , n1 tels que nk = z.
La dmonstration va indiquer comment trouver explicitement ces racines.

Dmonstration. On crit z = ei et lon prend = n ei n ; on a
alors effectivement n = ei = z.
Voyons les autres possibilits. Si = r ei vrifie n = 1 =
n
ni
r e , alors on doit avoir rn = et n = + 2k avec k Z.

Comme r 0, on en dduit r = n . Dautre part


=
donc

2k
+
,
n
n

ei = ei n e

de sorte que finalement = e

2ki
n

2ki
n

pour un certain k Z.

 Rci-

proquement si est de cette forme alors n = z, puisque e


1.

2ki

2ki
n

2`i

Si k et ` sont deux entiers, alors les nombres e n et e n


sont gaux prcisment lorsquil existe un entier m tel que ` =
k + mn (autrement dit, lorsque k et ` sont gaux modulo n). On
2ki
en dduit que pour 0 k n1, les nombres e n sont distincts,
2`i
et que tout nombre de la forme e n avec ` entier est dans cette
liste. Ce sont les n racines de lunit .
Finalement on a bien n nombres qui conviennent, sa2ki
voir k = e n pour 0 k n 1.

186

Le thorme fondamental de lalgbre


Pour linstant nous avons cit ce thorme (3.9) sans dmonstration. Revoici lnonc :
Thorme 10.16 Tout polynme de degr 1 dans C[X] possde
une racine dans C.
Dmonstration. Soit donc P C[X] de degr 1 ; crivons
P(X) = a0 + a1 X + a2 X2 + + an Xn ,
avec an , 0.
La fonction dfinie sur C par z 7 P(z) est continue. De plus
en crivant
!
a0 1
an1 1 an2 1
n
P(z) = an z 1 +
+
,
+ +
an z
an z 2
an z n
on voit que pour toute suite (zn )n0 de nombres complexes
tels que |zn | +, on a galement |P(zn )| +. La fonction f : R2 R dfinie par f (z) = |P(z)| satisfait donc les hypothses de la proposition 8.8, et on conclut quil existe z0
C tel que f (z) f (z0 ) pour tout z C. Nous allons montrer
que f (z0 ) = 0, donc P(z0 ) = 0, ce qui tablit le thorme.
Procdons par labsurde, et supposons que P(z0 ) , 0. Pour
se faciliter les choses, considrons
Q=

P(z0 + X)
;
P(z0 )

alors Q est un polynme de mme degr que P, la quantit |Q(z)|


atteint un minimum en 0, et ce minimum vaut Q(0) = 1. crivons
Q(z) = 1 + bd zd + bd+1 zd+1 + + bn zn ,
avec bd , 0, et d 1. Maintenant, pour se dbarrasser de bd ,
passons au polynme
R(X) = Q(X) ,
o vrifie d = b1 : un tel nombre existe daprs le corold
laire 10.15. Ce R est un polynme de degr n, la quantit |R(z)|
187

atteint un minimum en 0, et ce minimum vaut encore R(0) = 1 ;


mais de plus
R(z) = 1 zd + cd+1 zd+1 + + cn zn ,
pour des coefficients ci dont la valeur na pas dimportance
pour la suite.
Montrons que la relation R(z) 1 nous mne une contradiction. Prenons x R et crivons


R(x) 1 = xd 1 + cd+1 x + cd+2 x2 + + cn xnd = xd g(x) .
Il existe un intervalle I contenant 0 sur lequel la quantit g(x)
reste > 0, daprs la proposition 6.19. Sur cet intervalle, on
constate que R(x) 1 est du signe de xd , et donc prend des
valeurs (strictement) ngatives. Ceci est en contradiction avec
lingalit R(x) 1.

Deuxime lecture
Matrices et normes
Dfinition 10.17 Soit A = (aij ) Mn,m (R). Sa norme (euclidienne) est
1

X 2

2
kAk =
aij .

i,j

De mme, soit A = (aij ) M,nm (C). Sa norme euclidienne est


1

2
X

2
|aij | .
kAk =

i,j

188

Quelques remarques simposent. Une matrice relle de taille n


m est constitue de nm coefficients, et on peut identifier lensemble Mn,m (R) avec Rnm . Ceci tant fait, la norme dune matrice nest autre que la norme euclidienne du vecteur correspondant de Rnm , que nous connaissons bien (dfinition 4.27).
De mme avec les matrices complexes, on identifie Mn,m (C)
avec Cnm ; de plus on peut identifier C avec R2 , de telle sorte
que z = x + iy correspond (x, y), et alors |z|2 = x2 + y 2 ; par
suite Cnm peut tre vu comme R2nm , et au total la norme dune
matrice complexe nest rien dautre que la norme du vecteur
de R2nm correspondant.
Pour les calculs, il va tre utile de faire la remarque suivante. Si les colonnes de A sont C1 , C2 , . . . , Cm , alors
kAk2 = kC1 k2 + + kCm k2 ;
de mme si les lignes de A sont L1 , . . . , Ln , alors
kAk2 = kL1 k2 + + kLn k2 .
La diffrence entre les matrices et les vecteurs, videmment,
est que lon peut multiplier les matrices. Le rsultat suivant
donne le lien entre les normes et la multiplication.
Lemme 10.18 Soient A Mn,m (C) et B Mm,` (C). Alors
kABk kAk kBk .
Dmonstration. crivons A = (aij ) et notons L1 , . . . , Ln les lignes
de A ; de mme crivons B = (bij ) et notons C1 , . . . , C` les colonnes de B. La matrice AB possde, sur sa ligne i et dans la
colonne j, le coefficient
cij =

m
X

aik bkj .

k=1

189

On a donc les ingalits


|cij |

m
X

|aik | |bkj |

k=1

1
1

2 X
2
X

|aik |2
|bkj |2
k

= kLi k kCj k .
La premire est lingalit triangulaire, la deuxime est lingalit de Cauchy-Schwarz (lemme 4.31). En prenant la somme, il
vient
X
X
kABk2 =
|cij |2
kLi k2 kCj k2
i,j

i,j

X
X

=
kLi k2
kCj k2

= kAk kBk .
Le rsultat en dcoule.
Lexponentielle de matrice
Lemme 10.19 Soit A une matrice carre. On note
Sn (A) =

n
X
1 k
A .
k!
k=0

Alors la suite (Sn (A))n0 possde une limite.


Avant de donner la dmonstration, indiquons tout de suite :
Dfinition 10.20 Soit A une matrice carre, coefficients
complexes. Son exponentielle est
+
X
1 k
exp(A) = e = lim Sn (A) =
A .
n
k!
A

k=0


190

Dmonstration. On utilise la convergence absolue, cest--dire


le thorme 4.29, qui nous assure quil suffit de vrifier que
n
X
1
k Ak k
n
k!

lim

k=0

existe. Or, on a

1 k
1
A k kAkk ,
k!
k!
daprs le lemme 10.18. Si on note
k

un =

n
X
1
k Ak k ,
k!
k=0

on a donc
un

n
+
X
X
1
1
kAkk
kAkk = ekAk .
k!
k!
k=0

k=0

La suite (un ) est donc croissante et majore, et on en conclut


quelle possde bien une limite.
Pour linstant, on ne sait calculer que des exemples trs
simples :
Exemple 10.21 Prenons une matrice diagonale :
!
x 0
A=
.
0 y
On a donc
An =
et

xn
0

Pn xk

Sn (A) = k=0 k!
0

0
yn

!
,
0
yk
k=0 k!

Pn

En passant la limite, on obtient :


eA =

ex 0
0 ey
191

!
.

Proposition 10.22 Lexponentielle de matrice possde les proprits suivantes :


1. Si P est inversible, alors
1 AP

eP

= P1 eA P .

2. Si AB = BA, alors eA B = BeA .


3. Si AB = BA alors

eA+B = eA eB .

La proprit (3) est la plus importante, bien sr. Attention,


lhypothse AB = BA est ncessaire !
Dmonstration. Pour le (1), on calcule dabord
(P1 AP)2 = P1 APP1 AP = P1 A2 P ,
et de mme
(P1 AP)3 = P1 AP(P1 AP)2 = P1 APP1 A2 P = P1 A3 P .
Par rcurrence on obtient pour tout n :
(P1 AP)n = P1 An P .
On voit que Sn (P1 AP) = P1 Sn (A)P, do la formule (1) en passant la limite.
Pour le (2), on passe la limite dans la relation vidente
Sn (A)B = BSn (A) (ou alors, si B est inversible, on utilise la relation B1 AB = A, do B1 eA B = eA daprs le (1)).
Pour le (3), cest essentiellement la mme dmonstration
que pour le thorme 10.2. Lhypothse AB = BA est utilise pour pouvoir utiliser la formule de Newton qui donne le
dveloppement de (A + B)n (elle est fausse si AB , BA, par
exemple (A + B)2 = A2 + AB + BA + B2 en gnral). On constate
quil suffit de montrer la formule pour kAk et kBk au lieu de A
et B, et nous savons que lidentit est vraie pour les nombres
rels.

192

Exemple 10.23 Prenons


A=

11
18
6 10

Pour calculer eA , on essaie de la mettre sous la forme P1 BP


o B est le plus simple possible. Dans le chapitre Diagonalisation , nous verrons de nombreuses techniques pour faire
a ; pour linstant, admettons que lon nous ait souffl que, en
posant
!
3 2
P=
,
2
1
alors
1
0

P AP =
On a donc

eA = ePDP

0
2

!
= D.

= PeD P1 ,

daprs le (1) de la proposition. On peut calculer eD sans peine


comme dans lexemple prcdent, et finalement
! 1
!
!
3 2
e
0
1
2
eA =
2
1
2 3
0 e2
!
1
2
1
3 e + 4 e 6 e + 6 e2
=
.
2 e1 2 e2
4 e1 3 e2
Voici comment exploiter la proprit (3). Prenons
!
5 7
A=
.
0 5
On pose alors A = D + N avec
!
5 0
D=
et
0 5

N=

0
0

7
0

!
.

On vrifie que DN = ND, donc eA = eD eN . De nouveau, on


peut calculer eD facilement puisque la matrice est diagonale.

193

Pour N, on constate que N2 = 0, ce qui ramne son exponentielle eN = 1 + N. Finalement


!
e5 7e5
eA = eD (1 + N) =
.
0 e5
Exponentielle et drive
Proposition 10.24 Soit A une matrice complexe, de taille n n.
La fonction : R Mn (C) dfinie par (t) = etA est drivable, et
sa drive est 0 (t) = AetA = A(t).
De plus, cette proprit caractrise , cest--dire que si c : R
Mn (C) vrifie c0 (t) = Ac(t) et c(0) = Id, alors on a c(t) = (t) pour
tout t.
Il faut noter que, si s et t sont deux nombres rels, alors les
matrices sA et tA commutent, donc e(s+t)A = esA etA . En dautres
termes (s + t) = (s)(t).
Dmonstration. Le calcul de 0 (t) est tout--fait analogue la
dmonstration de la proposition 10.3.
Montrons lunicit. Supposons donc que c0 (t) = Ac(t), et dfinissons
f (t) = etA c(t) .
La drive de f est donne par


f 0 (t) = (A)etA c(t) + etA c0 (t) = etA Ac(t) + c0 (t) = 0 .
On a utilis le fait que AetA = etA A, daprs le (2) de la
proposition 10.22. Puisque f 0 (t) = 0, on en conclut que f est
constante, donc pour tout t on a f (t) = f (0) = Id. Ceci donne
etA c(t) = Id, et en multipliant par etA on en tire bien c(t) =
etA = (t).

194

Chapitre 11

Espaces vectoriels
Dans ce chapitre, la lettre K dsigne Q, R ou C.

Premire lecture
Au collge on vous a prsent les vecteurs, dans le cadre
de la gomtrie lmentaire dans le plan ou lespace. Ces mthodes sont tellement efficaces que lon souhaite les appliquer
le plus largement possible, non seulement en dimension
quelconque, mais galement dans des cadres abstraits. Un espace vectoriel va tre dfini comme un ensemble sur lequel
on peut faire ce type de gomtrie.
Il se trouve que les calculs que nous allons tre amens
faire se ramnent presque tous des oprations sur les matrices, que nous savons dj faire. Ce chapitre prsente une organisation abstraite de ces calculs, en quelque sorte. Au fur et
mesure de vos tudes en mathmatiques, les espaces vectoriels
vont prendre de plus en plus de place.

195

Le lecteur ayant
assimil la
dfinition 2.15
peut prendre
pour K
nimporte quel
corps.

Dfinitions & Exemples fondamentaux


Dfinition 11.1 Un espace vectoriel sur K est un ensemble E
muni dune opration daddition
E E
(u, v) 7

E
u+v

K E
(, u) 7

E
u

et dune opration

satisfaisant les axiomes suivants :


(a) u + v = v + u,
(b) 0 + u = u,
(c) (u + v) + w = u + (v + w),
(d) u (u) tel que u + (u) = 0,
pour u, v, w E et , K.

(e) (u + v) = u + v,
(f) ( + ) u = u + u,
(g) 1 u = u,
(h) () u = ( u),


Exemple 11.2 Lexemple le plus fondamental, sans conteste,


est celui de Kn . On identifie, comme dhabitude, les lments
de Kn avec les matrices-colonnes de Mn,1 (K), et les oprations
sont celles que lon connait bien :

x1 y1 x1 + y1
x y x + y
2 2 2 2
. + . =
,
..
. .

. .
.



xn + y n
xn
yn
et


x1


x2

=
.. .
.


xn
xn
x1
x2
..
.

On vrifie sans problme que les axiomes (a-b-c-d-e-f-g-h) sont


satisfaits, donc Kn est un espace vectoriel sur K. En fait la proposition 5.7 nous indique que lensemble Mn,m (K) des matrices
est aussi un espace vectoriel.
196

Exemple 11.3 Lensemble K[X] des polynmes coefficients


dans K est un espace vectoriel sur K, la vrification des huit
axiomes tant immdiate. Cest un premier pas vers labstraction : de par leurs bonnes proprits, les polynmes peuvent
tre vus et manipuls comme des vecteurs !
Exemple 11.4 Soit A un ensemble quelconque. Notons F (A, K)
lensemble des fonctions A K. Si f et g sont de telles fonctions, on dfinit leur somme f + g de la manire la plus simple,
par la formule (f + g)(x) = f (x) + g(x), pour x A. De mme
si K, on dfinit f par (f )(x) = f (x).
On vrifie que F (A, K), avec ces oprations, est un espace
vectoriel sur K. Les fonctions sont donc aussi des vecteurs.
Sous-espaces
La quasi-totalit des espaces vectoriels que nous allons rencontrer vont tre btis partir des trois exemples prcdents,
en ajoutant des conditions supplmentaires. Nous allons utiliser la notion suivante :
Dfinition 11.5 Soit E un espace vectoriel et F E. On dit
que F est un sous-espace vectoriel de E lorsque les deux conditions suivantes sont remplies : pour u, v F, on doit avoir u+v
F, et pour K et v F, on doit avoit v F.

Il est clair quun sous-espace vectoriel est lui-mme un espace vectoriel, et cest notre principale source dexemple. Pour
certains tudiants (par exemple certains chimistes), la seule notion au programme est celle de sous-espace vectoriel de Rn .
Et pour tout le monde, cest lexemple comprendre en premier.
Exemple 11.6 Voici un exemple gnrique de sous-espace
de Kn . Donnons-nous une matrice A Mm,n (K) et considrons
E = {v Kn | Av = 0} .
(L encore on identifie les lments de Kn avec des matricescolonnes, donc le produit Au a un sens.) Alors E est un sousespace de Kn . En effet si u et v sont dans E, on a Au = Av = 0,
197

donc A(u + v) = Au + Av = 0, donc u + v E. On vrifie de mme


que A(v) = Av = 0 si Av = 0, donc v E si v E.
Par exemple, prenons
!
3 1 2
A=
M2,3 (R) .
7 0 8
Dfinissons E comme ci-dessus, et prenons un lment

x
y
v =
R3 .

z
Alors v E lorsque Av = 0, cest--dire lorsque
(
3x + y + 2z = 0
7x
+ 8z = 0
On dit que ce sont les quations qui dfinissent E. On retiendra que les solutions dun systme linaire, dont le second
membre est 0, forment un espace vectoriel.
Exemple 11.7 On note Kn [X] lensemble des polynmes dont
le degr est n. Alors Kn [X] est un sous-espace vectoriel de
lespace K[X] (vrifiez-le).
Voyons un exemple plus abstrait.
Exemple 11.8 Soit C(I, R) lensemble des fonctions continues
sur lintervalle I. On a C(I, R) F (I, R), et la proposition 6.11
nous dit que cest un sous-espace vectoriel.
On peut remplacer continue par drivable , ou encore
paire , ou impaire . . . On peut mme considrer
E = {f F (I, R) | f est drivable deux fois et 3f 00 5f 0 + f = 0} ,
on vrifie que E est alors un sous-espace vectoriel de F (I, R).
Familles gnratrices
Pour dcrire un sous-espace vectoriel, il est trs commun de
donner des quations comme dans lexemple 11.6, mais il y a
une autre mthode galement utile.
198

Dfinition 11.9 Soit E un espace vectoriel, et soient e1 , e2 , . . . ,


en des lments de E. Une combinaison linaire de ces lments
est une somme de la forme
1 e1 + 2 e2 + + n en ,
avec i K.
Lensemble des combinaisons vectorielles de e1 , e2 , . . . , en
est not Vect(e1 , . . . , en ).

Lemme 11.10 Lensemble Vect(e1 , . . . , en ) est un sous-espace vectoriel de E.
Nous dirons de Vect(e1 , . . . , en ) que cest lespace engendr par
les vecteurs e1 , . . . , en .
Dmonstration. On fait un calcul direct. Prenons
u = 1 e1 + 2 e2 + + n en Vect(e1 , . . . , en )
et
v = 1 e1 + 2 e2 + + n en Vect(e1 , . . . , en ) ,
on a alors
x + y = (1 + 1 )e1 + (2 + 2 )e2 + + (n + n )en .
Ainsi u +v Vect(e1 , . . . , en ). De mme on voit que v appartient
au vect si cest le cas de v.
Exemple 11.11 Prenons E = R3 , puis

e1 =

1
5
2

et

e2 =

3
0
1

Comment vrifier si un lment quelconque de R3 , disons

x
y
v =
,

199

appartient Vect(e1 , e2 ) ? Par dfinition v Vect(e1 , e2 ) si et


seulement sil existe deux nombres 1 et 2 tels que v = 1 e1 +
2 e2 . En crivant ceci, on tombe sur le systme suivant :

1 + 32 = x

5
= y

21 32 = z
Nous savons faire ; commenons
L3 + 2L1 :

32
1 +

15

32

par L2 L2 5L1 et L3
=
=
=

x
y 5x
z + 2x

Faisons L2 L2 + 5L3 , puis changeons les deux dernires


lignes :

+ 32 =
x

1
3
=
z
+
2x

0 = 5x + y + 5z
Pour que v Vect(e1 , e2 ), il est donc ncessaire que 5x+y+5z = 0.
Mais rciproquement, si 5x + y + 5z = 0, alors on peut rsoudre
le systme ( savoir, 2 = 13 (z + 2x) et 1 = x 32 = x z,
mais peu importent ces valeurs). Donc finalement lespace vectoriel Vect(e1 , e2 ) est compltement dcrit par lquation 5x+y +
5z = 0.
Il est important de savoir passer dun espace dcrit comme
un vect une description par des quations comme dans
lexemple 11.6. On peut toujours le faire sur le modle du calcul ci-dessus. Plus loin nous verrons comment faire la transition inverse (vous pouvez dj essayer dimaginer la mthode).
Les descriptions par des quations permettent de vrifier
rapidement si un lment donn appartient au sous-espace en
question ; les descriptions par les vects permettent dobtenir
facilement des vecteurs appartenant au sous-espace.
Un espace vectoriel donn peut tre dcrit comme un vect
de plusieurs faons, et nous allons nous attacher trouver les
meilleures familles de vecteurs, notamment celles contenant le
plus petit nombre dlments. Commenons par donner une
dfinition :
200

Dfinition 11.12 Soit E un espace vectoriel et e1 , e2 , . . . , en une


famille dlments de E. On dit que cest une famille gnratrice
de E lorsque E = Vect(e1 , . . . , en ).

Exemple 11.13 Prenons E = R2 et
!
1
e1 =
, e2 =
0
crivons simplement
!
x
=x
y

1
0

!
+y

0
1

0
1

!
.

!
= xe1 + ye2 .

On constate bien que tout vecteur de R2 peut scrire comme


une combinaison linaire de e1 et e2 , donc e1 , e2 est une famille
gnratrice de R2 .
Il y en a dautres, par exemple prenons
!
!
2
1
1 =
, 2 =
.
3
1
!
x
La condition pour quun vecteur
appartienne Vect(1 , 2 )
y
est lexistence de deux nombres 1 et 2 tels que
(
21 + 2 = x
31 + 2 = y
Le dterminant du systme est 2 1 3 1 = 1 , 0, donc la
matrice correspondante est inversible (ou si vous prfrez, la
matrice bien chelonne correspondante est lidentit), donc le
systme a une solution unique. On peut si on le souhaite trouver les valeurs de 1 et 2 , mais peu importe : de toute faon,
nous savons que 1 , 2 est une famille gnratrice de R2 .
Enfin, notons que la famille e1 , e2 , 1 , 2 , qui comporte 4 lments, est galement gnratrice par dfinition. Et pour terminer, nous avons vu un exemple de famille qui nest pas gnratrice dans lexemple 11.11, puisque le vect en question ntait
pas R3 tout entier mais un sous-espace dcrit par une certaine
quation.
201

En fait dans le cas o E = Kn , on peut se ramener des


calculs simples sur des matrices :
Proposition 11.14 Soit e1 , e2 , . . . , em une famille de vecteurs
de Kn , et soit A Mn,m (K) la matrice dont les colonnes sont les
vecteurs ei . Enfin soit EA la matrice bien chelonne associe.
Alors e1 , e2 , . . . , em est une famille gnratrice de Kn si et seulement si EA comporte un pivot dans chaque ligne.
Remarquons que la condition revient demander que EA
ne comporte pas de ligne nulle.
Dmonstration. Par dfinition, la famille est gnratrice si et
seulement si pour tout v Kn , il existe

1

2
= .
..

m
tel que A = v.
Supposons que cest le cas. Prenons une matrice inversible P
telle que PA = EA (corollaire 5.22), et choisissons

v = P1 u

avec u =

0
0
..
.

Dans ce cas le systme A = v quivaut, en multipliant par P,


PA = Pv, soit EA = u. On constate que la dernire ligne
de EA ne peut pas tre nulle, sinon EA se terminerait aussi par
une ligne nulle, et ce nest pas le cas de u. Donc aucune ligne
de EA nest nulle, tant donn quelle est bien chelonne.
Montrons la rciproque, et supposons que EA na pas de
ligne nulle. Nous devons montrer que le systme A = v a des
solutions quel que soit v, ou ce qui revient au mme en multipliant par P, que EA = Pv possde toujours des solutions.
202

Notons que dans ce cas, puisque EA est bien chelonne avec n


lignes non-nulles, de taille nm, on peut lobtenir partir de la
matrice identit de taille n n en rajoutant des colonnes nulles
droite. Mais alors

1

2
EA = . = les n premires lignes de ,
..

n
et le systme EA = Pv possde certainement des solutions,
puisquil scrit en fait i = le coefficient sur la ligne i de Pv,
pour 1 i n.
La remarque suivante est trs utile :
Corollaire 11.15 Si e1 , e2 , . . . , em est une famille gnratrice
de Kn , alors m n.
De plus, si m = n, alors la famille est gnratrice si et seulement
si la matrice A est inversible.
Dmonstration. Si m < n la matrice chelonn EA , ayant plus
de lignes que de colonnes, est certaine davoir une ligne nulle,
donc la famille ne pourrait pas tre gnratrice daprs la proposition. Donc m n.
Si m = n, la matrice EA est carre ; elle ne possde pas de
ligne nulle exactement lorsquelle vaut lidentit, puisquelle
est bien chelonne. Daprs la proposition 5.19, ceci quivaut
linversibilit de A.
Familles libres
Dfinition 11.16 Soit E un espace vectoriel et e1 , e2 , . . . , en
une famille dlments de E. On dit que cest une famille libre
lorsque lquation
1 e1 + 2 e2 + + n en = 0 ,
avec i K, ne possde quune seule solution, savoir 1 =
2 = = n = 0.

203

Nous allons voir que le concept de famille libre est en un


certain sens le dual du concept de famille gnratrice. Rapidement, nous verrons que les familles qui sont la fois libres
et gnratrices sont particulirement intressantes. Mais commenons par des exemples.
Exemple 11.17 Prenons E = R2 , puis
!
5
e1 =
et e2 =
1

3
7

!
.

Pour vrifier si la famille est libre, nous devons examiner lquation 1 e1 + 2 e2 = 0, qui scrit comme le systme
(
51 + 32 = 0
1 + 72 = 0
Le dterminant tant 32 , 0, le systme a une solution unique,
qui est bien sr 1 = 2 = 0. Donc la famille
est libre.
!
2
, la famille e1 , e2 , e3 estSi maintenant on pose e3 =
8
elle libre ? Le systme devient
(
51 + 32 23 = 0
1 + 72 + 83 = 0
En faisant L1 L1 + 5L2 , puis en permutant les lignes, on obtient
(
1 +
72 +
83 = 0
382 + 383 = 0
Le systme est chelonn, on prend 3 comme paramtre, et on
tire 1 = 2 = 3 . En particulier, on a la solution 1 = 2 = 1,
3 = 1, et dailleurs on vrifie effectivement que e1 +e2 e3 = 0.
La famille nest donc pas libre. (Ceux dentre vous qui auraient
repr que e1 + e2 e3 = 0 peuvent simplement faire cette remarque, et il est alors tabli que la famille nest pas libre).
Exemple 11.18 Voyons un exemple plus abstrait. On prend E =
F (R, R), lespace vectoriel de toutes les fonctions R R, et on
204

essaie la famille consitue par e1 = cos (la fonction cosinus)


et e2 = sin. Cette famille est-elle libre ?
On doit tudier lquation 1 e1 + 2 e2 = 0. Cest une galit
de fonctions, et en particulier le 0 dsigne la fonction nulle ;
cest--dire que lquation est vraiment
x R ,

1 cos(x) + 2 sin(x) = 0 ,

les inconnues tant 1 et 2 . Or pour x = 0 on trouve 1 = 0 et


pour x = 2 on trouve 2 = 0, donc la famille est bien libre.
Pour tudier les familles libres dans Kn , on dispose du rsultat suivant, quil est instructif de comparer la proposition 11.14.
Proposition 11.19 Soit e1 , e2 , . . . , em une famille de vecteurs
de Kn , et soit A Mn,m (K) la matrice dont les colonnes sont les
vecteurs ei . Enfin soit EA la matrice bien chelonne associe.
Alors e1 , e2 , . . . , em est une famille libre de Kn si et seulement
si EA comporte un pivot dans chaque colonne.
Dmonstration. Pour vrifier si la famille est libre, on doit tudier le systme A = 0, avec

1

2
= . .
..

m
Il possde les mmes solutions que le systme chelonn EA =
0. ce stade on doit se rappeler que les inconnues qui vont
servir de paramtres dans lcriture des solutions sont celles
qui correspondent aux colonnes dans lesquelles il ny a pas de
pivot (relire au besoin lexemple 5.13).
Ainsi la famille est libre le systme na quune solution il ny a pas de paramtres il y a un pivot dans
chaque colonne.
Corollaire 11.20 Si e1 , e2 , . . . , em est une famille libre de Kn ,
alors m n.
De plus, si m = n, alors la famille est libre si et seulement si la
matrice A est inversible.
205

Dmonstration. Si m > n la matrice chelonne EA , ayant plus


de colonnes que de lignes, est certaine davoir une colonne sans
pivot, donc la famille ne pourrait pas tre libre. Donc m n.
Si n = m, la matrice EA est carre ; elle possde un pivot
dans chaque colonne exactement lorsquelle vaut lidentit,
puisquelle est chelonne. Daprs la proposition 5.19, ceci
quivaut linversibilit de A.
En comparant ce dernier rsultat avec le corollaire 11.15,
on constate que
Corollaire 11.21 Considrons une famille comportant prcisment n vecteurs dans Kn . Alors elle est libre elle est gnratrice la matrice A est inversible.
Autre observation simple : une famille la fois libre et gnratrice de Kn doit comporter n vecteurs, ni plus ni moins.
Ces phnomnes sont gnraux dans les espaces vectoriels, et
nous allons tout de suite le montrer.
Bases
Dfinition 11.22 Lorsquune famille est la fois libre et gnratrice, on dit que cest une base de lespace vectoriel considr.

Exemple 11.23 Dans Kn , nous venons juste de voir quune
famille e1 , e2 , . . . , em ne peut pas tre une base si m , n ; si n = m
la famille est une base exactement lorsque la matrice nn dans
laquelle on a rang ces vecteurs en colonnes est inversible.
La base canonique de Kn est celle pour laquelle la matrice en
question est lidentit. En clair

1
0
0
0
1
0

e1 = . , e2 = . , . . . , en = . .
.
.
.
.
.
.

0
0
1
Exemple 11.24 Considrions E = Kn [X], lespace vectoriel des
polynmes de degr n. Posons ei = Xi , pour 0 i n. Tout
206

polynme scrit comme combinaison linaire des puissances


de X, donc la famille est gnratrice ; de plus si
0 e0 + 1 e1 + 2 e2 + + n en = 0 = 0 + 1 X + 2 X2 + + n Xn ,
alors on a 0 = 1 = = n = 0 (par dfinition mme de ce
quest le polynme nul). Donc la famille est libre.
Finalement la famille 1, X, X2 , . . . , Xn est une base, quon appelle encore la base canonique de Kn [X]. Noter quelle comprend n + 1 lments.
Exemple 11.25 Lorsquun sous-espace de Kn est donn par
des quations (sur le modle de lexemple 11.6), on peut facilement en trouver une base. Considrons donc
E = {v Kn | Av = 0} ,
o A est une matrice. On peut chelonner la matrice sans changer les solutions de Av = 0, donc nous allons supposer que A
est chelonne et donner la mthode sur un exemple. Prenons

1 4 0

A = 0 0 1

0 0 0

3
0
0

x
y

v =
,
z

alors en tudiant Av = 0 on constate que lensemble des solutions est

4 3

1 0

.
avec
y,
t

K
y
+
t
E=

0
0

0
1
(Pour les calculs intermdiaires, reprendre lexemple 5.13.)
Prenons les notations

4
3
1
0

e1 =
e2 =
,
,
0
0

0
1
207

alors nous venons dcrire que E = Vect(e1 , e2 ), donc e1 , e2 est


une famille gnratrice de E. On peut vrifier directement que
la famille est libre, puisque lquation 1 e1 + 2 e2 = 0 donne

41 + 32 0
0

=
,

0
0

2
0
do 1 = 2 = 0. La famille est bien libre et cest donc une base
de E.
Ce nest pas un hasard : lorsquon crit les solutions de la
manire dcrite dans lexemple 5.13, les vecteurs que lon obtient forment toujours une base. On peut le vrifier rapidement
dans chaque cas.
la fin du chapitre nous verrons comment trouver une base
dun sous-espace prsent comme un vect. En attendant, vous
pourriez crire des quations pour lespace et procder comme
ci-dessus (mais la mthode que nous verrons est plus efficace).
Coordonnes
Lintrt des bases est de permettre lutilisation de coordonnes, de la faon suivante. Soit e1 , e2 , . . . , en une base de lespace
vectoriel E, et soit v E un vecteur quelconque. La famille tant
gnratrice, on peut trouver des nombres i tels que
v = 1 e1 + 2 e2 + + n en .
La famille tant libre, on peut voir que cette criture est en fait
unique : en effet, si on a galement
v = 1 e 1 + 2 e 2 + + n e n ,
alors en faisant la diffrence on obtient
v v = 0 = (1 1 )e1 + (2 2 )e2 + + (n n )en .
Puisque la famille est libre, on doit avoir i i = 0 et donc i =
i .
208

Dfinition 11.26 Soit B = e1 , e2 , . . . , en une base de lespace


vectoriel E. Si v E, les nombres 1 , 2 , . . . , n tels que
v = 1 e1 + 2 e2 + + n en
sont appels les coordonnes de x dans la base B. On notera

1

2
. Kn .
B [v] =
.
.

n
Lorsque la base B sera vidente daprs le contexte on crira
tout simplement [v].

Exemple 11.27 Soit B = e1 , e2 la base de R2 donne par
!
!
1
1
e1 =
et e2 =
.
1
1
Cest bien une base, puisque si nous mettons ces vecteurs en
colonnes dans
!
1
1
A=
,
1 1
alors det(A) = 2 , 0. Prenons maintenant un vecteur quelconque de R2 , disons
!
x1
v=
.
x2
Pour trouver ses coordones 1 , 2 dans la base B nous devons
rsoudre 1 e1 + 2 e2 = v, ce qui revient
!
1
A = v avec =
.
2
Puisque A est inversible on a
1

=A v=

1/
2
1/
2

1/
2
1/
2

209

x1
x2

!
=

1
2 x1 +
1
2 x1

1
2 x2
1
2 x2

!
.

Finalement

1
2 x1 +
1
2 x1

B [v] =

1
2 x2
1
2 x2

Par contre si nous appelons C la base canonique (cf exemple 11.23),


alors on a tout simplement
C [v] = v .

En effet le calcul est le mme que ci-dessus, mais cette fois A =


Id ; ou encore, cela dcoule du calcul suivant :
!
!
!
x1
1
0
v=
= x1
+ x2
.
x2
0
1
Exemple 11.28 Considrons maintenant E = Kn [X] et sa base
canonique, cest--dire B = 1, X, X2 , . . . , Xn . Si on prend un polynme P E et quon lcrit
P = a0 + a1 X + a2 X2 + + an Xn ,
alors par dfinition

B [P] =

a0
a1
..
.
an

Kn+1 .

Les coordonnes vont nous permettre de ramener de nombreuses questions abstraites sur un espace vectoriel E des
questions sur Kn , que lon sait traiter. Considrons par exemple :
Proposition 11.29 Soit E un espace vectoriel, et soit B = e1 , e2 ,
. . . , en une base. crivons [v] pour B [v]. Alors
1. [u + v] = [u] + [v],
2. [v] = [v],
3. si 1 , 2 , . . . , m est une famille de vecteurs de E, alors elle est
libre si et seulement si la famille [1 ], [2 ], . . . , [m ] de vecteurs
de Kn est libre.
210

4. idem avec gnratrice au lieu de libre .


La dmonstration est extrmement facile ; elle vous est laisse titre dexercice important.
Voici une premire application. Le thorme suivant est le
plus important du chapitre pour linstant.
Thorme 11.30 Soit E un espace vectoriel, muni dune base B =
e1 , e2 , . . . , en . Enfin, soit F = 1 , 2 , . . . , m une famille de vecteurs
de E.
1. Si F est gnratrice, alors m n.
2. Si F est libre, alors m n.
3. Si F est une base, alors m = n.
Rciproquement, si m = n, alors F est gnratrice F est libre
F est une base.
Dmonstration. Elle est trs simple. En effet nous avons dmontr tout ceci dans le cas o E = Kn : voir le corollaire
11.15 pour le (1), le corollaire 11.20 pour le (2) ; le (3) est alors
vident, et la rciproque est galement indique dans ces corollaires.
Pour le cas gnral, on utilise tout simplement la proposition prcdente, qui nous ramne Kn .
Nous constatons que toutes les bases dun espace vectoriel ont
le mme nombre dlments. Ce nombre porte un nom :
Dfinition 11.31 La dimension dun espace vectoriel est le
nombre de vecteurs dans une base quelconque. La dimension
de E est note dim E.

Exemple 11.32 La dimension de Kn est n : prendre la base
canonique.
Exemple 11.33 La dimension de Kn [X] est n + 1 (attention !),
l encore voir la base canonique 1, X, X2 , . . . , Xn .
Exemple 11.34 Lespace vectoriel K[X] ne possde pas de base
finie : en effet si P1 , P2 , . . . , Pn est une famille finie de polynmes,
alors en prenant N = sup{deg(Pi )}, on voit facilement que tout
211

polynme dans Vect(P1 , P2 , . . . , Pn ) est de degr N. En particulier Vect(P1 , . . . , Pn ) nest pas K[X] tout entier.
Dans ce livre nous ne parlerons pas de familles infinies de
vecteurs. Ceci dit, il existe des dfinitions que vous pouvez
imaginer de famille libre , famille gnratrice et base
ayant ventuellement un nombre infini de vecteurs. Avec ces
dfinitions, on montre que la famille infinie 1, X, X2 , . . . , Xk , . . .
est une base de K[X].
Quoi quil en soit, nous dirons quun espace vectoriel est de
dimension finie lorsquil possde une base finie. Ce nest pas le
cas de K[X], qui est de dimension infinie.
Exemple 11.35 Voici une application clbre. Prenons E =
Rn [X], qui est de dimension n + 1. Choisissons un nombre x0
R, et considrons
ei = (X x0 )i

pour

0 i n.

Montrons que cette famille est libre : lquation 0 e0 + 1 e1 +


+ n en = 0 scrit
0 + 1 (X x0 ) + 2 (X x0 )2 + + n (X x0 )n = 0 .
Le terme en Xn dans le membre de gauche est n Xn , donc n =
0. Mais alors le terme en Xn1 dans le membre de gauche
est n1 Xn1 , donc n1 = 0. De proche en proche, on en dduit que n = n1 = = 1 = 0 = 0. Donc la famille est
libre.
Cette famille ayant n + 1 lments, cest en fait une base
daprs le thorme. Autre argument possible pour montrer la
mme chose : crivons [ei ] pour les coordonnes de ei dans la
base canonique, alors il suffit de montrer que la famille [ei ] est
une base de Kn+1 (cf proposition 11.29) ; or la matrice obtenue
en mettant ces vecteurs en colonnes est triangulaire suprieure
avec des 1 sur la diagonale, donc son dterminant est 1 et donc
elle est inversible, ce qui tablit que les vecteurs forment une
base.
Que lon prenne un argument ou lautre, essayez dapprcier les efforts qui nous sont conomiss : montrer directement

212

que la famille est gnratrice par un calcul naf serait bien pnible.
On en dduit que tout polynme P Rn [X] peut scrire de
manire unique sous la forme
P = 0 + 1 (X x0 ) + 2 (X x0 )2 + + n (X x0 )n = 0 .

(*)

Sachant que cette criture existe, il est maintenant facile de calculer les nombres i . En valuant en X = x0 , on trouve dj 0 =
P(x0 ). Prenons maintenant la drive :
P0 = 1 + 22 (X x0 ) + + nn (X x0 )n1 .
On en tire 1 = P0 (x0 ). En drivant une deuxime fois on
voit 22 = P00 (x0 ), puis 63 = P(3) (x0 ), et par rcurrence on
montre (faites-le) que k! k = P(k) (x0 ).
Lquation () sappelle la formule de Taylor, quon crit donc
P(X) =

deg(P)
X
k=0

P(k) (x0 )
(X x0 )k .
k!

Deuxime lecture
Le thorme de la base incomplte
Nous avons vu que les bases sont trs utiles pour tudier les
espaces vectoriels, mais quil nexiste pas toujours de base finie
(cf exemple 11.34). Nous aurions bien besoin de critres faciles
pour garantir lexistence de bases, et cest le thorme suivant
qui va en donner. Commenons par un lemme trs simple.
Lemme 11.36 Soit E un espace vectoriel, soit e1 , . . . , en une famille
libre de E, et soit v E tel que la famille e1 , e2 , . . . , en , v nest pas
libre.
Alors v Vect(e1 , . . . , en ).

213

Dmonstration. Il existe une combinaison linaire nulle


1 e1 + + n en + v = 0 ,
dont les coefficients ne sont pas tous nuls. On doit donc avoir ,
0 : en effet dans le cas o = 0 on aurait
1 e1 + + n en = 0
donc 1 = 2 = = n = 0 puisque la famille est libre, ce qui
est une contradiction.
On peut donc crire
1
v = (1 `1 + + n `n ) ,

ce qui montre que v Vect(e1 , . . . , en ).


Thorme 11.37 (de la base incomplte) Soit E un espace vectoriel, soit L = `1 , `2 , . . . , `n une famille libre de vecteurs de E, et
soit G = g1 , g2 , . . . , gm une famille gnratrice de E. Alors on peut
complter L par des vecteurs de G pour en faire une base.
Plus prcisment, il existe des indices i1 , i2 , . . . , ik tels que
`1 , `2 , . . . , `n , gi1 , gi2 , . . . , gik
est une base de E.
Dmonstration. Considrons lensemble des entiers s tels quil
existe des indices (distincts) i1 , i2 , . . . , is pour lesquels
`1 , `2 , . . . , `n , gi1 , gi2 , . . . , gis
est libre ; notons S cet ensemble. Prenons k = sup S, qui existe
puisque S est fini (si S = par contre, on prend k = 0). Par
dfinition on a une famille libre
F = `1 , `2 , . . . , `n , gi1 , gi2 , . . . , gik ,
et nous allons montrer que cest une base.
Prenons en effet un vecteur gi de la famille G. Si on lajoute
la famille F , on obtient une famille de n + k + 1 vecteurs ; par
214

maximalit de k, cette famille ne peut pas tre libre. Daprs le


lemme 11.36, on a donc gi Vect(F ).
Cest vrai pour tous les vecteurs de G, donc Vect(G) Vect(F ).
Mais Vect(G) = E puisque G est gnratrice par dfinition, et
donc Vect(F ) = E galement, cest--dire que F est bien gnratrice.
Corollaire 11.38 Si E possde une famille gnratrice (finie),
alors E possde une base (finie).
Dmonstration. Cest ce que dit le thorme dans le cas o L est
la famille vide (vous pouvez vrifier que la dmonstration
du thorme est parfaitement adapte au cas o il ny a aucun
vecteur dans L).
Voici une autre consquence (en toute rigueur cest surtout
une consquence du lemme 11.36).
Corollaire 11.39 Soit E un espace vectoriel de dimension finie, et soit F E un sous-espace. Alors F est de dimension finie
et dim F dim E.
De plus, on a une quivalence F = E dim F = dim E.
Dmonstration. Si L est une famille libre de F, alors cest aussi
une famille libre de E. Donc L comprend moins de n lments,
o n = dim E (thorme 11.30).
Prenons maintenant une famille libre L de F ayant le plus
grand nombre dlments, disons L = `1 , . . . , `m , avec donc m
n. Alors par le lemme 11.36, on voit que tout f F appartient Vect(L) (puisque la famille `1 , . . . , `m , f ne peut pas tre
libre, par maximalit de m). Cette famille est donc une base,
et dim F = m dim E.
Si on a en fait dim F = dim E, alors prenons une base L =
`1 , `2 , . . . , `n de F ; cest une famille libre dlments de E, comprenant n = dim E vecteurs, donc cest une base de E daprs le
thorme 11.30. Ainsi F = Vect(L) = E.

215

Le rang dune matrice


Dfinition 11.40 Soit A Mn,m (K). On note Vect(A) le sousespace de Kn engendr par les colonnes de A. La dimension
de Vect(A) est appele le rang de la matrice A.

Nous allons voir comment calculer le rang. Du mme coup,
nous verrons comment trouver une base dun espace vectoriel
donn comme un vect dans Kn . En fait, laide de la thorie dveloppe dans ce chapitre, nous allons donner deux mthodes
profondment diffrentes ; le fait quelles donnent le mme rsultat est un thorme clbre.
Proposition 11.41 Le rang de A est le nombre de lignes nonnulles dans la matrice bien chelonne EA .
Pour trouver une base de Vect(A), il suffit de prendre les colonnes de A qui correspondent aux pivots.
Attention la dernire phrase. Elle signifie que si les pivots
de EA sont dans les colonnes i1 , i2 , . . . , ir , alors les colonnes de
la matrice de dpart A numrotes i1 , . . . , ir forment une base
de Vect(A) (notez que le nombre de pivots est gal au nombre
de lignes non-nulles, bien sr). De nombreux tudiants font
lerreur de proposer les colonnes de EA comme base.
Dmonstration. On note g1 , g2 , . . . , gm les colonnes de A, qui
forment une famille G gnratrice de Vect(A). Notons i1 , . . . , ir
les numros des colonnes de EA qui contiennent les pivots, et
soit B = gi1 , . . . , gir . Nous allons montrer que B est une base
de Vect(A), ce qui prouve les deux assertions du mme coup.
Soit B la matrice dont les colonnes sont les vecteurs de B ;
en dautres termes B est formes des colonnes de A numrotes i1 , . . . , ir . Alors la matrice bien chelonne EB est elle
aussi extraite de EA en gardant les colonnes correspondantes.
En particulier, EB possde un pivot dans chaque colonne, par
construction. Daprs la proposition 11.19, la famille B est
libre.
Par contre, prenons un indice i qui nest pas dans la liste i1 ,
. . . , ir , et rajoutons le vecteur gi B ( sa place dans lordre).
La matrice de cette nouvelle famille, disons C, est obtenue
216

partir de B en rinsrant la colonne de A correspondante. La


mme chose peut tre dite de EC , obtenus partir de EB en
rajoutant une colonne de EA . Cette colonne ne contient pas de
pivot par construction, et cest encore la proposition 11.19 qui
nous permet de conclure que la famille obtenue en rajoutant gi
B nest pas libre. Daprs le lemme 11.36, on a gi Vect(B).
Finalement, on a bien Vect(A) = Vect(G) Vect(B) Vect(A),
donc Vect(B) = Vect(A), et B est une base.
On en dduit la chose suivante :
Corollaire 11.42 On ne change pas le rang dune matrice en
faisant des oprations sur ses lignes.
Dmonstration. Si A0 est obtenue partir de A par de telles oprations, on a EA0 = EA clairement.
Exemple 11.43 Prenons

4
0
7 1

2
8
51
A = 1

5 5 12 102

Aprs quelques oprations sur les lignes, nous obtenons la


forme chelone :

16/
17/
1 0
15
5

EA = 0 1 52/15 119/5 .

0 0
0
0
Le rang de A est donc 2. Les pivots sont dans les colonnes 1 et 2
de EA , donc on va prendre les colonnes 1 et 2 de A :

1
7
2
1
e1 =
.
, e2 =

5
5
La proposition nous dit que e1 , e2 est une base de Vect(A).
Passons la deuxime mthode : les colonnes vont remplacer les lignes. Les choses se passent maintenant dans lordre
inverse, car le rsultat suivant est assez vident.
217

Lemme 11.44 On ne change pas le rang dune matrice A en faisant des oprations sur les colonnes. En fait on ne change mme
pas Vect(A).
Dmonstration. Si A0 est obtenue partir de A par de telles
oprations, chaque colonne de A0 est visiblement dans Vect(A).
Ainsi Vect(A0 ) Vect(A). Mais bien sr on peut retrouver A en
faisant des oprations sur les colonnes de A0 , donc de la mme
manire on a Vect(A) Vect(A0 ).
Dans lnonc suivant, on va dire quune matrice est chelonne en colonnes lorsque cest la transpose dune matrice
chelonne. En dautres termes, reprenez la dfinition de matrice chelonne et remplacez ligne par colonne . En faisant des oprations sur les colonnes dune matrice A, on peut
la mettre sous une forme unique bien chelonne en colonnes :
pour sen assurer, il suffit dobserver que cela revient mettre
la transpose t A sous forme bien chelonne en faisant des
oprations sur les lignes.
Proposition 11.45 Le rang de A est le nombre de colonnes nonnulles dans la matrice bien chelonne en colonnes associe A.
Pour trouver une base de Vect(A), il suffit de prendre les colonnes non-nulles de cette matrice chelonne en colonnes.
Dmonstration. Soit B la matrice bien chelonne en colonnes
obtenue partir de A. Daprs le lemme Vect(B) = Vect(A).
Si g1 , g2 , . . . , gr sont les colonnes non-nulles de B, il est clair
que Vect(g1 , . . . , gr ) = Vect(B), donc il suffit de sassurer que cest
une famille libre. Or les pivots tant seuls dans leurs lignes,
cest clair (voir lexemple).
Exemple 11.46 Reprenons le mme exemple, cest--dire :

4
0
7 1

2
8
51
A = 1

5 5 12 102

En faisant des oprations sur les colonnes, on peut mettre A

218

sous la forme

1
0

0 0 0

1 0 0 ,

2 0 0

et cette matrice est bien chelonne en colonnes . On voit de


nouveau que le rang est 2. Cette fois ci, la proposition nous dit
de prendre

0
1
0
1
1 =
, 2 =
.

1
2
La famille 1 , 2 est une base de Vect(A).
En comparant les deux mthodes, il vient le rsultat suivant, qui est loin dtre vident si on part de la dfinition :
Thorme 11.47 Le rang dune matrice est gal au rang de sa
transpose.
Dmonstration. Le rang de A est le nombre de lignes nonnulles dans EA , qui est gal au nombre de colonnes non-nulles
dans t EA . Or t EA est bien chelonne en colonnes, et obtenue
partir de t A en faisant des oprations sur les colonnes, donc le
nombre de ses colonnes non-nulles est bien le rang de t A.

219

Chapitre 12

Formules de Taylor
Introduction
Soit f une fonction dfinie sur un intervalle I contenant 0.
Nous allons examiner les conditions de continuit et de drivabilit en 0 sous un angle un peu nouveau.
La fonction f est continue en 0 si et seulement si lim f (x) =
f (0) lorsque x 0. Dans ce cas, on peut crire, mme si a
parat artificiel pour linstant, que
f (x) = f (0) + (x) ,
avec (x) = f (x) f (0) ; on observe alors que (x) 0 lorsque
x 0. En dautres termes, la fonction f se rapproche de la valeur (constante) f (0) lorsque x approche de 0. On ne sait pas
quelle vitesse cette approche se fait.
De la mme manire, le lemme 9.7 nous dit que si f est
drivable en 0, alors
f (x) = f (0) + f 0 (0) x + x(x) ,
o l encore (x) 0 lorsque x 0. crivons P(x) = f (0) +
f 0 (0) x ; cest un polynme en x, de degr 1. Comme nous le faisions remarquer aprs le lemme 9.7, la diffrence f (x) P(x) =
x(x) est le produit de deux fonctions qui tendent vers 0 avec x,

220

et on peut donc considrer que P est une approximation assez


bonne de f .
Gomtriquement, le graphe de P est la droite passant par
(0, f (0)) et dont le coefficient directeur est f 0 (0) ; cest la droite
tangente au graphe de f . On en sait donc un peu plus sur la
faon dont f approche la valeur f (0) lorsque x 0.
Le but de ce chapitre est de montrer que lon peut continuer
dans cette voie : on peut trouver, en supposant que lon peut
driver f au moins n fois, un polynme Pn (x) de degr n tel que
la diffrence f (x) Pn (x) tende vers 0 encore plus vite.
Cest utile dans de nombreux calculs : nous allons tre capables de calculer des limites qui restent inaccessibles par les
autres mthodes classiques. En fait, presque nimporte quel
calcul de limite va se ramener une limite de polynmes !
La formule de Taylor-Lagrange
Il y a un certain nombre de formules, dites de Taylor , qui
ont toutes pour objectif lapproximation dune fonction par un
polynme, comme annonc dans lintroduction. Nous en verrons deux, il en existe encore dautres.
Thorme 12.1 (Taylor-Lagrange) Soit f une fonction drivable n fois sur un intervalle I contenant 0. Alors x I il existe
]0; 1[ tel que :
f (x) = f (0) + f 0 (0)x +

f 00 (0) 2
f (n1) (0) n1 f (n) (x) n
x + +
x
+
x .
2
(n 1)!
n!

(Attention : dpend de x et de n.)


Dmonstration. On va faire la dmonstration pour x > 0, pour
simplifier.
On peut toujours trouver un rel A (qui dpend de x !) tel
que
A
f (x) = f (0) + f 0 (0) x + + xn .
n!
(En effet il suffit de poser A = (f (x) (f (0) + ))/(xn /n!).) On
veut montrer que A = f (n) (x) pour un certain 0 < < 1.

221

Sur lintervalle [0; x], on dfinit


"
f 00 (t)
F : t 7 f (x) f (t) + f 0 (t)(x t) +
(x t)2 +
2
#
f (n1) (t)
A
+
(x t)n1 (x t)n .
(n 1)!
n!
Cette fonction F est drivable, on a F(0) = 0 par choix de A,
et F(x) = 0. Le thorme des accroissements finis donne lexistence de c ]0, x[ tel que
F0 (c) =

F(x) F(0)
= 0.
x0

En posant = xc , on a bien 0 < < 1 et c = x.


Calculons maintenant F0 (t) (les dtails vous sont confis en
exercice) :
F0 (t) =


 (x t)n1
f (n) (t)
A
(xt)n1
(xt)n1 = A f (n) (t)
.
(n 1)!
(n 1)!
(n 1)!

Donc lquation F0 (x) = 0 que nous avons obtenue donne A =


f (n) (x), comme on le souhaitait.
Pour n = 1, noter que cette formule redonne exactement
le thorme des accroissements finis (un tout petit peu reformul).
Exemple 12.2 Prenons la fonction f (x) = ex . On a f 0 = f , et
donc aussi f 00 = f et par rcurrence f (n) = f pour tout n. En particulier f (n) (0) = 1. La formule de Taylor-Lagrange donne donc,
pour tout x R et tout entier n , lexistence dun nombre 0 <
< 1 (qui dpend de x et de n) tel que
f (x) = ex = 1 + x +

xn1
ex n
x2
+ +
+
x .
2
(n 1)! n!

En guise dapplication, essayons de fixer x et de faire tendre n


vers linfini. Si on observe que |ex | e|x| e|x| , on en tire


n1 k
X
n

x
e|x| |x| .
ex
k!
n!

k=0
222

Puisque
dduit

|x|n
n!

0 lorsque n + (toujours avec x fix), on en


n1 k
+ k
X
X
x
x
=
.
n+
k!
k!

ex = lim

k=0

k=0

On retrouve la dfinition de lexponentielle telle que nous


lavions donne (dfinition 10.1). De plus, nous avons simplement utilis le fait que f 0 = f et f (0) = 1, donc nous retrouvons
la partie unicit du lemme 10.4.
Exemple 12.3 Prenons maintenant une fonction pour laquelle
nous ne connaissons pas encore de dveloppement en srie :
par exemple f (x) = ln(1 + x), dfinie sur ] 1; +[. On a
f 0 (x) =

1
1+x

donc

f 00 (x) =

1
(1 + x)2

et

f (3) (x) =

2
.
(1 + x)3

On peut montrer que f (n) (x) = (1)n1 (n 1)!(1 + x)n ; en fait


en drivant cette formule on obtient tout de suite la forme
de f (n+1) (x), do le rsultat par rcurrence. En particulier, on
a f (n) (0) = (1)n1 (n 1)!.
La formule de Taylor-Lagrange donne lexistence pour tout x
et tout n dun nombre 0 < < 1 tel que
f (x) = ln(1+x) = x

x2 x3 x4
xn1 (1)n1 xn
+ + +(1)n1
+
.
2 3 4
n 1 n(1 + x)n

L encore, fixons x et faisons tendre n vers +, pour voir. On


va se restreindre x ] 1, 1], pour avoir |xn | 1. Dans ce cas et
pour x 0 on a


(1)n1 xn 1
0 ,

n(1 + x)n n n
alors que pour x 0 on a (1 + x) (1 + x) donc


(1)n1 xn
1
0 .


n(1 + x)n n(1 + x)n n

223

Dans les deux cas lexpression tend vers 0, et on a donc pour


tout x ] 1, 1] :
ln(1 + x) = lim

n+

k1
X

(1)k1

k=1

xk X
xk
=
(1)k1 .
k
k
k=1

Cest cette formule qui est utilise par les calculatrices pour
calculer un logarithme ! Notons pour x = 1 que lon a
ln(2) =

+
X
(1)k1
1 1 1
= 1 + +
k
2 3 4
k=1

Nous avions annonc ce rsultat dans lexemple 4.22.


La formule de Taylor-Young
Dans les exemples ci-dessus, nous avons fix x et tudi le
reste , cest--dire le terme en xn ; cest typique de lutilisation de Taylor-Lagrange. Voici maintenant la formule de TaylorYoung, qui va tre utilise lorsque lon veut faire tendre x vers 0
pour calculer une limite.
Thorme 12.4 (Taylor-Young) Soit f une fonction drivable n
fois sur un intervalle I contenant 0. Alors on peut crire
f (x) = f (0) + f 0 (0)x +

f 00 (0) 2
f (n) (0) n
x + +
x + xn (x)
2
n!

o (x) 0 quand x 0.
Dmonstration. La dmonstration complte sera donne plus
loin. Ici nous donnons une dmonstration avec une toute petite restriction : on va supposer que, en plus des hypothses
ci-dessus, la fonction f (n) est continue en 0. Cest par exemple
le cas si f est drivable n + 1 fois, et en pratique dans tous nos
exemples nous serons dans cette situation.
On a alors f (n) (x) f (n) (0) ; en dautres termes, si on pose
h(x) = f (n) (x) f (n) (0), on peut crire f (n) (x) = f (n) (0) + h(x) avec
h(x) 0. La formule de Taylor-Lagrange donne alors :
f (x) = f (0) + +

f (n1) (0) n1 f (n) (0) n


x
+
x + xn h(x x) .
(n 1)!
n!
224

On rappelle encore que = x dpend de x. Posons alors (x) =


h(x x). Comme 0 < x < 1, on a (x) 0 lorsque x 0, ce qui
conclut la dmonstration.
Exemple 12.5 Avant de connatre les formules de Taylor, calculer une limite relve souvent de lastuce. Par exemple escos(x)1
sayons de calculer la limite de
lorsque x 0. Lastuce
x
consiste remarque que, si f (x) = cos(x), alors la quantit tudie est le taux daccroissement de f :
cos(x) 1 f (x) f (0)
=
f 0 (0) = 0 .
x
x0
cos(x)1

Si maintenant nous essayons de calculer la limite de x2


en 0, la mme astuce ne donne rien. Pour parvenir faire le
calcul, crivons la formule de Taylor-Young pour la fonction f
dfinie par f (x) = cos(x) et pour n = 2 (on dit souvent TaylorYoung lordre 2 ). On a f (0) = 1, f 0 (0) = 0 et f 00 (0) = 1. Par
consquent :
f (x) = cos(x) = 1

x2
+ x2 (x)
2

avec (x) 0. Et donc :


cos(x) 1
1
1
= + (x) .
2
2
x2
Ainsi, la formule de Taylor nous a permis de remplacer la
2
fonction cos par le polynme 1 x2 dans le calcul de la limite.
Au passage, il est trs facile dcrire la formule de TaylorYoung pour la fonction cos nimporte quel ordre, puisque les
drives successives sont :
cos0 = sin ,

cos00 = cos ,

cos(3) = sin

et

cos(4) = cos .

Les nombres cos(n) (0), lorsque n augmente, sont donc


1, 0, 1, 0,

1, 0, 1, 0,

225

1, 0, 1, 0, . . . ,

la squence 1, 0, 1, 0 se rptant sans cesse. En particulier les


termes impairs dans la formule de Taylor-Young sont nuls,
et la formule lordre 2n + 1 est
cos(x) = 1

x2 x4 x6
x2n
+

+ + (1)n
+ x2n+1 (x) ,
2
4! 6!
(2n)!

o (x) 0 lorsque x 0.
sin(x)x

Exemple 12.6 On souhaite calculer la limite en 0 de x2 .


crivons dabord la formule de Taylor-Young pour la fonction
sinus : les drives successives sont
sin0 = cos ,

sin00 = sin ,

sin(3) = cos

et

sin(4) = sin .

Les nombres sin(n) (0), lorsque n augmente, sont donc


0, 1, 0, 1,

0, 1, 0, 1,

0, 1, 0, 1, . . . .

En particulier les termes pairs dans la formule de Taylor-Young


sont nuls, et la formule lordre 2n est
sin(x) = x

x2n1
x3 x5 x7
+

+ + (1)n
+ x2n (x) ,
3! 5! 7!
(2n 1)!

o (x) 0 lorsque x 0. Pour notre limite, prenons lordre 4 :


sin(x) = x

x3
+ x4 (x) ,
6

o, vous laurez devin, on a (x) 0. Ainsi


sin(x) x x
= + x2 (x) 0 .
6
x2
Exemple 12.7 Un dernier. Essayons de calculer la limite de

3
1 + 2x 1 + 3x
,
x2
lorsque x tend vers 0. Introduisons la notation f (t) = (1 + t) ,
pour > 0, et calculons la formule de Taylor-Young pour f . On
a
f0 (t) = (1 + t)1 ,
f00 (t) = ( 1)(1 + t)2 ,
226

et par rcurrence on a facilement


(n)

f (t) = ( 1)( 2) ( n + 1) (1 + t)n .


Le coefficient qui apparat dans Taylor-Young est donc
(n)

f (0) ( 1)( 2) ( n + 1)
=
,
n!
n!

et ce nombre est souvent not n , ce qui est cohrent avec la
notation lorsque est un entier. On a donc
!
( 1) 2
n n

(1 + t) = 1 + t +
t + +
t + t (t) ,
2
n
avec (t) 0. Pour =

1
2

et n = 2, on obtient

1
1
t2
1 + t = (1 + t) 2 = 1 + t + t2 1 (t) .
2
8
Pour t = 2x ceci donne

1 + 2x = 1 + x

x2
+ 4x2 1 (2x) .
2

Vous montrerez quen prenant =

1
3

on en arrive

3
1 + 3x = 1 + x x2 + 9x2 2 (x) .
Finalement lexpression dont on cherche la limite est de la
forme
1 2
2
1
2 x + x h(x)
= + h(x) ,
2
2
x
o h(x) est une certaine expression qui tend vers 0 avec x. La
limite vaut 12 .
Si vous avez trouv ce dernier calcul un peu compliqu,
alors vous conviendrez quon aurait besoin de notations plus
simples, et de quelques conseils pratiques.

227

Dveloppements limits
Les expressions telles que 4x2 1 (x) ci-dessus sont rapidement pnibles manier. Donner des noms diffrents aux fonctions qui tendent vers 0 qui apparassent (1 , 2 , . . . ) devient
vite compliqu, et on se demande sil est vraiment utile de baptiser toutes ces fonctions. On ne peut pourtant pas toutes les
nommer de la mme manire.
Pour rsoudre ce problme, on introduit la notation de Landau, qui en toute rigueur est un peu ambige, mais en pratique
conomise bien des efforts. Elle fonctionne de la manire suivante : tout dabord on crit
o(1)
qui se prononce petit o de 1 , pour dsigner une fonction
anonyme qui tend vers 0. On ne dit pas quand qui tend vers
quoi , cest pourquoi la notation est ambige, mais cest le
contexte qui rend les choses claires.
Ensuite, tant donne une fonction , qui en pratique sera
trs souvent de la forme (x) = xn , on utilise le raccourci
o((x)) = (x) o(1) .
o(xn )

dsigne une expression de la forme xn (x)


Par exemple
avec (x) 0 (et ces expressions sont beaucoup intervenues
dans le dbut de ce chapitre !). Ainsi on peut noncer la conclusion du thorme de Taylor-Young sous la forme
f (x) = f (0) + f 0 (0)x +

f 00 (0) 2
f (n) (0) n
x + +
x + o(xn ) .
2
n!

On peut penser o((x)) comme quelque chose de ngligeable devant (x) .


Avant de voir cette notation loeuvre dans un calcul, une
petite dfinition :
Dfinition 12.8 On dit que f a un dveloppement limit
lordre n au voisinage de 0 sil existe a0 , . . . , an R tels que
f (x) = a0 + a1 x + a2 x2 + an xn + o(xn ) .

228

Le thorme de Taylor-Young affirme donc que si f est drivable n fois, alors elle possde un dveloppement limit
f (k) (0)

lordre n, et de plus ak = k! . Mais utiliser le thorme nest


pas toujours la meilleure faon de trouver un dveloppement
limit en fait, presque jamais.
Exemple 12.9 En crivant (1 x)(1 + x + x2 + + xn ) = 1 xn+1 ,
on tire
xn+1
1
= 1 + x + x2 + xn +
1x
1x
2
n
= 1 + x + x + x + o(xn ) .
Ici on a utilis le fait que

x
1x

0 lorsque x 1, ce quon rn+1

= o(1) ; et donc x1x = o(xn ).


sume en crivant
Bien entendu on peut obtenir ce dveloppement grce
Taylor-Young, ou encore en utilisant celui de (1 + t) comme
dans lexemple 12.7 pour = 1 et t = x. Mais le plus simple
pour le retrouver reste le calcul ci-dessus.
x
1x

Exemple 12.10 Cherchons un dveloppement limit de la


fonction x 7 (ex 1)(sin(x) x) en 0 lordre 4. On crit
ex 1 = x + o(x)

et

sin(x) x =

x3
+ o(x3 ) ;
3!

en effet nous connaissons ces dveloppements par coeur depuis


les exemples 12.2 et 12.6.
En multipliant il vient
" 3
#
x4
x
x
3
3
(e 1)(sin(x) x) = + o(x) + xo(x ) + o(x)o(x ) .
3!
3!
Maintenant nous faisons une srie de petites simplifications,
quil va falloir shabituer faire de tte (cest trs facile). Tout
dabord
x4
x3
o(x) = o(1) = x4 o(1) = o(x4 ) .
3!
3!
1
Pour la deuxime galit, on utilise le fait que 3!
o(1) = o(1), ce
1
qui signifie seulement que 3! o(1) tend vers 0 avec x.

229

Deux autres petits calculs donnent xo(x3 ) = o(x4 ) et o(x)o(x3 ) =


Enfin la somme des termes dans le crochet est

o(x4 ).

o(x4 ) + o(x4 ) + o(x4 ) = x4 (o(1) + o(1) + o(1)) = x4 o(1) = o(x4 ) .


Ici on utilise le fait que o(1) + o(1) = o(1) (ce qui surprend la
premire fois !). Finalement
(ex 1)(sin(x) x) =

x4
+ o(x4 ) .
3!

Proposition 12.11 Si lon peut crire :


f (x)

=
=

a0 + a1 x + an xn + o(xn )
b0 + b1 x + bn xn + o(xn )

alors ai = bi . En dautres termes, lorsquun dveloppement limit


existe, il est unique.
Dmonstration. Par rcurrence sur n. Pour n = 0, on prend la
limite quand x tend vers 0, et on obtient a0 = b0 .
Si lunicit a t prouve pour n 1 et que lon a un dveloppement limit lordre n, on crit an xn + o(xn ) = o(xn1 ) et
de mme pour bn , et on obtient
f (x)

=
=

a0 + a1 x + an1 xn1 + o(xn1 )


b0 + b1 x + bn1 xn1 + o(xn1 ) .

Par rcurrence on a ai = bi pour 0 i n 1.


On peut donc simplifier lgalit ci-dessus, et il reste an xn +
n
o(x ) = bn xn + o(xn ). On divise par xn et on prend la limite en 0 :
il vient an = bn .
Exemple 12.12 Cette proposition est videmment utile lorsque
nous avons deux faons de trouver un dveloppement limit.
Par exemple, considrons la question suivante : soit f (x) =
1
; combien vaut f (6) (0) ? On peut bien sr rpondre cette
1+2x3
question en drivant 6 fois. . . mais cest trs long. Procdons
autrement.

230

Daprs Taylor-Young, nous savons que cette fonction possde un dveloppement limit tous les ordres, et le terme
en xk est prcisment

f (k) (0) k
k! x .

Mais nous savons aussi que

1
= 1 + u + u2 + o(u2 ) ,
1u
depuis lexemple 12.9, donc en prenant u = 2x3 :
1
= 1 2x3 + 4x6 + o(x6 ) .
1 + 2x3
Dtaillons un peu ce qui vient de se passer avec le reste. Le
terme o(u 2 ) scrit donc u 2 (u) avec (u) 0 lorsque u 0.
Lorsque lon fait u = 2x3 , ce terme devient 4x6 (2x3 ), et cette
expression est bien de la forme x6 o(1) = o(x6 ). L encore il faut
faire a de tte, avec lhabitude.
Daprs la proposition, on peut comparer ce dveloppement
limit avec celui donn par Taylor-Young, et en particulier pour
les termes en x6 la comparaison donne
f (6) (0)
=4
6!

donc

f (6) (0) = 4 6! = 2880 .

Mthodes de calcul des dveloppements limits


Calculer les dveloppements limits ncessite de lentranement, et nous allons lister quelques techniques connatre.
videmment la premire mthode est dappliquer le thorme
de Taylor-Young, mais il est trs rare que ce soit le meilleur
choix. Cest bien sr grce ce thorme que nous avons obtenu les dveloppements des fonctions usuelles (exponentielle,
sinus, cosinus. . . ), mais ceux-ci sont savoir par coeur absolument, de sorte qu partir de maintenant il sera exceptionnel dappliquer directement Taylor-Young. ( la fin du chapitre
nous rsumons les choses mmoriser).
Exemple 12.13 (Composition) Essayons de trouver un dve1
lordre 4 en 0. On utilise le fait
loppement limit de cos(x)
que :
1
= 1 u + u2 + o(u2 ) .
1+u
231

Ensuite on crit cos(x) = 1 + u(x) avec u(x) = x2 + x4! + o(x4 ) (on


a retenu le calcul de lexemple 12.5 par coeur).
En combinant les rsultats, on obtient
1
1
=
= 1 u(x) + u(x)2 + o(u(x)2 )
cos(x) 1 + u(x)
= 1+

x2 5x4
+
+ o(x4 ) .
2
24

On a utilis au passage o(u(x)2 ) = o(x4 ). Dune manire gnrale le petit rsultat suivant est retenir : si u(x) possde un
dveloppement limit qui commence par un terme en xm , alors
o(u(x)n ) = o(xnm ).
Exemple 12.14 (Intgration) Le principe est le suivant. Soit f
une fonction drivable n+1 fois. Daprs Taylor-Young, f admet
un dveloppement limit lordre n + 1, donc f (x) = a0 + a1 x +
f (k) (0)

+ an+1 xn+1 + o(xn+1 ), avec ak = k! .


Mais on sait aussi que f 0 est drivable n fois, et donc admet
un dveloppement limit de la forme f 0 (x) = b0 +b1 x+ +bn xn +
o(xn ), avec cette fois
bk =

(f 0 )(k) (0) f (k+1) (0)


=
= (k + 1)ak+1 .
k!
k!

On peut donc trouver les ak partir des bk (et le contraire aussi


dailleurs, mais en gnral cest plus intressant dans ce sens, et
cest pourquoi on parle de la mthode dintgration ). Il reste
juste calculer a0 = f (0) directement, et on obtient n + 1 coefficients du dveloppement limit de f partir de n coefficients
du dveloppement de f 0 .
Voyons a pour f (x) = arctan(x). On est bien plus laide
1
avec la drive f 0 (x) = 1+x
2 , puisque lon a
1
= 1 x2 + x4 x6 + + (1)n x2n + o(x2n ) .
1 + x2
1
(On dduit celui-ci du dveloppement de 1u
, que lon connat
par coeur). Pour revenir f , il suffit dintgrer terme terme ,

232

cest--dire que lon a


f (x) = f (0)

x3 x5 x7
x2n+1
+

+ + (1)n
+ o(x2n+1 ) .
3
5
7
2n + 1

Et bien sr f (0) = arctan(0) = 0.


Exemple 12.15 (Tangente) Il y a de nombreuses faons de
calculer le dveloppement limit de f (x) = tan(x). La mthode
que nous allons prsenter est particulirement rapide. Cest un
classique qui peut donner des ides dans dautres situations.
On commence par noter que f 0 (x) = 1 + tan(x)2 = 1 + f (x)2 .
Ainsi f (0) = 0 et f 0 (0) = 1 + 0 = 1. Par Taylor-Young, nous avons
le dveloppement lordre 1, savoir f (x) = x + o(x).
Mais alors
f 0 (x) = 1 + f (x)2 = 1 + (x + o(x))2 = 1 + x2 + o(x2 ) .
Par la mthode dintgration, on en dduit que
f (x) = x +

x3
+ o(x3 ) .
3

Et on recommence :
!2
x3
3
+ o(x )
f (x) = 1 + x +
3
2
= 1 + x2 + x4 + o(x4 ) .
3
0

On intgre de nouveau :
f (x) = x +

x3
2
+ x5 + o(x5 ) .
3
15

On peut continuer comme a pendant longtemps. Vous pouvez


vrifier que lon a
f (x) = x +

x3
2
17 7
62 9
+ x5 +
x +
x + o(x9 ) .
3
15
315
2835

Il nexiste pas de formule gnrale pour lordre n.


233

Le minimum savoir par coeur


Plus on connat de dveloppements limits par coeur, plus
les suivants sont faciles. Voici cependant une liste minimale de
choses savoir par coeur, sous peine dtre incapable daffronter les exercices. Les dmonstrations ont toutes t donnes au
cours de ce chapitre. Nous indiquons des moyens mnmotechniques.
x2
xn
 ex = 1 + x +
+ +
+ o(xn ).
2
n!
x2 x4 x6
x2n
 cos(x) = 1
+

+ + (1)n
+ o(x2n+1 ).
2
4! 6!
(2n)!
(On garde les termes pairs de lexponentielle avec un
signe une fois sur deux.)
x3 x5 x7
x2n1
 sin(x) = x
+

+ + (1)n
+ o(x2n ).
3! 5! 7!
(2n 1)!
(Pareil avec les termes impairs.)
!
( 1) 2
n

 (1 + x) = 1 + x +
x + +
x + o(xn )
2
n
( Formule du binme .)
1
= 1 + x + x2 + + xn + o(xn ).

1x
(Cest un cas particulier de la formule prcdente, mais il
est tellement important quil faut savoir lcrire rapidement.)
x2 x3
xn
 ln(1 + x) = x
+
+ + (1)n1 + o(xn ).
2
3
n
(En drivant on doit retrouver la formule pour (1 + x)1 .)
 Pour arctan, arcsin et arccos, on drive et on fait un dveloppement de la drive laide de la formule pour (1 +
x) .

234

Chapitre 13

Applications linaires
Dans ce chapitre, la lettre K dsigne Q, R ou C.

Premire lecture

nimporte quel
corps.

Dfinition & Exemples


Dfinition 13.1 Soient E et F des espaces vectoriels sur K.
Une application linaire est une fonction f : E F telle que
f (u + v) = f (u) + f (v) pour u, v E, et telle que f (v) = f (v)
pour tout K.

Exemple 13.2 Lexemple le plus simple sobtient en choisissant une matrice A Mm,n (K). On dfinit alors une application
f : Kn
v

Le lecteur ayant
assimil la
dfinition 2.15
peut prendre
pour K

Km
f (v) = Av .

(Comme dhabitude, les vecteurs sont vus comme des matricescolonnes.) On vrifie trs simplement que f (u + v) = A (u + v) =
Au + Av = f (u) + f (v), et f (v) = A (v) = Av = f (v). Cest
donc bien une application linaire.
Ainsi lapplication f : R3 R2 dfinie par

!
! x

x
5x + 7y z
5
7 1
f y =
=
y

x y + 19z
1 1 19

z
z
235

est linaire.
Exemple 13.3 Prenons E = F = C, qui est un espace vectoriel
de dimension 1 sur K = C. Fixons un nombre rel . Lapplication f (z) = ei z est alors linaire, exactement comme dans
lexemple prcdent.
On peut aussi identifier C avec R2 de la manire habituelle ;
on le voit alors comme un espace vectoriel de dimension 2
sur K = R. La mme application f est toujours linaire, bien
sr, quand on la voit comme une fonction R2 R2 . On lappelle la rotation dangle , ce qui doit correspondre lide de
rotation que vous avez tudie au collge ou au lyce.
Exemple 13.4 Voyons un exemple plus abstrait. Prenons
E = { : R R drivable } ,
lespace vectoriel des fonctions drivables, et
F = F (R, R) ,
lespace vectoriel de toutes les fonctions R R. Alors on peut
dfinir une application f : E F par f () = 0 . Cette application f est linaire, car (+)0 = 0 +0 et ()0 = 0 pour toute
constante (cf proposition 9.5).
Dfinition 13.5 (et Proposition) Soit f : E F linaire. On
dfinit son noyau ker(f ) comme tant
ker(f ) = {v E | f (v) = 0} .
On dfinit limage de f , note =(f ), par
=(f ) = {w F | il existe v E tel que w = f (v)} .
On utilise aussi la notation f (E) pour =(f ).
Alors ker(f ) et =(f ) sont des sous-espaces vectoriels (de E
et F respectivement).
La dimension de =(f ) est appele le rang de f .

La vrification que ker(f ) et =(f ) sont bien des sousespaces vectoriels vous est laisse.
236

kernel en
Anglais = noyau

Exemple 13.6 Prenons f (v) = Av comme dans lexemple 13.2.


Alors ker(f ) est lensemble des v tels que Av = 0 : cest lensemble des solutions dun systme linaire. Rciproquement
dailleurs, tant donn un systme, on peut considrer sa matrice et lapplication linaire correspondante, dont le noyau est
lensemble des solutions.
Avant de regarder =(f ) pour le mme f , notons un rsultat
simple :
Lemme 13.7 Soit f : E F linaire. Si E = Vect(e1 , . . . , en ),
alors =(f ) = Vect(f (e1 ), . . . , f (en )).
Dmonstration. Chaque f (ei ) est dans =(f ) par dfinition,
donc Vect(f (e1 ), . . . , f (en )) =(f ). Rciproquement, si w = f (v),
alors on crit v = 1 e1 + + n en , ce qui est possible par hypothse, et on applique f :
w = f (v) = f (1 e1 + + n en ) = 1 f (e1 ) + + n f (en ) .
Ceci montre bien que w Vect(f (e1 ), . . . , f (en )).
Exemple 13.8 Reprenons encore f : Kn Km dfinie par f (v) =
Av comme dans lexemple prcdent, et intressons nous =(f ).
On peut prendre la base canonique e1 , . . . , en de Kn , et daprs
le lemme on sait que =(f ) = Vect(f (e1 ), . . . , f (en )). Or on a

f (ei ) = Aei = A

0
..
.
1
..
.
0

= la i-me colonne de A .

Donc =(f ) est lespace engendr par les colonnes de A, cest-dire que =(f ) = Vect(A). En particulier, par dfinition mme
le rang de f concide avec le rang de A (rappelez-vous la dfinition 11.40).
Ces deux derniers exemples montrent que les deux grands
types de sous-espaces de Kn qui nous sont familiers, savoir
237

ceux dfinis par des quations et ceux donns comme des vects,
peuvent tre vus comme des noyaux ou des images dapplications linaires. Comprendre les applications linaires permet
donc de comprendre bien des choses.
Exemple 13.9 Reprenons lapplication f () = 0 comme dans
lexemple 13.4. Le noyau de f est constitu des fonctions
telles que 0 = 0 ; daprs le thorme des accroissements finis,
ceci revient dire que est constante.
Limage de f est lensemble des applications qui sont de
la forme = 0 . En dautres termes il sagit des fonctions qui
possdent une primitive. Peut-on dcrire facilement cet espace
vectoriel ? Cest une question trs difficile ! Dans le chapitre
suivant nous montrerons au moins que toutes les fonctions
continues possdent une primitive (mais a nest quune description partielle de =(f ) bien sr).
Sommes directes
Nous souhaitons dcrire deux types dapplications linaires
trs courantes et de nature gomtrique, les projections et les
symtries. Ce sont des gnralisations des projections et symtries orthogonales que vous aviez vues au collge. Pour prparer correctement la version la plus gnrale, il nous faut examiner un peu les relations quil peut y avoir entre deux sousespaces dun espace donn.
On part donc dun espace vectoriel E, et on prend deux
sous-espaces U et V. On peut tout dabord considrer lintersection U V, constitue des vecteurs qui sont la fois dans U
et dans V : vous vrifirez sans peine que cest encore un sousespace vectoriel. Une autre opration possible est la suivante.
Dfinition 13.10 La somme de U et V, note U + V est lensemble des vecteurs de E de la forme u + v avec u U et v V.

L encore, cest un sous-espace vectoriel de E.
Exemple 13.11 Lorsque U et V sont donns par des quations,
dcrire U V est facile. Par exemple dans E = R3 , si U est dcrit
238

par les quations


(

3x
x

y
3y

+
+

z
5z

=
=

0
0

et si V est dcrit par lquation x z = 0, alors U V est lensemble des vecteurs dont les coordonnes vrifient toutes ces
quations la fois. En clair U V est dcrit par

3x
y +
z = 0

x
+
3y
+
5z
= 0

z = 0
Si maintenant U et V sont donns comme des vects, cest U+
V qui est facile dcrire. En effet, les dfinitions entranent
immdiatement que
Vect(u1 , . . . , un ) + Vect(v1 , . . . , vm ) = Vect(u1 , . . . , un , v1 , . . . , vm ) .
(Vrifiez-le.)
Si maintenant on souhaite dcrire UV pour U et V donns
comme des vects, ou U + V pour U et V donns par des quations, la seule solution est de faire dabord une traduction des
quations aux vects ou vice-versa, comme on sait le faire.
Il existe une relation simple entre les dimensions de U V
et U + V :
Proposition 13.12 Soit E un espace vectoriel et U, V deux sousespaces de dimension finie. Alors U + V et U V sont de dimension
finie, et on a
dim(U + V) = dim(U) + dim(V) dim(U V) .
Dmonstration. Puisque UV est un sous-espace de U, il est de
dimension finie par le corollaire 11.39. Prenons donc une base
de U V, disons e1 , e2 , . . . , ed .
Daprs le thorme de la base incomplte (11.37), on peut
trouver u1 , u2 , . . . , uk U tels que BU = e1 , . . . , ed , u1 , . . . , uk est
une base de U. De mme, on peut trouver v1 , . . . , v` V tels
que BV = e1 , . . . , ed , v1 , . . . , v` est une base de V. Montrons que
B = e1 , . . . , ed , u1 , . . . , uk , v1 , . . . , v`
239

est une base de U+V. Ceci montrera que U+V est de dimension
finie, et que sa dimension est d + k + ` = (d + k) + (d + `) d =
dim(U) + dim(V) dim(U V), comme prvu.
Pour commencer, puisque U = Vect(BU ) et V = Vect(BV ), il
est clair que U + V = Vect(B) (voir lexemple prcdent). Donc
B est gnratrice. Pour montrer quelle est libre, nous devons
tudier lquation
1 e1 + + d ed + 1 u1 + + k uk + 1 v1 + ` v` = 0 ,
que nous rcrivons
1 e1 + + d ed + 1 u1 + + k uk = (1 v1 + + ` v` ) .
Le membre de gauche appartient U et le membre de droite
appartient V ; pour quils soient gaux, il faut donc quils
appartiennent tous les deux U V. Lespace U V ayant
pour base e1 , . . . , ed , les deux membres de la dernire quation
doivent donc tre de la forme 1 e1 + + d ed pour certains
scalaires i . crivons en particulier
(1 v1 + + ` v` ) = 1 e1 + + d ed ,
ou encore
1 e1 + + d ed + 1 v1 + + ` v` = 0 .
La famille BV tant libre, tous les coefficients ci-dessus sont
nuls : 1 = = d = 1 = ` = 0. Si nous revenons lquation de dpart, il ne reste plus que
1 e1 + + d ed + 1 u1 + + k uk = 0 .
Et finalement, la famille BU tant libre, ces derniers coefficients
sont galement nuls : 1 = = d = 1 = = k = 0. La famille B est bien libre.
Corollaire 13.13 Soit E un espace vectoriel de dimension finie, et soient U, V deux sous-espaces. Alors, lorsque deux des trois
conditions ci-dessous sont remplies, la troisime lest galement :
1. U V = {0},
240

2. E = U + V,
3. dim(U) + dim(V) = dim(E).
Dmonstration. Il faut simplement se rappeler les choses suivantes : si F est un sous-espace de E, alors F = E dim(F) =
dim(E) (corollaire 11.39) ; en outre F = {0} dim(F) = 0.
Donc on peut rcrire les trois conditions de la faon suivante :
1. dim(U V) = 0,
2. dim(E) = dim(U) + dim(V) dim(U V),
3. dim(U) + dim(V) = dim(E).
(On a utilis la proposition pour le (2)). Il est maintenant clair
que si deux galits sont vraies, alors la troisime aussi.
Dfinition 13.14 On dit que E est la somme directe de U et V,
et on crit E = U V, lorsque lon a U V = {0} et E = U + V. 
Le corollaire indique donc que, dans le cas de la dimension finie qui est celui que nous recontrons presque toujours,
on peut vrifier si E = U V de plusieurs faons. Typiquement,
vrifier si E = U + V peut tre plus difficile que de vrifier les
deux autres conditions du corollaire.
Exemple 13.15 Prenons E = R3 , puis U dfini par lquation 2x y + 7z = 0, et enfin V = Vect(v) avec

v = 1 .

2
Alors dim(U) = 2 (on peut prendre y et z comme paramtres),
et dim(V) = 1, donc dim(U)+dim(V) = dim(E). Daprs le corollaire, pour vrifier que E = UV il suffit de montrer que UV =
{0}. Ceci nous vite de montrer directement E = U + V, ce qui
est un peu plus pnible.
Un vecteur de V est de la forme

v = ,

2
241

avec R. Ce vecteur est dans U lorsque


2 + 7 2 = 15 = 0 .
Ceci narrive que pour = 0, donc le seul vecteur la fois
dans U et dans V est le vecteur nul. On a bien U V = {0},
et finalement E = U V.
Exemple 13.16 Une situation trs simple est celle dun espace
vectoriel E muni dune base e1 , . . . , en , dans lequel on choisit de
couper en deux ces vecteurs, en posant U = Vect(e1 , . . . , ek )
et V = Vect(ek+1 , . . . , en ). Dans ce cas il est clair que E = U V,
les deux conditions les plus facile vrifier tant E = U + V
et dim(U) + dim(V) = dim(E).
Il y a mme une sorte de rciproque. Si E = U V, prenons
une base u1 , . . . , uk de U et une base v1 , . . . , v` de V, et considrons B = u1 , . . . , uk , v1 , . . . , v` . Alors B est une base de E, le
plus facile tant de reprer que cest une famille gnratrice
ayant k + ` = dim(E) lments.
La meilleure faon de comprendre de manire intuitive et
gomtrique les sommes directes reste dtudier les projections,
ce que nous allons faire maintenant.
Projections et symtries
De mme que les bases nous permettent de prendre des coordonnes, les sommes directes vont nous permettre de dcomposer les vecteurs. En effet, supposons que E = U V, et prenons x E. Puisque E = U + V, on peut trouver u U et v V
tels que x = u+v. Mais de plus, u et v sont uniques. Pour vrifier
ceci, crivons x = u 0 + v0 avec u0 U et v0 V, puis
u + v = u0 + v 0 = u u0 = v0 v .
On a u u 0 U et v0 v V, donc pour que ces vecteurs soient
gaux, il faut quils soient dans U V = {0}. Ainsi u u 0 = 0 =
v0 v et donc u = u 0 , v = v0 .
Les vecteurs u et v sont bien dfinis par x ; on pourrait les
noter ux et vx . Nous allons pouvoir tudier la fonction qui x
associe ux :
242

Dfinition 13.17 Supposons que E = U V. La projection


sur U, paralllement V, est lapplication
p : E E,
dfinie par p(x) = ux , o x = ux + vx (comme ci-dessus).

Exemple 13.18 Prenons E = R2 , et choisissons une base e1 , e2 .


Enfin, posons U = Vect(e1 ) et V = Vect(e2 ), de sorte que E = UV
comme dans lexemple 13.16. Soit p la projection sur U, paralllement V.
La situation se prsente comme sur le dessin suivant, sur
lequel on a indiqu x et p(x) sur un exemple. La construction
se fait en prenant la parallle V passant par x ; lintersection
de cette droite avec U est p(x).
Proposition 13.19 Soit p comme ci-dessus. Alors
1. p est linaire,
2. p(p(x)) = p(x),
3. le noyau de p est V, limage de p est U.
Rciproquement, si p est une application de E vers lui-mme
vrifiant (1) et (2), alors on a
E = =(p) ker(p) ,
et p est la projection sur =(p) paralllement ker(p).
Sur la figure prcdente, essayez de voir gomtriquement
pourquoi U = ker(p) et V = =(p).
Dmonstration. Si x = u + v et y = u0 + v0 , alors x + y = (u + u 0 ) +
(v + v0 ) avec u + u 0 U et v + v0 V, donc par dfinition p(x +
y) = u + u0 , avec u = p(x) et u0 = p(y). On montre de mme
que p(x) = p(x). La projection p est bien linaire.
En crivant x = u + v comme ci-dessus, on a p(x) = u U. Si
lon crit u = u + 0, alors cest la dcomposition de u sur U et V
et par dfinition p(u) = u. Ainsi p(p(x)) = p(x). Les points (1) et
(2) sont montrs.
Passons au (3). Si x = u + v et si p(x) = u = 0, alors x = v V ;
donc ker(p) V. Rciproquement si x V, on crit x = 0 + x =
243

u + v pour constater que u = 0 = p(x) (et v = x), donc x ker(p)


et finalement ker(p) = V. Limage de p est clairement contenue
dans U, et rciproquement si on prend u U, en lcrivant u =
u + 0 on voit (comme ci-dessus) que p(u) = u donc u =(p).
Limage de p est bien U.
Voyons la rciproque, et supposons que p est linaire de E
vers E, avec p(p(x)) = p(x). Si on prend x E quelconque, on
crit simplement
x = p(x) + (x p(x)) .
(*)
Bien sr p(x) =(p), et comme p(x p(x)) = p(x) p(p(x)) =
p(x)p(x) = 0, on a xp(x) ker(p). Ceci montre que E = =(p)+
ker(p).
Pour tablir que la somme est directe, prenons x ker(p)
=(p). Alors p(x) = 0 puisque x ker(p). Dautre part x = p(y)
pour un certain y, donc p(x) = p(p(y)) = p(y) = x. En comparant
les deux on voit que x = 0, et ker(p) =(p) = {0}. La somme est
bien directe.
Enfin lquation (*) montre bien que la projection de x
sur =(p) paralllement ker(p) est p(x).
Aprs les projections, les symtries. Cette fois-ci, au lieu de
remplacer vx par 0, on le remplace par vx . Plus prcisment :
Dfinition 13.20 Supposons que E = U V. La symtrie par
rapport U, dans la direction V, est lapplication
s : E E,
dfinie par s(x) = ux vx , o x = ux + vx (comme ci-dessus).
Proposition 13.21 Soit s comme ci-dessus. Alors
1. s est linaire,
2. s(s(x)) = x,
3. on peut caractriser U et V par
U = {x E | s(x) = x} ,
et
V = {x E | s(x) = x} .
244

Rciproquement, si s est une application de E vers lui-mme vrifiant (1) et (2), et si on dfinit U et V par les galits ci-dessus,
alors E = U V et s est la symtrie par rapport U, dans la direction V.
Dmonstration. On vous laisse montrer les trois points, titre
dexercice. Montrons la rciproque : on prend s linaire telle
que s(s(x)) = x et on dfinit U et V par les galits proposes.
crivons
1
1
x = (x + s(x)) + (x s(x)) .
2
2
En posant ux = 12 (x + s(x)) et vx = 12 (x s(x)), on a donc x = ux +
vx . De plus
s(ux ) =

1
1
(s(x) + s(s(x))) = (s(x) + x) = ux ,
2
2

donc ux U par dfinition. Un calcul similaire donne s(vx ) =


vx , soit vx V. Ceci montre que E = U + V.
Si x U V, alors s(x) = x = x, donc 2x = 0 et x = 0. Par
suite U V = {0}, et E = U V.
Enfin s(x) = s(ux + vx ) = ux vx , donc s est bien la symtrie
annonce.
La matrice dune application linaire
Nous avons vu quune matrice A Mm,n (K) dfinissait une
application linaire f de Kn vers Km par f (v) = Av. Nous allons
voir maintenant que, rciproquement, si f : E F est linaire,
on peut lui associer une matrice une fois que des bases ont t
choisies pour E et F.
Supposons donc que B = e1 , . . . , en est une base de E, et
que C = 1 , . . . , m est une base de F. Le lemme suivant contient
une observation simple : pour dfinir une application linaire
dans cette situation, il suffit de spcifier chaque f (ei ).
Lemme 13.22 Soient v1 , . . . , vn des vecteurs quelconques de F.
Alors il existe une application linaire f : E F et une seule telle
que f (ei ) = vi .

245

Dmonstration. Voyons lunicit dabord. Prenons u E, que


lon peut crire u = 1 e1 + + n en . On doit avoir
f (u) = 1 f (e1 ) + + n f (en )
= 1 v1 + + n vn .

(*)

Il ny a donc quun seul choix possible pour f (u), et f est


unique si elle existe.
Pour vrifier lexistence, on dfinit f par la formule (), et on
doit simplement vrifier quelle est linaire. Cest trs facile, et
on vous le confie titre dexercice.
Exploitons maintenant le fait que nous avons aussi choisi
une base C pour F. En effet, pour spcifier f (ei ), il suffit dsormais de donner ses coordonnes dans C ; cest--dire que lon
peut crire
f (ei ) = a1i 1 + a2i 2 + + ami m ,
et lapplication f est dtermine par les nombres aij . Cest la
matrice (aij ) que lon appelle la matrice de f , par rapport aux
bases B et C.
En dautres termes :
Dfinition 13.23 Soit f : E F une application linaire,
soit B = e1 , . . . , en une base de E, et soit C une base de F. Alors la
matrice de f dans les bases B et C, que lon va noter
C [f ]

est construite de la manire suivante : dans la colonne i, on


place les coordonnes de f (ei ) dans la base C.
Lorsque les bases sont videntes daprs le contexte, on va
crire [f ] plutt que C [f ]B .

Exemple 13.24 Prenons E = F = R2 , et
!
!
3
1
e1 =
,
e2 =
.
1
2

246

Alors B = e1 , e2 est une base de R2 . On pose U = Vect(e1 ) et V =


Vect(e2 ), de sorte que R2 = UV. Soit maintenant p la projection
sur U, paralllement V.
Il y a au moins deux questions naturelles que lon peut poser. Tout dabord, quelle est
B
B [p]

(On dira la matrice de p dans la base B pour indiquer que


lon prend C = B). Pour cela, on revient la dfinition. Dans la
colonne 1, on crit les coordonnes de p(e1 ) dans la base B. On
a p(e1 ) = e1 = 1 e1 + 0 e2 , donc la premire colonne est
!
1
.
0
Dans la colonne 2, on indique les coordonnes de p(e2 ). Or p(e2 ) =
0 = 0 e1 + 0 e2 , donc la deuxime colonne est
!
0
.
0
Finalement
B [p]

1
0

0
0

!
.

Maintenant, avec R2 il est naturel de penser la base canonique C = 1 , 2 avec


!
!
1
0
1 =
,
2 =
.
0
1
Quelle est donc
C [p]

Il faut calculer p(1 ) et p(2 ), dans la base canonique, et ceci


nous donnera les deux colonnes de la matrice que lon cherche.
Prenons donc un vecteur quelconque
!
x1
x=
.
x2
247

On va calculer ses coordonnes dans la base B, puisque cest


avec cette base que lon sait bien faire des calculs avec p. Pour
cela introduisons
!
3 1
A=
,
1
2
la matrice dont les colonnes sont les vecteurs de B. On a alors
!
!
!
2
1
1
2
x1
1
7
7
7 x1 + 7 x2
=
A
x
=
.
=
[x]
B
x2
17 37
17 x1 + 37 x2
(Revoir lexemple 11.27 si ce nest pas clair.) En particulier on
obtient donc
!
!
2
1
7
7
,
.
B [1 ] =
B [2 ] =
3
17
7
On a donc 1 = 72 e1 71 e2 , ce qui permet de calculer que
!
6
2
6
2
7
p(1 ) = e1 = 2 = 1 + 2 .
7
7
7
7
De la mme manire, on a 2 = 17 e1 + 73 e2 donc
!
3
3
1
1
7
p(2 ) = e1 = 1 = 1 + 2 .
7
7
7
7
Finalement
C [p]

6
7
2
7

3
7
1
7

!
.

Pour vrifier si vous avez assimil les dfinitions, assurez-vous


que vous comprenez maintenant pourquoi
!
!
2
1
3 0
B
C
7
7
et B [p] =
.
C [p] =
1 0
0 0
Si vous trouvez cet exemple difficile suivre, alors vous apprcierez la formule du changement de base que nous allons prsenter trs bientt. Cest une formule simple et systmatique pour organiser les calculs ci-dessus, mais il faudra
248

toujours tre capable dcrire au moins une matrice (pour certaines bases), la formule donnera les matrices dans les autres
bases. Dans lexemple, le plus simple est de commencer par
!
1 0
B
.
B [p] =
0 0
Nous commenons dailleurs avec cet exemple voir lintrt de toutes ces matrices : puisquelles contiennent toutes
la mme information, savoir une description de lapplication p, libre nous de choisir la plus simple. Et vous voyez
bien que B [p]B est beaucoup plus simple que les autres ! Cette
ide sera pousse dans le chapitre Diagonalisation .
Commenons par constater, avec la proposition suivante,
que toutes les applications linaires (entre espaces vectoriels
de dimension finie) se ramnent multiplier une matrice par
un vecteur-colonne ; et la composition des applications se ramne multiplier les matrices.
Proposition 13.25 Soient E, F et G des espaces vectoriels, et
soient B, C et D des bases de ces espaces respectifs.
1. Si f : E F est linaire, et si x E, alors [f (x)] = [f ][x]. Plus
prcisment
B
C [f (x)] = C [f ] B [x] .
2. Si g : F G est linaire, alors [g f ] = [g][f ]. Plus prcisment
B
C
B
D [g f ] = D [g] C [f ] .
Nous ne donnerons pas les dtails de la dmonstration : elle
consiste seulement vrifier les dfinitions.
Exemple 13.26 Reprenons lexemple prcdent. Nous avons
calcul
!
6
3
M = C [p]C = 72 17 .
7

Ceci nous permet de calculer limage dun vecteur quelconque


par lapplication p (dans la base canonique). En effet si
!
x1
x=
= C [x] ,
x2
249

alors
p(x) = C [p(x)] = C [p]CC [x] = Mx =

6
7 x1 +
2
7 x1 +

3
7 x2
1
7 x2

!
.

En dautres termes, lapplication p nest autre que p(x) = Mx.


Au dpart il ntait pas clair partir de la dfinition gomtrique de la projection que lon puisse lcrire simplement
avec une matrice.
Formule du changement de base
Nous allons voir comment passer de la matrice dune application linaire, crite dans certaines bases, la matrice de la
mme application crite dans dautres bases. Notre point de dpart est donc celui dun espace vectoriel E muni de deux bases,
disons B = e1 , . . . , en et C = 1 , . . . , n .
Dfinition 13.27 La matrice de passage de B C, que lon va
noter
B
CP ,
est la matrice obtenue de la manire suivante : dans la colonne i, on place les coordonnes de ei dans la base C.

Exemple 13.28 Reprenons lexemple 13.24, et conservons les
notations. On a alors
!
3 1
B
P
=
.
C
1
2
En effet cette matrice contient bien dans la colonne 1 le vecteur e1 de B, crit dans la base canonique C, et de mme la
colonne 2 contient e2 .
Pour calculer B PC , on doit placer dans la colonne 1 le vecteurcolonne B [1 ], et dans la colonne 2 on place B [2 ]. Nous avons
fait ces calculs dans lexemple, et finalement on a
!
2
1
C
7
7
.
BP =
17 37

250

Proposition 13.29 Les matrices de passage ont les proprits suivantes :


1.

B
BP
B
DP

= Id (matrice identit).

= D PCC PB .

1
3. B PC = C PB .

2.

Dmonstration. Le premier point est vident daprs les dfinitions. Pour le deuxime, le plus simple est de noter la chose
suivante : si : E E est lapplication (x) = x, alors les dfinitions entranent que
B
B
C P = C [] .
On exploite ensuite le fait que ((x)) = x donc = et par
suite, en utilisant la proposition 13.25 :
B
DP

= D []B = D [ ]B = D []CC []B = D PCC PB .

Le troisme point est maintenant facile, puisque lon a


C B
BP CP

= C PC = Id ,

donc les matrices C PB et B PC sont bien inverses lune de lautre,


comme annonc.
Voici maintenant la formule proprement dite :
Proposition 13.30 Soit f : E F linaire, soient B et B 0 deux
bases de E, et soient C0 et C0 deux bases de F. Alors
C0 [f ]

B0

= C0 PCC [f ]BB PB .

Cette formule est plus facile mmoriser quil ny parat. Il


suffit de se rappeler quil faut mettre des matrices de passage gauche et droite ; ensuite, pour crire les bonnes bases,
il suffit de sassurer dabord que les bases apparaissant cte-cte sont les mmes (ci-dessus, on a crit B deux fois, cte-cte, et de mme pour C) ; enfin, les bases lextrieur des
formules (donc B 0 et C0 ) sont les mmes des deux cts de lgalit.
251

Dmonstration. On utilise la mme astuce. Soit E : E E lapplication E (x) = x, et soit F dfinit de la mme manire. On
a F (f (E (x))) = f (x), donc F f E = f , ce qui donne en termes
de matrices (en utilisant la proposition 13.25) :
C0 [f ]

B0

= C0 [F f E ]B = C0 [F ]CC [f ]BB [E ]B

B
C
B0
C0 P C [f ] B P

puisque C0 [F ]C = C0 PC et B0 [E ]B = B0 PB .
Exemple 13.31 Reprenons lexemple 13.24 : les choses vont
tre maintenant beaucoup plus simples. Il sagit donc de la
projection p : R2 R2 sur U = Vect(e1 ) paralllement V =
Vect(e2 ). Dans la base B = e1 , e2 on a
!
1 0
B
,
B [p] =
0 0
puisque p(e1 ) = e1 et p(e2 ) = 0 (pour linstant les vecteurs e1
et e2 particuliers que lon choisit ne changent rien laffaire).
Si maintenant on considre la base canonique C et que lon veut
la matrice de p dans cette base, on utilise la formule du changement de base :
C
B
B
C
C [p] = C P B [p] B P .
Dans lexemple 13.28, nous avons vu que
!
3 1
B
.
CP =
1
2
Pour lautre, on utilise le fait que B PC =
dj fait ce calcul, et on trouve
!
2
1
C
7
7
P
=
.
B
17 37


B 1 .
CP

Nous avons

Ce qui donne bien


C [p]

3 1
1
2

1
0

0
0

252

2
7
1
7

1
7
3
7

!
=

6
7
2
7

3
7
1
7

!
.

On peut traiter sans peine le cas de la projection s par rapport


U, dans la direction V. En effet on a s(e1 ) = e1 et s(e2 ) = e2 ,
donc
!
1
0
B
.
B [s] =
0 1
Dans la base canonique, on introduit exactement les mmes
matrices de passage, donc
!
!
!
!
5
6
2
1
3 1
1
0
C
7
7
7
7
=
=
.
[s]
C
4
5
1
2
0 1
17 37
7 7
Ce qui signifie que pour trouver limage dun vecteur quelconque par cette symtrie, on peut calculer simplement
!
!
!
!
6
5
5
x1 + 76 x2
x1
x1
7
7
7
= 4
.
s
= 4
5
5
x2
x2
7 7
7 x1 7 x2

Deuxime lecture
Applications injectives, surjectives, bijectives
Le lecteur est invit revoir les dfinitions des termes injectif , surjectif , et bijectif , introduits dans le tout premier chapitre de ce livre.
Nous allons examiner ces concepts dans le cadre des applications linaires. Il se trouve que la situation est bien plus
simple que dans le cas gnral. Commenons par :
Lemme 13.32 Soit f : E F linaire. Si f possde une rciproque f 1 : F E, alors f 1 est galement linaire.
Dmonstration. Prenons u et v dans F, et soit x = f 1 (u + v).
On a f (x) = u + v = f (f 1 (u)) + f (f 1 (v)) = f (f 1 (u) + f 1 (v))
puisque f est linaire. En applicant f 1 , on obtient x = f 1 (u)+
f 1 (v) = f 1 (u+v). On vous laisse montrer de la mme manire
que f 1 (v) = f 1 (v).
On utilise un mot savant pour les applications bijectives et
linaires :
253

Dfinition 13.33 Une application linaire et bijective est appele un isomorphisme. Lorsquil existe un isomorphisme E
F, on dit que E et F sont isomorphes.

Ce nouveau nom ne doit pas cacher un vieux calcul :
Proposition 13.34 Soit f : E F linaire, soit B une base (finie)
de E, et soit C une base (finie) de F. Alors
f est un isomorphisme la matrice C [f ]B est inversible .
De plus la matrice de la rciproque f 1 est linverse de la matrice
de f .
Ce qui veut dire que lon peut se ramener un calcul de
dterminant.
Dmonstration. Si f 1 existe, on note que f 1 (f (x)) = x donc la
matrice de f 1 f dans la base B est lidentit. Ainsi
h
iC
h
iB
Id = B f 1 f = B f 1 C [f ]B .
De la mme manire, on montre dans lautre sens que
B
C [f ] B

h
iC
f 1 = Id ,

ce qui montre que


h
B

f 1

iC

C [f ]


B 1

Rciproquement, si la matrice de f est inversible, on dfinit


M = C [f ]B

et

N = M1 ,

et on crit g pour lunique application F E dont la matrice


est
C
B [g] = N .
Les relations MN = NM = Id entranent g(f (x)) = x et f (g(x)) =
x, donc g = f 1 .

254

Une matrice inversible se doit dtre carre, donc citons tout


de suite :
Corollaire 13.35 Deux espaces de dimension finie E et F sont
isomorphes ils ont la mme dimension.
Dmonstration. Pour toute application linaire f : E F, sa
matrice est de dimension m n, avec n = dim(E) et m = dim(F).
Sil en existe une qui est bijective, alors sa matrice doit tre
carre, donc n = m. Rciproquement si n = m, prenons nimporte quelle matrice A inversible de taille n n (par exemple
lidentit), prenons une base B de E et une base C de F, et enfin
prenons f lunique application linaire f : E F telle que
C [f ]

= A.

Cest un isomorphisme daprs la proposition.


Exemple 13.36 Prenons r : R2 R2 la rotation dangle autour de lorigine. Rappelons quen identifiant R2 avec le plan
complexe C, on a r(z) = ei z. Choisissons la base B = 1, i. On
a r(1) = ei = cos() + i sin(), et r(i) = iei = sin() + i cos().
Par dfinition on a donc
!
cos() sin()
B
.
B [r] =
sin()
cos()
Le dterminant de cette matrice est cos()2 + sin()2 = 1 , 0,
donc elle est inversible et son inverse est
!
cos() sin()
.
sin() cos()
Donc r est bijective et sa rciproque est donne par la matrice
ci-dessus dans la base B. Puisque cos() = cos() et sin() =
sin(), on peut rcrire
!
cos() sin()
[r1 ] =
.
sin()
cos()
On constate que la rciproque de r est la rotation dangle ,
ce qui est normalement vident du point de vue gomtrique.
255

Les conditions de surjectivit et dinjectivit se vrifient


galement facilement. On a dabord :
Proposition 13.37 Une application linaire f : E F est surjective le rang de f vaut dim(F).
Dmonstration. Tout est dans les dfinitions. On a f surjective
=(f ) = F dim(=(f )) = dim(F), et bien sr dim(=(f ))
est par dfinition le rang de f .
Exemple 13.38 Une application linaire f : R2 R3 ne peut
pas tre surjective. En effet, si A dsigne la matrice de f dans
les bases canoniques, alors f (v) = Av et le rang de f est le rang
de la matrice A. Or le rang dune matrice 3 2 ne saurait tre
gal 3.
Pour linjectivit, le rsultat suivant est trs utile :
Proposition 13.39 Une application linaire f est injective
on a ker(f ) = {0}.
Dmonstration. Si f est injective, alors pour x ker(f ) on a f (x) =
0 = f (0) donc x = 0, et ker(f ) = {0}. Rciproquement, supposons que ker(f ) = {0}. Si f (x1 ) = f (x2 ), alors f (x1 x2 ) =
f (x1 ) f (x2 ) = 0, donc x1 x2 ker(f ), do x1 = x2 , et f est
bien injective.
Exemple 13.40 Voici la traduction en termes de matrices. Prenons f : Kn Km dfinie par f (v) = Av pour une matrice A.
Alors les lments v de ker(f ) sont les solutions du systme
linaire Av = 0.
Dire que ker(f ) = {0}, cest affirmer que ce systme na que la
solution nulle. On saperoit alors que linjectivit de f revient
exiger que les colonnes de A forment une famille libre.
En particulier, cest impossible pour n > m (thorme 11.30),
et il ny a par exemple aucune application linaire injective R3
R2 .
On voit que des considrations simples sur les matrices
nous permettent de faire des liens entre linjectivit ou la surjectivit dune application linaire et les dimensions des espaces qui sont en jeu. En fait il y a une faon trs simple et trs
256

gnrale de rsumer toutes ces relations, quil faut retenir :


cest le thorme du rang que nous prsentons maintenant.
Le thorme du rang
Cest le suivant :
Thorme 13.41 Soit f : E F une application linaire, et supposons que E est de dimension finie. Alors =(f ) est de dimension
finie, et on a
dim(E) = dim(ker(f )) + dim(=(f )) .
Dmonstration. Soit e1 , . . . , ek une base de ker(f ). Par le thorme de la base incomplte, on peut trouver 1 , . . . , ` tels que
la famille B = e1 , . . . , ek , 1 , . . . , ` est une base de E. Posons fi =
f (i ), et montrons que la famille C = f1 , . . . , f` est une base
de =(f ). Comme dim(E) = k + `, le thorme sera tabli.
Si y =(f ), par dfinition y = f (x) pour un certain x E, et
on peut crire
x = 1 e1 + + k ek + 1 1 + + ` ` ,
do
y = f (x) = 1 f (1 ) + + ` f (` ) = 1 f1 + + ` f` .
(car f (ei ) = 0 bien sr). Donc C est gnratrice de =(f ).
Si maintenant on a une combinaison linaire nulle :
1 f1 + + ` f` = 0 = 1 f (1 ) + + ` f (l ) = f (1 1 + + ` ` ) ,
on en conclut que 1 1 + + ` ` ker(f ). Nous avons une
base de ker(f ) notre disposition, crivons donc quil existe
des scalaires 1 , . . . , k tels que
1 1 + + ` ` = 1 e1 + + k ek .
On en dduit
1 e1 + + k ek 1 1 ` ` = 0 ,
et comme B est une base de E, on a finalement 1 = = k =
1 = = ` = 0. En particulier, la famille C est libre.
257

Exemple 13.42 Pour une application f : Kn Km , de la forme


f (v) = Av, o A est une matrice, ce thorme dit une chose
bien concrte en termes du systme Av = 0. En effet dim(E) = n
est le nombre dinconnues en jeu, dim(ker(f )) est le nombre
(minimal) de paramtres ncessaires pour dcrire lensemble
des solutions, et dim(=(f )) est le rang de la matrice A. On a
donc
!
!
!
nombre
nombre de
rang de
=
+
.
dinconnues
paramtres
la matrice
Avec un peu dexprience vis--vis des systmes, a na rien de
surprenant. Il est toutefois apprciable davoir une formulation trs prcise de cette galit par exemple la notion de
dimension dun espace vectoriel rend prcise lide de nombre
minimal de paramtres ncessaires pour dcrire les solutions.
Le thorme du rang a de nombreuses consquences immdiates.
Corollaire 13.43 Soit f : E F linaire. Alors
1. Si f est injective, on a dim(E) dim(F).
2. Si f est surjective, on a dim(E) dim(F).
3. Si f est un isomorphisme, on a dim(E) = dim(F).
Nous avions observ ces phnomnes un peu plus haut,
mais la dmonstration est maintenant plus directe :
Dmonstration. Si f est injective, alors dim(ker(f )) = 0 (proposition 13.39), do dim(E) = dim(=(f )) dim(F) puisque =(f )
est un sous-espace de F.
Si f est surjective, alors dim(=(f )) = dim(F) = dim(E)
dim(ker(f )) dim(E).
Le prochain rsultat met galement au clair quelque chose
que nous avions observ sur des exemples :
Corollaire 13.44 Soit f : E F linaire. Si deux des proprits
ci-dessous sont satisfaites, alors la troisime lest galement :
1. f est injective,
258

2. f est surjective,
3. dim(E) = dim(F).
Dmonstration. Dans le prcdent corollaire on a vu que (1) et
(2) entranent (3). Supposons que lon ait (1) et (3). Alors
dim(=(f )) = dim(E) dim(ker(f )) = dim(F) 0 = dim(F) ,
donc =(f ) = F et f est surjective. Si lon a (2) et (3), alors
dim(ker(f )) = dim(E) dim(=(f )) = dim(F) dim(F) = 0 ,
donc ker(f ) = {0} est f est injective.
Nous verrons de nombreuses applications dans les exercices.
Vieux rsultats, nouvelles dmonstrations
Le thorme du rang occupe une place centrale en algbre
linaire. tel point que dans certains livres sur le sujet, on
trouve une dmonstration de ce thorme trs tt dans lexposition, avec les autres rsultats prsents comme consquences.
Ce genre dapproche est plus concis mais plus difficile suivre
pour les dbutants. Il est probable quen deuxime anne, on
vous donne un rsum de lalgbre linaire de premire anne
qui soit de ce genre.
Pour se faire une ide, voici de nouvelles dmonstrations
de rsultats dj obtenus, qui font usage du thorme du rang.
Notez la concision des arguments en contrepartie de leur ct
abstrait. Il est naturel que ces dmonstrations soient plus difficiles suivre pour linstant.
Lemme 13.45 Soit A et B des matrices carres telles que AB = Id.
Alors on a galement BA = Id, et B = A1
Nous avions vu a en tant que lemme 5.23, et la dmonstration faisait appel la notion de matrice bien chelonne.

259

Dmonstration. Soit E = Mn (K), vu comme un espace vectoriel


de dimension finie, et soit
f : Mn (K)
M 7

Mn (K)
f (M) = BM .

On voit tout de suite que f est linaire. Montrons quelle est


injective. Si f (M) = 0, alors BM = 0 ; en multipliant par A
gauche, on obtient ABM = Id M = M = 0, donc ker(f ) = {0}.
Ainsi f est injective, et daprs le corollaire 13.44, elle est galement surjective (on a E = F ici). On conclut quil existe, en
particulier, une matrice C telle que f (C) = Id, soit BC = Id. En
multipliant encore par A gauche, on a C = A.
Voici maintenant le rsultat selon lequel le rang dune matrice est gal au rang de sa transpose (voir le thorme 11.47),
dans ce nouveau style. On obtient mme un peu plus quavant.
Quelques notations : on travaille avec des matrices m n, et on
crit

..

mn
,
Ir
=

.
.

0
cest--dire la matrice dont tous les coefficients sont nuls, sauf
les r premiers sur la diagonale, qui valent 1. Lorsque la taille
est vidente, on crit juste Ir .
Proposition 13.46 Soit A une matrice m n.
1. Si P Mn (K) est inversible, alors rang(AP) = rang(A).
2. Si Q Mm (K) est inversible, alors rang(QA) = rang(A).
3. rang(A) = r il existe P et Q telles que QAP = Ir .
4. rang(A) = rang(t A).
Nous avons vu tous ces rsultats, part le (3). La dmonstration va tre trs diffrente.
260

Dmonstration. La matrice A donne une application linaire


que lon va noter fA : Kn Km , dfinie par fA (v) = Av. De
mme on note fP et fQ pour les applications linaires correspodant P et Q.
Montrons le (1). Le rang de A est dim(=(fA )) = dim(fA (Kn )),
et de mme le rang de AP est dim(fA (fP (Kn ))). Puisque fP est
un isomorphisme, elle est surjective, et donc fP (Kn ) = Kn . Do
le (1).
Pour le (2), on note que le rang de QA est dim(fQ (fA (Kn ))).
Lapplication g : fA (Kn ) fQ (fA (Kn )) donne par g(v) = fQ (v)
est surjective par dfinition, et injective parce que fQ est ellemme injective (comme application dfinie sur Km tout entier).
Donc g est un isomorphisme et on en conclut que dim(fA (Kn )) =
dim(fQ (fA (Kn ))). Do le (2).
Pour le (3), si QAP = Ir alors rang(A) = rang(QAP) = rang(Ir )
daprs les points (1) et (2), et bien sr rang(Ir ) = r. Rciproquement, supposons que le rang de A est r. Comme dans la dmonstration du thorme du rang, prenons e1 , . . . , ek une base
de ker(fA ), que lon complte en une base de Kn avec des vecteurs 1 , . . . , r ; on a vu que lon obtient une base de =(fA ) en
prenant f1 , . . . , fr o fi = f (i ). Enfin, compltons f1 , . . . , fr en
une base de Km en ajoutant des vecteurs fr+1 , . . . , fm . Si B =
1 , . . . , r , e1 , . . . , ek et C = f1 , . . . , fm , alors par dfinition
B
C [fA ]

= Ir .

Mais alors C [fA ]B = QAP o Q et P sont des matrices de passages bien choisies (et en particulier inversibles). Ceci donne le
(3).
Le (4) est maintenant vident. En effet si A est de rang r,
do t Pt At Q = t Imn
= Irnm . Daprs le (3)
on a QAP = Imn
r
r
t
t
appliqu A, on en dduit que A est de rang r galement.

261

Chapitre 14

Intgrale de Riemann
Premire lecture
Introduction
Le problme de dpart que nous nous proposons de rsoudre dans ce chapitre est le suivant. tant donne une fonction f , existe-t-il une fonction F telle que
F0 = f

(*)

Lquation (*) est le premier exemple dquation diffrentielle


que nous rencontrons. Il sagit dune quation dans laquelle
linconnue est une fonction, ici F, et la condition sur F fait
intervenir sa drive. Nous verrons que rsoudre (*) est une
premire tape importante pour rsoudre des quations diffrentielles plus compliques. Notons quune solution de (*) est
appele une primitive de f .
Il est facile dtudier lunicit des solutions, sil y en a. En
effet, supposons que f soit dfinie sur un intervalle I, et que
nous cherchions F sur I. En prsence de deux primitives F et G,
on observe que (F G)0 = F0 G0 = f f = 0. La fonction F G
est alors constante : deux primitives dune mme fonction sur
un intervalle diffrent dune constante, cest--dire que G(x) =
F(x) + c pour x I.
262

Le point dlicat est de montrer que, sous certaines conditions, il existe au moins une primitive. On aimerait galement
pouvoir calculer explicitement les valeurs prises par F. Dans ce
chapitre nous allons dmontrer quune primitive existe lorsque
la fonction f est continue.
La stratgie est la suivante. Supposons que F0 = f , que
F(x0 ) = 0, et examinons la condition F0 (x0 ) = f (x0 ). Si lon
scarte un peu de x0 pour atteindre le point x0 + h avec h
petit , alors F(x0 +h) est proche de F(x0 )+F0 (x0 )h = f (x0 )h (on
remplace la fonction par son dveloppement limit lordre 1).
Lide est dinterprter la quantit F(x0 + h) ' f (x0 )h comme
laire du rectangle de hauteur f (x0 ) et de largeur h. De mme la
diffrence F(x0 +2h)F(x0 +h) devrait tre proche de F0 (x0 +h)h =
f (x0 + h)h, qui est laire du rectangle de hauteur f (x0 + h) et de
largeur h. Au total F(x0 +2h) = (F(x0 +2h)F(x0 +h))+F(x0 +h) est
proche de la somme des aires des deux rectangles considrs
sur le dessin ci-dessous.

De mme pour tout entier k, la valeur F(x0 + kh) est proche


de la somme des aires de k rectangles. Pour trouver une approximation de F(x1 ) pour x1 > x0 , on peut dcouper lintervalle [x0 , x1 ] en morceaux de largeur h, et calculer laire des
263

rectangles obtenus. Lorsque h devient de plus en plus petit, intuitivement, on obtient laire de la zone situe entre le graphe
de f et laxe des abscisses, et entre les droites verticales dquations x = x0 et x = x1 .

Cette analyse tant faite, pour dfinir la fonction F, il reste


dfinir rigoureusement ce quon entend par aire . Cest
ce que nous allons faire, et nous lappellerons lintgrale de f ,
entre deux bornes donnes (sur le dessin, x0 et x1 ). Nous pourrons alors poser F(x) = lintgrale de f entre x0 et x, et nous
montrerons (assez facilement) que ce procd donne bien une
primitive de f .
Nous obtenons au passage une application intressante, qui
est celle que vous avez tudie en Terminale : dans de nombreux cas, cest le calcul de laire qui nous intresse, alors que
lon peut trouver une primitive directement. La relation entre
aire et primitive est utile dans les deux sens.
Fonctions intgrables au sens de Riemann
On fixe un intervalle compact [a; b]. Les premires fonctions
pour lesquelles on peut dfinir facilement ce quest laire sous
la courbe sont les fonctions en escaliers :
264

Dfinition 14.1 Une fonction sur [a, b] est dite en escaliers


lorsquil existe des nombres a0 = a < a1 < a2 < < an = b tels
que est constante sur chaque intervalle ouvert ]ai , ai+1 [.
La famille a = (a0 , a1 , . . . , an ) est appele une subdivision
(adapte ).

Voici un exemple de fonction en escaliers.

Notez que la valeur de en ai peut tre quelconque, indpendamment des valeurs prises sur ]ai1 , ai [ et ]ai , ai+1 [. Sur
cet exemple on voit bien que la subdivision a = (a0 , a1 , a2 , a3 , a4 )
nest pas unique : en effet est en ralit constante sur ]a2 , a4 [,
et on aurait pu prendre la subdivision a0 = (a0 , a1 , a2 , a4 ).
On peut alors poser la dfinition suivante :
Dfinition 14.2 Soit en escaliers, et a = (a0 , . . . , an ) une subdivision adapte. Soit i la valeur de sur ]ai , ai+1 [. On pose :
I(, a) =

n1
X

(ai+1 ai )i .

i=0


Ce nombre est bien laire des rectangles dfinis par
(avec cependant la possibilit que i soit ngatif). Gomtriquement on sattend donc ce que I() ne dpende pas du
choix de la subdivision. Cest le cas :
265

Lemme 14.3 Le nombre I(, a) ne dpend que de et pas du choix


de la subdivision a.
On va donc pouvoir utiliser la notation I().
Dmonstration. tudions un premier cas simple : si a0 est obtenue partir de a en retirant un point ai , comme dans lexemple
ci-dessus, nous allons montrer que I(, a0 ) = I(, a). En effet, la
fonction est alors constante sur ]ai1 , ai+1 [ de sorte que dans
la somme dfinissant I(, a), on a deux termes que se simplifient :
(ai+1 ai )i + (ai ai1 )i1 = (ai+1 ai1 )i1 ,
puisque i1 = i . Lgalit I(, a0 ) = I(, a) est alors claire.
En rptant lopration, on constate que si a0 est obtenue
partir de a en retirant plusieurs points, alors on a I(, a0 ) =
I(, a) l encore.
Finalement, soient a et a0 deux subdivisions quelconques
(adaptes ). On dfinit une nouvelle subdivision a00 en prenant tous les points de a et de a0 , et en les rangeant dans lordre.
Alors a00 est obtenue partir de a en retirant les points de a0 ,
donc I(, a00 ) = I(, a) ; et a00 est obtenue partir de a0 en retirant les points de a, donc I(, a00 ) = I(, a0 ). Finalement I(, a) =
I(, a0 ).
Lorsque et sont deux fonctions (quelconques) sur [a; b]
telles que (x) (x) pour chaque x [a; b], on crira simplement . La proprit suivante est trs utile :
Lemme 14.4 Si et sont en escaliers, et si , alors I()
I().
Dmonstration. Soit a0 < a1 < . . . < an une subdivision telle que
, resp , est constante de valeur i , resp 0i , sur ]ai ; ai+1 [. Grce
au lemme prcdent, on peut utiliser cette subdivision (qui
nest pas forcment minimale) pour calculer les I. Par hypothse on a i 0i , donc
I() =

n1
X
i=0

(ai+1 ai )i

n1
X
(ai+1 ai )0i = I() ,
i=0

266

comme annonc.
Il est bon de noter quon ne change pas I() si on change la
fonction en un nombre fini de points. De mme, si (x) (x)
pour tous les x dans [a; b] sauf pour un nombre fini de valeurs
x = x1 , . . . , x = xk , alors on peut quand mme conclure que I()
I(). Dans ce qui suit, on va utiliser ce genre de simplifications
de manire implicite.
Nous arrivons la dfinition de lintgrale de Riemann. Soit
f une fonction quelconque, borne, sur [a; b]. On dfinit
I+ (f ) = inf {I() | en escalier telle que f }
et

I (f ) = sup {I() | en escalier telle que f } .

Daprs le lemme prcdent, la relation f donne I()


I(), et par suite I (f ) I+ (f ).
Dfinition 14.5 Lorsque I (f ) = I+ (f ), on dit que f est intgrable au sens de Riemann, et on note
Zb
f
a

la valeur de I (f ), que lon appelle intgrale de f sur [a; b]. On


note aussi parfois
Zb
f (t) dt .
a

Ici la variable t est muette, et peut tre remplace par nimporte


quelle lettre, souvent x ou y ou u...

Noter que la dfinition contient un sup, et un inf. Ceci est
possible car les sup et les inf existent dans R, comme nous
lavons vu. La thorie des intgrales atteste, nouveau, de limportance de cette proprit des nombres rels.
Lemme 14.6 Lorsque f est en escaliers, on a
Zb
f = I(f ) .
a

267

Dmonstration. On peut prendre = f , et f donne I (f )


I() = I(f ). De mme, en prenant = f on obtient I+ (f ) I(f ).
Ainsi, on a I (f ) I+ (f ), do I (f ) = I+ (f ) = I(f ).
Premiers exemples de fonctions intgrables
Notre premier objectif est de trouver dautres exemples de
fonctions intgrables, en dehors des fonctions en escaliers. La
dfinition ci-dessus est trs concise, et montre de manire explicite lutilisation de sup et de inf, mais pour montrer concrtement quune fonction donne est intgrable on va utiliser le
critre simple suivant.
Lemme 14.7 Soit f une fonction sur [a; b]. Alors f est intgrable
il existe deux suites (n )n0 et (n )n0 de fonctions en escaliers telles que n f n , et telles que
b

Z
lim

n+ a

Z
n

n = 0 .

On a alors
Z

Z
f = lim

n a

n = lim

n .

n a

Dmonstration. Commenons par =. De n f on tire I (f )


Rb
R
+ (f ) b . On tire

par
dfinition
;
de
mme
I
n
a
a n
+

0 I (f ) I (f )
a

Z
n

n .

En passant la limite sur n, on obtient bien I+ (f ) = I (f ), cest-dire que f est intgrable.


Maintenant regardons =. Soit n un entier 1. Comme
I (f ) n1 < I (f ), on sait par dfinition du sup (= le plus petit des majorants dun ensemble) quil existe une fonction en
escaliers n telle que n f et telle que I(n ) I (f ) n1 . De
la mme manire, il existe n en escaliers telle que n f et

268

telle que I(n ) I+ (f ) + n1 . Si f est intgrable on a I+ (f ) = I (f )


et donc
Zb
Zb
 


1
2
1
I (f )
=
0
n
n I+ (f ) +
n
n
n
a
a
(la premire ingalit provient du lemme 14.4). En passant la
limite, on obtient le rsultat.
Pour finir, de lingalit n f n , on tire
Z

par dfinition mme de lintgrale. En crivant ceci sous la


forme
Zb
Zb
Zb
Zb
0
f
n
n
n
a

et en faisant tendre n vers linfini, on obtient bien la formule


souhaite.
Par exemple on peut utiliser ce rsultat pour montrer :
Proposition 14.8 Soit f une fonction monotone sur [a; b]. Alors
f est intgrable.
Dmonstration. On va faire la preuve dans le cas o f est croissante. Le cas o elle est dcroissante est similaire.
Soit n un entier 1.
 On va dcouper [a; b] en n morceaux
en posant ai = a + i ba
n , pour 0 i n. On dfinit maintenant
deux fonctions en escaliers n , resp. n , qui sont constantes
sur chaque intervalle ]ai : ai+1 [ de valeur f (ai ), resp. f (ai+1 ).
Par croissance de f , on a n f n . Calculons maintenant
Rb
= I(n ) directement avec la formule dfinissant I : comme
a n
ai+1 ai = n1 , on obtient
Z

n1

n =

1X
f (ai ).
n
i=0

269

De mme
Z

On tire
Z

n1

n =

i=0

Z
n

1X
f (ai+1 ).
n

n =

f (b) f (a)
.
n

On fait ensuite tendre n vers linfini, et les conditions du lemme


14.7 sont runies. Donc f est intgrable.
Cette dmonstration est illustre sur le dessin suivant.

Exemple 14.9 Prenons f (t) = t sur [0, 1]. Elle est croissante,
donc intgrable, et on peut mme calculer son intgrale grce
au procd dcrit dans la dmonstration. En effet dans ce cas
on a n (t) = ni sur lintervalle ] ni , i+1
n [. Par suite
I(n ) =

n1
n1


X
i+1 i
i
1 X

i.
= 2
n
n
n
n
i=0

i=0

270

Or comme vous le savez on a


n1
X

i = 0 + 1 + 2 + 3 + + (n 1) =

i=0

Ceci donne
I(n ) =
et
Z

1 1

,
2 2n

t dt = lim I(n ) =
n

n(n 1)
.
2

1
.
2

Exemple 14.10 Prenons maintenant f (t) = et sur [0, 1]. L encore f est croissante donc intgrable, et cette fois on a (toujours
i
avec les notations de la dmonstration) n (t) = e n sur ] ni , i+1
n [.
Ici
n1
n1


X
i
i+1 i
1X i
I(n ) =

=
en
en .
n
n
n
i=0

i=0

1
n

Si on pose = e , on a
n1 
X

en

i

= 1 + + 2 + + n1 =

i=0

1 n 1 e
=
.
1
1
1 en

Utilisons le dveloppement limit eu = 1 + u + o(u). On en


1
tire e n = 1 + n1 + o( n1 ), do
I(n ) =

1
1e
1e
1
.
=
1
n n + o( n ) 1 + o(1)

En passant la limite, on obtient


Z1
et dt = e 1 .
0

On a donc dj un grand nombre dexemples de fonctions


qui sont intgrables, comme lexponentielle, le logarithme, etc.
Noter que lon ne suppose mme pas que f est continue dans
la proposition.
271

Pour ce qui est des autres fonctions usuelles , comme le


sinus et le cosinus par exemple, on peut remarquer que sur un
intervalle compact [a; b], mme si elles ne sont pas forcment
monotones, on peut dcouper [a; b] en un nombre fini de sousintervalles sur lesquels ces fonctions sont monotones. Les proprits lmentaires des intgrales, que nous allons voir tout
de suite, vont alors montrer que ces fonctions sont galement
intgrables.
Proprits lmentaires
Commenons par la relation de Chasles :
Proposition 14.11 Soit f une fonction sur [a; b], et soit x [a; b].
Alors f est intgrable sur [a; b] f est intgrable sur [a; x] et sur
[x; b].
De plus, on a la relation dite de Chasles :
Z

f =
a

f+
a

f.
x

Le schma de la dmonstration est retenir : on va le rutiliser constamment.


Dmonstration. On commence par traiter le cas o f est en escaliers. Alors f est intgrable partout, donc il y a seulement la
relation de Chasles montrer. En utilisant la formule pour I,
on saperoit que le rsultat est vident.
On passe au cas gnral. Montrons =. On suppose que f
est intgrable sur [a; b], et on prend n et n comme dans le
lemme 14.7. La relation n f n tant valable sur [a; b],
elle est aussi valable sur [a; x] et [x; b]. De plus, comme n et n
sont en escaliers et que lon a une relation de Chasles dans ce
cas, on a :
Zb
Zb
Zx
Zx ! Zb
Zb !
n
n =
n
n +
n
n .
a

Les termes entre parenthses sont 0 car n n et on a le


lemme 14.4.
272

En particulier on a
Zx
Zx
Zb
Zb
0
n
n
n
n
a

et en faisant tendre n vers +, on obtient


Zx
Zx
lim
n
n = 0.
n+ a

Donc le lemme 14.7 (dans le sens = !) nous dit que f est intgrable sur [a; x]. De mme entre x et b.
Montrons maintenant =. Notons f1 la restriction de f
[a; x]. On suppose f1 intgrable, donc on peut choisir des suites
n,1 et n,1 comme dans le lemme 14.7. De mme, on dfinit
f2 , n,2 et n,2 sur [x; b]. On recolle les morceaux, en dfinissant
n sur [a; b] par n (t) = n,1 (t) si t [a; x], et n (t) = n,2 (t) si
t ]x; b] ; de mme on dfinit n .
On veut utiliser encore le lemme 14.7 pour conclure. Vrifions les hypothses : n et n sont en escaliers ; on a bien
n f n , car on peut vrifier ceci sparment sur [a; x] et
sur [x; b] et on a suppos que n,i f n,i pour i = 1 ou 2 ; enfin, la relation de Chasles pour les fonctions en escaliers donne
encore :
Zx ! Zb
Zb !
Zb
Zb
Zx
n
n =
n
n +
n
n .
a

Le terme dans la premire parenthse est en fait


Zx
Zx
n,1
n,1
a

puisque par construction, n = n,1 sur [a; x] ; de mme le


terme dans la deuxime parenthse peut scrire avec n,2 et
n,2 . Donc les termes entre parenthses tendent vers 0 quand
n tend vers +, en on a finalement runi toutes les hypothses
du lemme 14.7, qui nous dit que f est intgrable sur [a; b].
De plus, on sait aussi que
Zb
Zb
Zx
Zx
Zx
f = lim
n , que
f =
f1 = lim
n,1
a

n+ a

273

n+ a

et que
Z

f =
x

f2 = lim

n+ x

n,2 .

En crivant la relation de Chasles pour n (qui est en escaliers)


et en passant la limite, on obtient la relation de Chasles pour
f quelconque.
Exemple 14.12 Supposons que f soit une fonctions sur [a; b],
et quil existe une subdivision a0 = a < a1 < < an = b telle
que f est monotone sur [ai : ai+1 ] (par exemple les fonctions sinus et cosinus ont cette proprit sur nimporte quel intervalle
compact). Alors daprs la proposition 14.8, f est intgrable sur
[ai : ai+1 ]. En utilisant la proposition 14.11 (plusieurs fois !), on
obtient que f est intgrable sur [a; b].
On a donc montr que toutes les fonctions dites usuelles
sont intgrables. Par contre nous navons encore rien dit sur la
faon de calculer les intgrales, bien sr.
Toutes les autres proprits lmentaires de lintgrale se
dmontrent de la mme manire. On a principalement :
Proposition 14.13 Proprits de lintgrale :
1. (Linarit) Si f et g sont intgrables, et si , R, alors
f + g est intgrable et on a :
Z

(f (t) + g(t)) dt =
a

f (t) dt +
a

g(t) dt .
a

En dautres termes, lensemble E des fonctions intgrables est


un espace vectoriel, et lintgrale est une application linaire
E R.
2. (Croissance) Si f et g sont intgrables, et si f g, alors
Z

f
a

g.
a

Esquisse. Le principe est le mme que pour la proposition prcdente : on vrifie les proprits pour les fonctions en escaliers dabord (par exemple le point 2 est donn dans ce cas par
274

le lemme 14.4), et on utilise le lemme 14.7 pour montrer par


passage la limite que les proprits sont en fait vrifies pour
des fonctions quelconques.
Sur le mme modle, nous allons conclure en tablissant
la trs utile ingalit triangulaire pour les intgrales. Nous
aurons besoin des dfinitions suivantes : si f est une fonction
quelconque, on pose
(
f (x) si f (x) 0
+
f (x) =
0
sinon,
(
f (x) si f (x) 0
f (x) =
0
sinon.
On vrifie que lon a f (x) = f + (x) f (x) et aussi |f (x)| = f + (x) +
f (x). Aussi, on note que si f g, alors f + g + et g f .
Proposition 14.14 Si f est intgrable sur [a; b], alors |f | est galement intgrable et on a lingalit dite triangulaire
Z
Z
b
b
f
|f | .


a
a
Dmonstration. On commence par montrer que f + est intgrable. Puisque f est intgrable, on peut trouver n et n
comme dans le lemme 14.7. Les fonctions +n et +n sont en escaliers, et on a +n f + +n . On vrifie (exercice) que +n +n
n n . Donc finalement
Zb
Zb
Zb
Zb
+
+
0
n
n
n
n .
a

(On a utilis la linarit de lintgrale.) En passant la limite,


on voit que lon peut appliquer le lemme 14.7 dans le sens =,
et on conclut que f + est intgrable.
De mme, on montre que f est intgrable. Donc |f | = f + +

f est intgrable, comme somme de fonctions intgrables.


Enfin, de f |f | on tire
Zb
Zb
f
|f |
a

275

par croissance de lintgrale. De mme de f |f | on tire


Zb
Zb

f
|f |.
a

On a bien prouv lingalit triangulaire.


Intgrales et fonctions continues
Nous allons maintenant montrer le rsultat thorique principal du chapitre, savoir lintgrabilit des fonctions continues.
Thorme 14.15 Soit f une fonction continue sur [a; b]. Alors f
est intgrable.
Dmonstration. On commence comme dans la proposition 14.8.
Soit n un entier  1. On va dcouper [a; b] en n morceaux en
posant ai = a + i ba
n , pour 0 i n. On dfinit maintenant
deux fonctions en escaliers n , resp. n , qui sont constantes
sur chaque intervalle ]ai : ai+1 [ de valeur i , resp i , avec
i = min{f (t) | t [ai ; ai+1 ]}
et
i = max{f (t) | t [ai ; ai+1 ]} .
(Ceci a un sens daprs le corollaire 8.4, qui garantit que i ,
+ par exemple.) Ainsi n f n .
Soit > 0. Comme f est uniformment continue (daprs
le thorme de Heine 8.11), il existe > 0 tel que, si x et y
sont dans [a; b] et vrifient |x y| < , alors f (x) f (y) < . Mais
pour n suffisamment grand, on a n1 < ; fixons un tel n. Comme
ai+1 ai = n1 , on voit que si x et y sont pris tous les deux dans
]ai ; ai+1 [, alors |f (x)f (y)| . On en conclut que i i pour
chaque i.
Rb
Si on calcule maintenant a (n n ) directement avec la
formule pour I, on obtient :
Z

(n n ) =

n1
X

(ai+1 ai )(i i ) + + + = .
n n
n
i=0

276

Rb
Ainsi, pour tout > 0, on a 0 a (n n ) ds que n est
suffisamment grand ; cest dire que
Zb
lim
(n n ) = 0 .
n+ a

Le lemme 14.7 nous dit alors que f est intgrable.


On saperoit a posteriori quon aurait pu considrer dautres
fonctions en escaliers dans cette dmonstration, et obtenir la
mme limite. Pour tre prcis, on a le rsultat suivant :
Proposition 14.16 Soit f une fonction
sur [a; b]. Pour
 continue

ba
chaque entier n 1, on pose ai = a + i n pour 0 i n, et on
choisit xi,n [ai ; ai+1 ]. Alors :
n1

ba X
lim
f (xi,n ) =
n+ n
i=0

f (t) dt .
a

Dmonstration. On reprend alors les notations de la dmonstration du thorme 14.15.


Soit alors n la fonction en escaliers, constante sur ]ai ; ai+1 [,
de valeur f (xi,n ). La formule pour I montre que I(n ) est bien
la somme dont on cherche la limite.
Par dfinition, on a alors n n n , et donc
I(n ) I(n ) I(n ).
Les termes de gauche et de droite de cette ingalit tendent vers
Rb
f comme on la observ, et donc le terme du milieu converge
a
vers la mme limite.
Les sommes de cette forme sont appeles sommes de Riemann . Comme on vient de le voir dans la dmonstration, elles
expriment lintgrale de certaines fonctions en escaliers qui
sapprochent de f , et la proposition affirme qu la limite on
obtient lintgrale de f . Il est clair quon aurait pu trouver des
fonctions en escaliers plus gnrales pour lesquelles le rsultat
est encore vrai (notamment avec des subdivisions de lintervalle [a, b] plus compliques) et cest parfois sous cette forme
277

que lon nonce un rsultat sur les sommes de Riemann dans


certains livres. Dune manire gnrale, lorsquon tudie certaines sommes, il faut garder en tte lide dutiliser des fonctions en escaliers et des intgrales.
En pratique ceci dit, mme la version ci-dessus est trop gnrale. Dans presque tous les cas que lon rencontre, le choix
est xi,n = ai ; et trs souvent, on a mme a = 0 et b = 1. Ainsi, il
est bon de mmoriser la formule suivante : lorsque f est continue sur [0, 1], on a
n1   Z 1
1X
i
f
=
f (t) dt .
n n
n
0

lim

i=0

Exemple 14.17 Soit


Sn =

n1
X
i=0

n
.
i 2 + n2

La suite (Sn )n1 a-t-elle une limite ? Si on pense utiliser une


somme de Riemann, il faut trouver une bonne fonction f . Commenons par faire apparatre le n1 , puis mettons la quantit ni
en vidence :
n1

Sn =

n1

1 X n2
1X 1
=
.
i2
n
i 2 + n2 n
i=0
i=0 1 + n2

On a donc bien envie dintroduire la fonction f dfinie sur [0, 1]


1
par f (t) = 1+t
2 , puisqualors :
Sn =

n1  
i
1X
f
.
n
n
i=0

Donc Sn est une somme de Riemann, et


Z1
Z1
dt
f (t) dt =
.
lim Sn =
n
1
+ t2
0
0
Reste calculer cette intgrale ! Nous allons maintenant voir
comment.
278

La fonction x 7

Rx
a

Il existe une hirarchie des fonctions sur [a; b] :


f drivable = f continue = f intgrable .
On a dj vu la premire implication ; la deuxime est le
contenu du thorme 14.15. On va maintenant montrer quen
intgrant une fonction, on remonte dans la hirarchie.
Soit donc f intgrable sur [a; b]. On note
Zx
F(x) =
f (t) dt .
a

Daprs la proposition 14.11, F est bien dfinie.


Proposition 14.18 Pour toute fonction f intgrable, la fonction F est continue.
Dmonstration. Soit donc x0 [a; b]. Daprs la relation de
Chasles, on a :
Zx
F(x) F(x0 ) =
f (t) dt .
x0

La fonction f est borne par hypothse : crivons |f (t)| M


pour t [a; b]. Utilisons maintenant lingalit triangulaire :
Zx
Zx
|F(x) F(x0 )|
|f (t)| dt
M dt = M(x x0 ) .
x0

x0

(On a suppos x x0 , le cas x x0 est similaire.) Ceci montre


que
lim F(x) F(x0 ) = 0,
xx0

cest--dire que F est continue en x0 .


Dans le mme genre, on a le rsultat annonc depuis lintroduction de ce chapitre :
Proposition 14.19 Si f est continue, F est drivable. De plus, on
a F0 = f .

279

Dmonstration. Soit x0 [a; b]. En utilisant la relation


Zx
f (x0 ) dt = f (x0 )(x x0 )
x0

et la relation de Chasles, on peut crire :


Zx
F(x) F(x0 )
1
f (x0 ) =
(f (t) f (x0 )) dt.
x x0
x x0 x0
Soit > 0. Comme f est continue en x0 , il existe > 0 tel que
|x x0 | < entrane |f (x) f (x0 )| < . Fixons un tel x, et pour
simplifier disons x > x0 . Si maintenant t [x0 ; x], on a aussi
|t x0 | < et donc |f (t) (f (x0 )| < . On en dduit :
Zx


F(x) F(x0 ) f (x ) 1
|f (t) f (x0 )| dt
0
x x0
x x0 x0
Zx
1

dt
x x0 x0

(x x0 )
= .
x x0

On a donc bien
lim

xx0

F(x) F(x0 )
f (x0 ) = 0 .
x x0

Donc F est drivable en x0 , et F0 (x0 ) = f (x0 ).


On a donc bien dmontr, comme annonc dans lintroduction, que toute fonction continue f admet une primitive, ici
note F. Notons que le point dlicat tait vraiment de montrer
que f est intgrable : le reste de la preuve ci-dessus nutilise
que des proprits lmentaires de lintgrale.
La proposition a une consquence que lon appelle, en toute
simplicit, le thorme fondamental de lanalyse :
Thorme 14.20 Si f est une fonction continument drivable
sur [a; b], alors
Zb
f 0 (t) dt = f (b) f (a) .
a

280

Dmonstration. Cest une reformulation de la proposition prcdente. Dire que f est continument drivable signifie que f 0
est continue, on peut donc appliquer la proposition 14.19 avec
f 0 a la place de f . On en dduit que lapplication dfinie par
Zx
g(x) =
f 0 (t) dt
a

f 0.

est drivable de drive


Donc g a la mme drive que f , et
ceci entrane f (x) = g(x) + c pour une constante c. En valuant
en a, on obtient f (a) = g(a) + c = c, do f (x) = g(x) + f (a). En
x = b, on obtient f (b) f (a) = g(b), ce quon voulait.
Exemple 14.21 Revenons lintgrale rencontre la fin de
lexemple 14.17 :
Z1
dt
=?
1
+ t2
0
Pour utiliser le thorme 14.20, il nous faut trouver une fonction f telle que
1
f 0 (t) =
.
1 + t2
Passant en revue les drives des fonctions que lon connat, on
constate que lon peut prendre
f (t) = arctan(t)
(et les autres primitives sur [0, 1] sont donc de la forme t 7
arctan(t) + c). Donc
Z1
dt

= arctan(1) arctan(0) = .
2
4
0 1+t
En particulier, grce lexemple 14.17, on a une formule pour
calculer :
n1
X
n
.
= lim 4
2
n
i + n2
i=0

La convergence est trs lente. Il faut attendre n = 119 pour


avoir 3 chiffres corrects (3, 149984. . . ) et pour n = 100000 on
obtient 3, 141602. . . , donc seulement 4 chiffres corrects.
281

Exemple 14.22 On peut retrouver les rsultats des exemples 14.9


et 14.10 trs facilement. En effet la fonction t 7 t admet pour
2
primitive t 7 2t , do
Z

"
t dt =

t2
2

#1
=
0

1
.
2

Ici on a utilis la notation avec les crochets qui vous est familire depuis la Terminale, savoir
[f (t)]ba = f (b) f (a) .
De mme on a
Z

h i1
et dt = et = e 1 .
0

On retrouve bien les mmes valeurs.


Exemple 14.23 La mthode des primitives pour calculer les
sommes est trs puissante ; cest prcisment pour cela que les
intgrales sont plus faciles calculer que les sommes. Voyons
une application. On considre la suite (Hn )n1 dfinie par
n

Hn = 1 +

1 1
1 X1
+ + + =
.
2 3
n
i
i=1

(On appelle parfois (Hn ) la srie harmonique , do la notation.) Nous allons montrer que Hn tend vers +. partir de la
dfinition, cest difficile.
Essayons donc dutiliser des intgrales. Nous navons pas
une somme de Riemann, mais nous pouvons malgr tout essayer dintroduire certaines fonctions en escaliers. En loccurence, considrons lintervalle [1, n] et la fonction en escaliers n qui vaut 1i sur lintervalle ]i, i + 1[. En comptant laire
des rectangles, on constate que
Zn
n = Hn .
1

282

Soit maintenant f (t) = 1t sur le mme intervalle. On a alors n


f , ce qui est une consquence du fait que f est dcroissante. Par
suite
Zn
Zn
n
f.
1

Mais grce la mthode des primitives, nous pouvons facilement calculer lintgrale de f : en effet le logarithme ln vrifie ln0 = f . Ainsi
Zn
dt
= ln(n) ln(1) = ln(n) .
1 t
Or nous savons que ln(n) + lorsque n +, donc lingalit Hn ln(n) que nous venons dobtenir garantit que Hn
+.
La formule du changement de variables
Une autre consquence plus ou moins immdiate de la proposition 14.19 est la formule du changement de variables
qui est trs pratique dans les calculs :
Proposition 14.24 Soit u une fonction continument drivable
sur [a; b], et supposons que limage de [a; b] par u soit lintervalle
[u(a); u(b)]. Soit f une fonction continue sur [u(a); u(b)]. Alors :
Z

f (u(t)) u 0 (t) dt =

u(b)

f (x) dx .
u(a)

Dmonstration. Pour X [u(a); u(b)], soit


ZX
F(X) =
f (x) dx
u(a)

et soit g(T) = F(u(T)) pour T [a; b]. Puisque f est continue, la


proposition 14.19 permet de calculer la drive de F, savoir
F0 = f ; et la formule pour la drive dune fonction compose
donne au total :
g 0 (T) = F0 (u(T)) u 0 (T) = f (u(T)) u0 (T) .
283

Dun autre ct, soit


T

f (u(t))u0 (t) dt

h(T) =
a

pour T [a; b]. Lexpression t f (u(t))u 0 (t) est bien continue,


donc la proposition 14.19 (encore) donne h0 (T) = f (u(T))u 0 (T).
Ainsi, les fonctions g et h ont la mme drive. Elles sont
toutes les deux nulles en T = a, donc elles sont finalement
gales. En crivant g(b) = h(b), on obtient la formule.
Pour retenir correctement la formule, nous suggrons un
petit abus de notation. Dans le membre de droite de la formule
du changement de variables, lcriture f (x) dx peut tre videmment remplace par f (y) dy ou f (z) dz. Si vous pensez que
lon peut utiliser nimporte quelle lettre, demandez-vous quand
mme ce que donnerait la formule avec la lettre f ou pire,
avec d. Nous proposons dutiliser la lettre u, et donc de mmoriser
Z
Z
b

u(b)

f (u(t)) u0 (t) dt =

f (u) du .
u(a)

strictement parler, cest un abus de notation, puisque la


lettre u dsigne dj une certaine fonction. Mais lintuition
derrire ce choix est assez correcte. Si on lit la formule de
la droite vers la gauche , on constate que en faisant varier u , donc en remplaant u par u(t), on doit remplacer du
par u 0 (t) dt, ce qui est cohrent avec la notation u0 (t) = du/ dt
utilise en Physique.
La plupart du temps, on utilise cependant la formule de la
gauche vers la droite . Dans ce sens, on retient que lexpression u(t), ventuellement trs complique, peut tre remplace
simplement par u pour peu que lon ait quelque part un u0 (t) dt,
qui va devenir du. Voici un exemple.
Exemple 14.25 Calculons
Z

dt
.
1 + et

284

On va poser u(t) = et , pour voir. Il nous faudrait un u 0 (t) dt


quelque part ; or u 0 (t) = et . On peut donc artificiellement crire
Z

1
0

dt
=
1 + et

1
0

et dt
=
t
e (1 + et )

1
0

u 0 (t) dt
=
u(t)(1 + u(t))

du
.
u(1 + u)

On va pouvoir finir ce calcul facilement. Avant de le faire, remarquons que si les choses se sont bien passes, cest surtout
parce que u0 (t) peut sexprimer facilement en termes de u(t). Cest
la grande qualit que lon cherche dans un changement de variables. Faites lexprience suivante : essayez le changement de
variables v(t) = 1/(1 + et ). Vous vous rendrez compte que pour
faire apparatre le v0 (t) dt, on est amen exprimer v0 (t) en
fonction de v(t). Cest faisable, mais moins facile que pour u ;
au total on finit avec la mme expression, mais aprs bien plus
defforts.
Terminons tout de mme. On crit
1
1
1
=
.
u(1 + u) u 1 + u
Vous vrifierez cette galit sans peine ; au chapitre suivant
nous verrons comment systmatiser ce genre dastuce. Maintenant il vient :
Ze
Ze
Ze
du
du
du
=

u(1
+
u)
u
1
+u
1
1
1
= [ln(u)]e1 [ln(1 + u)]e1
= 1 + ln(2) ln(1 + e) .

Deuxime lecture
Fonctions valeurs vectorielles
Dfinition 14.26 Soit f : [a, b] Rr une fonction, et crivons
f (t) = (f1 (t), . . . , fr (t)) .

285

On dit que f est Riemann-intgrable lorsque chaque fonction fk


est Riemann-intgrable (au sens dj dfini dans ce chapitre).
De plus, lintgrale de f est le vecteur
Z

f =
a

f1 ,

Z
f2 , . . . ,

!
fr .


Par exemple, si nous identifions comme dhabitude le plan C


des nombres complexes avec R2 , en voyant x + iy comme (x, y),
alors cette dfinition signifie que nous avons la convention
suivante : pour une fonction f : [a, b] C de la forme f (t) =
x(t) + iy(t), son intgrale est
Z

f (t) dt =
a

x(t) dt + i
a

y(t) dt .
a

Cest videmment la dfinition la plus naturelle.


Proposition 14.27 On a les proprits suivantes.
1. Si f et g sont intgrables, valeurs dans Rr , et si et sont
des constantes relles, alors f + g est intgrable et
Z

Z
(f (t) + g(t)) dt =

g(t) dt .

f (t) dt +
a

De plus, si v Rr est un vecteur (constant), et si f : [a, b]


R est intgrable, alors la fonction t 7 f (t) v est intgrable et
Z

f (t) v dt =
a

!
f (t) dt v .

2. La relation de Chasles est vrifie.


3. Si f : [a, b] Rr est continue, alors elle est intgrable.
4. Si f : [a, b] Rr est continument drivable, alors
Z

f 0 (t) dt = f (b) f (a) .

286

La dmonstration de cette proposition est laisse en exercice ; cest une consquence directe des dfinitions. Nous allons
nous contenter de la remarque suivante. Si e1 , . . . , er est une base
de Rr , alors pour chaque t on peut crire
f (t) = 1 (t)e1 + + r (t)er .
En utilisant les deux proprits nonces dans le (1) de la proposition, on en dduit, si f est intgrable, que
Z

f (t) dt =
a

1 (t)e1 dt + +

=
a

r (t)er dt

!
!
Zb
1 (t) dt e1 + +
r (t) dt er .
a

Si maintenant on prend pour e1 , . . . , er la base canonique, on


retrouve la dfinition mme de lintgrale de f ; en dautres
termes, pour que le (1) de la proposition soit vrai, la seule dfinition possible est celle que nous avons donne. Dans le mme
temps, nous observons que lintgrale se comporte comme
prvu dans toutes les bases, donc notre dfinition ne privilgie pas la base canonique.
Pour travailler avec les fonctions valeurs vectorielles, il
serait utile de montrer que lon peut se ramener aux fonctions
en escaliers, comme dans le cas des fonctions valeurs dans R.
La dfinition de fonction en escaliers ne change pas : il
sagit toujours dune fonction : [a, b] Rr qui est constante
sur ]ak , ak+1 [ pour une certaine subdivision ( ceci prs que la
valeur constante est bien sr un vecteur).
Il y a une difficult : crire f na pas de sens pour les
fonctions valeurs dans Rr . Pour cette raison, on a un rsultat
moins prcis que le lemme 14.7, mais qui va suffire.
Proposition 14.28 Soit f : [a, b] Rr une fonction intgrable.
Alors il existe une suite de fonctions en escaliers (n )n0 valeurs
dans Rr telle que
Z

b
a

Z
n (t) dt
n

287

f (t) dt .
a

(1)

Si de plus f est continue, alors on a


b

kf (t) n (t)k dt 0 ,
n

(2)

et enfin
Z

Z
kn (t)k dt
n

kf (t)k dt .

(3)

Remarquons que lhypothse f continue est uniquement


l pour nous simplifier la vie. En effet, pour que les relations
(2) et (3) aient un sens, il faut que la fonction t 7 kf (t)k soit
intgrable, et mme la fonction t 7 kf (t) + vk pour tout vecteur constant v (ainsi en utilisant la relation de Chasles on voit
que t 7 kf (t) n (t)k est galement intgrable). Ceci est automatique lorsque f est continue (cf (3) de la proposition). Dans
la dmonstration vous verrez bien que la continuit nest pas
utilise pour autre chose.
Dmonstration. Pour chaque indice k on applique le lemme 14.7
fk , et on trouve une suite (k,n ) de fonctions en escaliers telles
que k,n fk et
Z

Z
k,n (t) dt
n

fk (t) dt .

(*)

Posons n (t) = (1,n (t), . . . , r,n (t)). Alors n est en escaliers,


valeurs dans Rr . La relation (1) est alors une consquence immdiate des dfinitions.
Pour montrer (2), qui est plus difficile tablir, soit e1 , . . . , er
la base canonique de Rr . crivons
f (t) n (t) = (f1 (t) 1,n (t)) e1 + + (fr (t) r,n (t)) er .
Daprs lingalit triangulaire pour les vecteurs, on a
kf (t) n (t)k |f1 (t) 1,n (t)| ke1 k + + |fr (t) r,n (t)| ker k .
Puisque fk k,n et kek k = 1, on peut rcrire ceci
kf (t) n (t)k (f1 (t) 1,n (t)) + + (fr (t) r,n (t)) ,
288

do
Zb
a

Z
kf (t) n (t)k dt

Z
f1 (t) dt
Z

a
b

+
a

1,n (t) dt +
Z
fr (t) dt

r,n (t) dt .

Ainsi la relation (*) entrane bien la relation (2).


Pour la (3), on utilise tout simplement la deuxime ingalit triangulaire, celle qui affirme que | kak kbk | ka bk (cf
lemme 4.30). Ceci donne
Z
Z
b
b

| kf (t)k kn (t)k | dt
(kf (t)k kn (t)k) dt
a
a
Zb

kf (t) n (t)k dt .
a

(On a utilis aussi lingalit triangulaire pour les intgrales de


fonctions relles.) On constate que (3) est une consquence de
(2).
laide de la proposition 14.28, nous pouvons montrer lingalit triangulaire pour les fonctions valeurs dans Rr . Il ne
vous aura pas chapp quil nous a fallu plus defforts pour
lobtenir que dans le cas des fonctions relles.
Proposition 14.29 Soit f : [a, b] Rr continue. Alors
Z
Z
b
b

f (t) dt
kf (t)k dt .


a
a
Dmonstration. Supposons dabord que f est en escaliers. Son
intgrale est alors de la forme
X
(ak+1 ak )k ,
k

o f est constante de valeur k sur ]ak , ak+1 [. Lingalit triangulaire pour les vecteurs donne


X
X
(ak+1 ak )k
(ak+1 ak ) kk k .

k
k
289

Or le membre de droite nest autre que lintgrale de la fonction


en escaliers t 7 kf (t)k. Donc lingalit triangulaire est vraie
pour les intgrales de fonctions en escaliers.
Pour f continue, on prend une suite (n ) comme dans la
proposition 14.28. Pour chaque n on a
Z
Z
b
b

n (t) dt
kn (t)k dt ,


a
a
puisque n est en escaliers. Le membre de droite tend vers lintgrale de t 7 kf (t)k daprs le (3) de la proposition. Le membre
de gauche tend vers
Z

b

f (t) dt ,


a
daprs le (1) de la proposition et le lemme 4.32. En passant
la limite sur n, on a donc lingalit annonce.
Nous allons utiliser ceci pour montrer que le plus court
chemin entre deux points, cest la ligne droite .
Longueur dune courbe
Une courbe est tout simplement une application : [a, b]
Rr . On utilise surtout le mot courbe dans les cas r = 2
(courbes planaires) ou r = 3 (courbes dans lespace), mais leur
tude peut se faire en gnral.
Comment dfinir la longueur dune courbe ? Une ide naturelle est de chercher une approximation de la courbe par des
segments de droite, comme dans la figure ci-dessous.

290

Plus prcisment, on choisit une subdivision a0 = a < a1 <


< an = b de [a, b], et on considre le segment qui joint (ak )
(ak+1 ), pour 0 k < n. La longueur de ce segment est k(ak+1 )
(ak )k, donc une premire approximation de la longueur de
est
n1
X
`(, a) =
k(ak+1 ) (ak )k .
k=0

Si on insre un nouveau point dans la subdivision, disons si


on ajoute un point a00 entre a0 et a1 , alors on peut crire
k(a1 ) (a0 )k = k(a1 ) (a00 ) + (a00 ) (a0 )k
k(a1 ) (a00 )k + k(a00 ) (a0 )k ,
daprs lingalit triangulaire. Si on appelle a0 la nouvelle subdivision, on aura donc `(, a0 ) `(, a) : la longueur augmente
mesure que la subdivision devient plus fine.

Ceci motive la dfinition suivante.


Dfinition 14.30 La longueur de la courbe : [a, b] Rr est
`() = sup {`(, a) | a subdivision de [a, b]} .
On pose `() = + lorsque le sup nexiste pas dans R.

On dit parfois dune courbe telle que `() < + quelle est
rectifiable.
Le rsultat qui va rendre les choses calculables est le suivant :

291

Proposition 14.31 Soit : [a, b] Rr une courbe continument


drivable. Alors
Z
b

`() =

k0 (t)k dt .

Dmonstration. Soit a une subdivision. On crit


Z

ak+1 0

k(ak+1 ) (ak )k =
(t) dt
ak

Z ak+1

k0 (t)k dt ,

(*)

ak

en utilisant le thorme fondamental de lanalyse puis lingalit triangulaire. En faisant la somme sur tous les indices k, par
la relation de Chasles il vient
Zb
`(, a)
k0 (t)k dt ,
a

et donc
Z

`()

k0 (t)k dt .

Soit maintenant > 0. On va montrer quil existe une subdivision a telle que
Z

k0 (t)k dt (`, a) + ,

ce qui terminera la dmonstration. Pour cela, examinons un


cas simple dans lequel lingalit triangulaire est en fait une
galit : lorsque v est un vecteur constant, on a bien

Z
Zb

b
v dt = k(b a)vk = (b a) kvk =
kvk dt .


a
a
Prenons deux points ak et ak+1 dans [a, b], et appliquons cette
dernire remarque avec v = 0 (ak ). Intuitivement, lide est
la suivante : lorsque ak et ak+1 sont trs proches, la fonction
continue 0 ne varie pas beaucoup sur [ak , ak+1 ], donc elle est
292

presque constante, gale 0 (ak ) ; lingalit (*) ci-dessus est


alors presque une galit. Pour mettre en forme ceci, notons
Mk = sup { k0 (t) 0 (ak )k | t [ak , ak+1 ]} ,
et crivons :
Z ak+1
Z
0
k (t)k dt =
ak

ak+1

a
Z kak+1

k0 (ak ) + (0 (t) 0 (ak ))k dt


Z

ak+1

k (ak )k dt +
k0 (t) 0 (ak )k dt
ak
ak
Z
Z
ak+1
ak+1 0

=
(ak ) dt +
k0 (t) 0 (ak )k dt
ak

ak
Z

ak+1 0


(ak ) dt + Mk (ak+1 ak )
ak

Z

ak+1

 0

0
0
=
(t) + ( (ak ) (t)) dt + Mk (ak+1 ak )
ak

Z
Z
ak+1
ak+1



0 (t) dt +
k0 (ak ) 0 (t)k dt
ak

ak

+ Mk (ak+1 ak )
k(ak+1 ) (ak )k + 2Mk (ak+1 ak ) .
Puisque 0 est continue sur lintervalle compact [a, b], elle est
uniformment continue daprs le thorme de Heine. Ainsi, il
existe un > 0 tel que k0 (x) 0 (y)k < /2(ba) ds que |x y| < .
On peut alors choisir n un entier tel que ba
n < , et poser ak =
 
ba

a + k ba
,
de
sorte
que
|a

a
|
=
<

et donc Mk 2(ba)
.
k+1
k
n
n
Si on fait la somme des ingalits
Z ak+1

k0 (t)k dt k(ak+1 ) (ak )k +


n
ak
pour tous les indices k, on termine avec
Zb
k0 (t)k dt `(, a) + ,
a

comme annonc.
293

Corollaire 14.32 Soient p et q deux points dans Rr . Alors le


plus court chemin continument drivable entre p et q est la ligne
droite, dont la longueur est kq pk.
Dmonstration. Soit donc un chemin continument drivable
sur [a, b], tel que (a) = p et (b) = q. Comme on la dj observ
dans la dmonstration prcdente, on a
kq pk = k(b) (a)k
Z

b 0

=
(t) dt


Z

a
b

k0 (t)k dt

= `() .
Donc la longueur de la courbe est toujours suprieure ou
gale la distance euclidienne kq pk. Prenons maintenant la
ligne droite, disons : [0, 1] Rr dfinie par
(t) = (1 t) p + t q

(= p + t (q p)) .

(Cest bien un dplacement en ligne droite de p vers q.) La drive est 0 (t) = q p, un vecteur constant, donc
Z1
k0 (t)k dt = kq pk = `() .
0

Ainsi dans le cas de la ligne droite le minimum est atteint.


Exemple 14.33 (Circonfrence dun cercle) Considrons,
dans le plan complexe identifi R2 , le cercle de centre p et
de rayon R. On peut le parcourir avec la courbe : [0, 2] C
dfinie par
(t) = p + Reit ,
comme expliqu dans le chapitre Lexponentielle . Calculons
la longueur de cette courbe, qui est continument drivable. On
a 0 (t) = Rieit do k0 (t)k = R. Ainsi
Z 2
`() =
R dt = 2R .
0

294

La circonfrence dun cercle de rayon R est 2R, en particulier


a ne dpend pas du centre. videmment ctait la premire
dfinition historique du nombre .
Il peut vous paratre surprenant quune courbe soit dfinie
comme une fonction et pas un sous-ensemble de Rr , et que la
longueur dune courbe : [a, b] Rr ne soit pas dtermine
par limage ([a, b]). Par exemple, dans le cas du cercle, est-ce
que la longueur change si lon considre une courbe qui se
dplace sur le cercle une vitesse diffrente ? Et lorsque nous
parlions ci-dessus de la ligne droite entre p et q, est-ce que
lon aurait pu considrer une autre paramtrisation que t 7
(1 t) p + t q, et trouver une autre longueur ?
La premire rponse ces questions est que la longueur
dpend en effet en gnral de la fonction. Lexemple le plus
bte est celui de la courbe : [0, 4] R2 dfinie par (t) =
p + Reit : en effet cette courbe fait deux fois le tour du cercle
de centre p et de rayon R, et vous pouvez vrifier que sa longueur est 4R. Alors que limage ([0, 4]) est le cercle, qui
peut tre parcouru par une courbe de longueur 2R comme
on la vu. Ici les deux courbes sont trs diffrentes dans leur
comportement.
Cependant, voici un petit rsultat qui exprime lide que
des changements simples de paramtrisation ne vont pas changer la longueur.
Lemme 14.34 Soit 1 : [a, b] Rr une courbe continument drivable, et soit u : [c, d] [a, b] une bijection, galement suppose
continument drivable. Soit enfin 2 = 1 u, qui est encore une
courbe. Alors
`(1 ) = `(2 ) .
Dmonstration. La fonction u est monotone daprs la proposition 6.23, on va supposer quelle est croissante (le cas dcroissant est similaire), do u(c) = a, u(d) = b, et u0 (t) 0 pour
tout t [c, d].
On applique alors simplement le thorme du changement

295

de variables :
Z
`(2 ) =

=
c

=
c

=
a

k02 (t)k dt
k01 (u(t)) u0 (t)k dt
k01 (u(t))k u 0 (t) dt
k01 (u)k du

= `(1 ) .
Pour en revenir au cercle, la courbe 1 : [0, 2] R2 dfinie par 1 (t) = p + Reit et la courbe 2 : [0, 1] R2 dfinie
par 2 (t) = p + Re2i t sont lies comme ci-dessus, avec u(t) =
2t, donc elles ont la mme longueur (comme on le vrifie tout
de suite).
Dmonstration de Taylor-Young
Nous allons conclure ce chapitre avec la dmonstration du
thorme de Taylor-Young dans sa forme gnrale (dans le chapitre sur les formules de Taylor nous avions une petite hypothse restrictive). laide des intgrales, cest trs facile.
Lemme 14.35 Soit I un intervalle contenant 0 et f : I R une
fonction intgrable. On suppose que f (t) = o(tn ) pour un certain
entier n. Si on pose
Z
x

F(x) =

f (t) dt ,
0

pour x I, alors F(x) = o(xn+1 ).


Dmonstration. Par hypothse f (t) = tn h(t) avec h(t) 0, donc
si on se donne un > 0 il existe un > 0 tel que |h(t)| <

296

pour |t| < . Si on prend galement 0 < x < on a


Z x
Z x

f (t) dt
|f (t)| dt

0
Z0x

tn dt
0
" n+1 #x
xn+1
t
=
.
=
n+1 0
n+1
On traite de la mme faon le cas < x < 0, et finalement on
constate que si |x| < , alors


F(x) .
xn+1 n + 1
Cest donc que
F(x)
0
xn+1
lorsque x 0, comme on le souhaitait.
On peut alors montrer facilement
Thorme 14.36 (Taylor-Young) Soit f une fonction drivable
n fois sur un intervalle I contenant 0. Alors on peut crire
f (x) = f (0) + f 0 (0)x +

f (n) (0) n
f 00 (0) 2
x + +
x + o(xn ) .
2
n!

Dmonstration. Par rcurrence. Le cas n = 1 est donn par le


lemme 9.7. Supposons le thorme vrai pour n, et soit f drivable n+1 fois. Appliquons le rsultat au rang n la fonction f 0 ,
qui est drivable n fois :
f 0 (t) = f 0 (0) + (f 0 )0 (0)t + +

(f 0 )(n) (0) n1
t
+ o(tn1 ) .
(n 1)!

En intgrant ceci entre 0 et x, et en utilisant le lemme prcdent, on obtient la formule pour f au rang n.

297

Chapitre 15

Fractions rationnelles
Dans ce chapitre, la lettre K dsigne Q, R ou C.
Fractions rationnelles
Dfinition 15.1 Une fraction rationnelle F coefficients dans K
est un quotient de deux polynmes de K[X] :
F=

P
,
Q

avec Q , 0. Lensemble des fractions rationnelles est not K(X).



Les rgles de calcul usuelles sappliquent. Dans le jargon
de la dfinition 2.15, on dira que K(X) est un corps. Des informations supplmentaires sont apportes dans lencadr Les
corps de fractions .
Le nombre deg P deg Q est appel le degr de F, not deg F.
Il faut vrifier quil est bien dfini, puisque la paire (P, Q) nest
pas unique : en fait on a
P
P0
= 0
Q Q

298

PQ0 = P0 Q ,

Le lecteur ayant
assimil la
dfinition 2.15
peut prendre
pour K
nimporte quel
corps.

et ainsi deg P + deg Q0 = deg P0 + deg Q, do deg P deg Q =


deg P0 deg Q0 , comme souhait.
Notre objectif est de mettre les fractions rationnelles sous
une forme particulire, qui facilite le calcul des primitives
lorsque K = R. Tout part de lobservation suivante :
P
Lemme 15.2 Soit F = Q
une fraction rationnelle. Supposons que
lon ait une factorisation Q = AB avec pgcd(A, B) = 1. Alors il
existe des polynmes P1 et P2 tels que

F=

P1 P2
+ .
A B

Dmonstration. On utilise le thorme de Bzout (3.22), qui


nous donne lexistence de U et V tels que AU + BV = 1. Par

Les corps de fractions


La question dsormais classique revient : comment donner une dfinition complte des fractions rationnelles, suffisamment complte
pour quun ordinateur puisse faire
des calculs ?
Il se trouve que le procd est totalement identique, quasiment mot
pour mot, celui dcrit dans lencadr Une dfinition de Q dans
le chapitre Nombres ; ceci prs
quil faut remplacer Z par K[X].
En fait cette construction porte un
nom : on dit que Q est le corps
des fractions de lanneau Z, et
que K(X) est le corps des fractions de lanneau K[X]. Cest la raison pour laquelle avec Sage, on
construit Q(X) avec la commande
QQ[X].fraction_field()
Pour faire cette construction partir dun anneau A quelconque, il y
a une petite restriction technique :
il faut pouvoir simplifier dans A.

Plus prcisment, on dit quun anneau A est intgre lorsque lgalit


ab = 0 avec a, b A et a , 0, entrane
b = 0. Cest vrai pour A = Z et A =
K[X], mais pas pour A = Mn (K).
Vous pourrez montrer alors facilement, en copiant ce que lon a fait
pour Q, qu partir de nimporte quel
anneau A qui est commutatif et intgre, on peut contruire un corps,
not Fr(A) et appel le corps des
fractions de A.
Il y aura peu dexemples en premire
anne, hormis Z et K(X). On peut en
donner un tout
de mme en considrant A = Z[ 2], qui par dfinition
est lensemble
des nombres de la
forme a + b 2 avec a, b Z. Vous
montrerez que cet anneau est commutatif et intgre, et
que son corps
des fractions est Q[ 2], cest--dire
lensemble
des nombres de la forme

a + b 2 avec cette fois a, b Q.

299

suite

1
AU + BV U V
=
= + .
AB
AB
B A
En multipliant par P, il vient
F=

PV PU
P
=
+
,
AB
A
B

do le rsultat avec P1 = PV et P2 = PU.


On sait donc couper une fraction rationnelle en deux
lorsque son dnominateur se factorise en deux termes premiers
entre eux. loppos, on a une autre remarque calculatoire :
Lemme 15.3 Soient P et Q deux polynmes, soit un entier, et
soit
P
F=
.
Q
Alors il existe des polynmes Pj , pour 0 j , tels que
F = P0 +

P1 P2
P
+ 2 + + ,
Q Q
Q

et tels que deg Pj < deg Q pour j 1.


Attention, il ny a pas de condition sur le degr de P0 .
Dmonstration. Faisons une division euclidienne
P = AQ + R ,
avec deg R < deg Q. Alors
AQ + R
P
=
=
Q
Q

A
R
.
+
Q
Q1

On peut alors poser P = R et faire une rcurrence sur .


On en dduit le thorme principal de ce chapitre.

300

Thorme 15.4 (Dcomposition en lments simples) Soit F


K(X). crivons
P
P
F = = 1 2
,
Q Q1 Q2 Qn n
avec chaque Qi irreductible, et avec pgcd(Qi , Qj ) = 1 pour i , j.
Alors il existe des polynmes Pi,j pour 1 i n et 1 j i , et un
polynme P0 , tels que
F = P0 +

i
n X
X
Pi,j
j

i=1 j=1

Qi

avec deg Pi,j < deg Qi .


De plus, si deg P < deg Q, alors P0 = 0.
Cet nonc peut paratre compliqu, mais nous verrons
quil est facile mettre en pratique. Lessentiel est que chaque
terme
Pi,j
,
j
Qi
que lon appelle lment simple , possde une primitive assez facile calculer (lorsque K = R). On va donc tre capable
de calculer une primitive de nimporte quelle fraction rationnelle F.
Dmonstration. Cest la combinaison des deux lemmes prcdents. Le deuxime lemme traite le cas n = 1. Dans le cas gn
n1

ral, on pose A = Q1 1 Qn1


et B = Qn n , de sorte que pgcd(A, B) =
1. Le premier lemme donne alors
F=

P1 P2
+ ,
A B

et lon peut faire une rcurrence sur n.


Reste montrer le de plus . Notons une chose simple :
si F et G sont deux fractions rationnelles, on a
deg(F + G) max(deg F, deg G) .
Dans notre thorme, si deg F < 0, on en dduit que deg P0 < 0.
Or P0 est un polynme, donc ceci impose P0 = 0.
301

Avant de donner des exemples de calculs, donnons des versions de ce thorme spcialises R et C.
Corollaire 15.5 (lments simples sur C.) Soit
F=

P
(X x1

)1 (X x

n)

C(X) ,

o les nombres xi sont distincts. Alors on peut crire


F = P0 +

i
n X
X

i,j

i=1 j=1

(X xi )j

o P0 est un polynme et i,j C. De plus si deg F < 0 alors P0 = 0.


Exemple 15.6 Prenons
F=

X3 X
.
X2 + 1

Le premier rflexe est de faire une division euclidienne du numrateur par le dnominateur. Ici on a X3 X = X(X2 + 1) 2X,
de sorte que
2X
F = X 2
.
X +1
On va maintenant appliquer le thorme au dernier terme
droite. Puisque X2 + 1 = (X i)(X + i), on sait quil existe et
tels que

2X

=
+
.
X2 + 1 X i X + i
Le plus simple pour trouver les valeurs de et nest pas
de procder comme dans la dmonstration du thorme, mais
simplement didentifier les numrateurs :

( + )X + ( )i
2X

+
=
= 2
.
Xi X+i
X2 + 1
X +1
On a donc = 0 et + = 2, donc = = 1. Finalement
F = X

1
1

.
Xi X+i
302

Voici maintenant la version sur R, qui est celle qui nous


intresse le plus pour calculer des primitives.
Corollaire 15.7 (lments simples sur R.) Soit
F=

(X x1 )1 (X xn )n Q11 Qmm

R(X) ,

o les nombres xi sont distincts, chaque polynme Qi est de degr 2


sans racine relle, et pgcd(Qi , Qj ) = 1 si i , j. Alors on peut crire
F = P0 +

i
n X
X

i,j

i=1 j=1

(X xi )j

i
n X
X
i,j X + i,j
j

i=1 j=1

Qi

o P0 R[X], et i,j , i,j , i,j R. De plus si deg F < 0 alors P0 = 0.


Exemple 15.8 Si on reprend lexemple prcdent, cest--dire
F=

X3 X
,
X2 + 1

alors on a vu quaprs une simple division euclidienne on a


F = X

2X
.
X2 + 1

Sur R, on sarrte l : on ne peut pas factoriser plus le dnominateur X2 + 1, et lexpression obtenue est bien de la forme
annonce dans le corollaire. Notons dailleurs que lon a assez
travaill pour calculer une primitive, en effet
Z

#b
x2
2
ln(x + 1) .
F(x) dx =
2
a
"

Voyons un exemple beaucoup plus compliqu. Prenons


F=

1
X5 2X4 + 6X3 12X2 + 9X 18

Il faut dabord factoriser le dnominateur. Nous avons de la


chance, puisque 2 est une racine vidente . En faisant une division euclidienne, on obtient (X2)(X4 +6X2 +9). De plus X4 +
303

6X2 + 9 = (X2 + 3)2 , de sorte que


F=

1
.
(X 2)(X2 + 3)2

Le corollaire nous annonce donc que nous pouvons crire


F=

X + 1 2 X + 2

+ 12
+ 2
.
X2
X +3
(X + 3)2

(*)

Il est possible, bien que trs long, de mettre le membre de


droite au mme dnominateur. On obtient au numrateur
( + 1 ) X4 + (21 + 1 ) X3 + (6 + 31 21 + 2 ) X2
+ (61 + 31 22 + 2 ) X + 9 61 22 .

(**)

En crivant que ce numrateur doit valoir 1, on obtient alors


un systme 5 inconnues et 5 quations, dont on sait quil possde des solutions, et on peut les trouver par les techniques
habituelles. laide dun ordinateur, cest une mthode trs efficace.
Bien sr pour finir le calcul la main , on peut utiliser des
astuces. Voici une compilation des plus connues. Multiplions
lquation (*) par le polynme X 2 :
(X 2)F =

( X + 1 )(X 2) (2 X + 2 )(X 2)
1
+
= + 1
.
(X2 + 3)2
X2 + 3
(X2 + 3)2

On peut voir a comme une galit de fonctions, et on va regar1


der la valeur en X = 2 : il reste simplement = 49
. On a dj
trouv !
Maintenant multiplions (*) par (X2 + 3)2 ; nous obtenons
1
1 (X2 + 3)2
=
+ (1 X + 1 )(X2 + 3) + (2 X + 2 ) .
X 2 49 X 2

On value en X = i 3 (pour que X2 + 3 = 0), et il reste simplement

1
= 2 i 3 + 2 .

i 32
304

Pour trouver les parties relles et imaginaires du membre de


gauche on crit bien sr

1
2 i 3
=
,

7
i 32
do 2 = 27 et 2 = 71 .
Ensuite, on peut choisir dvaluer (*) en X = 0, parce que
cest relativement facile : on obtient

1
37
1
=
,
18 3 1 882

2
do 1 = 49
.
Regardons le numrateur (**) ci-dessus. Il commence par (+
1 )X4 , ce que lon peut vrifier de tte trs vite sans tout mettre
au mme dnominateur. On a donc + 1 = 0 do 1 = =
1
49
.
Finalement
!
1
1
X+2
7X + 2
.
F=

49 X 2 X2 + 3 (X2 + 3)2

Ce calcul tait relativement compliqu. Pourrait-on en confier


une partie un ordinateur ? La seule chose qui ntait pas purement mcanique dans le raisonnement ci-dessus tait. . . de
trouver que 2 tait une racine du dnominateur. Ceci tant,
un ordinateur peut (au pire) mettre les deux membres de (*)
au mme dnominateur et rsoudre un systme, et ce, en une
fraction de seconde. Retenons :
Proposition 15.9 Lorsque lon sait factoriser compltement le
dnominateur dune fraction rationnelle, trouver la dcomposition
en lments simples est une procdure automatisable, que lon peut
confier une machine.
Par contre, vous aurez peut-tre besoin de savoir dcomposer une fraction la main, pour les besoins dun concours ou
dun examen ! Dans labsolu, il est utile de savoir traiter les cas
trs simples, mais il est absurde de devenir expert.
305

Intgration des lments simples


Nous fixons dsormais K = R. La dcomposition en lments simples est cense nous aider calculer les primitives,
et pour mettre cela en oeuvre il fait savoir intgrer chacun des
termes apparaissant dans le corollaire 15.7.
Les plus simples sont bien sr
#q
"
Zq
(x x0 )+1
dx
=

+1
p (x x0 )
p
pour > 1 et
Z

dx
q
= [ ln |x x0 | ]p
x x0

(ne pas oublier la valeur absolue). Il nous reste donc traiter


Zq
x +
dx .
2

p (ax + bx + c)
Il y a toute une srie dtapes pour y arriver. Le premier
rflexe est de faire apparatre la drive du dnominateur au
numrateur . En effet on sait calculer
" 2
#q
Zq
(ax + bx + c)+1
2ax + b
dx
=
2

+1
p (ax + bx + c)
p
pour > 1 et
Z

h
iq
2ax + b
dx = ln |ax2 + bx + c| .
2
p
ax + bx + c

Donc on va se dbrouiller pour faire apparatre 2ax + b.


Exemple 15.10 la fin de lexemple 15.8 nous avions le terme
x+2
.
x2 + 3
On crit alors


x+2
1 2x
4
=
+
,
x2 + 3 2 x2 + 3 x2 + 3
306

de sorte que lon sait intgrer une partie au moins de lexpression :


Zq
Z
Zq
1 q 2x
x+2
1
dx
=
dx
+
2
dx
2
2
2
2 p x +3
p x +3
p x +3
Zq
h
iq
dx
2
= ln(x + 3) + 2
.
2+3
p
x
p
De la mme manire si nous avons intgrer lexpression
5x 3
,
x2 + x + 1
la premire chose faire est dcrire


5x 3
5 2x + 1
11
=

.
x2 + x + 1 2 x2 + x + 1
2(x2 + x + 1)
On a alors
Zq
iq 11 Z q
5x 3
5h
dx
2
dx =
ln(x + x + 1)
.
2
2
p
2
2 p x +x+1
p x +x+1
Retournons au cas gnral. Nous sommes ramens calculer les intgrales de la forme
Zq
dx
,
2 + bx + c)n
(ax
p
avec b2 4ac < 0 puisquon suppose que le dnominateur ne
sannule pas. On en connat une :
Zq
dx
q
= [ arctan(x) ]p .
2
p x +1
Nous allons voir que lon peut toujours se ramener ce cas-l
(ce qui explique la prsence abondante de la fonction arctangente dans toutes les questions de primitives). La prochaine
tape est de faire un changement de variables pour mettre le
dnominateur sous la forme u(x)2 + 1.
307

Exemple 15.11 Reprenons les exemples ci-dessus. On a


1
x2 + 3
avec u(x) =
Z

x .
3

1
2
3( x3

+ 1)

On a u0 (x) =

1
3(( x )2 + 1)
3
1
3

1
3(u(x)2 + 1)

et donc

Z q 1 dx
Zq 0
u (x) dx
dx
3
3
3
=
=
3 p u(x)2 + 1
3 p u(x)2 + 1
x2 + 3

Z q/ 3

3
3
du
q/ 3
.
=
=
arctan(u)
[
]

p/ 3
3 p/ 3 u 2 + 1
3

Plutt que de refaire ce changement de variables chaque


fois, on peut dcider de mmoriser quune primitive de x 7
1
est x 7 1a arctan( xa ) (tout dpend de la quantit de prix2 +a2

mitives que lon souhaite garder en tte). Pour a = 3 onretrouve le rsultat ci-dessus videmment (noter que 1 = 33 ).
3
Cependant, il est parfois prfrable de refaire le changement
de variables, notamment lorsque le dnominateur est lev
une puissance (voir plus bas).
Essayons maintenant x2 +x+1 au dnominateur. La prsence
du terme de degr 1 nous force une tape prliminaire :
1
1
3
x2 + x + 1 = (x + )2 + 1 = t(x)2 +
2
4
4
avec t(x) = x + 12 . On peut faire un premier changement de variables :
Zq
Zq 0
Z q+ 1
2
t (x) dx
dx
dt
=
=
.
2 +x+1
2+ 3
2+ 3
1
x
t(x)
t
p
p
p+ 2
4
4
Ou bien on change encore de variables, ou bien on utilise la
primitive que lon connait, pour en arriver :
Z

q+ 12

p+ 12

"
#q+ 12
dt
2
2t
=
arctan(
)
.

t2 + 34
3
3 p+ 21
308

En utilisant ce genre de changements de variables, on en


arrive finalement toujours calculer une intgrale de la forme
Zq
dx
In =
.
2 + 1)n
(x
p
Nous savons faire pour n = 1, et la dernire chose que nous
devons apprendre est le calcul de In pour tout entier n.
Cest le moment dutiliser la technique, que vous avez vue
au Lyce, de lintgration par parties. Le principe est trs simple :
de la formule
(f g)0 = f 0 g + f g 0 ,
on tire f 0 g = (f g)0 f g 0 et donc
Zq
Zq
q
0
f (x)g(x) dx = [f (x)g(x)]p
f (x)g 0 (x) dx .
p

(Cette formule est valable ds que f et g sont continument drivables.)


Exemple 15.12 Pour trouver une primitive de x 7 ln(x), on
peut faire une intgration par parties avec f (x) = 1 et g(x) =
ln(x), do
Zq
Zq
q
ln(x) dx = [ x ln(x) ]p
dx
p

p
q
= [x ln(x) x]p

Une primitive est donc x 7 x ln(x) x.


Pour en revenir au calcul de In , on a la formule de rcurrence suivante.
Lemme 15.13 Pour n 1 on a
"
#q
2n 1
1
x
In+1 =
I +
.
2n n 2n (x2 + 1)n p
Plutt que dapprendre cette relation par coeur, il vaut
mieux retenir que la dmonstration, que voici, sappuie sur
une intgration par parties.
309

Dmonstration. On prend f (x) = 1 et g(x) =


"
In =

x
(x2 + 1)n

#q

+ 2n
p

1
,
(x2 +1)n

do

x2 dx
.
(x2 + 1)n

En crivant x2 = x2 + 1 1, on constate que la dernire intgrale


droite est In In+1 . On en tire le rsultat en arrangeant les
termes.
Exemple 15.14 Pour calculer
Zq
p

dx
(x2 + 3)2

on commence par poser u(x) = x comme dans lexemple pr3


cdent, de sorte que
Z q0
Zq
du
3
dx
=
2 + 3)2
2 + 1)2
3
(x
(u
0
p
p
avec p0 =
Z

q0

p0

et q0 =

q
.
3

On fait une intgration par parties :

"
#q0
Z q0 2
du
u
u +11
=
+4
2
2
2
2
2
2
(u + 1)
(u + 1) p0
p0 (u + 1)
"
#q 0
Z q0
u
du
=
+
4
arctan(u)
,

4
2 + 1)2
(u2 + 1)2
(u
0
0
p
p

do
Z

q0

p0

Finalement
Zq
p

"
#q0
du
1
u
=
+
4
arctan(u)
.
(u 2 + 1)2 5 (u 2 + 1)2
p0

"
#q/ 3
dx
3
u
=
+ 4 arctan(u) .
(x2 + 3)2 15 (u 2 + 1)2
p/ 3

Ces calculs sont difficiles. Cependant, nous pouvons nouveau remarquer que rien nempche un ordinateur de les faire
pour nous : toutes les tapes sont parfaitement mcaniques.
310

Proposition 15.15 Lorsque lon sait factoriser compltement le


dnominateur dune fraction rationnelle, trouver une primitive est
une procdure automatisable, que lon peut confier une machine.
L encore, renseignez-vous pour savoir si lon attend de
vous, loccasion dun concours ou dun examen, que vous
sachiez calculer ces primitives la main . Cest trs probable ! En tout cas il est souhaitable de savoir traiter quelques
exemples.
Fractions rationnelles trigonomtriques
Nous allons apprendre calculer des intgrales dun certain
type prcis, savoir de la forme
Zq
F(cos(), sin()) d .
p

Ici on suppose que lon a une fonction (x, y) 7 F(x, y), deux
variables, dfinie au moins au point (x, y) = (cos(), sin())
pour p q. Lensemble de ces points est un arc de cercle,
et en faisant un peu de gomtrie nous allons trouver un changement de variables judicieux. En particulier, lintgrale cidessus va se ramener une intgrale de fraction rationnelle
lorsque F(x, y) est une expression utilisant seulement des oprations arithmtiques (addition, soustraction, multiplication et
division), disons par exemple
F(cos(), sin()) =

3 cos()2 sin() 1
.
sin()3 + cos()

On dit parfois alors que F(cos(), sin()) est une fraction rationnelle trigonomtrique .
Pour les impatients, il est trs simple de rsumer la mthode : utiliser le changement de variables t() = tan( 2 ). Vous
pouvez de suite aller voir lexemple 15.17 ci-dessous, en prenant connaissance des quations (**) au passage. Mais il est
instructif de prendre le temps de comprendre pourquoi cette
astuce fonctionne.

311

Considrons le dessin ci-dessous. On indentifie le plan R2


avec C, et sur le dessin on a plac le point z0 = 1 ainsi quun
point z = x + iy = cos() + i sin() sur le cercle unit.

Lide trs simple est la suivante : au lieu de reprer le


point z laide de langle quil fait avec lhorizontale depuis
lorigine, on peut utiliser langle , entre lhorizontale et la
droite passant par z0 et z. Remarquons que le triangle reprsent sur le dessin est isocle, donc possde deux angles gaux,
et 2 + = ; mais + = donc = 2 .
On peut retrouver ceci par le calcul. crivons z = x+iy, alors
le vecteur u = z z0 est simplement u = z + 1 = x + 1 + iy. Par
dfinition de , on a aussi u = rei = r cos() + ri sin() pour un
y
certain r > 0, donc tan() = x+1 . Puisque z est de module 1, on
peut galement crire x = cos() et y = sin(), de sorte que
tan() =

2 cos( 2 ) sin( 2 ) sin( 2 )


sin()

=
=
= tan( ) .

2
cos() + 1
2
2 cos( 2 ) 1
cos( 2 )

On retrouve bien = 2 , si lon prend dans lintervalle ], [


et dans ] 2 , 2 [.
Nous venons dutiliser quelques formules de trigonomtrie
bien connues. Cest en faisant un petit effort de calcul supplmentaire que lon va comprendre lintrt dutiliser au lieu
312

de . Posons t = tan( 2 ) =
1 + t2 =

y
x+1 ,

et calculons

y 2 + x2 + 2x + 1
2
=
,
2
x
+
1
(x + 1)

puisque x2 + y 2 = 1. On en tire
x+1 =

2
,
1 + t2

(*)

do

1 t2
2t
et y = sin() =
.
(**)
1 + t2
1 + t2
(La deuxime en multipliant (*) par t, puisque y = t(x + 1).) Ces
relations sont trs intressantes, puisquelles nous poussent
utiliser en ralit t, et non pas lui-mme, pour reprer le
point z sur le cercle : lavantage est alors que les coordonnes x
et y de z sont des fractions rationnelles en t. Par contraste,
lorsque lon exprime x et y en fonction de , on fait appel aux
fonctions cosinus et sinus, qui sont bien plus compliques (la
diffrence va devenir trs claire dans le calcul des primitives,
ci-dessous).
Pour rsumer, nous avons montr la chose suivante.
x = cos() =

Proposition 15.16 Soit z = x + iy un nombre complexe ; on suppose z , 1. Alors z est de module 1 si et seulement sil existe un
nombre rel t tel que
x=

1 t2
1 + t2

et

y=

2t
.
1 + t2

Dans ce cas, on a

y
,
x+1
donc en particulier t est uniquement dtermin par z.
t=

Ce rsultat nest pas seulement intressant pour les primitives (voir lencadr Triplets pythagoriciens ). Mais pour
linstant, faisons donc le lien avec le calcul des intgrales, dont
313

nous nous sommes carts temporairement. Rappelons que


nous cherchons calculer
Zq
F(cos(), sin()) d .
p

La petite tude gomtrique ci-dessus nous pousse introduire

Triplets pythagoriciens
La proposition 15.16 tablit une bijection entre lensemble R dune
part, et lensemble des points sur
le cercle unit (sauf (1, 0)) dautre
part. Cette bijection tant donne
par la formule explicite
1 t2 2t
,
),
1 + t2 1 + t2
on constate quelle possde la proprit remarquable dtablir galement une bijection entre Q et lensemble des points (x, y) sur le cercle
tels que x Q et y Q (et (x, y) ,
(1, 0)).
Voici une application clbre. Un
triplet pythagoricien est donn par
trois nombres entiers (a, b, c) tels
que a2 + b2 = c2 . Grce au thorme
de Pythagore, on peut interprter un
tel triplet comme donnant les longueurs (entires !) dun triangle rectangle. Par exemple (3, 4, 5) est un
triplet pythagoricien.
Connaissant un triplet (a, b, c), on
peut en fabriquer une infinit en
multipliant par un mme nombre
n, cest--dire en considrant
(na, nb, nc), mais les triangles correspondants ont le mme aspect.
Peut-on construire une infinit de
triplets pythagoriciens, y compris
en considrant comme identiques
deux triplets proportionnels ?
Sans parler dinfinit, peut-on dj
t 7 (

en construire beaucoup ? Combien


pouvez-vous en citer ?
On commence par associer tout
triplet (a, b, c) la paire (x, y) avec x =
a et y = b . On a alors x2 + y 2 =
c
c
1, cest--dire que (x, y) est sur le
cercle unit, et x Q, y Q. Vous
montrerez titre dexercice que si
un autre triplet (a0 , b0 , c0 ) donne la
paire (x0 , y 0 ), alors (x0 , y 0 ) = (x, y) si et
seulement si (a0 , b0 , c0 ) et (a, b, c) sont
proprotionnels. De plus, partir de
(x, y) on peut retrouver au moins un
triplet (a, b, c) correspondant en multipliant par le produit des dnominateurs de x et y (ou leur ppcm).
Or daprs ce qui prcde, se donner la paire (x, y) revient se donner
un nombre t Q ; de plus les conditions x > 0 et y > 0 (qui simposent
nous lorsque lon prend a, b et c positifs) sont quivalentes 0 < t < 1.
Nous avons donc une bijection entre
les triplets pythagoriciens proportionnalit prs et les nombres
rationnels entre 0 et 1 ! Il y en a donc
bien une infinit.
Pour t = 1/2 , on trouve x = 3/5 et
y = 4/5 do le triplet pythagoricien (3, 4, 5) que nous connaissions
dj. Pour t = 1/3 on tombe sur
(4, 3, 5) qui nest pas vraiment diffrent. Par contre pour t = 1/4 on obtient (15, 8, 17) et pour t = 1/5 on dcouvre le triplet (12, 5, 13).

314

le nombre t, qui a lair de donner des formules simples. Plus


prcisment, posons

t() = tan( ) .
2
Est-ce un bon changement de variables ? Tout dabord, daprs
(**) nous avons
!
1 t()2 2t()
,
.
F(cos(), sin()) = F
1 + t()2 1 + t()2
Quant la drive t0 (), nous sommes chanceux car elle vaut
1

1
(1 + tan( )2 ) = (1 + t()2 ) .
2
2
2

t0 () =

On peut donc toujours crire


! 0
Zq
Zq
t ()
1 t()2 2t()
,
d
F(cos(), sin()) d = 2
F
2 1 + t()2 1 + t()2
1
+
t()
p
p
!
Z t(q)
1 t2 2t
dt
=2
F
,
.
2 1 + t2 1 + t2
1
+
t
t(p)
Lorsque F est une fraction rationnelle trigonomtrique, lexpression que nous avons intgrer est une fraction rationnelle
en t. Nous savons donc comment en trouver une primitive.
Exemple 15.17 Essayons de calculer
Z
I=
0

cos() d
.
cos() + sin()

Nous avons bien une expression en cos() et sin(). Comme


nous lavons dit, la seule chose retenir est que poser t() =
tan( 2 ) est une bonne ide. crivons t pour t(), et remplaons cos() par

1t2
,
1+t2

puis sin() par

2t
.
1t2

Il vient

1
(1 t2 )(1 + t2 )
cos()
1 t2
= 2
= 1 2
.
cos() + sin() t + 2t + 1 2 (t2 + 2t + 1)(1 + t2 )

315

La deuxime manoeuvre est l pour faire apparatre 12 (1 + t2 ) =


t0 (). On a donc
Z

I=2
0

(1 t2 ) dt
(t2 + 2t + 1)(1 + t2 )

le t0 () d devenant dt. Nous avons donc une fraction rationnelle en t.


2
Le facteur t +2t +1 au dnominateur sannule pour t = 1
2, ce qui permet de factoriser. La dcomposition en lments
simples scrit alors
1 t2

1
1
=

(t 1 2)(t 1 + 2)(1 + t2 ) 4(t 1 2) 4(t 1 + 2)


t1
.

2(1 + t2 )

Do la primitive

1
1
1
1
ln |t 1 2| + ln |t 1 + 2| ln(1 + t2 ) + arctan(t) .
4
4
4
2

Cette expression vaut 0 pour t = 0 (noter que ln( 2 1)+

2
ln( 2 + 1) = ln( 2 1) = ln(1) = 0), et elle vaut 8 pour t = 1.
Finalement I = 4 .

316

Chapitre 16

Diagonalisation
Le lecteur ayant
assimil la

Dans ce chapitre, la lettre K dsigne Q, R ou C.

dfinition 2.15
peut prendre
pour K
nimporte quel
corps.

Premire lecture
Motivation
Dans ce chapitre, les concepts dalgbre linaire des chapitres prcdents vont tre mis en application. Nous allons dcrire la technique gnrale de la diagonalisation, qui sera utilise dans ce livre dans le cadre de problmes trs concrets :
lors de ltude de certaines quations diffrentielles dune part
(dcrite dans le chapitre suivant), et dautre part pour analyser certaines suites rcurrentes. Voyons ce dernier point tout
de suite.
Imaginons une suite de vecteurs (Xn )n0 , avec Xn Rd , dfinie par rcurrence de la manire suivante : on se donne X0 ,
on fixe une matrice A de dimension d d, et on pose
Xn+1 = AXn .

(*)

Pour tre trs concret, nous allons prendre un exemple clbre.


Commenons par la suite de Fibonacci (un )n0 , qui est la suite
de rels dfinie par u0 = u1 = 1 et un+2 = un+1 + un . On peut
317

alors poser pour tout n 0 :


un
un+1

Xn =

!
R2 .

On a alors
Xn+1 =

un+1
un+2

!
=

un+1
un+1 + un

0
1

1
1

un
un+1

!
= AXn ,

o A est la matrice 22 ci-dessus. On est donc bien en prsence


dune suite de la forme (*). Nous allons voir que lon sait bien
mieux tudier (Xn ) que (un ). En fait en passant par (Xn ), nous
allons trouver une expression directe pour un en fonction de n,
ce qui nest a priori pas vident du tout.
Commenons par quelques calculs :
X1 = AX0 ,

X2 = AX1 = A2 X0 ,

X3 = AX2 = A3 X0 ,

et par rcurrence on obtient immdiatement Xn = An X0 . Nous


devons donc calculer les puissances successives de la matrice A.
Par le calcul direct, cest difficile (essayez quelques valeurs de n
pour tenter de deviner la formule).
Soit alors maintenant

!
1 5
1+ 5
2
2
P=
.
1
1
Do sort cette matrice ? Tout le but de ce chapitre, justement,
et dexpliquer do provient P, et comment la trouver par vousmme. Pour linstant, supposons donc que lon ait envie dessayer cette matrice, et de calculer P1 AP. On trouve

P1 =

5
5

55

5
10

105

puis

P AP =
1

1+ 5
2

0
318

+ 12
,

+ 12
0

1 5
2

Voil qui nous arrange bien. En effet, la matrice P1 AP est diagonale, cest--dire que seuls les coefficients sur sa diagonale
sont non-nuls ; on peut donc calculer les puissances de cette
matrice sans effort :

 n

1+ 5
0
2

1
n


n
(P AP) =
.

1 5
0
2

Bien sr ce que nous cherchons, ce sont les puissances de A.


Mais y bien regarder on a :
(P1 AP)2 = P1 APP1 AP = P1 A2 P ,
et de mme
(P1 AP)3 = P1 AP(P1 AP)2 = P1 APP1 A2 P = P1 A3 P .
Par rcurrence on obtient pour tout n :
(P1 AP)n = P1 An P .
Ainsi la matrice que lon cherche est tout simplement

 n

1+ 5
0

 n P1 .
An = P(P1 AP)n P1 = P
1 5

0
2

Il ny a plus qu multiplier ces trois matrices. Pour le faire sans


douleur, introduisons

1 5
1+ 5
,
2 =
,
1 =
2
2
de sorte que
P=

2 1
1
1

!
et

1
P1 =
5

1
1
1 2

!
.

En tenant compte de la relation 1 2 = 1, on obtient finalement


!
n1
n1
n1 n2
1
1 2
An =
.
n+1
n1 n2
n+1
5
1 2
319

Rcoltons le fruit de nos efforts, et retournons la suite de Fibonacci. Nous avions


!
!
un
n
n 1
= Xn = A X0 = A
.
un+1
1
Sur la premire ligne de cette galit de matrices-colonnes, on
a la relation

1 
n1
n
n
un = n1
1 2 + 1 2 ,
5
ce qui est donc une formule donnant le n-ime nombre de Fibonnaci. Il est remarquable que ce soit un nombre entier, de
ce point de vue. Noter quen utilisant les relations 1 + 1 = 21
et 1 + 2 = 22 , on peut mme simplifier cette expression en

1 
n+1
un = n+1
.
1 2
5
Le calcul ci-dessus a t rendu possible par larrive dramatique de la matrice P, ayant la proprit que P1 AP est diagonale. Trouver P, tant donne la matrice A, est ce quon appelle
diagonaliser A. Dans ce chapitre nous allons voir comment procder (lorsque cest possible). Nous aurons besoin dutiliser les
concepts despace vectoriel, dapplication linaire, mais aussi
de dterminant, dvelopps dans les chapitres prcdents. En
un sens, nous voyons une mise en oeuvre de toute cette thorie.
Matrices conjugues
Nous allons commencer par donner des noms aux phnomnes observs dans lexemple prcdent. Ce chapitre introduit beaucoup de vocabulaire !
Dfinition 16.1 Deux matrices carres A et B coefficients
dans K sont dites conjugues, ou semblables, sil existe une matrice inversible P coefficients dans K telle que B = P1 AP (ou
ce qui revient au mme, A = PBP1 ).
On dit quune matrice A est diagonalisable lorsquil existe
une matrice diagonale D telle que A et D sont conjugues. 
320

Pouvez-vous
utiliser cette
expression
pour un afin de
calculer la limite
u
de un+1 ?
n

Exemple 16.2 Nous avons vu ci-dessus que la matrice


!
0 1
A=
1 1
et la matrice

D =

1+ 5
2

0
1 5
2

sont conjugues : en effet D = P1 AP avec


P=

1+ 5
2

1 5
2

!
.

En particulier, la matrice A est diagonalisable.


En prsence de deux matrices A et B, il est difficile de savoir si elles sont conjugues, et dans ce chapitre nous allons
apprendre quelques techniques. Voici dj un premier critre
simple.
Lemme 16.3 Si A et B sont conjugues, alors det(A) = det(B).
Dmonstration. En effet, si B = P1 AP, alors
det(B) = det(P)1 det(A) det(P) = det(A) .
Exemple 16.4 Dans lexemple prcdent, on a bien det(A) =
det(D) = 1. Par contre les matrices
!
!
2 3
1 1
A=
et
B=
4 5
1 1
ne sont pas conjugues, puisque det(A) = 2 et det(B) = 0.
Aprs le dterminant, voici la trace :
Dfinition 16.5 Soit A = (aij ) une matrice carre. La trace
de A, note Tr(A), est la somme des coefficients sur la diagonale de A.


321

Exemple 16.6 En reprenant les notations de lexemple 16.2,


on a Tr(A) = 0 + 1 = 1. Pour D, on obtient

1+ 5 1 5
Tr(D) =
+
= 1.
2
2
On obtient le mme rsultat, et ce nest pas un hasard.
Lemme 16.7 La trace possde les proprits suivantes :
1. Si M et N sont carres, alors Tr(MN) = Tr(NM).
2. Si A et B sont conjugues, alors Tr(A) = Tr(B).
Dmonstration. Pour le (1), on fait un calcul direct. Si M =
(mij )i,j et N = (nk` )k,` , on trouve en fait
X
mik nki = Tr(NM) .
Tr(MN) =
i,k

Pour le (2), supposons que B = P1 AP, et posons M = P1 ,


puis N = AP. Alors
Tr(B) = Tr(MN) = Tr(NM) = Tr(APP1 ) = Tr(A) .
Exemple 16.8 Nous allons pouvoir donner des exemples de
matrices qui ne sont pas diagonalisables. Commenons par
!
1 1
A=
.
0 1
Supposons que A soit diagonalisable, donc quil existe une matrice inversible P telle que
!
1
0
1
P AP =
= D.
0 2
On doit alors avoir det(A) = 1 = det(D) = 1 2 , et Tr(A) = 2 =
Tr(D) = 1 + 2 . Nous connaissons donc la somme et le produit
de 1 et 2 , et il est alors facile de trouver ces nombres : lastuce
habituelle est de regarder le polynme
(X 1 )(X 2 ) = X2 (1 + 2 )X + 1 2 = X2 2X + 1 = (X 1)2 .
322

On en dduit que 1 = 2 = 1. Mais alors, la matrice D nest


autre que la matrice identit ! Par suite
A = P1 DP = P1 Id P = P1 P = Id ,
ce qui est absurde puisque A , Id. Cette contradiction montre
que P ne peut pas exister, cest--dire que A nest pas diagonalisable.
Voyons maintenant la matrice
!
0 1
A=
.
1
0
Celle-ci est-elle diagonalisable ? De nouveau, supposons quil
existe P telle que P1 AP = D, avec D ayant les coefficients 1
et 2 sur la diagonale, comme ci-dessus. Cette fois-ci, on doit
avoir 1 2 = det(A) = 1 et 1 + 2 = Tr(A) = 0. Ceci donne
(X 1 )(X 2 ) = X2 + 1 .
Les nombres 1 et 2 , qui sont des lments de K, doivent donc
tre les racines du polynme X2 + 1. Si K = R, nous avons dj
une contradiction, puisque les racines sont i et i, qui ne sont
pas dans R : on dit que A nest pas diagonalisable sur R .
Mais on peut considrer A comme une matrice de M2 (C),
coefficients complexes, et rechercher P galement coefficients
complexes. Dans ce cas on peut prendre
!
!
1 1
i 0
1
P=
, et alors P AP =
.
i i
0 i
Donc A est diagonalisable sur C. L encore, nous allons expliquer dans la suite du chapitre comment trouver cette matrice P, que nous avons sortie de nulle part.
Interprtation laide des applications linaires
La proposition que voici donne des exemples de matrices
conjugues, et en un sens elle les donne mme tous.

323

Proposition 16.9 Soit E un espace vectoriel de dimension finie,


et soit f : E E une application linaire. Soient A et B deux bases
de E. Les matrices de f dans ces bases respectives sont notes
A = A [f ]A

et

B = B [f ]B .

Alors A et B sont conjugues, et plus prcisment on a mme B =


P1 AP o P est la matrice de passage
P = A PB .
Rciproquement, si C est une matrice de la mme taille que A, telle
que A et C sont conjugues, alors il existe une base C de E telle que
C = C [f ]C .
Dmonstration. Cest la formule du changement de base (proposition 13.30), qui affirme prcisment que
B [f ]

= B PAA [f ]AA PB .

Rappelons que si P = A PB , alors P1 = B PA .


Pour la rciproque, soit P telle que C = P1 AP. Soient e1 ,
e2 , . . . , en les vecteurs de E dont les coordonnes dans la base A
sont les colonnes de la matrice P. Puisque P est inversible,
ses colonnes forment une base de Kn (corollaire 11.21), donc
la famille C = e1 , . . . , en est une base de E (proposition 11.29).
Daprs la formule du changement de base on a
C [f ]

= C PAA [f ]AA PC = P1 AP = C.

Conclusion : deux matrices sont conjugues exactement


lorsquelles reprsentent la mme application linaire dans
deux bases diffrentes. De nouveau, les techniques matricielles
et le concept dapplication linaire vont senrichir mutuellement.
Pour diagonaliser, il va tre trs utile de rflchir en termes
dapplication linaires. En effet :

324

Proposition 16.10 Soit A Mn (K), et soit f : Kn Kn lapplication linaire dfinie par A, cest--dire f (v) = Av. Alors A est
diagonalisable il existe une base e1 , e2 , . . ., en de Kn avec la
proprit que f (ei ) = i ei pour un certain scalaire i K.
Lorsque cest le cas, soit P la matrice dont les colonnes sont les
vecteurs ei ; on a alors

1 0 0
0 0

P1 AP =
(*)
.. .
..
0
.
0
.

0
0 n
Dmonstration. Soit C la base canonique de Kn , de sorte que A =
C
C [f ] . Supposons que la base B = e1 , . . ., en existe avec la proprit ci-dessus, alors par dfinition mme de la matrice dune
application linaire, on a

1 0 0
0 0

B
=
(**)
[f
]

.. .
B
..
0
.
0
.

0
0 n
Mais daprs la formule du changement de base, on a B [f ]B =
P1 AP avec P = C [f ]B . Donc (*) est vrifie, et A est diagonalisable.
Rciproquement, si (*) est vrifie, on procde lenvers :
on appelle e1 , . . ., en les colonnes de P, qui forment une base B
puisque P est inversible ; la formule du changement de variable
nous dit que (**) est vrifie ; et par dfinition mme cela signifie que f (ei ) = i ei .
De nouveau, ces choses portent des noms classiques :
Dfinition 16.11 Soit f : E E une application linaire. Un
vecteur propre de f est un vecteur v , 0 tel que f (v) = v pour
un certain scalaire K. On dit que v et sont associs.
Lorsque K est associ au moins un vecteur propre, on
dit que cest une valeur propre de f .
325

Enfin, la valeur propre tant fixe, lensemble des v E


tels que f (v) = v est appel lespace propre associ . Nous le
noterons E .

Notez bien la condition v , 0, qui est essentielle ; elle garantit que v dtermine , puisque v = v entrane bien = ,
lorsque v , 0.
Exemple 16.12 Prenons deux vecteurs e1 , e2 R2 qui forment
une base, et posons U = Vect(e1 ), puis V = Vect(e2 ), de sorte
que R2 = U V. Soit maintenant s la symtrie par rapport U,
dans la direction V.
Par dfinition, on a s(e1 ) = e1 , donc e1 est un vecteur propre
de s associ la valeur propre 1. De mme s(e2 ) = 1, donc e2
est un vecteur propre de s associ la valeur propre 1. Enfin,
en crivant B = e1 , e2 , on a
!
1
0
B
,
B [s] =
0 1
et cette matrice est diagonale. Par suite, la matrice de s dans
nimporte quelle base est de la forme
!
0
1 1
P
P,
0 1
cest--dire quelle est diagonalisable.
Nous pouvons compltement terminer les calculs prsents
dans lintroduction de ce chapitre :
Exemple 16.13 Retournons la matrice
!
0 1
A=
1 1
de lintroduction (et de lexemple 16.2). Pour trouver (seuls !)
une matrice P telle que
!
1
0
P1 AP =
,
0 2
326

on utilise dabord la mme astuce que dans lexemple 16.8 : on


doit avoir 1 + 2 = Tr(A) = 1 et 1 2 = det(A) = 1. Donc
(X 1 )(X 2 ) = X2 (1 + 2 )X + 1 2 = X2 X 1 .
Ainsi, 1 et 2 sont les racines du polynme X2 X 1 ; supposons quon les ait numrotes de la faon suivante :

1+ 5
1 5
1 =
,
2 =
.
2
2

On comprend dj mieux do provenaient ces 5 !


Maintenant, soit f lapplication f (v) = Av, comme dans
la proposition 16.10. Cherchons les vecteurs propres associs
1 : cest un calcul de systme linaire. En effet, lquation f (v) = 1 v scrit
!
!
!
!
0 1
x
x
x
= 1
,
en posant v =
.
1 1
y
y
y
Ceci donne le systme
(
1 x +
x +

y
(1 1 )y

=
=

0
0

et en faisant L2 L2 + 1 L2 on obtient 0 = 0 sur la deuxime


1
ligne. Lensemble des solutions est donc dcrit par la seule
quation 1 x + y = 0, on peut prendre y comme paramtre, et
on constate que lon a un espace vectoriel de dimension 1, avec
comme base par exemple (en prenant y = 1) le vecteur
!
!
1
2
1
e1 =
=
.
1
1
En procdant de la mme manire pour 2 , on montre que lespace propre associ, cest--dire lensemble des vecteurs tels
que f (v) = 2 v, est un espace de dimension 1 avec pour base
le vecteur
!
1
e2 =
.
1
327

Il se trouve que e1 , e2 est une base de R2 , comme on le voit


tout de suite. Si alors P est la matrice dont les colonnes sont e1
et e2 , la proposition 16.10 nous dit que P1 AP est la matrice
diagonale annonce. Voici comment on tait venu bout de la
suite de Fibonacci.
Le polynme caractristique
Nous savons dsormais diagonaliser les matrices 2 2, du
moins lorsque cest possible, en procdant comme nous lavons
fait dans lexemple 16.13. Ce qui semble nous empcher de
faire de mme avec des matrices quelconques, cest que lon
ne sait pas a priori quelles sont les valeurs propres potentielles, alors que pour les 2 2 on exploite lastuce de calcul (X 1 )(X 2 ) = X2 Tr(A)X + det(A). Il se trouve quil
existe un polynme jouant le mme rle pour les matrices de
nimporte quelle taille.
Proposition 16.14 Soit A Mn (K), et f lapplication f (v) = Av.
Alors est valeur propre de f det(A Id) = 0.
Lexpression det(A Id) est un polynme en , que lon
appelle le polynme caractristique de A (ou de f ). On le note A ,
ou f .
Dmonstration. Cette dmonstration est facile en soi, mais il
est intressant de noter la quantit de rsultats non-triviaux
des chapitres prcdents qui entrent en jeu.
Pour K, notons f Id lapplication dfinie par (f
Id)(v) = f (v)v. Alors par dfinition est une valeur propre
de f il existe v , 0 tel que (f Id)(v) = 0 ker(f Id) ,
{0}.
Daprs la proposition 13.39, cette condition quivaut dire
que f Id nest pas injective. Daprs le thorme du rang (ou
plus prcisment le corollaire 13.44), ceci quivaut encore
dire que f Id nest pas bijective.
Daprs la proposition 13.34, ceci revient affirmer que la
matrice de f Id dans la base canonique nest pas inversible.
Or cette matrice est A Id, et finalement la proposition 7.5
affirme que cette condition se ramne det(A Id) = 0.
328

Exemple 16.15 Prenons une matrice 2 2 :


!
a b
A=
.
c d
Le polynme caractristique est alors
!
!!
a b
0
A = det(A Id) = det

c d
0


a
b
= 2 (a + d) + (ad bc) ,
=
c
d
ce qui donne dans ce cas particulier
A = 2 Tr(A) + det(A) .
On retrouve donc le polynme de degr 2 qui tait apparu dans
nos calculs avec les matrices 2 2.
Exemple 16.16 Prenons maintenant

2
1
6

A = 6 1 2

0
0
3

Le polynme caractristique est donn par :





2
1
6
6


A = 6 1 2 = (3 )
6


0
0
3

2
1

= (3 )(2 5 + 6) = ( 3)2 ( 2) .
Les valeurs propres sont donc 2 et 3, et on dit que 3 a une multiplicit de 2 puisque le polynme caractristique a (3)2 en
facteur.
Examinons les vecteurs propres. Pour trouver ceux associs la valeur propre 2, on rsoud comme dhabitude le systme Av = 2v. Faites le calcul, vous trouverez un espace de dimension 1, avec pour base par exemple

e1 = 2 .

0
329

Pour la valeur propre 3, on rsoud Av = 3v. Lensemble des


solutions est de dimension 2, avec pour base par exemple

2
1
1
1
e2 =
et e3 =
.

0
1
(Vrifiez ceci.)
Il se trouve que e1 , e2 , e3 est une base de R3 . Nous avons
donc une base de vecteurs propres, ce qui signifie que A est
diagonalisable. Plus prcisment, si P est la matrice dont les
colonnes sont e1 , e2 , e3 , on sait sans calcul supplmentaire que

2 0 0

A = P1 0 3 0 P .

0 0 3
Donnons quelques prorits gnrales du polynmes caractristique.
Proposition 16.17 Soient A et B des matrices de Mn (K).
1. Si A et B sont conjugues, alors A = B .
2. Si A est diagonalisable, alors son polynme caractristique A
est scind sur K.
Rappelons quun polynme en est dit scind si cest un
produit de facteurs de degr 1, cest--dire sil est de la forme
c( 1 )( 2 ) ( n ) .
Dmonstration. Si B = P1 AP alors
P1 (A Id)P = P1 AP P1 P = A Id ,
donc B Id et A Id sont conjugues. Elles ont donc le mme
dterminant, ce qui donne le (1).
Pour le (2), on utilise le (1) dans le cas o B est diagonale.
On a alors


0

0

1


0
2
0
= (1 ) (n ) .
A = B =
.
.
..
..


0
0


0
0
n
330

Donc A est bien scind dans ce cas.


Compter les vecteurs propres
Nous avons essentiellement dcrit toutes les tapes ncessaires pour diagonaliser une matrice. Mais on peut faire une
remarque supplmentaire qui va nous simplifier la tche.
Aprs avoir trouv des vecteurs propres pour les diverses
valeurs propres, nous devons vrifier si lon peut trouver une
base complte, forme de ces vecteurs propres. Il sensuit un
travail de vrification, pour savoir si certaines familles sont
libres. Vous aurez peut-tre remarqu que dans les exemples
jusqu prsent, on navait jamais de mauvaise surprise : ce nest
pas un hasard, comme nous allons le montrer.
Commenons par
Lemme 16.18 Soit f : E E une application linaire, et soit e1 ,
. . . , en une famille de vecteurs propres de f . On suppose que ei est
associ i , et que les nombres 1 , . . . , n sont distincts.
Alors la famille e1 , . . . , en est libre.
Dmonstration. Par rcurrence sur n, le rsultat tant vident
pour n = 1 (un vecteur propre est non-nul par dfinition).
Supposons donc que lon ait n + 1 vecteurs propres, et une
combinaison linaire nulle, disons
1 e1 + + n+1 en+1 = 0 .

(*)

Appliquons f aux deux membres de (*) ; en utilisant f (ei ) =


i ei , il vient
1 1 e1 + + n+1 n+1 en+1 = 0 .

(**)

Multiplions (*) par n+1 , et retranchons le rsultat (**) ; il


vient
(1 n+1 )1 e1 + (n n+1 )n en = 0 .
Par rcurrence, tous les coefficients de cette combinaison linaire sont nuls, donc (i n+1 )i = 0 pour 1 i n. Comme
i n+1 , 0 par hypothse, on en tire i = 0 pour ces valeurs
de i. Ensuite il est clair que n+1 = 0 galement, et la famille est
donc libre.
331

Du coup, lentreprise de diagonalisation sen trouve simplifie : en deux mots, lorsque lon runit des bases des diffrents
espaces propres, on obtient une famille qui est automatiquement libre. Si elle comporte suffisamment de vecteurs, et seulement dans ce cas, on a russi diagonaliser. Plus prcisment :
Proposition 16.19 Soit A Mn (K), et soit f lapplication linaire associe. Soient 1 , 2 , . . . , m les racines distinctes du polynme caractristique de A.
Pour chaque i , soit ni la dimension de lespace propre associ ker(f i Id), et soit
ei1 , ei2 , . . . , eini
une base de cet espace.
Alors A est diagonalisable si et seulement si
m
X

ni = n .

i=1

Lorsque cest le cas, la famille comprenant tous les vecteurs eij est
une base de Kn , forme de vecteurs propres de f .
Dmonstration. Montrons que la famille forme de tous les eij
est libre. Si on a une combinaison linaire nulle de la forme
X
i,j eij = 0 ,
i,j

alors on pose ei = j i,j eij . On a f (ei ) = i ei (puisque chaque eij


est un vecteur propre associ i ). De plus on a e1 +e2 + +em =
0.
Cette relation donnerait une contradiction au lemme prcdent, moins que tous les vecteurs ei soient nuls (et ne
sont donc pas des vecteurs propres). On a donc ei = 0 et donc
chaque i,j = 0 puisque la famille ei1 , ei2 , . . . , eini est libre.
Comme annonc,
la famille formePde tous les eij est libre.
P
Elle comporte i ni lements, donc si i ni = n = dim Kn , cest
une base. Dans ce cas, on est en prsence dune base forme de
vecteurs propres, donc A est diagonalisable.
332

P
Pour finir, supposons que i ni < n. Un vecteur propre v
de f doit appartenir un ker(f i Id) pour un certain i, donc
en particulier
v Vect(eij ). Mais lespace Vect(eij ) est de dimenP
sion i ni < n, et il ne peut pas contenir une base de Kn . Donc
il nexiste pas de base de Kn forme de vecteurs propres de f ,
et A nest pas diagonalisable.
En particulier, on a le rsultat suivant, tonnament simple :
Corollaire 16.20 Soit A Mn (K). Si le polynme caractristique de A possde n racines distinctes dans K, alors A est diagonalisable.
Dmonstration. Soient 1 , . . . , n les valeurs propres (distinctes).
Chaque espace ker(f i Id) est , {0},P
par dfinition, donc il est
de dimension 1. Ainsi, la somme i ni du corollaire prcdent est n ; mais bien sr cette somme est aussi n puisque
lon a vu que cest le nombre de vecteurs dans une certaine
famille libre. P
Finalement i ni = n, donc A est diagonalisable (et de plus
chaque ni = 1).
Lorsque lon souhaite montrer quune matrice est diagonalisable, mais que lon na pas besoin de trouver expressment
les vecteurs propres, ce corollaire est videmment idal. Nous
verrons une application dans le chapitre sur les quations diffrentielles.
Avant de donner des exemples dutilisation de ces derniers
rsultats, nous allons rsumer la mthode dveloppe dans ce
chapitre.
Rsum
Soit A Mn (K), soit f : Kn Kn lapplication linaire dfinie par f (v) = Av. Pour tenter de diagonaliser A, on suit les
tapes suivantes.
1. On calcule le polynme caractristique A = det(A Id),
et on trouve ses racines 1 , . . . , m dans K.
 Si A nest pas scind, alors A nest pas diagonalisable,
et on sarrte.
333

 Si A est scind, on passe ltape suivante. Si les valeurs propres sont distinctes, on sait dj que A est diagonalisable.
2. Pour chaque i , on calcule une base de ker(f i Id). On
en dduit sa dimension ni .
P
 Si i ni < n, la matrice A nest pas diagonalisable, et on
sarrte.
P
 Si i ni = n, la matrice est diagonalisable, et on passe
ltape suivante.
3. Soit ei1 , ei2 , . . . , eini une base de ker(f i Id). Alors la
runion de tous ces vecteurs est une base de Kn . Soit P la
matrice dont les colonnes sont, dans lordre :
e11 , . . . , e1n1 , . . . , em1 , . . . , emnm .
Alors sans calcul supplmentaire on sait que

P1 AP =

1
..
.
0
0
..
.
0
..
.

..
.
0
0

0
1
0

0
0
2

0
0
0

0
0

0
0

0
0

0
0
0
..
.

0
..
.

0
2
..
.


. .
.

droite on a une matrice diagonale, o 1 apparat n1


fois, puis 2 apparat n2 fois, etc.
Exemple 16.21 Prenons

A = 2

1 3

3 2 .

1 1

Le calcul du polynme caractristique donne


A = 3 + 52 + 2 24 .

334

Selon la faon de calculer le dterminant, ce polynme peut


vous apparatre factoris, ce qui est videmment une bonne
chose pour calculer les racines. En rgle gnrale, les oprations sur les lignes ou les colonnes, plutt que les dveloppements, on tendance produire des polynmes factoriss.
Mais admettons que nous ayons obtenu le polynme sous
la forme ci-dessus. Il faut trouver une racine vidente . Dans
cette situation, il est souvent utile de revenir la matrice : nestil pas clair que si on ajoute 2 sur la diagonale de A, alors la
premire colonne devient gale la troisime ? Donc det(A +
2 Id) = 0, ce qui signifie que 2 est valeur propre, et A (2) = 0.
On termine ensuite facilement la factorisation :
A = ( + 2)(2 7 + 12) = ( + 2)( 4)( 3) .
Les valeurs propres sont 2, 4 et 3. On a trois valeurs
propres distinctes, donc on sait que la matrice est diagonalisable. (Ceci conclut ltape 1).
Avant de poursuivre les calculs, dressons la liste de ce que
nous pouvons dj prvoir. Nous allons trouver des vecteurs e1 ,
e2 et e3 , vecteurs propres associs 2, 4 et 3 respectivement ;
ces vecteurs vont former une base de R3 , automatiquement.
Soit P la matrice dont les colonnes sont e1 , e2 , e3 . Alors

2 0 0

P1 AP = 0 4 0 .

0 0 3
Ce sont les conclusions de ltape 3. Si les valeurs propres
navaient pas t distinctes, on naurait pas pu prvoir le rsultat de ltape 2.
Cette tape 2 reste faire, de toute faon. Pour la valeur
propre 2 par exemple, on cherche ker(f + 2 Id) ce qui revient
rsoudre

3x
y + 3z = 0

2x
+
5y
+ 2z = 0

3x +
y + 3z = 0
En quelques tapes on constate que ce systme quivaut aux
quations y = 0 et x + z = 0. En prenant z = 1 par exemple, on
335

obtient

e1 = 0 .

De la mme manire, on obtient

1
1
5
12
e2 =
e3 =
,
.

1
5

Deuxime lecture
Trigonalisation
Nous lavons vu, la diagonalisation ne fonctionne pas toujours. dfaut de pouvoir diagonaliser, on tente parfois de trigonaliser.
Dfinition 16.22 Une matrice carre est dite triangulaire (suprieure) lorsque les coefficients sous la diagonale sonts nuls.
On dit quune matrice carre A est trigonalisable lorsquelle
est conjugue une matrice triangulaire, cest--dire lorsquil
existe P telle que P1 AP est triangulaire.

Exemple 16.23 La matrice
A=

3
0

1
3

est triangulaire (donc trigonalisable !). On peut voir facilement


quelle nest pas diagonalisable : en effet A = ( 3)2 , donc
la seule valeur propre est 3, et lespace propre correspondant
nest que de dimension 1.
Il est quand mme possible de faire des calculs avec A, par
exemple de calculer An , mme si cest plus difficile que pour
une matrice diagonale. Posons
!
!
3 0
0 1
D=
et N =
,
0 3
0 0
336

de sorte que A = D + N. On a N2 = 0, ce qui va grandement


nous aider. Notons galement que DM = MD = 3M pour toute
matrice M. On peut donc calculer
A2 = (D + N)2 = (D + N)(D + N) = D2 + ND + DN + N2 = D2 + 6N .
De mme
A3 = (D2 + 6N)(D + N) = D3 + 6ND + D2 N + 6N2
= D3 + 18N + 9N = D3 + 27N .
Visiblement An est de la forme Dn + an N. On a a2 = 6 = 2 3
et a3 = 27 = 3 32 . Supposons que an = n3n1 , alors
An+1 = (Dn + n3n1 N)(D + N) = Dn+1 + (n + 1)3n N .
Par rcurrence, ceci montre que an = n3n1 pour tout n (dans
les exercices nous verrons une autre mthode pour trouver
cette expression pour an , sans avoir deviner ). Finalement
la matrice An vaut
!
!
!
3n 0
3n n3n1
n
n1
n1 0 1
D + n3 N =
+3
=
.
0 3n
0 0
0
3n
Lorsquune matrice est triangulaire, avec 1 , 2 , . . ., n sur
la diagonale, son polynme caractristique est (1 )(2
) (n ). En particulier il est scind ; toute matrice dont
le polynme caractristique nest pas scind ne peut donc pas
tre trigonalisable.
Sur C, tous les polynmes sont scinds daprs le thorme
fondamental de lalgbre, donc on ne risque pas de trouver de
matrices non-trigonalisables en procdant comme a. Et en fait,
il ny en a pas ! En effet :
Proposition 16.24 Soit A Mn (C). Alors A est trigonalisable.
Dmonstration. On va procder par rcurrence sur n (pour n =
1 il ny a rien prouver).
Soit A le polynme caractristique de A. Comme on est
sur C, ce polynme possde au moins une racine, disons 1 .
337

Si f est lapplication f (v) = Av, alors par dfinition, on a donc


un vecteur propre e1 tel que que f (e1 ) = 1 e1 .
Daprs le thorme de la base incomplte, on peut trouver
une base B =e1 , e2 , . . ., en de Cn dont le premier vecteur est e1 .
La matrice de f dans la base B est de la forme

B
,

B [f ] =
0
..
A

0
o A0 est une matrice (n 1) (n 1) (et est un coefficient
quelconque).
Par rcurrence, il existe une matrice inversible Q telle que
la matrice T0 = Q1 A0 Q est triangulaire. Posons alors

0 0
1

P = .

..
Q

0
Linverse de P est de la mme forme, avec Q remplace par Q1 .
Un petit calcul montre alors que

0
B
1
.

P B [f ] P = .

1
0
0
Q AQ=T

..

0
En particulier cette matrice est triangulaire, puisque T0 lest ;
notons-la T, de sorte que B [f ]B = PTP1 .
Enfin, notons C la base canonique, ce qui permet dcrire A =
C
C
C [f ] . Notons galement R = B P . La formule du changement
de base nous dit que
A = R1 B [f ]B R = R1 PTP1 R = S1 TS,
avec S = P1 R. Ainsi, la matrice A est bien conjugue la matrice triangulaire T.
338

Le thorme montre donc quil existe P telle que

P1 AP =
.. .
..

.
.

n
Le polynme caractristique de A est donc
(1 ) (n ) ,
et les nombres i sont les valeurs propres de A. On observe
alors que 1 + 2 + + n = Tr(A), et 1 2 n = det(A), formules que nous connaissions pour n = 2. En dautres termes :
Corollaire 16.25 La somme des valeurs propres dune matrice
complexe, comptes avec leurs multiplicits, est gale sa trace ; le
produit de ces valeurs propres est gale son dterminant.
On a une notion vidente de matrice triangulaire infrieure,
lorsque les coefficients au-dessus de la diagonale sont nuls. On
dduit du thorme prcdent que :
Corollaire 16.26 Toute matrice complexe est conjugue une
matrice triangulaire infrieure.
Dmonstration. On applique le thorme la matrice transpose t A : il existe donc P telle que T = P1 (t A)P est triangulaire suprieure. En transposant, on obtient t P A t P1 = t T.
Posant Q = t P1 , on a bien montr que Q1 AQ = t T tait triangulaire infrieure.
Approximations
laide de la proposition 16.24, on peut montrer que la
plupart des matrices sont diagonalisables. Plus prcisment,
nous allons montrer :
Proposition 16.27 Soit A une matrice coefficients complexes.
Alors il existe une suite (An )n0 de matrices diagonalisables, telle
que
An A .
n

339

Rappelons un peu ce que la convergence signifie. Si A


MN (C), alors chaque An MN (C) ; dire que An converge vers A
signifie que les N2 coefficients de An convergent les N2 coefficients de A. Mais on peut identifier une matrice de MN (C) avec
2
2
un vecteur de CN (ou encore de R4N , en voyant C comme R2 ),
et penser la convergence en termes de norme comme dans la
proposition 4.28, si lon prfre.
Cette proposition est rapprocher de ce que font les ordinateurs lorsquils effectuent des calculs numriques approchs.
tant donne une matrice coefficients rels ou complexes, et
quelle que soit la prcision requise, un ordinateur (auquel on
ne demande pas explicitement de faire des calculs exacts) va
toujours annoncer quelle est diagonalisable (sur C). Concrtement, les valeurs propres, dont seule une valeur approche
sera calcule, seront toujours considres comme distinctes, et
dans ce cas on a le corollaire 16.20.
Cest cette mme ide qui va guider la dmonstration.
Dmonstration. Daprs la proposition 16.24, on peut trouver P
telle que P1 AP est triangulaire ; utilisons les notations suivantes :

1
.

T = P AP =
()

.
..

N
Soit maintenant Tn obtenue en prenant les coefficients de T
mais avec les changements suivants sur la diagonale :

1 + n
2

2 n

.
Tn =
..

N
N + n
(Les coefficients sont les mmes que dans () ; seule la diagonale est change.) Donc sur la ligne i on rencontre le coefficient i = i,n = i + ni .
Nous allons voir que les coefficients i sont tous distincts,
pour n suffisamment grand. En effet, si i et j sont deux indices,
340

alors nous avons deux cas considrer : dabord, si i = j ,


ij

alors i j = n , 0 si i , j ; si par contre i , j , alors


puisque i converge vers i , et j converge vers j , il est clair
que i , j ds que n est suffisamment grand.
Daprs le corollaire 16.20, la matrice Tn est diagonalisable,
pour tous les n suffisamment grands. Or il est clair que
Tn T
n

et que

PTn P1 PTP1 = A .
n

Enfin, nous notons que PTn P1 est diagonalisable pour n suffisamment grand, comme Tn .

341

Chapitre 17

quations
diffrentielles linaires
Premire lecture
Une quation diffrentielle est une quation dans laquelle
linconnue est une fonction, souvent note y dans ce chapitre.
Par exemple, si f est une fonction quelconque, on peut considrer lquation diffrentielle trs simple
y0 = f ,
dont les solutions sont les primitives de f . Nous avons tudi cette quation dans le chapitre sur les intgrales. Autre
exemple : lquation
y0 = y
a pour solutions (dfinies sur R) les fonctions de la forme y(x) =
cex avec c R, et aucune autre. Nous avons vu ce rsultat
loccasion du lemme 10.4, et nous allons le redmontrer sous
peu.
Dans ce chapitre, nous donnons un certain nombre de recettes pour rsoudre des quations bien particulires, qui sont
parmi celles que lon rencontre le plus souvent. Nous aurons
besoin du calcul de primitives, et aussi de lalgbre linaire
342

pour les quations les plus compliques. Dans le chapitre suivant, nous donnerons quelques rsultats gnraux, notamment
sur lexistence et lunicit des solutions. Cette thorie gnrale
nest pas ncessaire pour linstant.
quations linaires dordre 1
Ce sont les quations de la forme
y 0 (x) = a(x)y(x) + b(x) .

(E)

Lquation homogne associe est


y 0 (x) = a(x)y(x) .

(H)

En gnral on a une restriction x I, o I R est souvent un


intervalle (voir les exemples ci-dessous).
La proposition suivante justifie ladjectif linaire :
Proposition 17.1 Lensemble SH des solutions de lquation homogne est un espace vectoriel.
De plus, si y0 est une solution particulire de lquation (E),
alors nimporte quelle solution y1 de (E) peut scrire
y1 = y0 + y
o y est solution de (H).
Notons une chose : on peut considrer les solutions y valeurs dans R, ou bien celles valeurs dans C. Lespace vectoriel SH est lui-mme rel ou complexe selon le choix que lon
fait. La thorie est la mme dans les deux cas (alors que dans la
suite du chapitre, vous serez peut-tre surpris de voir que lon
travaille avec C en gnral).
Dmonstration. Si y et z sont des solutions de (H) alors on calcule tout simplement
(y + z)0 = y 0 + z0 = ay + az = a(y + z) ,
donc y + z SH . On vrifie galement facilement que si y SH
et si est un scalaire, alors y SH . Donc SH est un espace
343

vectoriel. (En langage plus savant : lapplication y 7 y 0 ay est


linaire, et SH est son noyau.)
Pour la deuxime partie, soient y0 et y1 deux solutions de
(E), alors
(y1 y0 )0 = y10 y00 = (ay1 + b) (ay0 + b) = a(y1 y0 ) ,
donc la fonction y = y1 y0 est bien solution de (H).
Nous connaissons donc la structure de lensemble des solutions de (E), et lon est pouss commencer par rsoudre (H).
Cest assez facile.
Voyons dabord lide intuitive (qui va aussi servir de moyen
mnmotechnique). On souhaite rsoudre lquation y 0 = ay. On
a bien envie dcrire
y0
= a,
(*)
y
mais alors il faut se restreindre aux fonctions y qui ne sannulent pas. Ceci tant, on peut intgrer les deux membres de
lquation (*), pour peu que a soit continue. Il vient
Zx 0
Zx
y (t) dt
= [ln |y(t)|]xx0 =
a(t) dt .
x0 y(t)
x0
Ici nous avons suppos que y tait dfinie sur un intervalle I
contenant x0 et x. On va rcrire un peu cette galit. Posons
Zx
a(t) dt ,
(x) =
x0

de sorte que lon a


ln |y(x)| = (x) + c0 ,
o c0 est une constante. Il vient
|y(x)| = e(x) ec0 .
Dbarrassons-nous de cette valeur absolue. On a suppos que y
ne sannulait pas, et tait dfinie sur un intervalle ; de plus,
344

on suppose ds le dpart que y est drivable donc continue.


Daprs le thorme des valeurs intermdiaires, y ne change
pas de signe. On a donc ou bien y(x) = |y(x)| pour tout x I, ou
bien y(x) = |y(x)| pour tout x. En posant c = ec0 , on en conclut
que
y(x) = ce(x) ,
(**)
pour une certaine constante c, et pour tout x I.
Nous avons donc montr que les solutions de (H) qui ne
sannulent pas sur un intervalle I sont de la forme (**). On imagine assez difficilement comment une solution pourrait sannuler, et prendre la forme (**) l o elle ne sannule pas. Cest
en effet impossible, comme le montre le rsultat suivant.
Proposition 17.2 Supposons que a est continue sur un intervalle I, et que y est une solution dfinie sur I de lquation
y 0 (x) = a(x)y(x)

(x I)

Alors il existe une constante c telle que


y(x) = ce(x) ,
o est une primitive de a, cest--dire que 0 = a. Rciproquement
pour tout c cette expression donne une solution.
Notez que maintenant que nous avons pressenti ce rsultat,
nous en donnons une dmonstration compltement dtourne
(et trs efficace).
Dmonstration. Soit une telle primitive, qui existe puisque a
est continue. Considrons la fonction f dfinie sur I par f (x) =
y(x)e(x) . Alors
f 0 (x) = y 0 (x)e(x) 0 (x)y(x)e(x) = (a(x)y(x)a(x)y(x)) e(x) = 0 .
Donc la fonction f est constante sur lintervalle I, disons f (x) =
c. Do le rsultat (la rciproque est vidente).
En particulier, la seule fonction qui sannule est obtenue en
prenant c = 0, et alors y est la fonction nulle.
345

Exemple 17.3 Si on revient lquation y 0 = y sur I = R, la


proposition nous dit que ses solutions sont de la forme y(x) =
cex , comme on le savait.
Exemple 17.4 Considrons maintenant y 0 (x) = xy(x), sur I =
R. Pour se rappeler lnonc de la proposition, il est trs courant de refaire les premires tapes du calcul que nous avons
fait en prliminaire. On crit donc
y 0 (x)
= x,
y(x)
do
ln |y(x)| =

x2
+ constante ,
2

puis
x2

y(x) = ce 2 .
(On retient que la valeur absolue est passe dans c .)
Trouver une solution particulire
Nous savons dsormais rsoudre (H). Pour rsoudre (E),
reste trouver une solution de (E), et appliquer la proposition 17.1. cette fin, il existe un principe gnral, qui servira
dans tout le chapitre (et mrite dtre tent avec nimporte
quelle quation diffrentielle). Cette mthode porte le nom
troublant de variation des constantes.
Le principe est le suivant. Aprs avoir trouv les solutions
de lquation homogne, on constate quelles scrivent avec
un certain nombre de paramtres (les constantes ). On peut
alors essayer de trouver une solution de lquation gnrale en
remplaant ces paramtres par des fonctions (donc en les faisant varier ).
Cest une recette assez vague, qui sapplique dans de nombreuses situations. Dans le cas des quations linaires dordre
1, les choses sont trs simples. Les solutions de (H) sont de la
forme y(x) = ce(x) . Pour trouver une solution de (E), on peut
alors essayer une fonction de la forme y(x) = c(x)e(x) .

346

Exemple 17.5 Cherchons une fonction y telle que


y 0 (x) = y(x) + 1

(E)

On a vu que les solutions de y 0 (x) = y(x) sont de la forme y(x) =


cex ; daprs le principe de variation de la constante, on a intrt
chercher une solution sous la forme y(x) = c(x)ex .
On a alors y 0 (x) = c0 (x)ex + c(x)ex = (c0 (x) + c(x))ex . Si nous
remplaons y 0 par sa valeur dans (E), on trouve
(c0 (x) + c(x))ex = c(x)ex + 1 ,
ce qui revient c0 (x)ex = 1 ou encore c0 (x) = ex . On en dduit c(x) = ex + constante ; comme on cherche juste une solution (et non pas toutes les solutions), on prend la constante
gale 0. Finalement c(x) = ex , et y(x) = ex ex = 1. La fonction constante gale 1 est solution de (E), comme on aurait
pu le remarquer tout de suite !
Pour finir le travail, appliquons la proposition 17.1. Elle
affirme que la solution gnrale de (E) (selon lexpression
consacre) et de la forme 1 + cex , avec c R.
Dans le cas qui nous proccupe des quations linaires
dordre 1, on a en fait le rsultat suivant.
Lemme 17.6 Pour les quations linaires dordre 1, la mthode de
la variation de la constante fonctionne toujours, et se ramne un
calcul de primitive.
Cest pourquoi vous entendrez les gens parler dintgrer
une quation diffrentielle, au lieu de la rsoudre .
Dmonstration. Les solutions de y 0 = ay, lorsque a est continue,
sont de la forme y(x) = ce(x) , o 0 (x) = a(x). Cherchons une
solution de lquation y 0 = ay + b sous la forme y(x) = c(x)e(x) .
On a y 0 (x) = (c0 (x) + a(x)c(x))e(x) = a(x)y(x) + c0 (x)e(x) . Donc
lquation y 0 = ay + b revient c0 (x)e(x) = b(x), ou encore c0 (x) =
b(x)e(x) . On sest donc bien ramen calculer une primitive
de b(x)e(x) .

347

Une astuce est


possible ici : on
note que si y est
solution de (E),
alors la fonction
z(x) = y(x) + 1
vrifie z0 = z.

Exemple 17.7 Prenons lquation


y 0 (x) =

y(x)
+ earctan(x) .
1 + x2

(E)

Commenons par lquation homogne


y 0 (x) =
qui donne

y(x)
1 + x2

(H)

y 0 (x)
1
=
,
y(x) 1 + x2

do
ln |y(x)| = arctan(x) + c ,
et

y(x) = cearctan(x) .

Maintenant, cherchons une solution particulire de (E),


sous la forme y(x) = c(x)earctan(x) . On peut faire un calcul direct de y 0 et remplacer dans (E) ; on peut aussi si lon prfre
retenir la formule obtenue dans la dmonstration du lemme ;
enfin on peut aussi redmontrer rapidement le lemme, lorsque
le cas gnral est plus clair que le cas particulier considr
(driver c(x)earctan(x) nest pas tellement plus agrable que driver c(x)e(x) ). Bref, on constate que y(x) = c(x)earctan(x) est solution de (E) lorsque
c0 (x) = earctan(x) e arctan(x) = 1 .
On prend donc c(x) = x, et alors y(x) = xearctan(x) . On peut vrifier rapidement que cest bien une solution de (E).
La solution gnrale de (E) est alors
y(x) = xearctan(x) + cearctan(x) ,
o c est une constante.

348

quations linaires dordre suprieur


Sans se restreindre lordre 1, une quation diffrentielle linaire est par dfinition de la forme
y (n+1) (x) = an (x)y (n) (x) + + a0 (x)y(x) + b(x) .

(E)

Lquation homogne associe, sans surprise, est


y (n+1) (x) = an (x)y (n) (x) + + a0 (x)y(x) .

(H)

La structure gnrale des solutions ne change pas :


Lemme 17.8 La proposition 17.1 est valable pour les quations
dordre suprieur.
Dmonstration. Si y est une fonction drivable n + 1 fois sur un
ensemble I, alors on note D(y) la fonction
D(y) = y (n+1) an y (n) a0 y ;
alors D(y) est encore une fonction dfinie sur I. On vrifie tout
de suite que D(y + z) = D(y) + D(z) et D(y) = D(y) si est
une constante. Comme SH est lensemble des fonctions y telles
que D(y) = 0, on voit de suite que cest un espace vectoriel.
En dautres termes, on peut voir D comme une application E F o E est lespace vectoriel des fonctions drivables n+
1 fois sur I, et F est lespace vectoriel de toutes les fonctions
sur I ; alors SH = ker(D), cest donc un espace vectoriel.
Nous avons vu comment rsoudre les quations dordre 1
dans le dbut du chapitre. Il y a un autre cas particulier que
lon sait traiter : celui des quations coefficients constants ,
cest--dire de la forme
y (n+1) (x) = an y (n) (x) + + a0 y(x) + b(x) ,

(E)

lquation homogne associe tant


y (n+1) (x) = an y (n) (x) + + a0 y(x) .

349

(H)

On commence par une remarque simple : il est facile de


trouver des solutions de la forme y(x) = ex . En effet dans ce cas
on a y 0 (x) = ex , puis y 00 (x) = 2 ex , et on voit immdiatement
que y (k) (x) = k ex pour tout k 0. Si nous insrons ceci dans
lquation (H), on obtient
n+1 ex = [an n + + a1 + a0 ] ex ,
ce qui revient en simplifiant lexponentielle () = 0, en posant
(X) = Xn+1 [an Xn + + a1 X + a0 ] .
On appelle (X) le polynme caractristique de lquation (H).
Puisque SH est une espace vectoriel, on peut obtenir dautres
solutions en considrant des combinaisons linaires, cest-dire des fonctions de la forme
y(x) = c1 e1 x + + cm em x ,
o 1 , . . . , m sont des racines du polynme caractristique.
Nous allons maintenant montrer que, sous lhypothse que ce
polynmes admet n + 1 racines distinctes, il ny a pas dautres
solutions :
Proposition 17.9 Supposons que le polynme caractristique
admette n + 1 racines distinctes 0 , 1 , . . . , n dans C. Alors toute
solution y valeurs complexes de lquation homogne, dfinie sur
un intervalle, est de la forme
y(x) = c0 e0 x + + cn en x ,
o ck C. En particulier une telle solution peut stendre en une
fonction dfinie sur R tout entier.
Avant de donner la dmonstration, voyons tout de suite
quelques exemples simples.
Exemple 17.10 Considrons lquation homogne
y 00 = y .
Le polynme caractristique est (X) = X2 1 = (X 1)(X + 1).
La solution gnrale est donc
y(x) = c1 ex + c2 ex .
350

Exemple 17.11 Voyons maintenant


y 00 = y .
Cette fois le polynme caractristique est (X) = X2 + 1 = (X +
i)(X i). La solution gnrale est donc
y(x) = c1 eix + c2 eix .

(*)

Mais cette fois-ci, on peut se demander quelle forme particulire est prise par les solutions valeurs dans R. crivons simplement que y(x) R si et seulement si y(x) = <(y(x)). En prenant la partie relle de (*), on constate alors que y(x) est de la
forme
y(x) = a cos(x) + b sin(x) ,
(**)
o a et b sont des constantes relles. (Si vous faites le calcul
vous verrez que lon a prcisment
a = <(c1 ) + <(c2 )

et b = =(c2 ) =(c1 ) ,

mais ces valeurs importent peu.) Rciproquement, toute fonction de la forme (**) est solution de (H), clairement. Finalement
lexpression (**) est la forme gnrale des solutions de lquation y 00 = y qui sont valeurs dans R.
On peut retenir que les solutions relles sobtiennent en
prenant les parties relles et imaginaires des solutions complexes.
Passons la dmonstration de la proposition.
Dmonstration. Soit y une fonction dfinie sur un intervalle
de R, valeurs dans C. Dfinissons alors

y(x)
y 0 (x)

,
Y(x) =
(*)
..

(n)
y (x)

351

de sorte que

Y0 (x) =

y 0 (x)
y 00 (x)
..
.
y (n+1) (x)

Dans ces conditions, la fonction y est solution de (H) exactement lorsque

y 0 (x)

y 00 (x)

0
.

Y (x) =
..

(n)
(n1)
an y (x) + an1 y
(x) + + a0 y(x)
Il se trouve que lon peut crire ceci laide dune matrice. Posons

0 1 0 0
0 0 1 0

.. .
.. . . . .
A = ...
. .
.
.

0 0 0 1

a0 a1 a2 an
Alors y est solution de (H) si et seulement si Y est solution de
Y0 (x) = AY(x) .

(V)

Notons dailleurs que si une fonction Y quelconque est solution


de (V), alors elle doit tre de la forme (*).
Conclusion : avec cette astuce (lintroduction de la bonne
matrice A), nous avons ramen ltude de lquation (H)
ltude de lquation (V), qui a lavantage dtre dordre 1,
mme si les fonctions en jeu sont cette fois valeurs vectorielles.
Lide est de diagonaliser A (dans la suite du chapitre nous
verrons que cest systmatiquement la chose faire). Si A est
le polynme caractristique de A, et si est le polynme caractristique de lquation diffrentielle, il se trouve que lon
a
A = (1)n+1 .
352

Vous montrerez ceci, titre dexercice. En particulier, A et


ont les mmes racines, et par hypothse ce sont 0 , 1 , . . . , n ,
qui sont distinctes. Daprs le corollaire 16.20, la matrice A est
diagonalisable.
Nous savons donc quil existe une matrice P telle que

0 0 0
0 0

1
P AP =
.. .
..
0
. .
0

0
0 n
Appelons D cette matrice diagonale, de sorte que A = PDP1 .
Lquation diffrentielle peut alors scrire
Y0 (x) = PDP1 Y(x) P1 Y0 (x) = DP1 Y(x)
Z0 (x) = DZ(x) ,
en posant Z(x) = P1 Y(x).
Comme D est diagonale, cette nouvelle quation est trs
simple. crivons

z0 (x)
.
Z(x) = .. .

zn (x)
(Si on calculait P, on pourrait exprimer zk en fonction de y,
mais nous naurons mme pas besoin de faire ce calcul). Lquation Z0 (x) = DZ(x) scrit zk0 (x) = k zk (x) pour chaque k, quation que lon sait rsoudre : on a zk (x) = ck ek x .
Pour rcuprer Y, et donc y, on utilise Y = PZ. On constate
bien que y(x) est une combinaison linaire des ek x , comme annonc.
Pour rsoudre compltement lquation (E), il faut savoir
trouver une solution particulire. cette fin, on peut appliquer des techniques du type variation des constantes , mais
les calculs sont souvent compliqus. Il convient de connatre
un certain nombre dastuces, et elles seront explores dans les
exercices. Cest galement dans les exercices que nous verrons
353

comment grer les quations pour lesquelles le polynme caractristique a des racines multiples.

Deuxime lecture
Systmes dquations diffrentielles
Un systme dquations diffrentielles linaires, coefficients constants, est par dfinition une quation diffrentielle
de la forme
Y0 (x) = AY(x) + B(x) ,
(E)
o Y est une fonction valeurs dans Cn , ainsi que B, et A est
une matrice n n. Lquation homogne associe est
Y0 (x) = AY(x) .

(H)

Exemple 17.12 Si lon souhaite trouver deux fonctions y1 et y2


telles que
( 0
y1 (x) = 15y1 (x) + 44y2 (x)
y20 (x) = 10y1 (x) + 27y2 (x) ,
alors il sagit bien dun systme dquations diffrentielles linaires. En effet en notant
!
!
y1 (x)
15 44
Y(x) =
et A =
,
y2 (x)
10 27
alors on cherche bien rsoudre Y0 (x) = AY(x).
Noter quen pratique les notations peuvent tre trs diffrentes, par exemple le systme peut se prsenter sous la forme
(parfaitement quivalente)
( 0
x (t) = 15x(t) + 44y(t)
y 0 (t) = 10x(t) + 27y(t) .
a sera notamment le cas si lon pense t comme au temps ,
et t 7 (x(t), y(t)) comme une courbe. Toutefois dans ce chapitre nous garderons des notations uniformes.
354

Exemple 17.13 Au cours de la dmonstration de la proposition 17.9, nous avons vu que les quations linaires dordre suprieur, coefficients constants, peuvent se ramener un systme (trs particulier). Tout ce que nous allons maintenant dmontrer sur les systmes sapplique donc cette situation.
De nouveau, la proposition 17.1 sapplique : le soin vous
est laiss de faire cette dmonstration trs facile. Nous allons
surtout nous intresser aux quations homognes, dans un premier temps du moins, et voir quelques techniques pour lquation (E) dans les exercices.
La mthode pour rsoudre lquation homogne est simple
et tient en un mot : diagonaliser. Plus prcisment :
1. On commence par tenter de diagonaliser A, donc de trouver P telle que la matrice D = P1 AP est diagonale. Si cest
impossible, on cherchera une matrice P telle que P1 AP
est la plus simple possible (en premire anne on vous
donnera des indications pour a).
2. Lquation Y0 (x) = AY(x), puisque A = PDP1 , se rcrit
de la manire suivante :
Y0 (x) = PDP1 Y(x) P1 Y0 (x) = DP1 Y(x)
Z0 (x) = DZ(x) ,
en posant Z(x) = P1 Y(x).
3. On note

z1 (x)

Z(x) = ...

zn (x)

puis on rsoud lquation Z0 (x) = DZ(x). Lorsque D est


diagonale, ceci revient rsoudre une quation simple
pour chaque zk , et on trouve zk immdiatement.
4. On retrouve Y(x) par la formule Y(x) = PZ(x).
Il est important de noter que lon a pas besoin de calculer linverse de la matrice P, aucun moment. En effet les techniques
de diagonalisation que lon a vues permettent de trouver P telle
que P1 AP est diagonale sans calculer P1 .
355

Exemple 17.14 Revenons lexemple 17.12. La matrice est


!
15 44
A=
.
10 27
Le polynme caractristique est A = 2 12 + 35 = ( 7)(
5), les valeurs propres sont 7 et 5, la matrice est diagonalisable.
On cherche les vecteurs propres, on trouve par exemple
!
!
2
11
e1 =
et
e2 =
1
5
associs 7 et 5 respectivement. On en conclut quen posant
!
2 11
,
P=
1 5
alors
1

P AP =

7
0

0
5

!
= D.

On pose alors
1

Z(x) = P Y(x) =

z1 (x)
z2 (x)

!
.

(On na pas calcul P1 .) Alors Z satisfait lquation Z0 (x) =


DZ(x), ce qui scrit
( 0
z1 (x) = 7z1 (x)
z20 (x) = 5z2 (x) .
On sait bien faire a : z1 (x) = c1 e7x et z2 (x) = c2 e5x .
Pour finir Y(x) = PZ(x) donc
(
y1 (x) = 2c1 e7x + 11c2 e5x
y2 (x) =
c1 e7x +
5c2 e5x
Exemple 17.15 Parfois la matrice A nest pas diagonalisable
(a sera videmment plus rare). Par exemple on peut considrer
le systme
( 0
y1 (x) =
y1 (x) + y2 (x)
y20 (x) = y1 (x) + 3y2 (x) .
356

Le polynme caractristique est ( 2)2 , et lespace propre associ lunique valeur propre 2 est de dimension 1, avec pour
base par exemple
!
1
e1 =
.
1
La matrice nest pas diagonalisable. Prenons nimporte quel
vecteur e2 tel que e1 , e2 est une base, par exemple
!
1
e2 =
,
0
et soit P la matrice dont les colonnes sont e1 et e2 . Calculons
!
2 1
1
P AP =
= D.
0
2
(Un peu de rflexion montre que, quel que soit notre choix
pour e2 , la matrice P1 AP doit tre triangulaire, et en calculant la trace ou le dterminant on sassure que la diagonale
doit tre (2, 2). La mthode qui suit ne dpend pas vraiment
du choix de e2 .)
On continue dappliquer la mthode. On pose
!
z1 (x)
1
Z(x) = P Y(x) =
.
z2 (x)
On a Z0 (x) = DZ(x), ce qui scrit
( 0
z1 (x) = 2z1 (x)
z2 (x)
z20 (x) =
2z2 (x)
On peut rsoudre la deuxime dabord : z2 (x) = c2 e2x . En remplaant dans la premire, nous obtenons
z10 (x) = 2z1 (x) c2 e2x .

(*)

Cest une quation dordre 1, que lon sait rsoudre ! Lquation


homogne est z10 (x) = 2z1 (x) qui a pour solutions les fonctions
de la forme c1 e2x . En appliquant la mthode de variation de
357

la constante, on cherche une solution de (*) de la forme c(x)e2x ;


on constate que lquation revient c0 (x) = c2 e2x e2x = c2 . On
prend c(x) = c2 x ce qui donne la solution c2 xe2x . Finalement
la solution gnrique de (*) est
z1 (x) = c1 e2x c2 xe2x .
On retrouve finalement y1 et y2 daprs la relation Y(x) = PZ(x),
cest--dire y1 (x) = z1 (x) + z2 (x) = c1 e2x + c2 (1 x)e2x et y2 (x) =
z1 (x) = c2 e2x .
tude qualitative des systmes
Nous avons toutes les clefs en main pour rsoudre les systmes dquations diffrentielles en pratique. prsent, nous
allons montrer quelques proprits qualitatives : le calcul de la
dimension de lespace vectoriel des solutions, leur forme gnrale, et les intervalles sur lesquelles on peut les dfinir. En deux
mots, nous trouverons que pour un systme n n, les solutions
forment un espace de dimension n, on peut les exprimer avec
des exponentielles et des polynmes, et par consquent on peut
naturellement les tendre R tout entier. Les dmonstrations
font surtout appel de lalgbre linaire.
Commenons par un petit lemme de calcul.
Lemme 17.16 Soit f (x) = P(x)ex , o P est un polynme. Alors f
possde une primitive de la forme Q(x)ex , o Q est encore un
polynme. Si , 0, alors deg Q deg P, alors que si = 0,
alors deg Q = deg P + 1.
Dmonstration. Le cas = 0 est vident donc on se tourne
vers , 0. La drive de Q(x)ex est (Q(x) + Q0 (x))ex . Il suffit donc de montrer que pour tout polynme P, il existe un
polynme Q de degr deg P tel que P = Q + Q0 .
Pour montrer ceci, soit n = deg P, et soit
: Cn [X]
Q 7

Cn [X]
Q + Q0 .

Cest une application linaire ; regardons ker(). On a (Q) =


0 Q = Q0 , et si Q , 0 cest impossible pour des raisons de degr. Donc ker() = {0}. Par suite, est injective, et
358

donc surjective aussi (corollaire 13.44). Ainsi il existe Q tel


que (Q) = P.
Thorme 17.17 On considre une quation diffrentielle de la
forme
Y0 (x) = AY(x) ,
(HA )
o A Mn (C). Alors lespace vectoriel SA des solutions est de dimension n.
De plus, les solutions ont la forme suivante. crivons

y1 (x)

Y(x) = ...

yn (x)
et soit

A () = (1 )m1 (s )ms

le polynme caractristique de A, factoris sur C. Alors yk (x) peut


scrire comme une combinaison linaire des expressions
xj ei x
avec j < mi .
En particulier yk stend naturellement en une solution dfinie
sur R.
Dmonstration. On va procder par rcurrence sur n. Le cas n =
1 est celui des quations linaires dordre 1 que lon connait
bien, et le thorme est alors videmment vrai. Supposons donc
le thorme dmontr pour n 1 et montrons-le pour n.
Le point essentiel est de comprendre ce qui se passe lorsquon remplace la matrice A par une matrice conjugue B =
P1 AP. Comme nous lavons vu dans les exemples, si Y est une
solution de Y0 = AY, alors Z = P1 Y est solution de Z0 = BZ, et
vice-versa. De manire plus savante, on a un isomorphisme
SA
Y 7

359

SB
P1 Y .

Linverse est donn par Z 7 PZ, bien sr. On en dduit que dim SA =
dim SB . Dautre part, chaque composante zk de Z est une combinaison linaire des composantes yk de Y (et rciproquement),
donc elles ont la mme forme (combinaisons de certains polynmes et dexponentielles). Conclusion : il suffit de montrer
le thorme pour B, il sera alors vrai pour A.
Choisissons donc P telle que la matrice B = P1 AP est de la
forme

..

An1
. .
B =


n
Cest possible daprs le corollaire 16.26 (qui dit mme que lon
peut prendre An1 triangulaire infrieure, mais a ne sera pas
utile). Notons que
A () = B () = (n )An1 () ,
comme on le voit en dveloppant par la dernire colonne.
Soit donc Z une solution de Z0 (x) = BZ(x), et notons

z1 (x)

Z(x) = ...

zn (x)
Enfin notons

z1 (x)

..
Zn1 (x) =
.

zn1 (x)

cest--dire que Zn1 est obtenu en ne gardant que les n 1 premires composantes de Z. Daprs la forme de B, on constate
que Zn1 vrifie Z0n1 (x) = An1 Zn1 (x) (cest ce que lon voit
en ne regardant que les n 1 premires quations du systme Z0 (x) = BZ(x)). On a donc une application linaire
: SB
Z 7
360

SAn1
Zn1 .

Nous allons montrer deux choses : dune part, que est surjective, et dautre part que dim ker() = 1. En effet, supposons
ces deux choses tablies, et appliquons le thorme du rang.
Nous avons
dim SB = dim ker() + dim(=()) ,
et par rcurrence, on sait que dim =() = dim SAn1 = n 1.
On a donc dim SB = 1 + (n 1) = n = dim SA . Ceci donne bien le
calcul de la dimension au rang n.
Le plus simple est ltude de ker(). Si (Z) = 0, alors Z est
de la forme

0
0

Z(x) = . ,
..

zn
et lquation Z0 (x) = BZ(x) quivaut zn0 (x) = n zn ; cette dernire quation est un systme dordre 1, donc ses solutions
forment un espace de dimension 1 (et concrtement, zn (x) =
cen x ). Ceci montre que dim ker() = 1.
Montrons que est surjective. Il faut montrer que, tant
donnes des fonctions z1 , . . . , zn1 qui forment une solution
de Z0n1 (x) = An1 (x)Zn1 , on peut les complter en une solution Z de Z0 (x) = BZ(x) en ajoutant une fonction bien choisie zn .
Or la seule quation du systme Z0 (x) = BZ(x) faisant intervenir zn est la dernire, qui est de la forme
zn0 (x) = n zn (x) + b(x) .

(*)

On sait tudier les quations dordre 1 ; en particulier, une telle


quation possde toujours des solutions lorsque b est continue,
ce qui est le cas (voir plus bas la forme de b). Donc on peut
trouver zn , et est surjective. Ceci conclut la dmonstration
que lespace des solutions est de dimension n.
Pour finir la dmonstration, il reste tablir que les solutions ont la forme annonce, et par rcurrence on le sait
pour Zn1 ; reste donc voir la forme de zn , ce qui va se faire

361

en regardant de plus prs lquation (*). Puisque les fonctions zk sont des combinaisons de polynmes et dexponentielles, pour 1 k n 1, on a
X
b(x) =
Pi (x)ei x .
i

La solution gnrale de (*) est donc


zn (x) = cen x + c(x)en x ,
o c(x) vrifie
c0 (x) = b(x)en x =

Pi (x)e(i n )x .

On peut maintenant appliquer le lemme 17.16. Il nous dit que


lon peut choisir c(x) sous la forme
X
c(x) =
Qi (x)e(i n )x ,
i

o Qi est un polynme, avec deg Qi deg Pi , sauf si n = i


pour un certain i, et alors deg Qi = deg Pi + 1. Notons alors que
le produit c(x)en x peut scrire
X
Qi (x)ei x .
c(x)en x =
i

Ceci montre que zn (x) a prcisment la forme annonce.


Nous pouvons revisiter les examples tudis ci-dessus la
lumire du thorme.
Exemple 17.18 Le systme de lexemple 17.12 tait
( 0
y1 (x) = 15y1 (x) + 44y2 (x)
y20 (x) = 10y1 (x) + 27y2 (x) ,
la solution tait donne dans lexemple 17.14. On a vu que le
polynme caractristique tait ( 7)( 5). Le thorme nous
affirme alors que y1 est de la forme
y1 (x) = ae7x + be5x ,
362

o a et b sont des constantes, et que y2 est de la forme


y2 (x) = ce7x + de5x .
Attention : le thorme ne dit certainement pas que, rciproquement, on obtient des solutions en prenant a, b, c, d arbitrairement ; dailleurs on ne sattend pas avoir 4 paramtres libres
alors que le thorme nous dit galement que lespace des solutions est de dimension 2.
En fait, nous avions fait les calculs et trouv que
(
y1 (x) = 2c1 e7x + 11c2 e5x
y2 (x) =
c1 e7x +
5c2 e5x
o c1 et c2 sont des constantes arbitraires (il y en a bien 2 !).
Regardons de mme lexemple 17.15, pour lequel le systme est
( 0
y1 (x) =
y1 (x) + y2 (x)
y20 (x) = y1 (x) + 3y2 (x) .
Le polynme caractristique est ( 2)2 . Le thorme affirme
donc que
y1 (x) = ae2x + bxe2x ,
et

y2 (x) = ce2x + dxe2x ,

o a, b, c, d sont des constantes ; lespace des solutions est de dimension 2 donc il doit y avoir des relations entre ces constantes.
Nous avions fait les calculs et trouv que
y1 (x) = (c1 + c2 )e2x c2 xe2x ,
et que

y2 (x) = c2 e2x ,

avec deux constantes arbitraires c1 et c2 .


Les rsultats prdits par le thorme sont donc cohrents
avec ceux que lon avait obtenus directement. Le thorme
lui seul ne donne pas assez dinformation pour rsoudre le systme, et dailleurs on sen passe. Mais lintrt de cet nonc
363

abstrait est de dire au moins quelque chose dans les cas o un


calcul direct nest pas envisageable, par exemple si la matrice
est trs grande, o si elle dpend elle-mme de paramtres
dune manire complique.
Retour sur les quations dordre suprieur
Pour se convaincre de lintrt du thorme 17.17, voici
une consquence concrte : nous pouvons maintenant rsoudre
toutes les quations diffrentielles linaires dordre suprieur,
coefficients constants. Rappelons que dans la proposition 17.9
nous avions seulement trait le cas o les racines du polynme
caractristique taient distinctes.
Proposition 17.19 On considre lquation homogne
y (n+1) (x) = an y (n) + + a0 y(x) .

(H)

Soit
() = n+1 [an n + + a0 ] = ( 1 )m1 ( s )ms
le polynme caractristique, factoris sur C. Alors toute solution y
de (H) peut scrire de manire unique
y(x) =

s m
i i
X
X

cij xj ei x ,

i=1 j=0

et rciproquement pour tout choix de coefficients cij , une fonction


de cette forme est solution.
Dmonstration. On reprend le dbut de la dmonstration de la
proposition 17.9 : on pose

A =

0
0
..
.

1
0
..
.

0
1
..
.

..
.

0
a0

0
a1

0
a2

364

0
0
..
.

an

et alors on constate que Y est solution de Y0 (x) = AY(x) si et


seulement si elle est de la forme

y(x)
y 0 (x)

,
Y(x) =
(*)
..

(n)
y (x)
avec y solution de (H).
Si on note SA lespace des solutions de Y0 = AY, et SH lespace des solutions de (H), alors on a un isomorphisme SA SH
donn par Y 7 y ; linverse envoie y sur la fonction Y dfinie
par (*). On en conclut, daprs le thorme 17.17, que dim SH =
dim SA = n.
Or, daprs le mme thorme, on sait que y doit avoir prcisment la forme annonce dans la proposition (rappelons que
le polynme caractristique de A est, au signe prs, le polynme caractristique considr dans lnonc).
Il est facile de conclure. Soit eij la fonction dfinie sur R
par eij (x) = xj ei x , pour 1 i s et 0 j < mi . Ces fonctions
sont au nombre de n, qui est le degr du polynme . Considrons alors lespace vectoriel E = Vect(eij ) (cest un sous-espace
de lespace de toutes les fonctions R C). Il est donc de dimension n. Mais on vient de voir que SH E et que dim SH = n.
On en conclut que SH = E et que dim E = n ; de plus la famille
des eij doit donc tre libre.
On a donc bien montr que chaque eij SH , donc est solution de (H), et que chaque solution de (H) scrivait de manire
unique comme combinaison linaire de ces fonctions.
Exemple 17.20 Considrons lquation
y (3) (x) + 3y 00 (x) + 3y 0 (x) + y(x) = 0 .
Le polynme caractristique est 3 + 32 + 3 + 1 = ( + 1)3 . On
en conclut que les solutions sont prcisment les fonctions de
la forme
(a + bx + cx2 )ex ,
o a, b et c sont des constantes arbitraires.
365

Utilisation de lexponentielle matricielle


Le lecteur ayant parcouru la deuxime partie du chapitre
Lexponentielle connait les exponentielles de matrices. Rappelons que si A est une matrice, alors par dfinition
eA =

+
X
1 k
A .
k!
k=0

La proposition 10.24 affirme alors que la fonction (x) = exA


vrifie 0 (x) = AexA . On aperoit alors une nouvelle faon de
produire des solutions de nos systmes dquations diffrentielles : en effet, pour tout vecteur v Cn , si on pose Y(x) = exA v,
alors Y0 (x) = AexA v = AY(x).
Et toutes les solutions sont en fait de cette forme :
Proposition 17.21 Soit Y une solution du systme Y0 (x) = AY(x).
Alors Y est de la forme Y(x) = exA v pour un certain vecteur v ; par
suite v = Y(0). Rciproquement toutes les fonctions de cette forme
sont solutions.
En particulier, une solution Y de ce systme est entirement dtermine par le vecteur Y(0).
Dmonstration. Nous avons dj vu la partie rciproque . On
doit montrer que toute solution Y est de cette forme.
Il y a deux dmonstrations faciles. La premire consiste
adapter la dmonstration de la proposition 17.2, en remplaant
lexponentielle usuelle par lexponentielle de matrice. Il ny a
presque rien changer (et le peu quil y a changer a en fait
t vu lors de la dmonstration de la proposition 10.24).
Voici la deuxime dmonstration. On considre lapplication : SA Cn dfinie par (Y) = Y(0) (comme dhabitude SA
est lespace vectoriel des solutions du systme). Lapplication
est videmment linaire. De plus, elle est surjective, puisque
pour tout v Cn , la solution Y SA dfinie par Y(x) = exA v
vrifie Y(0) = v. Daprs le thorme 17.17, la dimension de SA
est n, et on en conclut que est injective galement. Ceci
montre que Y est dtermine par v = Y(0). Ainsi, la seule solution Y telle que Y(0) = v est Y(x) = exA v.
366

Il semblerait que nous ayons donn une formule simple


pour exprimer les solutions de Y0 (x) = AY(x), et en un sens cest
le cas. Mais il ne faudrait pas croire que cette formule va nous
dispenser de la mthode que nous connaissons pour rsoudre
un tel systme en pratique. En effet, le calcul de eA est compliqu, et se fait. . . en diagonalisant A (voir lexemple 10.23). On
ne gagne pas vraiment de temps en procdant ainsi.
Par contre, le fait quune solution Y est dtermine par Y(0)
est nouveau. Nous verrons dans le prochain chapitre quil y a
l un phnomne gnral dans la thorie des quations diffrentielles.
Exemple 17.22 De nouveau, retournons lexemple 17.12,
donc au cas o
!
15 44
A=
.
10 27
Les solutions de Y0 (x) = AY(x) sont, daprs la proposition, de la
forme exA v, et nous devons donc commencer par calculer exA .
On a vu (exemple 17.14) que
!
!
7 0
2 11
1
P AP =
= D avec P =
.
0 5
1
5
On en tire xA = P (xD) P1 et
exA = PexD P1 ,
voir la proposition 10.22. De plus comme xD est diagonale, on
a videmment
!
e7x 0
exD =
.
0 e5x
On veut sviter le calcul de P1 (rappelons que nous navons
pas eu besoin de faire ce calcul pour diagonaliser A). On va
donc garder le rsultat sous cette forme, et crire quil existe
un vecteur v tel que
!
2e7x 11e5x
xA
xD 1
Y(x) = e v = Pe P v =
w,
e7x
5e5x

367

en posant w = P1 v. On sait que v peut tre choisi librement,


donc w peut tre choisi librement ; en posant
!
c1
w=
,
c2
on retrouve le rsultat de lexemple 17.14, savoir que Y est de
la forme
!
2c1 e7x + 11c2 e5x
Y(x) =
.
c1e7x + 5c2 e5x
Cette mthode nest ni plus rapide, ni plus lente que la prcdente.

368

Table des matires


1 Ensembles
Premire lecture . . . . . . . . . . . . . .
Ensembles et appartenance . . . .
Quelques constructions . . . . . .
Propositions mathmatiques . . .
Fonctions . . . . . . . . . . . . . .
Deuxime lecture . . . . . . . . . . . . .
Fonctions injectives . . . . . . . .
Fonctions surjectives et bijectives
Galerie dexemples . . . . . . . .
La mthode axiomatique . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

3
3
3
4
6
8
11
11
13
15
19

2 Nombres
Premire lecture . . . . . . . . . . . . . . .
Les premiers nombres . . . . . . . .
La proprit de la borne suprieure
Lensemble des rels . . . . . . . . .
Les nombres complexes . . . . . . .
Deuxime lecture . . . . . . . . . . . . . .
Calculs sur machine et corps . . . .
Arithmtique de lhorloge . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

22
22
22
25
28
33
37
37
40

3 Polynmes
Premire lecture . . . . . . . . . . . . . . . . . . . . . . .
Dfinitions & Notations . . . . . . . . . . . . . . .
La division Euclidienne . . . . . . . . . . . . . . .

44
44
44
46

369

Racines . . . . . . . . . . . .
Diviseurs dans C[X] . . . . .
Deuxime lecture . . . . . . . . . .
Plus grand diviseur commun
Le thorme de Bzout . . .
Premiers . . . . . . . . . . .
Factorisation . . . . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

49
53
55
55
57
58
60

4 Suites
Premire lecture . . . . . . . . . . . . . .
Suites de rels . . . . . . . . . . .
Convergence . . . . . . . . . . . .
Combiner les limites . . . . . . .
Suites croissantes et dcroissantes
Convergence vers . . . . . . .
Deuxime lecture . . . . . . . . . . . . .
Convergence absolue . . . . . . .
Suites de complexes . . . . . . . .
Suites de vecteurs . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

62
62
62
64
68
70
72
74
74
78
81

5 Matrices
Premire lecture . . . . . . . . . . . . . . . . . . . . . . .
Introduction . . . . . . . . . . . . . . . . . . . . .
Addition et multiplication . . . . . . . . . . . . .
Rgles de calcul . . . . . . . . . . . . . . . . . . .
Matrices chelonnes . . . . . . . . . . . . . . . .
Oprations sur les lignes . . . . . . . . . . . . . .
Calcul de linverse dune matrice . . . . . . . . .
Deuxime lecture . . . . . . . . . . . . . . . . . . . . . .
Un autre point de vue sur les oprations sur les
lignes . . . . . . . . . . . . . . . . . . . . .
Justification de la mthode de calcul de linverse
Lunicit de la matrice bien chelonne . . . . . .

84
84
84
87
90
93
96
100
102

6 Continuit
Premire lecture . . . . . . . . . . . . . . . . . . . . . . .
Introduction & Dfinitions . . . . . . . . . . . . .
Le thorme des valeurs intermdiaires . . . . . .

108
108
108
111

370

102
104
105

Autres exemples de fonctions continues


Le langage des limites . . . . . . . . . . .
Continuit et ingalits . . . . . . . . . .
Deuxime lecture . . . . . . . . . . . . . . . . .
Continuit et fonctions monotones . . .
Fonctions de plusieurs variables . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

113
116
118
119
120
123

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

126
126
126
131
135
137
137
138
142

8 Compacit
Premire lecture . . . . . . . . . . . . . . . . . . . .
Le thorme de Bolzano et Weierstrass . . .
Fonctions continues et intervalles compacts
Deuxime lecture . . . . . . . . . . . . . . . . . . .
Parties compactes . . . . . . . . . . . . . . .
Autres tudes de minima et maxima . . . .
Continuit uniforme . . . . . . . . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

146
146
146
147
149
149
151
151

9 Drives
Premire lecture . . . . . . . . . . . . . . . .
Dfinitions & Premires proprits .
Le thorme des accroissements finis
Deuxime lecture . . . . . . . . . . . . . . .
Le thorme du point fixe . . . . . .
Drives et rciproques . . . . . . . .
Fonctions valeurs vectorielles . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

154
154
154
161
165
165
171
173

7 Dterminants
Premire lecture . . . . . . . . . . . . . . .
Mthode de calcul . . . . . . . . . .
Dveloppements des dterminants
Les formules de Cramer . . . . . . .
Deuxime lecture . . . . . . . . . . . . . .
Unicit du dterminant . . . . . . .
Permutations . . . . . . . . . . . . .
La dfinition du dterminant . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

10 Lexponentielle
176
Premire lecture . . . . . . . . . . . . . . . . . . . . . . . 176
Lexponentielle complexe . . . . . . . . . . . . . . 176
Lexponentielle relle . . . . . . . . . . . . . . . . 179
371

Le cercle et le nombre . . . . . . . .
Forme polaire et racines n-imes . . . .
Le thorme fondamental de lalgbre
Deuxime lecture . . . . . . . . . . . . . . . .
Matrices et normes . . . . . . . . . . .
Lexponentielle de matrice . . . . . . .
Exponentielle et drive . . . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

181
185
187
188
188
190
194

11 Espaces vectoriels
Premire lecture . . . . . . . . . . . . . . . . .
Dfinitions & Exemples fondamentaux
Sous-espaces . . . . . . . . . . . . . . .
Familles gnratrices . . . . . . . . . .
Familles libres . . . . . . . . . . . . . .
Bases . . . . . . . . . . . . . . . . . . .
Coordonnes . . . . . . . . . . . . . . .
Deuxime lecture . . . . . . . . . . . . . . . .
Le thorme de la base incomplte . .
Le rang dune matrice . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

195
195
196
197
198
203
206
208
213
213
216

12 Formules de Taylor
Introduction . . . . . . . . . . . . . . . . . . . .
La formule de Taylor-Lagrange . . . . . . . . . .
La formule de Taylor-Young . . . . . . . . . . .
Dveloppements limits . . . . . . . . . . . . .
Mthodes de calcul des dveloppements limits
Le minimum savoir par coeur . . . . . . . . .

.
.
.
.
.
.

220
220
221
224
228
231
234

13 Applications linaires
Premire lecture . . . . . . . . . . . . . . . . . . . . .
Dfinition & Exemples . . . . . . . . . . . . .
Sommes directes . . . . . . . . . . . . . . . . .
Projections et symtries . . . . . . . . . . . . .
La matrice dune application linaire . . . . .
Formule du changement de base . . . . . . . .
Deuxime lecture . . . . . . . . . . . . . . . . . . . .
Applications injectives, surjectives, bijectives
Le thorme du rang . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.

235
235
235
238
242
245
250
253
253
257

372

.
.
.
.
.
.
.
.
.

Vieux rsultats, nouvelles dmonstrations . . . . 259


14 Intgrale de Riemann
Premire lecture . . . . . . . . . . . . . . . . . . . .
Introduction . . . . . . . . . . . . . . . . . .
Fonctions intgrables au sens de Riemann .
Premiers exemples de fonctions intgrables
Proprits lmentaires . . . . . . . . . . . .
Intgrales et fonctions
continues . . . . . . .
Rx
La fonction x 7 a f . . . . . . . . . . . . . .
La formule du changement de variables . .
Deuxime lecture . . . . . . . . . . . . . . . . . . .
Fonctions valeurs vectorielles . . . . . . .
Longueur dune courbe . . . . . . . . . . . .
Dmonstration de Taylor-Young . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

262
262
262
264
268
272
276
279
283
285
285
290
296

15 Fractions rationnelles
298
Fractions rationnelles . . . . . . . . . . . . . . . . 298
Intgration des lments simples . . . . . . . . . 306
Fractions rationnelles trigonomtriques . . . . . 311
16 Diagonalisation
Premire lecture . . . . . . . . . . . . . . . . . . . . . .
Motivation . . . . . . . . . . . . . . . . . . . . .
Matrices conjugues . . . . . . . . . . . . . . . .
Interprtation laide des applications linaires
Le polynme caractristique . . . . . . . . . . .
Compter les vecteurs propres . . . . . . . . . .
Rsum . . . . . . . . . . . . . . . . . . . . . . .
Deuxime lecture . . . . . . . . . . . . . . . . . . . . .
Trigonalisation . . . . . . . . . . . . . . . . . . .
Approximations . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

317
317
317
320
323
328
331
333
336
336
339

17 quations diffrentielles linaires


Premire lecture . . . . . . . . . . . . . . . .
quations linaires dordre 1 . . . . .
Trouver une solution particulire . .
quations linaires dordre suprieur
Deuxime lecture . . . . . . . . . . . . . . .

.
.
.
.
.

342
342
343
346
349
354

373

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

Systmes dquations diffrentielles . . . .


tude qualitative des systmes . . . . . . .
Retour sur les quations dordre suprieur
Utilisation de lexponentielle matricielle .

374

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

354
358
364
366

Index
algorithme dEuclide, 53
anneau, 38
application, 8
application linaire, 231
arccosinus, 17
archimdien, 63
arcsinus, 16
arctangente, 17
base, 202
base canonique, 202, 203
Bzout (thorme), 54
bijection, 14
Bolzano-Weierstrass
(thorme de), 142
borne infrieure, 26
borne suprieure, 26
but (dune fonction), 8

continue (fonction), 106, 119


continuit uniforme, 148
continument drivable, 168
convergence, 60
convergence absolue, 70, 75,
77
coordonnes, 205
corps, 38
cosinus, 17
courbe, 286
Cramer (formules de), 131
croissante (fonction), 116
croissante (suite), 66

dcomposition en lments
simples, 297
dense (Q est dense dans R), 30
drive, 150
dterminant, 122, 138
C1 (fonction), 168
dveloppement des
Cauchy (suite de), 71
dterminants, 128
Cauchy-Schwarz (ingalit de), dveloppement limit, 224
78
diagonalisable, 316
changement de variables, 279 dimension, 207
Chasles (relation de), 268
division euclidienne, 40, 47
circonfrence, 290
domaine de dfinition, 8
combinaison linaire, 195
chelonne (matrice), 89
compact, 145
complexe (nombre), 33
lments simples, 297
conjugu (dun complexe), 34 ensemble, 3
375

escaliers (fonction en), 261


espace engendr, 195
espace propre, 321
espace vectoriel, 192
exponentielle, 15, 72, 76

lipschitzienne (fonction), 161


logarithme, 15
longueur dune courbe, 287

ingalit triangulaire, 32, 76,


78
ingalit triangulaire pour les
intgrales, 285
inf, 26
injection, 11
intgrable (fonction), 263
intgrale, 263
intervalle, 107
inverse (dune matrice), 87, 96
irrductible (polynme), 56
isomorphisme, 250

oprations sur les lignes, 92

Landau (notation de), 224


limite, 112
limite (dune suite), 60

R, 28
racine (dun polynme), 49
racine carre, 18, 30, 35

majorant, 26
matrice, 81
famille gnratrice, 197
matrice de passage, 246
matrice dune application
famille libre, 199
linaire, 242
Fibonacci (suite de), 59, 313
matrices conjugues, 316
fonction, 8
matrices semblables, 316
formes indtermines, 69
mineur, 127
formule du changement
de base, 247
minorant, 26
module (dun complexe), 34
fraction rationnelle, 294
modulo, 40
fraction rationnelle
trigonomtrique, 307 monotone (fonction), 116
multiplication des
Gauss (lemme), 56
matrices, 84
graphe, 8
norme, 77
groupe symtrique, 134
notation de Landau, 224
Heine (thorme), 149
noyau, 232

partie (dun ensemble), 3


permutation, 134
pgcd, 53
polynme, 44
polynme caractristique, 324
premier (nombre), 56
produit cartsien, 4
projection, 239
quantificateur, 7

376

thorme fondamental de
lalgbre, 51, 183
thorme du point fixe, 162
trace, 317
transpose (dune matrice), 82
transposition, 137
triangulaire (matrice), 332
trigonalisable, 332
triplet pythagoricien, 310

rang (dune application


linaire), 232
rang (dune matrice), 212
rationnel (nombre), 22
rciproque, 14
rel (nombre), 28
Riemann-intgrable, 263
Riemann (somme de), 273
Rolle (thorme), 159
rotation, 232
srie, 59
signature (dune permutation),
135
sinus, 16
somme directe, 237
somme de sous-espaces, 234
sommes de Riemann, 273
sous-espace vectoriel, 193
sous-suite, 142
suite (de rels), 58
sup, 26
surjection, 13
symtrie, 240

valeur absolue, 32
valeur propre, 321
Vect, 195
vecteur propre, 321
Z/NZ, 40

tangente, 17
Taylor (formule pour les
polynmes), 209
Taylor-Lagrange, 217
Taylor-Young, 220, 293
thorme des accroissements
finis, 158
thorme de la base
incomplte, 210
thorme des valeurs
intermdiaires, 108
thorme du rang, 253
thorme fondamental de
lanalyse, 276
377

Vous aimerez peut-être aussi