Académique Documents
Professionnel Documents
Culture Documents
et exercices corrigés
Sous la direction de :
Jean-Pierre Marco
Laurent Lazzarini
Hassan Boualem
Robert Brouzet
Bernhard Elsner
Laurent Kaczmarek
Denis Pennequin ·
PEARSON
Education
Mathématiques
Cours complet avec 1000 tests
et exercices corrigés
1
Cours complet avec 1000 tests
et exercices corrigés
PEARSON
a -
1
Education
Publié par Pearson Education France
47 bis, rue des Vinaigriers
75010 Paris
Tél. : 01 72 74 90 00
ISBN : 978-2-7440-7258-1
© 2007 Pearson Education France
Mise au point de la feuille de style TEX : Laurent Kaczmarek et Bruno Ayela
Aucune représentation ou reproduction, même partielle, autre que celles prévues à l'article L.
122-5 2° et 3° a) du code de la propriété intellectuelle ne peut être faite sans l'autorisation
expresse de Pearson Education France ou, le cas échéant, sans le respect des modalités prévues
à l'article L. 122-10 dudit code.
Les auteurs
Hassan Boualem est maître de conférences à l'université Montpellier II. Il y enseigne les
mathématiques discrètes et l'algèbre linéaire en 11. Il donne également des cours dans le
cadre des préparations aux agrégations externe et interne de mathématiques. Son domaine
de recherche est la géométrie différentielle. Il est par ailleurs coauteur, avec Robert Brouzet,
d'un livre d'enseignement intitulé La planète lR (Dunod, 2002).
Bernhard Elsner est professeur agrégé au lycée Saint-Exupéry à Créteil. Il y enseigne les
mathématiques aux élèves de premières S, ES et 1 et de terminales STT.
Laurent Kaczmarek est professeur en classe préparatoire PCSI au lycée François 1er du
Havre et intervient à la préparation à l'agrégation de mathématiques de l'université Pierre et
Marie Curie (Paris VI). Il a organisé la mise en page de cet ouvrage sous TEX-
Laurent Lazzarini est maître de conférences à l'université Pierre et Marie Curie (Paris
VI) où il donne des cours et des travaux dirigés d'analyse et participe à la préparation au
Capes et à l'agrégation. Il assure également une charge d'enseignement à l'École polytechnique
universitaire Pierre et Marie Curie (Paris VI). Ses domaines de recherche sont la géométrie
symplectique et l'analyse sur les variétés.
Remerciements xvi
I Bases 1
3 Fonctions circulaires 51
I De la trigonométrie· aux fonctions circulaires 51
II Fonctions circulaires réciproques . . . . . . . 57
III Application à la superposition de sinusoïdes 66
IV Exercices . . . . . . . . . . . . . . . . . . . . 67
6 Symboles [ et TT 115
I Calculer avec le symbole [ . . . . . . 115
II Séries arithmétiques et géométriques 120
III La formule du binôme . . . . . . . . 122
IV Sommes et produits trigonométriques 125
V Les sommes doubles . 128
VI Les produits finis 132
VII Exercices . . . . . . . 134
11111! 1
IV Exercices. . 473
rJJ
...
(!;
18 Bases 475
:=:
I Sous-espace vectoriel engendré par une partie 475
.__,)
E
rJJ II Bases. Dimension . . . . . . . . . . . . . . . . . . . . . . 480
V
"Cl III Représentation d'une application linéaire par une matrice 502
V
IV Exercices . . . . . . . . . . . . . . . 511
~
E-<
19 Sommes de sous-espaces vectoriels 515
I Somme directe de sous-espaces vectoriels 515
II Sommes directes et applications linéaires 524
III Exercices . 533
Complément 1 Noyaux . . . . . . . . . . 535
20 Déterminants 539
I Aire d'un parallélogramme . . . . . . . . 539
II Déterminant d'une matrice . . . . . . . . 541
III Calculs de déterminants et conséquences 547
IV Exercices . 556
Complément 1 Questions d'orientation 559
IV Analyse 563
21 La droite réelle 571
I La nécessité d'enrichir le corps des rationnels . 573
II La droite réelle 578
III Exercices . . . . . . . . . . . . 591
23 Représentation et approximation
des réels 635
I Développement d'un réel dans une base donnée 636
II Exercices . 643
Complément 1 Fractions continuées 644
Complément 2 Les gammes . . . . . 655
xi
unes d'entre elles. Elles seront donc autant de points de repère pour apprécier l'intérêt de la
formalisation élaborée par les mathématiciens au fil des siècles, et accéder à une approche
mathématique de niveau universitaire.
Il ne nous sera cependant pas possible, ni réellement utile, de décrire toute cette formali-
sation. En particulier nous conserverons dans cet ouvrage leur caractère intuitif aux notions
indispensables d'ensembles et d'éléments. La logique et la théorie des ensembles constituent
des disciplines à part entière, dont la présentation dépasse le niveau Ll. Nous en donnerons
une idée dans les ouvrages de L2 et L3.
o La partie I - BASES - déjà évoquée, a pour but d'exposer de manière synthétique les
connaissances acquises dans l'enseignement secondaire (trigonométrie, études de fonctions,
fonctions usuelles, géométrie plane), en soulignant clairement les questions que leur présenta-
tion intuitive conduit à se poser. Ces questions seront reprises et résolues dans le cours de ce
tome Ll et des suivants.
o La partie II - STRUCTURES FONDAMENTALES - est nouvelle pour l'étudiant. On y
présente une première approche de la notion de structure qui, de manière générale, formalise
les relations entre objets d'un système composé en faisant abstraction de la nature des objets
eux-mêmes. C'est la notion de groupe, imaginée par Évariste Galois au début du XIXe siècle,
qui inaugure cette nouvelle tendance de pensée structurelle. Cette notion sera présentée dans
la partie II, ainsi que des structures algébriques plus élaborées, comme celle d'anneau qui
permet de formaliser l'arithmétique classique et de montrer de manière claire ses relations
avec l'arithmétique des polynômes. On introduira aussi la notion de corps, fondamentale à la
fois en analyse et en algèbre linéaire.
o La partie III - ALGÈBRE LINÉAIRE - sous-tend de nombreux phénomènes rencon-
trés depuis les classes primaires et en élargit considérablement la portée. La règle de trois
bien connue est la première manifestation d'un phénomène linéaire, mais il y en a beaucoup
d'autres comme, par exemple, le célèbre théorème de Thalès. L'algèbre linéaire fonde en par-
ticulier la notion d'espace à plusieurs dimensions et donne la possibilité d'étendre l'idée de
proportionalité à ces nouveaux espaces. Les applications intervenant dans ce cadre sont les ap-
plications linéaires, généralisation multidimensionnelle de la règle de trois. Par l'intermédiare
de ces applications, l'algèbre linéaire est aussi à la base de tous les problèmes d'approximation
au premier ordre que l'on rencontre en analyse, notamment celui de la dérivation.
o La partie IV - ANALYSE - est certainement celle qui est la plus détaillée dans les
classes secondaires, surtout par le biais des études de fonctions. On sait, par exemple pour
une fonction comme
x3 + 1
f : lR ---, JR, XH xz+ 1'
calculer la dérivée, dresser un tableau de variations et tracer un graphe. Mais on ne sait pas
encore exactement ce qu'est l'ensemble lR sur lequel elle est définie, ni comment cette dérivée se
formalise de manière satisfaisante. De même, les fonctions usuelles (exp, ln, sin, cos, tan) sont
« bien connues » depuis les classes secondaires, mais leur définition ne peut être considérée
comme satisfaisante au niveau Ll. L'objet de cette partie IV est d'établir tous les outils
nécessaires à la construction rigoureuse d'une théorie des fonctions, de la notion de nombre
réel à celle de fonction dérivable et de fonction intégrable. Cette dernière notion permet à son
tour de donner un sens précis à la notion de longueur des courbes planes et par là même de
donner la première définition pleinement aboutie du nombre 7t.
XV
La construction d'un programme d'enseignement exige que l'on fasse des choix. Nous avons
privilégié dans ce tome Ll la mise en forme et le développement des notions de mathématiques
pures abordées au lycée. Nous ne négligerons pas pour autant les aspects plus récents de
l'approche des mathématiques, liés souvent au développement de l'informatique, comme le
calcul formel dont l'étude sera abordée dans le tome L2. D'autres parties plus traditionnelles,
comme les probabilités et statistiques, ont été elles aussi jugées mieux adaptées au cours de L2.
Un texte mathématique doit être lu de manière critique et active. Tout au long du texte,
des questions test sont destinées à permettre au lecteur de s'assurer de sa compréhension des
sujets abordés. Il est conseillé de les résoudre au fur et à mesure de la lecture. Elles sont
corrigées à la fin de l'ouvrage. Des exercices, d'un niveau plus élevé, sont regroupés à la fin
de chaque chapitre; ils sont eux aussi corrigés à la fin de l'ouvrage.
Pour conclure cette entrée en matière, nous espérons que cet ouvrage saura apporter au
lecteur non seulement les bases techniques qui lui seront nécessaires dans son cursus univer-
sitaire, mais aussi une part indispensable de plaisir dans la découverte des notions qui y sont
abordées. Pour souligner l'aspect «humain» indissociable de la création mathématique, nous
avons, au début de chaque chapitre, brièvement évoqué quelques personnalités marquantes
(certes choisies de manière très partiale, l'exhausitivité en ce domaine n'étant pas dans les
objectifs de notre ouvrage). Nous espérons ainsi que le lecteur se fera une idée plus fidèle de
la genèse du vaste édifice que sont nos mathématiques contemporaines.
Remerciements
'ÉQUIPE d'auteurs tient à remercier tous ceux qui ont participé de près ou de loin à cet
L ouvrage et, en particulier, tous les étudiants qui dans nos cours ont assisté parfois
patiemment à la mise au point du style d'enseignement qui a motivé sa rédaction.
Sihem Mesnager a relu une première version de la partie «Analyse». Ses critiques construc-
tives en ont fait évoluer la présentation et nous lui en sommes reconnaissants.
C'est à Arnaud Néris que nous devons la fractale qui a servi de base à l'illustration de
couverture. Nous lui sommes reconnaissants de nous avoir permis de l'utiliser.
L'intervention de Jean-Côme Charpentier pour la toute dernière mise en place des solutions
a été déterminante, de même que celle de Bruno Ayela pour la compilation finale. Nous leur
adressons nos sincères remerciements.
La composition de cet ouvrage a été l'occasion d'échanges parfois mouvementés mais tou-
jours fructueux avec Pascale Pernet, directrice éditoriale, et Louise Blottière, éditrice scien-
tifique. Leur foi constante en notre capacité à mener ce lourd projet à bien dans un temps
raisonnable a simplement permis de le voir naître aujourd'hui, ce dont nous les remercions
chaleureusement.
Quelques modes de raisonne ment
ANS la vie de tous les jours, nous utilisons souvent des affirmations pour décrire le
D
◊
monde qui nous entoure, les propriétés des objets, des êtres, etc. Par exemple, une
personne qui voyage souvent peut être amenée à dire
Paris est une grande ville,
◊ Paris est une petite ville,
◊ Paris a plus d'habitants que Lyon,
◊ Lyon a plus d'habitants que Paris.
Les deux premières affirmations expriment des opinions. Paris semble certainement être une
petite ville lorsque l'on revient de Mexico, mais c'est une grande ville si on la compare à Pau
par exemple. Ces deux affirmations ne portent pas de valeur de vérité a priori. En revanche,
nous nous accorderons pour dire que la troisième affirmation est vraie, alors que la quatrième
est fausse. Nous ne nous intéresserons qu'à ce dernier type d'affirmations, que nous appellerons
des propositions, ou aussi des assertions.
Notre but dans tout cet ouvrage va être d'étudier des propositions portant sur des objets
mathématiques, et de déterminer si elles sont vraies ou fausses. Nous ne chercherons pas ici
à définir ce que nous entendons par objet mathématique, et admettrons qu'il s'agit des objets
rencontrés dans la pratique courante de la discipline mathématique, depuis l'enseignement
secondaire. La famille de ces objets s'enrichira de nouveaux membres tout au long de ce
texte, et nous apprendrons progressivement à les manipuler. Ce n'est que dans le cours de
L2 que nous commencerons à donner des définitions plus précises, cela ne sera pas nécessaire
auparavant.
Revenons à l'intuition courante pour présenter plus en détail ce que seront nos problèmes.
Nous aurons à notre disposition des propositions dont nous saurons dès le départ qu'elles
sont vraies ou fausses et toute la question sera de déterminer à partir de ces données si
d'autres propositions, qui nous intéresseront au premier chef, sont vraies ou fausses. Nous
appellerons valeur de vérité le caractère vrai ou faux d'une proposition. En d'autres termes,
nous chercherons donc à déterminer la valeur de vérité de certaines propositions connaissant
la valeur de vérité d'autres propositions. Nous appellerons raisonnement la chaîne de pensées
qui nous permettra de le faire.
La logique a pour objectif premier de dégager les règles du raisonnement correct. Consi-
dérons les deux raisonnements R1 et R2 suivants.
1
[/J
<1)
En d'autres termes, notre deuxième assertion nous indique que la deuxième assertion de
la clause est fausse. On en déduit que la première assertion de cette clause est nécessaire-
ment fausse. Donc la proposition contraire [la lampe n'est pas allumée] est vraie, d'où notre
I
;::l
conclusion.
Dans le raisonnement R2 , les assertions sont changées (et quelque peu fantaisistes) mais la
Ol
structure de la chaîne de pensées utilisée est exactement la même, comme on peut facilement
s'en convaincre. C'est précisément ainsi que le logicien envisage ses problèmes. Il oublie la
valeur de vérité des propositions qu'il considère et ne s'intéresse qu'aux structures des chaînes
de pensées qui permettent de passer des unes aux autres. Du point de vue logique, les deux
raisonnements R1 et R2 sont exactement les mêmes.
Le raisonnement R1 porte sur des objets de la vie courante, alors que R2 porte sur des
propositions abstraites. Les choses ne seront pas différentes lorsque les propositions porteront
sur des objets mathématiques. Donnons un troisième exemple, emprunté aux connaissances
des classes secondaires.
Cet exemple est encore basé sur le même type de raisonnement. On affirme que 2 n'est
pas dans l'intervalle [3, +oo[ (ce qui provient de nos définitions des symboles 2 et 3), et la
première clause nous apprend que si l'assertion x3 ~ 27 est vraie, alors l'assertion x E [3, +oo[
est vraie. Comme cette dernière est fausse lorsque x = 2, il en résulte que la première assertion
x 3 ~ 27 est aussi fausse dans le cas où x = 2. C'est donc le contraire de cette assertion qui
est vrai, et ce contraire est 2 3 < 27.
un nombre réel, l'ensemble de référence est alors la droite réelle, traditionnelleme nt notée JR.
Considérons la proposition p(x) suivante, qui dépend d'un nombre réel x et qui est définie par 1::
1
2
p(x) : « x ) 0 ».
On sait (par la règle des signes) que cette proposition est vraie pour toute valeur de x. On r/J
·ca
écrira donc « pour tout réel x, p(x) est vraie » ou encore « pour tout x appartenant à JR, ~
(L)
x2 ) 0 ». "O
~
En revanche, l'énoncé
q(x) : « x 2 > 4 »
1r/J
(L)
2
n'est pas vrai pour tout x réel, mais puisque 3 = 9 > 4, il existe une valeur réelle x telle
que la proposition q(x) soit vraie (la valeur x = 3 convient, mais ce n'est évidemment pas la
i;:l
Ol
seule). On écrira donc « il existe un réel x tel que q (x) soit vraie » ou encore « il existe un
réel x tel que x2 > 4 ».
2
Notons que dans les deux exemples précédents, l'écriture explicite des assertions x ) 0 et
x 2 > 4 à l'intérieur des propositions considérées sous-entend qu'elles sont vraies. Pour cette
raison, on convient que l'écriture « p (x) » à l'intérieur d'une proposition signifie « p (x) vraie».
Ceci nous amène à souligner la convention suivante.
Convention (C). Lorsqu'on rédige des mathématiques, une proposition écrite est implicite-
ment supposé vraie, sauf mention contraire.
Afin d'alléger l'écriture des propositions, les logiciens ont choisi une notation symbolique
2
pour les locutions «quelque soit 1 » et « il existe ».
Définition 1. Le symbole V signifie «quelque soit», on l'appelle le quantificateur universel.
Le symbole :l signifie « il existe », on l'appelle le quantificateur existentiel.
1
Le symbole V n'est ni plus ni moins que le A à l'envers du al/ anglais.
2
Le symbole :3 n'est ni plus ni moins que le E à l'envers du exists anglais.
X][
Le premier énoncé se lit, dans l'ordre « pour tout x EX, la proposition « pour tout y E Y,
.
É p(x, y)» est vraie». Le bon sens montre qu'il revient au même de dire que« pour tout x EX et
.
E
C
tout y E Y, la proposition p (x, y) est vraie » ou encore que « pour tout couple (x, y) E X x Y,
la proposition p (x, y) est vraie ». Il revient donc encore au même de dire que « pour tout y, la
E proposition « pour tout x, p(x, y) » est vraie» : les propositions 1) et 2) ont donc toujours
i
la même valeur de vérité, nous dirons provisoirement qu'elles sont synonymes.
Ë
.
-c Le lecteur aboutira de la même manière au constat que les propositions 6) et 7) sont aussi
.
,n
-g
synonymes, et se convaincra ainsi du bien-fondé de la règle suivante.
e
,n
V Rigi~. f Lê8 propasit{o1%S .ivx . ~· x;VjfE' Y.p(1'i\tf»'et"«Vv":E V: 'il*••·e X~p(1e/!k}. » sont
X.,39 'ÈË Y;<'.,pf'lt;, y}~· ét. •ilf··ay•. :e.,Yj:lx E :X;· pli; lil »
ÇJ/li01l1J'll,ifs; ÜS· p~Jiitttitts 4\3x·!:E
!
;::l .s<mt, syhTJti~-
Ol
Il faut en revanche prendre garde à l'intervertion des symboles V et :3. L'énoncé 3) signifie
il existe un x tel que la proposition « pour tout y, p (x, y) » soit vraie. En permutant les blocs
«::lx» et « Vy », on obtient la proposition 8) qui signifie pour tout y, la proposition « il
existe x tel que p(x, y) » est vraie. Ces deux propositions ne sont pas synonymes.
Les lecteurs que ces deux règles laisseraient perplexes s'exerceront à discerner les différences
entre les huit propositions dans des cas issus de la vie courante. Le prochain exemple éclaicira
certainement ce propos.
EXEMPLE 5. Traduisons en toutes lettres les huit propositions précédentes lorsque x désigne
un homme, y un film et que p(x, y) est la proposition« L'individu x a vu le film y».
1) signifie « Chaque individu a vu tous les films ».
2) est synonyme de 1).
3) signifie « Il existe un individu qui a vu tous les films ».
4) signifie << Il existe un film qui a été vu par tous les individus ».
5) signifie « Chaque individu a vu au moins un film».
6) signifie « Il existe un film qui a été vu par au moins un individu »ou encore « Il existe un
individu qui a vu au moins un film ».
7) est synonyme de 6).
8) signifie « Chaque film a été vu par au moins un individu».
Nous vérifions sur cet exemple que les propositions 3) et 8), obtenues par permutation
des blocs \;/y et ::lx, ne sont pas synonymes.
« x < 0 ». Nous noterons non(p) la négation de la proposition p, elle est fausse si p est vraie,
et vraie si p est fausse 3 .
On peut maintenant aller plus loin et chercher comment trouver la négation de proposition
contenant des quantificateurs. En faisant encore appel au bon sens, on voit que la seule
manière de contredire une proposition telle que « quel que soit x dans X, la proposition p(x}
est vraie » est d'en donner un contre-exemple, c'est-à-dire de mettre en évidence une valeur
10
r/J
'@
1.
particulière x 0 E X telle que la proposition p(xo} soit fausse. La négation de « Vx EX, p(x}» ~
est donc« ::lx EX, non(p(x}} ». D'une façon tout aussi intuitive, la négation d'une proposition
r/J
Ill
'O
telle que « il existe x dans X tel que la proposition p(x} soit vraie » est « pour tout x dans
X, la proposition non( p (x}) est vraie ». Le contraire de « ::lx E X, p (x} » est donc « Vx E X,
s
r/J
Ill
non(p(x)} ». Nous résumerons ces résultats dans la très importante règle suivante.
t;:l
~gl~:Jl, /: . ·>:,~\ < . . . .•· .·. •.. .. . : Ol
X,.
Là négoiwrt. àe '!tex e y(xJ ,esf•ih ~X, 11.~{p{xH,
l,iJ, itiêgâtiw de h EX;.f>{'ll) est Vx:eX;ti0n(p(X :)}:
Notons là encore que les négations ainsi construites ne sont que des exemples dans la classe
de toutes les propositions synonymes possibles.
Plus généralement, la négation d'une proposition s'écrivant
L'implication mathématique est à la base de la plupart des raisonnements que nous aurons à
rencontrer. En voici la définition.
Définition 8. Soient p et q deux propositions. Nous dirons que la proposition p implique
la proposition q, et nous noterons p ==} q, si on peut affirmer que q est vraie lorsqu'on sait
que p est vraie.
3
Notons que notre présentation comporte ici une part d'intuition et ne peut être considérée comme complète-
ment établie. En particulier, non(p) désigne en fait tout énoncé dont la valeur de vérité est celle que nous
avons décrite. Cela n'entraîne cependant en pratique aucun inconvénient.
xxii
Notons que si p et q sont des propositions, p =} q peut aussi être considérée comme
.., une proposition, qui peut être vraie ou fausse. Conformément à notre convention, dans un
C
CU
texte mathématique l'écriture p =} q sous-entend toujours que cette proposition est vraie.
Ê Ici cependant nous considérons encore l'écriture p =} q comme une proposition pouvant être
§
<1}
vraie ou fausse.
"§ L'utilisation de l'implication est à la base de ce que l'on appelle le raisonnement dédl!ctif,
CU
'O dont le principe est donné dans la règle suivante.
<1}
CU
1<1}
CU
On retiendra que les deux hypothèses p =} q vraie et p vraie sont indispensables. Il faut
& donc pour un raisonnement déductif pouvoir assurer à la fois que l'implication est vraie, et
'il
;:l
Ol que la première assertion de l'implication l'est aussi. Il faut donc en particulier disposer de
procédés permettant de décider qu'une implication est vraie.
EXEMPLE 10. Soient <X et 13 dans JR. Montrons que (a2 + al3 + 13 2 = 0) =}(<X= 13 = O).
► Supposons que a 2 + al3 + (3 2 = O. Puisque
Notons que nous avons utilisé la convention (C) dans l'exemple précédent. En effet, ( a 2 +
al3 + 13 2 = 0) =}(<X= 13 = 0) y signifie: l'implication« (a2 + al3 + 13 2 = 0) =}(<X= 13 = O) »
est vraie.
Cet exemple peut donner l'impression de tourner en rond. Nous voulons démontrer que
certaines assertions sont vraies au moyen d'implications, et nous venons de démontrer qu'une
implication est vraie au moyen d'une étude directe des assertions qu'elle contient. L'intérêt
du raisonnement déductif vient en fait de la règle suivante, que l'on appelle transitivité de
l'implication.
Ce résultat est à la base de preuve par déduction : si partant d'une hypothèse vraie p, on
prouve successivement que des implications sont vraies, jusqu'à aboutir à une proposition r,
alors r est vraie. Il est donc possible de montrer que des implications entre propositions sans
rapport immédiat entre-elles sont vraies, au moyen de chaînes d'implications plus faciles à
aborder. Nous en verrons de nombreux exemples dans cet ouvrage.
On dit en français que la proposition p est une condition nécessaire de q ou encore que q est
une èondition suffisante de p. D'un point de vue logique, ces deux affirmations signifient que
l'implication q =} p est vraie.
Définition 12. Soient p et q deux propositions. On dit que p est une condition suffisante
de q ou de manière équivalente que q est une condition nécessaire de p lorsque p =} q est
vraie.
Il existe d'autres mameres pour dire qu'une condition est nécessaire, ou suffisante. Si
p =} q, on voit que pour que p soit vraie, il faut que q soit vraie, alors que pour que q soit
vraie, il suffit que p soit vraie.
II.3. La contraposition
Considérons la phrase suivante
Sans préjuger de la validité de cette proposotion, chacun s'accordera à dire qu'elle est équi-
valente à
vache pas normande=} vache sans tache (II).
Le passage de l'énoncé (I) à la proposition synonyme (II) s'appelle en logique la contraposition.
Dans la pratique, lorsque l'on devra démontrer une implication, on se demandera s'il n'est
pas plus simple, en fonction des hypothèses de l'énoncé, de prouver sa contraposée. Illustrons
sans plus attendre ce principe.
2
EXEMPLE 14. Soit n EN. Prouvons que (n impair) =}(n impair).
(n pair) =} (n 2 pair).
► Raisonnons par contraposition. Soit n E N. Il s'agit d'établir que
2 2 2
Supposons n pair. Il existe alors m E N tel que n = 2m. Ainsi n = 4m et n est donc
pair.
Dans cet exemple, la contraposée est plus facile à prouver : l'hypothèse non( q) portant sur
n, il suffit d'élever au carré pour obtenir un renseignement sur n 2 . Bien entendu, il n'y a pas
de miracle. Deux propositions synonymes sont aussi difficiles à montrer l'une que l'autre. Mais
il est possible que l'une des deux versions soit mieux adaptée aux données dont on dispose,
ou aux habitudes de preuve de chacun.
EXEMPLE 15. Soit a ER Prouvons que (Ve E JR~, lai< c) =}(a= 0).
► Raisonnons par contraposition. Supposons a f. O. Posons E = lal/2: on a E > 0 et lai): E.
Ainsi 3c E JR~ tel que lai ): E, ce qui est la négation de \ic E JR~, lai < E, comme nous
l'avons vu.
xxiv
~ sait que p est vraie, et si de plus on peut affirmer que p est vraie si on sait que q est vraie.
On peut donc donner la définition suivante.
~
11)
"Cl Définition 16. Deux propositions p et q sont équivalentes si p ==} q et q ==} p. On note
r/)
11) alors p # q.
"Cl
0
a
r/) En d'autres termes, deux implications sont équivalentes lorsqu'elles sont synonymes.
!;:l
Ol
Lorsque p et q sont équivalentes, p est une condition nécessaire de q et p est aussi une
condition suffisante de q. On dit alors que p est une condition nécessaire et suffisante4 de
p. On écrira également que p est vraie si et seulement si q est vraie. De même q est une
condition nécessaire de pet q est aussi une condition suffisante de p, donc q est une condition
nécessaire et suffisante de p.
EXEMPLE 17. Montrons que pour tous nombres réels x et y, lx+yl = lxl+lyl si et seulement
si xy O.~
► Raisonnons en deux temps.
( {==) Supposons xy ~ 0. Alors x et y ont nécessairement le même signe. Notons é: = + 1
s'ils sont positifs, et é: = -1 s'ils sont négatifs. On voit donc que lxl = EX, 1111 = é:1/ et
lx+yl = dx+y) d'où lx+yl = lxl + 1111-
(=}) Supposons lx+ 111 = lxl + IYI- En élevant cette égalité au carré, on obtient sans peine
x2 + y2 + 2xy = x2 + y 2 + 2lxllyl, ainsi xy = lxllYI et donc xy ~ O.
Dans un souci de clarté, on énoncera toujours précisément l'implication que l'on est en
train de montrer. Notons que cet exemple est écrit de la manière légèrement abrégée qu'il est
de coutume d'employer en mathématiques. Nous avons dit « On voit que» pour signifier que
la vérification de l'assertion qui suit ne présente pas de difficulté. De même « On obtient sans
peine » fait ici référence à un simple calcul.
Bien entendu, il n'est pas toujours indispensable de dissocier la preuve d'une équivalence
en deux volets ({==) et (=}) , on peut aussi raisonner directement.
EXEMPLE 18. Mçmtrons que pour tous nombres réels x et y, lx+yl = lxl+lyl si et seulement
si xy ~
O.
► Puisque les deux membres sont positifs lx+ YI = lxl + 1111 si et seulement si lx+ yl 2 =
(lxl + lyl)2, ce qui équivaut à xy = lxyl, soit xy ~ O.
Les deux preuves que nous venons de donner ne sont pas différentes. Elles se distinguent
simplement par leur présentation, et par l'accent mis sur l'une ou l'autre des difficultés.
4
Ce que l'on note parfois CNS en abrégé.
XXV
EXEMPLE 20. Établissons que pour tous réels x et y, lx+ YI:( lxl
► Soient x et y dans lR. Comme les deux membres sont positifs,
+ lyl.
lx + y1:( lxl + IY I si et
2
seulement si lx+yl 2 :( (lxl + lyl)2, donc lx+yl :( lxl + IYI # x2 +2xy +y 2 :( x2 +21xllyl +y .
i
Ol
xy :( lxyl. Puisque cette dernière inégalité est vraie, on en déduit que lx+ YI :( lxl + IYI est
également vraie.
Toutes les règles précédentes formalisent certains types de raisonnements. Elles ne doivent
pas faire oublier que le « bon sens», emprunté à la vie courante, est toujours à l'œuvre dans
les considérations que nous allons développer dans cet ouvrage. Il serait illusoire de prétendre
tout démontrer en détail.
"~
•--- -:;,.;-~
xxvi
Il est recommandé au lecteur de présenter ses raisonnements par récurrence selon l'exemple
suivant.
10
rJJ
·@
...
EXEMPLE 23. Montrons que \ln E N, 5n+2 ? 4n+2 + 3n+2_
► Raisonnons par récurrence. Pour n EN, notons HR(n) la proposition 5n+2 ? 4n+2+3n+2_
◊ HR(O) est clairement vraie puisque 5 2 = 4 2 + 3 2 .
Cl)
'O ◊ Prouvons que Vn? 0, HR(n) =} HR(n + 1 ). Soit un entier n? O. On suppose que HR(n)
rJJ
Cl) est vraie, c'est-à-dire que 5n+2 ? 4n+2 + 3n+2 . Ainsi 5n+3 = 5 X 5n+2 ? 5 x 4n+2 + 5 x 3n+2 •
s
'O
Or, 5 X 4n+2? 4n+3 et 5 X 3n+2 ? 3n+3 d'où 5n+3 ? 4n+3 +3n+3 _ L'hypothèse HR(n+ 1) est
rJJ
Cl)
donc vérifiée.
& ◊ D'après le principe de récurrence, HR(n) est vraie pour tout entier naturel n.
-g
Ol Il est parfois nécessaire de recourir à une version légèrement différente du raisonnement
par récurrence, donnée dans la règle suivante.
Règle 24. $oit no E ~- P!Jv,r tO'Ut entier natureln ?: lto,· on considère. un~ irar,mntiQrt
HR(nJ dépt,ntlànt;tjf! a. Alors, si ttRJ1to)est vraie et si pour tout entier n ;;,, notla proposition
{HR(no) etliR(]lo+l) et .•. t!,t HR{tt}]'. =} }J.R(n+))
est. vraiè; âlôrs '[)Our tJut entiéi n J n 0 , HR(n) est vraie.
Première partie
BASES
ANS cette partie, nous rappelons les connaissances acquises dans les classes secondaires
la formalisation de ces idées, en permettant de donner des modèles pour ces objets, dont les
premiers sont les espaces vectoriels réels de dimension 1, 2 ou 3. Bien entendu, la portée de
l'algèbre linéaire ne se limite pas à unuelle formalisation : il est par exemple possible de
définir des espaces de toutes dimensions, et d'étudier certaines de leurs transformations. Il est
toujours possible de fixer une base dans un espace vectoriel, finie si la dimension de l'espace
est finie, et de repérer les éléments de cet espace vectoriel par leurs coordonnées dans cette
base. À quelques nuances près 1 on peut ainsi considérer que le cadre général de ce que nous
appelons habituellement «géométrie» sera fermement établi, à l'exception cependant de la
définition des distances et longueurs, sur lesquelles nous allons revenir.
o Distance entre deux points, longueurs de segments. Lorsqu'on se donne un repère
orthonormé dans le plan, et que l'on représente les points par leurs coordonnées dans ce repère,
il est possible de définir la distance entre le point A de coordonnées (x, -y} et le point B de
coordonnées (x', -y') au moyen de l'expression
Mais la notion de repère orthonormé n'est pas clairement définie, on fait en général de nouveau
appel à l'intuition en figurant un tel repère au tableau par un couple de vecteurs issus d'un
point et faisant entre eux un« angle droit». La distance calculée au moyen de l'expression (D)
correspond alors à la distance usuelle, mesurée au moyen de règles, ce qui traduit simplement
le théorème de Pythagore.
La formalisation complète de ces notions sera donnée dans le cours de L2 , elle fait partie
de ce que l'on appelle la géométrie euclidienne. Nous nous limiterons ici, lorsque nous aurons
à parler de distance entre deux points du plan ou de l'espace, aux modèles donnés par les
espaces vectoriels JR. 2 et JR. 3 ( que nous appellerons canoniques), dans lesquels les éléments sont
des couples et des triplets, et nous définirons la distance entre ces éléments au moyen de
l'expression (D) ou de sa version tridimensionnelle.
o La longueur des courbes du plan. Le plan sera donc maintenant représenté par le
modèle de l'espace vectoriel canonique JR. 2 , et la distance entre deux éléments du plan sera
définie par (D). On se pose alors le problème de mesurer la longueur des courbes du plan. Il
est donc d'abord nécessaire de définir ce que nous entendons par «courbe». Il s'agit d'une
notion assez difficile à mettre au point complètement, cela ne pourra être fait convenablement
qu'au chapitre 30. Pour l'instant, limitons-nous à l'idée intuitive que l'on peut se faire d'un
tel objet, fondée sur des exemples. Une droite du plan est certainement une courbe, la plus
simple d'entre elles, de même que le cercle, ou que l'ellipse, ou qu'un arc de cercle, ou que des
arcs de cercles joints bout à bout.
Comment définir convenablement la longueur d'un tel objet? Pour un segment de droite,
c'est simplement la distance entre les points extrêmes. Dans les autres cas, il est clairement
nécessaire d'introduire une définition nouvelle, qui sera fondée sur la définition préalable de la
notion de courbe et que nous ne donnerons donc pas encore (voir les chapitres 27 et 30). Nous
nous limiterons ici à tenter de faire sentir qu'il serait risqué de se satisfaire de l'idée intuitive
de cette notion sans la formaliser précisément.
Nous allons considérer dans le plan un segment S de longueur 2, et noterons O son milieu.
Puisqu'on connaît la notion de distance entre deux points, il est possible de considérer un
demi-cercle C de centre O et de rayon 1, dont les points extrêmes A et B sont les deux
1
Le modèle le plus adéquat pour la notion d'espace est en fait celui d'espace affine, que nous verrons dans le
cours de 12.
3
extrêmités du segment S. On sait depuis les classes primaires que la «longueur» de C est
égale à n, mais on ne connaît pas le sens exact du mot longueur. Nous n'en aurons pas besoin §
ici. Nous supposerons seulement.__gue si Cest la longueur du demi-cercle C, alors un demi-cercle :0
(.)
dont le diamètre est de longueur a (ce qui est bien défini) a pour longueur a x C/2. .g
Considérons maintenant la figure suivante, dans laquelle nous avons tracé une famille de
courbes (Cn), La courbe Co est par définition le demi-cercle C. La courbe C 1 s'obtient en
j
mettant bout à bout deux demi-cercles de rayon 1/2, centrés aux points milieux de AO et
OB. De même la courbe C2 s'obient en mettant bout à bout quatre demi-cercles, et ainsi de
suite.
On obtient ainsi une suite de courbes, qui s'aplatissent sur le segment S, comme le montre
l'exemple de la courbe Cs.
ooooooooooocv::v:vv:::-ooooooooooocv::,ooo
FIGURE 2. La courbe Cs
Quelle est la longueur de la courbe Cn? On voit que pour obtenir C 1, on a juxtaposé deux
demi-cercles de longueur C/2, donc la longueur de C 1 doit être C. De même, pour construire
C2, on a juxtaposé 4 demi-cercles de longueur C/4, on en déduit que la longueur de C2 est C.
On se convainc ainsi que la longueur de Cn est toujours égale à C.
Mais une autre intuition nous dit que comme Cn s'aplatit sur S à mesure que n grandit,
sa longueur doit être de plus en plus proche de celle de S. On en déduit donc que C= 2. Or C
est la longueur de C, dont nous avons depuis longtemps admis qu'elle était égale à n. Et nous
avons aussi appris que n = 3, 14159 ... Il y a donc là certainement un problème.
o Le nombre n. Le problème que nous venons de signaler porte à la fois sur la mesure des
longueurs des courbes et la définition du nombre n. On pourrait aussi penser que notre in-
tuition portant à croire que la longueur de Cn doit se rapprocher de celle de S est erronée,
et que l'on n'a pas le droit de passer à la limite quand on considère des longueurs. Mais
c'est précisément ainsi qu'Archimède a donné des évaluations assez précises du rapport de
la «longueur» du cercle à celle du diamètre (rapport noté 2n ... ). Il a construit des suites
de polygones inscrits et circonscrits dans le cercle, dont il pouvait définir et calculer les lon-
gueurs puisqu'il s'agit de réunions de segments de droites, et montré que les deux suites de
(
longueurs ainsi obtenues semblaient se rapprocher indéfiniment. Leur « limite » commune ne
pouvait qu'être ln.
Nous n'irons pas plus loin dans ces questions ici, nous ne les avons signalées que pour mettre
en évidence plusieurs nécessités. Les longueurs sont des nombres, il faut donc en préalable
;::: définir correctement ce qu'est un nombre. Les longueurs semblent faire intervenir ce que nous
avons appelé un passage à la limite, ce procédé doit donc être convenablement étudié. La
longueur d'une courbe n'est pas clairement définie, et il n'est même pas évident que tout ce
que nous pensons être une courbe puisse posséder une longueur ... il y a donc beaucoup de
travail avant d'espérer donner un sens précis à toutes les notions évoquées plus haut.
Une grosse partie de ce travail de fondement sera donnée dans la partie analyse de cet
ouvrage, on se reportera en particulier au chapitre 28 pour les questions concernant la longueur
des arcs de cercles. Seule l'explication du paradoxe des courbes Cn, tendant à prouver que
f = n, sera remise au tome 12, elle nécessite l'étude des modes de convergence de suites de
fonctions.
o Les mesures d'angles et les lignes trigonométriques. Ce qui précède montre assez le
danger de travailler sur des notions incomplètement formalisées. Nous espérons en évoquant la
difficulté inhérente à la mesure des courbes avoir fait sentir au lecteur que les notions d'angle,
telles qu'on les définit sur le cercle trigonométrique, ainsi que celles de lignes trigonométriques,
sont en fait en attente de définitions plus complètes que celles que l'on donne à titre provisoire
dans l'enseignement secondaire. On trouvera dans cet ouvrage les réponses à ces questions,
en particulier au chapitre 28.
c Chapitre 1
UN PEU DE GÉOMÉTRIE PLANE
C'est sous l'impulsion de Thalès de Milet 2 que la géométrie devient déductive : l'idée de
démonstration s'impose et repousse les limites mathématiques au-delà de la simple descrip-
tion. Selon Proclus, Thalès rapporta la géométrie de ses nombreux voyages en Égypte.
1
484-425 av. J.-C.
2
625-547 av. J.-C. On peut voir une reconstruction de la porte du marché de Milet au Pergamonmuseum de
Berlin.
3
:s;ous dirions de nos jours chapitres.
~ :S.ewton lui-même écrira son célèbre ouvrage Philosophiae Natumlis Principia Mathematica dans le style des
Éléments d'Euclide.
6
I.1. Avertissement
..:
.!::
;:: Toute théorie mathématique repose sur un certain nombre de résultats considérés comme
t vrais et que l'on appelle des axiomes 5 . Ce recours est inévitable : on ne peut construire une
théorie à partir de rien. Euclide fut le premier savant à proposer une axiomatisation de la
géométrie. Par exemple, le cinquième et célèbre postulat d'Euclide affirme que « par tout
point du plan passe une unique droite parallèle à une droite donnée ». Cette axiomatique
imparfaite fut retravaillée par David Hilbert à la fin du XIXe siècle. De nos jours, l'approche
traditionnellement retenue est de fonder la géométrie sur la notion de vecteur. L'ambition
de ce chapitre n'est pas de définir rigoureusement les notions de points et de vecteurs mais,
à partir des notions empiriques de géométrie acquises dans le secondaire, de développer de
nouveaux outils de résolution et de calcul.
Essayons de dégager les particularités de cet ensemble.Pest muni d'une opération appelée
addition dont le contenu est rappelé dans la figure l. Il est clair que l'ensemble (P, +) jouit
des propriétés suivantes.
o (P, +) est un groupe dont l'élément neutre est noté O, c'est-à-dire que + vérifie les
propriétés suivantes :
a. Associativité: Vû, v, w E P, ü + (v +w) = (û + v) +w;
b . le vecteur Ô est élément neutre : V Ü E P , Ü + Ô = Ô + Ü = Ü;
c . existence d'un opposé : tout vecteur Ü E P admet un opposé, ie V Ü E P, il existe
v E P tel que Ü + v = v + ü = O. On le note v = -Ü;
o Le groupe (P, +) est abélien, c'est-à-dire V Ü, v E P , Ü + v = v + ü.
5
Ou encore des postulats.
7
Ajoutons que la notation -ü empfoyée ci-dessus a un sens car l'opposé est nécessairement
unique (cf. le chapitre sur les structures).
Le groupe (P, +} est également muni d'une opération dite externe qui à un nombre réel À et
un vecteur ü associe le vecteur À· Û (que l'on note plus simplement "Au) défini naturellement:
ÀÛ est nul si À = 0 ou ü = Ô; À· Ü est de même direction que Ü; À· Ü de même sens
si À > 0, de sens contraire lorsque À < 0; la norme de À· Ü vaut l"AI fois celle de Ü. Cette
opération vérifie les règles de calculs suivantes.
On résume l'ensemble de ces propriétés en disant que ces opérations définissent sur l'en-
semble P une structure d'espace vectoriel réel. L'étude de cette structure particulière est l'objet
de l'algèbre linéaire, et plusieurs chapitres y seront consacrés. On déduit de la définition des
vecteurs que pour tous À E IR. et Ü E P, l'égalité À· Ü = Ô est équivalente à la proposition
"A= o ou ü = o.
6
6
On pourrait en fait déduire ce résultat des seules propriétés encadrées, (cf. la règle 17.3).
8
rfl
P est un espace vectoriel réel de dimension deux
Cl)
~
CO Soient (Ü, v) un couple de vecteurs non colinéaires de P. Pour tout vecteur w, il existe
..... un unique couple de nombre réels (x, -y) tel que w= x Ü + -y v.
w=xÜ+-yv
v ,,
-------.,!
û xu
Définition 1.3. (Bases de P, coordonnées d'un vecteur dans une base). Un couple
de vecteurs non colinéaires !!il = (Ü, v) est appelé une base de P. Pour tout vecteur w, il
existe un unique couple de nombre réels (x, -y) tel que w = x Ü +-y v.
On dit que (x, -y) ,qg sont
les coordonnées de w dans la base !!il.
Il faut savoir calculer sans hésiter les coordonnées dans une base d'une combinaison linéaire
de vecteurs de P.
v v
En effet, ai= x 1Ü + -y, et ai= x 2Ü + 1J2 donc, d'après les règles de calcul énoncées
ci-dessus, Àai +µai= (Àx1 + µx 2)Ü + (À-Y1 + µ-y 2)v. Ainsi, par définition, les coordonnées de
Àai + µai sont (Àx 1 + µx 2, À-y 1 + µ-y 2),qg. On retiendra que les coordonnées d'une combinaison
linéaire de vecteurs se calcule en effectuant la même combinaison linéaire sur les coordonnées
des vecteurs en jeu. Cette règle se généralise sans peine à toute combinaison linéaire d'un
nombre fini de vecteurs, telle que Àai + µai+ 'V(½.
Une unité de longueur et une orientation de Pétant choisies, nous verrons dans la partie III
de ce chapitre qu'il est possible de définir la notion de mesure des angles orientés.
Définition 1.4. (Vecteurs orthogonaux et notation ..l). On dit que deux vecteurs Ü et
v sont orthogonaux lorsque l'un d'entre eux est nul ou lorsque (û, v) = ±n/2. On notera
de manière condensée Ü..l v cette propriété.
9
1.3. Bases de P
Une orientation du plan étant choisie (ie un sens de parcours sur les cercles, appelé sens
trigonométrique), on peut définir la notion de base directe de P.
Définition 1.5. (Base directe). Une base (Ü, v} est dite directe lorsque (ü, v} E]O,n[
et indirecte lorsque (Ü, v} E] - n, O[.
,....;
.d
u
v v
(û, V) est une base indirecte (û, V) est une base directe
Une base &J = (Ü, v} de P sera dite orthonormée lorsque llûll = llvll = 1 et Ü..l v. On
dira que &J est orthonormée directe lorsque en plus (Ü, v} = +n/ 2. Il faut connaître les
résultats fondamentaux suivants, qu'il faut considérer comme de véritables axiomes.
On retiendra également que deux vecteurs non nuls et orthogonaux ne sont pas colinéaires
et forment donc une base de P.
Soit D une droite vectorielle de P. Il est immédiat que Vu E D \ { Ô}, D = vect ( Ü} : une
droite vectorielle est engendrée par n'importe lequel de ses éléments non nul. Une droite vecto-
rielle est stable par combinaison linéaire, c'est-à-dire que toute combinaison linéaire de vecteurs
de D est un vecteur de D. En effet, il existe un vecteur non nul Ü tel que D = vect (û}; il
est clair que toute combinaison linéaire de vecteurs colinéaires à Ü reste colinéaire à ü, d'où
le résultat. D'un point de vue intuitif, une droite vectorielle est un objet de dimension un;
d'une manière générale, on appelera espaces vectoriels de dimension un les droites vectorielles.
10
Anticipons un peu le mouvement du cours. Les droites vectorielles nous serviront à diriger
UJ
V
les droites affines (ie des droites en tant qu'ensemble de points du plan 9). Ce qui se cache
gJ derrière la notion de droite vectorielle est donc l'idée de direction.
CO
...:
1
V
3û ----, w(4+3il
Rappelons que le choix d'une base orthonormée
directe !?li = (û, v) du plan vectoriel P per-
met de définir l'affixe d'un vecteur. Soit w un
û :
Z:
:
v
___________
1
1
j
4v
vecteur de coordonnées (x, 1Jl.sW dans la base !?li.
L'affixe z de w dans !?li (on dit aussi « relati-
vement à !?li » ) est définie par z = x + i1J.
On écrira de manière condensée w(z) la pro-
position « w est d'affixe z » , voir la figure ci-
FIGURE 1.3. Affixe d'un vecteur contre.
:ProposfJ:ibn l.7~ {ltfglê de gi:lêtd); -• f>oùr tou~ vêcteuts <tt, <ii ·dla~ês a:1 , a'.2 et tt?-«S
réels À, µjl'o,ffixe du vecteur Ànt +µiij èst À.0..1 + µttz. - -
PREUVE. Soient (xi, 1Ji ).sW et (x2, 1J2).sW les coordonnées des vecteurs ai et ai dans la base !?li.
Puisque les coordonnées du vecteur Àaj + µai dans cette même base sont (Àx 1 + µ1) 1, Àx 2 +
µfü).@, son affixe est égale à ÀX1 + µ1)1 + i(ÀX2 + µfü) = Àa, + µaz. ■
Dans ce paragraphe, nous présentons deux outils fondamentaux de la géométrie que nous
généraliserons dans la suite à des espaces vectoriels de dimension quelconque.
,....;
L'expression « Ü • v » se lit « u scalaire v » ou encore « produit scalaire de Ü par v » . De
.d
la définition donnée ci-dessus de l'orthogonalité, on déduit immédiatement la caratérisation ü
des vecteurs orthogonaux à l'aide du produit scalaire.
~~:~.~~,'f(~~~:~,~~~t~)··•····•·~·. :
:~~ "Y";t'" €,Î~,;~~ . . •.·l%*t'iz·:'#.à(~t..m,tr;,?i.r.;;~:i;
s) ~if~, "~J)fp,:•·tt~, • ü.~~··ll~ll~.•?•o:;
4) ·,XJ;:.fiè~·y~,f: .faurw/4.v~;~rti.',,.~~ J tr '. ii ~ Jrü'U ,!1o~l;éfuîvalerice suivante
ü. û ± ô lii étsêulêmèntsî û:,:: ô. . ..···. ·... · . .. . ' . .
PREUVE. Notons u, v et w les affixes relativement à ~ des vecteurs u, v et w. 1) Soit
µ E R On a Ü · (v + µw) = 9te(u(v + µw)) = 9te(uv + µuw) = 9te(uv) + µ9te(uw) par
R-linéarité de la partie réelle, µ étant un réel. On a donc ü • (v + µw) = ü • v + µ ü •w. La
deuxième partie du 1) découle de la première et de 2) qui est immédiat car Ü • v = !Re (uv) =
!Re(uv) = !Re(uv) = 9te(vu) = v · ü. 3) ü · ü = !Re(uu) = 9te(lul ) = lul 2 = llûll2 > O.
2
Identités remarquables
Pour tous vecteurs Ü et v,
et
11rrll2- llvll 2 = (ü + vl. (ü- vJ.
1
.
Le produit scalaire de deux vecteurs est un nombre réel dont la valeur absolue est majorée
par le produit des normes des vecteurs.
PREUVE. L'inégalité est immédiate lorsque Ü ou v est nul. Dans le cas contraire, on a
Jt·1i;.
11 11
= cos(û, v) E [ -1, ll, d'où le résultat. Le cas d'égalité est clairement équivalent à
Ü = Ô ou v = Ô ou Ü et v non nuls et Icos(Ü, v)[ = 1 ie (Ü, v) = 0 ou n. On a donc
égalité si et seulement si Ü et v sont colinéaires. ■
PREUVE. Nous donnerons deux preuves de ce résulat. 1) Choisissons une base orthonormée
directe !JlJ de Pet notons u et v les affixes respectives de Ü et v relativement à !Jl/. On a alors
û + v = (u+v), llû + vll = [u+vl, llûll = [u[ et llvll = [vl, l'inégalité triangulaire pour les
vecteurs est donc une simple conséquence de l'inégalité triangulaire sur (C vérifiée paru et v :
[u+v[:,;; lui+ [v[.
l
13
i
:s
Cl)
,Cl)
2) Puisque les deux membres sont positifs, l'inégalité triangulaire est équivalente à 11 u+ vll 2 :( "Cl
2
(llull + llvlll2, c'est-à-dire llull2 + 2u · v + llvll2:,;; llull + 2llullllvll + llvll2, ou encore [
u · v :( Il ull Il vil qui est acquise puisqu'il s'agit de l'inégalité de Cauchy-Schwarz. ■ §
,....;
rr. v = 1 rr + vll2 -
[Il Il rr - vll2].
-u
Puisque la hauteur de ce parallélogramme vaut llvlll sin(u, v)I, son aire est égale à
llullllvlllsin(u, v)I = IDet(u, v)I. Plus précisément, Det(u, v) vaut l'aire du paral-
lélogramme lorsque (u, v) est une base directe, Det (u, v) vaut l'opposé de l'aire du
parallélogramme lorsque (u, v) est une base indirecte.
Pr~ôl(l,1on.··i~J}i;Jc~î~i,ij.a~miinanf)~,"tâ~.~~~Jfet:'î41Jiart.en~.~
p sont (1t}linéaîres•l¼Î•èi;J~tlÎ_émènt ~ Det(l'.t, V J =-0. •Sn pa1rt~'er, {i!1 v} est une base
de V ai.ètseulementéi ~t(û;v},6 o~ . .. . .
14
PREUVE. Supposons u et v colinéaires. Si l'un des deux vecteurs est nul, alors on a
Det (u, v) = O. Dans le cas contraire, il existe un nombre réel À tel que v = Àu. On a donc
(u, v) = 0 ou n selon le signe de À. Dans les deux cas, sin(u, v) = 0 et donc Det (u, v) = O.
.... Réciproquement, supposons Det (u, v) = O. Si l'un des deux vecteurs est nul, les vecteurs sont
colinéaires. Dans le cas contraire, puisque llullllvll /= 0, on a sin(u, v) = O. Ainsi (u, v) = 0
ou 7t : les vecteurs u et v sont donc colinéaires. ■
Définition 1.19. (Notation de Cauchy). Pour tous nombres complexes x, 1J, x' et y', on
pose
xx'I = X1J ,- X,1J.
1J y'
1
Remarque. Comme dans le cas du produit scalaire, la propriété 2) peut être démontrée à
partir de la définition Det (u, v) = llullllvll sin(u, v). Le recours aux nombres complexes
est par contre indispensable pour le 1).
15
Le calcul entrepris dans l'exercice précédent est généralisable : il s'agit de trouver l'ex-
pression de Det (ai, ai) lorsque les vecteurs ai et ai sont déterminés par leurs coordonnées
(x 1, y 1).&iJ et (x 2, y 2)9J relativement à une base /!,6 = (û, v) quelconque. Puisque /!,6 n'est pas
nécessairement orthonormée, la formule Det (ai, ai) = XfY2-1J1X2 n'est a priori plus valable.
On a ai= x 1û + y 1v et ai= x2Ü + y 2v, d'où, par bilinéarité du déterminant,
Det (ai, ai)= Det (ai, x2Ü +1J2v) = x2Det (ai, û) +1J2Det (ai, v).
De même,
Det (ai, Ü) = Det (x1 Ü + 1}1 v, Ü) = X1 Det (û, Ü) + l/1 Det (v, Ü) = -y1 Det (û, v)
car Det (v, v) = 0 et Det (û, v) = -Det (v, û). En utilisant le même type d'arguments, on
aboutit sans peine à la l'égalité Det (ai, v) = x 1 Det (û, v) et donc
Det (ai, ail= (X11J2 - X21Jil Det (û, v) = 1 ~~ ~~ 1 Det (û, v).
~ = (û, v) étant une base, Det (û, v) =/- 0, l'annulation de Det (ai, ai) est donc équivalente
à celle de j. On en déduit la caratérisation suivante des bases du plan vectoriel P.
1 ~] ~;
-)
D et ( -a 1,a2 = 1 x, x21 Det (-u, -)
v , d'où
lJ 1 lJ2
(ai, ai) est une base de P si et seulement si Det (ai, ai) =/- 0, ie 1 ~~ ~~ 1 =/- O.
La famille (Ü, v) est donc une base de P. D'après ce qui précède, on sait qu'il existe deux
réels X et 1J tels que w = xü +yv. On a
et
Det (w, vl = Det (xü +yv, vl = xDet (Ü, v),
d'où
Remarque. Cette méthode (et donc les formules énoncées ci-dessus) cachent en fait la
résolution d'un système linéaire. Illustrons ce propos à partir de l'exercice précédent. Puisque
!JlJ est une base, on sait qu'il existe deux réels x et y tels que
w = xü +yv = x(2ûo + 3vol +y(Üo +vol= (lx +y)ûo + (3x +y)v 0 •
Or, w = 6Ü 0 + 3v0 , et puisque la famille de vecteurs (ü 0 , v 0 l est une base de P, l'égalité
(2x+ylûo+(3x+y)vo = 6Üo+3vo est équivalente au système linéaire lx+ y= 6, 3x+y = 3.
On retrouve alors sans peine les valeurs x = -3 et y = 12.
17
Det (w, û') = Det (x'û' +-y'v', ü') = -y' Det (v', û')
....;
et ..d
ü
Det (w, v') = Det (x'û' +-y'v', v') = x'Det (û', v')
on a donc
, Det(w, v') , Det (û',w)
X=----- et -y = --~~-.
Det (u', v ') Det (u', v ')
o En identifiant des coordonnées, on se ramène à un système linéaire.
Puisque !!iJ est orthonormée, on a Det (û', v') = 1 ~~:/:l --;,:~~~~) 1 = cos2 (0) + sin2 (0) = 1
et
et
sur C#J' de M à N dans le sens trigonométrique 9 : le plus court èpnsiste à parcourir le cercle
de M à N dans le sens positif, nous le noterons MN+; tous les autres chemins dans le sens
direct de M à N diffèrent alors de MN+ d'un nombre entier de tours de cercle dans le sens
trigonométrique (voir figure 1.8).
N N
M M
0 0
,....;
..c::i
ü
-+ L'arc MN-
L'arc MN
De même, il existe une infinité de chemins tracés sur le cercle C#J' de M à N dans le sens
indirect, le plus court consistant à parcourir le cercle de M à N dans le sens négatif, nous le
noterons MN - ; tous les autres chemins dans le sens indirect de M à N diffèrent alors de MN -
d'un nombre entier de tours de cercle dans le sens trigonométrique inverse.
On définit alors la longueur algébrique d'un chemin tracé sur le cercle de M à N : si ce
chemin est dans le sens direct, sa longueur algébrique est égale à sa longueur; si ce chemin est
dans le sens indirect, sa longueur algébrique est égale à l'opposé de sa longueur.
Définition 1.23. (Mesure d'un angle orienté). Soit C#J' le cercle de centre O et de rayon
1. Soient u et v deux vecteurs du plan non nuls et U, V les points du cercle C#J' définis par
=
6ü u/llilll et av= v/llvll- On appelle mesure de l'angle orienté des vecteurs u et V
la longueur algébrique de tout chemin de U à V tracé sur le cercle C#J' ( voir figure 1. 9).
Définition 1.24. (Le nombre n). Le nombre 7t désigne le demi-périmètre d'un cercle de
myon 1.
9
C'est-à-dire dans le sens opposé des aiguilles d'une montre.
20
)
C'est le savant anglais W. Jones qui a introduit cette notation en 1706, la lettre 7t étant
rn
Il)
l'abréviation du mot periphery. Les mathématiciens, d'Archimède à cewc de l'ère informatique,
~ n'auront de cesse de calculer 7t avec une précision croissante. Euler obtint, par des méthodes
a:l
....;
que nous détaillerons dans le cours de L2
n r::::; 3 , l 4 l 592653589793238462643383279502884 l 97169399375105820
97494459230781640628620899862803482534211706798214808651
32823066470938446
Il découle de la définition précédente qu'un angle orienté de dewc vecteurs admet une
infinité de mesures. Parmi les dewc chemins uv+ et uv-, il en existe un plus court dont
la longueur (non algébrique) est nécessairement inférieure à la longueur d'un demi-tour, qui
vaut 7t. Si cette longueur est strictement inférieure à 7t, on choisit de noter (Ü, v) la longueur
(algébrique cette fois-ci) de ce chemin. Si les chemins ont même longueur 7t, on pose (Ü, v) =
7t. Soit maintenant Ü un vecteur non nul du plan. Étudions par exemple l'angle orienté des
vecteurs ü et Ü. Dans ce cas U = V et donc (ü, Ü) = O. Les autres mesures de cet angle
orienté sont donc toutes les longueurs algébriques des chemins tracés sur les cercle de U à U
dans le sens positif ou négatif; puisque qu'un tour de cercle est de longueur 2 7t, il s'agit des
nombres réels 2nk, k E Z. Insistons sur le fait que ces nombres ont en commun de mesurer le
même angle mais ne sont pas égawc (le nombre réel 2 7t est différent du réel 0) : il ne faudra
pas confondre les notions d'angle et de mesures d'angle.
Le cercle trigonométrique
On note !Ji: = (0, ü, v) un repère orthonormé direct du plan et'(/ le cercle de centre
0 et de rayon l'unité, appelé cercle trigonométrique du repère !Ji:. A désigne le point du
cercle trigonométrique de coordonnées (1, 0) dans le repère !Ji:. Rappelons que l'équation
cartésienne de !Ji: est x 2 +-y 2 = 1, c'est-à-dire qu'un point M(x,-y) appartient à'(/ si et
seulement si x 2 + -y 2 = 1. Ce cercle permet d'obtenir une représentation géométrique
commode des mesures d'angles.
Le cercle trigonométrique
Soit 0 E JR. On lui associe un unique point de '(/ noté Me de la manière suivante : Me
est l'extrémité de l'unique chemin d'origine A tracé sur le cercle trigonométrique de
longueur algébrique 0.
)
21
§
,11)
'Oil
Il)
"O
;:l
Il)
o.
III.2. La notion de congruence §
....;
Commençons par rappeler une notation utile. .d
ü
La notation a + b.Z
Pour tous nombres réels a et b, on note a+ bZ l'ensemble des nombres réels de la forme
a + kb, où k E Z. Autrement dit
a+ bZ = {a+ kb I k E Z}.
L·ensemble des multiples entiers de 7t sera donc noté nZ, celui des multiples entiers de
2rr, 2rrZ, etc.
Pour des raisons de commodité, nous utiliserons cette notion de congruence dans l'ensemble
de ce chapitre. Elle permet de calculer des sommes de mesures d'angles à partir de règles
simples telles que la relation de Chasles.
a= b [cp]
81gnifie qu'il existe k E Z tel que a = b + kcp et se lit « a est congru à b modulo cp ». Les
riels a et b diffèrent donc d'un multiple entier de cp, soit a - b E cpZ.
:\"ous pouvons donc reformuler la proposition 1.25 de la sorte: 8 est une mesure de l'angle
orienté des vecteurs û et v (non nuls) si et seulement si 8 = (û, v)[2rr].
Les règles de calcul sur les congruences, exposées dans la proposition suivante, sont à
connaître parfaitement.
22
rJl
PREUVE. On suppose que a = b [cp] et a' = b' [cp]. Alors il existe (k, l) E Z 2 tels que
11)
a= b + kcpet a'= b' + lep , ainsi a+ a'= b + b' + (k + l)cp et donc a+ a'= b + b' [cp].
!..... De même, Àa = ;\b + k;\cp et ainsi Àa = ;\b [Àcp]. La réciproque découle de l'implication
précédente appliquée à 1/;\. ■
Le lecteur devra savoir passer de l'équation 70 = n/2 [n] à l'équation 0 = n/14 [n/7] qui
lui est équivalente, et cela sans la moindre hésitation. Ces équations, dites de congruence, sont
à manipuler avec précaution: il ne faut pas confondre les symboles = et =. Rappelons encore
une fois que 2n # 0 mais 2n = 0 [n].
b cp
Y'= { - b/a + kcp/a , k E Z} = -- + -Z.
a a
....;
..d
ü
Remarque. Nous avons choisi ici une représentation géométrique sur le cercle. L'équation
<< résolue» est 0 =
1 [1]
et l'ensemble des solutions s'écrit Y = + z. 1 1
Test 1.11. Test 1.12.
Résoudre 20 + n = 0 [n] géométriquement. Déterminer l'ensemble Y des solutions de
-20 + n = n [n/3].
rJ)
<l)
~
O'.l
....;
Rappelons les relations bien connues suivantes, qu'un simple schéma permet d'ailleurs de
retrouver en cas d'oubli.
L'angle géométrique de deux vecteurs non nuls appartient toujours à l'intervalle [O, n] et ne
dépend pas de l'ordre des vecteurs. Il s'agit donc d'une notion de mesure d'angle non-orienté.
On a bien sûr l'égalité (if,~-) = ±(Ü, v).
Définition 1.34. (Angles nul, plat et droit). L'angle géométrique de deux vecteurs Ü et
v non nuls est dit nul lorsque ~= 0, plat lorsque (Dl= n et droit lorsque (iI,VJ= n/2.
/3
<X
Angles alternes-internes
Rappelons un peu de vocabulaire concernant les droites sécantes. Soient ~,, ~ 2 et ~ 3
trois droites non-concourantes et non-parallèles du plan. Quitte à permuter les indices,
on peut supposer que ~ 3 intersecte les autres droites en deux points distincts, définissant
ainsi quatre angles géométriques décrits dans la figure ci-dessous.
,...;
6
\\ ,;
Les couples d'angles ex, ô et /3, y sont dits alternes-internes. Les droites ~, et ~ 2 sont
parallèles si et seulement si les angles alternes-internes ex, ô sont égaux ou si et seulement
si les angles alternes-internes /3, y sont égaux.
~ous pouvons maintenant introduire la notation usuelle des angles géométriques d'un
triangle ABC.
Définition 1.36. (Notation des angles). Soient A, B et C trois points distincts du plan.
L ·angle géométrique des vecteurs AB et AC est noté Â, BAC ou CAB (voir la figure 1.11.1).
C C
A
L La notation Â
B A B
Preuve de  + B + ê = n
Venons-en à une célèbre propriété : la somme des angles géométriques d'un triangle est
égale à 7t. En guise d'esquisse de preuve, la figure 1.11 de droite rappellera au lecteur que la dé-
monstration de cette égalité repose sur la propriété énoncée précédemment sur le parallélisme
H les angles alternes-internes.
On déduit sans peine de cette proposition que, si ABC est un triangle rectangle en B, les
de~ angles géométriques  et ê appartiennent à l'intervalle ]O, 1t/2[. De plus, les angles Â
et C sont complémentaires.
26
La version suivante de la preuve établissant la célèbre formule d = nr2 de l'aire d'un disque
est due à Johannes Kepler. Cette formule fut établie pour la première fois par Archimède à
l'aide de polygônes réguliers.
Il)
A=B
]
o.
....-~
•Il)
a
0
•Il)
L'aire de !Yn 'oJJ
Il)
'O
~
o.
B
A B A
;§
La frise associée Un triangle de même aire que la frise
,...;
..d
FIGURE 1.13. La démonstration de Kepler illustrée ü
o Cette dernière a la même aire que le triangle obtenu en translatant à hauteur constante les
n sommets à la verticale du point A. La longueur h-n tend vers r lorsque n tend vers l'infini.
Puisque l'aire de ce triangle vaut -½ x Pn x h-n, on obtient par passage à la limite que l'aire d
du disque vaut -½ x 2nr x r = nr 2 . ■
PREUVE. La démonstration exposée ci-dessus peut être reprise point par point en partant
d"un secteur de disque au lieu du disque tout entier. On peut aussi invoquer la proportionnalité
de l'aire d'un secteur et de son ouverture angulaire 0, le résultat découle dans ce cas d'une
simple règle de trois. ■
' IDÉE de fonction a été forgée progressivement par les mathématiciens; outil indis-
I. FONCTIONS ET GRAPHES
Une courbe qui est un Une courbe qui n'est pas un graphe
graphe dans .Cfl dans .Cfl
Le graphe d'une fonction f: A------, B vérifie la propriété fondamentale suivante : pour tout
a E A, la droite verticale~ d'équation x = a coupe Gf en un unique point M de coordonnées
(a, f(a)). On peut même aller plus loin et affirmer qu'une courbe 't? du plan 9 est le graphe
d'une fonction f définie sur A si et seulement si pour tout a E A, la droite verticale ~
d'équation x = a coupe Gf en un unique point 2 .
1
Cet abus de langage est sans équivoque lorsque l'on travaille dans un seul repère .'Jt.
2
Cette propriété fondamentale permet de définir une fonction f: A --J B par la donnée de A, B et d'une courbe
~ vérifiant cette propriété. Il s'agit d'ailleurs de la définition abstraite d'application que nous donnerons dans
le cours d'Algèbre.
31
Diagrammes de composition
(l.)
~
Il est souvent commode d'utiliser des diagrammes lorsque l'on manipule des composées. ...
•<Ll
(l.)
On note classiquement
A ------t B c C ~ D .
~
gof
f
i:l
(l.)
s
'O
c-i
.d
Test 2.3. Test 2.4. ü
2
Soient les fonctions de lR dans lR définies par Soit, pour tout nombre réel t, P(t) = t +t+ 1.
f(x) = x 2 et g(x) = sin(x). Exprimer (f o g)(x) Calculer (Po P)(t) pour tout t réel.
et (go f)(x) pour x réel.
3) f est strictement croissante sur A lorsque \l(x, y) E A 2 , x < 1J =} f(x) < f(y);
4) f est strictement décroissante sur A lorsque \l(x, y) E A 2 , x < 1J =} f(x) > f(y);
5) f est monotone sur A lorsqu'elle est soit croissante, soit décroissante sur A ;
6) f est strictement monotone sur A lorsqu'elle est soit strictement croissante, soit stricte-
ment décroissante sur A.
Les interprétations géométriques sont claires : une fonction f est minorée si et seulement
si son graphe est contenu dans un demi-plan horizontal ouvert vers le haut et une fonction
f est majorée si et seulement si son graphe est contenu dans un demi-plan horizontal ouvert
vers le bas.
Une fonction f étant bornée si et seulement si elle est majorée et minorée, on voit que f
est bornée si et seulement si son graphe est contenu dans une bande horizontale.
FIGURE 2.3. Le graphe Gf d'une fonction bornée f est contenu dans une bande
Passons en revue quelques transformations utiles lors de l'étude des représentations graphiques
des fonctions numériques. Après chacune des définitions, nous donnerons la forme analytique
de la transformation, c'est-à-dire l'expression des coordonnées {x', y') du point M', image de
M, en fonction des coordonnées (x, y) de ce dernier.
M'
M/MM'-ü
~M'
Translation
M~M'
Symétrie centrale
.X M
o Soit Ü un vecteur du plan de coordonnées (a, /3). La translation de vecteur Ü est l'applica-
tion qui à tout point M du plan !Y associe l'unique point M' défini p a r ~ = ü. L'égalité
vectorielle ~ = Ü se traduit analytiquement en passant aux coordonnées de M, M' et Ü.
On a x' -x = ex et y' -y= /3. D'ou
L'ordre de composition est sans importance car les deux transformations commutent. Dans le
,ri
V
cas où L1 est l'axe des abscisses et Ü = À i (avec À E JR), l'image de M par la translation de
,ri
al vecteur Ü est le point M 1 de coordonnées (x + À, y), qui est à son tour transformé en M' de
c:l
....;
coordonnées (À+ x, -y) par la réflexion d'axe i:1. On a donc
Rappelons qu'une partie Ç!J de lR est dite symétrique par rapport à Olorsque V x E Ç!J, -x E Ç!J_
Définition 2. 7. Soit f : Ç!J H lR une fonction définie sur Ç!J C lR symétrique. On dit que
1) f est paire lorsque Vx E Ç!J, f(-x) = f(x);
2) f est impaire lorsque 1::/x E Ç!J, f(-x) = -f(x).
Notons M(x) le point de coordonnées (x, f(x)). Les points M(x) et M(-x) sont symétri-
ques par rapport à (O-y) lorsque f est paire, et symétriques par rapport à l'origine O lorsque
f est impaire. La courbe représentative de la fonction f est donc symétrique par rapport à
(O-y) dans le premier cas et symétrique par rapport à O dans le second cas. On en déduit que
dans les deux cas (f paire ou impaire), il suffit de construire la courbe sur Ç!J n [O, +oo[ ou
Ç!J n ] - oo, O] et de compléter la figure par la bonne symétrie pour obtenir la courbe sur Ç!J_
Tracé sur IR+ Tracé sur lR. '!racé sur IR+ Tracé sur IR
itt. ."îfütâêf:
..;.;•.'le}=J(x/.·.· À$ors ùi,
.·· ....
PREUVE. Le résultat est clair car, d'après les rappels sur les transformations usuelles du
plan, les points de coordonnées respectives (x, f(x)) et (2a - x, f(2a - x)) = (2a - x, f(x))
sont symétriques par rapport à la droite d'équation x = a. ■
EXEMPLE 2.9. Thouvons un axe de symétrie de la fonction définie sur lR par l'expression
f(x) =x 2 +4x-4.
► Écrivons le trinôme sous forme canonique. Pour tout réel x, f(x) = (x + 2) 2 - 8. Ainsi,
f(-4 - x) = f(x). La droite d'équation x = -2 est donc un axe de symétrie de la courbe
représentative de f.
35
Remarque. La courbe représentative de f est bien sûr une parabole dont le sommet
S(-2, -8) appartient à l'axe de symétrie.
Pour pouvoir définir la notion de périodicité, il faut au préalable introduire une notion d'in-
variance portant sur les domaines de définition. Soit T E lR. Une partie çg de ~ est dite
invariante (ou stable) par l'application 't: x H x + T lorsque 't(çg) = çg_ Comme 'test une
bijection de~, d'inverse 't- 1 : x H x- T, on voit en composant que si la partie çg est invariant
par 't, elle est aussi invariante par 't- 1 . Cela signifie simplement que, partant d'un point x de
çg, on reste dans çg lorsque l'on effectue un saut de ± T.
Définition 2.10. Soient TE~• et f: çg H ~ une fonction définie sur un sous-ensemble çg
de~ invariant par x H x ± T. On dit que
1) f est T-périodique lorsque \lx E çg, f(x + T) = f(x);
2) f est T-antipériodique lorsque \lx E çg, f(x + T) = -f(x).
Remarque. Si f est T-périodique, on prouve par une récurrence facile que pour tout x dans
q et tout k dans Z, f(x + kT) = f(x). Remarquons enfin qu'une fonction f T-antipériodique
est nécessairement 2T-périodique : Vx E çg, f(x + 2T) = -f(x + T) = f(x). Une fonction
T-antipériodique est donc plus symétrique qu'une fonction T-périodique, ce qui simplifie le
tracé de son graphe.
\'otons que nous ne nous sommes pas préoccupés du problème de minimalité de la période.
Il est évidemment intéressant de connaître la plus petite période strictement positive d'une
fonction périodique, nous y reviendrons dans des exemples.
36
r/J
Fonctions périodiques ou antipériodiques
Il)
r/J
Cil
Ill Cette proposition permet en cas de périodicité ou d'antipériodicité de simplifier l'étude
....; de f et le tracé de sa courbe représentative .
◊ Dans le cas d'une fonction T-périodique, il suffit de tracer la courbe sur l'intersection
de~ avec un intervalle de longueur T, par exemple [O, Tl, et d'effectuer, pour tout k E Z,
la translation de vecteur k Tï afin de compléter la courbe.
◊ Dans le cas d'une fonction T-antipériodique, il suffit de tracer la courbe sur l'intersec-
tion de~ avec un intervalle de longueur T, par exemple [O, Tl, et d'effectuer la symétrie
glissée d'axe (Ox) et de vecteur û pour tracer la courbe sur~ n [T,2T]. Afin de tracer
la courbe sur ~, on translate la portion de courbe sur ~ n [O, 2T] du vecteur 2kTÏ, k
décrivant Z.
V V V
EXEMPLE 2.12. Construisons la courbe représentative de l'unique fonction
2-antipériodique notée f coïncidant avec x H 1 - x 2 sur l'intervalle [-1, 1].
► Plutôt qu'un long discours :
LJ t V LJV
Afin de tracer le plus fidèlement possible la courbe représentative d'une fonction, il est utile
d'étudier avec soin ses branches infinies.
Définition 2.14. (Asymptote verticale). Soient f : I --+ lR et x 0 E lR tels que lf(x)I
tende vers +oo lorsque x tend vers x 0 . On dit alors que la droite d'équation x = x 0 est une
asymptote verticale à la courbe représentative de f en x 0 .
37
verticale :9
Définition 2.15. (Direction asymptotique). Soient ME IR et f: [M, +oo[---, lR tels que
6
f~) tende vers un nombre réel a i- 0 lorsque x tend vers +oo. On dit alors que la droite
d'équation li = ux est une direction asymptotique de la courbe représentative de f en +oo.
Lorsque If~J I tend vers +oo (resp. 0) lorsque x tend vers +oo, on dit que f admet une
branche parabolique en +oo de direction (0ll) (resp. (0x)).
Définition 2.16. (Asymptote oblique). Soient M E lR et f: [M, +oo[---, lR tels que f~l
tende vers un nombre réel ai- 0 et f(x) - ux vers un réel b lorsque x tend vers +oo. On dit
alors que la droite d'équation li = ux+ b est une asymptote oblique à la courbe représentative
de f en +oo.
Le lecteur adaptera sans peine cette définition au
cas d'une limite en -oo. L'existence d'une asymp-
tote en +oo se traduit géométriquement par un
« écrasement » du graphe de f sur la droite d'équa-
tion li = ux + b lorsque x tend vers +oo : en effet,
si M et N désignent les points d'abscisse x situés
respectivement sur la courbe représentative de f et
sur la droite d'équation li = ux + b, on a
FIGURE 2.8. Asymptote
MN=f(x)-ux-b,
qui tend par définition vers O. De plus, le signe de MN permet de déterminer la position
relative de la courbe par rapport à son asymptote.
38
EXEMPLE 2.17. Étudions les branches infinies de la fonction définie sur çg = lll \ {-2} par
rJl
V f. X H 3x2+1
rJl • x+2
ro ► Puisque lim lf(x)I = +oo, le graphe de f admet la droite d'équation x = -2 pour asymp-
:0 x----) -2
.....; 2
tote verticale. De plus, pour tout réel x i- 0, f(xl
X
= 3
1
++lz/;x
X
d'où lim
x~±oo
f(x)
X
= 3. Le graphe de
f admet donc une direction asymptotique en ±oo d'équation y = 3x. Étudions l'existence
d'une asymptote : f(x) - 3x = - 6+x+2 1 = -16+2111X, et ainsi X--t±oo
lim f(x) - 3x = -6, et le graphe
X + X
◊ Si tend vers +oo en ±oo, f admet une branche parabolique d'axe (Oy) en ±oo.
f(xl
X
◊ Si
X
tend vers O en ±oo, f admet une branche parabolique d'axe (Ox) en ±oo.
f(xJ
◊ Si f(xl
X
tend vers a E lll* en ±oo, on dit que f admet une direction asymptotique
d'équation y = ax en ±oo.
IV. BIJECTIONS
Soient I et J deux intervalles de R Une fonction f: I ----, J est dite injective lorsque
V(x, y) E !2, f(x) = f(y) =} x = Y,
autrement dit, lorsque f prend une valeur, elle ne la prend qu'en un seul point; une fonction
f : I ----, J est dite surjective lorsque tout élément de J admet un antécédent dans I par f,
autrement dit
Vy E J,:3x E I, y= f(x).
Une fonction f: I----, J est dite bijective lorsqu'elle est injective et surjective3 • On résume tout
cela dans la définition suivante.
Définition 2.18. (Bijection). Une fonction f: I----, J est dite bijective si tout y 0 apparte-
nant à J admet un unique antécédent x 0 par f, c'est-à-dire si l'équation f(x) = y 0 admet une
unique solution x = x 0 . On dit alors que f réalise une bijection de I sur J.
3 On comprend maintenant pourquoi il est essentiel de préciser les ensembles de départ et d'arrivée d'une
fonction : le caractère surjectif ou injectif d'une fonction ne dépend pas seulement de la formule f(x) = ...
39
Définition 2.20. (Bijection réciproque). Soit f: I-, J une fonction bijective. Pour tout
y E J, l'unique antécédent de y par f est noté f- 1 (y). La fonction ainsi définie, f- 1 : J -, I,
qui à y associe f- 1(y), est appelée fonction réciproque de f ; la fonction f- 1 réalise une
bijection de l'intervalle J sur I de bijection réciproque (f- 1 1- 1 = f.
EXEMPLE 2.21. Prouvons que la fonction f définie par x H l~x réalise une bijection de
[0,+oo[ sur (0, 1[. Exprimons f- 1 (y) en fonction de 1J E (0, 1( puis traçons les graphes de f
et f- 1.
...; ► Il est clair que la fonction f, définie sur (0, +oo[, est à valeurs dans [0, 1[. Soit y E [0, 1[.
L'équation x~ 1 = y est équivalente à x = y (x + 1), c'est-à-dire ( 1 - y) x = y, soit encore
x = ~' et puisque y E [0, 1[, 1 ~ E [0, +oo[. La fonction f réalise donc une bijection de
11
[0, +oo[ sur [0, 1[ de bijection réciproque f- 1 vérifiant \ly E (0, 1[, f- 1 (y) = 1~ .
11
L'expression f(x) = 1 - l~x permet de tracer simplement (i.e. sans étude) la courbe repré-
sentative de f. On en déduit celle de f- 1 (en pointillé sur la figure 2.12) par la symétrie d'axe
1J =X.
,,
,,
V. CONTINUITÉ
La définition de la continuité repose sur la notion de limite, que nous supposerons ici acquise.
Définition 2.22. (Continuité). Soient f: I-+ lR une fonction définie sur un intervalle de
lR et x 0 E I. On dit que f est continue en x 0 lorsque f (x) tend vers f (x 0 ) quand x tend vers
x 0 . On dit que f est continue sur l'intervalle I lorsque f est continue en tout point de I.
Le graphe d'une fonction continue est un objet plus complexe4 qu'il n'y paraît. On se
méfiera des représentations naïves des fonctions continues masquant la réalité géométrique
de cette notion. Les mathématiciens de la seconde moitié du XIXe siècle nous ont appris
4
La notion de continuité a d'ailleurs donné du fil à retordre à de nombreux et fameux mathématiciens du
xrxe siècle.
41
continuité. La liste des a priori en la matière est hélas fort longue. On ne confondra pas ~
,(1.)
1..,
non plus la continuité et l'idée d'un tracé à main levée. Par exemple, la fonction définie (1.)
par f(0) = 0, x-=/ 0 H f(x) = xsin(l/x) est continue sur [0,n] mais présente une infinité
d'« arches» d'aires alternativement positives et négatives, ce qui rend tout tracé à main levée
du graphe de f au voisinage de O mensonger.
f
i:,
(1.)
On retiendra qu'une fonction continue peut avoir un comportement extrêmement irré-
gulier. Nous étudierons dans le cours de l 2 les exemples donnés par le mathématicien allemand
Weierstrass de fonctions continues sur IR mais dérivables en aucun point de R
s
"Cl
c-i
..d
ü
Les fonctions usuelles (fonctions polynômes, fractions rationnelles, cos, sin, tan, exp, ln)
sont continues sur leurs ensembles de définition. Les sommes, produits et quotients (lorsqu'ils
sont définis) de fonctions continues sont des fonctions continues.
-------------- f(x1)
XJ X
Définition 2.24. (Nombre dérivé). Soient f : I ---, lR une fonction définie sur un intervalle
de lR et x 0 E I. On dit que f est dérivable en x 0 lorsque le taux d'accroissement de f en x0 ,
noté 'Txo et défini par 'Txo : I \ {xo}---, :IR, x H f(x2=~xol, admet une limite quand x tend vers
x 0 . Dans ce cas, cette limite est appelée nombre dérivé de f en x 0 et on le note f'(x 0 ).
Le quotient Txo(x) est la pente de la corde reliant les points de coordonnées (x 0 , f(x 0 )) et
(x, f(x)). En cas de dérivabilité de f en x 0 , sa courbe représentative admet donc en M 0 une
tangente de pente f'(x 0 ) et d'équation y = f(x 0 ) + f'(xo)(x - x 0 ).
Dans le cas où le taux d'accroissement de f en xo tend vers ±oo lorsque x tend vers x 0 ,
la fonction n'est pas dérivable en x 0 mais la courbe représentative de f admet en Mo une
tangente verticale.
43
\/h-0 1
'<o(h) = h-0 = )h"
Cette fonction tend vers +oo en 0+, la racine carrée n'est donc pas dérivable en O.
Remarque. On a utilisé la méthode de la quantité conjuguée pour simplifier 'TXo : pour tous
nombres réels strictement positifs a et b, y'a- 0J = ( y'a- 0J) X ~:~ = Fa~Fb-
Proposition 2.27~{Dérivabilité et continuité). Soitf: I 4 Rune foncti-on définie sur
un interoallel de R, déri:vable en xo E I. Alors f est continue en Xo-
La réciproque est bien sûr fausse, comme l'illustre la fonction f : x E lR H lxl, qui est
continue mais non dérivable en O. En effet, les limites à droite et à gauche du taux d'accrois-
sement de f en O sont égales à 1 et -1 respectivement. Le taux d'accroissement ne possède
donc pas de limite en 0, et par conséquent f n'est pas dérivable. Mais elle est continue en 0,
puisque ses limites à droite et à gauche sont nulles.
Lorsque la fonction f est dérivable sur tout l'intervalle I, on appelle fonction dérivée de f
ou plus simplement dérivée de f sur I, et on note f', la fonction définie sur I par x H f'(x).
5) Pàulr toute;f oncti<ins U : i ---f R et v : J 4 R dériva blés et Ûlles que u s?Jit à valeurs dans
J, la fonction composée vou est dérivable surI et pour toutx E I, (voù)'(x} = u'(x}v'(u(x}),
c'est'-d.~dite (\r ou)' :h u' x {v' ou).
44
Toute étude de fonction commencera par une étude soigneuse de ses propriétés de dériva-
bilité (et de continuité).
Formulaire de dérivation
Remarque. Il est préférable ici de dériver une puissance directement plutôt que d'appliquer
la formule de dérivation de l'inverse. On écrira sobrement en tant que composée de fonctions
dérivables sans détailler davantage.
Test 2.18.
Étudier la dérivabilité et calculer la dérivée de Test 2.20.
t H cos 3 (t).
Soient f, g et h trois fonctions dérivables sur
Test 2.19. un intervalle I de lR. Étudier la dérivabilité et
Étudier la dérivabilité et calculer la dérivée de trouver une formule pour (fgh)'.
45
Proposition ~~30.. (Dêrivie et sens .de variatit>nJ. Soit f : .· I .·~· R dérivable sur un
intervallel.de ~. teîlef[aèpourfout:tf1JP41'tènant ~ r, fit)~ o. Alors f est croissq,nte $Ur
I. De plus, .si f I n'est ide'fbtifù,emen-t nul!ê. sur àucunjnten,alle ouvert 'IWII, vide c ~ u daM
I, f est sttii::tement croissantê. sur L
Remarque. Rappelons qu'une fonction f est dite identiquement nulle sur un ensemble J
lorsque Vt E J, f(t) = O. En vue d'appliquer cette proposition, on commencera donc par
rechercher l'ensemble des zéros de f' (i.e. l'ensemble des réels t tels que f'(t) = 0). Si ce dernier
ne contient aucun intervalle ouvert non vide, on pourra en conclure que f est strictement
croissante.
Proposition 2.32. (Bijectivité et dérivée). Soit f ; [a, b] .-:-4 R continue sur [a, b] et
dérivable.sur Ja,b[, telle qtté f' ~ 0 et telle que f' ne sàit identi~ement nulle sur aucun
intervalle ouvert ri.on mde contè:hu· dans fa/bJ. Alors·f réalisê uve bijection strictement crois-
sante de [a, bl sur [f(a},f(b)] de bijection réèiproque f- 1.: [f(n)~ f(b)l ~ fa, b] strictement
croissante et rontinue 5Ur tf{a};f(b)J,
Nous n'avons énoncé ce théorème que dans le cas particulier où l'intervalle de départ est
de la forme [a, bl, il va de soi qu'il existe des variantes correspondant aux cas où f est définie
sur un intervalle semi-ouvert [a, b[, [a, +oo[ ou]~ oo, bl, etc. Dans la pratique, on repère une
éYentuelle bijection entre intervalles en étudiant le signe de f' (t) et en lisant les intervalles en
question sur le tableau de variation de f.
46
t a b
f'(t) -
f(t)
l~C
On conclut alors directement que f réalise une bijection strictement décroissante de ]a, b[
sur ]C, l[.
Remarque. Il est clair que le caractère injectif est assuré par la stricte monotonie de f et
que le caractère surjectif est assuré par la continuité de f (et plus précisément par le théorème
des valeurs intermédiaires).
EXEMPLE 2.33. Montrons que la fonction définie sur lR par f(t) = t - sin(t) réalise une
bijection strictement croissante de lR sur R
► Cette fonction est dérivable sur lR et, pour tout réel t, f'(t) = 1 - cos(t) ? O. La fonction
f est donc croissante sur JR. Puisque f'(t) = 0 équivaut à cos(t) = 1, l'ensemble des zéros de
f' est 21tZ et ne contient aucun intervalle ouvert non vide. La fonction f est donc strictement
croissante sur R Comme \ft E :IR, f(t) ? t-1, f(t) tend vers quand t tend vers +oo. Puisque
f est impaire, f(t) tend vers -oo avec t. On a donc le tableau de variation suivant :
t -(X) +oo
f'(t) +
/+oo
f(t) -(X)
Remarque. Ce n'est pas le signe + figurant sur la ligne de f'(t) dans le tableau précédent
qui justifie la stricte croissance de f. Le tableau ne suffit pas à établir la stricte monotonie, il
faut toujours étudier l'ensemble des zéros de f'.
47
EXEMPLE 2.34. Prouvons que l'image par la réflexion d'axe L1, notée Y,.,, d'une droite de
pente p non nulle est une droite de pente 1/p.
► Soient A(xA, YA) et B(xs, y 8 ) deux points distincts tels que la droite (AB) ne soit ni
horizontale ni verticale, c'est-à-dire YA c/c y 8 et XA c/c Xs. Notons A' et B' les images par Y,.,
des points A et B. On a bien sûr A'(YA, XA) et B'(y 8 , xs). On sait que l'image de la droite
(AB) par la symétrie Y,., est la droite (A'B'). Or, la pente de (AB) valant p = 1.Js-1.JA, celle
Xs-XA
de (A'B') vaut 118 ' -11A' = xs-xA = 1/p.
Xsr-xA, YB-YA
M'0
f- 1 non-dérivable en Yo f- 1 dérivable en Yo
o la pente f'(x 0 ) est non nulle et dans ce cas la droite :Yo' est tangente non verticale à "fl en
Mb; d'après le calcul précédent, :Yo' est de pente 1/f'(x0 ) :la fonction f- 1 est donc dérivable
en y 0 et son nombre dérivé est donné par la formule (f- 1 )'(yo) = 1/f'(f-1 (y 0 )).
...;
Regroupons l'ensemble de ces résultats dans la proposition suivante, que nous appliquerons
à de nombreuses reprises dans le cours d'analyse, après en avoir donné une autre démonstra-
tion.
1
est dérivable en y si et seulement si f'(f- (y)) i: 0 e~ dans.ce cas (f-1)'{y) = f'(f-l(y)f
Lorsque;f'(f-1 (yî} = 0, le graphe de la fonction f- 1 admet "èn y une td,i,,gente verl;icale.
EXEMPLE 2.36. Définissons la fonction « racine carrée» sur [0, +oo[ comme une bijection
réciproque. Étudions alors sa dérivabilité et retrouvons l'expression de sa dérivée sur][{';_.
► Notons f la fonction définie sur ][{ par f(x) = x 2 . En tant que fonction polynôme, f est
dérivable sur][{ et sur cet intervalle f'(x) = 2x. Puisque f' est positive sur][{+ et ne s'annule
qu'en 0, f est strictement croissante. Comme f(O) = 0 et lim f(x) = +oo, le tableau de
x-----++oo
variation de f est le suivant :
t 0 +oo
f'(t) +
/+oo
f(t) 0
On en déduit que f réalise une bijection de][{+ sur][{+· Notons, pour tout x) 0, f- 1 (x) = y'x.
D'après la proposition précédente, la racine carrée est continue sur ][{+, non-dérivable en 0
car f'( ylQ) = 0, dérivable sur ][{';_ avec sur cet intervalle, ( vxl /
= f'(f-1i (x)) = 2f-1 (x) = 2,½-
EXEMPLE 2.37. Étudions puis traçons le graphe de la fonction f définie par la formule
f(x) = ln (ex+rx).
► Puisque l'exponentielle est toujours strictement positive, f est définie sur R De plus, il
est clair que f est paire. On se contentera donc de l'étudier sur l'intervalle I = [0, +oo[. Sur
cet intervalle, f est dérivable en tant que composée de fonctions dérivables et, pour tout x
positif, f'(x) = ::~:=: )
= =~=~~ 0, avec f'(x) = 0 si et seulement si x = O. La fonction f
est donc strictement croissante sur][{+· Comme f(O) = 0 et lim f(x) = +oo, on en déduit
X---l+oo
Il y a donc une branche infinie en +oo. On remarque que, pour tout réel x,
VII. EXERCICES
2.1. 2.4 .
..;
Quelle est la parité de la composée de deux Prouver que, pour tous réels O < a,( b,
fonctions impaires ? paires ? paire et impaire ? b-a
ln(b) - ln(a) ,( r::-;:-.
vab
2.2. On commencera par établir que
L tion de fonction au XVIIe siècle. Le passage des tables numériques de l' Antiquité aux
fonctions numériques accompagna l'intérêt des mathématiciens pour des formes géo-
métriques s'éloignant de plus en plus des objets de la géométrie grecque.
Grâce aux lignes trigonométriques, nous disposons de trois « nouvelles » fonctions dites cir-
culaires - cosinus, sinus, tangente; les pages qui suivent sont consacrées à leur étude (déri-
vabilité, calcul le cas échéant de leur dérivée, détermination de leurs variations, etc).
PREUVE. Tout repose sur des considérations géométriques. Soit 0 E [O, n/2[. Plaçons-nous
sur le cercle trigonométrique Cf?, où M est le point de coordonnées (cos (0), sin (0)) et A celui
de coordonnées (1, 0). N désigne le point d'intersection de la tangente au cercle Cf} en M avec
la droite (OA).
52
o Puisque la tangente (MN) est extérieure au disque, l'aire du triangle OMN, qui vaut
½tan(0), est supérieure à l'aire du secteur de disque (d'ouverture 0) délimitée par le segment
[OM], l'arc de cercle MA et le segment [AO] qui vaut ½0. Ainsi 0 ,( tan(0). ■
PREUVE. On pourrait admettre ces résultats comme des évidences géométriques liées à la
définition du sinus et du cosinus, nous adopterons cependant un regard plus analytique en nous
basant sur des inégalités. Le sinus étant positif sur [O, n/2], on déduit du lemme 3.1 que sur
cet intervalle O ,( sin(0) ,( 0. on a donc, d'après le théorème d'encadrement, lim sin(0) = O.
x--->O+
Puisque la fonction sinus est impaire, on en déduit que lim sin(0)
X--)Û
= 0 = sin(O). La fonction
sinus est donc continue en O. Puisque le cosinus est compris entre O et 1 sur l'intervalle [O, n/2],
on a cos 2 (0) ,( cos(0) ,( 1, c'est-à-dire 1-sin2 (0) ,( cos(0) ,( 1 et puisque le sinus tend vers 0
avec 0, on a d'après le théorème d'encadrement que lim cos(0) = 1. Puisque la fonction cos
x--->O+
est paire, on en déduit que lim cos(0) = 1. ■
x--->O
Des premier et second lemmes, nous déduisons la limite du rapport sin(0)/0 lorsque 0
tend vers O; cette quantité n'est autre que le taux d'accroissement de la fonction sinus en
O. Ce résultat du lemme 2 prouve donc la dérivabilité de la fonction sinus en O et précise la
valeur du nombre dérivé du sinus en O : sin'(O) = 1.
PREUVE. D'après le lemme 3.1, pour réel 0 appartenant à l'intervalle ]O,n/2[, on a sin(0) ,(
0 ,( tan(0). D'où, 0cos(0) ,( sin(0) ,( 0 pµis cos(0) ,( sin~eJ ,( 1. D'après le théorème
d'encadrement, on a donc lim sint) = 1. La fonction 0 H sin(0)/0 définie sur IR* étant
0--->0+
pa1re, r -sin(eJ- = l .
. on a d one e1!fb
■
0
Poursuivons notre chemin: du lemme 3.3 nous déduisons la limite suivante, qui n'est autre
que la limite du taux d'accroissement de la fonction cosinus en O. Ce résultat prouve donc la
dérivabilité du cosinus en O et précise la valeur du nombre dérivé du cosinus en O: cos'(O) = O.
PREUVE.
2
Pour tout O < 0 < n/2 ) cos(:)-l = -2sin ~0121 = -Hsin~~;21 )2.
Puisque 0/2
tend vers O avec 0, on déduit du lemme 3.3 et du théorème de composition des limites que
le rapport sin~~{21 tend vers 1 lorsque 0 tend vers O; d'après le théorème sur le produit des
53
limites, il en est de même de son carré. Et, toujours par le théorème sur les produits de limites,
le rapport cos(:l~l tend vers O avec 0. ■
L'essentiel du travail est maintenant accompli : nous allons réduire la dérivabilité des
fonctions sinus et cosinus en 0 0 E lR à l'étude (déjà menée à bien) du cas 0 0 = 0 grâce aux
formules d'addition.
Proposi~ion 3.5.. (Dérivabilité des fonctions cosinus et sinus). &sfortctions .wsmus
et sinus stint dérivables sur lR avec cos' = - sin et sin' =cos.
PREUVE. D'après le lemme 3.3, la fonction sinus est dérivable en O de dérivée 1. D'après le
lemme 3.4, la fonction cosinus est dérivable en Ode dérivée O. Soit 0 0 ER Puisque, pour tout
0 E lR
sin(0 0 + 0) = sin(0 0 ) èos(0) + cos(0o) sin(0),
la fonction sin est dérivable en 0 0 de dérivée sin(0 0 ) x O+cos(0o) x 1 = cos(0o). On raisonne
de la même façon pour la fonction cosinus. ■
Du théorème de dérivation d'un quotient découle sans peine la dérivabilité des fonctions
tangente et cotangente, ainsi que les formules résumées dans l'ultime proposition de ce para-
graphe.
o D'après le théorème de dérivation d'un quotient, la fonction cotangente est dérivable sur
son ensemble de définition çg = lR \ {kn, k E Z}, et sur çg
'( ) -sin(x)sin(x)-cos(x)cos(x)
cotan x = - - - - - ~2~ - - - - - = - 1 - cotan 2 ( x ) = - - -1- .
sin (x) sin 2 (x)
r/J
V
~
i:o
,..;
V
~
o..
7î
2
7î
rJJ
Q,)
rJJ
cil
'°
,...;
Q,)
~ 7I
2
7[
et 1r. La fonction f est donc strictement décroissante sur [O, 2n/3) de 3/2 à -3/4 et strictement
croissante sur [2n/3, n] de -3/4 à -1 /2. On en déduit la courbe représentative. rJJ
1
-~u
rJJ
1
7[
O?
..d
ü
----
7[
D'après le cours de trigonométrie, pour tout nombre réel appartenant à 91, tan(0+n) = tan(0)
et tan(-0) = - tan(0). La tangente est donc une fonction impaire et 7t-périodique : il suffit de
l'étudier sur l'intervalle [O, n/2[ pour tracer sa courbe représentative sur 91. On rappelle que,
pour tout réel x appartenant à [O, n/2[, on a tan(x) = sin(x)/ cos(x), or, lim sin(x) = 1
X---ln/2-
et lim cos(x) = 0+, ainsi lim tan(x) = +oo. Puisque la dérivée de la tangente vaut
X---l7î/2- X---l7î/2-
tan1 = 1 + tan 2 = ~
cos
> 0, la fonction tangente réalise une bijection de [O, n/2[ sur [O, +oo[.
o La fonction cotangente est définie sur l'ensemble 91 = lR \ {kn , k E Z}. Elle est dé-
rivable sur cet réunion d'intervalles, avec cotan' = -1 - cotan 2 = -::b-.
sm
D'après le cours
de trigonométrie, pour tout réel 0 E 91, cotan(0) = - tan(0 + n/2). Puisque le point
M(0,cotan(0)) = (0,-tan(n/2+0)) se déduit du point M'(0+n/2,tan(0+n/2)) par la
symétrie glissées d'axe (Ox) et de vecteur û = fi,
la courbe représentative de la cotangente
est l'image de la courbe de la fonction tangente par la symétrie glissée s. On rappelle que,
pour tout x E)O, n/2[, on a cotan(x) = cos(x)/ sin(x). Or, lim sin(x) = 0+ et lim cos(x) = 1,
X---lO+ X---lO+
ainsi lim cotan(x) = +oo.
X---lO+
56
rf)
<U
~
CO
7r
2
7I
La tangente La cotangente
EXEMPLE 3.9. Prouvons que la fonction cp définie paru H ucotan(u) réalise une bijection
de l'intervalle ouvert JO, n[ sur un intervalle à préciser.
► La fonction <D est dérivable sur JO, n[ en tant que produit de
fonctions dérivables sur cet intervalle et Vu EJO, n[, 7I
Or, Vx > 0 , sin(x) < x, d'où pour tout O < u < 7t, cp'(u) < O.
La fonction cp est donc strictement décroissante sur ]O, n[. De plus
sin(u)
lim cp(u) = -oo; comme cp(u) = ~(1 cos(u) et lim - - = U~Ü+ U
U-----f7T- Slll U
Remarque. L'inégalité sin(u) < u peut s'obtenir de deux manières : par une étude de
fonction (ici x H x - sin(x)), par un argument géométrique exposé dans le lemme 1.
. 7t 2
arcsm(± 1) =± . /1
arcsm(±1/v2) = ± 7t ,
2 4 -1
. /1 7t . 7t
arcsm(±v 3/2) =± , arcsm(±l/2) = ± .
3 6
Ces résultats se retrouvent facilement à partir du FIGURE 3.5. Le sinus sur [-n/2, n/2]
cercle trigonométrique.
58
<ll
L'arcsinus vu sur le cercle trigonométr ique
GJ
<ll
C!l
CD L'arcsinus d'un réel x appartenant à l'intervalle [-1, 1] est l'unique réel appartenant à
....; l'intervalle [-n/2, n/2] dont le sinus vaut x .
arcsin ( x)
0 0
arcsin (x)
X < Ô
L'équation arcsin(x) =a
Le lecteur prendra garde à ce que l'équation arcsin(x) = a n'est pas équivalente à
sin(a) = x, afin d'obtenir une équivalence, il faut imposer -n/2 ~ ex ~ n/2. Par
exemple, l'égalité sin(2n) = sin(0) = 0 est vraie mais 2n =f 0 = arcsin(0).
EXEMPLE 3.10. Calculons de manière approchée la direction du rayon réfracté issu d'un
rayon d'angle d'incidence 90 degrés au contact du dioptre air-eau.
► L'indice de l'air vaut 1 (1 est en fait l'indice du vide), et celui de l'eau vaut à peu près 1,3.
On doit donc résoudre sin(r) = 1/1,3. Ainsi, r ~ arcsin(l/1.3) ~ 0.877 radians ie r ~ 50.3
degrés.
PREUVE. 1) Soit x E [-1, 1]. D'après la définition de l'arcsinus, arcsin(x) est une me-
sure d'angle dont le sinus vaut x. Ainsi, sin(arcsin(x)) = x. On a de plus cos 2 (arcsin(x)) +
sin 2 (arcsin(x)) = 1 d'où cos(arcsin(x)) = ±vî=xZ. La fonction cosinus étant positive sur
59
7[
2
7[
2
7[
--y
Pro11~~i~<>!l 3.13, c{Pl'Qpriêt~ <!~ l'~~s~us}... U Jon<;twn ~w. r6.ûis~. ~rilbîjecti<m. ~e·
[-7t!Î{'1tf2ksurl-l, ll de bijection réë.ipTV:</#e .Mt{e ~ciùµ î hl,Jl t4'l~i/2; i/2]. ·
1) '~fonÙion aresin est i~paite et Qdntin~ sur hl,tj, ... · . . ....
2) L 'arcsinus est dérivable sur] - l, l[ avec, Vx Ei --": 1f lf , a.rcsiu'{~) =· .l · • >·•
·.· . . .. .· . .··· y1-~2
3} L'arcsmus n'est pas dérivable en ±1, sti. courbe representative admettant en ces points
une tangente verticale.
PREUVE. 1) La fonction sinus est dérivable sur lR de dérivée cosinus, qui est positive sur
l'intervalle [-n/2, n/2] ne s'annulant sur cet intervalle qu'en ±n/2. D'après la proposition
2.30 (page 45), la fonction sinus réalise une bijection strictement croissante de [-n/2, n/2]
sur [-1, 1]. De plus, sa bijection réciproque arcsin: [-1, 1] ---1 [-n/2,n/2] est continue. Soit
x E [-1, 1]. Puisque le sinus est impair, - arcsin(x) est un angle dont le sinus vaut -x, puisque
- arcsin(x) E [-n/2, n/2], - arcsin(x) = arcsin(-x). L'arcsinus est donc une fonction impaire.
2) Soit y E [-1, 1]. D'après le théorème de dérivabilité d'une bijection réciproque (cf. page
48), la fonction arcsinus est dérivable en y si et seulement si
et arccos(-v'3/2) = Sn/6.
On utilisera le cercle trigonométrique pour retrouver ces valeurs particulières en prenant
garde à l'ensemble d'arrivée de la fonction arccosinus. Ainsi l'équation arccos(x) = ex n'est
pas équivalente à cos( ex) = x, pour obtenir une équivalence, il faut imposer la restriction
0 ~ex~ 7t. Par exemple, le nombre réel arccos(cos(3n/2)) est l'unique réel apartenant à [0,n]
dont le cosinus vaut cos(3n/2) = 0, on a donc arccos(cos(3n/2)) = n/2.
L'arccosinus de x E [-1, 1] est l'unique point de [0, 7t] dont le cosinus vaut x.
62
1) ·. Vx Ë [-1 ~tsî~{axq«is{x}} 1
2) vie R, ar~{;ua{xH ~-X si et sèuleniênt~si O~ x i"~t
EXEMPLE 3.17. Simplifions, pour tout x E [-1, 1], sin(2arccos(x)) et sin(4arccos(x)).
► Soit x E [-1, 1]. Posons 0 = arccos(x). On a sin(20) = 2sin(0) cos(0) = 2x ✓ l - x2 . De
plus,cos(20) =2cos (0)-1 =2x 2 -1 doncsin(40) =2sin(20)cos(20) =4x ✓ l -x2 [2x 2 -l].
2
2)L'(l~sinl(#isti~ê•sur'fl 1/1t~~\i'x~Je::1f,:1r:I~"{i)-=4
3) L'a~sîh~l:•~~ÎHtS'iUrl,wllk ~n
une tangente !flèrtîcoJe. ·. ·
±1,. sa•wûrilè'.~~~~'ailmê~
·· ·
.en. œs p<>i:rits
Les courbes représentatives de l'arccosinus sur [-1, 1] et du cosinus sur [O, 7t] sont symé-
triques par rapport à la première bissectrice, d'où le tracé suivant.
-1
R~O$~â;,if+,'.~"~J~~-~fl'~Ji:i {~ijf~,~~~~,.
ttngûfà ï~4{~:1~15,1i ~(xf+.~ûf~l'si;'Jt'<:' è·.·
Remarque. L'argument de continuité est ici essentiel car il permet de prolonger l'égalité
arcsin( x) + arccos( x) = 1, valable a priori sur ] - 1, 1 [, à l'intervalle fermé [-1 , 1].
X> Û
arctan (x)
arctan ( x)
0
X< Û
64
Mettons encore une fois en garde le lecteur contre les équations où interviennent des fonctions
(F) circulaires réciproques. Par exemple, l'égalité arctan(x) = ex n'est pas équivalente à l'égalité
s<lJ
...;
tan(cx) = x, car dans cette dernière le réel ex n'appartient pas nécessairement à l'intervalle
] - n/2, n/2[. Voici un autre exemple : le nombre réel arctan(tan(n)) est l'unique réel ap-
partenant à] - n/2, n/2[ dont la tangente vaut tan(n) = 0, ainsi arctan(tan(n)) = O. La
proposition suivante est une conséquence immédiate de la définition de l'arctangente.
PREuvE. 1) La fonction tangente est dérivable sur] - n/2,n/2[ de dérivée 1 + tan 2 , qui
est strictement positive sur R D'après la proposition 2.30 (page 45), la fonction tangente
réalise une bijection strictement croissante de ] - n/2, n/2[ sur R Sa bijection arctan : lR ---)
] - n/2, n/2[, est continue. 2) Soit 1J E R D'après la proposition 2.35 (page 48), la fonction
arctangente est dérivable en 1J si et seulement si tan'(arctan(y)) = 1 + tan 2 (arctan(y))
1 +y 2 -/- O. La fonction arctan est donc dérivable sur lR et \fy E JR, arctan'(y) = G7
1
. ■
+Y
------------------------------------i-~------ -
'1
FIGURE 3.10. Courbe représentative de la fonction arctangente
PREUVE. Soit x > O. Posons ex= n/2-arctan(x). Puisque arctan(x) E]O,n/2[, ex appartient
à ]O,n/2[. De plus, tan(cx) = 1/tan(arctan(x)) = 1/x. D'où arctan(x) + arctan(l/x) = 1-
Dans le cas où x < 0, la formule découle de ce qui précède par imparité de l'arctangente. ■
Cette proposition peut également être démontrée par une simple étude de fonction.
, 1 1 1 O
f (x) = 1 +x 2 - x 2 x 1 + (1/x) 2 = ·
La fonction f est donc constante sur chacun des deux intervalles ]-oo, O[ et JO, +oo[. Puisque
l'on a f(l) = 2 x n/4 = n/2 et f(-1) = -2 x n/4 = -n/2, on en déduit que pour tout réel
x non nul, arctan(x) + arctan(l/x) = signe(x) 1.
Remarque. Rappelons une fois encore que l'implication f' = 0 =} f constante n'est valable
que sur un intervalle.
EXEMPLE 3.26. Prouvons la formule arctan(l /2) + arctan(l /5) = arctan(7 /9).
► Posons ex = arctan( 1/2) +arctan( 1/5). La fonction arctangente étant strictement croissante
sur JR, les inégalités 1/2 < 1, 1/5 < 1 et les deux égalités O = arctan(O),n/4 = arctan(l)
entraînent que O < ex< 2n/4 = n/2. D'après la formule d'addition de la tangente, tan( ex) =
1/2+1/5 7 . . (7/9) .
1_ 1110 = 9 , ams1 ex= arctan
f(0) = J a1 + b 1 [cos(0 )
0 cos(0) + sin(0 0 ) sin(0)] = J a1 + b 1 cos(0 - 0 0 ).
La fonction f est donc une sinusoïde de même pulsation que ces deux composantes, seule
l'amplitude a changé et un déphasage 0 0 est apparu. Pour tout nombre réel c, l'équation
f(0) = c est équivalente à cos(0 - 0 0 ) = ✓ a2c+b2 , et admet donc des solutions si et seulement
si 1 ✓a2c+b2 I ~ 1.
EXEMPLE 3.28. On pose, pour tout nombre réel x, f(x) = 2sin(x) + 3cos(x). Étudions f
en répondant aux questions suivantes :
1. Tracer la courbe représentative de f.
2. Déterminer les ensembles f(x) = 1.
3. Étudier le signe de f sur l'intervalle [0,2n]. Résoudre sur lR l'inéquation f(x) < O.
► La fonction f est bien sûr définie sur R
1. Posons Xo = arccos(3/~) de sorte que sin(x 0 ) = Jl -9/13 = 2/~. Pour tout
nombre réel x, f(x) = ~[/4
sin(x) + cos(x)] k = ~cos(x - Xo). On en déduit la
courbe représentative de f.
Xo
IV. EXERCICES
rJl
3.1.
4 1
~
et ('")
3.7. a
On cherche à résoudre dans fit l'équation sui-
3.2. vante:
71
Étudier les variations sur fit et tracer le graphe arctan(2x) + arctan(x) = .
2
de la fonction f définie par
1. Montrer que si x est solution, alors nécessai-
Vx E fit , f(x) = sin(x) sin(2x). rement x vérifie l'équation 2x 2 + 1 = O.
2. Étudier la réciproque.
3.8.
3.3.
2. x x - . (
arcsm 1 + sin(x)) .
H 1. Pour quelles valeurs de x est-elle définie ?
2 2
2. Premième méthode de simplification. Utili-
3.4. ser la dérivation.
3. Deuxième méthode de simplification. Utiliser
On pose 1J
1
= arcsin ( \ v'S). Calculer
le paramétrage rationnel du cercle.
ORSQU'ON dispose de deux règles graduées R0 et R1, il est très facile de faire des additions
L approchées. Si l'on veut par exemple calculer 3, 8 + 5, 7 (ce que l'on pourrait aussi
faire mentalement bien sûr), il suffit de faire correspondre le O de la règle R0 avec la
graduation 3, 8 de R1, et de lire sur R1 la graduation correspondant à la graduation 5, 7 de
R0 . On constate que l'on trouve 9, 5, ce qui ne surprend personne.
0 2 3 4 5 6 7 8 9 10
1 11 11 11 11 11 11 1 11 1 1 1
0 1 2 3 4 5 6 7 8 9 1 1
10:
L'idée est tout simplement d'observer que si l'on forme une suite géométrique de raison a,
et si on indexe chaque terme de la suite par son exposant, c'est-à-dire si l'on pose Xn = un,
pour n EN, alors le terme dont l'indice est la somme n+m est le produit des termes d'indices
net m
Xn+m = U n+m = Un U m = Xn Xm.
Cette correspondance se matérialise en termes de "règles graduées" de la manière suivante.
ao al al a3 a4 as ...
l l l l l l
0 1 2 3 4 5
012345···
îîîîîî···
ao a 1 az a3 a4 as ...
70
En suivant le même principe que pour les règles graduées, on voit sur cette juxtaposition
rJJ
Cl)
de suites que a 3 a 2 = a 5 .
~ La remarque que nous venons d'illustrer permet donc dans une certaine mesure de trans-
i:o
...;
former les sommes en produits. Mais elle est insuffisante, puisqu'elle se limite aux produits
de nombres qui sont des puissances entières de a. Les fonctions logarithme et exponentielle
permettent de pallier cette lacune, comme nous allons le voir dans ce qui suit.
Tout ce chapitre repose sur le fait qu'une fonction continue strictement monotone sur un
intervalle est une bijection de cet intervalle sur son image. Cette propriété fondamentale sera
démontrée au chapitre 25.
En d'autres termes,
x dt
lnx =
Jt
1
-,
PREUVE.
1) C'est la définition.
2) Soit y E lR:'+- fixé. Considérons la fonction f: x H ln x + ln y - ln(xy) définie sur lR:'+-. On a
f(l) = 0 et elle est dérivable, avec f'(x) = 0 pour tout x E lR:'+-. Comme lR:'+- est un intervalle,
f =0.
3) ln~ + ln y = ln ( ~ x y) = ln x.
■
4) C'est une conséquence de 1) et de 3).
La propriété 2) du théorème montre que le logarithme transforme la multiplication en
addition. Comme nous le verrons, en langage de théorie des groupes, la fonction ln de (lR:'+-, x)
dans (JR, +) est un homomorphisme. C'est ce que nous cherchions à réaliser en introduction.
Nous y sommes parvenus par un détour inattendu : au lieu de poursuivre l'idée des suites
géométriques, nous avons préféré construire une nouvelle fonction au moyen d'une intégrale.
Mais on prendra garde au fait que le logarithme transforme la multiplication en addition, alors
que les suites géométriques transformaient l'addition en multiplication (pour des puissances
entières). Les deux méthodes sont donc inverses. En fait, nous allons montrer maintenant que
le logarithme possède une fonction inverse, qui n'est autre que le prolongement d'une suite
géométrique bien choisie à des exposants variant sur la droite réelle tout entière.
Proposition 4.3,
1) La fonction ln est strictement 'croissante· sur R~.
2) lim .lnx=+oo.
x--t+oo
3) lûnlnx =: -'-oo.
x--tO+
PREUVE.
...;
,,
V X-€ R, 1n(expx) =x -
et
1, 'ewi/tmeUe ..çst .strictêmënt croiss~~'e~ et. dêri1Jàble dans R.
[on~tir;n fl.triViée, . Ëlle est ?ij;te' iJ:·,~·pr~r>rf;
.. . . . ' . .
Remarquon s que puisqu'elle est définie comme la réciproque de la bijection ln: JR~ -) JR,
la fonction exponentie lle applique lR sur JR~. On préfère pourtant écrire exp : lR -) JR, en
gardant à l'esprit que expx > 0, pour tout x ER
Les propriétés du logarithme se complètent en propriétés correspond antes pour l'exponen-
tielle. La plus importante est certaineme nt la suivante.
aP =a·•• a et (4.2)
"-.,,-'
p fois
Ainsi, la définition d'une puissance de a avec un exposant entier est une question purement
algébrique. Elle ne fait intervenir qu'un nombre fini d'opérations élémentaires (multiplications
ou divisions).
74
Exposant rationnel. Soit q E N*. Alors, il est clair que la fonction <P : lR+ --, JR, x H xq est
rJl
11.) continue et strictement croissante. Comme <P(0) = 0 et limx-,+oo <P(x) = +oo, elle réalise une
~ bijection de lR+ sur lR+. Sa fonction réciproque est la racine q-ième
c:i
....
~ : lR+ --, lR, x H {l'x.
Si a > 0, par définition, {1/a est l'unique racine réelle positive de l'équation xq - a = O. On
la note aussi a"1
= ija.
Pour (p, q) E Z x N*, on vérifie que {1/aP = ijuP. On vérifie que, si (p ', q ') E Z x N* est tel
que p/q = p'/q', on a l'égalité {1/aP = W. Pour r E Q, avec r = p/q et (p, q) E Z x N*,
on peut donc poser
UT= {1/aP.
On vérifie facilement que cette définition pour les exposants rationnels prolonge celle pour les
entiers, c'est-à-dire que pour q = 1, on retrouve (4.2). De plus, on vérifie que la règle (4.3)
reste vraie pour des exposants rationnels.
Exposant réel quelconque. Quel sens donner maintenant à une expression comme 2v'.2?
Pour définir ax pour un exposant x réel quelconque, il est naturel d'exiger trois conditions :
1) le nombre ax doit dépendre continûment de x;
2) la règle ax+y = axa11 doit rester valable;
3) elle doit prolonger la définition pour les exposants rationnels.
V (x, p) E lR x Z, (4.6)
Si p ? 0, cela se démontre facilement par récurrence en utilisant la propriété 2). Considérons
maintenant le cas p < O. On a
75
donc expu(px) = (expu(x))P. Ainsi, l'égalité (4.6) est démontrée. En appliquant (4.6) deux
fois, on trouve pour tout (p, q) E Z x N*
Comme expa ( ~) > 0 et est racine de l'équation xP = uq, on obtient par définition d'une
puissance avec exposant rationnel
Nous avons donc f(x) = expu x, pour tout x ER, et par conséquent f > O. ■
Nous admettrons maintenant la proposition suivante, qui repose sur les propriétés de la
droite réelle, que nous verrons au chapitre 21. Nous renvoyons le lecteur au chapitre 28 pour
une preuve.
Ces deux propositions étant démontrées, nous pouvons maintenant revenir à la notation
ax = exp( x ln u) de la définition 4.6, puisque les deux fonctions coïncident. Les règles suivantes
sont des conséquences directes de cette définition.
a0 = 1 (4.9)
(4.10)
Définition 4.9. Le nombre d'Euler e est le réel défini pare= exp 1 ou de manière équiva-
lente par ln e = 1. On dit encore que e est la base des logarithmes neperiens.
expx =ex.
Pour tout a ER~, la fonction expu(x) = exp(xlnu) = ux est dérivable car composée de
fonctions dérivables. D'après la règle des fonctions composées, on a
76
Comme ax est positif, c'est le signe de ln a qui détermine la variation de exp a. Ainsi, x H ax
est strictement croissante si a > 1 et strictement décroissante si 0 < a < 1.
On déduit des limites de l'exponentielle que
...;
lim ax = {
x-H-oo
00
0
si a> 1
si0<a<l
et .
hm ax=
X------)-00
{o
00
si a> 1
si0<a<l.
Donc, pour tout a E ~"+- \{1}, la fonction exp a réalise une bijection continue de~ sur~"+--
Sa bijection réciproque lna est appelée le logarithme de base a. Il est caractérisé par
lnaX = Y
En prenant le logarithme naturel, cela équivaut à y ln a = ln x ou encore à
lnx
y=lnaX=--.
1na
Le logarithme de base a est donc simplement le logarithme naturel multiplié par une certaine
constante. La situation est donc encore plus simple que pour les puissances générales et ne
mérite pas une étude particulière.
a<l a>l
Définition 4.10. Pour tout réel a, on définit une fonction QJa de lll~ dans lll par
QJa(x) =exp(alnx).
La fonction QJa est appelée fonction puissance d'exposant a. On vérifie sans difficulté que les
fonctions puissances possèdent les propriétés rappelées dans le tableau suivant.
PREUVE. Posons -y(x) = xaebx_ Alors, ln-y(x) = aln x + bx et l'assertion se déduit de (4.16)
par composition par l'exponentielle. ■
PREUVE. Il suffit de poser -y = ln x et d'utiliser (4.17), ainsi que le résultat sur la composition
des limites. ■
On dit que le logarithme croît plus lentement que toute puissance, ou que les puissances
l'emportent sur le logarithme.
En conclusion de cette partie, nous pouvons maintenant montrer comment les fonctions
que nous avons introduites permettent de résoudre notre problème de calcul approché de
produits au moyen de règles graduées. C'est le principe utilisé dans les anciennes règles à
calculer, ancêtres mécaniques de nos calculatrices.
79
00
1 10 100 1000 10000 100000 (1.)
.§'
Ro 10 100 1000 10000 0
1 10000 ,e
(1.)
r
r,'
En effet, on montre que <fJ = {(e\ e-t) t E JR}. Cette branche d'hyperbole, après chan-
1
IL 1. Fonctions hyperboliques
Le sinus hyperbolique, le cosinus hyperbolique, la tangente hyperbolique et la cotangente hyper-
bolique sont
....;
Les fonctions sh et ch sont donc les parties impaires et paires de la fonction exponentielle.
Elles sont liées par la relation fondamentale
Cette relation montre en particulier que, pour tout t E ~, le point (ch t, sh t) est sur la branche
d'hyperbole J'f'.
Le tableau suivant résume les propriétés essentielles des fonctions hyperboliques. Les
preuves sont laissées au lecteur à titre d'exercice; elles sont presque immédiates.
Domaine ~ ~ ~ ~·
Image ~ [1,oo] l -1, 1[ ~ \ [-1, 1]
1 1
f' chx shx - -2
ch 2 sh
En pratique, chaque formule sur les fonctions trigonométriques induit une formule équi-
valente sur les fonctions hyperboliques, qu'on obtient en remplaçant cos par ch et sin par
i sh. La preuve de cette règle sera donnée au chapitre 28. Mais il est en général très facile de
trouver directement ces formules par un calcul direct. Elles proviennent toutes des propriétés
de l'exponentielle.
EXEMPLE 4.15.
► La formule cos 2 + sin 2 = 1 devient ch 2 + (i sh )2 = 1, ou encore
ch2 -sh 2 = 1.
La fonction ch La fonction sh
············•··························· ················_:;··;;;··-··-··---
.L
---- ...-:..::-::..:-:................ ········································
Les fonctions sh, th et coth sont continues et strictement monotones, elles sont donc bijectives
sur leur image et possèdent des fonctions réciproques. La fonction ch, en revanche, possède
deux branches monotones. On choisit toujours de prendre la réciproque de la restriction de
ch à JR+_ Les fonctions area sinus, area cosinus, area tangente et area cotangente sont les
réciproques des fonctions hyperboliques. On les note
argsh: lR-+ JR, argth: l - 1, H-+ lR,
argch: [1, oo[-+ [O, oo[, argcoth: ]-oo,-l[U]l,oo[-+ R
Contrairement aux fonctions réciproques des fonctions trigonométriques, les fonctions réci-
proques des fonctions hyperboliques ne sont pas de «nouvelles» fonctions. Elles s'obtiennent
comme composées de fonctions déjà connues.
Ainsi, e11 est racine de l'équation du second degré Y2 - 2xY - 1 = O. Cette équation possède
rJJ deux solutions, x + Jx 2 + 1 et x - Jx 2 + 1. La dernière étant négative, elle ne peut pas être
~
O'.l
égale à e11 • Donc e11 = x + Jx 2 + 1, et on conclut en prenant le logarithme.
..... Montrons maintenant la formule pour argth .
eY - e-Y 1+ X
-y = argth x {=} x = coth -y {=} x = --- {=} xe 211 + x = e 211 - 1 {=} e 211 = - --,
eY + e-Y 1 X
-
-1
La fonction
argth
7 La fonction argcoth
11.1.2. Étymologie
est une bijection. De la même manière, selon (4.19), on peut montrer que les fonctions hyper-
2
boliques paramètrent la branche d'hyperbole J"t' d'équations u 2 - v = 1, u ;::=: 0, au sens où
l'application
lR-, J"t'clR2 , xH (u(x),v(x))=(chx,shx)
est une bijection. Nous y reviendrons plus en détail au chapitre 28. Notons simplement ici que
cela justifie la terminologie fonctions hyperboliques.
Dans les ouvrages anglophones et allemands, on désigne leurs inverses par « area sinus
hyperbolicus » et « area cosinus hyperbolicus ». Cette terminologie est aussi intéressante.
V
T]
E,
Propositioa ,4. 11. Sôi~nt x € R et P le point de coordoiiné€$ (Up 1 Vp} = (ch x, sh x}. Alors
l'aire hachurée vaut Ill- ·
PREUVE. Nous suivons d'abord le cas de la figure, où le point Pest au-dessous de l'axe des
u, c'est-à-dire tel que x < O. Nous faisons d'abord un changement de coordonnées. On a
où on a posé
r/J u-v u+v
V
r/J E,= ./2, T] = ./2.
~
i:o
Le point P a donc pour coordonnées
= J: ~~ = 1 (1n ~ - l n ~ ) = - ; ,
ce qui donne le résultat pour x < O. On y ramène le cas x > 0, en utilisant la parité de ch et
l'imparité de sh. ■
En ce sens, on peut voir les fonctions hyperboliques comme fonctions d'une aire lxl, et
leurs inverses, les fonctions "area", redonnent cette aire .
III. EXERCICES
4.2.
4.3. 4.8.
4.5.
4.10.
Résoudre ch(x) + 2sh(x) = 2 dans R
Soit a E R On cherche à résoudre dans IR.
4.6.
l'équation
Soient ( a, b) E IR. 2 et n E N. Simplifier les
sommes sh(x) +sh(u+x) +sh(2u+x) +sh(3u+x) = O.
n n
Sn= L ch(ku+b) et Ln= L sh(ku+b). 1. Trouver, en exploitant l'imparité du sinus
4.7. k=O k=O
hyperbolique, une solution évidente de l'équa-
tion.
Résoudre argch(x) = argsh(2 - x) dans R
2. Résoudre l'équation sur R
Chapitre 5
LE CORPS (C DES NOMBRES COMPLEX ES
A naissance des nombres complexes est intimement liée à la résolution des équations
1
Cette approche est souvent appelée à tort « méthode de Cardan ».
2
Si ($) n'admettait aucune solution, nous ne pourrions donc rien en conclure. Comme souvent en mathéma-
tiques, il s'agit d'une piste envisageable, d'un pari en quelque sorte.
88
Cette audace de Bombelli est l'acte de naissance des nombres complexes. L'expression yCî
3
apparaît comme un objet absurde qui plus tard s'écrira « i » (initiale du mot impossible).
On a ainsi u 3 = 2 - 11 yCî et v 3 = 2 + 11 yCî et donc x = {h - 11 yCî + {h + 11 yCî
est solution de ( E 2 ). Le résultat sous cette forme n'a évidemment aucun intérêt et il reste
encore à découvrir que
de sorte que l'on peut choisir u = 2 - R. De même, en remplaçant yCî par -vCT,
v = 2 + vCî et finalement, x = u + v = 4. En écrivant vCT, on est allé au bout des calculs
de Scipion del Ferro en trouvant la solution évidente 4, le « nombre » yCî disparaissant en
fin de parcours et n'ayant donc été qu'un outil intermédiaire, sans statut propre.
Bombelli considère alors les « racines carrées de nombres négatifs » comme des nombres
sophistiqués, des quantités qui n'existent pas mais sur lesquelles les calculs sont néanmoins
possibles. Ce nouvel objet yCî effraie, et va mettre du temps à s'imposer.
3
Il faut noter qu'aujourd'hui la notation.;=î n'a aucun sens car on ne sait pas si elle désigne le nombre i ou
le nombre -i, on n'écrit donc jamais .;=î.
89
4
Descartes emploie pour la première fois le mot imaginaire en 1637.
5
C'est la théorie des ensembles qui fixe les règles permettant de construire de nouveaux ensembles à partir
d'ensembles connus. Nous y reviendrons dans le cours d'algèbre.
6
Ces propriétés sont à considérer comme des règles de calcul et que nous détaillerons au paragraphe suivant.
90
2) Associativité de + :
3) Associativité de x :
V z E C, z + 0 = 0 + z = z et 1 x z = z x 1 = z.
7
Ce sont d'ailleurs les seuls.
90
1) Commutativité de + et x :
2) Associativité de +:
\/ (z1, Zz, Z3) E (C
3, (z1 + Zz) + Z3 = Z1 + (zz + Z3).
3) Associativité de x :
\/ z E C, z + 0 = 0 + z = z et 1 x z = z x 1 = z.
Par exemple, pour calculer (1 + 2i)(8 - 3i), il suffit de développer le produit-par distribu-
tivité, d'appliquer les règles ci-dessus et d'utiliser la relation i 2 = -1, alors
7
Ce sont d'ailleurs les seuls.
Remarque. On résume ces sept propriétés en disant que (C muni des opérations + et x a
une structure de corps, et on parle du corps (C des nombres complexes. r/J
Notation. Afin d'alléger les notations, nous noterons les produits z 1 z2 au lieu de z 1 x z 2.
De même, pour z 1 E (Cet z 2 E C*, on notera z,/z2 ou encore~ z2
le nombrez, x (1/z2). Nous
1
0
(.)
r/J
utiliserons la convention usuelle d'exponentiation : pour tout nombre complexez non nul, z 0 i::
sera par convention égal à 1 ; pour tous z E (C et n ) 1, zn désignera le nombrez x • • • x z
(n fois). Pour tout z E (C* et tout n E N, on note z-n le nombre complexe (1/z)n. 1
r/J
<l)
Des propriétés de l'opération x découlent immédiatement les règles suivantes. Encore une 'O
fois, les propriétés des puissances sont les mêmes que sur lR. u
r/J
~
(.)
Règles d'exponentiation
iè
1) Vz E C*, V(m, n) E Z 2,znzm = zm+n_ 3) V(z1,z2) E(C*) 2, Vn EZ,zfzz' = (z1z2)n. .d
ü
2) Vz E C*, V(m, n) E Z 2, (zn)m = zmn_
L'associativité de+ et x nous autorise à omettre les parenthèses dans des calculs du type
(2 + i) + 4i ou (2 xi) x 4i. On écrira simplement 2 + i + 4i et 2 xi x 4i. Plus généralement,
l'associativité nous permet d'adopter les notations suivantes.
Notation. Soit n E N*. Pour tous nombres complexes u 1 , Uz, ... , Un, on pose
n n
.L, uk = u 1 + u2 + · · · + Un et TI uk = u, X Uz x · · · x Un-
k=l k=l
Par exemple, on écrira
17
1 + 2 + 3 + · - · + 17 = L k.
k=l
Cette notation a l'avantage d'être condensée et d'expliciter la forme générale du terme sommé.
Nous consacrerons un chapitre à la manipulation de ces symboles.
Les nombres complexes sont nés de la résolution des équations algébriques. Nous avons déjà
remarqué à quel point la propriété « (Z 1Z 2 = 0 si et seulement si z, = 0 ou Z 2 = 0) » était
fondamentale lors de la résolution d'une équation du second degré. Par exemple, z 2 = -1
équivaut à z 2 -i2 = 0, c'est-à-dire (z-i)(z+i) = O. Arrivés à ce stade de la résolution, nous
appliquons la propriété évoquée ci-dessus pour affirmer que les seules solutions de l'équation
z 2 = - 1 sont ±i.
Comme nous allons le voir, cette propriété repose essentiellement sur l'existence d'un in-
verse pour la multiplication x.
PREUVE. Raisonnons en deux temps.
( {=) Soit z E <C. Comme Oz = (0 + 0 )z = Oz+ Oz, on a Oz = Oz - Oz = O.
(=}) Supposons que z1z2 = O. Alors, si z1-/- 0, (z1z2)/z1 = O/z1 = 0, d'où z2 = O. ■
Nous savons que tout nombre complexez s'écrit de manière unique sous la formez= o + ib
avec o et b réels : on prendra garde au fait que l'unicité du couple (o, b) n'est vraie que si on
impose o et b réels. En effet, puisque -1 = -1 + 0 x i = 0 + i x i, il n'y a plus unicité de
(o, b} lorsque o, b E <C. L'unicité dans le cas réel permet de définir sans équivoque les parties
réelle et imaginaire d'un nombre complexe.
Définition 5.4. (Parties réelle et imaginaire). Pour tout z E <C, il existe un unique
couple (x, y) de nombres réels tel que z = x+iy. Le nombre x est noté 9té(z) et appelé partie
réelle de z; le nombre y est noté Jm(z) et appelé partie imaginaire de z. L'écriture z = x+iy
s'appelle la forme algébrique de z.
3
En guise d'entraînement, écrivons le nombre complexe ex= (1 + iv'2) + 1 + 8i sous forme
algébrique: ex= (1 + 3(iv'2) - 6 - 2v'2i) + 1 + 8i = -4 + i(8 + v'2).
Ce résultat est appelé propriété d'additivité des parties réelle et imaginaire sur <C; elle
s'étend par récurrence à un nombre fini de nombres complexes.
93
~
V (À, z) E lR x C, Jm(Àz) = À Jm(z) ? P.
a0
(.)
r/J
e:
I.2. Représentation géométrique des nombres complexes
Les nombres complexes furent d'abord des intermédiaires de calcul sans statut propre. En 1799,
1r/J
(1)
'O
le danois Gaspard Wessel en proposa une interprétation géométrique. Refusant de considérer Ç,,)
ces nombres comme « impossibles », le mathématicien allemand Carl-Friedrich Gauss poussa
plus loin les idées géométriques de Wessel. ~
0
(.)
j
Dans tout ce qui suit, le plan est muni d'un repère orthonormé direct !!J! = (0, li, v). in
.d
ü
Définition 5.7. (Affixe d'un vecteur). Soit un vecteur w du plan de coordonnées (x, y)
dans la base (li, v). On lui associe le nombre complexe z = x + iy, appelé affixe de w. On
notera de manière condensée w(z) le vecteur d'affixe z.
M(x+iy) w(x+iy)
y -------- y --------
v v
0 li X 0 li X
Définition 5.8. (Affixe d'un point et image d'un nombre complexe). Soit M un
point du plan de coordonnées (x, y) dans !!J!. On lui associe le nombre complexe z = x + i y,
appelé affixe de M. Réciproquement, à tout nombre complexez = x + i y où x, y E IR, on
associe le point M du plan de coordonnées (x, y) dans !!J!, appelé image de z. On notera de
manière condensée M(z) le point d'affixe z.
Au-delà des règles de calcul et des formules exposées jusqu'ici, nous allons définir dans les
pages qui suivent la très importante application de conjugaison.
94
[/J
Il)
[/J
rd
CO
,_;
I
I
I
I
I
I
I
I
I
if ŒÎ (zi)
0 ü
M(z)
y -----------------~
1
v
0 'X
ù 1
1
-y -----------------~
M'(z)
z+z z-z
\:/ z E C, ~e(z) = -
2
- et Jm(z) = li"
1
,1
1
95 '
On déduit de ces formules (et même au-delà du calcul, de l'interprétation géométrique de
la conjugaison) la proposition suivante : r/J
~
!i
!
~
o.
Ptop~itiQ~f~lff~ ~~tt~lij~~•~i.:~J ~i•~j~'}t s
0
<:)
1) VzEC;iëR~z,#,2'~ . . 2)Vt.è(;,z~,.·.~t=-:-z: r/J
Cl)
~
"a
Mffi;;;~slé·1iié~~r1~.,,rtr',f•i~i,f.,.·_ §
r/J
Cl)
"Cl
(,)
r/J
e-
3) \>'{z1, z2) e C2;z1z2 =Z:t:Zz; 5) •· Vz1 ~C.Vz2·E"C*,z1/Z2 =z1/Iï- 0
<:)
~
PREUVE. Soient z 1 = o 1 + ib 1 et z2 = 02 + ib2 où o 1, 02, b,, b2 sont quatre nombres réels. l!Î
On a immédiatement z 1 = o 1 - ib 1 = o 1 + ib 1 = z 1, la proposition 1) est donc vérifiée. De ..d
ü
plus, z 1 + z 2 = (o 1 + o 2) + i(b 1 + b 2), ainsi z 1 + z2 = o, + 02 -ib1 -ib2 = z, + Zz. De même,
z 1z2 = (o 1o 2 - b1 b2) + i(o 1b2 + 02b1l, donc z,z2 = (0102 - b1 b2) - i(o, b2 + 02b1) = z1 z2,
ce qui démontre les propriétés 4) et 3). Prouvons la propriété 2) : soit z E (C*, d'après 3),
z x 1/z = z x 1/z = 1, d'où le résultat. Prouvons la propriété 5) : soient Z1 E (Cet Z2 E (C*.
D'après la propriété 3), z 1/z2 = z 1 x 1/z2 = z, x l/z2, et en appliquant la propriété 2),
zi/z2 = z,/zz. ■
EXEMPLE 5.12. Déterminons l'ensemble des points M(z) tels que~ soit réel.
► V z E (C \ {l}, z/(1 - z) E IR si et seulement si z/(1 - z) = z/(1 - z), i.e. z/(1 - z) =
z/(1 - z), soit encore z - zz = z - zz, et finalement z = z, c'est-à-direz E R L'ensemble
recherché est donc IR \ {1}.
Le résultat suivant, dont la preuve est élémentaire, nous permettra de définir le module
d'un nombre complexe.
Ce petit calcul permet d'écrire sous forme algébrique le quotient de deux nombres com-
plexes, il suffit pour cela de multiplier dénominateur et numérateur de la fraction par la
quantité conjuguée du dénominateur : zi/z2 = z1z2/z2z2. Par exemple,
1-i 1-i
l+i l2+l2 -2-·
, . , . (i-1)3
EXEMPLE 5.14. Ecnvons sous forme algebnque le nombrez= (i + )2 + (i- lis·
3
► Puisque (i-1) 3 = (i- l)(i-1) 2 = 2+2i, (i-1) 5 = (2+2i)(-2i) = 4-4i; de plus
(i + 3) 2 = 8 + 6i. Ainsi z = (2 + 2i)/(12 +li)= (1 + i)(6 - i)/(6 2 + 1) = (7 + Si)/37.
96
!
....;
Définition 5.15. (Module). Pour tout z E C, on définit le module lzl du nombre complexe
z par la formule lzl = ,/zi. Si z =a+ ib avec a et b réels, lzl = ✓ a2 + b 2 . Si z = x E lR,
le module de x est égal à la valeur absolue de x, il n'y a donc pas conflit de notations.
Soit w un vecteur du plan d'affixe w = a+ ib, où a et b sont réels. D'après la définition
précédente, on a lwl = ✓ a 2 + b 2 , mais puisque ( a, b) sont les coordonnées de w dans le repère
orthonormé !3i, on a également ✓ a2 + b 2 = llwll, d'où lwl = llwll- La distance entre deux
points A(<X) et B(~) se calculera donc par la formule AB= 1~ - <XI, et, en particulier, si M
est un point du plan fYJ d'affixe z, on a lzl = OM : le module s'interprète donc comme une
distance.
M(z)
lzl
Pour tout nombre complexe w et tout réel r > 0, l'ensemble des points M d'affixe z tels
que lz-wl = r est donc le cercle de centre fl(w) et de rayon r. Notons que l'équation de ce
cercle lz - wl = r peut aussi s'écrire lz - wl 2 = r 2 , c'est-à-dire
( {==) Soit z ER+· On a alors Jm(z) = 0 d'où lzl = 19te(z)I = J9te(z) 2 = 9te(z).
(==}) Réciproquement, supposons que 9te(z) = lzl. Alors 9te(z) 2 = iz/2 = 9te(z) 2 + Jm(z)2, is
0
d'où Jm(z) = 0 et donc z = 9te(z) = lzl est un réel positif. u
ri)
~
Test 5.3. Test 5.4. "a
0
i::
Prouver que Établir que ri)
(1.)
"Cl
z E iJE. si et seulement si iJm(z) = z. z ER+ si et seulement si !Re(z) = lzl. u
ri)
e,
0
u
j
Les propriétés 1) à 4) énoncées ci-dessus correspondent à des évidences géométriques, le 10
lecteur s'en convaincra en observant la figure 15.4. La proposition suivante précise le compor- ..d
tement du module vis-à-vis de la multiplication.
u
EXEMPLE 5.20. Déterminons l'ensemble des nombres complexes z tels que liz-11 = liz+ 11.
► Soit z E C, liz- 11 = liz + 11 si et seulement si li(z + i)I = li(z - i)I donc si et seulement
si lillz + il = lillz - il, c'est-à-dire lz +il= lz - il. Notons A et B les points d'affixes i et -i.
Soient z E (Cet M le point d'affixe z, liz - 11 = liz + 11 si et seulement si AM= BM donc
si et seulement si M appartient à la médiatrice de [AB] et par conséquent si et seulement
si z ER
Lr/l
(1)
~
o:i
Étudions, pour clore ce paragraphe sur les propriétés du module, le comportement de
celui-ci par rapport à l'addition.
FIGURE 5.5. L'inégalité triangulaire sur C ou le plus court chemin entre deux points est
la ligne droite
Soit un nombre complexez non nul. Notons (r, 0) des coordonnées polaires du point M(z)
et (x, -y) les coordonnées cartésiennes dans (0, ü, v) du point M(z). D'après le cours de tri-
gonométrie, en notant H et K les projetés orthogonaux de M sur les axes (Ox) et (O-y), on a
100
Ainsi, pour déterminer la forme polaire d'un nombre complexez non nul donné, on com-
mencera par calculer lzl puis on recherchera 8 E lR tel que z/lzl = cos(8) +isin(8). On se
souviendra pour cela des valeurs particulières des lignes trigonométrique s (en n/2, n/3, n/6,
n/4, etc.) en s'aidant au besoin du cercle trigonométrique.
A(I)
La raison de distinguer ce nombre de tous les autres est qu'il intervient en géométrie du
triangle : il est très utile pour l'étude des configurations équilatérales. Avant d'y revenir dans
le cours de géométrie, remarquons d'ores et déjà que
et qu'ainsi les points A(l), B(j) et C(j2) forment un triangle équilatéral. On prendra donc
garde à ne pas utiliser les lettres i et j comme noms de variable dans un exercice sur les
nombres complexes, elles sont réservées.
101
(cos( 0) cos( cp) - sin( 0) sin( cp)) + i( cos( 0) sin( cp) + cos( cp) sin( 0)),
et d'après les formules d'addition du sinus et du cosinus, cette quantité est égale à
1§
r/J
Cl)
"O
cos(0 + cp) + isin(0 + cp ). y
r/J
Vis-à-vis des imaginaires purs, la quantité cos(0) + isin(0) joue donc le même rôle que l'expo- ~u
nentielle réelle : elle transforme des sommes en produits, ce qui motive la notation suivante. j
tr.i
Définition 5.28. (Exponentielle d'un imaginaire). Pour tout 0 E JR, on pose ..ci
u
ern = cos(0) + isin(0).
'.~(J··;~;/~('1}i~ii1~~~·•.··
~~titin s.oof ~iKtJ{fto"ît~~Î~jJ "~fé~'ffJ)1E i 2;~tr~YJ ~tt1!~':
1
PREUVE. Soit 0 E lR. Puisque ei9 = cos(0)-isin(0) = cos(-0) +isin(-0), on a ei9 = cm.
De plus, ei0-ie = e0 = 1 = ei0 e-rn, donc 1/eie = e-ie_ ■
Les règles précédentes vont nous permettre de calculer la forme polaire de la somme de
deux nombres complexes de module 1. Cette méthode est connue sous le nom de factorisation
par l'arc moitié.
102
Il faut remarquer que cette dernière écriture n'est pas toujours la forme polaire du nombre
eie + eicp puisque la quantité cos((0- cp) / 2) peut être négative. Cette méthode s'adapte sans
peine aux expressions du type ± 1 ± ei6 •
EXEMPLE 5.32. Écrivons sous forme polaire IX= ein/4 + elin/5 et f3 = 1 + ein/4 _
4
► Factorisons par l'angle moitié. On a IX= 2cos(23n/40)e in/ o mais cos(23n/40) < O.
33
On écrit donc, IX= 2cos(23n/40 + n)e in/ 0+in = 2cos(63n/40)e in/ o_ De même, on écrit
33 4 73 4
que f3 = einf (ein/B + e-in/ ) = lcos(n/8)ein/B, et c'est fini puisque cos(63n/40) > 0 et
8 8
cos(n/8) > O.
cos(0)+cos(qi)=2cos ( -e-qi)
- cos (e+qi)
- - . .
,sm(0)+sm(qi)=2cos - - sm (e+qi)
(e-qi). - -.
2 2 2 2
Il suffit pour cela d'égaler les parties réelles et imaginaires des deux membres.
PREUVE. Soit pour tout entier naturel n, HR(n) la proposition eine = (ei0)n. HR(O) est
banale puisque e 0 = 1. Supposons HR(n) vraie. Alors, d'après l'équation fonctionnelle de
l'exponentielle, ene+e = en°e 0 = (ei0)nei0 = (ei0)n+ 1 . La formule est donc acquise pour
n E N d'après le principe de récurrence. On remarque pour conclure que la formule est vraie
pour des exposants négatifs puisque e-ine = eine = (ei6 )n = (ei6 )n = (e-i0)n. ■
Rappelons que l'écriture eine = (ei0)n est une formulation condensée de l'égalité
Puisque e2in = eiO, la fonètion exponentielle, définie sur iIR, n'est pas injective. Nous
terminerons ce paragraphe par une proposition qui précise ce défaut d'injectivité de l'expo-
nentielle.
Définition 5.38. (Argument principal d'un nombre complexe non nul). Soit z E
C*. L'unique réel e E ] - n, n] tel que z = lzl ei8 est appelé l'argument principal de z. On
le note arg(z).
D'un point de vue géométrique, siboint M désigne l'image de z -=/= 0, tout argument
0 de z est une mesure de l'angle (Ü, OM), l'argument principal correspondant à la mesure
principale.
lzl
v 0
0 il
Connaissant un argument du nombre complexe non nul z, on peut facilement obtenir tous
les autres arguments de z de la manière suivante :
103
Puisque e 2i7I = ei0 , la fonction exponentielle, définie sur illl, n'est pas injective. Nous
terminerons ce paragraphe par une proposition qui précise ce défaut d'injectivité de l'expo- i
nentielle.
18
PREUVE. Pour tous e, cp E Ill, ei0 ei<P équivaut à (cos(0),sin(0))
.
(cos ( cp), sin ( cp)),
UJ
~
0
UJ
c'est-à-dire 0 = cp [2n]. ■ e-
8
L'ensemble des nombres complexes de module 1 correspond géométriquement au cercle de ~
centre O et de rayon 1. Les mathématiciens ont convenu de le noter lU. in
..d
ü
Définition 5.36. (lU). On pose lU = {z E C l lzl = 1} = {ei0, 0 E Ill}.
Définition 5.38. (Argument principal d'un nombre complexe non nul). Soit z E
C*. L'unique réel 0 E ] - n, n] tel que z = lzl ei0 est appelé l'argument principal de z. On
le note arg(z).
D'un point de vue géométrique, si9oint M désigne l'image de z "# 0, tout argument
0 de z est une mesure de l'angle (Ü, OM), l'argument principal correspondant à la mesure
principale.
lzl
v 0
0 ü
Connaissant un argument du nombre complexe non nul z, on peut facilement obtenir tous
les autres arguments de z de la manière suivante :
104
i1:1t ~:~t1t~t~tf~t..
11 5
~
21:miflli:il:= -~(f:ûI21CJ:
leJ:es ~1•. et zi ~on n1Jl.s, ·. ; >. . (i · •· .·.
. ·. 3) aig(i1/z~} !!Ê ~g{z.1) ~,~{~;J~~J2t~,.>
4) \fn E Z,arg(zf) = narg{z1}(2tt:J.
PREUVE. Soient z 1 et z 2 deux nombres complexes non nuls, que l'on écrit sous forme po-
laire, ZJ = r1eiarg(z,J et Zz = r2eiarg(zzl. On a z1z2 = r1r2ei(arg(z,J+arg(zzll_ Ainsi, d'après la
proposition précédente, arg(z1 z2) = arg(z1) + arg(z2) [2n]. Puisque 1/zz = (1/r 2Je-iarg(zzl,
arg(1/z2) = -arg(z2) [2n]. Appliquons ce qui précède: zi/z2 = z1 x l/z2, d'où finalement
arg(zi/z2) = arg(z 1) + arg(l /z2) = arg(z 1) -arg(z2) [2n]. Par une récurrence immédiate, on
prouve à partir de la formule 1) que \fn E N,arg(z1) = narg(z1) [2n]. On conclut alors en
utilisant le 2). ■
M(z)
PREUVE. Soient z 1 et z2 dans rc. Par définition, ez1 +z2 = e!R<lz, +z2lei'.lm[z, +z2 l, d'où par addi-
tivité des parties réelle et imaginaire, ez1 +z2 = e'.Re(z, l+'.Re(z2 lei'.lm(zi l+iJm(z2 l. Puis on applique
deux fois l'équation fonctionnelle de l'exponentielle (celle déjà prouvée pour les réels et les
imaginaires purs), ez1+z2 = e!R,[zile%(z2 leiJm(z,Jei'.lm(z2 l. On utilise alors les règles de calcul
I!)
sur (C pour obtenir, eZJ +z2 = e!Re[z, lei'.lm(z, le!Re[z2 lei'.lm[z2 ), Et finalement, d'après la définition ..d
de l'exponentielle, ez1 +z2 = ez, ez2. ■ u
On prouve à partir de cette proposition et par une récurrence immédiate, que pour tout
nombre complexez et pour tout entier naturel n, (ez)n = e=.
Les propriétés 2) et 3) de la proposition 5.43 peuvent être résumées par la phrase suivante :
La proposition suivante établit que la fonction exponentielle atteint toutes les valeurs
sauf O. Nous avons déjà remarqué la non-injectivi té sur C de l'application exponentielle au
cours des paragraphes précédents, ce qui nous empêche de définir une fonction logarithme sur
...; C* (qui serait la fonction réciproque de l'exponentielle) .
P~$}~~i;.~;4§~:l/4P}l~f4!~t!~~t~~,ijfilit~~itli·H.C}J;§'..~t~,~:~1~
PfMl: Btlll'j~tfé,·.~ml. î~gp étàn;t ~ieJtC*;' ..... :<,t. ;)~:;··•
PREUVE. Puisque l'exponentielle ne s'annule jamais, son image est contenue dans C*. Réci-
proquement, soit z E C*. Écrivons z sous forme polaire: z = rem avec r > 0 et 0 E R On a
alors z = eln(T)+ie et donc z appartient à l'image de l'exponentielle. ■
Dans le cas de la somme sin(p )+cos( q), on partira de cos( q) = sin(n/2-q) afin d'appliquer
la même méthode. Nous reviendrons sur le calcul des sommes trigonométriques.
et donc
EXEMPLE
a cos(x) + b sin(x) = r cos(x - 0) = J
a 2 + b 2 cos(x - 0).
PREUVE. Soit w un nombre complexe non nul. Écrivons w sous forme polaire : w = rern
avec 0 E lR et r > O. L'équation z 2 = w s'écrit donc z 2 - ( y'rei0/l)2 = 0, c'est-à-dire
(z-y'rei8 / 2)(z+ y'rei8 / 2) = O. Cette équation admet exactement deux solutions: les nombres
y'reie/2 et -y'reie/2_ ■
x 2 --y 2 = ry{e(w)
{ x 2 +-y 2 = lwl
◊ On en déduit quatre couples (x, -y) solutions, et puisque 2x-y = Jm( w), on ne retient
que les deux couples (x, -y) tels que le signe de xy soit celui de Jm( w).
On se gardera d'appliquer cette méthode dans le cas où w est un nombre réel. Les racines
carrés de w sont alors évidentes, égales à ±y'u! si w est positif et à ±iJfwî si w est
négatif.
Signalons une variante de cette méthode (mais qui ne manque pas de lourdeur) : on
substitue dans l'équation x 2 - -y 2 = ry{e(w) la valeur de -y calculée par lx-y = Jm(w); on
obtient alors une équation bicarrée en x, que l'on peut résoudre.
'v•z' € é,•tli4+lrz
. ..
:+.~ =a(z ~ ~h+ S)' (~:_ ~b ...
. ~ . ~
6
.)'. ··
i.e. Vz E C, az2 + bz+ c = a[(z+ b/2a)2-L'l/4a2]; soit ô une racine carrée de !1. L'équation
az2 + bz+c = 0 est équivalente à (z+ b/2a) 2 - (6/la) 2 = 0, c'est-à-dire (z+ b/2a+f>/la)(z+
b/2a- 6/2a) = O. ■
109
1
rfJ
Cl)
On remarquera que la méthode de résolution sur C est la même que sur :IR, la seule différence "Cl
intervenant au moment du calcul d'une racine carrée du discriminant ~, qui existe toujours u
rfJ
sur C alors que les réels strictement négatifs n'ont aucune racine carrée réelle. ~
u
2
EXEMPLE 5.52. Résolvons dans C l'équation z - (1 + i)z + 2 + 2i = O.
j
► Le discriminant de l'équation est égal à~= (i+ 1)2-4(2+2i) = -8-6i = (l -3i) (voir
2 in
3 1 3 ..d
l'exemple 5.50) d'où les racines de l'équation, z 1 = l+iil- i = 1 - i et z2 = l+, 2 + i = 2i. ü
On déduit des expressions z 1 = -~;0 et z2 = -~;0 de ci-dessus que la somme des racines
de (E) vaut s = z 1 + z 2 = -~ et que leur produit est égal à z,z2 = ~;;:f = ~ = ~-
Ces égalités sont appelées relations coefficients-racines et sont à connaître parfaitement ; elles
seront généralisées dans le cours sur les polynômes.
Relations coefficients-racines
PREUVE. Soit z E C*. Écrivons z sous forme polaire: z = reie avec r > 0 et 0 E R zn = 1
si et se'lllement si rn = 1 et eine = 1, c'est-à-dire r = 1 et n0 = 0 [2n], c'est-à-dire il existe
m E Z tel que z = ei0 avec 0 = 2mn/n. Effectuons alors une division euclidienne de m par
.... n : m = qn + k avec O ~ k < n. Ainsi z = e 2k7r/n+Ziq7r = e 2ik7r/n_ ■
Cette proposition permet le calcul effectif des racines n-ièmes de l'unité sous forme d'ex-
ponentielle.
EXEMPLE 5.56. Montrons que les racines cubiques de l'unité sont 1, j et j2.
► En effet, les racines cubiques de l'unité sont données par e 0 = 1, e 2i7r/3 = j et e 4 i7r/3 =
( e2i7r/3)2 = j2.
EXEMPLE 5.57. Puisque e 2i7r/ 4 = ei7r/Z = i, les racines quatrièmes de l'unités sont l ,i, i 2 =
-1, i 3 = -i. Puisque e 2i7r/G = ei7r/ 3 , les racines sixièmes de l'unité sont 1, w = ei7r/3 , w 2 =
j, w3 = -1, w4 = j2, ws = e-i7r/3_
wn - 1 e2ni7r/n - 1 e2i7r - 1
PREUVE. Puisque w =/= 1, 1 + w + · · · + wn-l = - -- = =0. ■
w- 1 w- 1 w- 1
La proposition 5.58 possède une interprétation géométrique simple : l'isobarycentre du
polygône régulier dont les sommets sont les images de 1, w, ... , wn-l est l'origine O.
111
Dans des calculs où intervient une racine n-ième w, on tirera parti de ces deux propriétés.
Par exemple lorsque n = 5 et w = e2 i.rr/S, le calcul de la quantité u = (w + w 4 ) (w 2 + w 3 )
ici
commence par un développement du produit u = w 3 + w 4 + w 6 + w 7 ; on simplifie alors ..d
la somme en exploitant la 5-périodicité de (wm)mEN: puisque w 5 = 1, on a w 6 = w et ü
w 7 = w 2 . Ainsi u = w + w 2 + w 3 + w 4 et de l'égalité 1 + w + • • • + w 4 = 0, on déduit que
u = -1.
Au-delà de la proposition 5.58, si z 0 désigne une racine n-ième de l'unité autre que 1, on
zn-1
a également 1 +Zo+···+z-:;,- 1 = O. En effet, z 0 -/= 1 donc 1 +zo+···+z-:;,- 1 = - 0- - = O.
Zo- 1
Définition 5.60. Une racine n-ième de <X E C est un nombre complexe z tel que zn = <X.
La connaissance des racines n-ièmes de l'unité permet de donner toutes les racines n-ièmes
d'un complexe (non nul) dès que l'une d'elles est connue.
PREUVE. Si Zo = <X, l'équation zn = <X est équivalente à zn = zô, i.e. (z/Zo)n = 1. D'où les
solutions de l'équation: zo, ZoW, ... , zown- 1 , en posant w = e 2i.7t/n_ On conclut la démonstra-
tion en remarquant qu'un tel Zo existe toujours, si z = rei.0 avec r > 0 et 0 E :IR, Zo = y'rei.0/n
convient. ■
ffJ
Calcul des racines n-ièmes de <X -/=- 0
Cl)
! o Rechercher une racine n-ième particulière z 0 en écrivant <X sous forme trigonométrique.
....; o L'équation zn = <X est équivalente à zn = z 0, i.e. (z / zo ln = 1, i.e. z / Zo est une
racine n-ième de l'unité.
o Les racines n-ièmes de <X sont donc z 0 , z 0 w, ... , z 0wn-l où w elin/n_
Les images des racines n-ièmes de <X E C * sont les sommets d'un polygône régulier à n
côtés circonscrit au cercle de centre O et de rayon yÎ<xÎ. On déduit sans peine des résultats
précédents que la somme des racines n-ièmes de <X est nulle.
Z+ 1_ (2k+l)in/n
--1-e ,
z-
i.e. (1 - e(lk+l)in/n)z = -(1 + e(lk+l)in/nl. Puisque Vk ,( n - 1, 1 - e(lk+l)in/n f= 0, les
solutions sont les nombres,
1+ e(2k+l)in/n .
_ e(lk+l)in/n = -icotan((2k + l)n/n), 1 ,( k ,( n -1.
1
Remarque. On retiendra de cet exercice qu'il faut justifier avec soin l'équivalence des équa-
tions étudiées et prendre garde à la division par O. Le lecteur aura reconnu une factorisation
par l'arc moitié à la dernière ligne, au numérateur et au dénominateur.
VI. EXERCICES
5.1. 5.2.
5.3. 5.9.
Simplifier la somme suivante : Écrire sous forme algébrique les nombres com-
plexes suivants :
(i+ 1) 4 + (i-1) 5
1. 7
(i+ 1)
(i+ 1) 6 + 16(i-1) 3
2. 9
(i+ 1)
5.4. j129 + i1457
3. ï147
Calculer (1 + i )7 de deux manières. En déduire
ij+j2
les valeurs des sommes
4. (1 + j)7'
22
2. En déduire les solutions dans IC de
UJ
1. Calculer la somme S = .[_ sin(kn/23).
~
Ill
...;
k=O
11
(z+~)n =1.
Z-l
2. Endéduirelavaleurde S' = .[_ sin(kn/23).
3. Soit 0 E fi: tel que 0 =/= 0 [2n/n]. Résoudre
k=O
dans IC l'équation
11
3. En déduire S" = .[_ 1w 2k - 11 où l'on a z+
( z-1
1) n = eine.
posé w = ein/ 23 _
4. En déduire les solutions dans IC de l'équation
~ ~) n =
On traitera le cas général : 0 E fi: sans aucune
1. Résoudre dans IC l'équation (; 1. restriction.
Chapitre 6
SYMBOLES [ ET TT
OMMENÇONS ce chapitre dédié aux calculs de sommes et de produits par une petite
C digression sur les symboles de l'algèbre. Les notations que nous connaissons et mani-
pulons quotidiennement sont apparues entre le XVe et le XVIIe siècle. Les lettres p
et m (des initiales des mots italiens piu - plus - et mena - moins) utilisées pour l'addition
et la soustraction disparurent peu à peu au XVIe siècle, laissant la place aux notations + et -
introduites par l'allemand Johann Widmann en 1489.
Le mathématicien suisse Leonhard Euler est à l'origine de la notation des sommes à l'aide
du symbole L La paternité du symbole TT pour signifier produit est très controversée. Certains
historiens l'attribuent à Carl Friedrich Gauss au XVIIIe siècle alors que d'autres remontent au
XVIIe siècle en la personne de René Descartes.
1. 1. Règles de calcul
Soient (Un)nEN une suite de nombres complexes et p ~ q deux entiers naturels. Afin d'alléger
l'écriture des formules, la somme Up + Up+i + · · • + Uq est notée
q
Dans la pratique, le terme uk est donné par une formule, ce qui rend l'écriture des sommes
à l'aide du symbole r: plus précise que les trois petits points précédents. Par exemple, pour
116
n
r/J
tout entier naturel n ;:: 1, on notera la somme des n premiers entiers non nuls L k au lieu
Il) k=l
de 1 + 2 + · · · + n.
~
...;
Dans l'expression précédente, l'indice k est muet, c'est-à-dire qu'on peut le remplacer par
n'importe quel autre indice
n n
Il est important de savoir compter le nombre d'indices intervenant dans une somme. On
q
retiendra que pour tous entiers naturels p :( q, la somme L. uk comporte q - p + 1 termes.
k=p
Il suffit d'observer le schéma suivant :
______
...._
q entiers
28
On dénombre, par exemple, 27 termes dans la somme 4 + 6 + 8 + •• • + 56 = L 2k.
k=2
Les règles suivantes sont élémentaires et à connaître par cœur. Elles se démontrent par
récurrence sur le nombre de termes sommés en appliquant les règles de calcul usuelles sur les
nombres complexes.
117
En particulier, on déduit des deux dernières règles que, pour tout nombre réel 0 et tout
entier naturel n, i::
t
~ cos(k0) = 9le ( ~ eike) et ~ sin(k0) = Jm ( ~ eike)- l,.J
rfJ
CL)
ô
.c
Ce résultat est essentiel pour le calcul des sommes trigonométriques.
1co
I.2. Changements d'indices ..ci
ü
Une somme possède de nombreuses écritures à l'aide du symbole L Considérons par exemple
S = 6 + 8 + 10 + 12 + ••• + 28. On a
14 13 15
S = L 2k L (2k + 2) L (2k -
= = 2)
k=3
Sn= L Uk+l·
k=O
Changement d'indice
Effectuons le changement de variable C= k + 1 dans la somme suivante :
Lorsque k décrit le n+ 1-uplet (0, 1, ... , n), Cdécrit le n+ 1-uplet (1,2, ... , n+ 1), d'où
Les exemples précédents consistaient en des décalages d'indices. Signalons dès maintenant
un autre type de changement de variable, qu'on pourrait qualifier de symétrie.
n n
..; EXEMPLE 6. 2. Interprétons et prouvons la formule .L. k = .L. (n - k) .
k=O k=O
► Il s'agit de prouver que
q
Rappelons que l'écriture L uk n'a de sens que pour p ::;;; q. On sera vigilant lorsqu'un
k=p
changement d'indice renverse l'ordre des indices (cf. l'exemple précédent).
Celle-ci est qualifiée de simplification par télescopage. On peut en donner une preuve à l'aide
d'un changement d'indice. On a en effet, par linéarité
n n n
.L_ (Uk+1 - Uk) = .L_ Uk+1 - .L_ Uk.
k=O k=O k=O
~
,.c
-u,,
+ U,,+1 - U,,+1
+ U,,+2 - U,,+2
1cc
+ U,,+3 - U,,+3 .ci
Pour tous entiers naturels p ~ q, on a ü
q
+uq-1 -Uq-1
+uq -Uq
L_ (Uk+l - Uk) = Uq+l -Up.
k=p
+uq+l
Le télescopage nous offre une piste pour le calcul explicite de certaines sommes. Afin de
n
simplifier .L. uk, on peut rechercher une suite (vklkEN telle que, pour tout entier naturel k,
k=O
Uk = vk+l -vk, On dit que (vklkEN est une suite primitive de (uk)kEN·
Suites primitives
Pour simplifier une somme Sn= L~=O uk, on peut rechercher une suite primitive (vk)kEN
de (uk) kEN, ie telle que pour tout k E N, uk = vk+ 1 - vk. On a alors
n n
Le terme suite primitive n'est pas innocent, il fait écho à la théorie des intégrales.
EXEMPLE 6.4. Calculons la somme des n premier entiers naturels non nuls.
► La formule
...;
(k + 1 )2 - (k + 1) k2 - k
----2------2-=k
nous fournit une suite primitive de (k)kEN: la suite de terme général k(~-ll. On a donc, pour
tout entier naturel n non nul
Sn= t
k=l
k = n(n/ 1).
on a
q q
2S = L (uk + Uq+p-k) = L (Up + Uq) = (q -p + 1)(Up + uq),
k=p k=p
d'où la formule suivante.
1
Cette formule se prouve à l'aide d'une récurrence élémentaire.
121
d'où
Tq-p+l -1
S=Up----
r-1
Le lecteur mémorisera cette formule en se souvenant de la formule suivante.
On dénombre, par exemple, 5543 termes dans la somme 12458 + 12459 + • • • + 126000 , et 218
dans la somme 5 123 + 5 125 + ... + 5 455 + 5457 _
2
Cette formule se prouve à l'aide d'une récurrence élémentaire.
122
11.3. Factorisation de an - bn
La formule de la série géométrique permet de factoriser l'expression an - bn .
....;
PREUVE. La formule est banale lorsque b est nul et a= b. Supposons b non nul et a -1- b.
On a alors
Factorisation de an - bn
Le lecteur retiendra que la factorisation de an - bn par a - b s'obtient en additionnant
tous les termes de la forme a kbe avec k+f = n-1. Ainsi, sans même recourir au symbole
r (source d'une perte de temps pour les petites valeurs den), on obtient
Nous avons déjà remarqué la validité des identités remarquables sur C. La formule du binôme
de Newton, qui généralise ces identités, est également valable sur C. Commençons notre exposé
par quelques rappels sur les cœfficients binomiaux.
Cette définition n'est évidemment pas la meilleure, car il n'apparaît pas d'emblée que ces
cœfficients sont des entiers. La bonne définition de ces cœfficients relève de la combinatoire :
(~) est par définition le nombre de choix possibles de k objets parmi n, sans ordre. Par
exemple, avec cette définition il est clair que (~) = 3.
123
Dans la pratique et pour de petits indices k ::::;; n, plutôt que d'évaluer les factorielles de
la définition ci-dessus, on calcule les cœfficients du binôme de proche en proche à l'aide de la
relation de Pascal.
PREUVE. Comme
n-1) (n-1)! x k+ 1 = (k+ l)(n-1)! c.o
..cl
( k - k!(n-1 - k)! k+ 1 (k+ l)!(n-1 ~ k)! u
et
n-1) (n-1)! x n-k-1 _ (n-k-l)(n-1)!
( k+l - (k+l)!(n-2-k)! n-k-1 - (k+l)!(n-1-k)!'
(k+l-n-k-l)(n-1)! _ n! _ ( n )
on a
n-1)
( k +
(n-1) _
k+l - (k+l)!(n-2-k)! - (k+l)!(n-k-1)! - k+l . ■
triangle de Pascal
2
3
4
n-1)
( k+l
(k:1)
et ainsi de suite.
PREUVE. Soient a et b deux nombres complexes. Soit, pour tout entier naturel n, HR(n) la
r/J proposition suivante :
s
Cl)
1
...;
(a+ b)(a + b)n =(a+ b) f_ (~) akbn-k = a f_ (~) akbn-k+ b f_ (~) akbn-k
k=O k=O k=O
HR(n + 1) est vraie et la formule est donc acquise d'après le principe de récurrence. ■
Nous démontrons cette formule une seconde fois (et de manière bien plus élégante) dans
le paragraphe consacré aux produits.
.L. (4n)
4
n
EXEMPLE 6.10. Soit n EN. Calculons la somme k ik.
k=O
► D'après la formule du binôme,
f(
k=O
4
;)ik= (1 +i) 4 n= ((1 +i}2J2n= (2iJ2n= (4i 2 )n= (-4in_
Développement de (a+ b )n
t::
Il suffit d'utiliser la n + 1-ième ligne du triangle de Pascal sur laquelle on lit les n + 1 tî
w
cœfficients (~), 0 ~ k ~ n apparaissant dans la formule du binôme. On multiplie chacun rfJ
d'entre eux par akbn-k et on additionne les résultats afin d'obtenir l'identité souhaitée.
Par exemple, grâce à la septième ligne du triangle de Pascal 1 6 15 20 15 6 1, nous
obtenons en un éclair la formule 1
cô
..d
ü
IV .1. La linéarisation
Linéariser un produit de fonctions trigonométriques f(x) = sinn(x) cosm(x) consiste à écrire
f(x) sous la forme d'une somme de fonctions du type
sin(x) cos2(x) = ((eix - e-ix) / 2i)((eix + e-ixi / 2)2 = ;i [e3ix _ e-3ix + eix _ e-ix]
2isin(3x) + 2isin(x) 1 [. ( ) . ( )]
= Si = 4 SII1 3X + SII1 X .
n/2
EXEMPLE
►
6.12. Calculons l'intégrale I
Pour tout x réel
=
I
0
cos 2(x) sin 4 (x)dx.
- i9 ( ei9 )8 - 1 i.9e16in/17 - 1
I: - e e'·e - 1 =e e'·e - 1
Puisque 16n/ 17 = 7î - 7î / 17, on a e 16in/l? = -e-i7r/ 17 . Ainsi,
-1 _ -in/17 -1 _ -in/17 -1-ein/17
L _ 2in/17 e _ Zin/17 e
-e ef2n/17_1 -e ein/ 172isin(n/17) 2isin(n/ 17)
i + icos(n / 17) - sin(n/ 17)
2sin(n/17)
et donc S = SJlc(I:) = -1 / 2.
127
Les principales formules apparaissant dans les calculs de sommes trigonométriques sont la
formule de la série géométrique et celle du binôme de Newton.
T = t (!)
k=O
cos(kn/3).
► Posons u = .L.!=0 (~) eikrr/ 3, de sorte que T = Dte(u). En appliquant successivement les
formules de Moivre du binôme puis en factorisant par l'angle moitié,
Nous démontrerons ce résultat général dans le chapitre consacré aux polynômes et nous
contenterons d'indiquer sommairement la méthode.
Le lecteur retiendra qu'il lui faut impérativement connaître le calcul des puissances de i
et savoir écrire la formule du binôme pour les petites valeurs den avec la rapidité de l'éclair
(en utilisant le triangle de Pascal) ! Le calcul des polynômes de Tchebychev ne lui posera alors
aucun problème. Nous montrerons dans un chapitre consacré aux polynômes l'unicité des
polynômes de Tchebychev de. première et seconde espèce.
V .1. Notations
Nous avons traité dans les paragraphes précédents la sommation de nombres rangés dans une
suite. Il existe pourtant un autre cas de figure très courant en mathématiques, celui où les
nombres sont rangés dans un tableau 3 • Soit donc (ai,i) où 1 ~ i ~ n et 1 ~ j ~ p un
tel tableau de nombres complexes. L'indice i désigne la ligne (numérotation de haut en bas
den ligne(s)) et j la colonne (numérotation de gauche à droite de p colonne(s)) du tableau
contenant le nombre ai,i· Par exemple, dans le cas où n = 3 et p = 5
On adaptera sans peine cette représentation au cas où les indices i et j prennent la valeur 0,
le seul effet étant un décalage de la numérotation des lignes des colonnes : la colonne repérée
par l'indice j = 3 sera la quatrième, la ligne repérée par l'indice i = 6 sera la septième, etc.
3
Que nous appellerons plus loin dans le cours une matrice.
129
L
(i,j)EL1
ai,j•
Par exemple, pour n = 3 et L1 = { (1, 2), (2, 3), (2, 2), (3, 3)}
L..
' U··
1,,J
étant plus compacte que celle utilisant l'ensemble L'.1, elle est plus souvent employée dans les
problèmes et les exercices. Par exemple, lorsque p = n, les sommes
L ai,î et L U·.
i,J
l~i,j~n
désignent respectivement la somme de tous les éléments du tableau et la somme de tous les
éléments ai,i du tableau tels que 1 < j ~ i ~ n.
D'une manière générale, on commencera par visualiser les éléments du tableau que l'on
doit sommer avant d'écrire quoi que ce soit.
L
1,;;i,;;n,1,;;j,;;p
Ui,j•
On peut la calculer en sommant d'abord les lignes puis en sommant les n résultats obtenus,
ainsi p
.L_Ui,j
i=l
]-
'----v---"
somme de la ligne i
Mais on peut aussi la calculer en sommant d'abord les colonnes puis en sommant les p résultats
obtenus, ainsi
n
.L_Ui,j
i=l
]-
'----v---"
somme de la colonne j
130
.... s= L Ui,j·
l~j<i~n
* * * * * * *
a2,1
* * * * * *
U3,1 U3,2
* * * * *
* * * *
i=i+l--+ Uj+l,1
~J * * *
i=n--+
* *
Un,1 Un,2 (an,i] Un,n-1
*
l
colonne j
Fixons une colonne d'indice j compris entre 1 et n - 1. La somme des termes ai,i d'indices
(i, j) appartenant à ~ et situés sur la j-ième colonne du tableau vaut
n
L
i=j+l
ai.i•
n n-1 [ n ]
L ai,î=L, ai,i. L
(i,j)ELI. j=l i=j+l
Mais on peut également sommer d'abord en lignes. On s'inspire alors du tableau suivant :
* * * * * * *
a2,1
* * * * * *
U3,1 U3,2
* * * * *
ligne i --+
* * * *
1 ai,1 J (ai,H)
* * *
* *
Un,1 Un,2 Un,i-1 On,n-1
*
l l l
i=l i=2 j=i-1
Fixons une ligne d'indice i compris entre 2 et n. La somme des termes ai,i d'indices (i, j)
appartenant à~ et situés sur la i-ième ligne du tableau vaut
i-1
L_Ui,i·
i=l
131
[ i-1 ]
L
n
(i,j)EL'.
ai,i = L L
n
i=2 j=l
ai,i .
Ces manipulations ne nécessitent aucune justification particulière, les deux tableaux n'ont été
donnés que pour mieux éclairer le lecteur. Dans la pratique, les interversions s'effectuent en
toute simplicité. co
.d
ü
EXEMPLE 6.16. Calculons Sn= .L. i-;-.
l;;;i(j;;;n J
► Fixons une colonne d'indice j compris entre 1 et n. La somme des termes figurant sur la
j-ième colonne vaut
i i 1 i . . j(j + 1) j +1
L =-;-Li= J x - 2 - = -2-·
i=l)
7
Ji=l
On a donc
, ! __ ~ j + 1 __ ! ~ . = n( n + 3)
Sn = L · L 2 2L J 4
l;;;i;;;j;;;n J j=l i=2
Dans cet exemple, sommer en lignes aurait été une maladresse car ces dernières sont beau-
coup plus difficiles à simplifier. On réfléchira donc toujours avant d'opter pour une méthode
de calcul. Notons pour conclure que l'on peut sommer de bien d'autres manières (par exemple
en diagonale), il faudra donc être astucieux et choisir le calcul le plus concis possible.
Test 6.15. n i • •
Compléter les interversions suivantes :
3. L L_Ui,j = L_Ui,j = L L_Ui,j•
i=l j=l •
n n • •
n n • •
1. L L_Ui,j = L_Ui,j = L L_Ui,j•
4. L L_Ui,j = L_Ui,j = L L_Ui,j•
i=l i=l •
..
i=l j=i
n-1 n
Test 6.16.
2. I:. I:. ai,j = L Ui,j = LL Ui,j• Soit n E N*. Calculer L ij.
i=l j=i+l • j=e i=• l~i,j~n
! L. Uibj
l!Çi~n,l~j~p
...;
:pêil en sommant en colonnes. Soit j un indice de colonne fixé entre 1 et p. La somme des termes
o.. de la j-ième colonne vaut
n n n
où /\ = L. ai est indépendant de j.
i=l
On conclut alors en regroupant dans la dernière somme aiai + UjUi = 2aiai pour i -1- j et en
imposant i < j afin de ne compter qu'une seule fois ce double produit. ■
Soient (Un)nEN une suite de nombres complexes et p :( q deux entiers naturels. Le produit
Up X l.Lp+l X ... X Uq est noté
rr
q
Up X l.Lp+l X · · · X Uq = Uk.
k=p
De nombreuses remarques concernant les sommes restent valables pour les produits : indices
muets, changements d'indices, etc. Le télescopage prendra par contre la forme suivante : pour
une suite (un)nEN de termes non nuls, on a
Rè~lfl èUS. Pour tous nombre complex~ {1; et tout réel a., toutes suites de nombres complexes
(On}ttê~'et fbn.}n.eN, èt tous èntîers naturel.s p ~ q, on a, lortrquèles e:tprèSsionssai'lfantes
ont un sens:
:\} n~ll)tO]t~
~i .•· ..
(n<lk). x(nbtt) ;
k=p k=p é
q;. :·· . n
2) Iltax'.tt) = uq-p+l Il Xk;
k=p.. . k=l
3) I1e~=eCt •Y:
k=p.
0
On peut alors retrouver facilement la formule du binôme. Rappelons que (~) est le nombre
de choix possibles de k objet(s) parmi n.
VII. EXERCICES
6.1. 6.6.
...;
n 1 Calculer les sommes suivantes :
Calculer la somme An= L. lk cos(kn/3).
k=l 1. .I:.
1 ~i,j~n
max(i,j). 4. .I:.
l~i<j~n
i.
6.2.
2. .I:.
l~i,j~n
ij. 5. .I:.
1~i<j::5;n
ij.
Calculer
(1 + j2)27 + (1 + j2)28 + ... + (1 + j2)429_
3. .I:.
l~i~j~n
li-il-
6.7.
6.3.
Soient XE R et n EN. Simplifier le produit
Soient n ~ 1 et w
2. Déterminer n.!!1.foo f_ ln ( cos 2~).
= e 2in/n_ k=l
1. Soit m E N. Simplifier la somme
6.9.
1 +wm+w2m+··•+w(n-l)m_
s(z) =
n-1
L (z+wk)n. 1. Simplifier la somme Dn(0) L eike_
k=-n
k=O 2. Simplifier la somme
6.5.
ANS cette partie nous allons introduire trois type de structures algébriques : les groupes,
D les anneaux, et les corps, dont les applications mathématiques sont très distinctes.
Il est assez difficile de définir le mot structure pris isolément. De manière générale,
décrire la structure d'un objet revient à trouver des manières de le simplifier, de le découper
en parties significatives, et d'indiquer comment ces parties s'assemblent entre elles pour re-
construire l'objet initial. Ce faisant, on est inévitablement conduit à décrire les relations que
ces parties entretiennent les unes par rapport aux autres, et ces relations prennent en retour
plus d'importance que les parties elle-mêmes. Ayant réalisé cette description, il devient alors
possible de percevoir des ressemblances entre objets distincts et de les décrire de manière
parfaitement formalisée.
Donnons un premier exemple, celui des deux dessins suivants, que l'on peut imaginer
représenter des guirlandes.
l
Il est clair que les deux guirandes se ressemblent. Leur structure commune peut être décrite
par la suite de six instructions : 1 bas +, 2 bas -, 3 haut +, 4 bas -, 5 haut +, 6 bas -. Le
chiffre désigne la position sur un axe des abscisses, le mot bas ou haut la position sur l'axe
des ordonnées, et le signe indique une couleur (différente dans les deux cas). Le fait que la
forme des décorations (disques ou triangles) ne soit pas la même dans les deux guirlandes n'a
en fait aucune importance.
Venons-en maintenant à notre sujet, celui des structures algébriques. Considérons un en-
semble E. Une loi de composition interne sur E est une application de E x E dans E. C'est
donc une manière d'associer à tout couple de E un élément de E bien défini. On désigne en
général les lois par des symboles opératoires, comme+, x, o, o, EB, 0, etc. Si un couple (a, b)
d'éléments de E est donné, et si EB est la loi de composition interne, on note alors a EB b
l'élément associé au couple ( a, b ). Une structure algébrique est un ensemble muni de une ou
plusieurs lois de composition internes. On peut décrire une loi interne par ce que l'on appelle
une table de composition de la forme suivante
EB A B C
A A B C
B B C A
C C A B
Iof=fol=f
pour tout élément f de E. On dit que I est l'élément neutre de la structure. Si f- 1 est la
bijection réciproque de f, on aura f o f- 1 = f- 1 of= I.
On dit que f- 1 est l'élément symétrique de f, sa composée avec f doit donner l'élément
neutre. Enfin, si f, g, h. sont trois éléments de E, on aura ( fo (go h.)) (x) = ( (fo g) oh.) (x) pour
tout x de A, ce qui montre que f o ( g oh.) = (f o g) oh.. On dit que la loi o est associative. Nous
venons ainsi de décrire les trois propriétés requises pour qu'une loi de composition munisse
un ensemble d'une structure de groupe.
Montrons-en une application. Soit (E, 0) un groupe, dont l'élément neutre sera noté e. On
considère l'équation suivante entre éléments de E
a0x=b
où l'inconnue est x, et où a et b sont donnés dans E. Alors on peut utiliser les propriétés
de la loi 0 pour montrer qu'elle possède une unique solution. En effet, composons les deux
termes de l'égalité par l'élément symétrique de a, que l'on note u- 1 . On obtient l'égalité
u- 1 0 (a 0 x) = u- 1 0 b. L'associativité de 0 permet de calculer le premier membre :
u- 1 0 (a 0 x) = (u- 1 0 a) 0 x = e 0 x = x. On a donc finalement obtenu x = u- 1 0 b,
l'équation est résolue, elle possède une unique solution.
Chacun reconnaît là la méthode de résolution des équations ax = b entre nombres ra-
tionnels par exemple, lorsque a -1 O. Cela n'a rien d'étonnant, puisque ((Ql*, •) est un groupe
(on suppose b -1 0 dans ce cas). L'intérêt de l'introduction de cette idée de structure est
qu'elle montre clairement que la résolution des équations entre bijections d'un ensemble est
exactement similaire à celle des équations entre rationnels non nuls. Là encore, peu importe
la nature des objets, seuls interviennent leurs rapports, codés de manière convenable. On no-
tera aussi que comme (Z, +), ((Ql, +) sont des groupes, les équations s'y résolvent de la mème
manière, ce qui est bien connu.
Les groupes seront introduits et analysés dans les chapitres 9 et 10. Le complément du
chapitre 10 donnera une première présentation des relations entre la notion de groupe et
l'analyse des symétries des objets, qui lui est intimement liée.
o La structure d'anneau. La structure d'anneau est une évolution de celle de groupe. Un
anneau est un ensemble muni de deux lois de composition interne, qui satisfont une liste de
propriétés. Là encore, plutôt que de les énumérer, nous considérerons un exemple significatif,
celui de l'anneau (Z, +, •), où + est l'addition usuelle et · la multiplication. Nous avons déjà
signalé que (Z, +) est un groupe, commutatif (ce qui signifie que la somme de deux nombres
ne dépend pas de l'ordre dans lequel on effectue l'addition). De plus, la loi • est associative,
commutative, et satisfait une égalité de compatibilité relative à l'addition, la distributivité
(X + y) · Z = X · Z + y · Z.
Il faut noter que le domaine d'application des anneaux est nettement moins universel que
celui des groupes. En effet, l'existence conjointe d~ deux lois de composition impose l'existence
137
préalable d'objets assez riches. Il n'y a pas par exemple de structure naturelle d'anneau sur
l'ensemble des bijections d'un ensemble. En revanche, il existe des structures d'anneau sur les
ensembles usuels de nombres Z et (Q), et aussi lR comme nous le verrons ((Q) et lR ont même
des structures plus riches) ainsi que sur les espaces d'applications linéaires que nous verrons
dans la partie III et sur les espaces de polynômes que nous verrons dans la partie II.
L'idée d'anneau est le cadre naturel où se développent les notions de type arithmétique, par
exemple celle de divisibilité. Donnons d'abord l'exemple des entiers relatifs, qui correspond à
l'arithmétique classique, comme elle est présentée depuis les classes primaires. Si u et b sont
des entiers, on dit que a divise b, et on note a I b, lorsqu'il existe un entier n tel que na= b.
Il est équivalent de dire que b est un multiple de a. On peut traduire cette idée de divisibilité
de manière ensembliste: pour u E Z, on note uZ = {un In E Z} l'ensemble des multiples de
a. Dire que a divise b est donc équivalent à dire que b E uZ, et donc encore que bZ C aZ.
Cette remarque met en évidence l'intérêt des ensembles de la forme aZ. Il intervient là un fait
essentiel, à savoir que de la structure de ces ensembles il est possible d'abord de retenir deux
traits saillants ce sont d'abord des groupes commutatifs, qui vérifient de plus la propriété
suivante
\fm E Z, \ic E aZ, me E uZ.
Une partie d'un anneau vérifiant ces deux propriétés s'appelle un idéal de l'anneau. Consi-
dérons maintenant un idéal quelconque de Z, il est alors possible de montrer qu'il est néces-
sairement de la forme aZ (c'est une conséquence de l'existence de la division euclidienne).
En d'autres termes, les deux traits que nous avons mis en relief suffisent à caractériser les
ensembles uZ. Cette propriété n'est pas valable dans tous les anneaux; lorsqu'il la possède,
un anneau est dit principal.
Montrons un exemple d'utilisation. Si a et b sont des entiers, on peut toujours considérer
l'ensemble aZ + bZ. On voit facilement que c'est un idéal de Z. Il existe donc un élément
c E Z tel que cZ = aZ + bZ. Comme a E uZ + bZ, et b E uZ + bZ, on voit que c I u et c I b.
Il en résulte que c est un diviseur commun à u et b. Si maintenant d est un diviseur commun
à u et b, alors on voit que aZ C dZ et bZ C dZ, donc que cZ = aZ + bZ C dZ d'où l'on
déduit que d I c. Il en résulte que c est le plus grand (au signe près) diviseur commun à u et
b, soit c = pgcd (a, b). Mais comme c E cZ, c E uZ + bZ, donc il existe deux entiers u et v
tels que c =au+ bv, c'est le théorème de Bézout.
Tous ces résultats peuvent être montrés de manière élémentaire dans Z. Nous avons ce-
pendant fait un grand pas en avant, puisque nous avons en fait prouvé qu'ils sont de portée
beaucoup plus générale : ils sont valables dans tout anneau principal.
Nous verrons au moins un autre exemple fondamental d'anneau principal, il s'agit de celui
des polynômes. Un polynôme est une expression de la forme a0 + u 1X + · · · + unXn que nous
définirons plus précisément au chapitre 13. Il est possible d'additionner et de multiplier deux
polynômes, on obtient ainsi une structure d'anneau sur lequel existe aussi une division eucli-
dienne, l'anneau est donc aussi principal. L'arithmétique des polynômes, c'est-à-dire l'étude
de leurs propriétés de divisibilité, est donc dans une large mesure identique à celle des entiers.
Là encore, les objets diffèrent, mais leurs relations sont les mêmes.
L XIXe siècle, en particulier en vuede répondre à des questions posées par la notion
d'infini. Pour donner une idée du type de problème qui se pose immédiatement,
imaginons que l'on écrive sur une ligne la liste des nombres entiers naturels, et sur la ligne
suivante la liste des doubles des mêmes nombres, disposés comme suit
012345 6 7 8 9 1011
0 2 4 6 8 10 12 14 16 18 20 22
Il semble clair que les deux listes doivent avoir le même «nombre» d'éléments. Mais par
ailleurs la seconde liste n'est autre que la première à laquelle on a ôté un élément sur deux.
Elle doit donc en avoir deux fois moins que la première. Ce paradoxe apparent est une propriété
spécifique des ensembles infinis.
Georg Cantor découvrit de plus des infinis successifs, c'est-à-dire comptant strictement
plus d'éléments les uns que les autres. Cantor et Frege furent les premiers à jeter les bases
d'une théorie des ensembles initialement destinée à rationaliser l'usage de ces différents infinis.
Quelques logiciens, parmi lesquels Bertrand Russell, ont mis en évidence les limites de cette
théorie 1 . Il s'est avéré que l'on ne peut effectuer sans précaution n'importe quelle opération
sur les ensembles. Une théorie axiomatique des ensembles fut dès lors forgée.
Nous nous limiterons ici à une présentation très intuitive des différentes notions de théorie
des ensembles nécessaires pour la suite de cet ouvrage, et reviendrons un peu plus en détail
sur ces problèmes dans le cours de L2.
1. LA NOTION D'ENSEMBLE
Les résultats fondamentaux que nous allons introduire seront énoncés sous forme de règles.
1
Voir le célèbre paradoxe de Russell exposé ci-dessous.
140
t
o.
Remarque. Un ensemble est la donnée d'objets sans ordre. Par exemple, les ensembles de
lettres {a, b} et {b, a} sont les mêmes. Il faut également noter qu'un ensemble ne compte aucun
doublon. Ainsi {a, b, a}= {a, b}.
Définition 7.2.
1) On note 0 et on appelle ensemble vide l'ensemble qui ne contient aucun élément.
2) On appelle singleton tout ensemble contenant qu'un seul élément.
3) On appelle paire tout ensemble contenant deux éléments exactement.
Ainsi, {a, a} est un singleton, l'ensemble des solutions complexes de z 2 = -1 est une paire
et l'ensemble des solutions réelles de x 2 = -1 est vide.
E? {x € Xfl){x)}
~tfo,JJ'ff't;:f~i~~l>iê d~ x-dans X te' qüê l){i'}~l;,J irlctitè··· l~ânt•1>{iY.îYÎ
Par exemple, résoudre une équation (algébrique, différentielle, etc.) revient à passer d'une
écriture de l'ensemble des solutions en compréhension à une écriture en extension.
où j = e2in/3.
Au-delà d'une simple énumération, on peut aussi définir en extension un ensemble au
moyen d'une formule. C'est ce que l'on fait lorsqu'on définit un ensemble par une description
de ses éléments : « E est l'ensemble des objets de la forme ... ». Ainsi, l'ensemble E des
nombres de la forme n 2 + 1 où n est un entier naturel peut s'écrire E = {n2 + 11 n E N}. Il
est clair que E s'écrit en compréhension E = {m EN l :3n EN, m = n 2 + l}.
141
Les rudiments que nous venons d'exposer ne suffisent pas à bâtir une théorie sans faille,
la raison essentielle étant que, contrairement à l'intuition ordinaire, un ensemble ne peut pas
être n'importe quelle collection d'objets. C'est le philosophe Bertrand Russell qui ébranla le
premier la théorie «naïve» de Cantor et Frege à l'aide de son célèbre paradoxe : notons E
l'ensemble de tous les ensembles et considérons A le sous-ensemble de E formé des ensembles
qui ne se contiennent pas eux-mêmes. Si A E A alors, par définition de A, A r/. A, ce qui est
absurde. De même, si A rf. A alors, par définition de A, A E A, ce qui est également absurde 2 !
Afin d'éviter les paradoxes de la théorie naïve des ensembles, les mathématiciens ont construit
une théorie axiomatique des ensembles qui fixe des règles plus précises. Loin d'entrer dans
les détails de cette théorie, nous nous contenterons d'un bref aperçu. En premier lieu, il n'y
a plus d'objet mais un certain nombre d'ensembles dont on postule l'existence. Un corpus
de règles, les axiomes de la théorie, permettent alors de construire de nouveaux ensembles
à partir des ensembles précédents et de tous les ensembles déjà construits par cette théorie.
Il s'agit finalement d'un jeu de mécano abstrait aux règles très précises. Tous les énoncés
qui suivent peuvent être établis à partir des postulats de la théorie des ensembles. Il faut les
considérer comme des règles.
Dêfinition 7.6. Deux ensembles E et F sont dits égaux lorsqu'ils ont les mêmes éléments,
c'est-à-dire \:lx, (x E E) # (x E F).
Il est donc possible de prouver directement l'égalité de deux ensembles par un raisonnement
par équivalence. En toute généralité, on peut également prouver que E = F en deux temps :
d'abord Vx, (x E E) =} (x E F) puis Vx, (x E E) =} (x E F). Ce principe de démonstration
est appelé règle de la double inclusion.
2
Russell en donnera lui-même une version plus imagée, le paradoxe du barbier : un barbier décide de couper
la barbe à tous les habitants de la ville qui ne se rasent pas eux-mêmes. Se coupe-t-il lui-même la barbe ?
3 Plus généralement, la proposition Vx E 0, p(x) est toujours vraie. En effet, son contraire :lx E 0, non(p(x))
est faux puisque 0 est vide.
142
z = z2 # re-i.8 = r 2e 2i.8
# r = r 2 et - 8 = 20[2n]
# r = 1 et 0 = O[2n/3]
# z = l,j ou j2.
En partant des couples, on peut définir par récurrence sur n la notion de n-uplet (x 1, •.. , Xn)
qui la généralise.
Définition 7.9. Soient E1 et E2 deux ensembles. Le produit cartésien de E1 par E2 est par
définition l'ensemble E1 x E2 des couples (xi, x2) tels que xi E E1 et X2 E E2. On adoptera la
convention E1 x E2 = 0 lorsque l'un des deux ensembles E1 ou E2 est vide.
b • • • (3, b)
a • • •
2 3
IJEk
k=l
est par définition l'ensemble des n-uplets (x,, X2, ... , Xn) tels que \fk E {l, ... , n}, xk E Ek.
On adoptera la convention E 1 x ... x En = 0 lorsqu'il existe 1 ~ i ~ n tel que E, = 0.
Dans la règle précédente, il n'est pas fait mention d'un ensemble E contenant A et B.
Cependant, dans la pratique, les mathématiciens travaillent avec un ensemble Ede référence,
dont ils manipulent des sous-ensembles. Le résultat suivant généralise la notion de réunion.
::r~t~';~Q~•,èlfj~.(~fbèfi~
NJfê.f/f·<Sùît!,c~b- ë~~tnltti-~ vide dont ltisllé't1'ïe'nts.sont des ense!lt-blés., ll ~a;iàt~:'lffl
1Jûi ri,,fiennênt à to~ lès élé~ts de Ê. et on le
;X/i;E .
Autrement dit, deux ensembles sont disjoints si et seulement si ils n'ont aucun élément en
commun.
Test 7.7. Test 7.8.
Calculer l'intersection des ensembles Les ensembles
A= {k/2n (k, n) E Z x N} et B = Z.
1 A={r+a,(r,a)EQx(IR\Q)} et B=Q
sont-ils disjoints ?
A\B
FIGURE 7.4. Les opérations vues sur les diagrammes de Venn, suite et fin
PREUVE.
'8
.2 et
Cl)
Ainsi, An (BL'lC)C = (An cc n Be) u (An B n C) et donc
~
Cette expression étant invariante par permutation des ensembles A, B et C, on a en particulier
AL'l(BL'lC) = CL'l(AL'lB). De plus, il est clair que CL'l(AL'lB) = (AL'lB)L'lC (en toute généralité
EL'lF = FL'lE). D'où AL'l(BL'lC) = (AL'lB)L'lC.
LJ
XEffe(E)
X et n
XEffe(E)
X.
1.4. Recouvrements et partitions
Définition 7.24. Soit A un ensemble et soit E un ensemble de parties de A. On dit que E
est un recouvrement de A ou encore que les éléments de E recouvrent A lorsque A= X. LJ
XEE
Définition 7.25. Une partition d'un ensemble E est un ensemble X dont les éléments sont
non vides, recouvrent E et sont deux à deux disjoints.
Toute partition d'un ensemble E est donc un recouvrement de E mais la réciproque est
fausse, comme l'illustre l'exemple de la figure 7.5 : les parties {l, 2} et {1, 3, 4} ne sont pas
disjointes. Par contre, l'ensemble X décrit à la figure 7.6 est une partition de E = {1, 2, 3, 4, 5, 6}.
EXEMPLE 7.26. On note 2N (resp. 2N + 1) l'ensemble des entiers naturels pairs (resp.
1 impairs). L'ensemble {2N,2N + l} est une partition de N.
D'un point de vue naïf, une application d'un ensemble A vers un ensemble B est la donnée
pour tout élément a. de A d'un unique élément b de B, correspondance que l'on note a. H b.
148
w
V
A
2 3
Par exemple, on peut définir une application de A = {1, 2, 3} dans B = {u, v, w} par les
~
o..
correspondances 1 Hu, 2 H w et 3 H v. On peut la représenter à la manière des fonctions
numériques usuelles sin,cos, etc., par la figure 7.7.
Cette notion empirique peut être formalisée au moyen des ensembles : l'application pré-
cédente est entièrement définie par la donnée de l'ensemble Ç = {(1, u), (2, w), (3, v)} appelé
graphe.
ILL Graphes
Définition 7.27. (Graphe). Soient E et F deux ensembles. On appelle graphe de E dans F
tout sous-ensemble Q de E x F.
Cette notion de graphe est trop générale pour définir une application de A dans B. Par
exemple, pour A= {l, 2, 3} et B = {u, v, w}, le graphe Ç = {(1, u), (1, v), (2, w)} ne permet pas
de faire correspondre à l'élément 1 de A un unique élément de B, puisque les couples (1, u)
et (1, v) appartiennent à Ç. De plus, comme 3 n'est la première composante d'aucun couple
du graphe, on ne peut faire correspondre aucun élément de B à l'élément 3 de A : tous les
graphes ne définissent pas des applications.
Définition 7.29.
1) On appelle application de E dans F tout graphe applicatif Q de E dans F.
2) On appelle fonction de E dans F tout graphe fonctionnel Q de E dans F.
Dans la pratique, une application ou une fonction Ç de E dans Fest notée à l'aide d'une
lettre, par exemple f, selon le principe suivant : pour tout élément x de E, en cas d'existence,
l'unique élément -y de F tel que (x, -y) E Ç est noté f(x) et appelé image de x par f. La seule
différence entre les notions de fonction et d'application de E dans Fest que certains éléments
de E peuvent ne pas avoir d'image par une fonction. On appelle ensemble de définition d'une
fonction f : E --+ F l'ensemble des éléments de E ayant une image par f. Signalons que les
conventions peuvent ici différer légèrement suivant les auteurs ou le contexte. Nous verrons
dans la partie «Analyse» qu'elles n'y sont pas exactement les mêmes, et qu'il y est usuel de
ne pas distinguer entre fonction et application.
Définition 7.30. Soit f: E-. F une application. Pour tout x dans E, f(x) est appelée image
de x par f. Pour tout y dans F, en cas d'existence, tout x dans E tel que y = f(x) est appelé
antécédent de y par f.
b
a
-t---+----e--+----+ E
2 3
La composition des applications est associative, c'est-à-dire que l'on peut parenthéser
indifféremment f o go h en (f o g) oh ouf o (go h) sans que cela ne change le résultat.
150
PREUVE. Soit x E E. On a
Une famille f: I -t E d'éléments de E indexée par I est souvent notée (fdiEh où fi= f(i)
pour tout i dans I.
Définition 7.36. Soit E un ensemble. On appelle suite d'éléments de E toute famille d'élé-
ments de E indexée par N, autrement dit toute application de N dans E.
De même, plutôt que u : N -t E, on note de préférence une suite sous forme indexée
(Un)nEN·
Il est clair que deux parties A et B de l'ensemble E sont égales si et seulement si ][A= l! 8 .
Plus généralement, on a AC B si et seulement si h '.:( l!B. L'intérêt des fonctions indicatrices
d'ensembles est donc de ramener des raisonnements ensemblistes tels que la double inclusion
à du calcul. La proposition suivante est un simple dictionnaire traduisant les opérations sur
les ensembles en termes de fonctions indicatrices. Nous n'en démontrerons que la troisième
formule.
151
PREUVE. Notons f = llAus et g = llA + lis - llAlls. Soit x E E. Il y a quatre cas à envisager.
Cas 1 x E A et x (j B. On a alors llAus(x) = llA(x) = 1 et lls(x) = 0, d'où f(x) = g(x).
Cas 2 x E A et x E B. On a alors llAus(x) = llA(x) = lls(x) = 1, d'où f(x) = g(x).
Cas 3 x E B et x (j A. On a alors llAus(x) = lls(x) = 1 et llA(x) = 0, d'où f(x) = g(x).
Cas 4 x (j A et x (j B. On a alors llAus(x) = llA(x) = lls(x) = 0, d'où f(x) = g(x). Comme
Vx E E, f(x) = g(x), on a f = g. ■
Les fonctions indicatrices permettent de prouver certaines inclusions par un calcul pure-
ment algébrique.
4
C'est d'ailleurs ce qu'on appelle le prolongement par continuité de f en O.
152
1
A = {1, 2}. Décrire f!A, A= {1,3},B = {2,3},C = {a} et D = {a,b}.
Que pensez-vous de flx? fi~ ? fi~? fil? ?
'2
-8
rJl
Il.4. Images directes et réciproques
J Une application f : E -, F est définie point par point. On peut considérer plus généralement
l'action de f sur certaines parties de E. Par exemple, lorsque E = F est un ensemble de points
et f une transformation géométrique de E, f(A) est une figure de E : la transformée par f de
la figure A.
Définition 7.43. Soit f: E-, F une application.
1) Pour tout AC E, on note f(A) = {f(x), x E A} l'image directe de A par f.
2) Pour tout B c F, on note f- 1 (B)= {x E E, f(x) E B} l'image réciproque de B par f.
Autrement dit, l'image réciproque f- 1 (B) est l'ensemble des éléments de E dont l'image
est dans B. La figure 7.10 montre que f(A) n'est pas vide dès que A-/= 0, alors que l'on peut
avoir f- 1 (B} = 0 pour B-/= 0.
f
----+
PREUVE.
Définition 7.46. Soit f: E----, F une application. Pour tout élément y de F, on appelle fibre
de f au-dessus de y le sous-ensemble f- 1 ({y}) de E formé par les antécédents de y par f.
E F
,j 4 •
•3
• 1 2•
f
l l l
F • • • •
a b C d
Définition de f Fibres de f
Cette notion permet une nouvelle représentation des applications. f : E ----, F est entièrement
définie par la donnée de ses fibres f- 1 ({-y}), y E F. Lorsque Fest un sous-ensemble de :IR, les
fibres de f sont aussi appelées les niveaux de l'application f.
154
EXEMPLE 7.47. Soit f: {-2, -1, 0, 1, 2, 3}--+ IR l'application définie par la formule f(n) =
rn
CL) cos(2nn/3). Déterminons les niveaux de f. Puisque l'image de f vaut B = {-1/2, 1}, pour
tout y E Be, la fibre de f au-dessus de y est vide. De plus, on a clairement
1
..srn On peut donc représenter de la sorte l'application f
i
i.......... 1• •3
-2• •O
-1/2 0 1/2
l l
---------+------+ lR
E F E E F
FIGURE 7.12. Les notions d'injectivité, surjectivité et bijectivité d'une application vues
sur un diagramme de Venn fléché
EXEMPLE 7.49. Toute application de IR dans IR strictement monotone est injective. Mais
la réciproque est fausse : f : (0, 2] --+ IR définie par x E (0, 1[ H x et x E [1, 2] H 3 - x est
injective mais pas monotone sur [O, 2].
Test 7.25. Test 7.26.
L'application f définie de C dans C par la for- Soit f : E --; F une bijection. Décrire les fibres
mule f(z) = z2 + 1 est-elle surjective ? Injec- de f.
tive?
PREUVE.
1) Soient x et x' dans E tels que (go f)(x) =(go f)(x'). On a alors g(f(x)) = g(f(x')), donc
f(x) = f(x') par injectivité de g. Puis, par injectivité de f, x = x'. Ainsi, go f est injective.
2) Soit z E H. Puisque g est surjective, il existe 1J E F tel que z = g(1J). Comme f est
surjective, il existe x dans Etel que 1J = f(x). Ainsi, z = (go f)(x) et go f est surjective.
3) Tout découle du 1) et du 2). ■
Par exemple, pour tout point O du plan !Y et pour tout réel 0, la rotation de centre 0
et d'angle 0 est une bijection de !Y dans !Y de bijection réciproque la rotation de centre
0 et d'angle -0.
156
Cette notation sera justifiée dans le chapitre sur le dénombrement. Anticipons de quelques
pages : si E et F sont des ensembles respectivement à p et n élément(s), fE est un ensemble
à nP élément(s). La notation fE permet donc de retenir cette formule.
EXEMPLE 7.55. Toute suite de réels étant une application de N dans JR, l'ensemble des
1 suites de nombres réels sera noté ]RN_ L'ensemble des applications de lR dans lR est noté JRIR_
Définition 7.56. L'ensemble des bijections de E dans F est noté pg(E, F). Lorsque F = E,
on note plus simplement pg(E, E) = 6(E). Une bijection de E dans E est également appelée
une permutation de E.
Nous allons généraliser dans ce qui suit la notion d'opération. Prenons un peu de recul
2
l'addition + des entiers naturels peut être considérée comme une application de N dans N,
qui à (n, m) associe le résultat de l'opération n +met vérifie certaines propriétés telles que
la commutativité (pour tous met n dans N, n+m = m+n), l'associativité (pour tous m, n
et p dans N, m + (n + p) = (m + n) + p), etc. Ainsi, après un examen minutieux de sa
2
démonstration, l'identité remarquable ( a + b )2 = a2 + 2ab + b repose sur la distributivité
de x par rapport à+, de la commutativité de x et de l'associativité de +.
Notation. Plutôt que 'l'(x, y), on note souvent le résultat de l'opération'!' de x par y à l'aide
d'un symbole, par exemple*, à la manière de l'addition+ et de la multiplication x usuelles
'!'(x, y)= X*lJ·
Définition 7.58. On appelle magma tout ensemble E non vide muni d'une loi de composition
interne*· On le note (E,*).
EXEMPLE 7.59. Soit E un ensemble. On note E = .':Jù(E) et pour tous les éléments A et
B de E, on pose A!iB = (An Be) U (Ac n B) E E. On définit ainsi une loi de composition
1 interne sur E.
1 * Il a b C 1 · · · 1
EXEMPLE 7.60. Dressons la table de Cayley de la loi Li sur E = Y'(A), où A= {O, l}.
Cl)
<Il
► On a E = { 0,{O},{l}, E} et il est clair que Vx E E, xLi0 = 0Lix = x et xLix = 0. De plus,
i
.a
Cl)
ELi{O} = {O}LiE = {1}, ELi{l} = {l}LiE = {O} et {O}Li{l} = E. On en déduit la table suivante
1 Li
0
{O}
Il 0
0
1 {O}
{O}
1 {1}
{1}
1 E
E
{1}
1
j {1}
{O}
{1}
0
E
E
0 {O}
i E E {1} {O} 0
5
Il semble d'ailleurs que l'associativité soit le minimum requis pour espérer des règles de calcul simples.
159
Définition 7.63. On appelle monoïde tout ensemble E muni d'une loi de composition
interne * associative et admettant un élément neutre.
EXEMPLE 7.64. (N,+), (lR,+), (JR, x), (C,+) et (C, x) sont des monoïdes d'éléments
neutres respectifs 0, 0, 1, 0 et 1. Pour tout ensemble E, (EE, o) est un monoïde 6 d'élément
neutre idE. Pour tout ensemble E, (.9(E),~) est un monoïde d'élément neutre 0.
Définition 7.65. Soient (M,*) un monoïde de neutre e, a E Met n EN. On définit par
récurrence afü par a 0 = e et pour tout n?:: 1, a*n =a* afü-l. On note plus simplement an
lorsqu'il n'y a pas d'ambiguité sur la loi*·
L'associativité de la loi* nous permet donc d'écrire que pour tous entiers met net tout
élément a du monoïde M, on a an+m = Un* am.
On prendra garde à ce que l'existence d'un inverse à droite et d'un inverse à gauche
n'implique pas l'existence d'un inverse en général. L'unicité d'un éventuel inverse n'est pas
assurée en général. On parlera donc d'un inverse et non de l'inverse d'un élément x.
EXEMPLE 7.67. Soit E = {a, b, c, d} muni de la loi* définie par la table de Cayley suivante
1 * Il a I b I c I d 1
a a b C d
b b a a C
C C a C a
d d a b d
L'élément a est neutre pour*· L'élément d est inversible à droite (car d * b = a) et à gauche
(car c * d = a) mais pas inversible. L'élément b admet deux inverses : b (car b * b = a) et
c (car b * c = a et c * b = a).
160
unique.
PREUVE. Notons e l'élément neutre de E. Soient y 1 et Y2, deux inverses de x pour*· On a
alors Y1 *X= e, d'où (Y1 *X) *Y2 = C*Y2 = Y2, puis Y1 * (X*Y2) = Y2, par associativité de*·
CommeX*Y2=e,onay1=Y1*e=y2. ■
Définition 7.69. Soit (E, *) un magma. Un élément x de E est dit régulier à gauche pour*
lorsque V(y1, Y2) E E2, X*Y1 = X*Y2 =} Y1 = Y2· On définit de même la régularité à droite.
Un élément x est dit régulier lorsqu'il est régulier à droite et à gauche.
Autrement dit, un élément x est régulier à gauche pour la loi * si et seulement si on peut
simplifier toute égalité à gauche par x.
EXEMPLE 7. 70. Dans N2 muni de la loi (n, m) * (n', m') = (nn', mm'), l'élément (1, 0)
n'est pas régulier à gauche car (1,0)*(2,3) = (1,0)*(2,5) et (2,3) i- (2,5). Par contre,
(1, 1) est régulier à gauche. De plus, (1,0) n'est pas régulier à droite et (1, 1) est régulier à
droite donc régulier dans (N 2 ,*).
L'exemple le plus important d'élément régulier est celui des éléments inversibles d'un
monoïde (M,*).
En particulier, pour tout élément inversible x d'un monoïde (M,*), l'égalité y = z est
équivalente à x- 1 *Y = x- 1 * z.
Définition 7. 72. Soit E un ensemble non vide. Une relation binaire sur E est la donnée
d'une partie R de E2.
161
Notation. On note x'Ry plutôt que (x, y) ER, et l'on dit que x et y sont en relation.
EXEMPLE 7. 73. On peut définir une relation sur ~ 2 par x'Ry si et seulement si y -x E ~+,
que l'on notera simplement x ~y.De même, pour tout ensemble E, on peut définir la relation
d'inclusion sur Y'(E) par ARB si et seulement si A C B, que l'on notera plus simplement
A C B. De même, sur ~iw., on définit la relation ~ par f ~ g si et seulement si pour tout
réel x, f(x) ~ g(x).
IV.1.1. Généralités
rJJ
Définition 7. 76. On appelle relation d'équivalence sur E toute relation binaire réflexive,
symétrique et transitive.
1
<El
rJJ
EXEMPLE
►
7. 77. Voici quelques illustrations.
La relation d'égalité= sur E est une relation d'équivalence.
► La relation ,S:: sur lR n'est pas une relation d'équivalence car elle n'est pas symétrique.
j ► La relation définie sur lR par xRy si et seulement si x 2 = y 2 est une relation d'équivalence
~ sur R
Définition 7. 78. Soit x un élément de E muni d'une relation d'équivalence R. On appelle
classe d'équivalence de x, et on note x, l'ensemble des éléments y en relation avec x, c'est-
à-dire y E x si et seulement si xRy.
Une relation d'équivalence permet de regrouper les éléments d'un ensemble E partageant une
même propriété pour former un nouvel ensemble appelé ensemble quotient de Epar R. C'est
un outil très puissant en algèbre, permettant par exemple de définir de nouveaux ensembles :
nous construirons dans ce qui suit Z à partir de N, puis (Q à partir de Z en utilisant les
relations d'équivalence.
Définition 7.80. On appelle ensemble quotient de Epar la relation d'équivalence R, et on
note E/R, l'ensemble des classes d'équivalence de E modulo R.
PREUVE. Soit X E E/R. Par définition de l'ensemble quotient E/R, il existe x E E tel que
X= x = 7t(xl. L'application 7t est donc surjective. ■
Définition 7.87. Une relation d'ordre ~ sur E est dite totale lorsque \l(x, Yl E E2 , x ~ y
ou y ~ x. On dit alors que l'ensemble (E, ~l est totalement ordonné.
Autrement dit, l'ordre ~ est total lorsque deux éléments quelconques de l'ensemble E sont
comparables au moyen de la relation ~-
EXEMPLE 7.88. L'ensemble (N, ~lest totalement ordonné. Ce n'est pas le cas de l'ensemble
ordonné (&(El, cl lorsque E possède plus de deux éléments. En effet, en notant a et b deux
éléments distincts de E, les parties {a} et {b} ne sont pas comparables par l'inclusion.
Définition 7.89. Soient (E, ~l un ensemble ordonné, F une partie non vide de E et x E E.
On dit que
1) x est un majorant de F ou encore que x majore F lorsque \If E F, f ~ x,
2) x est un minorant de F ou encore que x minore F lorsque \If E F, x ~ f,
3) x est un plus grand élément de F lorsque x E F et x est un majorant de F,
4) x est un plus petit élément de F lorsque x E F et x est un minorant de F.
164
1
de F, mais F n'admet pas de plus grand élément.
► Dans (Y'(E),c) où E = {O, 1}, F = {0,{O, 1}, E} est minorée par 0 et majorée par E qui
sont respectivement le plus petit et le plus grand élément de F.
]
..sen
1.....
..... PREUVE. Il s'agit d'une conséquence immédiate de l'antisymétrie de ~ : soient m1 et m2
deux plus petits éléments de F. Comme m2 E F, on a m1 ~ mz. Comme m1 E F, on a
également m 2 ~ m1. Ainsi, m1 = m2 par antisymétrie de~- ■
On peut donc parler du plus petit du plus grand élément d'un ensemble, lorsqu'il existe.
Définition 7.92. On dit qu'une partie A non vide d'un ensemble ordonné (E, ~) admet
une borne supérieure lorsque l'ensemble .,,f{A des majorants de A est non vide et admet un
plus petit élément. Ce dernier est alors unique : on l'appelle borne supérieure de A et on le
note sup(A).
EXEMPLE 7.95. La relation~ sur lR est compatible avec l'addition car, pour tous réels x, y
et z, (x ~ z) # (x + z ~y+ z) mais pas avec la multiplication. En effet, pour tous réels x, y
et z ~ 0, (x ~ z) # (x x z?: y x z).
lltb~tiê>n 7.96. Soit fE, *, ~} Un magma ordonné ; ~·et* sont compo,tibl~;'~.~f !Je,:ul~~,
,frient$i:°;'., . :.. ,. . .. •.i+·.· .. . .
4
V{x,y,z,t)EE , (x~y et z~t)=}{X*Z~Y*t)
PREUVE. ( {=) Soient x, y et z dans E tels que x ~ y. Puisque ~ est réflexive, z ~ z et donc
x * z ~ y * z et z * x ~ z * y : ~ et * sont compatibles.
(==}) Supposons ~ et * compatibles. Soient x, y, z et t dans E tels que x ~ y et z ~ t. Par
compatibilité à droite, on a x * z ~ y * z. Par compatibilité à gauche, on a y * z ~ y * t.
Par transitivité de ~' on a donc x * z ~ y* t. ■
V. LES ENSEMBLES N, Z ET Q
Comme nous l'avons remarqué dans les parties précédentes, la théorie des ensembles est en
quelque sorte un mécano permettant de construire de nouveaux ensembles à partir d'ensembles
connus et au moyen de règles fixées. Cela suppose l'existence d'un ensemble de départ7 à partir
duquel tous les autres peuvent être construits. Cet ensemble premier est l'ensemble N des
entiers naturels. Dans cette partie, nous allons voir comment utiliser le passage au quotient
pour construire les ensembles Z et IQ à partir de N.
Définition 7.97. (Axiomes de Peano). (N, ~) est un ensemble ordonné vérifiant les
propriétés suivantes
1) N admet un plus petit élément noté O.
2) L'ordre~ est total sur N.
3) Tout entier n admet un unique successeur noté n + 1.
4) Tout entier n =/. 0 admet un unique prédécesseur noté n - 1.
5) Le principe de récurrence. Soit, pour tout n dans N, HR(n} une propriété dépendant de
n. Si HR(O) est vraie et si, pour tout n E N, l'implication HR(n) =} HR(n + 1) est vraie,
alors HR(n) est vraie pour tout n dans N.
7
C'est-à-dire dont on postule l'existence.
166
1
successeur de O. On définit de même le prédécesseur d'un entier n non nul par n - 1 =
max({k ENI k < n}). On vérifie que (n -1) + 1 = n pour tout n non nul et (n + 1) -1 = n
pour tout n dans N.
]
-9 EXEMPLE 7.98. Prouvons que \ln EN, (n + 1) -1 = n.
r/J
► Soit n dans N. Commençons par remarquer que, pour tout entier naturel k, k < n + 1
équivaut à k :( n. L'implication ({=) est claire. Prouvons (===}) . Si k > n alors k ~ n + 1
J car k est un majorant strict de n donc il est minoré par le successeur de n, qui est n + 1.
C'est la contraposée de (===}) .
Ainsi {k E N Ik < n + 1} = {k E N Ik :( n} et donc
PREUVE.
1) Notons, pour tout n dans N, HR(n) la proprosition suivante : toute partie de N contenant
au moins un entier k tel que k :( n admet un plus petit élément. Prouvons cette propriété
par récurrence sur n. L'hypothèse HR(0) est vraie car si E C N contient 0, on a 0 = inf(N) =
inf(E). Soit n EN. Supposons HR(n) vraie et considérons un ensemble E contenant au moins
un élément k :( n + 1. Si on peut choisir k tel que k :( n, E admet un plus petit élément
d'après HR(n). Si ce n'est pas le cas, k = n + 1 et tous les éléments x de E vérifient x > n :
on an+ 1 = inf(E) d'où HR(n + 1 ). L'hypothèse HR(n) est donc vraie pour tout n dans N
par récurrence. Soit alors E C N non vide. Il existe n E E et donc, d'après HR(n), E admet
un plus petit élément.
2) Pour tout n dans N, notons HR(n) la proprosition suivante : toute partie de N non vide
et majorée par n admet un plus grand élément. Prouvons cette propriété par récurrence sur
n. L'hypothèse HR(0) est vraie car la seule partie non vide de N majorée par 0 est E = {0}
et max(E) = O. Soit n ~ O. Supposons HR(n) vraie et considérons une partie E de N non
vide et majorée par n + 1. Sin majore E, E admet un plus grand élément d'après HR(n). Si
ce n'est pas le cas, n + 1 E E et majore E ainsi max(E) = n + 1, d'où HR(n + 1) est vraie.
L'hypothèse HR(n) est donc vraie pour tout n dans N par récurrence. Soit alors E C N non
vide et majorée. Il existe n EN tel que n majore E et donc, d'après HR(n), E admet un plus
grand élément.
3) Cette propriété découle immédiatement du fait que tout élément de N admet un successeur.
■
Les axiomes de Peano assurent que ces deux lois sont bien définies sur N. On notera plus
simplement nm le produit n x m. Les propriétés de ces deux lois se vérifient par récurrence
sur les entiers m et n, nous nous contenterons de les énoncer.
• • • • ,, • JI ,,,•
• • • .,,.✓ , , , ' , .... ,"_,,,,' , . , JI
,' , ,' •✓
, • ,' ,'
.•
,/' ,'
•
,'
,,/ ,,•'
,.,, ,•'
,'
,/'
, ,' ,11'
,,.,,. ,,'
,,' ,,' , ,/
•'--:,---:,,•
,/ ,--:::-< ,--<-<---- .
_,,• / ,,,. ,,,. . .
•' ,----,,---,,,--
•' .,
•' •'
:,,---
. .. .. ..
FIGURE 7.13. Construction de Z à partir de N
Définition de la loi + sur Z. Pour toutes les classes z = (n, m) et z' = (n', m'), on
pose z + z' = (n + n', m + m'). Cette définition est correcte car indépendante des représen-
tants (n,m) et (n',m') des classes z et z'. En effet, si z = (n 1,m1) et z' = (n;,m;l, on a
n 1 + m = n + m 1 et n; + m' = n' + m 1, d'où n 1 + n; + m + m' = n' + n + m1 + m;
et donc (n+n',m+m') = (n 1 +n;,m1 +m;). On vérifie sans peine que+ est associative
et commutative sur Z et que 0 = (0, 0) est un élément neutre pour + sur Z. En identifiant
(n,0) et n EN, on a N C Z, l'addition sur N coïncidant avec celle sur Z puisque, pour tous
les entiers naturels n et m, (m, 0) + (n, 0) = (n + m, 0). Tout élément z = (m, n) admet un
opposé (n, m) noté classiquement -z.
PREUVE. L'unicité est claire. Soit z E Z. Il existe (k, f) E N2 tel que z = (k, f). Si k ~ e, on
az = e e,
(k- e, 0) = k- EN. Si k < on a z = (0, f - k) = -(E - k) avec E- k EN. ■
Définition de la loi x sur Z. Pour toutes les classes z = (n, m) et z' = (n', m'), on pose
z x z' = (nn', mm'). On prouve que cette définition est correcte en démontrant qu'elle est
indépendante des représentants de z et z' choisis. De plus, on prouve sans peine que cette
définition prolonge la multiplication sur N à savoir que, pour tous entiers naturels m et n,
(m,0) x (n,0) = (mn,0).
Construction de (Q). Pour tous couples (p, q) et (p', q') de Z x Z*, on note (p, q)R(p', q')
si et seulement si pq' = qp'. On vérifie sans peine que Rest une relation d'équivalence sur
Z x Z*. On note (Q) = Z x Z* /R l'ensemble quotient de Z x Z* par R. On peut considérer que
Z C (Q) en identifiant p E Z avec (p, 1) . Tout élément (p, q) de (Q) est noté !.
Définition de la loi+ sur (Q). Soient r = (p, q) et r' = (p', q') deux nombres rationnels.
On pose r + r' = (p q' + p 'q, q q '). On vérifie que la loi + est bien définie car indépendante
des représentants des classes r et r' choisies. De plus, on montre que la loi + est associative et
commutative et qu'elle prolonge l'addition sur le monoïde (Z, +), c'est-à-dire que, pour tous
8
Anticipons un peu le cours sur les anneaux : la construction ici exposée de iQ) à partir de Z est généralisable à
n'importe quel anneau intègre. C'est ce qu'on appelle la construction d'un corps de fractions, nous y reviendrons
dans le complément du même nom.
entiers relatifs pet q, (p, 1) + (q, 1) = (p + q, 1).
Définition de la loi x sur (Q). Soient T = (p, q) et r' = (p', q'). On pose r+r' = (pp', qq').
On vérifie que la loi x est bien définie car indépendante des représentants des classes T et r'
choisies. De plus, on montre que la loi x est associative et commutative et qu'elle prolonge la
multiplication sur Z, c'est-à-dire que, pour tous pet q dans Z, (p, 1) x (q, 1) = (pq, 1). On
établit sans peine que tout élément T = (p, q) non nul est inversible pour x d'inverse r- 1 = ~-
PREUVE. Soit TE (Q), il existe (p, q) E Z x Z* tel que T =~-Si q > 0, le résultat est acquis.
Sinon, q < 0 et T = ~ = =~. Le résultat est donc acquis puisque q > O. ■
Définition de la relation d'ordre ~ sur (Q). Pour tout couple (r1, T2) appartenant à (Q) 2,
on écrit T1 = (p1, q1) E Z x N* et T2 = (p2, q2) E Z x N*, et T1 ~ T2 si et seulement
si p2q1 - pi q2 EN. De cette définition découlent immédiatement la propriété suivante.
Remarque. Comme nous l'avons vu, les constructions de Z et (Q) s'effectuent sans peine à
partir d'un passage au quotient pour une relation d'équivalence définie par un nombre fini
d'opérations arithmétiques (voir l'utilisation de + et x dans les définitions ci-dessus). La
construction de lR à partir de (Q) s'avère beaucoup plus délicate et ne sera exposée qu'au
chapitre 21.
VI. EXERCICES
Soit E un ensemble.
1. Trouver une injection de E dans 9"(E).
2. Établir qu'il n'existe aucune surjection de E
7.3. dans 9"(E).
1
'2
..8 et
X= (AnB) u (B ne) u (CnA) et
inf(A, B) = inf({A, B}).
a. Justifier ces définitions. On exprimera
[/J y= (Au B) n (Bu C) n (Cu A).
sup(A, B) et inf(A, B) en fonction des sous-
ensembles A et B à l'aide des symboles U et
J 7.7.
n.
b. Montrer plus généralement que toute par-
tie non vide ff de (9-"(E), c) admet une borne
Soient I et J deux ensembles, (Ai,il(i,j)ElxJ une inférieure et une borne supérieure que l'on ex-
famille d'ensembles. plicitera à l'aide de ff en utilisant les symboles
1. Établir que net u.
2. Prouver à l'aide d'un contre-exemple qu'il On définit une relation binaire sur N2 par
n'y a pas toujours égalité des deux ensembles.
3. Établir que les deux ensembles sont égaux
lorsqu'on a en plus, pour tous couples (i,j) et
(i',j') de I x J,
1. Prouver que ~ est une relation d'ordre sur
if= i' =} Ai,i n Ai',i' = 0. l'ensemble N2 .
2. L'ordre est-il total ?
7.8. 3. On pose A= {(p,p), p EN} et
La notion de relation d'équivalence est l'outil qui permet de coller ensemble les éléments
d'un ensemble que l'on souhaite regrouper sous le même nom. Nous en verrons de nombreux
exemples dans le cours de Licence et cela n'a rien d'étonnant : c'est une notion qui traverse
les mathématiques toutes entières. Il existe cependant bien d'autres façons de relier des objets
entre eux.
Les graphes sont les objets mathématiques qui modélisent la notion la plus générale de
relation sur un ensemble. Nous allons ici nous intéresser plus particulièrement aux notions
d'arbre et d'arborescence et nous verrons comment elles permettent de résoudre efficacement
des problèmes d'optimisation.
Un passeur doit transporter une chèvre, un loup, un chou d'une rive à l'autre d'un
fleuve. Malheureusement, sa barque est trop exiguë pour transporter plus d'un objet ou
animal à la fois. De plus, il ne fait aucun doute que si la chèvre est laissée sans sur-
veillance en présence d'un chou, l'immonde animal peu vergogneux dévorera l'innocent
crucifère, et c'est bien laid. De même, si le loup est laissé seul avec la chèvre, comme
le dit la fable, il la mangera, et c'est bien normal. À l'inverse, le loup, hostile à tout
régime végétarien, ne toucherait au chou pour rien au monde. On admet enfin - et ce
n'est pas le moins incroyable de l'histoire - que le passeur maîtrise la situation et que
les deux animaux ne cèderont jamais à leurs instincts en sa présence. Comment doit-il
procéder pour amener les trois passagers à bon port ?
On a exclu les mots Cl, Cel et Cc qui ne sont pas compatibles avec les instincts de Cet
de l. Puisque les états de B se déduisent de ceux de A par passage au complémentaire, on
représente l'état du problème par l'état de A. On a donc 10 états possibles : C, L, c, cL, 0,
PcL, PcC, PCL, PC et PCcL. La question est de savoir si l'on peut passer de PCcl à 0. Pour
cela, on décompose tout voyage du passeur en trajets élémentaires, correspondant à une seule
traversée du passeur entre A et B.
On dira que deux mots sont en relation s'il est possible de passer de l'un à l'autre
par un trajet élémentaire.
Par exemple, les mots C et PC sont en relation car si seul C est en A, alors P,c,L sont en B et
il suffit que P revienne à vide en A pour obtenir le mot PC. Pour chacun des 10 mots, nous
allons dresser la liste des mots qui sont en relation. On peut s'aider des deux observations
suivantes.
Règle 7.106.
Dew: mots w1 et w2 sont en relation si· et seulement si Wz et w1 •· t.e sont:
Deux mots sont en relation si seulement si l'un des deux mots contient P, .et l'autrè. non.
La première règle exprime le fait que la relation est symétrique. La seconde règle traduit
le fait qu'il existe une partition de l'ensemble des 10 mots possibles en deux sous-ensembles :
A 1 = {Pel, PcC, PCl, PC, PCcl} et A 2 = {C, l, c, cl, 0}; et qu'il n'existe pas de mots en
relation au sein d'un même sous-ensemble. On dit que la relation est bipartie.
On représente la relation par le schéma suivant. Les 10 mots possibles sont associés à 10
points du plan. On trace un arc entre deux points si les mots afférents sont en relation. Il est
inutile d'orienter les arcs puisque la relation est symétrique. On obtient ainsi un graphe, dont
les 10 points sont les sommets et les arcs sont les arêtes. Si le graphe contient beaucoup de
sommets et d'arêtes, il n'est pas possible en général de le schématiser avec toutes ses arêtes
deux à deux disjointes. Pour éviter toute ambiguïté, on convient de choisir des arcs respectant
les deux règles suivantes.
Règle 7.107.
Les arcs ne se coupent qu'en un nombre fini de points.
Si plusieurs arcs se coupent en un même point, alor.s leurs droites tangentes en ce point sont
deux à deux disjointes.
PcL C
PcC L
PCL C
PC cL
PCcL 0
Dans notre problème de passeur, on obtient donc le graphe (biparti) donné par la fi-
gure 7.14. Les mots en relation avec un mot donné se lisent alors sur le dessin du graphe. Par
exemple, C est en relation avec PcC, PCL et PC : ce sont les mots reliés par une arête à C
sur le schéma. Il est important de comprendre que ce graphe a été obtenu sans préjuger de la
solution: nous avons dessiné a priori tous les arcs possibles issus de chaque sommet. Nous ne
cherchons donc pas à deviner pour l'instant quel est le meilleur enchaînement de traversées
possibles.
Examinons de plus près ce graphe. La propriété de bipartition se lit immédiatement sur la
figure: il se traduit par le fait que les deux colonnes de 5 points, représentant A 1 et A 2 , n'ont
aucune arête interne. Toute arête issue de la première colonne est incidente à un sommet de
la seconde colonne et inversement, toute arête incidente à la seconde colonne est issue de la
première colonne. Il suffit donc de dresser pour chaque mot de A 1 la liste des mots de A2 en
relation pour connaître, en retour, pour chaque mot de A 2 , la liste des mots de A1 en relation.
PCL
PCcL cL PcL
Une relation n'a pas une représentation graphique unique : elle dépend du choix de la
position des sommets dans le plan et plus encore du tracé des arcs. Par exemple, la figure 7.15
représente la même relation. Chaque figure a son avantage. La figure 7.14 met en évidence que
le graphe est biparti. À la figure 7.15, il est presque évident que notre problème a exactement
deux solutions avec k minimal.
(PCcL) (cL) (PcL)(L)(PCL)(C)(P C)(0) ;
(PCcL) (cL) (PcL)( c) (PcC) (C) (PC) (0).
Il faut un minimum de 7 trajets élémentaires pour que le passeur amène C, c, L sur la rive B.
9
Pour distinguer les sommets des chaînes et les sommets dans les chaînes, il sera commode d'utiliser un paren-
thésage. Ainsi, par exemple, (PC)(cL) désigne la chaîne formée d'une seule arête entre les deux sommets PC
et cL, alors que PCcL désigne le sommet correspondant au cas où P, c, C, L sont sur la rive A.
autres sommets sont donc à distance au moins 2 de PCcL. Or, PcL est adjacent à cL. On en
déduit que
2 :S d(Pcl) :S d(cl) + 1 = 2.
Ainsi, d(Pcl) = 2 et Pel est le seul sommet à distance 2 de PCcL. En procédant de proche en
proche, on peut donc calculer la distance de tout sommet au sommet PCcL. On étiquette alors
chaque sommet w du nombre d(w), ce qui donne la figure 7.16. Il en résulte que d(0) = 7 et
qu'il faut bien un minimum de 7 trajets élémentaires au passeur pour amener C, c et L sur la
rive B.
C
L
C
PC cL
PCcL o 0
Proposition 7.108.
L'algorithme A.1 de calcul des distances s 1ardte après un nômbre fi:ni d'opéro.tions.,
10
On convient que l'on a toujours i # j, ce qui signifie que le graphe ne contient pas de boucle, c'est-à-dire
d'arête reliant un sommet à lui-même. De plus, on identifie les mots WiWj et WjWi, qui reprêsentent donc la
même arête, ce qui signifie que le graphe est non orienté.
de fois qu'il est possible d'ajouter un sommet à l'ensemble variable Sv*, soit n fois. On a donc
au plus n + 2 + n x (n - 1 + 3) = n 2 + 3n + 2 opérations, ce qui montre que l'algorithme
s'arrête bien. ■
Comme cela est vrai pour toutes les chaînes joignant w 0 et v, la définition de la fonction d
montre que dw0 (v) :S d(v), ce qu'il restait à démontrer. ■
J.,~~ 7.110. .. . . ·. . ·
Soit dw0 : V-+NU{oo}lafonction définiepar l'algorithme A.1.0n suppose que dwo{w) < oo
et que wx E E. Alors dWo(x) :S: dWo(w) + 1.
On obtient ainsi une relation d'ordre total sur Sw dont w 0 est le plus petit élément et w le
plus grand : les sommets de Sw sont en effet ordonnés par ordre d'apparition dans la variable
v*. De plus, la fonction dw0 est croissante pour cette relation d'ordre. En effet, pour v 1 < v 2
consécutifs dans Sw, montrons que dw0 (vi) :S dw0 (vz). On a l'alternative suivante.
o Soit on a déjà dw0 (v2) < oo au moment où v* = V1, ce qui signifie que
◊ Soit dw0 ( Vz) = oo au moment où v* = V1, ce qui signifie que dw0 ( Vz) = dw0 ( V1) + 1 quand
l'algorithme s'arrête.
Dans les deux cas, dw0 (v1) :S dw0 (v2l, ce qui montre la croissance de dwo·
Montrons enfin l'inégalité de l'énoncé. Soit Vmin le plus petit sommet de Sw tel que VminX E
E. Alors par définition de l'algorithme, dw0 (x) est construit quand S = Svm•n' ce qui entraîne
que dw0 (x) = dw0 (Vminl + 1. Or, Vmin ~ W, donc dw0 (Vminl ~ dw0 (w). Il en résulte bien que
dw0 (x) ~ dw0 (w) + 1, comme annoncé. ■
Remarque. Si toutes les distances d(v) sont finies, on dit que le graphe est connexe. Cela
signifie que l'on peut joindre n'importe quel sommet à Wo par une chaîne. Autrement dit, il
est possible de se déplacer sur le graphe de n'importe quel sommet w à n'importe quel autre
sommet w' en suivant des arêtes. Il suffit en effet de suivre une chaîne de w à w 0 , puis de
suivre une chaîne de w 0 à w'.
est minimisante. Dans notre exemple, on a trouvé exactement deux chaînes minimisantes
L -1-~> \ PCL
~~
\c PC 0
~~-
PCcL cL PcL
Remarquons avant d'aller plus loin que la terminologie relation d'équivalence est ici abusive
car il faudrait la définir comme une relation binaire sur un ensemble des ensembles qui n'existe
pas ! Cela est bien sûr sans conséquence car nous n'utiliserons dans tout ce qui suit que les
propriétés de réflexivité, de symétrie et de transitivité de cette relation.
1
-g
..s
PREUVE. Raisonnons en deux temps.
(-;==) Si n ,,;; m, Nn C Nm et l'application d'inclusion de Nn dans Nm définie par i : x ---+ x
est clairement injective .
rJJ
(==}) Raisonnons par récurence sur n): 1. On note HR(n) l'hypothèse suivante : Pour tout
j entier naturel non nul m, l'existence une injection de Nn dans Nm implique que n ,,;; m.
L'hypothèse HR(l) est vérifiée car n = 1 ,,;; m. Soit n): 1. Supposons HR(n) vérifiée. Soit cp
~ une injection de Nn+l dans Nm. Envisageons plusieurs cas :
◊ Si cp(n + 1) = m, alors m): 2 car si on avait m = 1, on aurait cp(n + 1) = cp(l) = m donc
n + 1 = 1 par injectivité de cp, ce qui est absurde car n =/ O. De plus, la restriction <rlNn est
une injection de Nn dans Nm-l, et donc, d'après HR(n), on an,,;; m - 1, d'où n + 1 ,,;; m.
◊ Si cp(n + 1) < m, notons T la permutation de Nm qui échange les éléments cp(n + 1) et m,
c'est-à-dire l'application de Nm dans lui-même définie par
T(m) = cp(n + 1 ), T( cp(n + 1)) = m et T(k) = k pour k (/. {m, cp(n + 1)}.
L'application T est bijective car vérifie T o T = idNm. L'application cp' = T o cp est une injection
(en tant que composée d'injections) de Nn dans Nm vérifiant cp'(n + 1) = m. On est donc
ramené au cas précédent d'où n + 1 ,,;; m.
◊ Dans tous les cas n + 1 ,,;; met HR( n + 1) est donc vérifiée. ■
Proposition 8.6. (Cardinal d'un ensemble fini) Soit r. un énsèmt>le fin0i6n vide.· ft
exi.$te v.n.unique ent~er rw,tu~ln tel que E,... Nn. On le note n.= card (EL n = IEI, ou #{E},
et on l'appellè èlirdinillde t:Pur con11ention, on pose cari:I(0) =ô. . ...
PREUVE. Soient n et m deux entiers naturels non nuls tels que E ~ Nn et E ~ Nm. Soient
<r1 une bijection de E dans Nn et <pz une bijection de E dans Nm. L'application cp 1 o cp 21 est
alors une bijection de Nm dans Nn et donc, d'après le lemme précédent, m = n. ■
Pl'o-posîtfoif 8;7. ·Soîe'lit f. êt f deu:c ensirmbies tels quèE ;...• F. S(E èst;fini ~rSf également
~~~~ . .
1
,(1.)
Cl
oci
PREUVE. En effet, si E = 0 alors F ~ E entraîne F = 0. Si E =f. 0, en posant n = IEI, E ~ Nn ..d
u
d'où, par transitivité de la relation~, F ~ Nn, donc Fest fini et IFI = n = IEI. ■
◊ l'esquisse d'une preuve qui consiste à construire un élément de Fen faisant un certain
nombre de choix et à en déduire, après recensement de toutes les posibilités, la valeur
de IFI. '
EXEMPLE 8.8. Soit n un entier naturel non nul. Calculons le cardinal de l'ensemble défini
par F ={(n 1,n2) ENI n, +n2 = n}.
► Un calcul rigoureux mais laborieux: l'application définie par 1!': F--, Nn, f(n1, n 2) = n 1+
1 est une bijection de F sur Nn+l · En effet, puisque pour tout (n,, n2) E F, n2 = n-n 1 ~ 0,
on a O :( n 1 :( n d'où f(n1, n2) E Nn+l : l'application f est donc bien définie. De plus,
celle-ci est surjective, car, pour tout k E Nn+ 1 , k = f (k - 1 , n - k + 1). Il est clair que f est
injective car si f(n 1, n 2) = f(n\, n~), on a n 1 = n\, d'où n 2 = n-n 1 = n-n\ = n~ et donc
(n,,n2) = (n\,n~l- Ainsi, Fest fini et IFI = Nn+l =n+ 1.
► Un calcul heuristique mais élégant : un élément (n,, n2) de F étant entièrement défini par
le choix d'un entier n 1 entre O et n, on a IFI = n + 1.
Un des premiers résultats à établir est que tout sous-ensemble F d'un ensemble fini E est
fini avec IFI :( IEI- On commence par prouver les résultats pour les parties de l'ensemble Nn.
PREUVE. Prouvons le résultat par récurrence sur n = IEI. Notons HR(n) la proposition
suivante : toute partie de Nn est finie de cardinal inférieur à n. L'hypothèse HR(l) est claire
182
car les seules parties de N1 sont 0 et N 1. Soit n ~ l. Supposons HR(n) vraie et soit Fun
r/J sous-ensemble de Nn+l· Si F C Nn, Fest finie et !FI ~ n ~ n + 1 d'après HR(n). Sinon,
n+ 1 E F et l'on pose F' = F\ {n+ 1}. Si F' = 0, F = {n+ 1} est finie de cardinal 1 ~ n+ 1.
1
]
..8
Si F' =f. 0, F' est une partie non vide de Nn et, d'après HR(n), il existe p ~net une bijection
cp: F'----, Np. L'application g: F----, Np+l définie par gJp = f et f(n+ 1) = p + 1 est clairement
une bijection de F dans Np+ 1 • Ainsi F est finie de cardinal IFI = p + 1 ~ n + 1, d'où HR( n + 1) .
r/J Le résultat est donc acquis par récurrence sur n E N*. ■
j Ce lemme va nous permettre de prouver le résultat annoncé ci-dessus. Ajoutons que les
È
Cl)
fonctions indicatrices interviennent également dans le cadre du dénombrement. Elles per-
mettent quelques calculs de cardinaux.
PREUVE. o Commençons par prouver que A est fini. Si E = 0, le résultat est clair. Sinon,
notons n = IEI et f une bijection de E dans Nn. L'application g = flF : F----, Nn est injective
en tant que composée d'injections. On a donc F ~ g(F). D'après le lemme 8.9, la partie g(F)
est finie de cardinal m ~ n. Ainsi, par transitivité de ~, A ~ Nm et A est finie de cardinal
IAl=m~n.
o Si A= 0, l'égalité est banale. Si A =f. 0, il existe un entier naturel net une bijection cp
de A dans Nn. Puisque Vx E Ac,lIA(x) = 0, on a
n n
Proposition 8.11. Soient A c B dem ensembles finis.· Alors !Al·~ ft3f, De plus, A = 13 si
èt seulèment si JAi = !BI. · (
PREUVE. Il suffit d'appliquer la formule précédente et de remarquer que A C B équi~aut à
h ~ lis. Le cas d'égalité découle de l'équivalence A = B si et seulement si ][A = lis. '· ■
PREUVE.
1) La corestriction fi~(El étant une bijection, on a jf(E)I = jEj. Comme f{E) C F, on en déduit
que IEI ::;;; IF/.
2) Soit g : F -l E la fonction qui à tout élément -y de F associe un antécédent de -y par f.
Cette application est bien définie car f est supposée surjective. Il est clair que g est injective
donc, d'après le 1), IFI ::;;; IEI.
3) Le seul résultat non banal à montrer est que les hypothèses IEI = IFI et f injective impliquent
que f est surjective. Or, f(E) C F et jf(E)I = IEI par injectivité de f, d'où lf{E)I ::;;; IFI et donc
f(E) = F d'après la proposition 8.11. ■
EXEMPLE 8.14. Soient A et B deux ensembles finis. Montrons que l'ensemble A\ Best fini
de cardinal IAI - IA n Bj.
► Par définition, A\ B est le complémentaire de An B dans A. Ainsi, d'après la proposition
8.13, A\ B est fini de cardinal IA \BI= IAI - IA n BI.
Prop0$ltion 8.16. Soient A1, •.• , Ap sont p ensembles <Jeux à de'll,fl; <Jisjoints, ori a
On déduit de cette formule le calcul dans le cas général du cardinal de la réunion de deux
ensembles.
Proposition/ $.l7. Poor tQus enlembles finis" A et B, lo: ré-ûnior,, AIJ B eit itn epstmble
fini et !AüB! =!Al+ !BI~ IAn BI~
■
Cette formule se retrouve sans peine à l'aide d'un diagramme de Venn.
1
Par récurrence.
185
IEI = IAI + IB u Cl - IA n (Bu C)I = IAI + IBI + ICI - IB n Cl - l(A n B) u (An C)I
= IAI + IBI + ICI - IB n Cl - [IA n BI+ IA n Cl - IA n B n Cl]
= IAI + IBI + ICI - IB n Cl - IA n BI - IA n Cl + IA n B n Cl
Pi;-O{l~tio1;1 $.19~ (Forlllllle de Poincaré), Soient At. Ai, ... A,. n ~ l efl,Semble(s)
·n-
fini(s). Alors LJA1c est fini et
k==l
PREUVE. Notons A la réunion des Ak pour 1 :( k ( n. Cet ensemble est fini (voir la
remarque précédant l'énoncé de la proposition 8.19).D'après les lois de De Morgan
et donc
n n n
1 - lIA = ]IN = rr
k=l
][At = rr [1 - hJ
k=l
= 1 + L.r-11 k
k=l
d'où
n n
Ainsi,
n
■
186
PREUVE. Si 9 est vide, alors E = 0 et la formule est acquise. Dans le cas contraire, notons
9 = {A 1 , •.• , Ap}- Comme les ensembles Ai sont deux à deux disjoints de réunion E, E est
fini et l'on a
p
IEI= .[_.!XI;
XEE/R,
EXEMPLE 8.22. Dans une ville comptant 300000 habitants, dont chacun possède entre 0
et 10000 cheveux, il existe au moins 30 habitants ayant le même nombre de cheveux.
► On définit sur l'ensemble E des habitants la relation R : Avoir le même nombre de
cheveux. Il s'agit clairement d'une relation d'équivalence. Raisonnons par l'absurde : si les
classes d'équivalences de E étaient toutes de cardinal au plus 29, on aurait d'après l'équation
aux classes,
Corollaire 8.23. (Lemme des Bergers) Soient E ·et F deux ensembles, E étant fini) et
f: E -4 f une application. Alors
PREUVE. Il suffit d'appliquer l'équation aux classes pour la relation d'équivalence R associée
à f sur E. ■
/
187
Ce résultat s'étend sans peine par récurrence sur n à un produit cartésien fini d'ensembles
finis E1, ... , En : E 1 X ... X En est fini et de cardinal IE 11 x ... X IEnl- Ainsi, pour tout ensemble
E fini et tout entier naturel n non nul, En, l'ensemble des n-uplets d'éléments de E, est fini
de cardinal IEln.
On comprend à présent pourquoi la notation FE est appropriée elle est adaptée au calcul
du cardinal de l'ensemble FE.
Lemme. 8.26. ·. Soient E et F deux ensembles finis non mdes de même cardinal n. Alors
l'ensemble bi(E, F) des bijections de E dans F et l'ensemble 6E des permutations de E sont
éqûipotents.
Proposition 8.27. Soit E Un ensemble fini de cardinàl n. EN•\ L'ensemble des permuta•
twns de E/èstfiii, de ~nat n!. . .• ....
PREUVE. Démontrons la propriété par récurrence sur n. Pour tout n E N*, notons HR(n)
la proposition suivante : pour tout ensemble E de cardinal n, l6EI = n!.
o HR(l) est banale car la seule permutation d'un ensemble à 1 élément est l'identité.
o Soit n ;;;:, 1. Supposons HR(n) vraie. Soit alors E un ensemble de cardinal n + 1. Notons
E = {e 1, ... , Cn+i} et, pour tout k entre 1 et n + 1, Fk l'ensemble des permutations f de E
vérifiant f(en+il = ek. Il est clair que les ensembles Fk pour k variant de 1 à n + 1 forment
une partition de 6E. On a donc
n+l
l6EI = L, IFkl-
k=l
Remarque. On retrouve sans peine ce résultat de la manière suivante. Pour déterminer une
permutation de Nn, il faut commencer par choisir l'image de u(l) : on dénombre n choix
possibles. Puis il faut déterminer u(2) parmi Nn \ {u(l)} (car on doit avoir u(l) cf. u(2) par
injectivité de u), ce qui représente n- 1 choix. On continue ainsi de suite pour u(3), ... , u(n).
Finalement, on dénombre n x (n-1) x ... x 1 = n! permutations de Nn. Ce calcul est à retenir
et on n'hésitera pas à le reconduire même s'il n'est pas aussi rigoureux que la démonstration
de la proposition 8.27.
Propositiôn 8.28. $Ôîtf. un. ensemble fini de cardinal n E N. Alors .9(E) ·est fini de
cardinal zn. .
PREUVE. Si E = 0, c'est-à-dire sin= 0, le seul sous-ensemble de E est 0, d'où lg'J(E)I =
1 = 2n. Si E cf. 0, notons E = {e1, ... , en}- Soit alors
◊ L'application 'Ji est injective car si 'Jl(A) = 'Jl(B) = (y 1, ... , 1Jnl pour A et B dans g'J(E),
en notant I le sous-ensemble (éventuellement vide) des indices 1 ~ i ~ n tels que 11i = 1 , on
a A= B = {e,, i E I}.
◊ L'application 'Ji est surjective. En effet, si X = (h, ... , inl E {O, l}n, notons I l'ensemble des
indices 1 ~ i ~ n tels que j, = 1. On a clairement 'Jl({eh, i E I}) = X.
◊ L'application 'Ji est donc une bijection, puisque {O, l}n est fini de cardinal 2n, g'J(E) est fini
de cardinal 2n. ■
189
l6r,kl = .L. 1
1'!1- ({i})I = .L. (n - k)! = (n - k)!ldk,nl,
iEdk,n iEdk,n
IV. 2. Combinaiso ns
Nombre de combinaisons de k éléments parmi n.
Définition 8.33. Soient n et k deux entiers naturels. On appelle combinaison de k objets
parmi n toute partie à k éléments d'un ensemble de n objets.
EXEMPLE 8.35. Combien de droites du plan peut-on tracer à partir de 13 points trois à
trois non alignés ?
► Il y a autant de droites que de couples de points sans ordre parmi 13 points; ainsi, on
dénombre (7) = 13 ; 12 = 78 droites.
PREUVE. En développant le produit (a+ b)n ={a+ b) ... (a+ b), on obtient des termes
du type akbn-k avec O ~ k ~ n, l'indice k correspondant au nombre de facteurs du produit
(a+ b) ... (a+ b) pour lesquelles on a choisi a. Puisqu'on dénombre(~) choix possibles de k
facteurs parmi n, on obtient
■
191
EXEMPLE 8.37. Simplifier, pour tout n dans N, la somme Sn='[; 2k-l3n-k+l (~).
► On a
PREUVE.
2
1) On a clairement (n::J = (n-k)!(,:'~(n-k))! = (n-~)!k! = (;).
2) La formule est banale pour n = O. Soit O ~ k ~ n - 1. Notons Ek l'ensemble des parties
de Nn à k + 1 éléments, Fk l'ensemble des parties à k + 1 éléments de Nn qui contiennent n et
F( l'ensemble des parties à k + 1 éléments de Nn qui ne contiennent pas n. Il est clair que Ek
est la réunion des deux ensembles disjoints Fk et F(. De plus, IFkl = (n~l) et IF(I = (;:;D car
Fk est en bijection avec l'ensemble des parties à k éléments de Nn-1 (sin~ 2, sinon 0) et F(
est en bijection avec l'ensemble des parties à k + 1 éléments de Nn-1 (sin~ 2, sinon 0).
3) Il suffit d'appliquer la formule du binôme,
Cette relation permet le calcul de proche en proche des coefficients binomiaux, la disposi-
tion correspondante des coefficients étant appelée triangle de Pascal.
2
3 3
4 6 4
5 10 10 5
(n~l) (n-1)
k+l
(k~l)
2
Voir la question test 8.8 pour une preuve plus belle.
192
on a Pn =In= 2n-l _
Sommes en colonnes.
Pour tous n et p dans N, on a f_ (n: k) =(n:: 11). Cette formule se prouve par
k=O
récurrence sur p EN. Elle est banale pour p = O. Si elle est vraie au rang p, on a
~ (n+k)
k=O n
=t (n+k)+(n+p+l)
n
k=O
=(n+p+l)+(n+p+l)
+1 nn
=(n+p+2)
n+1 n
Par un dénombrement.
Soient E 1 et E2 deux ensembles disjoints à n éléments. Dénombrons l'ensemble des parties à
n éléments de E = E 1 U Ez. Puisque IEI = 2n,
il y en a (~). Parmi elles, il y a les parties
k
qui contiennent exactement éléments de E 1 et
2
n-k
éléments de E2 où O:( k:( n:
on en
dénombre(~) x (n~J = (~) car (~) = (n~J- Ainsi,
193
d'où la formule.
Remarque. L'idée principale (à retenir !) est que les racines n-ièmes de l'unité (avec n ?:
2) permettent d'extraire d'une somme de monônes donnée la somme des monônes dont la
puissance divise l'entier n.
1, 2, 3 ; 1, 1, 2 ; 1, 1, 3 ; 1, 2, 2 ; 2, 2, 3 ; 1, 3, 3 ; 2, 3, 3 ; 1, 1, 1 ; 2, 2, 2 ; 3, 3, 3.
Contrairement aux combinaisons, le dénombrement à l'aide des parties de l'ensemble formé par
les n objets n'est plus possible puisqu'un ensemble n'admet aucun doublon. Ainsi {1, 1, 2} =
{1, 2}. Il nous faut donc modéliser mathématiquement le choix de k éléments avec répétitions
dans un ensemble E = {e1, ... , en} à n éléments. Soit un tel choix. Notons Xi le nombre de
fois que l'élément ei a été choisi. On a alors X1 + ... + Xn = k. Réciproquement, à tout
195
Dénombrement de E~.
On peut représenter un n-uplet de E~ = { (x1, ... , Xn) E Nn : X1 + ... + Xn = k} à l'aide
de bâtons et de boules. On place et matérialise à l'aide de bâtons I n boîtes qui contiennent
chacune des boules•· Dans la première boîte, on place X1 boules, dans la deuxième X2 boules,
et ainsi de suite jusqu'à la dernière boîte où l'on place Xn boules. Par exemple, l'élément
(2, 1, 0, 3, 1) de E~ est représenté par la figure suivante
I • • I • 1 1 • • • I • 1-
L'ensemble E~ est en bijection avec l'ensemble des figures ainsi obtenues. Or, construire une
telle figure revient à placer n - 1 bâtons I et k boules • entre les deux bâtons I extrêmes, ce
qui revient à choisir la position des k boules parmi n + k- 1 emplacements possibles, d'où
Statistique de Maxwell-Boltzmann.
On considère que toutes les molécules sont discernables deux à deux, et qu'ainsi un macro-état
est composé d'un seul micro-état. Tous les microétats sont possibles, c'est-à-dire que l'on a
Q = {{f} f E N:n }. Ainsi
1
Statistique de Bose-Einstein.
Les molécules sont indiscernables et on regroupe dans le même macro-état des fonctions f et
g telles que, pour tout nombre k dans Nn,
c'est-à-dire que l'on ne distingue pas deux systèmes ayant les mêmes nombres de molécules
au niveau d'énergie k, pour tout k dans Np. Tous les micro-états sont possibles, c'est-à-
dire que Q est une partition de N:n. Pour dénombrer 0, il faut donc calculer toutes les
196
manières différentes de remplir p niveaux d'énergie avec n particules; il s'agit par conséquent
de combinaison avec répétitions, d'où
Statistique de Fermi-Dirac.
Dans ce cas les particules sont indiscernables, chaque niveau d'énergie étant occupé par au
plus une molécule. Les micro-états sont donc les injections de Nn dans Np et l'on regroupe en
un seul macro-état des injections ayant la même image. Dénombrer Q revient alors à calculer
le nombre de parties à n éléments parmi p. Ainsi
......
......
On peut démontrer par de l'algèbre linéaire que cette relation de récurrence et les condi-
tions initiales u 1 = 1, u 2 = 2 impliquent que
exemple, 2N est un sous-ensemble strictement contenu dans N, pourtant Net 2N ont le même
cardinal : l'application f: N---, 2N, f(n) = 2n est clairement une bijection de N dans 2N. De
même, [0, 1] est strictement contenu dans [0, 2] mais l'application g : [0, 1] ---, [0, 2], g(t) = 2t
est une bijection de [0, 1] dans [0,2].
VI.2. Dénombrabilité
Définition 8.44.
1) Un ensemble A est dit dénombrable lorsque A~ N.
2) Un ensemble est dit au plus dénombrable lorsque A est fini ou dénombrable.
Autrement dit, un ensemble A est infini dénombrable si et seulement si on peut dénombrer
ses éléments en comptant 0, 1, 2, ... C'est-à-dire, si on peut écrire les éléments sous la forme
d'une suite injective qui n'oublie aucun élément
A= {ao, a1, a2, ... }.
Nous admettrons que tout sous-ensemble d'un ensemble dénombrable est au plus dénom-
brable ou, de manière équivalente, que tout ensemble qui contient un sous-ensemble non
dénombrable est non dénombrable.
EXEMPLE 8.45.
o L'ensemble Z des entiers 0, 1, -1, 2, -2, ... est dénombrable. En effet tout le monde com-
prend les « trois petits points» que nous venons d'écrire. Il est superflu d'expliciter davantage,
mais si on insiste :
où les au, (k, €) E N2 , sont des chiffres entre O et 9. On définit pour tout chiffre a
si a =/- 1,
si a= 1.
Dans la liste, on considère maintenant la suite des chiffres diagonaux akk· Si dans cette suite
on remplace chaque chiffre akk par akk, on obtient le nombre décimal
198
b étant un nombre réel dans [O, 1 [, il doit figurer dans la liste, c'est-à-dire b = ak pour un
certain k E N. Cela est une contradiction : le k-ième chiffre après la virgule de ak est akk,
mais le k-ième chiffre après la virgule de b est akk, et akk -=p akk·
. ...
. .
..
... .
Ce résultat devrait vous susprendre, vu que lR est non dénombrable et que tout nombre
réel peut être approché arbitrairement par une suite de rationnels !
PREUVE. Considérons d'abord le cas de deux ensembles. Soient A= {ao,a 1,a2, ... } et
B = {b 0 , b 1, b2, ... } dénombrables.
On écrit tous les éléments du produit A x B
EXEMPLE 8.49.
o Pour tout naturel n l'ensemble Qn est dénombrable.
o Le sous-ensemble Q(NI de QN constitué des suites quasi nulles (tous termes nuls à partir
d'un certain rang) est dénombrable.
Pour preuve, considérons pour n E N l'injection suivante
Alors
Q(N) = LJ ln(Qnl
nEN
et on conclut avec la proposition 8.46.
o QN est non dénombrable.
En effet, pour tout nombre réel a il existe une suite dans QN qui converge vers a. Deux suites
qui convergent vers deux réels distincts sont forcément distinctes. Donc dans QN il y a au
moins autant d'éléments 3 que dans R Or, on sait que lR est non dénombrable.
3
Ce résultat n'est pas fondé dans l'état de nos connaissances. Il se démontre à l'aide du théorème de Cantor-
Bernstein.
200
VII. EXERCICES
rJJ
1 8.5.
8.1.
J 8.2.
ES premières traces de la théorie des groupes remontent aux travaux de 1832 d'Évariste
L Galois qui ne furent publiés qu'après sa mort, en 1846. Lors de son étude des équations
algébriques, le jeune mathématicien s'intéressa particulièrement aux permutations de
l'ensemble des racines d'un polynôme. Il mis en évidence de nombreuses propriétés de ce qui
est de nos jours appelé le groupe symétrique à n éléments et noté 6n.
Autrement dit, un groupe est un monoïde ( G, *) dont tous les éléments sont inversibles.
On dit parfois que * est une loi de groupe sur G pour signifier que ( G, *) est un groupe.
On peut tirer plusieurs conséquences de cette définition : l'élément neutre est unique
et chaque élément g admet un unique inverse noté g- 1 . Puisque l'inversiblité implique la
régularité, tous les éléments d'un groupe (G,*) sont réguliers pour la loi*·
202
Régularité
rJJ
1
'2
..8
Tous éléments d'un groupe ( G, *) sont réguliers à droite et à gauche, c'est-à-dire, pour
tous éléments x, 1J et g de G
rJJ
EXEMPLE 9.2. Voici quelques exemples de groupes rencontrés au cours des chapitres pré-
cédents. Le lecteur est renvoyé au chapitre 7 pour les justifications correspondantes.
► (Z, +) et (<Ql, +), où + est l'addition usuelle des nombres rationnels.
(
► <Ql*, x), où x la multiplication usuelle des rationnels.
(
► C*, x), où x la multiplication usuelle des nombres complexes.
► (6(E),o), où E est un ensemble et 6E l'ensemble de ses permutations.
► (g'l(E),~), où E est un ensemble quelconque, g'J(E) l'ensemble de ses parties et ~ la
différence symétrique définie par \f(A, B) E g'l(E), A~B =(AU B)/(A n B).
Définition 9.3. On dit qu'un groupe (G, *) est commutatif, ou abélien, lorsque la loi * est
commutative sur G. On dit que dew.: éléments x et 1J d'un groupe (G, *) commutent lorsque
X *Y= 1J *X.
On peut également définir un groupe au plus dénombrable par une table de Cayley 1 .On
prendra garde à ce qu'une loi interne quelconque (donc une table de Cayley quelconque) ne
définisse pas en général une loi de groupe. Par exemple, la table suivante
* a b c
a a b c
b c a b
c b c a
ne définit pas une loi de groupe sur l'ensemble E = {a, b, c} car la loi de composition* associée
n'admet aucun élément neutre.
1
Voir page 157
203
Proposition 9.4. (Groupe ptoduitJ Siirient (G1 ;*let fGt, o} dètJ:i; {trouipl],$; L'ensemble
G1 x G2 mtmi de là loi de composition ® suivante ·
(x1, x2) ® [(y1, Y2) ® (z1, z2)l = (x1, x2) ® (Y1 * z1, Y2 o z2) = (x1 * (Y1 * z1), X2 ◊(Yi◊ z2))
= ((x1 *Yi)* z1, (x2 oy2) o z2) = (x1 *Yi, X2 oy2) ® (z1, z2)
= [(x1, x2) ® (Y1, Y2)l ® (z1,z2)
d'où le résultat. ■
sur l'ensemble produit G 1 x ... x Gn. Lorsque tous les groupes Gi sont égaux à un même
groupe G, on note plus simplement Gn le groupe produit obtenu.
L'associativité de la loi* permet de définir les puissances d'un élément g par gn = e pour
n = 0 et Vn), 1, gn = g * gn- 1, puis gn = (g- 1)-n pour tout n < 0 (voir le chapitre sur les
structures algébriques).
Pour n < 0, on a, par définition, (a-1 * g * a)n = ((a- 1 * g * a)- 1)-n, or, d'après la première
propriété, l'inverse de a-1*g*a vaut a- 1*9*U. La formule découle alors de l'étude précédente.
3) La propriété se démontre facilement par récurrence sur n en appliquant la propriété 1).
4) Idem. ■
Définition 9.7. Lorsqu'un groupe (G,*) est fini, IGI est appelé l'ordre de G.
Par exemple, le groupe des racines n-ièmes de l'unité lUn est un groupe d'ordre n, pour
tout entier naturel n non nul.
2
C'est ce qu'on appelle un carré latin.
205
* a b c
a a b c
b c a b
c b c a
qui est un carré latin mais dont nous avons déjà montré qu'elle ne définit pas une loi de groupe
sur {u, b, c} (voir page 202).
II. Sous-GROUPES
IL 1. Définition et caractérisations
Un sous-groupe d'un groupe ( G, *) est une partie H de G qui, munie de la loi induite par celle
de G, est un groupe. Par exemple, les sous-ensembles {e} et G d'un groupe (G,*) (de neutre
e) sont des sous-groupes. Il s'agit en quelque sorte des sous-groupes extrêmes 3 de (G,*), on
les appelle les sous-groupes triviaux de (G, *). Notons que cette définition des sous-groupes
impose en premier lieu que H soit stable par *, c'est-à-dire que pour tous x et y dans H,
x * y E H, pour que * restreinte à H soit une loi interne. Dans la suite, on convient de noter
par le même symbole la loi de G et la loi induite sur une partie de G.
Lênune 9.l~.. Stiit l-t un}oîtS-~upe de {G,*), Alors eH =eG et les inverses d'un élément
dé h dâns les groùpes (H, *) et (G, *) coïncident.
On retiendra les caractérisations suivantes des sous-groupes d'un groupe (G, *) donné.
3
Respectivement le plus grand et le plus petit sous-groupes de ( G, *) au sens de l'inclusion.
206
PREUVE. Notons e le neutre de G. Commençons par prouver que les deux conditions sont
équivalentes.
1) =} 2). Soient x et y dans H. Puisque H est stable par passage à l'inverse, x- 1 E H et comme
H est stable par*, x- 1 *Y EH.
2) =} 1). Comme H =/=- 0, H contient au moins un élément u et donc e = u- 1 *U EH. Soient
alors x et y dans H. On a x- 1 = x- 1 * e E H donc H est stable par passage à l'inverse. De
plus, X*Y = (x- 1 )- 1 *Y EH car y et x- 1 appartiennent à H : H est stable par*·
D'après le lemme 9.10, ces deux conditions sont nécessaires pour que (H,*) soit un groupe.
Réciproquement, lorsque la propriété 1) est vérifiée, il existe ho E H. Comme h 01 E H et que
H est stable par la loi*, on a eG = ho* h 01 EH. L'ensemble (H, *lest donc un monoïde dont
tous les éléments sont inversibles : il s'agit d'un groupe. ■
EXEMPLE 9.12.
► 1IJ = {z E C : lzl = l} est un sous-groupe de (C*, x). En effet, 1IJ CC*, 1IJ =/=- 0 car 1 E 1IJ
et, pour tous z et z' dans 1IJ, on a lz'z- 1 I = lz'l/lzl = 1/1 = 1 donc z'z- 1 E 1IJ.
► Pour tout entier naturel n non nul, l'ensemble 1Un des racines n-ièmes de l'unité est un
sous-groupe de (1IJ, x ). En effet, 1Un C 1IJ (toute racine n-ième de l'unité est de module 1),
1Un =/=- 0 car 1 E 1Un et, pour tous z et z' dans 1Un, on a (z'z- 1 )n = z'n/zn = 1/1 = 1 donc
z'z- 1 E 1Un.
► Plus subtil : l'ensemble r = UnEN· Un de toutes les racines de l'unité est un sous-groupe
de (1IJ, x). En effet, r c 1IJ, r =/=- 0 car 1 Er. Soient z et z' dans r. Il existe alors net m dans
N* tels que zn = 1 et z'm = 1. En particulier, (z'z- 1 )mn = z'mnz-mn = (z'm)n(zn)-m = 1
donc z'z- 1 E 1Umn Cf.
Proposition 9;13. Soit {G, *)· un groupe. Toute intersection dé stJus-groupes.de (G,*}·est
un sous-groupe de {G, *).
PREUVE. Soit (HïliEI une famille de sous-groupes de (G, *). Posons K = niEI Hi. L'ensemble
K est non vide car il contient le neutre e de ( G, *) : en effet, pour tout i dans I, Hi est un
sous-groupe de ( G, *) donc contient le neutre e. Soient x et y dans K. Pour tout i dans I, x
et y appartiennent au sous-groupe Hi donc x- 1 * y E Hi d'où x- 1 * y E K. L'ensemble K est
donc un sous-groupe de ( G, *). ■
EXEMPLE 9.14. Soient H et K deux sous-groupes de (G,*). Alors HUK est un sous-groupe
de ( G, *) si et seulement si H C K ou K c H.
► Il est clair que les inclusions H C K et K C H entraînent chacune que H U K est un
sous-groupe de ( G, *). Prouvons la réciproque par contraposition. Supposons que H (/_ K et
207
PREUVE. Notons Y l'ensemble des sous-groupes de (G, *) contenant S. Y est non vide car il
contient G. Posons alors H = nxEY X. Comme, pour tout X dans Y, S c X, on a S c H. De
plus, en tant qu'intersection de sous-groupes, H est un sous-groupe de (G,*). Il s'agit bien du
plus petit au sens de l'inclusion, car si K est un sous-groupe quelconque de (G,*) contenant
G' on a K E y et donc H = nXES" X C K. ■
Notation. Le sous-groupe engendré par S est noté (S). Dans le cas où S = {a}, on le note
de préférence (a).
Définition 9.16. On dit qu'un groupe ( G, *) est engendré par S C G lorsque G = (S).
Une telle partie S est alors appelée une partie génératrice de ( G, *). On dit aussi que S
engendre le groupe ( G, *).
EXEMPLE 9.17. Soit (G,*) un groupe de neutre e. Il est clair que (0) = {e} et (G) = G.
De même, (e) = {e}. En outre, si a E G vérifie a 2 = e, on a clairement (a) = {e, a}. Nous
généraliserons d'ailleurs cette égalité dans l'exemple 9.19.
Proposition u~Ht ·Sait S· unè partie non vide d'un groupe {G,*). On a
{S) = {xr* ... *Xnln EN* et \t'k E Nn., x1c ES ou xk1 ES}.
4
On a vu que l'entier p = mn convient.
208
l
récurrence sur n que x, * · · · * Xn E S' pour tous xk dans G tel que xk E S ou xk 1 E S.
Autrement dit, on a S' C (S). Il suffit d'établir que S'est un sous-groupe de (G,*) contenant
S pour montrer l'inclusion réciproque (S) C S'. Il est clair que S' contient S et donc que
S' -/- 0. Soient x et y dans S' : il existe n et m dans N* et x,, ... , Xn, y,. ... , Ym tels que
..s
00 pour tout i dans Nn et tout j dans Nm, Xi E S ou xi 1 E S, Yi E S ou y 11 E S et vérifiant
~ X= x, * ... *Xn et y= y,* ... *Ym· On a alors
1
- avec pour tout i dans Nn et tout j dans Nm, Xi ES ou xi 1 ES, y 11 ES ou Yi= (y 11 )- 1 ES
d'où X*Y_, ES'. ■
EXEMPLE 9.19. Ainsi, pour tout groupe (G,*) et tout élément g appartenant à G, on a
(g)= {gn, n E Z}. Appliquons cette formule au sous-groupe lU4 = {-1, 1, -i, i} de (C*, x ).
o On a clairement (1) = {1 }. Comme 1/ - 1 = -1, on a (-1) = {-1, 1}.
o Comme i 2 = -1, i 3 = -i, i 4 = 1, 1/i2 = -1 et 1/i 3 = i, on a (i) = {1, -1, i, -i} = 1U4 .
o De même, (-i )2 = -1, (-i)3 = i, (-i )4 = 1, 1/ (-i )2 = -1 et 1/ (-i )3 = -i, on a (-i) =
(i) = {l, -1, i, -i} = lU4.
Définition 9.20. Un groupe (G, *) est dit monogène s'il existe a E G tel que G = (a). Un
tel élément a de G est dit générateur de ( G, *). On dit aussi que a engendre g.
(l)
EXEMPLE 9.25. Voici divers exemples issus des cours d'algèbre et d'analyse.
1) La fonction exponentielle exp : (C, +) --+ (C*, x) est un morphisme de groupes car
2) La fonction f: (~, +)--+ (1U, x) définie par f(t) = eit est un morphisme de groupes car
On peut en fait montrer que tous les morphismes de (Z, +) dans lui-même sont de la
forme décrite au 4) de la proposition précédente. Le résultat suivant précise la propriété
des morphismes annoncée plus haut, « respecter» les structures de départ et d'arrivée : un
morphisme envoie le neutre du groupe de départ sur le neutre du groupe d'arrivée et l'inverse
de l'image d'un élément x est égale à l'image de l'inverse de l'élément x.
211
PREUVE. Comme e 1 * e 1 = e 1, on a cp(e1) o cp(ei) = cp(ei) = cp(e1) * e2, et, par régularité,
cp(e 1) = e 2. Soit alors x E G 1. On a cp(x) o cp(x-1) = cp(x * x- 1) = cp(ei) = e2 et donc
cp(x-1) = cp(x)-1. ■
1
ÈrJ)
j
Avant de décrire leurs propriétés, nous allons éclairer la définition des morphismes sous
un nouvel angle. Soient (G 1 ,*) un groupe et G 2 un ensemble au plus dénombrable. D'une
manière générale, pour toute application cp : G 1 -, G2, on définit l'image par cp d'une table
de Cayley T de ( G 1, *) par la table T' obtenue en inscrivant case après case l'image par cp de
la case correspondante de T. On obtient ainsi une loi de composition interne ◊ sur cp (G 1)
on dit que l'on a transporté 5 la loi * de G1 sur cp ( G il par cp.
◊
*
Si cp est injective, le lecteur vérifiera sans peine que o est loi de groupe sur l'ensemble cp ( G 1).
Supposons maintenant l'ensemble G2 muni d'une loi de groupe•· Il est clair que la restriction
de T' à cp (G il est une table de Cayley de ( cp (G 1), •) si et seulement si pour tous Xi et Xj dans
G 1, on a cp (Xi* Xj) = cp (xd • cp (Xj), c'est-à-dire si et seulement si les lois o et • coïncident sur
cp ( G1), soit encore si et seulement si cp est un morphisme de groupes de ( G 1, *) dans ( G2, •).
* •
cr(xd
5
Voir l'exercice 9.2 pour de plus amples informations sur le transport d'une loi par une application.
212
Phlj;>Ôst~ '9~. i 1i1Atiûé •ët lé 1i91Jlil,tt ,Umf morphisme dé Jlf(Jùpe q> : ( G1, *} -½ ( G2 , <>)
son(raijîêèlïti~ritJèi"~ûs--}1Nûpeiîfè (G2.◊} étf-G'f~ :t.'}:'," ... .. . .. .• . .. . .
PREUVE. Raisonnons en deux temps.
o Ker ( cp) f.
0 car e 1 E Ker ( cp). Soient x et y dans Ker ( cp). On a
Rappelons la notation des classes à droite (voir la remarque suivant le théorème de La-
grange 9.22) : y H = {yx Ix E H} = {z E G Iy- 1 * z E H}. En reprenant les notations de la
proposition précédente, la connaissance d'une (éventuelle) solution particulière x 0 de l'équa-
tion cp(x) = a, où a E G2, permet la résolution complète de l'équation.
1) Supposons cp injectif. Soit x E Ker(cp}. Comme cp(e1} = e2, on a cp(x} = cp(e 1) donc,
par injectivité de <p, on a x = e 1. Ainsi Ker ( cp} = {e 1}. Réciproquement, supposons que
Ker(cp} = {e1} et soient x et y dans G1 tels que cp(x} = cp(y}. On a alors cp(x*y-1) = e 2 et
X*1J-T E Ker(cp} = {e 1}, d'où X*1J-l = e 1 , puis x =y.L'application cp est par conséquent
cri
injective. .d
ü
2) La proposition est claire et valable pour toute application cp de G1 dans G2 qu'il s'agisse
d'un morphisme ou non. ■
L1 . 0 {O} {l} E X -1 i -i
0 0 {O} {1} E 1 1 -1 i -i
{O} {O} 0 E {1} -1 -1 1 -i i
{l} {1} E 0 {O} i i -i -1 1
E E {l} {O} 0 -i -i i -1
et
Après un minutieux examen de ces trois tableaux, on s'aperçoit que le premier et le troi-
sième sont identiques à un changement de nom des éléments près. Quitte à écrire 0 au lieu
de (1, 1), {O} au lieu de (1,-1), {1} au lieu de (1,-1) et Eau lieu de (-1,-1), on obtient
6
Voir l'exemple 9.5.
214
effectivement la même table. On dit que les deux groupes (&'(El,~) et (lU~,0) ont la même
structure de groupe 7 . Puisqu'un tel changement de notation revient à définir une bijection
cp : lU~----, &'(El par
l'identité de ces deux structures de groupes se traduit par l'existence d'une bijection du premier
ensemble dans le second qui transporte la première loi sur la seconde, autrement dit une
bijection qui est de plus un morphisme de groupes.
Un isomorphisme de groupes de (G1,*) dans (G2,•l est donc une bijection <p: G,----, G2
qui transporte la loi* de G 1 sur la loi• de G 2. En algèbre, c'est la notion d'isomorphisme qui
formalise l'idée de structure. L'étymologie est d'ailleurs claire, le préfixe iso signifiant même
et morphisme étant issu du grec qui signifie forme. Nous prouverons dans l'exemple 9.34 qu'il
est impossible de transporter la loi 0 de (1U~, 0) sur la loi x de (1U4 , x) : ces deux structures
de groupes ne sont pas isomorphes.
Un isomorphisme de (G1,*) dans (G 2,o) transforme donc une table de Cayley de (G 1 ,*)
en une table de Cayley de ( G 2, o) terme à terme et traduit donc bien l'idée d'une même
structure de groupe.
Revenons un instant aux trois structures de groupes (&'({O, 1}),~), (1U4 , x) et (1U~,0)
décrites ci-dessus.
EXEMPLE 9.34. Les groupes (&'(El,~) et (lU~,0) sont isomorphes pour IEI = 2 mais ne
sont pas isomorphes à (1U4 , x).
► Montrons plus généralement que, pour tout entier naturel n ~ 1, les groupes (&'(El,~) et
{U2, 0) sont isomorphes, où E est un ensemble de cardinal n. Soient e 1, ... , en les éléments
de E et <p: (&'(El,~)----, (1U 2,0) défini par
On a vu dans le chapitre 7 que, pour toutes parties A et B de E, [AL'.B = [A+ ITs - 2[A[B et
donc
(1 - 2[A)(1 - 2[s) = 1 - 2[A - 2[s + 4[A[B = 1 - 2[AL'.B
ainsi cp(A~B) = cp(A) 0 cp{B) : l'application <p est un morphisme de groupe. Il est clair que
Ker {<p) = {0} donc <p est injective. Comme l&'(E)I = l1U 2I = 2n, <p est bijective. Les deux
groupes sont donc isomorphes.
► Raisonnons par l'absurde en supposant l'existence d'un isomorphisme <p : (1U4 , x) ----,
(lU~, 0 ). Comme cp(i2) = cp(i) 2 = (1, 1), on a cp(-1) = (1, 1). Or cp(l) = (1, 1) car <p est un
morphisme de groupes. On a donc -1 E Ker ( <p) -/- {1 }, ce qui est absurde.
7
D'une manière générale, le terme de structure est employé en mathématiques lorsque l'on ne s'intéresse qu'aux
relations qu'ont les éléments d'un ensemble les uns par rapport aux autres indépendamment de leur nature.
215
PREUVE. Soient net n' dans Z. On a cp 9 (n * n') = gnn' = gn ◊ gn' = cp 9 (n) o cp 9 (n').
L'application cp 9 est donc un morphisme de groupes et Ker ( cp 9 ) est un sous-groupe de (Z, +) :
d'après la proprosition 9.23, il existe n E N tel que Ker ( cp 9 ) = nZ. ■
► Dans (Z, +), tous les éléments m-/- 0 sont d'ordre infini car le morphisme de (Z, +) dans
(Z, +) défini par f(n) = nm est injectif. Seul O est d'ordre fini (valant 1 car O est le neutre
de (Z,+)).
► Dans le groupe multiplicatif 1U4 = {-1, 1, i, -i} des racines quatrièmes de l'unité, w(l) = 1
2
(en tant que neutre du groupe), w(-1) = 2 car (-1) 1 -/- 1 et (-1) = 1, w(-i) = 4 car
(-i)k -j. 1 pour tout 1 ( k ( 3 et (-i) 4
= 1, w(i) = 4 car (i]k-j. 1 pour tout 1 ( k ( 3 et
(i)4 = 1.
► Dans le groupe (9(E),L'-.) où E = {O, 1}, comme \ig E 9(E), gL'-.g = 0 = e, tous les
éléments distincts de e = 0 sont d'ordre deux et l'ordre de e = 0 vaut 1.
Pour tout élément d'ordre fini égal à n d'un groupe (G,*), on a (g) = {gkl O ( k ( n-1}
avec gn-l-/- e, ainsi w(g) = n = l(g)I.
Un isomorphisme de groupe traduisant une structure commune, l'ordre d'un groupe est
un invariant d'isomorphisme.
PREUVE. C'est une conséquence immédiate du théorème de Lagrange puisque (g) est un
sous-groupe de G de cardinal w(g) (voir le corollaire 9.37). ■
V. EXERCICES
Nous avons déjà rencontré à plusieurs reprises la notion de relation d'équivalence. La donnée
d'une relation d'équivalence sur un ensemble E se ramène à celle d'une partition de E, c'est-
à-dire d'une partie d de 9(E) formée par des sous-ensembles non vides de E, deux à deux
disjoints, et dont la réunion est égale à E. En effet, si une relation d'équivalence est donnée,
ses classes d'équivalence forment une partition de E, alors que si une partition d de E est
donnée, on définit une relation d'équivalence !Jè sur E en posant x/Jè-y si et seulement six et
-y appartiennent au même élément de la partition d.
Il est clair que !Jèf est une relation d'équivalence. En effet, elle est évidemment réflexive et
symétrique, et si x/Jèf-y et-y/Jèfz, alors f(x) = f(-y) et f(-y) = f(z), donc f(x) = f(z) et X!%tz,
elle est donc transitive. La classe d'équivalence d'un élément x de E pour 8lt est l'ensemble
des éléments -y de E qui vérifient f (-y) = f {x). Les classes d'équivalence sont donc les parties
de E formées par les éléments ayant la même image par f.
3. Par exemple, si E = {1, 2, 3,4, 5, 6} et F = {a, b, c, d}, et si f: E-----, Fest l'application définie
par
f(l) = a, f(2) = c, f(3) = b, f(4) = c, f(5) = a, f(6) = c
les classes d'équivalence de !Jèf sont
Il est clair que cette application est injective. Elle est construite de manière naturelle à partir
de f: à une classe d'équivalence donnée elle associe la valeur prise par f sur tous les éléments
de cette classe.
4. Raisonnons maintenant de manière plus formelle. Considérons une application f d'un en-
semble E dans un ensemble F, notons comme auparavant &t'f la relation qu'elle définit sur
E, et Q = E/&t't l'ensemble quotient. La surjection canonique de E sur Q sera notée 'TC; si
x E E, n(x) est donc la classe de x, c'est un élément de Q. On voit que l'application 'TC vérifie
n(x) = n(y) si et seulement si f(x) = f(y).
Il est alors possible de définir une application f de Q dans F de la manière suivante :
soit a E Q, il existe x E Etel que n(x) = a, on pose f(a) = f(x). Cette définition est bien
légitime, puisque si y E Y vérifie la condition n(y) = a, on aura f(y) = f(x), donc cette valeur
ne dépend pas du point dans l'image inverse de a par 'TC. On dit que f passe au quotient sur
E/&t'f, et que f est l'application quotient de f.
Il est possible d'aller encore un peu plus loin. On vérifie facilement que pour que f passe
au quotient comme nous venons de le faire, il suffit que l'égalité n(x) = n(y) implique l'égalité
f(x) = f(y). L'équivalence n'est en fait pas nécessaire.
Notre but dans ce complément va être de faire une construction analogue lorsque l'ensemble
est muni d'une structure de groupe, et lorsque l'application considérée est un morphisme vers
un autre groupe.
1
facilement que pour que H soit distingué, il faut et il suffit que pour tout 9 E G, 9- H- 9- C H.
Dans ce qui suit nous omettrons le · pour alléger les notations.
Si H est un sous-groupe de G, on peut définir une relation d'équivalence sur G de la
manière suivante
2 1
\1(91,92) E G , 91&€92 si et seulement si 919 2 EH.
1 1
La relation 3€ est clairement réflexive, elle est symétrique car si 919 2 E H, alors 929 1 =
1
(919 21)-1 E H puisque H est un sous-groupe, et elle est transitive car si 9 19 2 E H et
1 1 1
92931 EH, alors 9193 = (9192 )(9293 ) EH puisque H est un sous-groupe.
On note G/H l'ensemble quotient de G par&€, et n la surjection canonique de G sur G/H.
On voudrait munir G/H d'une structure de groupe naturellement reliée à celle de G. Il faut
donc définir sur G/H une loi 0 convenable. On est tenté d'opérer de la manière suivante : si
a et b sont des éléments de G/H, on met en évidence des élements 9 0 et 9b de G tels que
n(9 0 ) = a et 7C(9b) = b. Alors il est possible de considérer le produit 9a9b et de le projeter
par 7t: pour obtenir un élément de G/H. On voudrait alors poser ab= n(9 0 9b), mais il faut
1 1
pour cela que l'élément 1t:(9 0 9b) soit indépendant du choix de 9 0 E n- ({a}) et 9b E n- ({b}).
Cette propriété n'est pas vraie en général, mais elle l'est si H est un sous-groupe distingué
de G. En effet, si g~, 9a et g~, 9b sont des éléments de G vérifiant n(g~) = n(ga) = a et
n(g~) = 7t(9b) = b, on a g~g;;- 1 EH et g~g;;- 1 EH, donc
1 1 1 1
g~g~( 9a9b)-l = g~g~gb g~ E g~Hg~ = g~g~ H = H.
où l'avant-dernière égalité provient du fait que H est distingué, et la dernière du fait que
g~g;;- 1 EH et H sous-groupe. Donc n(g~g~) = 7t(9a9bl-
Ainsi, on peut donc définir une loi 0 sur G/H. Pour la comprendre de manière un peu plus
directe, identifions une classe d'équivalence, élément de G/H, au sous-ensemble de G qu'elle
définit. Alors on remarque que la classe d'équivalence d'un élément g de G s'écrit simplement
Hg, puisque dire que f~ g équivaut à fg- 1 E H ce qui est encore équivalent à l'existence de
h E H tel que eg- 1 = h, soit e= hg E Hg. Comme H est distingué, on a aussi la possibilité
d'identifier Hg et gH.
Il s'agit donc de définir l'opération g 1 H 0 g2H, et ce que nous avons montré plus haut est
simplement qu'il est légitime de poser
Il nous reste à étudier l'effet du passage au quotient sur les morphismes de groupe.
ce qui montre que gkg-1 E Ker cl>, donc que g Ker cpg-1 C Ker cl>, et Ker cp est distingué. ■
PREUVE. L'application cp passe au quotient. En effet, si g et e sont dans une même classe
d'équivalence de G/(Ker cl>), ge- 1 E Ker cp, donc il existe k E Ker cl> tel que g = fk, donc
ERMUTER n objets signifie les ranger dans un certain ordre. Née de considérations
ne prend qu'au plus deux valeurs <X et f3 lorsque l'on permute des six manières possibles
les racines x1, X2 et x 3 . Il put alors ramener la résolution d'une équation de degré trois à
la résolution d'une équation du second degré et d'un système linéaire de 3 équations à 3
inconnues pour le détail des calculs.. Lagrange réussit à étendre cette technique au degré
quatre mais prouva qu'elle ne pouvait être adaptée au cas d'équations de degré n ?:: 5. En
1799, le savant italien Ruffini annonça que l'équation algébrique du cinquième degré n'est pas
résoluble, c'est-à-dire qu'on ne peut trouver (à la manière des équations de degré 1, 2, 3 et
4) une expression des racines d'un polynôme P de degré cinq au moyen de radicaux2 et en
fonction des coefficients de P. Bien qu'infructueuses, les tentatives de démonstration de Ruffini
furent l'occasion de nombreux développements concernant les permutations. Abel démontra
la non-résolubilité de l'équation de degré cinq en 1824 en basant son argumentation sur les
permutations.
Après un premier mémoire sur l'utilisation des permutations dans la résolution des équa-
tions algébriques, Cauchy publia en 1844 un ouvrage majeur où pour la première fois les
permutations furent étudiées comme un sujet à part entière. En 1831, Galois fut le premier
mathématicien à comprendre que la résolubilité des équations algébriques est reliée à la struc-
ture d'un certain groupe de permutation qui lui est associé.
1
C'est-à-dire une équation de la forme P(x) = 0 où Pest un polynôme à coefficients dans lR ou IC. Le degré de
P est appelé le degré de l'équation.
2
C'est-à-dire au moyen de racines.
224
PropositiQn 10.1 . . Pour tout ensemble E non'Vide, (6{E},oJ est ungrou,:pe.<En 1}flrticulier,
pour tout entier n ~ t t rtim nul1 ( 6n, o} ·.~ un !Jl"(J'JJ!Jie 0,ppeié le urm1;pe sym,étrique Îl 7o~
n. Le cardin0,l5 de~·ti,t égt;l'ành
Le résultat suivant justifie que l'étude des groupes 6(E) se résume à celle des groupes de
permutations 6n.
PropositiOIJ, 10,2. ·Pour: to'/4 ense,mble E 4e cardî'IUÛ :n,,·lçs, ~~ 6{E} et :6"' sqnt ·i@-
morphes. · · · · ·
PREUVE. Puisque E et Nn sont équipotents (par définition du cardinal), il existe une bijection
f : E ---+ Nn. Soit alors '!' l'application définie par
'!'(cr 1 o cr2 ) = f o (cr 1 o cr2 ) o f- 1 = f o (cr 1 o (idE) o cr2 ) o f- 1 = f o (cr 1 o (f- 1 of) o cr2 ) o f- 1
= (f o cr 1 o f- 1 ) o (f o cr2 o f- 1 ) = '!'(cri) o '!'(cr2 )
3
Plus précisément, si [G[ = n, G est isomorphe à un sous-groupe de 6n.
4
La lettre 6 est un « s » gothique majuscule.
5
Attention à ne pas s'emmêler dans le vocabulaire : {6n, o) est le groupe symétrique d'ordre n mais son ordre
(c'est-à-dire son cardinal) vaut n!.
225
Tout groupe peut donc être vu comme un sous-groupe d'un groupe de permutation les
groupes de permutations sont finalement les groupes dont la structure est la plus complexe.
Par exemple, la permutation cr de N3 définie par cr(l) = 2, cr(2) = 3 et cr(3) = 1 sera notée
123)
Cf= ( 231 .
Grâce à cette notation, les puissances de cr (pour la loi o) se calculent facilement. Ainsi,
Définition 10.4. Soit u E 6n- On appelle support de u l'ensemble des entiers k E Nn tels
que u(k) -/- k. On note cet ensemble Supp( u). On appelle point fixe de u tout élément k de
........,
<Il
;:l
c.;
Nn tel que u(k) = k. L'ensemble des points fixes de u est noté Fix(u) .
2 Autrement dit, l'ensemble Supp( u) est le complémentaire dans Nn de l'ensemble des points
û5 fixes de CJ : Supp(u) = Fix(u)C, ou de manière équivalente, Fix(u) = Supp(u)C.
i CIJ
PREUVE. Rest une relation d'équivalence sur Nn. En effet, comme x = u 0 (x) = id(x), x R x
et Rest réflexive. Soient x et -y dans Nn tels que x R-y : il existe k dans Z tel que -y = uk(x).
On a alors x = u-k(-y) d'où -yRx : la relation Rest symétrique. Soient x,-y et z dans Nn
tels que x R -y et -y R z : il existe k et m dans N tels que -y = uk( x) et z = um(-y). Ainsi,
z = uk+m( x) et x R z car k + m E N : la relation R est transitive. ■
Lemme _10.7. Soient rr E ~n, x ety dans Nn tels qu'il existe k E Z tel que y = rrk(x,}.
Alors il existe m EN tel que y= um(x).
PREUVE. Le seul cas à traiter est celui où k < O. (6n,o) étant un groupe d'ordre n!, on a
un!= idNn et donc u-kxn! = idNn· Ainsi -y= uk(x) = u-kxn!+k(x). On conclut en remarquant
que k(l -n!)?:, O. ■
Calculer les orbites de Ns pour l'action asso- Calculer les orbites de Ns pour l'action asso-
ciée. ciée.
Notation. Le cycle défini précédemment est noté c = (a,, Uz, ... , up).
On dit qu'un cycle c réalise une permutation circulaire des éléments de son support. La
figure suivante illustre cette terminologie.
EXEMPLE 10.10. La permutation <T = (Hf~~) est un cycle de 6 5 car elle n'admet
qu'une seule orbite O = N5 . En revanche, la permutation <T = ( ! l ~ ~ ~) n'est pas un cycle
1
car admet elle deux orbites non réduites à un point, 0(2) = {2, 3} et 0(1) = {l, 4, 5}. On a
<T = (1,4,5,2,3).
228
Ce dernier résultat est généralisable à tout élément x de supp(c) : Supp(c) = {ck(x) k EN}.
1
Le lemme suivant regroupe trois résultats importants sur les cycles de 6n,
PREUVE.
Les transpositions de 6n sont donc les permutations de la forme T = (i, j) avec i et j dans
Nn tels que i /. j.
PREUVE. Soient C1 = (01, 02, ... , ap) et C2 = (b1, b2, ... , bm) deux cycles de 6n dont les
supports sont disjoints. Soit x E Nn, Six (/. Supp(c1) U Supp(c2l, alors (c 1 o c 2)(x) = x =
(c2oc 1)(x). Six E Supp(ci), comme ni x ni c 1(x) n'appartiennent à Supp(c 2), on a c 2(c 1(x)) =
C1(x) = c1(c2(x)). De même, pour x E Supp(cz), on a c2(c1(x)) = C1(c2(x)) = c2(x). Ainsi
C1 o C2 = C2 o C1. ■
Test 10.7.
Test 10.9.
Compléter la permutation suivante de N6 de
manière à obtenir un cycle. Soient n ), 3 et a, b, c trois éléments deux à
deux distincts de Nn. Calculer
CY=
123 4 5 6
( 26473??.
7) c, = (a, b)(b, c)(a, b).
Test 10.8.
Test 10.10.
Calculer dans (66, o) le produit
Que dire d'une permutation de 6n n'admettant
(3, 4 )( 4, 5)(2, 3 )(1, 2)(5, 6)(2, 3 )( 4, 5)(3, 4 )(2, 3). qu'une seule orbite O ?
On écrira indifféremment (1, 2)o(l, 2, 3) ou (1, 2)(1, 2, 3) la composée de deux cycles donnés
de 6n. Une composée de permutations est souvent appelée produit de permutations.
-=.J
Il. DÉCOMPOSITIONS D'UNE PERMUTATION
Cl)
o.
II.1. Décomposition en produit de cycle(s)
c, Cm
les m supports étant deux à deux disjoints. Il est alors clair que, pour tout k dans {1, ... , m},
on a
Supp(ck) = {ak, cr(ak), ... , crPrl (ak)} = O(ak), cklorakl= crlo(ak)
et les 0( ak) pour 1 ::,; k ::,; m sont exactement les orbites non réduites à un points de
l'action de (cr) sur Nn. On déduit de ces résultats que les cycles ck sont uniques à permuta-
tions près et leurs supports sont les orbites de Nn pour la relation d'équivalence R sur Nn
associée à cr. ■
On a (1, 4, 7, 2, 3) 5 = idNs (car l'ordre d'un cycle est égal à sa longueur, voir le lemme 10.11)
et (5, 6) 2 = id, donc, comme 2006 = 5 x 401 + 1, on a
Proposition 10.17. Soit o-. = c1 o •.• o Cm avec m;;;, 1 et oit, les Ci sent des cycles de
supports deux à deux disjoints. Alors l'ordre àe <T vautppcm(t(c1}, ... ,ffcm)).
PREUVE. Puisque les cycles commutent à deux (leurs supports sont disjoints), on a, pour
tout entier naturel k, crk = c} o ... oc~. Comme le support de cf est contenu dans Supp( cd,
crk = id si et seulement si pour tout q entre 1 et m, c~ = idNn, ce qui équivaut à f(cq) divise
k (voir le lemme 10.11 : l'ordre de c dans le groupe (6n,o) vaut f(c)). Ceci est équivalent
à k est un multiple commun des f(cq). Le plus petit k tel que crk = id est donc le plus petit
des multiples communs des nombres e(cql, ie o( cr) = ppcm(f(ci), ... , €(cm)). ■
PREUVE.
Par exemple, {( 1, 2), (3, 1 )(2, 3)} et {(2, 1), (3, 1)(3, 2)} sont deux ensembles de paires de
N3 et, pout tout n?: 2, P = {(i,j) 11 ~ i < i ~ n} est un ensemble de paires de Nn. Plus
généralement, un ensemble de paires de Nn contient n(n - 1)/2 éléments. Si P et P' sont
deux ensembles de paires de Nn, on a clairement
et
Lemme 10.24. Soient n ·~ 2 o- E Sn. Soit P un ensemble de paires ile Nn. Pour tout
couple {i, j) d'éléments de Nn, on note Sa-(i,j) = (<r(i), o-{j)).
1) L'ensemble Su(P) est ûn ensembt~ dê!paires dé Nn;
n u7~î).
0
PREUVE.
1) Par surjectivité de cr, pour tout (i', j') EN~, il existe i et j dans Nn tels que i' = cr(i) et
j' = cr(j). Par injectivité de cr, on a donc i -# j si et seulement si i' -# j '. Sous cette hypothèse,
comme (i,j) E Pou (exclusif) (j,i) E P, (i',j') E Su(P) ou (exclusif) (j',i') E Su(P). On en
déduit que Su(P) est un ensemble de paires de Nn.
2) Puisque Su(P) et P sont deux ensembles de paires de Nn, les valeurs absolues des deux
produits du 2) sont égales. De plus, tout couple (cr(i), cr(j)) de Su(P), le signe de cr(i) - cr(j)
est l'opposé de celui de i - j si et seulement si (i,j) ou (j,i) est une inversion, le premier
produit diffère donc du second d'un facteur multiplicatif égal à (-1) I(rrl. ■
ci
,-<
(i, i + 1), (i, i + 2), ... , (i, j), (i + 1, j), (i + 2, j), ... (j - 1, j)
et on en dénombre (j - i) + (j - i - 1) = 2(j - i) - 1.
( ') = TI
f(YO(J
(crocr')(j)-(crocr')(i)
j-i
(i,j]EP
Proposition 10.29.
-
Soit
--:
n .~- 2.
- - - -.
- -
1) La signature d 'undransposition 't de 15n. vaut -1.
2) Bi <1 = 't1 o ..• o 'tm où les 'tt sont des tmnspositions, on a e( cr) :;::::{-l}m..
3) La signature d'un cycle a E 6n vaut (-l)f<0 l--+.
PREUVE.
Regroupons en guise de conclusion les trois manières de calculer la signature d'une per-
mutation cr .
PREUVE. Comme 21n = Ker (c) et E est un morphisme de groupes, (21n, o) est un sous-groupe
de (6n, o). Soit 'T une transposition quelconque de 6n. L'application 'l',, : 21n ----, 21~ définie
par 'l',,(u) ='Tou. L'application 'l',, est bien définie car, pour tout CY E 21n, 'T o CY E 6n et
E('To u) = E('T)E(u) = -1 x 1 = -1 et donc 'l',,(u) E 21~. L'application 'l',, est clairement
1
bijective de bijection réciproque 'l',,----1 : 21~----, 21n définie par 'l',,----1 (u) = 'T- ou. Ainsi l21nl =
121~1 et donc l21nl = 1
6znl = 1f. ■
IV. EXERCICES
10.1. 10.2.
Soient n ? 2 et cr1, cr2 les cycles définis par Soit n ? 2. Déterminer le centre Z de ( 6n, o),
c'est-à-dire l'ensemble des permutations cr'
telles que
10.3. 10.6.
..... 10.4 .
..... 10.7 .
Soit <JE 610 définie par
Soit n ~ 2. Déterminer les éléments <J de
123 4 5678910) (6n, o) vérifiant <J2 = idll!n.
<J= ( 3571089146 2 .
Nous allons commencer par montrer sur quelques exemples bien connus, liés à l'étude des
fonctions de lR dans IR, ce que nous entendons par les mots transformation, invariance et
symétrie, et en quoi l'existence de symétries permet de mieux comprendre un objet.
1. Les fonctions paires et impaires. Une fonction f : lR ---1 lR est dite paire lorsque
f(x) = f(-x) pour tout réel x, et impaire lorsque f(x) = -f(-x) pour tout réel x. Si l'on sait
qu'une fonction f est paire ou impaire, il suffit donc de connaître ses valeurs en tous les points
de JR- (par exemple) pour la connaître entièrement. La parité et l'imparité d'une fonction ont
des traductions immédiates en termes de graphes. Si f est une fonction paire, les graphes
de sa restriction à JR- et JR+ sont images l'un de l'autre par la symétrie par rapport à l'axe
des ordonnés. Plus précisément, si Y' est la symétrie de JR 2 définie par Y'(( x, y)) = (-x, y),
alors Y'(Ç-) = g+ et Y(Ç+) = g-. De même, si f est impaire, les graphes g- et g+ sont
images l'un de l'autre par la symétrie par rapport à l'origine : si 'ifo est la symétrie définie
par 'ifo((x, 11)) = (-x, -11), alors 'ifo(Ç-J = g+ et 'ifo(Ç+) = g-. Dans les deux cas, comme le
graphe Ç de f est la réunion g-ug+, la donnée de g- (ou de g+) permet donc de reconstituer
immédiatement le graphe total.
g- g+ g+
g-
De même, le graphe d'une fonction impaire est invariant par 'ifo : 'if0 (Ç) = Ç.
Une telle propriété d'invariance par une application «simple» s'appelle une symétrie.
Cette terminologie se trouve ici justifiée par le fait que les deux applications Y et 'if0 sont
précisément ce qu'il est convenu d'appeller respectivement une symétrie axiale (ou encore
une réflexion) et une symétrie ponctuelle. Mais le cadre dans lequel la notion de symétrie
se développe naturellement ne se limite pas à ces simples exemples, comme nous allons le
montrer dans ce complément.
2. Fonctions périodiques. L'étude des fonctions d'une variable réelle nous donne aussi
d'autres exemples un peu plus complexes. Soit f une fonction de lR. dans R Une période de
f est un réel T qui vérifie f(x + T) = f(x) pour tout réel x. Clairement O est toujours une
période de f. Si Test une période de f, on dit que f est T-périodique
Si f est une fonction T-périodique, son graphe Ç est invariant par la translation de JR. 2
définie par 'tT: (x,11) H (x + T,11). En effet, si (x,11) E Ç, par définition 11 = f(x) et
donc 11 = f(x + Tl, donc (x + T, 11) E Ç, soit 'tT(X, 11) E Ç, ce qui montre que 'tT(Ç) C Ç.
Réciproquement, il suffit de remarquer que f est aussi (-T)-périodique, ce qui montre que
't_T(Ç) C Ç par le même raisonnement. Enfin, on voit immédiatement que 't-T = (-rTJ- 1 ,
donc (-rT)- 1 (Ç) C Ç, donc Ç C 'tT(Ç) par composition à gauche par 'tT- On a donc montré
l'invariance annoncée : 'tT(Ç) = Ç.
Bien que la translation 'tT ne soit pas une symétrie au sens géométrique du mot, on dit
encore que la propriété d'invariance précédente traduit une symétrie du graphe Ç.
Comme pour les fonctions paires et impaires, cette symétrie est utilisée lors de l'étude
des fonctions périodiques. Pour étudier complètement une telle fonction, il suffit en effet de
l'étudier sur un intervalle de la forme [O, T[, où Test une période (que l'on choisit en général
minimale). En effet, si on connaît le graphe Ç0 de la restriction de f à [O, T[, on en déduit le
graphe Çn de sa restriction à [nT, (n + 1 )T[ (où n E Z*) au moyen de la translation 'tnT· Le
graphe total s'obtient enfin par réunion de tous les graphes Çn·
3. Le point commun. Dans les deux paragraphes précédents, nous avons constaté une
propriété d'invariance d'un graphe par une application (une «symétrie»), et utilisé cette
propriété pour reconstituer ce graphe en connaissant seulement l'une de ses parties.
Une remarque très importante est que si un graphe Q est invariant par une application f,
que nous supposerons bijective de JR. 2 dans JR. 2 , alors il est encore invariant par toute composée
fn pour n EN* (rappelons que tn est l'application obtenue en composant n fois l'application
f). Montrons-le par récurrence. Nous savons que f(Q) = Q. Supposons que fn(Q) = Q, alors
ce qui prouve l'assertion. De même, on voit facilement que f- 1 (Q) = Q en composant l'égalité
g = f(Q) à gauche par f- 1 . Convenons de noter t 0 = Id, et f-n = (f- 1 )n pour n E N*.
Nous avons donc ainsi défini l'application tn pour tout n E z. On vérifie immédiatement que
fn(Q) = g pour tout n E Z.
Nous sommes donc amenés naturellement à considérer toutes les applications tn, n E Z, au
lieu de la simple application f, toutes ces applications sont en effet des symétries du graphe,
et peuvent servir à en réduire l'étude. Dans le cas des fonctions paires et impaires, nous avons
en fait les égalités
et dans ce cas la possibilité de restreindre l'étude à l'intervalle borné [O, T[ exploite l'existence
de cet ensemble infini {(-rT)n In E Z} de symétries, puisque 9n = (-rT)n(Qo) pour n E Z, ce
qui permet de reconstituer le graphe total.
4. Un premier aperçu sur le groupe des bijections d'un ensemble. Pour unifier les
deux cas de figure que nous venons de rencontrer, et en montrer la généralité, nous allons
maintenant utiliser le vocabulaire de la théorie des groupes.
Soit E un ensemble non vide, et soit 6(E) l'ensemble de toutes les bijections de E dans
E. Le couple (TT(E), o), où o est la loi de composition des applications, est alors un groupe.
D'abord la loi o est interne : la composée de deux bijections est une bijection. L'application
identique IdE (qu'on notera simplement Id s'il n'y a pas de confusion possible) est l'élément
neutre de E. Le symétrique d'une bijection f est son inverse, qu'on note f- 1 . Enfin la loi de
composition est toujours associative : si f, g, h sont trois bijections de E, et six E E
ce qui montre que ho ( g o f) = (ho g) o f puisque x est arbitraire. On reconnaît bien là les
propriétés que doit vérifier une loi de groupe.
Comme précédemment, si n est un entier > 0, la composée de n applications égales à f
est notée fn, et on note enfin f-n l'application (f- 1 )n. On pose par convention t 0 =Id.Pour
tout n E Z, la notation tn est donc bien définie.
Soit f E TT(E). Par définition, le sous-groupe de 6(E) engendré par f est le plus petit sous-
groupe de 6(E) qui contient f, on le notera< f >. Il est facile de voir que< f >= {fn In E Z}.
En effet, le sous-groupe engendré par f contient ldE, f, et f- 1 (puisqu'il contient f et est un
sous-groupe), et donc aussi fn pour n E Z, donc {fn I n E Z} C< f >. On vérifie d'autre
part facilement que l'ensemble {fn In E Z} est un sous-groupe de S(E), l'inclusion précédente
montre donc qu'il est égal au sous-groupe engendré par f.
On peut maintenant généraliser ce que nous avons vu pour les graphes au cas de parties
quelconques de l'ensemble E. On dit qu'une partie A de E est invariante par une application
f E TT(E) si f(A) = A. On voit alors par récurrence que fn(A) = A pour tout n EN*. En
effet, f(A) = A et si fn(A) = A, alors fn+l (A) = fn o f(A) = fn(f(A)) = fn(A) = A. De
1
même, en appliquant f- 1 aux deux membres de l'égalité f(A) = A, on voit que A= f- (A),
1
donc A est invariant par f- . Il en résulte que f-n(A) = A pour n E N*. On voit donc que
fn(A) = A pour n E z. En conséquence, si une partie A de E est invariante par une bijection
f E TT(E), elle est invariante par tout élément du sous-groupe< f >; en d'autres termes tout
élément de < f > est une symétrie de A.
Il faut maintenant expliquer comment reconstruire A à partir de la donnée de ses symétries
et de l'un de ses sous-ensembles, comme nous l'avons fait pour les graphes. Il n'y a pas de
méthode générale pour le faire, mais on peut cependant en donner une idée assez claire. Bien
que les éléments de < f > laissent A globalement invariante, ils peuvent modifier des parties
de A : il se peut, comme nous l'avons vu pour les graphes, que f(B) -=/ B pour une partie B
de A. On cherche alors une partie B telle que la réunion UhE<f>h(B) = A, et on veut de plus
que cette partie B soit « la plus petite possible» pour exploiter au maximum la donnée des
symétries. C'est exactement ce que nous avons fait dans le cas des graphes.
Ceci explique pourquoi, en général, si une partie B de E est donnée, il est important de
considérer toutes les images h(B) pour h E< f >. L'ensemble formé par toutes ces images
s'appelle l'orbite de B suivant f. On voit que cette orbite est un sous-ensemble de l'ensemble
9(E) des parties de E. Dans le cas des fonctions paires ou impaires, l'orbite du sous-graphe
9- était l'ensemble {9-, 9+}, dans le cas des fonctions périodiques l'orbite du sous-graphe 90
2 2
était Wn I n E Z}. Ce sont bien des sous-ensembles de l'ensemble 9(JR ) des parties de JR. .
Dans les deux cas, la réunion de toutes les parties contenues dans l'orbite donne le graphe
entier, que nous avons donc ainsi reconstruit.
Bien entendu, les exemples que nous avons cités sont trop simples pour que les idées de
théorie des groupes que nous avons introduites soient réellement efficaces ou intéressantes.
Mais les généralisations qu'elles permettent ont montré depuis deux siècles qu'elles sont en
réalité extrêmement profondes, et nous allons en voir quelques-unes dans ce qui suit.
Pour conclure, donnons encore un exemple de fonction élémentaire dont le graphe possède
des symétries intéressantes, la fonction partie entière E : lR --, R Rappelons que pour tout
réel x, la partie entière E(x) de x est l'unique entier vérifiant E(x) :S x < E(x) + 1. Il est
facile de vérifier que E n'est ni paire, ni impaire, ni périodique. Cependant, le graphe 9 de
2
E est invariant par l'application X de JR. 2 dans JR. définie par x(x, y) = (x + 1, y+ 1). En
effet, si x E JR, E(x + 1) = E(x) + 1 puisque E(x) + 1 est un entier et vérifie les inégalités
E(x) + 1 :S x+ 1 < E(x) +2. Si (x, y) E 9, y= E(x), donc y+ 1 = E(x+ 1) et on en déduit que
(x + 1, y+ 1) = x(x, y) E 9, ce qui montre que x(9) c 9. Réciproquement, si (x, y) E x(9),
soit (a, b) = (x - 1, y - 1). Comme y = E(x), on vérifie que b = E(a), ce qui montre que
(a, b) E 9, donc 9 c x(9). Il en résulte bien l'égalité x(9) = 9.
Là encore, le graphe 9 est invariant par toutes les applications du sous-groupe <X>, et
on voit qu'il suffit de se restreindre à l'étude de E sur [O, 1[, puisque si 90 est le graphe de
E [o,i[, alors
1
Dans ce qui précède, nous nous sommes limités au cas où les symétries de l'objet que nous
considérions étaient obtenues par composition d'une seule application. La pratique montre que
c'est très insuffisant, comme nous allons le voir en étudiant le cas d'un triangle équilatéral.
Mais la force des idées de théorie des groupes que nous avons introduites est qu'elles s'adaptent
à cette nouvelle situation sans aucune modification.
L'étude détaillée des propriétés de P, et des propriétés plus générales de géométrie euclidienne,
sera traitée dans le cours de L2. Il suffit ici de savoir que le plan euclidien est le modèle ma-
thématique pour le plan muni de la notion de distance qui nous est familière. En effet, si dans
un plan physique nous traçons deux axes faisant entre eux un angle droit et si nous prenons
sur chacun d'eux la même unité de longueur, ce plan se trouve ainsi muni de coordonnées;
ces coordonnées sont telles que la distance mesurée entre deux points est alors donnée par la
fonction d.
ile B
Dans le plan euclidien P, considérons un triangle équilatéral T = {A, B, C}. Si ~ est une
droite qui n'est pas une des médianes de T, et si Y est la réflexion par rapport à~, on voit sans
peine que Y(~) /.~-En termes usuels, le triangle n'est pas symétrique par rapport à~- Il est
alors facile de voir que l'orbite de~ sous l'action de Y contient exactement deux éléments :
('.)y(T) = {T,Y(T)}. Nous reviendrons dans la suite sur le problème général des orbites, et
allons nous concentrer ici sur l'étude des applications de P dans P qui laissent le triangle T
invariant. II faut immédiatement signaler que nous n'envisagerons pas toutes ces applications,
il y en aurait beaucoup trop et ce ne serait pas très intéressant. Nous nous limiterons aux
isométries du plan, c'est-à-dire aux applications qui préservent la distance entre deux points
de P. II est clair que les réflexions, les rotations et les translations sont des isométries de P,
et un théorème général, que nous verrons dans le cours de l2 montre que toutes les isométries
s'obtiennent comme composées de réflexions, de rotations et de translations.
Il y a manifestement trois réflexions qui laissent le triangle invariant, ce sont les réflexions
par rapport aux médianes. Nous noterons YA, Ys, Yc, les réflexions par rapport aux médianes
passant par A, B et C respectivement. On peut les représenter symboliquement par leur effet
sur les points A, B, C de la manière suivante
AHC) AHB)
5"8 : B H B , Y'c: B HA .
( CHA ( CHC
Il est clair que si deux applications du plan laissent le triangle T invariant, leur composée
le laisse aussi invariant (c'est l'analogue de ce que nous avons vu pour les graphes). Il est par
ailleurs clair que la composée de deux isoméries est encore une isométrie : en effet, si f et g
sont deux isométries, et si a et b sont deux points de P
AHC)
Y'A o Y'c : B HA .
( CHB
Ces deux applications n'entrent pas dans la liste des symétries que nous avons considérées.
Pour les identifier, nous allons faire appel au théorème fondamental suivant, que nous verrons
dans le cours de 12.
Une isométrie du plan est entièrement déterminée par les images de trois points non ali-
gnés.
En d'autres termes, puisque les points A, B, C sont non alignés, si f et g sont deux iso-
métries du plan telles que f(A) = g(A), f(B) = g(B) et f(C) = g(C), alors elles sont égales,
c'est-à-dire que f(M) = g(M) pour tout point M du plan.
Or si O est le centre du triangle T, et si /Jè+ et fJè_ sont les rotations de centre O et d'angles
br/3 et -2n/3 respectivement, il est clair que les images des points A, B, C par /Jè+ et par
Y'A o 5"8 sont égales, et de même les images de A, B, C par fJè_ et par Y'A o Y'c sont égales.
On en déduit que
Nous avons jusqu'à maintenant omis de parler de la plus simple des isométries, l'identité du
plan, que nous noterons Id. Il est clair qu'elle laisse T invariant, elle entre donc aussi dans
notre cadre. Il aurait d'ailleurs été impossible de l'oublier, puisqu'on vérifie par exemple que
Y'A o Y'A = Id, ou encore que /Jè+ o !]è_ = Id.
Nous disposons donc maintenant de 6 isométries différentes qui laissent le triangle T inva-
riant : Id, Y'A, Y's, Y'c, !Jè+, fJè_. Là encore, il est convenu d'appeler chacune d'entre elles une
symétrie de T, bien que seules Y'A, 5"8 , Y'c soient des symétries au sens usuel.
La question naturelle est maintenant de savoir si nous avons identifié toutes les isométries
laissant T invariant. C'est encore le théorème fondamental précédent qui fournit la réponse.
Une isométrie du plan est entièrement déterminée par les images qu'elle associe aux points A,
B et C. Il y a donc autant de telles isométries que de bijections de l'ensemble T = {A, B, C}
dans l'ensemble T. Nous savons qu'il existe 3! = 3 x 2 = 6 bijections de T dans T. Par ailleurs,
comme nous l'avons vérifié, les isométries Id, Y'A, Y's, Y'c, !Jè+, fJè_ déterminent, en restriction
à T, 6 bijections distinctes. Nous avons donc ainsi trouvé toutes les isométries du plan euclidien
P qui laissent l'ensemble T invariant.
Il est très tentant de résumer notre discussion précédente par un tableau récapitulatif. No-
tons î(T) = {Id,YA,Ys,Yc,fl+,fl_} l'ensemble des isométries précédentes. Comme nous
l'avons déjà signalé, si deux isométries laissent T invariant, leur composée est aussi une iso-
métrie qui laisse T invariant. Elle appartient donc à l'ensemble §(Tl, donc la composition
des applications est une loi de composition interne dans î(T). Il est donc possible de dresser
une table de la forme suivante.
0 Id Yc fl+ ,?l_
YA Ys
Id Id Yc fl+ fl_
YA Ys
YA YA Id fl+ ,?l_ Ys Yc
Ys Ys ,?l_ Id fl+ Yc YA
Yc Yc fl+ fl_ Id YA Ys
fl+ fl+ Yc YA Ys fl_ Id
,?l_ ,?l_ Ys Yc YA Id fl+
Dans cette table, nous avons écrit dans la case située à l'intersection de la ligne repérée
par une isométrie f, et de la colonne repérée par une isométrie g, leur application composée
f o g, qui est bien entendu aussi dans î(T). Il est clair que cette table examine toutes les
compositions possibles des applications de î(T). Nous invitons le lecteur à vérifier à la main
l'exactitude de cette table en examinant toutes les composées possibles.
Nous avons déjà remarqué que la composée de deux applications de î(T) est une appli-
cation de î(T). De même, l'inverse d'une application de î(T) est encore une application
de î(T). On peut le vérifier sur la table, ou encore remarquer que l'inverse d'une isométrie
de Pest une isométrie de P, et que l'inverse d'une application qui laisse T invariant laisse T
invariant.
Nous avons donc démontré que î(T) est un sous-groupe du groupe des bijections (TT(P), o)
de l'ensemble P.
Nous allons voir dans ce qui suit que ce fait est général. Mais arrêtons-nous un instant
encore sur la table précédente, et cherchons les sous-groupes de (§(Tl, o ). Ce sont les parties
/ C î(T) pour lesquelles la composition est une loi interne, et qui contiennent les inverses
de chacun de leurs éléments. Un petit raisonnement, joint à l'examen de la table, permet de
trouver tous les sous-groupes de (î (T), o).
1) Il y a d'abord les sous-groupes triviaux {Id} et î(T).
2) Il y a ensuite trois sous-groupes à deux éléments {Id, YA}, {Id, Ys}, {Id, Yc}. Il est bien
sûr possible de donner une table de composition pour ces sous-groupes.
0 Id YA 0 Id Ys 0 Id Yc
Id Id YA Id Id Ys Id Id Yc
YA YA Id Ys Ys Id Yc Yc Id
0 Id fl+ ,?l_
Id Id fl+ fl_
fl+ fl+ ,?l_ Id
,?l_ ,?l_ Id fl+
Il n'y a pas d'autres sous-groupes de (î(T),o) que ceux que nous venons de présenter.
Pour le voir, il suffit de remarquer que si un sous-groupe contient à la fois un élément de
l'ensemble {YA, YB, Yc} et un élément de l'ensemble{.~\,,%'_}, alors il est égal à l'ensemble
î(T) entier. Nous en laissons la vérification au lecteur.
L'exemple le plus simple de sous-groupe de 6(E) est G = {Id}. Pour tout élément x de E, on
a dans ce cas O (G, x) = {x}, ce qui traduit le fait que G ne modifie pas l'ensemble E. Il y a
donc autant d'orbites que de points dans E.
Le cas opposé est celui où G = TT(E). Alors pour tout x dans E, 0 (G, x) = E. En effet, si
1J E E, on peut définir l'application fxy de E dans Epar fx11 (x) = 1}, fx11 (y) = x, et fx 11 (z) = z
si z (/:. {x, y}. Cette application f xy est clairement une bijection de E, donc f xy E G. Comme
f xy (x) = 1J, on voit que 1J E O ( G, x), ce qui montre que E C O ( G, x), puisque y est arbitraire.
Comme O (G, x) est un sous-ensemble de E, on en déduit que O (G, x) = E. Il y a donc dans
ce cas une seule orbite, qui est l'ensemble E lui-même.
Bien entendu, comme nous allons le voir, les cas intéressants sont ceux pour lesquels le
sous-groupe G choisi est propre, c'est-à-dire différent des deux cas triviaux {Id} et 6(E). On
peut dans tous les cas établir une propriété très importante des orbites. Notons D l'ensemble
formé par toutes les orbites des points de E. Alors les éléments de D réalisent une partition
de E, au sens où
1) une orbite est toujours non vide
2) deux orbites distinctes sont disjointes
3) la réunion de toutes les orbites est égale à E.
Pour montrer ces propriétés, il suffit d'établir l'existence d'une relation d'équivalence sur
E dont les classes d'équivalence sont exactement les orbites suivant G. On sait en effet que les
classes.d'équivalence forment une partition de l'ensemble sur lequel la relation d'équivalence
est définie. Pour cela, on introduit la relation R sur E définie par
V(x, y) E E2 , x R 1J si et seulement si il existe f E G tel que y= f(x).
Cette relation R est une relation d'équivalence sur E. Pour voir qu'elle est réflexive, notons
que l'application identique Id est dans G (puisque c'est l'élément neutre de 6(E)) et vérifie
x = Id( x), donc x R x. Elle est symétrique, puisque si x et 11 sont des éléments de E vérifiant
x R 11, il existe une application f E G telle que 11 = f (x), et donc x = f- 1 (11), mais f- 1 E G
puisque G est un sous-groupe, donc x R 11- Enfin, elle est transitive, puisque si x, 11, z dans
E vérifient 11 R x et z R 11, il existe deux applications f et g dans G telles que 11 = f (x) et
z = 9(11), donc z =go f(x), mais go f E G puisque G est un sous-groupe, ce qui montre que
z R x, ce qui termine la preuve.
Les classes d'équivalence de R sont les orbites suivant G. En effet, si x E E, l'orbite
0 (G, x) est exactement l'ensemble des éléments de E qui s'écrivent 11 = f(x) pour f dans G,
c'est donc l'ensemble des points 11 de E tels que 11 R x, soit la classe d'équivalence de x.
Nous venons donc de voir que l'effet de G sur E se traduit par une partition de E en
orbites. Mais un élément x E E étant donné, il est aussi intéressant de considérer l'ensemble
des éléments f de G qui laissent x invariant, c'est-à-dire tels que f(x) = x. On définit ainsi le
stabilisateur de x par
Stab(x) = {f E G I f(x) = x},
c'est donc une partie de G. Nous allons voir que le stabilisateur de x est un sous-groupe de G.
D'abord clairement Id E Stab(x). Soit f dans Stab(x). Alors de l'égalité f(x) = x on déduit
que
x = f- 1 (f(x)) = f- 1 (x)
Avant d'aller plus loin, remarquons que ce qui vient d'être dit s'étend sans difficulté au cas
des parties de E. En effet, si P est une partie de E, et si f E G, on définit de manière usuelle
f(P) = {f(x) x E P} CE. On peut alors définir l'orbite de la partie P suivant G
1
Il faut bien noter que O (G, P) est une partie de l'ensemble &(E) de toutes les parties de E,
puisque chaque élément f(P) est une partie de &(E), alors que l'orbite d'un point x de E est
une partie de E. On peut montrer exactement de la même manière que pour les points de E
que les orbites {O (G, P) P E &(El} réalisent une partition de &(E).
1
Le stabilisateur d'une partie est donc l'ensemble des bijections de G qui la laissent invariante.
C'est ce stabilisateur que nous avons déterminé dans le cas du triangle équilatéral, lorsque G
est le sous-groupe de 6(P) formé par les isométries euclidiennes.
Les notions ainsi définies pour les parties prolongent les précédentes, puisqu'on note im-
médiatement que six E E, Stab({x}) = Stab(x), et que l'orbite du singleton {x} est l'ensemble
de tous les singletons formés par les éléments de O ( G, x).
Là encore, l'effet d'un sous-groupe G sur les parties de E s'étudie à deux niveaux, d'une part
l'orbite d'une partie renseigne sur les modifications induites par G, alors que le stabilisateur
d'une partie décrit ses propriétés d'invariance suivant G.
Terminons par une remarque pour inviter le lecteur à imaginer d'autres constructions
à partir des mêmes idées. Nous venons de décrire l'effet d'un sous-groupe de 6(E) sur les
parties de E ; tout ce qui a été dit se transpose sans aucune modification au cas des parties
de E à nombre d'éléments fixé. Soit en effet n E N*, et soit D"n(E) l'ensemble des parties
à n éléments de E. Si f E $6(E), et si P E D"n(E), alors f(P) E D"n(E). En conséquence,
il est possible de définir l'orbite de P suivant un sous-groupe G de 6(E), qui est une partie
de D"n(E), et l'ensemble des orbites suivant G réalise une partition de D"n(E). On pourrait
aussi examiner l'effet de G sur les n-uplets d'éléments de E, en posant f(x1, Xz, ... , Xn)
(f(xi), f(xz), ... , f(xnll, et on peut ainsi imaginer de multiples situations analogues.
Nous allons maintenant montrer comment les idées que nous avons évoquées dans les parties
précédentes s'appliquent naturellement à la définition de la notion de géométrie.
Il existe dans les constructions mathématiques de nombreux exemples d'ensembles E et de
sous-groupes de 6(E) dont la structure est très bien connue. Donnons-en quatre.
• Les espaces vectoriels E pour lesquels il est particulièrement intéressant de considérer le
sous-groupe GL(E) de 6(E) formé par toutes les applications linéaires bijectives de E dans E.
• Lorsque E = lRn, avec n 2': 1, on peut définir la distance de deux éléments x = (x 1, ... , Xn)
et 1J = (x1, ... , 1:Jnl de lRn par
et on peut considérer le sous-groupe de 6(1Rn) formé par toutes les applications de GL(JRn)
qui préservent la distance entre deux points, c'est-à-dire des applications f E GL(lRn) pour
lesquelles d(f(x), f(11)) = d(x, 11) pour tous points x et 1J de lRn. Ce sous-groupe est noté
0 (JRn) et est appelé groupe des isométries linéaires euclidiennes de ]Rn_
• On peut aussi considérer le sous groupe de 6 (JRn) formé par toutes les applications de
O(JRn) dont le déterminant dans la base canonique de ]Rn est égal à 1. Ce sous-groupe est
noté SO(lRn), c'est le groupe des isométries linéaires euclidiennes directes de lRn.
• Plus généralement, on peut considérer le groupe Isom(JRn) formé par toutes les bijections
(pas forcément linéaires) de ]Rn dans ]Rn qui préservent la distance d. Il est donc plus gros
que O(lRn), c'est le groupe des isométries affines euclidiennes de ]Rn_ On peut montrer qu'une
telle isométrie est la composée d'une isométrie linéaire et d'une translation.
Ces exemples de groupes sont très bien compris, la structure de leurs éléments est « facile
à décrire». Nous limitons là notre liste, mais les exemples sont encore très nombreux.
Cette fonction g sera notée cr * f. On voit donc apparaître une « loi de composition ex-
terne » entre les éléments de 6n et les fonctions définies sur en. Avant d'aller plus loin,
notons que cette idée permet de mettre en évidence des propriétés naturelles des fonctions de
§. Par exemple, on dit qu'une fonction f de§ est symétrique lorsque
pour tout (x 1, ... , Xn) E en et tout cr E 6n- Ceci traduit le fait qu'elle garde la même valeur
lorsque ses variables sont permutées de manière arbitraire. Avec notre nouvelle notion, une
fonction f est symétrique si et seulement si cr* f = f pour tout cr E 6n.
Cherchons maintenant quelles sont les propriétés de cette loi de composition externe *·
On voit d'abord que Id* f = f pour toute fonction f de § (Id désignant toujours la bijection
identité de Nn)- Ensuite, si cr et T sont donnés dans 6n, et f dans§, et si (x 1, ... , Xn) E en
Pour exprimer le second membre, posons 1Jk = X"(kJ pour 1 ::; k ::; n. On obtient alors
[cr* (T* f)l(x1, ... , Xn) = (T* f)(y1, ... , Yn) = f(Y-r(l), ... , Y-r(n))
= f(XCJ(-r(l)), ... , XCJ(-r(n))) = [( cr o -r) * f](x1, ... , Xn).
Comme cette égalité est vérifiée pour tout (x 1, ... , Xn) E en, il en résulte l'égalité des applica-
tions cr*(T*f) et (cro-r)*f. Pour tout élément cr E 6n, on considère maintenant l'application
<D" de § dans § définie par
Montrons que <D" est une bijection de §. Pour cela, il suffit de mettre en évidence une
application 'l' : § ---, § telle que 'l'o <D" = <D" o 'l' = Id.9". On voit que l'application 'l' = <D cr'
convient. En effet
donc <D " 1 o <Do- = Id.fi<, et on raisonne de même pour <D" o <D" 1 .
Nous avons donc en fait construit une application <D de 6n dans l'ensemble des bijections
6(ff) : il suffit de poser <D( cr) = <De, pour tout cr E 6n. Cette application <D est un morphisme
du groupe (6n, o) dans le groupe (TT( ff), o), comme le montrent les propriétés que nous venons
d'établir.
Cet exemple va nous servir de motivation pour la définition suivante.
Définition 10.32. Soit ( G,@) un groupe, et soit E un ensemble. Une action de G sur E est
un morphisme de G dans le groupe des bijections 6(E).
C'est précisément cette définition qui modélise l'idée d'action « à distance» que nous
cherchions. Le groupe G n'est plus supposé être un sous-groupe de 6(E), mais il est simplement
envoyé dans 6(E) par un morphisme. Soit <D : G---, 6(E) un tel morphisme. Alors pour g E G,
<D(g) est un élément de 6(E), et six E E, (<D(g))(x) est à comprendre comme le transformé
de x par l'action de l'élément g. Pour cette raison, on note
g *X= (<!J(g))(x).
pour f E G et x E E. Bien entendu, dans ce cas, il s'agit d'une formalisation inutile, elle
n'ajoute rien à ce que nous avons déjà dit. Mais par exemple lorsqu'on envisage l'effet de G
sur les parties de E, comme nous l'avons fait, nous somme déjà en présence d'une véritable
action de groupes, puisque G n'est plus un sous-groupe de 6(.9(E)). On a dans ce cas
hP =f(P)
pour P E &(E) et f E G. Enfin, dans le cas des parties de cardinal fixé, ou des n-uplets,
l'action se définit de manière analogue.
Terminons cette partie en généralisant à notre nouvelle notion d'action de groupe l'idée
d'orbite et de stabilisateur.
Définition 10.33. Soit (G,@) un groupe, et soit E un ensemble. Soit <D une action de G
sur E. On note g * x = (<D(g))(x) pour g E G et x E E. Pour x E E, on pose
On dit que O (G, x) est l'orbite de x sous l'action de G, c'est une partie de E, et que
Stab( G, x) est le stabilisateur de x.
On montre exactement comme nous l'avons fait plus haut que les orbites suivant l'action
de G forment une partition de E, et que Stab(G, x) est un sous-groupe de G.
1.6. L'équation de degré trois et les résolvantes de Lagrange
La formule de résolution de l'équation du second degré est très simple et bien connue. Nous
avons aussi rencontré la formule de Cardan, qui permet la résolution de l'équation du troisième
degré. Il est aussi possible de donner des formules explicites pour la résolution de l'équation
du quatrième degré. Il se pose donc naturellement la question de l'existence de formules
générales permettant la résolution des équations polynomiales de degré quelconque. C'est à
Niels Abel et surtout à Évariste Galois que l'on doit la preuve qu'il est impossible de trouver
une formule générale de résolution pour les équations de degré supérieur ou égal à 5. La preuve
de Galois a marqué un tournant dans l'histoire des mathématiques, c'est en effet la première
fois que l'idée de groupe est apparue et a été utilisée de manière systématique. Il s'agissait
en l'occurence d'analyser l'effet des permutations des racines sur certaines quantités pour en
déduire la non-existence de formules de résolution.
Nous ne pourrons pas décrire ici la totalité de la méthode de Galois, nous la rencontrerons
de nouveau dans la suite du cours. Mais il est déjà possible, et fructueux, d'utiliser les idées
mises en place dans les parties précédentes pour analyser l'existence et la structure d'une
formule de résolution des équations du troisième degré. Cette méthode est due à Lagrange et
Vandermonde, et diffère notablement de celle de Cardan.
Commençons auparavant par examiner la résolution bien connue de l'équation du second
degré. Considérons donc deux complexes b et c, et cherchons à résoudre l'équation
x 2 + bx+c = 0,
où le coefficient de x 2 a été choisi égal à 1, ce qui ne restreint pas la généralité. On écrit
traditionnellement le trinôme sous forme canonique, ce qui conduit rapidement à la solution.
Nous voulons ici indiquer une méthode plus adaptée à une généralisation. Pour cela, nous
allons remarquer qu'il est possible de calculer la somme et le carré de la différence des racines
au moyen des coefficients b etc de l'équation. En effet, si x 2 + bx + c = (x - ri)(x - r 2), on
voit par identification que r 1 + r2 = -b et r 1r 2 = c, on obtient donc
{ r,, r2} = { ½[r1 + r2 + (r1 -r2)l, ½[r, + r2 - (r 1 -r2)l} = {½[-b + dl, ½[-b - d] },
et on retrouve bien les formules usuelles (nous avons utilisé la notation ensembliste pour éviter
l'ambiguité due à la numérotation des racines).
Cette méthode de résolution a deux clés principales. La première est la possibilité de
calculer les expressions r, + r2 et (r 1 - r 2)2 en fonction des coefficients du trinôme. Le point
essentiel est que ces calculs ne font intervenir que des sommes et des produits des coefficients b
etc, et des constantes explicitement connues. Ces expressions sont donc des «polynômes» en
les coefficients b et c, nous allons en donner une définition précise dans ce qui suit.
La seconde clé est la possibilité de retrouver les racines au moyen des deux expressions
précédentes. Pour cela, il est nécessaire d'extraire une racine carrée, celle de l'expression
polynomiale b2 - 4c. L'ensemble des solutions est donc obtenu à partir des coefficients de
l'équation au moyen de sommes, produits, produits par des constantes, et extraction d'une
racine carrée.
Nous allons voir comment généraliser cette approche au cas des équations de degré 3,
en séparant la partie de la résolution qui ne fait intervenir que des calculs polynomiaux en
fonction des coefficients de l'équation, et celle qui conduit à l'expression finale des solutions,
qui repose sur l'extraction de racines de degré convenable. C'est dans la première partie que
la notion de symétrie va s'avérer cruciale.
1. Les fonctions symétriques des racines. Soit n E N*. Une fonction polynôme sur en
est une fonction P de en dans e définie par
L
(k1 ,... ,kn )EN
k1 kn
fi(k1 ,... ,kn)Xl · · · Xn
où N est une partie finie de Nn, et où les coefficients a(ki ,... ,knl sont dans C. Par exemple, la
fonction définie par P(x 1 , x 2 , x 3 ) = 3xfx~x1 + 8ix1x~X3 + Sx~x~xi est une fonction polynôme
sur e3 .
Il faut voir ici les fonctions polynômes sur en comme les fonctions « les plus simples »,
au sens où elles ne font intervenir que des sommes et produits de variables et de constantes
explicitement connues, et ne requiert pas d'extraction de racines (ou de fonctions plus com-
plexes).
On dit qu'une fonction polynôme sur en est symétrique lorsque cHP = P pour tout cr E 6n.
Il est possible de montrer que pour que P soit symétrique, il faut et il suffit que cr(N) = N
pour tout cr E 6n, et que fi(a(ki), ... ,a(knll = fi(k, ,... ,knl pour tout (k1, ... , kn) EN. Par exemple,
la fonction définie par P(x1, x2, x3) = xfx~+xfxi+x~xi est une fonction polynôme symétrique
sur e3 .
Une classe très importante de fonction polynômes symétriques apparaît lors de l'étude des
équations polynomiales dans C. Considérons l'équation
(E)
où ak E e pour O::; k < n. On sait qu'elle possède n racines complexes (comptées avec leur
multiplicité), que nous noterons ri, ... , Tn. Il est donc possible d'écrire l'égalité
= -an-1
r1 + r2 + · · · + Tn
r1r2 + r1r3 + · · · + Tn-JTn = Un2
r1r2r3 + r1r2r4 + · · · + Tn-2Tn-1Tn = -Un-3
On voit que les premiers membres de ces égalités définissent des fonctions polynômes symétri-
ques. Plus précisément, introduisons les fonctions polynômes .s 1 , ... Sn sur eN définies par les
expressions
.51 (X1, ... , Xn) = XJ + X2 + · · · + Xn,
.52(X1, ... , Xn) = X1X2 + X1X3 + · · · + Xn-JXn,
.53(X1, ... , Xn) = X1X2X3 + X1X2X4 + · · · + Xn-2Xn-1Xn,
On voit facilement que s 1, ... Sn sont symétriques. On les appelle fonctions polynômes symé-
triques élémentaires sur en. Leur importance dans notre problème de résolution des équations
polynomiales vient d'un remarquable théorème, dû à Newton, dont voici l'énoncé.
Soit P une fonction polynôme symétrique sur en. Alors il existe une fonction polynôme <l>
sur en telle que
Nous ne démontrerons pas ici ce théorème, mais nous nous limiterons à montrer son
intérêt dans notre problème. Revenons à l'équation (E), et considérons une fonction polynôme
symétrique P sur en. Une question importante, comme nous le verrons, est de calculer la valeur
de Pau point (r 1, ... , rn) E en formé par les racines de (E) (on notera qu'il est inutile de
spécifier l'ordre dans lequel les racines sont énumérées, puisque le polynôme est symétrique).
Nous avons remarqué que les valeurs des fonctions SJ, ... ,sn au point (r1, ... ,rn) ont des
expressions très simples en fonction des coefficients de l'équation
Il résulte alors immédiatement du théorème de Newton qu'il existe une fonction polynôme 1Jl
sur en telle que
P(r1, ... , rn) = 1Jl( ao, ... , Un~il•
Il faut voir là que la valeur prise par P sur le n-uplet(r1, ... , rn) formé par les racines de
l'équation peut être exprimée de manière polynomiale au moyen des coefficients de l'équation,
c'est-à-dire en ne faisant intervenir que des sommes et produits de ces coefficients. De plus,
il est possible dans la pratique de calculer le polynôme 1Jl. Pour simplifier, nous ne nous
préoccuperons pas du problème du calcul effectif de 1Jl dans ce qui suit.
2. L'équation du troisème degré. Nous pouvons maintenant mettre en application les idées
générales qui précèdent et envisager le problème de la résolution de l'équation du troisième
degré. Considérons donc une équation de la forme
x 3 +px+ q =0 (T)
ce qui ne restreint pas la généralité, puisque toute équation du troisième degré se ramène à
cette forme par un changement d'inconnue de la forme x----, x + IX. Notons r 1, r 2 , r 3 les racines
de cette équation.
Nous allons considérer la fonction polynôme sur e 3 définie par
1 H2)
21H1)
H3 (1H3)
( 3H2 , 2H 2 ,
P1 : Pz : p3: 2H 1 ,
3H1 ( 3H3
C+ : 21 H2)
H 3 , c_ :
(12 H3)
H 1
( 3H1 3H2
Étudions maintenant l'action de 6 3 sur u et v.
1) On sait que Id *U = u.
3
2) C+*U(X1,X2,x3) =U(Xc+(1J,Xc+(2),Xc+(3)) =u(x2,X3,X1) = (x2+jx3+j2x,)
= (j2(x1 + jxz + j2x3))3 = (x1 + jxz + j2x3) 3 = u(x1, X2, X3)
donc c+ * u = u.
3) c_ * U = (C+ )2 * U = C+ * ( C+ * U) = C+ * U = U
donc c_ *U = u.
3
4) Pi* u(x1, x2, X3) = u(xp 1 (1), Xp 1 (2), Xp 1 (3Jl = u(x1, X3, x2) = (x1 + jx3 + i2x2) .
3
Cette expression est nouvelle, nous noterons v(x1, X2, X3) = (x1 + jx3 + i2x2) .
3
5) P2*U(X1,X2,x3) =U(Xpz(l),Xpz(2),Xpz(3)) =u(x3,X2,X1) = (x3+jx2+i2x1)
2 3
= (j2(x1 + jx3 + i2x2))3 = (x1 + jx3 + j x2) = v(x1, Xz, x3),
donc Pz*U=V.
2 3
6) p3*U(X1,X2,X3) =U(Xp3(l),Xp3(2),Xp3(3)) =u(x2,X1,X3) = (xz+jx, +j x3)
3 3
= (Hx1 + jx3 + i2x2)) = (x1 + jx3 + i2x2) = v(x1, X2, X3),
donc p3 * u = v.
Il en résulte donc que l'orbite de u suivant l'action* est l'ensemble {u, v}. Cette remarque
est cruciale, elle va nous permettre de former des fonctions polynômes symétriques qui vont
nous donner les solutions de l'équation (T). Remarquons auparavant que l'on peut décrire
aussi très simplement l'orbite de v suivant*·
Considérons les fonctions polynômes S et P sur C 3 définies par
7
Cela semble hors de portée des théories actuelles, la notion de choc étant l'une des plus difficiles à modé-
liser correctement, de même que celle de roulement sur une surface, et ces deux problèmes interviennent
crucialement pour décrire le mouvement de la pièce en contact sur le sol.
Munissons maintenant la sphère de la notion intuitive d'aire qui nous est familière (elle
est d'ailleurs utilisée en physique sous le nom d'angle solide), notons À(A) l'aire d'une partie
A C S. Il est clair que l'application Y' conserve les aires, au sens où À(Y'(A)) = À(A).
Il en résulte que
l'aire correspondant au résultat pile est donc égale à l'aire correspondant au résultat face.
Une construction mathématique permet maintenant de construire un « volume » ;\ sur
l'espace des conditions initiales C = g x SS x IR 3 , qui correspond à l'intuition physique de
volume dans IR 3 , et que nous pouvons valablement utiliser pour mesurer le caractère aléatoire
de notre expérience (comme l'aire dans notre exemple de la feuille transportée par le vent).
Nous reverrons cette notion de volume (qui s'appelle une mesure) dans le cours de 13. Pour
3
une partie AC C de la forme A= A 1 x A2 x A3, avec A 1 C Q, A2 CSS, A3 C IR , le volume
A(A) de A sera donné par
A(P) =A(F).
Nous avons donc terminé notre démonstation. L'espace des conditions initiales contient
deux parties complémentaires P et :F de même volume (généralisé), inconnues du joueur, et
extrêmement complexes. C'est l'ignorance du joueur jointe à la très grande complexité de ces
deux parties qui le conduit à utiliser des conditions initiales également disposées dans ces
deux parties, lors d'un grand nombre de tirages, conduisant ainsi à notre conclusion d'équi-
probabilité des deux tirages.
Terminons par une question. Nous avons négligé le problème de la rotation de la pièce
autour de son axe, comment utiliser le raisonnement précedent pour en tenir compte ?
Chapitre 11
ANNEAUX ET CORPS
I. LA STRUCTURE D'ANNEAU
La structure de groupe peut être enrichie d'une seconde loi de composition. Par exemple, sur
le groupe (Z, +) est également définie une multiplication.
Définition 11.1. Un anneau est un ensemble (A,+,o) muni de deux lois de compositions
internes telles que :
1) (A,+) est un groupe abélien de neutre noté OA;
2) (A, o) est un monoïde d'élément neutre noté 1A;
3) La loi◊ est distributive à gauche et à droite par rapport à+, c'est-à-dire
EXEMPLE 11.2. Nous avons rencontré de nombreux anneaux dans le cours d'algèbre.
► Les ensembles Z et Q, pour l'addition et la multiplication usuelles, est un anneau. Voir le
chapitre 7 pour les justifications calculatoires.
► Il en est de même de (]R., +, x), (C, +, x ).
► Pour tout ensemble E, (Y'(E), ~, n) est un anneau commutatif (rappelons que Y'(E)
désigne l'ensemble des parties de E et~ la différence symétrique). En effet, on a déjà prouvé
que ( Y' (E), ~) est un groupe abélien de neutre 0, que la loi n est associative sur Y' (E)
d'élément neutre E. Il reste à montrer la distributivité de n sur ~- Soient A, B et C trois
parties de E. Utilisons les fonctions indicatrices
Or, [(MB)ti(MCl = [MB + [Mc - 2[MBnMC = [MB + [Mc - 2ITMsnc- Ainsi [M(MC)
IT(MBJti(MC), et donc An (B~C) =(An B)~(A n C).
► IRrn:. est muni de deux opérations + et x qui définissent une structure d'anneau pour
toutes fonctions f et g de IR dans IR, on pose, pour tout t réel,
1
Voir le chapitre 7 pour le détail des diverses conventions et la définition de un.
260
1
,.8
rJJ
tout n EN,
Wn = Un+ Vn et tn = UnVn,
Encore une fois, les vérifications consistent en des calculs élémentaires reposant sur la struc-
j ture d'anneau de (JR, +, x).
~ À la manière du produit direct de deux groupes, on peut définir une notion d'anneau
produit. Les vérifications sont purement calculatoires et laissées au lecteur.
(a1, ci2) EB {«{, ai} ~ (n1 ~.l ~j, 0:2:EBz tlz} et .(t11 ,a.zt®Jai,~~l =(~1 ~1 ni,ni ~zJ2)
est un anneau.
Cette proposition se généralise à n anneaux (A1, EE11, 01 ), ... , (An, EEin, 0n) par les formules
(ai, ... , un) (fi (a;, ... , a~l = (a1 EEl1 a;, ... , Un EEin a~l
et
(ai, ... , Un) 0 (a;, ... , a~)= (a1 01 a;, ... , Un 0n a~l-
En particulier, si (A,+, x) désigne un anneau et n un entier naturel non nul, An peut être
ainsi muni d'une structure d'anneau.
PREUVE.
Il faudra prendre garde à la loi o la structure d'anneau n'implique pas la régularité d'un
élément a quelconque pour la loi o.
À la régularité pour ◊
261
.
Il peut exister des éléments non réguliers pour la loi ◊ d'un anneau (A,+,◊). Par
exemple, dans l'anneau produit (&':2,œ,@l, on a (1,0) x (1, 1) = (1, 1) x (1,0) = (1,0)
alors que (1, 1) =/- (1,0).
n
, Xn dans A, on notera
n
--
..d
ü
L, Xk = X1 + · ·· + Xn et IJxk=X1◊···◊Xn
k=l k=l
Ces expressions étant bien définies par associativité des lois + et ◊. La distributivité de ◊ sur
+, ainsi que l'associativité de +, permet d'écrire sans ambiguïté que, pour tous net m dans
N*, tous X1, ... , Xn, Yi, ... , Ym dans A
L
1:(i:(n , 1:(j:(m
Xi◊Yi·
L'ensemble des règles de calcul dans un anneau (A,+,◊) permet d'établir que la formule du
binôme est valable dans A pour des éléments a et b qui commutent. Nous nous contenterons
de l'énoncer, la preuve suivant point par point celle exposée dans le chapitre 6.
PtopÔèifiÔÏi 1L5. 'Soiént'a ëtb deÏt:c ilêrnents. qui commùteni t!.':Un a~t_îèf}t, +,<>f
Alors, pour ëntier naturefrt,
Nous étudierons trois sous-structures importantes dans les anneaux : les sous-anneaux, le
groupe des éléments inversibles et les idéaux. Les deux dernières structures sont particulière-
ment importantes quand on cherche à faire de l'arithmétique sur un anneau.
262
Cette définition impose en premier lieu que les restrictions des lois + et o à B soient
internes sur B. Remarquons dès maintenant que la condition 1A = 1s n'est pas superflue
par exemple, ({OA},+, x) est un anneau mais pas un sous-anneau de (A,+,o).
Proposition 11.7. Une partie B d'un anneau {A,+:◊) est ,an sous-anneau de A
si et seulement si
1) 1;,.EB. 2}V{b,'b1fEBi,b..:;.b'EB etb~tie.13,
EXEMPLE 11.8. L'ensemble Z[i] = { a+ib, (a, b) E Z 2} est un sous-anneau de (C, +, x).
► On a 1 = 1 + 0 xi donc 1 E Z[i]. Soient z 1 et z2 dans Z[i]. Il existe a 1, b 1, a2 et b 2 dans
Z tels que z1 = a1 + ib1 et z2 = a2 + ib2. On a alors
Z[i] est appelé le sous-anneau des entiers de Gauss. Il est utile en arithmétique.
fffi~!,~!'l!:s~~}~~.,;);4èff~f!~A~~ê~~l~-~t•ri"1~r~'ti~i~n,êiu
PREUVE. Soient x et y dans A x. Comme (A,◊) est un monoïde, on sait que xoy est inversible
pour◊ d'inverse y- 1 ◊x- 1 , ainsi Ax est stable par la loi◊. Comme (A,+,o) est un anneau,
la loi de composition interne induite par ◊ sur A x est associative. Le sous-ensemble A x est
non vide car il contient 1A qui est l'élément neutre de (A x , ◊). De plus, pour tout x dans A x,
x- 1 E Ax car x- 1 est inversible d'inverse x. Le monoïde (A,o) est donc un groupe. ■
Les éléments inversibles d'un anneau (A,+, o) sont parfois appelés les unités de (A,+,◊).
On ne confondra pas les ensembles A* et A x respectivement ensemble des éléments non nuls
de A et ensemble des unités de A.
Les sous-ensembles {OA} et A d'un anneau (A,+,◊) sont toujours des idéaux, appelés
les idéaux triviaux de (A,+,◊). Si A est commutatif, pour tout a E A, l'ensemble aA =
{a◊ a' 1 a' E A} est clairement un idéal de A. Il faut connaître l'exemple fondamental de
l'anneau (Z,+, x).
EXEMPLE 11.12. Les seuls idéaux de l'anneau (Z, +, x) sont les sous-ensembles de la forme
mZ, avec m E N.
► Un idéal Ide (Z, +, x) étant en particulier un sous-groupe, il existe m EN tel que I = mZ.
Il suffit donc de prouver que les sous-groupes additifs mZ sont des idéaux. Soient n E Z et
a E mZ : il existe k E Z tel que a = km et donc an = na = knm E mZ. L'ensemble mZ
est donc un idéal de (Z, +, x ).
264
PREUVE.
EXEMPLE 11.17. Dans l'anneau produit (Z 2 ,EB,®), on a (1,0) ® (0, 1) = (0,0). Les élé-
1 ments (1, 0) et (0, 1) sont donc des diviseurs de zéros de cet anneau.
Définition 11.18. On appelle anneau intègre tout anneau vérifiant les trois propriétés
suivantes :
1) (A, +,o) est commutatif;
2) 1A/.0A;
3) (A,+,o) n'admet aucun diviseur de zéro.
Autrement dit, un anneau (A,+,◊) est intègre si et seulement s'il est commutatif, s1
1A /. 0A et si
\f(a, b) E A 2 , (ao b = 0A) =}(a= 0A ou b = 0A).
Par exemple, (Z, +, x), (Q, +, x) et (JR, +, x) sont intègres, ce qui n'est pas le cas de l'anneau
produit (Z 2 ,EB,®).
Dans un anneau intègre, on note plus simplement l'opération◊ de manière multiplicative
au moyen du symbole x par analogie avec (Z, +, x ). On notera même ab le produit a x b
afin d'alléger les démonstrations.
Définition 11.19. Soient (A,+, x) un anneau intègre, a et b deux éléments de A. On dit
que a divise b dans A s'il existe c E A tel que b = ac. On note alors a I b et l'on dit de
manière équivalente que b est un multiple de a.
Proposition 11.20. Dans un anneau intègre (A,+, x), (a.lb et .bJn} stet seulement si
3u E Ax tel que a. = bu. · · · ··
PREUVE. Raisonnons en deux temps.
(===}) Il existe a' et b' dans A tels que a = ba' et b = ab', d'où a = ab'a' et donc
a(lA- b'a') = 0A. Comme (A,+, x) est intègre, on en déduit que a= 0A ou b'a' = 1A. Si
a= 0A, on ab= ab'= 0A, Si a 1- 0A, on a a'b' = b'a' = 1A, donc a' et b' appartiennent à
Ax et donc :lu E Ax tel que a= bu. ■
266
Définition 11.21. Un anneau (A,+,o) est dit principal lorsque les trois propriétés sui-
vantes sont vérifiées :
1) (A,+,o) est commutatif;
2) lAIOA;
3) tous les idéaux de (A, +,o) sont de la forme aA, avec a dans A.
EXEMPLE 11.22. (Z, +, x) est principal d'après l'exemple 11.12. Les seuls idéaux de l'an-
1 neau (IR,+, x) sont les idéaux triviaux {O} et IR, (IR,+, x) est donc principal.
L'anneau principal intègre est un bon cadre pour fonder une arithmétique, car il permet
de définir simplement des notions de pgcd et ppcm 3 . Nous verrons dans la suite de cet ouvrage
que l'anneau des polynômes à coefficients dans IR ou C est un anneau principal intègre.
V. LA STRUCTURE DE CORPS
Définition 11.23. Un corps est un ensemble (K, +, x) muni de deux lois de compositions
internes telles que
1) (K,+, x) est un anneau commutatif 4 ; 3) (K*, x) est un groupe.
2) lK ?"OK;
2
Voir la proprosition 11.20.
3
Respectivement plus grand diviseur commun et plus petit multiple commun.
267
Un corps est donc un anneau commutatif (K, +, x) dont tous les éléments non nuls sont
inversibles pour x et tel que 1K -=fa OK.
EXEMPLE 11.24. (Q,+, x), (lR,+, x) et (C,+, x) sont des corps. (Z,+, x) n'est pas un
1 corps car, par exemple, 2 n'est pas inversible dans Z pour la multiplication usuelle x.
PREUVE. La loi x étant commutative et 1K -=fa OK, il suffit de prouver que (K, +, x) n'admet
aucun diviseur de zéro. Soient x et y dans K tels que xy = OK. Supposons x -=fa OK, alors x
--
..d
u
est inversible et x- 1 (xy) = x- 1OK = OK. Ainsi (x- 1x)y = 1KY = y = OK et (K, +, x) est bien
w~. ■
Un sous-ensemble l d'un corps (K, +, x) est appelé un sous-corps de K lorsque (l, +, x) est
un corps. On déduit sans peine des résultats sur les sous-anneaux la caractérisation suivante
des sous-corps.
VI. EXERCICES
4
Dans Je ca.s où la loi x n'est pa.s commutative, la structure (K, +, x) est appelée un corps gauche.
268
11.7.
Deux plus deux font zéro, mais deux fois deux font trois
Nous allons définir une structure de corps sur l'ensemble des entiers naturels! Dans un certain
sens, cette structure est la plus simple possible. En effet, à chaque fois que nous aurons le
choix dans la définition d'un produit et de la somme de deux entiers donnés, nous prendrons
systématiquement la plus petite valeur permise. Le plus étonnant est que l'on obtienne par
un procédé aussi simple une structure aussi riche. On peut voir ce corps comme un bijou des
mathématiques, que seul un maître artisan a su ciseler. Notre construction s'inspire en effet
très largement de celle des nombres «surréels», inventés par le mathématicien anglais John
Conway, et plus particulièrement du chapitre 6 du livre intitulé On numbers and games5 .
On ne peut qu'encourager le lecteur à se procurer cet ouvrage, qui contient bien d'autres
merveilles.
Bien évidemment, on se doute que les opérations que nous allons définir ne sont pas les
additions et multiplications usuelles. Pour bien les différencier, nous noterons nos nouvelles
opérations 0 et EB. Il faudra être attentif et oublier nos habitudes de calcul dans (N, +, ·).
oœo =O.
Si on veut que (N, EB) soit un groupe, on vient de décider que O est son élément neutre. On
pose donc n EB O = 0 EB n = 0 pour tout n E N. Considérons maintenant la somme 1 EB 1. La
seule valeur interdite est 1. En effet, si 1 EB 1 = 1, on pourrait additionner à chaque membre
de l'égalité l'opposé de 1 (pour la loi EB), noté el. On aurait donc
0 = (el) EB 1 = (el) EB (1 EB 1) = ((e 1) EB 1) EB 1 = 0 EB 1 = 1,
ce qui est impossible. En revanche, la valeur zéro est libre. Fidèle à notre principe, nous posons
1 EB 1 = O.
De même,
2 EB 1 ::/= 0 car sinon, on aurait 2 EB 1 = 1 EB 1, puis 2 = 1 en simplifiant par 1.
2 EB 1 ::/= 1 car sinon, on aurait 2 = 0 en simplifiant par 1.
2 EB 1 ::/= 2 car sinon, on aurait 1 = 0 en simplifiant par 2.
La première valeur libre est 3. Nous posons donc en retenant notre souffle
1 EB 2 = 2 EB 1 = 3.
5
J.H. Conway, London Mathematical Society Monographs, No. 6. Academic Press, 1976, 238 p.
On considère ensuite la somme 2 EB 2.
2 EB 2 =/- 2 car sinon, on aurait 2 = 0 en simplifiant par 2.
2 EB 2 =/- 3 = 1 EB 2 car sinon, on aurait 2 = 1 en simplifiant par 2.
Mais les valeurs O et 1 sont libres. On choisit la plus petite possible en posant
2 EB 2 = O.
Enfin, si on veut que (N, EB) soit un groupe abélien, les choix de 2 EB 3 et de 3 EB 3 sont forcés.
En effet
2 EB 3 = 2 EB (1 EB 2) = 1 EB (2 EB 2) = 1 EB O = 1;
3 EB 3 = (1 EB 2) EB (1 EB 2) = (1 EB 1) EB (2 EB 2) = 0 EB O = O.
Pour résumer, on peut dresser la table d'addition pour les sommes que nous avons calculées.
EB 0 1 2 3
0 0 1 2 3
1 1 0 3 2
2 2 3 0 1
3 3 2 1 0
On observe que la loi EB est stable sur l'ensemble N4 = {O, 1, 2, 3}. De plus, cet ensemble, muni
de la loi interne définie par EB, est un groupe abélien, ce qui justifie a posteriori nos choix.
Pour voir cela, il suffit par exemple de considérer l'application <p : N4 -+ 71,/271, x 71,/27!, définie
par
cp(O) = (O, 0) ; cp(l) = (1, O) ; cp(2) = (0, 1) ; cp(3) = (1, 1).
On remarque en effet que <p est bijective et on laisse au lecteur le soin de vérifier que
cp(x EB y)= cp(x) + <p(y).
Les axiomes de groupe se vérifient alors sur (N4 , EB) en les transportant à l'aide de <p dans le
groupe (7!,/27!, x 71,/271,, + ).
2. La multiplication. Comme O est l'élément neutre de (N, EB), si on veut que (N, EB, 0) soit
un corps, on a pour contraintes que
Vn EN, 00n=n00 =0;
V(n, m) E N2, (n =/- 0 et m =/- 0) # n 0 m =/- O.
Ainsi, seule la valeur O est interdite pour le produit 1 0 1. On pose donc
Cette relation montre que l'on a choisi 1 pour élément neutre de la multiplication. On pose
donc 1 0 n = n 0 1 = n pour tout n E N. Nous en déduisons un corrolaire intéressant. Le
lecteur attentif a pu en effet noter que l'on a 1 EB 1 = 2 EB 2 = 3 EB 3 = O. Il est naturel de se
demander si n EB n = 0 pour tout n E N. La réponse est oui, sous réserve que (N, EB, 0) soit
au moins un anneau. En effet, pour n EN, on a
n EB n = (1 0 n) EB (1 0 n) = (1 œ 1) 0 n = 0 0 n = O.
Cela signifie que dans le groupe (N,EB), tout entier est son propre opposé! On a donc
VnE N, n=en.
Il en résulte que pour tous n, m EN, on a
(nEB m) 20= (nEBm) 0 (nEB m) = (nEB m) 0 (ne m) = n 20 e m 20 = n 28 EB m 20 .
Autrement dit, l'application cl>: N-----, N définie par cp(n) = n 20 = n 0 n est un morphisme
de groupe pour la loi EB.
Considérons le produit 2 0 2.
20210 car sinon, on aurait 2 = O.
20211 car sinon, on aurait 328 = (2 EB 1)28 = 228 EB 1 = 1 EB 1 = 0, puis 3 = O.
20212 car sinon, on aurait 2 0 (2 0 1) = 0, puis 2 = 1 ou 2 = O.
On choisit donc la plus petite valeur possible et on pose
Enfin, les produits 2 0 3 et 3 0 3 sont forcés par nos choix précédents. En effet
Pour résumer, on peut dresser la table de multiplication que nous venons de définir.
0 0 1 2 3
0 0 0 0 0
1 0 1 2 3
2 0 2 3 1
3 0 3 1 2
Ici, on observe que N4 = {0, 1, 2, 3} est stable pour la loi 0 et que (N4 \ {0}, 0) est un groupe.
Pour voir ce dernier point, il suffit de considérer l'application lj, : {1, 2, 3}-----, Z/3'11, définie par
lj, ( 1 ) = Ï, lj, (2) = 0 et lj, (3) = 2, de noter que lj, est bijective et de vérifier que
R~l~. ït.~'f;
....· > . • ,
A4dition: •···· .·..... •..... ,
$i x~:}h ~t1fÎI <2nl #r~ X$lÎ. ·•·•estitf;omme >
ùsuellex·fy,'~ais
·•
i{i:l,;t.
Multîil,ication :
Six =2!2,"} èt si y <x, àlors 'lC(!)îJ'eSt·liiproduit usuèZ.xy,·mais-x©x Sx./2:. · =
Le lecteur devra être vigilant pour vérifier que nous n'utiliserons pas cette méthode de calcul
dans les preuves avant d'avoir établi les propriétés de (N, œ, 0). Bornons-nous ici à montrer
que ces deux règles permettent effectivement de faire tous les calculs souhaités, une fois que
sera connue la structure de (N, œ, 0 ). Nous supposons donc ici, et seulement ici, que (N, œ, 0)
est un anneau.
Rappelons que tout entier n EN peut s'écrire sous la forme
14 œ 12 = (8 + 4 + 2) œ (8 + 4) = 2.
On a éliminé 8 = 2 3 et 4 = 2 2 .
- Pour calculer un produit, on utilise les axiomes de commutativité, d'associativité du produit
et la distributivité sur l'addition. On se ramène ainsi à calculer des produits de la forme 2n02m.
Notons ap = 22P pour tout p EN. En décomposant n = 2"'1 + · · • + 2<Xi>, on otient donc par
un raisonnement analogue à celui de l'addition
d'après la règle 11.27 de multiplication. Le produit 2n02m s'en déduit aisément. Par exemple
Notation. Dans tout ce qui suit, on note pour tout entier naturel n
n = min (N \ (?)) .
Notation. Pour toute partie AC N, on note ppne(A) = min(N\A) le plus petit non élément
de A. On convient que ppne(N) = oo.
4. Définition par récurrence de la loi Ef). Nous allons définir une loi additive en nous
efforçant de garantir la régularité des translations, qui est une propriété très importante
d'une loi de groupe : on veut que n EB p-/- n EB q et que p EB n-/- q EB n pour tous les couples
d'entiers (p, q) tels que p -/- q. Bien sûr, il suffit d'imposer ces conditions seulement pour
p < q, puisque les rôles de p et q sont symétriques.
Définition 11.29. Soient n et m deux entiers naturels. La somme n EB m est le plus petit
des entiers différents des entiers de la forme n' EB m ou n EB m', avec n' < n et m' < m.
Autrement dit
PREUVE. Soit n, p, q trois entiers naturels tels que p -/- q. Les rôles de p et q étant symé-
triques, on peut supposer que q < p. Par définition,
PREUVE. Par définition, ~ = {n' EB m In' E 9(n)} U {n EB m' 1 m' E 9(m)} sous-définit
n EB m. De plus, on a 9(m) C ~met 9(n) C ~n, donc
Or, la proposition 11.30 montre que nEBm !/. {nEBm' m' E ~m} car m
1 !/. ~m- De même, on
an EB m !/. {n' EB m I n' E ~n} car n !/. ~n- Il en résulte que
Comme la partie ~ sous-définit l'entier n EB m, les conditions (11.1) et (11.2) montrent que
{n EB m' 1 m' E ~m} U {n' EB m I n' E ~n} sous-définit l'entier n EB m, ce qui prouve notre
assertion. ■
► Élément neutre.
On raisonne par récurrence sur n EN. On a déjà vu que 0œ0 = O. Soit n E N\{0}. On suppose
que pour tout k < n, on a k EB 0 = k. Alors, par définition, la partie {n' EB 0 In' < n} U 0 =
{n' 1 0 ~ n' ~ n-1} sous-définit n EB O. Il en résulte que n EB 0 = ppne{0, 1, ... , n-1} = n.
► Commutativité.
On raisonne par récurrence sur N = n + m. On a bien n EB m = m EB n pour n = m = O. Soit
N E N\ {0}. On suppose que pour tout (p, q) E N2 tel que p + q < N, on a p EB q = q EBp. Soit
net m deux entiers tels que n+m = N. Alors pour n' <net m' < m, on an' EBm = mœn'
et n EB m' = m' EB n par hypothèse de récurrence. Il en résulte que
{n' EB m In' E 9(n)}U{nEB m' m' E 9(m)} 1
Nous sommes maintenant en mesure de prouver la règle 11.27 d'addition. Nous avons déjà
montré que n EB n = 0 pour tout n E N dans la proposition précédente.
Pri,p~1tîô~,1.1~ss.; P~i~lli;til'\:: Nif;1it\ît<z~~~lôri i 4 (t) i ;;.<2~,+,i; · ·
PREUVE. On raisonne par récurrence sur le couple ( a, n), pour l'ordre lexicographique de
N2 . Pour a = 0, il est immédiat que 1 EB 0 = 1. Soit a ~ 1 et soit 0 :( n < 2a. On suppose
que pour tout couple (b, m) tel que 0 :( b < a et m < 2b, ou tel que b = a et m < n, on
a 2b EB m = 2b + m. Ainsi, il est facile de voir que cette hypothèse entraîne que, pour tout
m<2a,
m = 2a1 + · · · + 2av = 2a1 EB · · · EB 2av,
où a> a1 > !Xz > ··· > <Xp ~ 0 sont uniquement déterminés et correspondent à l'écriture de
men base 2.
a-1 a-1
Écrivons m = L. mk2k et n = L. nk2\ avec mk, nk E {0, 1} pour 0 :( k <a.Alors
kaa-0 kaa-0
a-1 a-1 a-1
m EB n = ffi(mk2k EB nk2k) = ck2k = E9 L.
ck2k par hypothèse de récurrence,
k=O kaa-0 kaa-0
On en déduit que m EB n < 2a. Notons Nza = {k 1 0 :( k < 2a}. Comme l'application
Nza -, Nza : m H m EB n est injective et que N2a est un ensemble fini, cette application est
bijective et en particulier
{m EB n I m < 2a} = {0, 1, ... ,2a - 1}.
De plus, l'hypothèse de récurrence montre que pour m < n, on a 2a EB m = 2a + m. Aussi
{2a EB m 10 :( m < n} = {2a,2a + 1, ... ,2a + n -1}.
En résumé,
2a EB n = ppne({0, 1, ... , 2a - 1} U {2a, 2a + 1, ... , 2a + n - 1})
= ppne{0, ... , 2 a + n - 1}
=2a+n.
On obtient ainsi la relation souhaitée au rang suivant, ce qui démontre la proposition. ■
5. Définition par récurrence de la loi 0. Nous allons définir une loi multiplicative en
nous efforçant de respecter la propriété 6 principale d'un anneau intègre : on veut que (ne
n') 0 (mem')-/- 0 sin-/- n' et m-/- m'. Comme dans le cas de l'addition, on peut se borner
par symétrie à ne considérer que les couples (n', m') tels que n' <net m' < m. Dans toute
la suite, on supposera dans les formules que la loi 0 est prioritaire sur EB.
Définition 11.34. Soient n et m deux entiers naturels. Le produit n EB m est le plus petit
entier différent des entiers de la forme n' 0 m EB n 0 m'en' 0 m', avec n' < n et m' < m.
PREUVE. Soit n, p, q trois entiers naturels tels que p -/- q et n-/- O. Les rôles de pet q étant
symétriques, on peut supposer que q < p. Mais par définition, la partie
çg ={n' 0p EBn0p' en' 0p' n' <net p' < p}
1
Proposttiôn- 1:1'.:i6é; Soi,ent .·n •. et m'deux entiê'ts ~iuretset .~iê,.N•Ji(~miC .·N de'tl$
parties qùi sous:.âéfini~ent n etm, respictivément, AfÔi-Sc • . . .
· · ·. r . t •· ,.
{n 0 m EB n. 0 m. en 0 ni I m
.J , €· !.îtm.....et ·n i',€ Jî7n.}' Sl'JYts~d~jln1,t
'·\/ •. . .· ..·.
ll: 0 m;
~êînë tfit7:
t•etîsernüÎ,.fN) inùhi/<le~ lois œ' et e; ·e~t ûn antifau îri:~; d/iÜiiil lé ~tnnM/1:
6
Dans toute formule, on peut employer indifféremment les signes Ell ou 8 car Sn = n pour tout n E N. On
gardera parfois les signes 8 en souvenir de la formule d'origine dans un anneau quelconque.
La commutativité et l'associativité de 0 se démontrent par des récurrences analogues à celles
de l'addition - c'est un bon exercice pour le lecteur que de les rédiger avec soin. Concentrons-
nous sur la distributivité de la multiplication par rapport à l'addition.
On raisonne par récurrence sur N = n + p + q. Pour N = 0, on a bien O0 (0 EB 0) = 0 0 0 =
0 = 0 0 0 EB O0 O. Soit N > O. On suppose que r 0 (s EB t) = r 0 s EB r 0 t sir+ s + t < N.
Les trois parties
ÇJn0 p ={n' 0p EBn0p' en' 0p' n' <net p' < p},
1
ÇJ = {s EB n 0 q I s E çgn0p} U {n 0 p EB s I s E çgn0q}.
PREUVE. Il s'agit de vérifier que tout élément O < x < Un est inversible dans Nan. Or,
l'application Îx : Na\ {0} -1 Na\ {0} définie par Îx(-Y) = x 0 -y est injective d'après la
proposition 11.35. Comme l'ensemble Na \{O} est fini, l'application Îx est donc aussi surjective.
Notamment, il existe x 0 E Na\ {0} tel que Îx(x 0 ) = 1, ce qui montre que x a pour inverse le
nombre Xo E Na. ■
L~~•l:lAlS. $Qif;1},J;:N,. Si.N<i,i ·e,t .tm cufP.avalo'.l's,.:,
v{x'., 1:1} eNi> x 0 a'n. <irv ~o~+ïk . .. .
a~ . .limemfJre•àe àrottf~t f~-altâvicîJs Ôfhati6~Wsuèllis"itê.~;1&n JHi~ié~Vi'âppli~·
cation
..
·•· '••·.: («, fii ·i,.,nt0a.tt $ . p ·est·. ûn'iitmîo'f'/iffisifiê!41éi'flrovi1m'IJ•âdJ
A.· :~a.,.· '. ;_;•..N•·. Gn+t • ' . . ·. '
TJtifs> ·
•
PREUVE.
► Il est immédiat que A est un morphisme de groupes. Soit (x, y) E N~n tel que A(x, y)= O.
Alors, six cf. 0, on aurait
X0 Un EB 1J = 0 #Un= x- 1 01},
où x- 1 serait l'inverse de x dans N a-n· On aurait donc Un E Nan, ce qui est absurde. Ainsi
x = 0, puis y = 0 0 0 0 x = O. Le noyau de A est donc nul : le morphisme de groupe A est
injectif et donc bijectif car Nan est un ensemble fini.
► De plus, une récurrence facile sur x montre que x0 Un ( XUn- En effet, six'< x et u < Un,
alors x 0 u 0 u 0 x' E Nan. Si on suppose que x' 0 Un ( x'un, alors
X1 0 Un EB X 0 U 0 U 0 X1 ( X1 Un+ Un - 1 = XUn - 1.
On en déduit que
x0 Un ( ppne{x' 0 UnEBX0 ue u0x' 1x' < xu < Un} ( ppne{k 10 ( k ( XUn -1} = XUn.
On a donc A(x, y)= x0 UnE&Y ( XUn +y< Un pour tout (x, y) E Nan. Comme l'application
A est bijective, l'égalité s'ensuit. ■
$eil)t {:t~?~· stiPJ7ô~ê11•e Niii ,~st: .'Lffl •cûtps 'ét ([ite '/liiur iéutx
. $.i;i~.f.;fdti'
PREUVE.
► On note cp : N --+ N : x H x 20 . On a vu que cp(x E& y) = cp(x) EB cp(y). Comme on a
immédiatement cp(x 0 y) = cp(x) 0 cp(y) et cp(l) = 1, on en déduit que cp est un morphisme
d'anneaux. Notons que cp(x) = 0 # x 20 = 0 # x = O. Ainsi, cp est un morphisme injectif.
De plus, comme Nan est un corps par hypothèse, l'application cp induit un isomorphisme de
corps cp : Nan --+ Nan. Nous venons donc d'établir que pour tout l3 E Nan, le polynôme
X2 EB l3 E Nan [X] a une racine double. Autrement dit, tout élément de Nan a une unique racine
carrée.
► Par hypothèse, on peut définir 1j,,: Nan --+ Nan/2 en posant lj,,(x) = x 20 E& x. De plus,
Chaque point de l'image de 1j,, : Nan --+ Nan/2 a donc exactement deux antécédents. Il en
résulte que 1j,, est surjective. Autrement dit, {x 20 EB x 0 ( x < un} = {k 0 ( k < un/2}.
1 1
Ainsi, tout polynôme de la forme X2 EB X EB f3 avec O ,::; f3 < Un/2 a ses deux racines dans le
corps Nan·
► Pour résumer les deux points précédents, pour tout couple (ex, /3) < (1, un/2) dans l'ordre
lexicographique de N2, le polynôme X2 EB exX EB f3 a toutes ses racines dans Nan. Comme
Un r/. Nan, on en déduit que a~0 EB ex 0 Un EB f3 -=/ 0, soit encore a~0 -=/ ex 0 Un EB /3. Mais
ex 0 Un EB f3 = exun + f3 prend exactement toutes les valeurs 0, 1, ... , Un+ ( Un/2 - 1) quand
( ex, /3) décrit l'ensemble des couples d'entiers tels que ( ex, f3) < (1, Un/2). Donc
2 Un_3
Un0 ): Un+
2 - 2un.
► Par hypothèse, le polynôme X 2 EB X EB Un/2 n'a pas de racine dans Nan. Aussi il n'est pas
de la forme (X - b) 0 (X - &') = X 2 0 (b EB &')X EB b 0 &',avec(&,&') E N;n. Autrement dit,
D'après le lemme 11.39, on en déduit que UnEB 0ï -=/ (bEBb')0Un0b0b' pour tout (b, b') E N;n.
Donc a~0 = ppne{(b EB &') 0 Un 0 b 0 &' 1 b < Un, &'<un},::; Un EB ,.., ce qui démontre, par
double inégalité, l'identité annoncée. ■
Remarque. N est l'union sur n EN des corps finis Nan, de cardinal 2( 2nl_ On peut facilement
en déduire (voir la preuve du lemme 11.40) que tout entier admet dans (N, EB, 0) une unique
racine carrée. Par exemple, v'2. = 3 comme le montre le tableau 11.2. On imagine que les
pythagoriciens auraient adoré vivre dans un monde modélisé par (N, EB, 0).
Le corps (N, EB, 0) possède une autre propriété remarquable. Comme tout entier admet
une racine dans ce corps, les esprits vifs auront peut-être conclu que tout polynôme de degré
à coefficients dans N admet une racine. En effet, il est bien connu que tout polynôme de la
forme
P = aX 2 + bX+c
avec a-/- 0, admet pour racine
-b ± ✓b 2 -4ac
X± = ------,2:-a_ __
Signalons ici que les opérations sont effectuées dans le corps (N, Ell, 0). On devrait donc plutôt
écrire que l'on s'attend à ce que P ait pour racine
b Ell ✓b 28 - 4 0 a 0 _c
Xo = ____ 2_0_•_a_ _ _ (11.3)
Cette formule a un sens car 2 et a sont non nuls, de sorte que le produit 2 0 a est non nul
et donc inversible. Pourtant, cette formule n'est pas correcte. En effet, quand on regarde la
démonstration de la formule des racines du binôme de Newton, on se rend compte que le
facteur 2 du dénominateur n'est pas donné comme tel, mais qu'il résulte de la somme de deux
monômes dans le développement du polynôme
Proposition 11.42. Pour .tout entier n ~. 0, on peut trouver un pal'!)n~e d,u J~if,J,,e
degré. i.coeffic~ dans le. corps Nan so,ns mcine ~tiSN'iln, .·~ tow, jkil~111,e d~/Îf~~'IJ}~
degré (I; coeffiéiènts dans Nan 0, ses racin,:s dans Nu..+1, . .. . . 'k •
Nous ne démontrerons pas ce dernier énoncé car nous ne disposons pas de l'outil permettant
de traiter cette question, c'est-à-dire la théorie de Galois, que nous verrons en troisième année.
En somme, N est le « plus petit » corps qui contient N2 et tel que tout polynôme du deuxième
degré à coefficients dans N admet ses racines dans N. On dit que N est quadratiquement clos.
Chapitre 12
ARITHMÉTIQUE DANS Z
Rappelons que l'ensemble aZ est défini par aZ = {ak Ik E Z} et que, pour tous entiers relatifs
a et b, on pose
Nous utiliserons à plusieurs reprises le résultat suivant, démontré dans le chapitre 11.
Plus précisément, pout tout idéal I de l'anneau (Z, +, x), il existe un unique m E N tel
que I = mZ.
Bien que déjà définie dans le chapitre 11 sur un anneau intègre quelconque, nous rappelle-
rons dans ce qui suit la relation de divisibilité sur l'anneau (Z, +, x) ainsi que ses principales
propriétés.
Ainsi, 0 est divisible par n'importe quel entier relatif et le seul entier relatif divisible par
0 est O. Les seuls diviseurs dans Z de 1 sont -1 et 1. Pour tous entiers relatifs a et b, on a
clairement a I b si et seulement si bZ C aZ.
Remarque. La relation de divisibilité est réflexive et transitive mais pas antisymétrique sur
Z : en effet, a I b et b I a si et seulement si a= ±b.
Notation. D'une manière générale, nous noterons ~a, ,... ,am l'ensemble des diviseurs communs
à des entiers relatifs a 1 , ... , Um donnés. Ainsi, ~a désigne l'ensemble des diviseurs de a et donc
~a, ,... ,am = ~a, n ... n ~Um. On note de même Aa, .... ,am l'ensemble des multiples communs
à des entiers relatifs a 1, ... , am donnés. Ainsi, Au, .... ,am = Aa, n · · · n Aam. L'ensemble Au
sera de préférence noté aZ.
Deux entiers ont les mêmes diviseurs si et seulement s'ils sont égaux ou opposés. Nous
utiliserons à plusieurs reprises ce résultat élémentaire.
i
si a= ±b. Test 12.4.
Test 12.2. Soit n E N*. Montrer que 9 I 1on - 1.
La relation de divisibilité est-elle une relation
.2 d'ordre sur N ?
rn
1
~ I.2. Le théorème de la division euclidienne
Le théorème de la division euclidienne est une mise en forme de la division enseignée et
pratiquée dans les petites classes, celle que l'on pose de la manière suivante
701 4
400
----
175
301
280 ams1 701 = 4 x 175 + 1.
21
20
o Commençons par prouver l'unicité d'un couple (q, r) tel que a = qb + r et O ( r < b
soient deux couples (q 1, r 1) et (q 2, r 2) vérifiant ces conditions. Alors a= q 1b+r 1 = q 2b+r2,
d'où r2 - r1 = b(q, - q2); ainsi b divise r2 - r,. Puisque O ( r2 < b et O ( r1 < b, on en
déduit que -b < r 2 - r 1 < b. Le seul multiple de b dans ] - b, b [ étant 0, on a r 2 = r 1.
Puisque r2 -r, = b(q, - q2) = 0 et b cp 0, q, = q2.
o Soit E = {k E Z I kb ( a}. Cet ensemble est une partie non vide et majorée de Z : si a? 0,
0 E E et a majore E (car b? 1); si a< 0, a E E et O majore E. L'ensemble E admet donc
un plus grand élément q. On a donc qb ( a< ( q + 1)b et en posant r = a - bq, on a bien
0 ( r < b. ■
Remarque. On peut même préciser que si a EN, le quotient q dans la division euclidienne
de a par b est un entier naturel. En effet, si a ? 0, on a vu au cours de la preuve précédente
que q = sup(E) et que O E E. On a donc q = sup(E) ? O.
On déduit de l'unicité dans le théorème précédent que b I a si et seulement si le reste dans
la division euclidienne de a par b est nul.
283
iil~Wif~~~i{,S-~:.,a,~~•·Onditq.¾i,'0i/i'<i.·Mue,~dn,
PREUVE. Notons r 0 le reste et q 0 le quotient dans la division euclidienne den par b, puis,
\ln? 1, notons rn le reste et qn le quotient dans la division euclidienne de qn-l par b. D'après
la remarque de la page 282 sur la division euclidienne, on sait que les deux suites (rnlnEN et
( qnlnEN sont à valeurs dans N.
o Unicité : les ai sont uniques car, en cas d'existence, on a clairement Vk ~ m, ak = rk et
Vk? m + 1, rk = O. L'entier m est donc le plus grand entier naturel k tel que rk cf. O.
o Montrons par l'absurde qu'il existe un entier n 0 pour lequel qll-0 = O. Si ce n'était pas le
cas, on aurait pour tout n? 0, qn = bqn+l + fn+l avec O ( fn+l d'où bqn+l ( qn et comme
qn+l > 0 et b ? 1, qn+l < qn. La suite ( qn)nEN serait donc strictement décroissante ce qui
est absurde car il s'agit d'une suite d'entiers naturels.
◊ Existence : soit n 0 le plus petit entier naturel tel que q11-0 = O. On a alors, pour tout
0 ( k ( no, qk = bqk+T +rk et q11-0 = 0 d'où n = r 0 +r1b +r2b 2 + ... +r11-0b11-0. Le nombre
r11-0 n'est pas nul car q11-0-l = bq11-0 + r11-0 = r11-0 et q11-0-l cf. 0 par définition de n 0 • ■
284
Lorsque n est nul, la relation de congruence modulo n coïncide avec la relation d'égalité
sur Z. Un entier relatif m est divisible par n si et seulement si m = 0 [n). Si q et r désignent
respectivement le quotient et le reste dans la division euclidienne de a par b -1- 0, on a a= r [b)
mais également a = r [q). On retiendra plus précisément le lemme suivant.
Lén:ünt:i :12.8, ~ ii,~ r[l>J âv'eclt e Nf •et O~ ,-:< 11, aJbrs T:~est le. ~të dàns la diwnon
eucli.die:nne ~ a paib.
PREUVE.
1) Supposons que a= b [n] etc= d [n]. Comme ac - bd= c(a - b) + b(c - d) et que n
divise a - b etc - d, n divise aussi ac - bd, donc ac= bd [n].
2) Supposons que a = b (n] et c = d [n]. Comme a + c - (b + d) = ( a - b) + (c - d) et que
n divise a - b etc - d, n divise aussi a+ c - (b + dl, donc a+ c = b + d [n].
3) C'est un cas particulier del) avec c = d = k.
4) La propriété se démontre sans peine par récurrence sur k EN* à partir du 1). ■
Les congruences évitent bien des lourdeurs et permettent d'aboutir à des résultats d'arith-
métique avec beaucoup d'élégance. Écrire a = b [n] évite le recours à une variable entière
k : il existe k E Z tel que a = b + kn. Par exemple, on pourra utiliser les congruences afin
de déterminer le chiffre des unités d'un grand nombre : sin = am ... a1ao 10 , c'est-à-dire
n = ao + a 1 10 + ... + am 1om, on a n = ao (1 0].
77
EXEMPLE 12.11. Déterminons le chiffre des unités de 7( l_
► Il faut commencer par étudier le comportement des puissances de 7 modulo 10 : on a
successivement 72 = -1 [10] et 74 = 1 [10]. On aura donc tout intérêt à poser la division
77
euclidienne de 77 par 4 : 77 = 4q+r avec 0 ,,;; r < 4. En effet, 7( l = 74 q+r = (74 )q?T = ?T [1 0]
4
car (7 ) q = 1q = 1 (1 0]. En fait, seule la valeur de r importe. Il suffit donc de considérer les
2 7
puissances de 7 modulo 4 : 72 = 1 [4] et donc 76 = (7 ) 3 = 13 = 1 [4], d'où 7 = 7 = 3 [4].
77
On a par conséquent r = 3 puis 7( l = 7 = -7 3 = 3 [10]. Le chiffre des unités de 7( 77 l est
donc 3.
1
-g
..8
II.2. Application aux critères de divisibilité
<Il
~
Pro~~t~1f2:ltk Soit.n· =,•ttm.; :'ttfdb 1ô- tJn â altmi · ·..··. . .·. •
~ !} ·J'fp,.~ ~. .!et11ênt 1-L~ (;;Jo,2,.t,·6, tJ, ~) .ffn,sifît ~~~.ai 9:lqe *.,,;-tr Ltrmt
i a) lin. si et ~ulem.en.tsi. 31 ~ -f-, .,+ Uni,
- S) 41 n si et eeul~mimt si 4 l 0.1 ao- 1e, ••·· _6} t'ît~si ef~~~ents,Jlltt~1-:.~1+:./.r
t-..:=1~m.tt1WF' r:•; · ,✓• l:•r :I,it?.::
4) Sltt siet~ntJâô;~;il ~··llt>='S/
PREUVE. L'ensemble aZ + bZ est un idéal de (Z, +, x) en tant que somme de deux idéaux
de (Z, +, x), d'où l'existence d'un unique entier naturel m tel que aZ + bZ = mZ. ■ N
rJl
L'appellation PGCD mérite d'être éclaircie. Elle sous-entend deux propriétés : al\ b est ~
un diviseur de a et b, et il s'agit du plus grand (au sens de la relation d'ordre de la divisibilité 1 (l)
sur N) des diviseurs entiers naturels communs à a et b. La proposition suivante résume ces g
•(l)
1
deux propriétés.
P\'Ôl)O$itiii)n 12.l,5. &rient a èt b .®ris z. IJ11, e,itier retati}d est. 'Un dîrMfur .commun de
aetbsi~ ~ulement.si,d•inAo,.,Atitremtmi dit, S,4 çy,~.~ai\'lt, .... c-i
......
..d
ü
PREUVE. Raisonnons en deux temps.
(4==) Il suffit de prouver que a J\ b divise a et b. Comme aZ + bZ = (a J\ b )Z et que aZ et
bZ sont contenus dans aZ + bZ, on a aZ C (aAb)Z et bZ C (aAb)Z, ce qui signifie que
aAblaet aAblb.
(===}) Supposons que d divise a et b. Comme ( a J\ b )Z = aZ + bZ, il existe (u, v) E Z 2 tel
que a/\b = au+ bv : d divise donc également a/\b. ■
L'algorithme d'Euclide permet de calculer le PGCD de deux entiers relatifs par divisions
euclidiennes successives. Il est fondé sur le lemme suivant.
~i~ . •···.t~<~.tifn~fttiitWt'ilJ;/:;::1::?{i.~~fi}
On <t âliirl âXb ± no-1. . .
1' . . .
ftl~~t!it:rt
1
Voir la remarque de la page 281.
288
PREUVE. Les nombres r 0 , r 1 et r 2 sont bien définis car b # O. Supposons construits les
nombres ro, r1, ... , rn-1 où n;;,: 3. D'après le théorème de la division euclidienne, si rn-l # 0,
1
on peut effectuer la division euclidienne der n-2 par r n-1 dont le rester n vérifie 0 :::;; r n < r n-l ·
On remarque alors qu'il existe nécessairement un plus petit rang n 0 pour lequel rno = 0 car
sinon la suite (r nlnEN* serait bien définie, à valeurs dans N et strictement décroissante, ce qui
-g est absurde. D'après le lemme 12.17, pour tout 1:::;; k:::;; no, a Ab= rk-l Ark = rno-1 Arno=
..8
U) rno-1 /\0 = rno-1 · ■
iÈ
[/)
Calcul du PGCD par l'algorithme d'Euclide
On cherche le PGCD de a et b. On peut toujours supposer b > O. On note r 0 = a,
r 1 = b. Il existe un rang n 0 pour lequel, pour tout entier naturel n tel que Vn0 ;;,: n;;,: 2,
rn le reste dans la division euclidienne de rn-2 par rn-1 est bien défini, avec rno = O.
Comme pour tout entier naturel n tel que 2 :::;; n :::;; no, r n-2 /\ r n-1 = r n /\ r n-1, on a
a/\ b = rno-1 /\ rno = rno-1 A0 = rno-1 ·
188
70
ri1
118
48 1 ~o
70
22 1 ~8
48
4 12;
22
2
rs
et comme 4 = 2 x 2 + 0, on a 61542A6514 = 2.
({=) S'il existe (u, v) E .:;E;2 tel que au+bv = 1, on a 1 E aZ+bZ = (aAb)Z et donc a Ab 11.
Cela impose que a/\ b = 1 et donc que a et b sont premiers entre eux. ■
Une relation du type 1 = au+ bv (avec u et v dans Z) est appelée une relation de Bézout
pour les entiers premiers entre eux a et b. On peut facilement obtenir une telle égalité à l'aide
de l'algorithme d'Euclide : en notant To = a, T1 = b, T2 le reste dans la division euclidienne
de r 1 par r 0, ... , Tk (resp. qk) le reste (resp. le quotient) dans la division euclidienne de Tk-1
par Tk-2, ... , et en notant n 0 l'entier où l'algorithme d'Euclide s'arrête, i.e. Tno = 0, on a
Tno-l = UA b = 1. De plus, 1 = Tno-1 = Tno-2-Qno-1Tno-3 d'où l'on tire un relation de Bézout
a-
C'I
1 = <Xn,i-2Tno-2 + f3no-3Tno-3· Or on a Tno-2 = Tno-3 - Qno-2Tno-4 d'où l'on tire une nouvelle
relation de Bézout 1 = <Xn,i-3Tno_3 + f3no-4Tno-4, et ainsi de suite jusqu'à a= bq2 + T2 d'où
l'on tire une relation de Bézout de la forme 1 = aoa + f3ob,
EXEMPLE 12.22. Montrons que les entiers 157 et 24 sont premiers entre eux et trouvons
une relation de Bézout les reliant.
► Appliquons l'algorithme d'Euclide.
Le dernier reste non nul dans l'algorithme d'Euclide étant égal à 1, les deux nombres sont
bien premiers entre eux. On a successivement
et donc b A (a, a2) = 1. Par une récurrence immédiate, on en déduit la généralisation suivante.
290
Prôpôsittîiti'.24. 7.fhient . ô.. et. '&'.flti~ Z; 2avéi;:'{ùili} ~tOfOr:,•ôit i~ttfav~ 4Nb"t?Î Wti
écrira ~ dn",'puis b ~ db" f.tue1d o1,1''} èZ ; Alors à:'AbI. == J~ . . .. . ...
Le lemme de Gauss est un résultat élémentaire mais très utile en arithmétique, comme
nous le verrons dans le paragraphe consacré à l'équation diophantienne du premier ordre.
PREUVE. Puisque albc, il existe a' E Z tel que be= aa'. Comme a/\b = 1, il existe
2
(u, v) E Z tel que au+ bv = 1. On a donc c = acu + bcv = a( eu+ a'v) et donc a I c. ■
PREUVE. Comme 01 lb, il existe q1 E Z tel que b = a1q1. Puisque UzAa 1 = 1 et azlb, on
déduit du lemme de Gauss que 021 q1 et donc que 01021 b. ■
On en déduit le résultat suivant par une récurrence évidente sur l'entier m EN*.
PREUVE. On sait que .'.z7a,b,c = .'.z7a n .'.z7b n .'.z7c- Or, on a vu que .'.z7a,b = .'.z1a n .'.z7b = .'.z7a/\b
et donc .'.z7a,b,c = .'.z1a/\b n .'.z7c = .'.z1(a/\b)/\c· Mais on a également .'.z7a,b,c = .'.z7a n (.'.z7b n .'.z7c) =
.'.z7an .'.z7b/\c = .'.z7a/\(b/\c)· D'où .'.z1a/\(b/\c) = .'.z7(a/\b)/\c et donc (a/\ b) /\C = a/\ (b /\C ), d'après
le lemme 12.3 de la page 281. ■
Pour un nombre fini d'entiers relatifs a 1 , ... , Un, on peut donc définir sans ambiguïté le
PGCD de ai, Oz, ... , Un par 01 /\Oz/\··· /\Un- On démontre sans peine par récurrence que
291
.Pu 1 n · · · n .Pun = .Pu 1 , ••• ,un. On peut également montrer par récurrence à partir de la définition
du PGCD que
u1Z + u2Z + · · · + UnZ = (u1 /\Uz/\ · · · /\Un)Z.
Ainsi, il existe (u1, ... , Un) E zn tel que
Définition 12.29. Des entiers relatifs u 1 , ... , Un sont dits premiers entre eux dans leur
ensemble2 lorsque leurs seuls diviseurs communs sont ± 1, c'est-à-dire u 1 /\ · • • /\ Un = 1. c--i
.....
Cette propriété est équivalente à l'existence d'une relation de Bézout 6
U1U1 + UzUz + ... + UnUn = 1.
EXEMPLE 12.30. Déterminons une relation de Bézout reliant les entiers 6, 10 et 15.
► On a 6 /\ 10 /\ 15 = (6 /\ 10) /\ 15 = 2 /\ 15 = 1. Les trois entiers sont donc premiers entre
eux. On a 2 x 6 - 10 = 2. Il suffit alors de trouver une relation de Bézout entre 2 et 15
15 - 7 x 2 = 1. Ainsi,
Comme dans le cas du PGCD, la terminologie PPCM signifie deux propriétés u vb est
un multiple de u et de b, et il s'agit du plus petit multiple au sens de la relation d'ordre de la
divisibilité 3 sur N des multiples entiers naturels communs à u et b. La proposition suivante
résume ces deux propriétés.
2
On dit parfois premiers entre eux sans préciser dans leur ensemble.
3
Voir la remarque de la page 281.
292
f/J
1
'2
..8
PREUVE. Le résultat découle immédiatement de l'égalité aZ n bZ = (av b )Z.
Le PPCM définit sur Z 2 une loi de composition commutative et associative, ce qui permet
la définition du PPCM den entiers relatifs a 1, ... , Un par a1 v a2 v ... v Un.
Le crible d'Ératosthène
On écrit la liste des n premiers entiers naturels non nuls, on élimine 1, les multiples de
2, puis les multiples de 3, etc. jusqu'aux multiples du plus grand entier inférieur 4 à y'rt.
Les nombres qui restent sont les nombres premiers inférieurs ou égaux à n.
293
PREUVE. Soit n ) 2. Notons E l'ensemble des diviseurs de n qui sont des entiers naturels
supérieurs ou égaux à 2. Comme n E E, E est une partie non vide de N. Soit k le plus petit
élément de E. Comme k E E, k In. Montrons que k est premier par l'absurde. Si ce n'était
pas le cas, k admettrait un diviseur 1 < k' < k et on aurait donc k' n d'où k' E E et 1
PREUVE. Raisonnons par l'absurde en supposant l'existence d'un nombre fini m de nombres
premiers, notés P1, ... , Pm· Posons alors N = P1 x pz x ... x Pm+ 1. L'entier N admet au
moins un diviseur premier que nous noterons p. Par hypothèse, il existe i :( m tel que p = Pi·
Ainsi, Pi divise N et Pl x pz x ... x Pm, donc p divise également N -p1 x pz x ... x Pm= 1,
donc Pi= 1, ce qui est absurde car 1 n'est pas un nombre premier. ■
Démontré à la fin du XIXe siècle, le théorème des nombres premiers précise la répartition
asymptotique des nombres premiers parmi les entiers : le nombre n( n) de nombres premiers
inférieurs à n peut être estimé par l'équivalent n(n) ~ ln(nl. On déduit de cette estimation
que le n-ième nombre premier, noté Pn, vérifie Pn ~ nln(n) (voir le chapitre 25 pour la
définition des équivalents et leur maniement}.
î>~opt,4t1Qn ·1i.:JS~. (Leinmê dtËÙclidê) . .Soient l' u~ nombre .prpmier eJ (a, b) E Z2 .tel
que plàb. Alors pl a ou plb.
4 On se limite aux diviseurs y'n car si k ,c:;; n est composé, il s'écrit n = n1n2 et l'un des deux nombres n et
1
n2 est nécessairement inférieur à y'n.
294
PREUVE. Soit p un nombre premier divisant ab. Si p I a, le résultat est acquis. Sinon, d'après
rIJ
Cl)
le lemme 12.37, p /\a= 1 et, d'après le lemme de Gauss, on a p I b. ■
1 ~L:;~~~;t~1;~~~~~:~;~t~;tl:'~-~~W. sqtt:un;~.~~t•··.
'2
rIJ
a, x ... x am, alors il existe 1 ::( i ::( m tel que p I ai.
~ ,(Pmc,~r Pr des
cOÛples (1'1' ~lh •.. llÙ ~. sont norrî6~. ~-,nif;1;s' w,· <,
k=l
n = rr
m
k=l
p:k = rr
m'
qek
avec les Pi et qi premiers deux à deux distincts, met m' dans N* ainsi que les exk et les f3e-
Soit 1 ::( k ::( m. Puisque exk? 1, Pk In, donc d'après le lemme d'Euclide, il existe 1 ::( C::( m'
tel que Pk I qe et donc, puisque ce deux nombres sont premiers, Pk = qe. On a ainsi prouvé
que
{p,, ... ,Pm} C {q,, ... ,qm,}.
Les deux décompositions jouant des rôles symétriques, on a aussi {q,, ... , qm,} C {p 1, ... , Pm}-
Puisque ces deux ensembles sont de cardinaux respectifs m' et m, on a m = m'. Notons
K+ = {k 11 ::( k ::( m, exk > f3k} et K_ = {k 11 ::( k ::( m I f3k > exk}- On a alors 5
k=l
rr
m
p~ = rr
m
k=l
Ptk ==}
kEK+
rr p~ -f3k = rr
kEK-
Ptk -CXJc
et comme K+nK_ = 0, on déduit de ce qui précède que l'un des ensembles K+ ou K_ est vide.
0 na done TT kEK+ pk""-l3k = 1 ou TT kEK- pk'3k -CXJc = 1, ce qm. ent rame
' K + = K _ = 0 car tout
nombre premier est supérieur ou égal à 2. Ainsi, \fk E Nm, exk = f3k, ce qui achève de prouver
l'unicité (à permutation près) des couples (pi, ex,), ... , (Pm, exml décrits dans l'énoncé. ■
5
Rappelons la convention n k E 0 Œk = 1.
295
pEP
car ce produit ne compte en fait qu'un nombre fini de termes différents de 1. Cette écriture a
l'avantage d'être intrinsèque : elle évite le recours à l'indice met aux exposants <Xk-
PREUVE. Supposons que l'équation admette une solution (x, y). Comme a Ab divise a et
b, a Ab I ax + b-y = c d'où le résultat. Réciproquement, supposons que a Ab I c. Écrivons
d = a Ab, a = da', b = db' et c = de' où a', b' et c' appartiennent à Z. On sait que
a' Ab' = 1. Comme ( a, b) /= (0, 0), d f O et l'équation est équivalente à a'x + b'-y = c'.
Comme a' Ab'= 1, il existe (u,v) E Z 2 tel que a'u+ b'v = 1, donc a'uc' + b'vc' = c' et le
couple (x, y)= (uc', vc') est une solution particulière de l'équation ax + b-y = c. ■
Résolution de l'équation ax + by =c
◊ Si aAb ne divise pas c, l'équation n'admet aucune solution.
◊ Si aAblc, écrire d = aAb, a= da', b = db' etc= de' avec a',b' etc' dans Z.
L'équation est équivalente à a'x + b'y = c'.
1. On commence par rechercher une solution particlière (x 0 , y 0 ) en exploitant une rela-
tion de Bézout entre a' et b'.
2. Résoudre l'équation en écrivant qu'un couple (x, y) est solution si et seulement
si a'x + b'y = a'x 0 + b'y 0 , i.e. a'(x - x 0 ) = b'(y 0 - y). On applique ensuite le lemme
..... de Gauss (on a a' Ab'= 1) pour conclure que les solutions sont les couples d'entiers de
.....
la forme (xo + kb', Yo - ka') avec k E Z.
PREUVE. Commençons par prouver que ces deux définitions ont un sens. Soient x, x', y et y'
dans Z tels que x = x' et y= y'. Pour que la définition x +y= x + y ait un sens il s'agit de
vérifier 6 que x + y = x' +y'· C'est bien le cas puisque x = x' [n] et y = y' [n] implique que
x+y = x' +y' [n]. De même, le produit x x y est bien défini puisque x = x' [n] et y= y' [n]
implique que xy = x'y' [n]. Il reste à vérifier que ces deux lois confèrent à Z/nZ une structure
d'anneau commutatif (ces calculs sont laissés aux soins du lecteur). ■
L'anneau Z/nZ n'est pas intègre en général. Par exemple, 2 x 2 = 0 dans Z/4Z, alors que
2#0.
6
Autrement dit, il s'agit de justifier que x +y est indépendant des représentants x et y des classes x et jJ.
297
7
On déduit de cette caractérisation des inversibles de Z/nZ le petit théorème de Fermat .
PREUVE. Puisque p est premier, Z/pZ est un corps. Ainsi (Z/pZ*, x) est un groupe d'ordre
p - 1. On a donc, pour tout IX E Z/pZ*, IXp-l = Î et donc IXP = IX. Cette dermière égalité
est encore valable en IX= O. Ainsi, pour tout k E N, on a ffP = n, c'est-à-dire nP = n [p]. Si
p /\ n = 1, on sait que n E Z/pZ* et donc n:v- 1 = î, c'est-à-dire nv- 1 = 1 [p]. ■
7
Le grand théorème affirme que l'équation xn +yn = zn n'admet aucune autre solution entière pour n ~ 3 que
les solutions évidentes pour lesquelles xyz = O. Le mathématicien Andrew Wiles a démontré ce théorème en
1994, après dix années de recherches solitaires et presque secrètes, mais aussi dans le prolongement de quatre
siècles d'efforts de nombreux mathématiciens.
298
VII. EXERCICES
12.2.
12.6.
Résoudre dans Z le système de congruences
X= 2 [3], X= 3 [5].
On note Mn = zn - 1 pour tout entier naturel
n.
12.3. 1. Établir que Mn premier =} n premier.
2. Justifier que M 11 n'est pas premier.
On pose Un= sn+6n pour tout n E N. Calculer
Un+l /\Un.
12.7.
12.4.
Soit n E N. L'entier n 4 + 4 est-il premier ?
Montrer que pour tout n E Z, n( n + 1 )( 8n + 1)
est divisible par 6. 12.8.
Le jeu de Nim est très ancien et il en existe de nombreuses variantes. Dans la plupart des
jeux, la règle stipule que le gagnant est celui qui force son adversaire à ne plus pouvoir jouer.
Par exemple, aux échecs, le perdant est celui dont le roi est mis en échec sans qu'il ait le
moindre coup autorisé pour pallier l'échec. C'est somme toute naturel si on considère qu'un
joueur est d'autant plus en difficulté qu'il a moins d'options à sa disposition, et à plus forte
raison quand il n'en a plus du tout!
Le jeu de Nim renverse cette logique. Il fait partie de la classe des jeux dits « de misère» qui
considère au contraire que le joueur perd quand il est le dernier à pouvoir jouer.
1. Le jeu à une pile. Ce jeu se pratique à deux selon les règles suivantes. On dispose
sur une table une rangée d'allumettes. Un coup consiste à retirer de la rangée une, deux ou
trois allumettes. Le joueur qui retire la dernière allumette perd. Existe-t-il une stratégie pour
gagner à coup sûr ?
Représentons notre jeu par un graphe. Les sommets sont les positions possibles du jeu,
c'est-à-dire ici le nombre d'allumettes. C'est donc un graphe dont les sommets sont indexés
par N. On relie ensuite un sommet n, à un sommet n2 par une flèche (orientée) s'il existe
un coup permettant de passer de n 1 à n2 allumettes. Autrement dit, on définit un ensemble
d'arêtes E C N 2 par la condition
(n 1, n 2) E E # (n 1 = n 2 + 1 ou n 1 = n 2 + 2 ou n 1 = n 2 + 3).
On obtient ainsi un graphe orienté dont la figure représente un graphe partiel. Le lecteur
attentif aura noté que nous n'avons pas représenté toutes les flèches qui existent entre les
points 0, ... , 13, mais nous avons conservé celles qui sont significatives pour notre étude.
On observe que le joueur qui jouerait à partir d'une rangée formée d'une unique allumette
est perdant. On dira que le sommet 1 est perdant. Mais alors, les sommets 2, 3 et 4 sont
gagnants puisqu'il existe des flèches joignant ces sommets au sommet 1. Un joueur devant
jouer à partir de la position 2, 3 ou 4 peut ainsi mettre son adversaire dans la position 1
perdante. En revanche, les trois coups possibles à partir de 5 mènent tous à des positions
dont nous venons de montrer qu'elles sont gagnantes. Le sommet 5 est donc perdant et il
s'ensuit que 6, 7 et 8 sont gagnants, etc. On peut donc étiqueter chaque sommet du graphe en
leur attribuant le statut de gagnant ou de perdant et on se convaincra facilement que chaque
triplet de sommets disposés verticalement dans notre figure sont gagnants, alors que chaque
sommet au contact de deux « losanges » sont perdants.
L'ensemble des sommets perdants est appelé le noyau du graphe. Tout joueur sait qu'il a
intérêt à connaître le plus de sommets possibles d'un tel noyau. Par exemple, les problèmes
d'échecs du type « les blancs jouent et gagnent en n coups» que l'on trouve dans la presse
sont des exercices où l'on demande de démontrer que l'on peut mettre l'adversaire dans le
noyau 8 en un seul coup et que ce dernier ne pourra résister que sur n - 1 coups.
Cette idée de noyau est peut-être mieux illustrée par une autre façon de schématiser le
jeu de Nim. Imaginons une bande de cases, infinie à droite. Le jeu débute en plaçant un jeton
sur l'une des cases. Un coup consiste à déplacer le jeton sur la gauche, dans la direction où
la bande a une extrémité finie, de une, deux ou trois cases. Le joueur qui déplace le jeton sur
la première case de la bande a gagné. Il est facile de se convaincre que ce jeu de bande et le
jeu de Nim sont éqivalents. Le numéro de la case occupée par le jeton peut en effet tout aussi
bien désigner le nombre d'allumettes sur la table.
■ 11 ■ 11 ■TI:.11 ■ 11.
FIGURE 12.2. Une bande semi-infinie
Les cases hachurées sont les cases perdantes. En effet, si un joueur doit jouer alors que
le jeton est sur l'une de ces cases, il ne peut pas déplacer le jeton jusqu'à la case hachurée
suivante. En revanche, le joueur adverse peut toujours contrer le coup en ramenant le jeton
sur une case hachurée. Comme la première case est perdante, toutes les cases hachurées sont
bien perdantes et les cases complémentaires sont gagnantes.
Dans ce schéma, le noyau est l'ensemble des cases en position 1, 5, 9, 13, etc. Ce sont les
positions obtenues à partir de la position 1 en ajoutant un multiple entier de 4. C'est donc
l'ensemble {n 1 :lp EN, n = 1 + 4p} = (1 + 4Z) n N, soit encore l'ensemble des représentants
positifs de la classe de 1 dans le groupe Z/4Z. La démonstration que cet ensemble est bien le
noyau repose sur le résultat facile suivant, appliqué au cas n = 4.
8
Le graphe du jeu des échecs est toutefois légèrement plus compliqué à définir parce que l'ensemble des coups
possibles à partir d'une position de l'échiquier dépend de la couleur du joueur.
Supposons que l'on débute avec N allumettes et que l'on en retire de 1 à n - 1 par coup.
Si N =f=- 1[n], le premier joueur retire N-1 modulo n allumettes au premier coup, puis pare tous
les coups en retirant n - q quand son adversaire en retire q. Comme le nombre d'allumettes
décroît strictement, le jeu se termine quand le second joueur doit jouer et perdre avec une
seule allumette sur la table. Si au début N = 1[n], les rôles sont inversés.
2. Le jeu à plusieurs piles. On dispose cette fois plusieurs rangées d'allumettes sur une
table. Un coup consiste à retirer un nombre quelconque d'allumettes, mais au moins une dans
la rangée de son choix. Un joueur gagne s'il retire la dernière allumette.
Comme dans le cas du jeu à une pile, notre analyse va reposer sur un groupe. Cette fois,
il s'agit de (N,EB) que nous avons introduit dans le complément du chapitre 11. Rappelons
brièvement comment il est défini. Étant donnés deux entiers n1 et nz, on les décompose en
base 2, c'est-à-dire sous la forme
n 1 = 2«1 + 2«2 + • • • + 2"" et n 1 = 213 1 + 2132 + • • • + 213P',
avec a 1 > a 2 > • • • > <Xp~O et (3 1 > (3 2 > · · · > (3p, ~ O. On définit alors n1 EBnz comme la
somme des puissances de 2 qui figurent dans l'une des décompositions à l'exclusion de l'autre.
Autrement dit, on calcule la somme habituelle, après avoir éliminé les puissances qui figurent
dans les deux décompositions à la fois. Par exemple,
7EB 14 = (1 +2+4) EB (2+4+8) = 1 +8 = 9.
On a éliminé les puissances 2 et 2 2 . Le lecteur vérifiera - ou se reportera au complément du
chapitre 11- que l'on définit bien ainsi un groupe (N,EB) commutatif, d'élément neutre O et
qu'il possède en outre la propriété remarquable, mais immédiate, que n EB n = 0 pour tout
nEN.
~roposition t2.;i;J. . . $oit (nt, n2, ~ .. , 11.p) € (N \ {0})1'. On pose N =h1 E9 • · • $11.p. On a
alors l'alter;native suivante. ·
l) Si N =/= :O, alors il existe un entier ko tel que 1 ::;; k ::;; 1' et N E9 n.ko < ~.
2) SiN =0, alorspoùrl ::;;k::;; 1' etO~n{, < nk, on an1E9·· •n.1c.-1E9niE9n1c.+1 · • ·E9np =/= O.
PREUVE. 1) On suppose que N =/= O. Soit 2° la plus grande puissance qui figure dans la
décomposition de N en base 2. Par hypothèse, il existe un entier k 0 , avec 1 :S k 0 :S p, tel que
2° figure dans la décomposition de nko sous la forme
Soit fo le rang, dans l'ordre décroissant, de l'exposant a parmi ceux de cette décomposition.
Autrement dit, on a
<X1 > · · · > <Xjo =a> <Xj0 +1 • · • > <Xm ;::=: O.
Par définition de a, dans la somme N EB nko, la puissance 2° est éliminée, contrairement aux
puissances 2<>i avec j > fo. Il en résulte que
N EBnko::;; 2«1 + · · · +2"io+ 1 +2a-l + · · · +2+ 1::;; 2«1 + · · · +2"io+ 1 +2°-1 < nko.
2) On suppose que N = O. Soit n( < nk. Il s'agit de montrer que N EB nk EB n( =/= O. En effet,
Si N =/- 0 au début du jeu, alors le premier joueur calcule la somme N EB nk pour chaque
rangée jusqu'à rencontrer ko tel que N EB nko < nko· Il retire alors dans cette rangée autant
d'allumettes que nécessaire pour qu'elle n'en ait plus que N EB nko. La somme totale donne
maintenant N EB nko EB n 0 EB EBn1 EB · · · EB nko EB · · · EB Tt.p = N EB N = 0.Le second point
de la proposition 12.51 montre que l'adversaire ne peut maintenir N = O. Il suffit donc au
premier joueur de parer chaque coup en ramenant la somme à zéro. Comme le nombre total
d'allumettes décroît strictement, le jeu finit par s'arrêter, et ce n'est possible que lorsque
N = 0, c'est-à-dire après un coup du premier joueur, qui est donc le gagnant. Si N = 0 au
début, les rôles sont inversés.
Remarque. Et si un joueur perd en retirant la dernière allumette? Si N =/- 0 au début du
jeu, le premier joueur joue comme plus haut, tant que sa tactique donne au moins une rangée
de plusieurs allumettes. Que doit-il jouer quand ce n'est plus le cas? Gagne-t-il toujours?
Chapitre 13
POLYNÔMES À UNE INDÉTERMINÉE SUR
LE CORPS lK == :IR OU (C
L quelques savants (comme Diophante) ont abordé la résolution des équations, mais
sans aucun recours au symbolisme et en faisant systématiquement reposer leurs tra-
vaux sur des considérations géométriques.
Seule figure à notre programme la résolution générale des équations de degré deux. Il faut
cependant savoir qu'il existe des méthodes générales de résolution des équations de degré
trois (pour un aperçu des idées de Scipion del Ferro) et quatre (Ferrari et plus tardivement
Lagrange). Après de nombreux échecs concernant l'ordre cinq, Abel et Galois prouvèrent,
au début du XIX •siècle, qu'au-delà de l'ordre quatre, il n'existe aucune formule générale
permettant de calculer les racines d'un polynôme à l'aide de radicaux2 •
1. L'ALGÈBRE IK[X]
Une expression de la forme Po+ p,x + p2x 2 + · · · + PnXn où n E N a un sens lorsque les
variables Pk (0 ::,; k ::,; n) et x appartiennent à un anneau (A,+, x ). Mais quel sens précis
faut-il donner au mot «expression» ? La réponse la plus immédiate est de définir cette
1
Ce mot signifie littéralement « remplissage ou réduction d'une fracture». Chez Cervantès, le mot algebrista
désigne un rebouteux.
2
Abel traita le cas de l'ordre cinq et Galois celui des équations de degré quelconque n:;,, 5.
304
«expression» comme l'application q> de A dans A telle que, pour tout élément x de A,
cp(x) = p 0 +p 1x+p 2x 2 + ... +PnXn; ce type de fonction est appelée une fonction polynomiale
à coefficients dans A de la variable x. Cette première approche s'avère en fait incomplète.
Plaçons-nous un instant dans le cas où l'anneau A est le corps lFz = Z/2Z = {O, î}, et
2 3
considérons les fonctions polynomiales de lF 2 dans lF 2 définies par f(x) = x +x et g(x) = x +x.
Puisque On = 0 et În = Î pour tout entier naturel non nul n, ces deux fonctions coïncident sur
JF 2 . Une affirmation telle que f est de degré 2 et g de degré 3 n'a donc aucun sens puisque f = g.
Cependant, les formules définissant f et g sont effectivement différentes. La définition d'une
expression du type précédent comme une fonction de lFz dans lF2 est donc insuffisante car elle
ne permet pas de distinguer entre les deux formules. Cette remarque permet de cerner l'intérêt
- de la notion de polynôme : différencier une expression du type précédent de la fonction qu'elle
définit.
Nous allons introduire dans ce chapitre la notion générale de polynôme à coefficients dans
le corps lR ou C, et verrons que dans ce cas, il est possible d'identifier un polynôme à la fonc-
tion polynomiale qui lui est associée. L'ensemble des définitions de cette partie sont cependant
généralisables à n'importe quel corps (JK, +, x ). L'exemple précédent prouve qu'il faut alors
distinguer les notions de polynôme et de fonction polynomiale. Les développements récents
de la cryptologie3 utilisent les propriétés des polynômes à coefficients dans un corps 1K fini,
cadre dans lequel cette distinction n'est pas gratuite.
Dans tout ce qui suit, 1K désigne le corps lR ou C. Dans l'esprit du mécano de la théorie des
ensembles, nous allons construire l'ensemble des polynômes à coefficients dans 1K à partir des
ensembles dont nous disposons. L'objectif de ce premier paragraphe est de définir un polynôme
comme une suite (PnlnEJI! d'éléments de 1K nulle à partir d'un certain rang4 : :3no E N, Vn;;::
n 0 , Pn = O. Le polynôme correspondant à l'expression x 3 + x sera (O, 1, 0, 1, 0, ... ) et celui
correspondant à x 4 - 2x + 1 sera (1, -2, 0, 0, 1, 0, ... ), les points de suspension signifiant que
la suite stationne à la valeur O. Il restera alors à définir trois opérations sur les polynômes,
celles correspondant aux calculs suivants :
Une suite nulle à partir d'un certain rang est également appelée une suite presque nulle.
3
Étymologiquement science du secret, la cryptologie est la science du codage et du décodage de données, une
discipline à mi-chemin entre les mathématiques et l'informatique. Les cryptologues sont nos amis : c'est grâce
à eux que nous pouvons effectuer en toute sécurité des transactions bancaires sur internet.
4
Rappelons que l'ensemble IK/1 des suites d'éléments de 1K a été défini dans le chapitre sur les structures
algébriques.
305
Ces de'//$ ppémtions âéfini,ssent respeètivemoot une loi interne et externe à domaine d'opé-
rateurs K sur JK(N).
PREUVE. Il existe n1 et nz tels que 'v'n > n1 , Pn = 0 et 'v'n > nz , qn = 0 et donc, en posant
n3 = max(ni, nz), 'v'n > n3, Pn+qn = 0 et donc P+Q E JK(NJ_ De même, 'v'n > n1, ÀPn = 0,
donc À • P E JK(Nl. L'ensemble JK(Nl est donc stable par la loi + et la loi externe à domaine
d'opérateurs 1K sur JK(NJ_ ■
pose
n
P X Q = (CnJneN où \in E N , Cn = :L PkQn""-k•
k=-0
PREUVE. Il existe deux entiers n1 et nz tels que 'v'n > n1 , Pn = 0 et 'v'n > nz , qn = O.
Posons n3 = n1 + nz. Soit n > n3. On a Cn = L~=O Pkqn-k· Pour tout O ~ k ~ n, si
k > n1, on a Pk = 0; si k ~ n1, n - k? n-n1 > nz, donc qn-k = 0, ainsi Cn = 0 et donc
(cnlnEN =PX Q E JK(N)_ ■
Ajoutons que les éléments neutres pour les lois+ et x sont respectivement égaux à (0, ... )
et (1, 0, ... ). L'anneau (JK[X), +, x) étant commutatif, la formule du binôme de Newton y est
valable en toute généralité.
5
La structure d'espace vectoriel est à la base de l'algêbre linéaire. Le lecteur pourra se rapporter aux chapitres
correspondants mais leur étude n'est pas indispensable à la lecture des pages qui suivent.
306
Les méthodes de démonstration sont exactement les mêmes que dans le cas complexe
une récurrence est possible mais la manière la plus élégante est basée sur la combinatoire6 •
Proposition 13.6. L'application i : K -t K(N) définie par i(a:} = (a:, 0, . .. ) est un mqr-
phisme de corps injectif 7 •
(cx,0, ... ) + w,o, ... ) = (ex+ 0,0, ... ) et (cx,0, ... ) x (0,0, ... ) = (cx0,0, ... )
d'où i(cx) +i(0) = i(cx+ 0) et i(cx) x i(0) = i(cx0). De plus, i(l) = (1,0, ... ) = lK1"1-
L'application i est donc un morphisme d'anneaux. On conclut que i est injective en remarquant
que 8 Ker (i) = {O}.
■
L'image i(K) du c<;>rps li( par le morphisme injectif i est un corps isomorphe à li(, ses
éléments sont appelés les polynômes constants. Dans tout ce qui suit, on identifiera via i les
corps li( et i(K), ce qui revient à identifier un polynôme constant et son unique coefficient.
On écrira donc li( C K[X]. En particulier, l'élément neutre (1, 0, ... ) pour la loi x est égal à
1 et l'élément neutre (O, ... ) pour la loi + est égal à O.
6
Voir la page 190 du chapitre 8 pour une preuve détaillée.
7
Rappelons qu'un morphisme de corps est un morphisme d'anneaux entre deux corps.
8
En fait, on peut prouver plus généralement que tout morphisme de corps est injectif.
9
Voir les difficiles calculs de produits du test 13.2.
307
.\ttcutiun L'indéterminée X
w
;:l
Dès que le contexte fait intervenir l'anneau OC[X], la lettre majuscule X est une nota- 0
tion réservée (au même titre que la lettre i des nombres complexes). On n'écrira donc ê1i
Il
JAMAIS des phrases du type « en posant X= ... » qui n'ont aucun sens! Autrement ~
dit, il ne faut pas confondre l'indéterminée X avec l'inconnue x. rJJ
e-
0
<:)
PREUVE. D'après le lemme et la notation définie ci-dessus, pour tout P = (pk)kEIK E ][((Nl,
+oo
on a P = .L. pkXk. ■
k=O
Remarque. Dans le langage de l'algèbre linéaire, cette proposition signifie que la famille
de polynômes (XnlnEJ\I est une base du OC-espace vectoriel OC[X]. Nous l'appellerons la base
canonique de ][([X].
10
Valable dans n'importe quel anneau.
308
......
...... L'usage de l'indéterminée X achève de formaliser la notion intuitive de polynôme que nous
avons décrite dans l'introduction.
La notation IKY"l de l'ensemble des polynômes sur le corps 1K est désormais caduque.
Nous noterons désormais lK[X] cet ensemble.
11
En effet, si Pn = 0 dès que n), n 0 , l'entier n 0 est un majorant de E.
309
Définition 13.12. Soit P un polynôme non nul, de degré n ~ O. Ils 'écrit de manière unique
P =Po+ · · · + PnXn avec Pn =fa O. Le coefficient Pn est appelé coefficient dominant de P. Un
polynôme est dit unitaire lorsque son coefficient dominant vaut 1.
u
g
ê1i
La proposition suivante rassemble les principales propriétés du degré et de la valuation. Il
Nous ne démontrerons que la formule deg (PQ) = deg (P) +deg (Q), les autres résultats étant ::ai:
r/J
faciles à établir. e-
0
CJ
Proposition 13;13. Soient P et Q dans K[X].
l)deg{PQ}Fdeg{P)+deg(Q } et va.lf PQ} =va.lWl+val(Q};
2) deg {P +QJ~ max(deg (P),deg{Q}} et val(P+Q)~ mîn(vàl(P),val{QJ}.
3) Sideg(P}#=deg{QJ, on adêg(P+Q} =mâx(deg(P},deg(Q)).
4) Si val(P} i-val(Q}, on a val{P + Q} = min(val(P), val(Q}).
=
5). 'r/A E K* , deg{ÀP} deg {P). etval(ÀP) = val(P).
PREUVE. Il est facile de prouver que les propriétés sont vraies lorsque P = 0 ou Q = O.
Par exemple, si P = 0, PQ = 0 et donc 1) est vérifiée puisque l'on a convenu de l'égalité
-oo = -oo + deg (Q) pour deg (Q) = -oo ou deg (Q) EN. Plaçons-nous dans le cas où Pet
Q sont non nuls. Notons n 1 = deg (Pl, deg (Q) = n2 et n3 = n, +nz. Reprenons les résultats
de la proposition-définition 13.3 de la page 305. On a vu que pour n > n 3, Cn = O. De plus
n,+n2
Cn3 = L, Pkqn1+n2-k·
k=O
Pour k < n,, on an, + n2 - k > n2 donc qn1+ni-k = O. Pour k > n,, on a Pk = O.
Ainsi Cn3 = Pn, qn2 =fa O car Pn, =fa O et qn2 =fa O. Ainsi deg (PQ) = n3 = n, + n2 et donc
deg (PQ) = deg (P) + deg (Q). ■
où les pointillés désignent une somme de monômes de degré compris strictement entre m+m'
etn+n'.
PREUVE. o IK[X] est intègre : soient Pet Q dans IK[X]. Comme deg (PQ) = deg (P)+deg (Q),
on a (deg (P) ~ 0 et deg (Q) ~ 0) ===} deg (PQ) ~ 0 donc (P =fa O et Q =fa 0) ===} PQ =fa 0, d'où
le résultat.
12
Rappelons que la notation Ax désigne le groupe des éléments inversibles d'un anneau (A,+, x) donné.
310
1
deg (P) = deg (Q) = 0 et donc P E IK*. Inversement, si P E IK*, on a clairement P E IK[X]x.
Ainsi IK[X] x = IK*. ■
'2
..s
rfJ
Définition 13.15. Soit n EN. L'ensemble des polynômes de degré inférieur ou égal à n est
noté IKn[X].
1
Ê Nous démontrerons dans les chapitres d'algèbre linéaire que IKn[X] est un sous-espace
(/)
vectoriel de IK[X].
B
~ Il. OPÉRATIONS USUELLES SUR LES POLYNÔMES
Au-delà des opérations usuelles+, x et l'opération externe du corps 1K sur IK[X], on peut définir
de nouvelles opérations sur les polynômes : la composition, l'évaluation et la dérivation.
L'application P: li(----, li( définie par P(x) = P(x) est appelée Jonction polynomiale associée
au polynôme P. 1
,Il)
"O
.s
Remarque. Pour tout polynôme P = I::: PkXk avec (Pkhoi presque nulle, on a clairement
0
§
+oo ,(lj
P(a) = L Pka\ s
rJJ
,o
k=O
.§,
cette dernière somme étant finie. ~
c,'.i
On dit également que le nombre P( a) est la valeur de P en a. Évaluer P en a signifie .....
calculer le nombre P (a). .d
ü
Proposition 13.20. $oiênt aE JI( e.tea: K[XJ -t K définie parea{Pl = P(a). L'application
ea, appelée opérateur d'éwl~o:tion en a, vérifie les propriétés suivantes :
1) 'V'{P, Ql eK[XJ2, 'ea{Pç Q}""' 8Q(o}(P) = P(Q(a)}.
2) V(P;Q} € lf\[X}2 ; 'vA È K , {P+ 1'Q)(u1= P(a} + :\Qfak
3J V{P/Q) E: KiXJ1 , èaf'PQJ e<1(P)e4 (Q) ~ P{a)Q(a).
=
PREUVE. Nous nous contenterons de prouver le 2), les autres démonstrations sont faciles et
laissées au lecteur. Ecrivons P = I:::
0 PkXk et Q = I:::
0 qkXk. On a
Remarque. Nous avons appris à évaluer les polynômes de OC[X] sur les éléments de li( mais
on pourrait tout aussi bien les évaluer sur tout élément d'un anneau contenant li( (comme par
exemple OC[Xl). On comprend maintenant le rôle de l'indéterminée X. La notation X symbolise
la capacité de l'indéterminée à être remplacée dans un polynôme par n'im~orte quel élément
d'un anneau contenant OC. On peut ainsi voir la proprosition 13.17 comme, une conséquence
de la proposition 13.20.
312
1
~
1 Définition 13.21. Soit P un polynôme à coefficients dans K Si deg (Pl ~ 0, on pose P' = O.
Sin= deg (Pl ~ 1, P s'écrit de manière unique P =Po+ P1X + · · · + PnXn et l'on pose
P' = p 1 + 2pzX + · · · + npnxn-l _ Le polynôme P' s'appelle le polynôme dérivé de P.
Remarque. Autrement dit, pour tout polynôme P = .L.;:0 PkXk avec (pklkEN presque nulle,
on a
+oo +oo
P' = L kpkxk-l = I:.(e + llPr+1Xf.
k=l f=0
Proposition 13.22.- Sait D : JK[XJ ---4 K[X] définie par D{P} P'.
1) D est une applica.tiôn linéaire;• c'ést~à:--âire
13
Une dérivation sur un anneau (A,+, x) est une application li : A -l A vérifiant la propriété suivante:
\/(a, b) E A 2 , li(ab) = ali(b) + li(a)b, appelée identité de Leibniz. On peut prouver qu'üexiste une unique
dérivation li sur IK[X] qui est linéaire et vérifie li(X) = 1 : il s'agit de O. ·
313
~
Q,)
,Q,)
1
=voQ' + % Pk(%k(n- k+ k)qn-kxn-l)
,Q,)
"O
=voQ' + % Pk(%k(n- k)qn-kxn-l) + % kpk(%k qn-kxn-l) .s
§
,c,j
=poQ'+ %Pk(~eqfxH+k) + %kpk(~qfXHk-l)
s
rtJ
<O
1 1
=voQ'+ %vkxk(~eqfxt- ) + %kpkxk- (~qtxt) E,
~
+oo +oo C".Î
......
= PoQ' + L PkXkQ' + L kpkxk-lQ = PQ' + P'Q. .ci
ü
kcèl k=l
3) La formule découle d'une récurrence élémentaire en appliquant le 2).
4) Comme Po Q = L~o pkQ\ on déduit de la linéarité de D que
+oo +oo +oo
D(P O Q) = L_ PkD(Qk) = L_ kpkQ'Qk-l = Q' L_ kpkQk-l = Q' X (P' 0 Q)
k=O k=l k=O
où l'on a appliqué le 3) afin de calculer D(Qk).
■
Définition 13.23. Pour tout k E N*, la composée D k = Do ... D (k fois) est bien définie et
pour tout polynôme P E JK[X], on note p(kl = Dk(P) et on l'appelle polynôme dérivé d'ordre
k de P.
On adoptera la convention D 0 = idoc[XJ· Ainsi, VP E JK[X] , p(Ol = P. On notera souvent
P" au lieu de p(ll_ Par exemple, pour P = X4 - 5X 3 + 4X + 1, on a successivement P' =
4X 3 - 15X2 + 4, P" = 12X2 - 30X, p( 3 l = 24X - 30, p( 4 l = 24 et, pour tout entier k )! 5,
p(kl = O. Par une récurrence facile, on prouve la formule suivante.
Proposition 13.25. (Formule de Leibniz). Pour tous polynômes P etQ dans JK[X] et
tout entier naturel n, on a
◊ Prouvons que \ln E N, HR(n) ---+ HR(n + 1) soit n E N ; supposons HR(n) vraie. On a
alors, pour tous P et Q dans JK[X],
= t( (~)p(k}Q(n-k})
1
et ainsi
t,
k=l
HR(n + 1) est vraie et la formule est donc acquise d'après le principe de récurrence. ■
Le lecteur aura remarqué que la preuve de la formule de Leibniz est en tout point similaire
à la démonstration de la formule du binôme.
et donc, après division par xn =/= 0 (rappelons que l'anneau JK[X] est intègre),
PREUVE. Un polynôme p de 1Kn[X] s'écrit p =Po+ p,X + ... + Pnxn. Par linéarité de la
dérivation, pour tout k entre O et n, on a
et donc
n p(kl(a) k n (1 n C! f-k k)
L
k=O
~ ( X - a ) = L k!L_Pe(C-k)!u (X-a)
k=O f=k
= t (t
f=O
Pe (C _c~)!k! uf-k(X - a)k)
tve(t
k=O
= G)af-k(X-a)k) = tve(X-a+a)e
n
::::i
Notation. D'une manière générale, nous noterons ~A, ,---,Am l'ensemble des diviseurs com-
muns à des polynômes A 1, ... , Am donnés. En particulier, ~A désigne l'ensemble des u
diviseurs de A et donc ~A,, ... ,Am = ~A, n ... n ~Am· On note de même .,,f(A,, ... ,Am
g
êl
l'ensemble des multiples communs à des polynômes A 1, ... , Am donnés. On a donc claire- Il
ment .,,f/A, ,.. ,,Am = .,,f/A, n ... n .,,f/Am. L'ensemble .,,f/A sera de préférence noté AlK[X]. ~
r/J
~
Test 13.15. Test 13.16. (.)
Si B divise A et A-=/= 0, alors deg (B) ::,:; deg (A). En effet, il existe un polynôme Q E OC[X]
tel que A= BQ d'où l'égalité deg (A)= deg (B) + deg (Q) et, comme on a clairement (A-=/=
0) =} ( Q -=/= 0 et B -=/= 0), deg ( Q) ;): 0 et donc deg (B) ::,:; deg (A).
X'2- ZX + 1 1 X- 3
- (X - 3X) X+1
= X+ 1 ainsi X2 - 2X + 1 = (X+ 1 )(X - 3) + 4.
(X-3)
= 4
Les polynômes Q et R sont respectivement appelés quotient et reste dans la divisi<>n eucli.._
dienne ·de•A par B.
318
1
..Si
r/J
BQ1 + R1 = BQ2+ R2, d'où l'égalité B(Q1 - Q2) = R2- R1 et donc deg (B) +deg (Q1 -Q2) =
deg (R2 - R1 ). Raisonnons par l'absurde : si deg (Q1 - Q2) ~ 0, puisque deg (B) ~ 0, on a
alors deg (R2 - R1) =/- 0 et deg (R2 - Ri) ~ deg (B). Ceci est absurde, car deg (R1) < deg (B) et
deg (R 2) < deg (B) impliquent que deg (R2 - Ri) ~ max(deg (R,),deg (R2)) < deg (B). Ainsi
i Q 1 = Q2, puis R1 = A - BQ, = A- BQ2 = Rz.
i o Existence de (Q, R) : raisonnons par récurrence sur le degré de A. Notons m = deg (B) ~ 0
et B = bmXm + • • • + b 0 avec bm =/- O. Soient n un entier naturel et HR(n) la propriété
suivante : pour tout polynôme A de degré inférieur ou égal à n, il existe un couple (Q, R) de
polynômes à coefficients dans 1K tels que A= BQ+ R et deg (R) < deg (B). L'hypothèse HR(0)
est vraie : en effet, A = a0 E !K. Sim~ 1, on pose Q = 0 et R =A; si m = 0, on pose
Q = a 0/b 0 et R = O. On a bien dans tous les cas A= BQ+R et deg (R) < deg (B). Soit n ~ O.
Supposons HR(n) vérifiée. Soit A un polynôme de degré n+ 1 : A= nn+lxn+l +· · ·+a,X+a0 .
Sin+ 1 < m = deg (B), il suffit de poser R = A et Q = O. Sin+ 1 ~ m = deg (B), posons
A 1 = A- (an+i/bm)xn+l- mB. On a deg (A 1) ~ n, donc d'après HR(n), il existe un couple
de polynômes (Q 1, R1) tels que A, = Q 1B + R1 avec deg (R,) < deg (B). Posons R = R, et
Q = Q 1+(an+i/bm)Xn+ l-m_ On a bien A= BQ+R et deg (R) < deg (B). L'hypothèse HR(n)
est donc vraie pour tout n dans N par récurrence sur n. ■
L'unicité dans la division euclidienne sur IK[X] permet d'affirmer qu'un polynôme B =/- 0
divise A si et seulement si le reste dans la division euclidienne de A par B est nul.
X4 + x 2 + x + 2 x 2 -3
(X4_3x2) xz+4
4X 2 +X+ 2 ainsi A= (X 2 + 4)8 +(X+ 14).
(4X 2 - 12)
x+ 14
Cette méthode peut être adaptée au calcul du reste dans la division euclidienne de P par
(X - a)2. Il faudra dans ce cadre faire appel à la dérivation.
n (kl( ) n p(k)( )
P= _L p k!a (X-at=P(a)+ P'(a)(X-a)+ (X-a)2_L Trx-aik- l.
k=O k=2
On en déduit, par unicité dans la division euclidienne, que R = P(a) + P'(a)(X - a).
A = 3X5 + 2X + 2X + X et B = X + 1,
4 3 2
X2 + 2X 3 + 2X4 + 3X 5 1+ X
(x2 + X3l xz+x3
X3 + 2X4 + 3X5 ainsi A= (X 2 + X3)B + X4(1 + 3X).
(X3 + X4)
X4 + 3X5
X2 + 2X 3 + 2X 4 + 3X 5 l+X
(Xl +X3)
xz+x3+x4
X3 + 2X4 + 3X5
(X3 + X4) ainsi A= (X 2 + X3 + X4)B + X5 (2).
2X5
320
Propositiôn ·13.36. '(Division 'Selon ·Jes puissance& eroiesantes} Srnënt,A, et' B -dans
'1l
11.l ll{[X] tels que vâl{Bl ~ 0 et n EN: ll exîsteufi u~#Juè CQUJle de polyMmes(CbR) à 'coeffe~
] cients dans.KfX] tels que A= BQ +xn+tR et deg {Q) ~ n. ·
1
]
PREUVE. Raisonnons en deux temps.
..8 ◊ Unicité. Soient ( Q 1, Ri) et ( Q2, R2) deux couples de polynômes de OC[X] tels que A =
'1l
1:::
BQi + xn+lRi et deg(Qd,.:;; n pour i E {1,2}. On a alors B(Q1 - Q 2) = xn+ 1(R 2 - R1) et
donc val(Q 1 -Q2) = n+ 1 +val(R2- Ri) > n. Comme Q1 -Q2 =/= 0 implique val(Q1 -Q 2) ,.:;;
~
deg (Q 1 - Q2) ,.:;; n, on a nécessairement Q 1 = Q 2 puis xn+l (R1 - R2) = O. L'anneau OC[X]
È
[/) étant intègre, on en déduit que R1 = R2.
◊ Existence. Raisonnons par récurrence sur n E N*. Notons HR(n) l'hypothèse suivante :
pour tous polynômes A et B de OC[X] tels que val(B) = 0, il existe un couple (Q, R) E OC[X]2
tel que A= BQ +xn+ 1R et deg (Q),.:;; n. Notons B = b 0 + • • • + bvXP. Comme val(B) = 0, b 0
n'est pas nul. L'hypothèse HR(0) est vraie. En effet, notons A= ao + a1X + · · · + UmXm. Le
polynôme A- (a 0 /b 0 )B est de valuation au moins égale à 1, il est donc de la forme XR avec
RE OC[X]. Le couple ((ap/b 0 ), R) convient donc. Soit n?: O. Supposons HR(n) vraie. Soient
A et B deux polynômes de OC[X] tels que val(B) = O. D'après HR(0), il existe (Q 1, R1 ) E OC[X] 2
tel que A = BQ 1 + XR1 et deg (Qi) ,.:;;: O. D'après HR(n), il existe (Q2, R2) E OC[X]2 tel
que R1 = BQ2 + xn+ 1R2 et deg (Q2) ,.:;; n. On a donc A = BQ1 + X(BQ2 + xn+ 1R2) =
B(Q 1 + XQ 2) + xn+2R2 avec deg (Q 1 + XQ 2) ,.:;; n + 1. L'hypothèse HR(n + 1) est donc vraie
et le résultat est acquis par récurrence. ■
Cette division est utile pour décomposer des fractions rationnelles et calculer des dévelop-
pements limités 14 .
=
Lemme.13.37; SfA R[B] a:vet B E K[XJ \ {O} et d!i!g(R} < deg{Bl, alors Rest le reste
dans la division euclidienne de A par B.
Le résultat suivant est donné sans démonstration. Le lecteur adaptera sans peine la preuve
donnée dans le chapitre d'artihmétique dans Z au cas des polynômes.
Proposition 13.38. La· relation de congruence modulo· P est une relation d'équivalence.
14
Voir les chapitres 14 et 28.
15
Elle suit point par point la preuve du lemme analogue sur Z décrit page 284
321
L'ensemble des règles de calcul sur les congruences est consigné dans la proprosition sui-
vante dont la preuve, laissée au lecteur, est en tout point analogue au cas des entiers relatifs.
Proposition 13.40. L'anneau (K[X], +, x) est principal, c'est-àrdire que ses idéaux sont
exactement les sous-ensembles de la forme
PK[XJ = {PQ I Q E K[X]} où P E K[XJ.
1
'O
i::
.s
polynômes, -v = deg .
PREUVE. L'ensemble PJK[X] + QJK[X] est un idéal de JK[X], voir le test 13.22. D'après la
caractérisation des idéaux de JK[X], il existe D E JK[X] tel que PJK[X] + QJK[X] = DJK[X]. Si
P = Q = 0, on a clairement D = O. Sinon, par exemple si P -f. 0, D -f. 0 car P = 1 x P+0 x Q E
DJK[X]. Puisque DJK[X] = D1lK[X] si et seulement si D ~ 01, un tel polynôme D est unique
si l'on impose que son coefficient dominant soit égal à 1. ■
Le pcgd porte bien son nom : pour (A, B) -f. (0,0), AAB est un diviseur de A et B, et
il s'agit du diviseur unitaire de plus grand degré parmi les diviseurs communs à A et B. La
proposition suivante résume ces deux propriétés.
Il est clair que, pour tous polynômes A, B et C de JK[X], on a (AC)/\ (BC) ~ (A/\ B) C.
EXEMPLE 13.44. On a (X- 1) /\ (X 2 - 1) = X- 1 car X- 1 est le diviseur unitaire de plus
2
1 grand degré de X - 1 et qu'il divise X - 1.
L'algorithme d'Euclide permet de calculer le pgcd de deux entiers relatifs par divisions
euclidiennes successives. Il est fondé sur le lemme suivant.
323
Ce raisonnement est classique : puisque le pgcd est le diviseur unitaire de plus grand
degré de l'ensemble ÇJ?A,B des diviseurs de A et de B (pour B i- 0), on a A/\ B = B /\ R si et
seulement si Çl,1A,B = Çl?B,R·
Proposition 13.46. (Algorithme d'Eudide) Soient A et B i- 0 deux polynômes. On
note Ro = A, R1 = B. R existe ·un·entier no #' 2 pour lequel le reste Rn dans la division
~
euclidienne de Rn-i par Ri.-1 est défini \in~ no avec Rno =O. On a alors AAB Rnc~1-
PREUVE. Les polynômes R0 , R1 et R2 sont bien définis car B i- O. Supposons construits
les polynômes R0 , Ri, ... , Rn-l où n ? 3. D'après le théorème de la division euclidienne, si
Rn-l i- 0, on peut effectuer la division euclidienne de Rn-2 par Rn-1 et le reste Rn vérifie
0 ~ deg (Rn) < deg (Rn-1 ). On remarque alors qu'il existe nécessairement un rang n 0 pour
lequel Rno = 0, car sinon la suite {deg (RnllnEN* serait bien définie, à valeurs dans N et
strictement décroissante, ce qui est absurde. D'après le lemme 13.45, pour tout 1 ~ k ~ no,
A/\B = Rk-1 /\Rk = Rno-1 /\Rno = Rno-1 /\0 ~ Rno-1· ■
A/\B est associé au dernier reste non nul dans l'algorithme d'Euclide
16
Car si B = 0, on a directement A/\ B ~ A.
324
obtient (X 5 - X4 + X3 - X 2 + X - 1) /\ (X 2 - 1) = X - 1.
Proposition l.~.48. Le pegd. à~ 'deux, polyn/Jmes de R[X] ·esf,;égal ··au_· pgcd dê êes deu:r;
polyiiOmes ,xinsidérés commé éléments de CfXl. . . . .. ·•
......
......
Cl)
PREUVE. Soient A et B dans JR.[X] avec B =/= O. Notons Q et R le quotient et le reste dans la
~ division euclidienne de A par B dans JR.[X]. Comme A= BQ+ R avec (Q, R) E C[X] tels que
deg (R) < deg (B), on constate que la division euclidienne de A par B dans C[X] est la même
que dans JR.[X]. Comme l'algorithme d'Euclide ne repose que sur la division euclidienne, la
proposition en découle. ■
Définition 13.49. Deux polynômes A et B sont dits premiers entre eux lorsque leurs seuls
diviseurs communs sont les constantes non nulles, autrement dit lorsque A/\ B = 1.
EXEMPLE 13.50. Pour tous a et b dans OC, (X- a)/\ (X- b) = 1 si et seulement si a=/= b.
► Prouvons(=}) par contraposition: si a= b, on a (X-a) A(X-b) =X-a=/= 1. Prouvons
l'implication ({cc=) . Soit D un diviseur commun à X - a et X - b. Comme D divise aussi
X- b - (X- a)= a - b cf. 0, D est une constante non nulle. Ainsi (X - a) A(X- b) = 1.
Comme dans Z, une égalité du type AU+ BV = 1 s'appelle une relation de Bezout.
L'algorithme d'Euclide permet de déterminer des relations de Bezout sur IK[X].
325
X3 +2 -2X-1
- (X 3 + (l/2)X 2 )
-(1/2)X 2 + (1/4)X-1/8
x44-1 1 xx3 +2 -(1/2)X 2 +2
- (X +2X) - (-(1/2)X 2 - (1/4)X)
-2X-1 (1/4)X+2
- ((1/4)X + 1/8)
15/8
Soient A1,A 2 et B trois polynômes tels que BAA1 = BAA2 = 1. Il existe alors un
quadruplet de polynômes (U, V, W, Z) tels que UA1 + VB = WA2 + ZB = 1 d'où
Prop0$ition 13.53. . Soient A1, ... , An et B dans K[X] tels que \lk. E Nn , B AAk = 1.
Altfrs B X{A1 • .c.An) 1.= . .
EXEMPLE 13.54. Prouvons que, pour tous a i- b dans Il{ et tout (n, m) E N2, on a
(X-u)nA(X- b)m = 1.
► Puisque ai- b, on a (X-a) A(X- b) = 1 (voir l'exemple 13.50 de la page 324). On déduit
de la proposition 13.53 que (X - a)n /\ (X - b) = 1 puis que (X - u)n A (X - b )m = 1.
Les quotients de A et B par leur pgcd sont deux polynômes premiers entre eux.
PREUVE. Comme AIK[X] + BIK[X] = DIK[X], il existe (U, V) E IK[XJ2 tel que D = AU + BV
et donc D = D(A 1U+ BiY). Comme (A, B)-/- (O, O), D-/- 0 et l'on a A 1U+ B1V= 1, et donc
A1 AB1 = 1. ■
PREUVE. Puisque Al BC, il existe A 1 E IK[X] tel que BC = AA1. Comme AAB = 1, il existe
(U, V) E IK[X]2 tel que AU+ BV = 1. On a donc C = ACU + BCV = A(CU + A 1V) et donc
AIC. ■
Lemme 13.57. Soient A1 ,A2 et B dans KfX] tels qùe A1 AA2 = 1, A1 IB et A2I B. Alors
A1A2IB.
PREUVE. Comme A11 B, il existe Q1 E IK[X] tel que B = A1Q1. Puisque A2AA1 = 1 et
A21 B, on déduit du lemme de Gauss que A21 Q1 et donc que A1A21 B. ■
On en déduit le résultat suivant par une récurrence évidente sur l'entier m EN*.
Proposition 18.58. Soient A 1, A2, ..• , Am et B dans K{X] · tels que, pour tout (i, jJ E N~
vérifianti-j. j, AiAAi = 1 et Atl B. Alors A1A2 .•. Ami B.
Comme dans le cas des entiers relatifs, on prouve sans peine que le pgcd définit une loi
associative sur IK[X], ce qui donne un sens au pgcd P1 I\ ... I\ Pn d'un nombre fini n ), 1 de
polynômes Pi, ... , Pn de IK[X].
Définition 13.59. On dit que des polynômes A 1, ... , An sont premiers entre eux dans leur
ensemble lorsque A1 I\ ... AAn = 1.
Comme dans le cas de deux polynômes, A1 I\ ... AAn = 1 si et seulement si il existe une
relation de Bezout entre les Ai, c'est-à-dire s'il existe des polynômes U 1, ... , Un dans IK[X]
tels que A1 U1 + ... +AnUn= 1.
327
Comme dans le cas du pgcd, la terminologie ppcm signifie deux propriétés : pour A et B
non nuls, A vB est un multiple de A et de B, et il s'agit du multiple unitaire de plus petit
degré commun à A et B. La proposition suivante résume ces deux propriétés.
Comme dans le cas des entiers relatifs, on prouve que pour tous polynômes A et B non
nuls, c(A /\ B )(Av B) = AB où c désigne le coefficient dominant de AB. On en déduit que
le ppcm de deux polynômes à coefficients réels considérés comme éléments de lll[X] coïncide
avec le ppcm de ces mêmes polynômes considérés comme éléments de IC[X]. En particulier,
si A/\ B = 1, alors Av B ~ AB. On prouve également sans peine que, pour tous polynômes
A, B et C dans OC[X], (AC) v (BC) ~ (A vB)C.
2 2 2
EXEMPLE 13.62. On a (X 2 -9) v (X +5X+6) = (X -9)(X+2) car X -9 = (X-3)(X+3),
2
1 X +5X+6= (X+3)(X+2) et (X-3)A(X+2) = 1.
Le ppcm définissant une loi de composition associative sur OC[X], on définit par récurrence
le ppcm A 1 v ... v An d'un nombre fini n ;;?; 1 de polynômes A 1, ... , An de OC[X].
Une équation de la forme P(cx) = 0 où P E OC[X] est appelée une équation algébrique sur
K Elle est dite de degré n EN lorsque deg (P) = n. Le lecteur est renvoyé au chapitre sur les
nombres complexes où il trouvera la méthode générale de résolution des équations algébriques
de degré deux sur C.
17
Le terme «racine» provient d'une analogie avec un arbre : les cœfficients sont les branches de l'arbre, les
racines sont la partie souterraine, cachée du polynôme.
328
IV.1. Généralités
,îf~liÎJZt(Uf S~~t P € K[XJ .tt 4•E IC Alors a
s(~+~f~. · · · · · · est une màne. d~;f:met
· · ijüle~nt
· · ·· ·
PREUVE. Effectuons la division euclidienne de P par X - a =/= 0 : on a vu (à la page 318)
qu'elle s'écrit P = (X - a)Q + P( a). Comme X - a I P si et seulement si le reste R dans la
division euclidienne de P par X - a est nul, on voit directement que X - a I P si et seulement
si P(a) = 0, c'est-à-dire a est racine de P. ■
PREUVE. Puisque ai =/= ai pour i =/= j, les polynômes X - ai sont deux à deux premiers entre
eux et divisent P, on en déduit que (X - a1) ... (X - am) P. 1 ■
On en déduit immédiatement que le seul polynôme admettant une infinité de racines dans
1K est le polynôme nul.
Nous avons démontré dans le chapitre consacré aux nombres complexes que tout polynôme
de degré deux à coefficients dans C admet une racine dans C. Ce résultat est généralisable à
un polynôme de degré quelconque mais non constant.
PREUVE. Prouvons la propriété par récurrence sur n ;;::: 1. Le résultat est clair au rang 1. ~
Supposons le résultat acquis au rang n ;;::: 1 et considérons un polynôme P de degré n + 1.
Ill
•Ill
D'après le théorème de d'Alembert-Gau ss, P admet une racine Zn+1 E C. Ainsi, il existe
Q E C[X] tel que P = (X- Zn+ilQ. Comme deg (Q) = n, on déduit de l'hypothèse au rang n
l'existence de z 1 , ••• , Zn, À dans (C tels que
1
•Ill
"O
.s
n n+l
TI (X- zk)- §
Q = À TI (X- Zk) d'où P = (X- Zn+ilQ = À k=l •cd
s
rJJ
k=l
<O
L'hypothèse est donc vraie au rang n+ 1. On déduit du principe de récurrence que la propriété
est vraie pour tout entier naturel non nul n. ■
i
C".Ï
,-<
Définition 13. 70. On dit qu'un polynôme P E JK[X] est scindé sur 1K lorsqu'il existe n E N*, ..d
ü
X1, ... , Xn dans 1K et À E 1K tels que
n
P=ÀTI(X-xk l-
k=l
Autrement dit, un polynôme est scindé sur 1K si et seulement si il est le produit de poly-
nômes de JK[X] de degré un. On peut donc reformuler ainsi le théorème de d'Alembert-Gau ss :
tout polynôme de C[X] non constant est scindé sur C.
PREUVE. Soient P1 et Pz dans JK[X] tels que F(Pi) = F(Pz), soit P1 = Pz. Cela signifie que,
pour tout élément x de lK, on a P1(x) = Pz(x). Ainsi, \/x E JK, (P 1 - Pz)(x) = O. Puisque
1K = lR ou (C est de cardinal infini, le polynôme P 1 - Pz admet une infinité de racines dans 1K :
il est donc nul et P1 = Pz. ■
330
Autrement dit, deux polynômes à coefficients dans IR ou <C sont égaux si et seulement
si leurs fonctions polynomiales associées sont égales. Le lecteur aura remarqué que le caractère
infini du corps OC joue un rôle central dans cette démonstration. Comme nous l'avons vu en
introduction de ce chap~re, l:,s polynômes P 1 = X3 + X et P2 = X2 + X sur OC = lF 2 = {O, î}
sont distincts bien que P1 = Pz.
PREUVE. Puisque a est une racine de P, l'ensemble E = {k EN* 1 (X - u)k I P} est non vide.
Comme P est non nul, E est majoré par deg (P). En tant que partie non vide et majorée de
N, l'ensemble E admet un plus grand élément n. ■
Proposition .13..'1'3. Si ah ...· , Um sont des racines deux à deux dîstin<;tes de, m'll,ltiplîcités
re/i'pectives ni.; ...., n.m de P E K[X], alors (X - a., )"11 ••• {X - Om.} nm j P.
PREUVE. Puisque ai cf. ai pour i cf. j, les polynômes X - ai sont deux à deux premiers entre
eux, et il en est donc de même des polynômes (X - ai)lli qui divisent P. On en déduit que
(X - ai)n, ... (X - Um)nm I P. ■
Corollàir_; 1$';74. Tout polynôme de :II{[XJ de degré n admet au plus n, racines. dans K
comptées avec leurs multiplicités.
p(nl = [(X- a)nQ](n) = f_ (n)C [(X- a)n](e)Q(n-e) = f_ (n)C (n n!- C)! (X- a)n-eQ(n-eJ,
C=O C=O
3) =} 1). Comme p(nl(a) =f. 0, p(nl =f. 0 et ainsi p = deg (P) ? n. D'après la formule de Taylor
au point a,
p = ~ p(kl(a) (X- a)k = ~ p(kl(a) (X- a)k = (X- a)n ~ p(kl(a) (X- a)k-n_
L k! L k! L k!
k=0 k=n k=n
P p(kl(a) p(nl(a)
Posons alors Q = r.--(X-a)k-n_ On a P = (X-a)nQ et Q(a) = - -1- =/- O. On en
k! n.
k=n
déduit par l'absurde que P n'est pas divisible par (X - a)n+l : si c'était le cas, il existerait
Q 1 E JK[X] tel que P = (X - a)nQ = (X- a)n+ 1Q1. JK[X] étant intègre et (X- a)n =/- 0, on
aurait alors Q = (X- a)Q 1 d'où Q(a) = 0, ce qui est absurde. ■
Les racines appartenant à C\JR d'un polynôme à coefficients réels vont toujours par deux:
on peut les regrouper par paires de racines conjuguées. Ce résultat repose sur le lemme suivant.
Appliquons ce lemme aux couples de racines conjuguées d'un polynôme à coefficients réels.
Proposition 13.77. Soient P E R{X], n EN* et a E C. Le nombre a est une mcine de P
de multiplicité n si et seulement si le nombre ëï est 'U,ne mcine de P de multiplicité n.
PREUVE. On déduit du lemme 13.76 que, pour tout entier naturel k, p(kl(a:) = p(kl(a). Ainsi
p(kl(a) = 0 si et seulement si p(kl(a) = 0, d'où le résultat. ■
4 2
EXEMPLE 13. 78. Déterminer les racines du polynôme p = X6 +X 5 +3X +2X 3 +3X +X+ 1
sachant que i en est une racine multiple.
► On a P(i) = P'(i) = 0, mais P"(i) =-Si=/- O. Le nombre i est donc une racine de P de
multiplicité deux. Puisque P est à coefficients réels , -i est également une racine de P de
multiplicité deux. Pest donc divisible par (X-i)2(X +i) 2 = (X 2 + 1)2. En posant la division
euclidienne, on trouve P = (X 2 + 1)2(X 2 +X+ 1). Comme X2 +X+ 1 = (X - j)(X - j2), les
racines de P sont i, -i (racines d'ordre deux) et j, j 2 (racines simples).
332
Les fonctions crk : ocn --+ JK, pour 1 ~ k ~ n, sont appelées les fonctions symétriques
élémentaires d'ordre n.
La notation est ambigüe : cette fonction dépend également de l'entier naturel non nul
crk
n. On écrira souvent crk au lieu de crk(x1, .•. , Xn) afin d'alléger les notations. Par exemple,
pour n = 2, on a cr 1 = X1 + Xz et cr2 = X1X2 ; pour n = 3, on a cr1 = x1 + xz + x 3 ,
CTz = X1X2 + XzX3 + X3X1 et 0"3 = X1X2X3.
L'adjectif « symétrique» signifie que les fonctions crk sont invariantes par permutation
quelconque de leurs n variables : pour tous X1, Xz, ... , Xn dans lK, on a crk(Xi:(1), .•• , Xi:(n)) =
crk(x1, ••• , Xn).
EXEMPLE 13.80. Soit n E N*. Exprimons les fonctions symétriques élémentaires d'ordre
n + 1, [k, à l'aide des fonctions symétriques élémentaires d'ordre n, CTt, pour tout k compris
entre O et n + 1.
► Soient X1, ... , Xn, Xn+l dans lK. On a L1 = cr1 + Xn+l, et, pour tout 1 ~ k (; n,
On rencontre les fonctions symétriques élémentaires lorsque l'on cherche à développer des
expressions du type rr
n
k=l
(X - Xk)- Par exemple,
2
(X - x1)(X - Xz) = X - (x1 + Xz)X + x1x2 = X
2
- cr1X + cr2,
333
On calcule donc les coefficients d'un polynôme dont on connaît les racines au moyen des
fonctions symétriques élémentaires. La proposition suivante généralise nos calculs à un nombre
n ~ 1 quelconque de racines.
k.;,1
(X-xk). Alors,
Connaissant les coefficients d'un polynôme P E C[X], on peut calculer les sommes de
Newton associées aux racines complexes de P.
On peut trouver les coefficients d'un polynôme en calculant les fonctions symétriques
élémentaires en ces racines.
18
Ce théorème relève de la théorie des polynômes à n indéterminées, sujet qui n'est pas à notre programme.
Nous nous contenterons de quelques exemples et ne donnerons aucun résultat plus précis.
335
Un polynôme irréductible sur lK est donc «incassable» par division dans JK[X].
Avant de décrire tous les irréductibles sur lR et C, nous passerons en revue quelques
exemples.
PREUVE.
1) On a {P E C[X], deg {P) = 1} C .fc d'après l'exemple 13.85. Soit P E C[X] tel que
deg (P) ~ 2. D'après le théorème de d'Alembert-Gauss, il existe a E C tel que P( a) = 0 et
donc X - a IP : P n'est pas irréductible. On en déduit l'inclusion réciproque.
- 2) Commençons par prouver qu'un polynôme de degré supérieur ou égal à trois n'est pas
irréductible. Soit P un tel polynôme. D'après le théorème de d'Alembert-Gauss, il existe
a E C tel que P( a) = O. Si a E JR, X - a I P et X - a E JR[X] donc P n'est pas irréductible sur
R Si a'/. JR, on sait que P(êï) = 0 et P(a) = 0, donc que X- êïl Pet X- al P. Comme Pest
à coefficients réels et a -=f. êï, êï et a sont deux racines distinctes de P, d'où (X - a)(X - êï) 1 P.
Or, (X - a)(X - êï) = X 2 - 29tc(a)X + lal 2 E JR[X]. Comme deg (P) ~ 3, on en déduit que
P n'est pas irréductible sur R Il reste à examiner le cas des polynômes de degré deux. Soit
P E JR[X] de degré deux. P n'est pas irréductible sur lR si et seulement si il admet un diviseur
de degré un dans K[Xl, c'est-à-dire de la forme ;\(X - ix), où À ER.* et <XE R Ainsi, P n'est
pas irréductible sur lR si et seulement si il admet une racine réelle, c'est-à-dire si et seulement
si son discriminant est positif. ■
sur K Si ce n'était pas le cas, Do admettrait un diviseur unitaire D1 de degré strictement <O
inférieur à no et non constant. On aurait donc deg (D 1 ) E E et deg (Di) < n 0 = min(E), ce .§,
qui est absurde. ■ ~
....C')
..d
~nune 13;.9\. Soient P E JKOO un polynôme irréductible sur K et A E K[XJ. Alors C,)
PREUVE. Si PI A, le résultat est acquis. Sinon, d'après le lemme 13.91, P AA = 1 et, d'après
le lemme de Gauss, on a PI B. ■
19
Et qui a l'avantage d'être généralisable à un corps K quelconque.
338
HR(l) est clairement vraie car dans ce cas P est de la forme P = aX + b, avec a-/- 0, et
r/J
CL)
il suffit de poser À= a et P 1 =X+ b/a pour décomposer P en P = ;\P 1 avec P 1 irréductible
~ sur JK.
Soient n ~ 1 et P E JK[X) un polynôme de degré n + 1. Supposons HR(n) vérifiée. D'après
J~
'9
le lemme 13.90, le polynôme P admet au moins un diviseur irréductible unitaire Q. Comme
le quotient Q 1 de P par Q est de degré inférieur ou égal à n, on peut appliquer HR(n) : il
r/J existe un entier m E N, un nombre À E JK*, un m-uplet de polynômes irréductibles unitaires
deux à deux distincts (P1, ... , Pml et un m-uplet d'entiers naturels non nuls ( <X1, ... , <Xm) tels
que Q1 = ÀTI~ 1 P~k et donc P = ÀQ x TI;:'= 1 P~ : HR(n + 1) est donc vraie.
J o Unicité. Supposons que P s'écrive
k=l
p= À rr
m
k=l
p~ = µ
Qek rr
m'
avecµ et -v dans JK*, les Pi irréductibles et unitaires deux à deux distincts, idem pour les Qi;
m et m' dans N* ainsi que les ak et les f3t- Soit 1 ~ k ~ m. Comme les polynômes Pi et
Qi sont unitaires et µ et À ne sont pas nuls, À et µ sont égaux au coefficient dominant de P.
Puisque <Xk ~ 1, Pk I P, donc d'après le lemme d'Euclide, il existe 1 ~ i ~ m' tel que Pk I Qc
et donc, puisque ces deux polynômes sont irréductibles sur lK, Pk ~ Qc et comme ils sont
unitaires, on a Pk = Qc. On a donc prouvé que
Les deux décompositions du polynôme P jouant des rôles symétriques, l'inclusion réciproque
est également vérifiée. On a donc égalité des deux ensembles qui sont de cardinal m = m'.
De plus, quitte à réindexer les polynômes Qi, on peut supposer que Pk = Qk, pour tout
1 ~ k ~ n. Notons K+ = {k 11 ~ k ~ m, <Xk > f3k} et K_ = {k 11 ~ k ~ m, f3k > ak}. On a
alors 20
rr
m
k=l
p~k =
k=l
rr
m
pek
kEK+
p~-f3k =
=} rr pek-<Xkrr
kEK-
et comme K+ n K_ = 0, on déduit du lemme d'Euclide que l'un des ensembles K+ ou K_ est
v1.de. On a done TI kEK+ p<Xk-f3k
k = 1 ou TI kEK- pf3k-<Xk
k = 1, ce qui· entrame K+ = K_ = 0 car
A
tout polynôme irréductible sur 1K est de degré supérieur ou égal à un. Ainsi, \fk E Nm, ak = f3k,
ce qui achève de prouver l'unicité (à permutation près) des couples (P 1,a1), ... ,(Pm,<Xm)
décrits dans l'énoncé.
p =À rr rx -
n
k=l
zkl-
20
Rappelons la convention Il k E 0 ak = 1.
339
toutes ses racines complexes sont réelles, c'est fini. Sinon, on note r 1 , ... , Tm les racines réelles r,"i
Il
de P et z 1 , ... , Zr, z 1 , ... , :ZC les racines de P qui appartiennent à (('. \ li (on sait qu'elles vont ~
par paires de conjugués d'après la proposition 13.77 page 331). On a donc 00
r f r f ~
P= À TI (X - Tk) I] (X - zk) (X - zk) = À TI (X - Tk) TI (X 2
- 2 9le(zk)X + lzkl 2 )
LJ
Comment passer de (C à IR ?
En revanche,
2
P"(j) = 42(1 + j) 5 - 42j 5 = 42(-j2) 5 - 42j2 = -42j 10 -42j2 = -42j - 42j = 42 -f 0.
P= f_
k=O
G)xk-x -1 = f_k=l G)xk_
7
l
-g
..s VI. EXERCICES
[/J
](.)
13.1. 13.3.
13.8. 13.10.
ab
C
be
a
ac
b
3. Prouver que
3 < L kn < 3 .
k=l <O
Résoudre dans (('. le système suivant :
E,
5. Montrer que la suite de terme général ~
(")
n 1 ......
Un= L
k=l
k2 ..d
ü
converge vers 1·
COMPLÉMENT 1. DES RACINES
Il existe des algorithmes très performants pour calculer une valeur approchée d'un zéro d'un
polynôme à coefficients réels sur la droite réelle. Nous verrons par exemple au chapitre 26 une
de ces méthodes couramment utilisée, la méthode de Newton. Cependant, il est généralement
nécessaire de connaître déjà un encadrement suffisamment précis de ce zéro pour que ces algo-
rithmes convergent. Pour approcher les zéros d'un polynôme, il faut donc trouver un premier
algorithme capable de localiser ces zéros, c'est-à-dire de donner de premiers encadrements qui
isolent chaque zéro et indiquent dans quelle région de la droite lR il faut les chercher.
Considérons par exemple le polynôme P = 4X 3 - 6X 2 + 1. Comme le degré de P est
impair, P(x) tend vers -oo quand x tend vers -oo, et vers +oo quand x tend vers +oo.
Par le théorème des valeurs intermédiaires, il existe donc au moins une racine c E lR telle
que P(c) = O. En fait, un peu d'arithmétique élémentaire montre que P a un unique zéro
rationnel, en c = 1/2. Or, P'(l/2) = -3 < O. Cela signifie que P(x) < 0 pour x > 1/2 et
P(x) > 0 pour x < 1/2, six est très proche de 1/2. Il en résulte que Pa deux autres racines
C1 < 1/2 < C2 sur la droite réelle. En fait P(2) = 9 et P(-1) = -9, ce qui nous permet de
préciser que -1 < c 1 < 1/2 < C2 < 2. Il est possible ensuite de recourir à des méthodes plus
efficaces pour calculer des valeurs approchées de C1 et C2 : un argument de convexité montre
que la méthode de Newton converge vers C1 si l'on part de -1 et qu'elle converge vers c 2 si
l'on part de 2.
Cet exemple montre comment la relation d'ordre sur lR donne des renseignements sur
l'emplacement des zéros. Une suite de Sturm est un outil plus sophistiqué pour extraire des
informations sur les zéros d'un polynôme du fait que lR est totalement ordonné. Notons qu'il
n'est pas anodin de choisir de travailler dans lR plutôt que dans C En effet, les racines réelles,
même comptées avec multiplicité, ne rendent pas compte de toute l'information contenue dans
un polynôme, même à coefficients réels. Par exemple, le polynôme X3 + X2 = X(X 2 + 1) a une
seule racine réelle. Ses racines ±i ne sont pas "visibles" dans R C'est le prix à payer pour
travailler sur un corps totalement ordonné.
j
1.1. Suite de Sturm et transversalité
Nous commençons par parachuter la définition des suites de Sturm et ses propriétés arith-
métiques. Le but de cette partie est de donner un sens géométrique et plus parlant à cette
définition et à ses conséquences.
LçmEî 13.95. Soit Po, P1 dans RP(]~aflèe P1 #: 0, Alors ta sùite de Stfftm associée à
(P-0,Ph 1PNJ véri,fiele~ propr;iêté§ suivantes.
1) Pt,t est lèplw:gmnd:dsviseuf commun de Po et P,,
2) PN tlivise thi1,q'ue polynûme Pk pwr O:f k ::; N et
SÎlt~fPo/PN;t>Ù~~)'~ {P~/tN,• .. •~k!P~, ... ,tj.
a). fou,- .twt c e, llk J, •
Nous allons considérer la manière dont cette courbe rencontre l'axe des abcisses.
► Si Pk( c) > 0 et Pk+l (c) > 0, alors le segment joignant (k, Pk( c)) au point (k + 1, Pk+l (c))
ne rencontre pas l'axe des abcisses. En effet,
ou bien 0 <ex~ 1, (1 - cx)Pk+i(c);?: 0 et cx.Pk(c) + (1 - cx)Pk+ 1(c);?: cx.Pk(c) > 0,
ou bien 0;?: ex< 1, cx.Pk(c);?: 0 et cx.Pk(c) + (1-cx)Pk+i(c);?: (1-cx)Pk+i(c) > O.
Dans les deux cas, on a bien cx.Pk(c) + (1 - cx)Pk+i(c) > O. On peut traiter de manière
analogue le cas où Pk( c) < 0 et Pk+l (c) < O.
► Si Pk(c) > 0 et Pk+ 1(c) < O. alors le segment joignant (k, Pk(c)) au point (k + 1, Pk+ 1(c))
coupe l'axe des abcisses en exactement un point. En effet, on résout l'équation
Notation. On rappelle que pour deux points A1 = (x1,1J1) et A2 = (x 2,Yz) dans 112, un
paramétrage du segment [A 1;Az.] est donné par
21
Par exemple, une sphère de dimension 2 dans ll 3 rentre dans cette catégorie, car, comme le montre notre
expérience quotidienne au point qu'il fallut longtemps pour que cette évidence bien ancrée dans les esprits les
moins avertis ne soit considérée comme une naïveté, la surface terrestre est (localement) plane.
Définition 13.96. Soit (C 0 , ... , CN) E lllN+l une liste de nombres réels. On lui associe la
ligne brisée, notée [Co, ... , CNl C lll 2 , définie par
N-1
[Co, ... , CNl = LJ [rk, Ck); (k + 1, Ck+il].
k=O
On dit que la ligne [C 0 , ... , CNl est transverse à l'axe des abcisses si les deux conditions
suivantes sont remplies.
1. C0 -/- 0 et CN-/- O.
2. Si ck = 0 pour un entier 1 ::; k::; N - 1, alors ck-1 Ck+l < O.
Lemme . 13JJ7. $oit . {Po, ... , PN)' une suite . de: Stn. St Po{è) #:- ··o, alors
[P 0 (c}, P 1 (c), ••• , PN(cJJ est transvei-se â l'axe des abcisses.
PREUVE. C'est une reformulation du lemme 13.95 3). En effet, si P0 (c)-/- 0, alors PN(c)-/- 0
et le reste de la condition de transversalité est une traduction immédiate de (13.2). ■
Définition 13.98. Soit Cff = [C 0 , ••• , CNl une ligne brisée. Le nombre de croisements de Cff,
noté V(C), est le nombre de changement de signes de la liste (C 0 , ••• , CNl- C'est le nombre
d'éléments non nuls dans cette liste dont le premier successeur non nul est de signe opposé.
On convient que si la liste est identiquement nulle, alors ce nombre vaut zéro.
Notation. Soit 9 = (Po,•·· , PN) une liste de polynômes à une indéterminée à coefficients
réels. On note V(9)(c) = V([Po(c), ... , PN(c)l).
On remarquera que si l'on note cx9 = (cxP 0 , • · · , cxPN), alors
V(9) = V(cx9) pour tout ex E JR\{O}. (13.4)
Lemme 13.101. _An,r tous>noml,res réels <1 < b, la fonction V(9) : [a, b] .; N est en
esc,a,lîer: îl e:,;istè une subdivision a= ao < a.1 • • • < a 11 = b telle que V{9)(c) est consta1>;te
quand c décrit chaque interualle ouvert la.1,;, a1ç+1 [, 0 :5 k $ p - 1.
PREUVE. Soit {c 1 , · · • , en} C lR l'ensemble des zéros sur la droite réelle des polynômes
P0 , ••• , PN. Quitte à élargir l'intervalle [a, b] et à réindexer la famille (cd1::;,::;n, on peut sup-
poser que a< c 1 < · · · < Cn < b. On pose p = n + 1, ao = a, ak = C1ç pour 1 $ k $net
Un+l = b. Cette subdivision de l'intervalle [a, b] est adaptée à la fonction V(9). En effet, les
polynômes Pi, 0 $ j :::::; N, ne s'annulent pas sur les intervalles ]a1ç, ak+l [, 0 :::::; k $ n. Aussi
Pi(c) garde-t-il un signe constant sur ]ak, ak+l [ en vertu du théorème des valeurs intermé-
diaires. Donc V( 9)( c) reste constant quand c décrit ] ak, ak+l [. ■
De combien « saute » V( 9) (c) quand c passe par un zéro? Pour répondre à cette question,
nous avons besoin de la notion d'indice de Cauchy.
Définition 13.102. Soit P0 , P1 E JR[X] avec Po-=/ 0 et soit Q la fraction rationnelle définie
par Q = Pi/Po. Soit a< b dans R tels que P0 (a)-=/ 0 et Po(b)-=/ O. L'indice de Cauchy de
Q sur l'intervalle ]a, b[ est la différence entre le nombre de sauts de -oo à +oo et le nombre
de sauts de +oo à -oo de la fonction rationnelle x H Q (x) quand x varie de a à b. On le
note I~(Q).
_ X(2X + 1) +oo _ _
EXEMPLE 13.103. Pour Q - (X+ )(X 2 _ l), on a L 00 (Q) - 2-1 - 1.
2
En effet la fonction x H Q(x) est définie sur JR\{-2, -1, l}. Elle saute de -oo à +oo au
passage de -2, de +oo à -oo au passage de -1 et de -oo à +oo au passage de 1. Pour voir
cela, on peut décomposer Q en éléments simples.
2 1/2 1/2
Q=x+2-x+1 +x-1·
o Cas où Po et P1 sont premier entre eux. Soit Co un zéro d'un des polynômes Pk, avec
a :S: c 0 :::; b et O :S: k < N (le polynôme PN est constant non nul).
- Si P 0 (c 0 )
-/- 0, Alors [P 0 ( Co), ... , PN(c 0 )] est transverse à l'axe des abcisses et le lemme 13.100
montre que V( c) reste constant pour c proche de c 0 •
- Si P 0 (c 0 ) = 0, alors P1(co) -/- 0 et V= V(Po, Pi)+ V(P1, ... , PN) au voisinage de Co. Le
cas précédent appliqué à Sturm(P1, Pz)= (Pi, Pz, ... , PN) montre que V(P1, ... , PN) ne varie
pas au passage de Co.
Étudions la variation de V(P 0 , P1) au passage de c 0 . Comme P0 n'est pas identiquement
nulle et que P1 (col-/- 0, la fraction Pi/Po a un pôle en Co. Or, V(Po, P1)(c) = 1 si P 1(c)/P 0 (c) <
0 et V(P 0 , P1)(c) = 0 si P1(c)/Po(c) > O.
Pi/Po(col Pi/P0 (ct) V(Po, P1Hcol V(Po, P1)(ct) ~V(co)
-oo +oo 1 0 -1
+oo -oo 0 1 +1
+oo +oo 0 0 0
-oo -oo 1 1 0
Ainsi V saute de + 1 exactement quand Pi/Po saute de +oo à -oo, et de -1 exactement
quand Pi/Po saute de -oo à +oo. La variation totale V(b) - V(a) égale donc la différence
du nombre de sauts de +oo à -oo et du nombre de sauts de -oo à +oo quand c parcourt
l'intervalle [a, bl, soit encore V(b) - V( a) = -I~(Pi/P0 ), ce qui est la formule annoncée.
o Cas où Po et P1 ne sont pas premiers entre eux. Comme P0 (a)-/- 0, le lemme 13.95 3)
montre que PN (a) -/- 0. Aussi
La première identité résulte de la relation (13.4) appliquée à fllJ = Sturm((P0 , P1) et à <X=
1/PN(a). La seconde identité découle du lemme 13.95 2). De même, V(b) a une expression
analogue. On applique alors le cas précédent aux polynômes P0 /PN et Pi/PN, premiers entre
eux.
V(a) - V(b) = I~ (;:;;:) = I~ (;:), ce qui démontre le théorème. ■
2. Compter les zéros sur la droite réelle. Dans cette partie, nous montrons comment le
théorème de Sturm répond au problème de localisation des zéros que nous avons posé dans
l'introduction.
T~ème Ja,105~. Bt1it P. .E &[X] lit ,wita < b .de~ nombres réels. On S'll,pffJOse que
P(a} ,foOetf>(b) if::Q. Alor-s .
2
EXEMPLE 13.106. Considérons P = 4X 3 - 6X 2 + 1. Alors P' = 12(X - X). On calcule la
suite de Sturm de P et P' /12.
Po= 4X3 - 6X 2 + 1,
2
P1 = X -X,
P2 = 2X-1,
P3=1/4.
Quand x tend vers -oo, (P 0 (x), ... , P3(x)) tend vers (-oo, +oo, -oo, 1/4 ).
Quand x tend vers +oo, (P 0 (x), ... , P3(x)) tend vers (+oo, +oo, +oo, 1/4).
On en déduit que P a exactement 3 - 0 = 3 zéros sur R On peut alors préciser.
Remarque.
1) Chaque fonction polynômiale Pk garde un signe constant près de l'infini, qui dépend du
signe du coefficient dominant et, en -oo, du degré de Pk, Pour P = UnXn + · · · + u 0 avec
Un =f. 0, posons
al
3
p = n2-T;
Q = Y + p Y + q, avec
2af a 1a 2
q= 27 - -3- + a3.
Nous allons appliquer le théorème 13.105 au polynôme Q.
Cas où p -1- O. On calcule la suite de Sturm de Q et de Q' = 3Y2 + p.
Q O= y3 + p y + q,
Q, = 3y2 +p,
2p
Q2 = - Y- q,
3
4p 3 + 27q 2
Q3 = - 4p2
Quand x tend vers -oo. (Q 0 (x}, Q 1 (x}, Q2(x}, Q 3 (x}} tend vers (-oo, +oo, signe(p }oo, Q 3 }.
Donc V(-oo} :( 3 avec l'égalité si et seulement si p < 0 et Q 3 > O.
Quand x tend vers +oo, (Qo(x), Q 1 (x}, Q2(x), Q 3 (x}} tend vers
(+oo,+oo,-signe(p}oo,Q3}. Donc O :( V(-oo) :( 2 et V(-oo} = 0 si et seulement
si p < 0 et Q3 > O.
Il en résulte que V(-oo} - V(+oo} = 3 si et seulement si p < 0 et Q 3 > O. Notons
de plus que Q 3 > 0 # 4p 3 + 27q 2 < 0 et que cette dernière inégalité n'est possible que si
p < O. Ainsi,si p -1- 0, le polynôme Q = Y3 + pY + q a trois racines réelles si et seulement si
4p 3 + 27q 2 < O.
Cas où p = O. Si q = 0, alors Y3 a une racine triple en zéro. Si q -1- 0, alors Y3 + q a une
racine simple x 0 -1- 0 et deux racines simples conjuguèes dans C \IR de la forme x 0 exp ( ± 21).
Dans les deux cas, Q n'a pas trois racines distinctes dans R
Cas général. On a montré que pour que Y3 + p Y + q ait trois racines réelles, il faut et il
suffit que
4p 3 + 27q 2 < o.
x 2 +(y-3)2=1 (E1);
x 2 + y 2 - xy = 3 (Ez);
Si on munit JR 2 du produit scalaire canonique ((x,y),(x',y')) = xx' +yy', alors (E1) est
l'équation du cercle centré en (0,4) de rayon 1 et on peut facilement montrer que (E2) est
l'équation d'une ellipse d'axes principaux les bissectrices de JR 2 d'équations x - y = 0 et
x + y = O. Mais nous ne nous servirons pas de ce fait. On se demande quelles sont les
positions relatives de E1 et Ez.
Calculs de projection. Nous allons calculer la projection de l'ellipse E1 sur l'axe x = O.
Considérons le polynôme Py = X2 -yX +y 2 -3. La projection {y I Y E JR, :3x E JR, Py(x) = O}
est aussi l'ensemble de nombres réels y pour lesquels le polynôme Py a des racines dans R
Bien sûr, on pourrait déterminer cet ensemble par le calcul d'un discriminant. Toutefois, dans
un souci de généralité (car Py pourrait être de degré plus grand pour une autre courbe), nous
allons utiliser la suite de Sturm de Py et P~, soit encore
Po = X2 - yX + y 2 - 3;
P1 = 2X-y:
P2 = -¾y2 +3.
Si P2 < 0, alors Py a Y( +oo, -oo, -1) - Y( +oo, +oo, -1) = 1 - 1 = 0 racines réelles.
Si P2 > 0, alors Py a Y( +oo, -oo, + 1) - Y( +oo, +oo, + 1) = 2 - 0 = 2 racines réelles.
Il en résulte que la projection de E2 sur l'axe x = 0 est l'ensemble des couples (0, y) tels
que -3y 2 /4 + 3 ): 0, soit encore tels que y 2 ::;; 4. Ainsi, la projection de E2 sur l'axe x = 0
parallèlement à l'axe des abcisses est le segment {0} x [-2,2]. Comme la projection du cercle
E 1 est le segment {0} x [2; 4], le cercle E2 est à l'extérieur de E 1.
Calcul d'intersection. Les courbes E1 et E2 sont elles tangentes? Bien qu'un peu de géomé-
trie pourrait répondre à cette question, faisons le calcul. On paramètre le cercle par l'équation
X= cos0·
y= 3 + ~in0;
{ 0ER
On développe. Il vient
Il nous reste à appliquer le théorème 13.105 au polynôme Q = 5X4 + 7X3 + 7X 2 + SX + 2. Le
lecteur consciencieux vérifiera que l'on obtient la suite de Sturm
Q 0 = 5X4 + 7X3 + 7X 2 + SX + 2;
Q 1 = 20X 3 + 21X 2 + 14X + 5;
2
Q2 = fo(-133X -202X-125);
Q 3 = 1; :9 (-348X-509);
Q 4 -_ 13815109
1211040 •
Le polynôme Q a donc V( +oo, -oo, -oo, +oo, +) - V( +oo, +oo, -oo, -oo, +) = 2 - 2 = 0
racines réelles. Les courbes E1 et E2 sont disjointes et E1 est à l'extérieur de E2.
Chapitre 14
FRACTIONS RATIONNELLES
ous savons que l'ensemble des nombres rationnels, muni des lois d'addition et de mul-
1) Il existe un corps JK(X) qui contient l'anneau JK[X] et dont les lois prolongent celles de
JK[X]. Autrement dit, l'injection i: JK[X] ----, JK(X) : PH P est un morphisme d'anneaux.
2) Tout élément de K(X) s'écrit sous la forme ~ avec P E JK[X] et Q E JK[X] \ {O}.
x=(~)·(Q·x)EK
comme produit de deux éléments de K. Nous venons ainsi de montrer que lK(X) C K. Comme
l'inclusion réciproque résulte immédiatement de la définition de K, on a bien K = JK(X),
comme annoncé.
354
~
Q
= (!.
S
s). 2-)
(p.
Q
=!.(S. P). __!_=(S. P). ! . __!_=(S. P). -
S Q S Q
1
(S · Q)
- =(P. S) · -
1
(Q · S)'
-
La structure de corps de lK(X) intervient déjà à cette étape. On a en effet utilisé l'associativité
du produit pour la deuxième égalité, et sa commutativité pour les troisième et cinquième
égalités. La quatrième égalité résulte du calcul de l'inverse du produit Q · S dans le groupe
multiplicatif (lK(X))*. On peut montrer de la même manière que
R 1
S= (Q. R). (Q · S)'
Il reste à utiliser la distributivité de la multiplication sur l'addition. On a donc
~ ~ 1 1
+ = (P · S) · ( -- ) + (Q · R) · ( -- ) = (P · S + Q · R) · ( -- ) .
Q S Q·S Q·S
1
Q·S
Or, d'après 1), les expressions P-S+Q· R et Q·S définies a priori par des opérations dans lK(X)
peuvent tout ausi bien être vues comme le résultat des opérations usuelles correspondantes
dans lK[X]. On a donc P • S + Q · R = PS + QR et Q · S = QS dans lK[X]. On a donc exprimé
x + -y sous la forme d'un quotient de polynômes. On retiendra que
P R PR
Q S QS.
Bien sûr, avec un peu d'habitude, ces raisonnements sont très naturels et il n'est plus
nécessaire de décomposer un calcul aussi simple en autant d'étapes, ni de se demander à tout
instant si un produit ou une somme se calcule dans lK(X) ou dans lK[X]. Mais il faut savoir ce
que l'on fait.
Pour que ces calculs aient un sens, il faut toutefois s'assurer que le corps lK(X) existe bien.
Cela résulte d'une construction générale, valable pour tout anneau intègre, que nous donnons
en complément.
355
On dit que l'écriture de la fraction rationnelle ~ est irréductible lorsque les polynômes P et
Q ne possèdent pas de facteur commun non constant, c'est-à-dire que P et Q sont premiers
entre eux. L'intérêt de cette notion vient de ce que cette écriture est non seulement la plus
simple possible, mais aussi qu'elle est essentiellement unique.
1
:0
~
§
14~L ~
Proposition Soit (P,R, Q, S) .E {K00) 2 x (K[X] \ {0})2. On suppose que l'écriture
est irréductible. On a alors les propriétés suivantes .•
1
-sj<
1) t= lsi et seuliYm!:nt s'il existe RtE K{X}\ {O} tel qué R= PR1 etS='QR 1•
......
..d
ü
2) L'ecriture} dela:J'raction i est irréductible si étseulement s'îl existe), E K\{O} tel que
R=AP etS=AQ.
et on convient que le degré de la fraction nulle est -oo. Cette définition prolonge celle du
degré d'un polynôme et on retrouve les propriétés analogues à celles de ce dernier.
deg (F1 F2) = deg F1 + deg F2, deg (F1 + F2) ::S; max( deg F1, deg F2) (14.2)
x 2 +2x x+2
EXEMPLE 14.2. X3 et X2 sont deux écritures de la même fraction rationnelle F.
1 La seconde écriture est irréductible la première ne l'est pas. Le degré de F est -1.
356
P(x)
F(x) = Q(x)·
D'après notre discussion des écritures irréductibles d'une fraction, il est clair que cette valeur
ne dépend pas du choix de l'écriture de F comme quotient de deux polynômes. De la même
manière que l'on peut associer une fonction polynomiale à un polynôme, on associe à F la
fonction rationnelle définie par 1K \ {u 1, ..• , uT} ----+ lK, x H F (x), où u 1, .•. , UT sont les zéros
de Q.
Étymologiquement, un pôle est un axe autour duquel on tourne (du verbe "polein", tourner,
en grec ancien) : pensez à l'étoile polaire qui indique l'axe de rotation de la voûte céleste, les
pôles géographiques du globe terrestre, et cetera ... En mathématiques, les pôles d'une fraction
rationnelle sont des points singuliers en lesquels la fonction rationnelle associée "part à l'infini".
Elle n'est donc pas définie en ce point. Nous verrons toutefois en troisième année de Licence
qu'il est très intéressant d'intégrer les fonctions rationnelles le long de chemins dans C qui
font le tour d'un pôle. C'est ce qu'on appelle le calcul des résidus, inventé par Cauchy. Pour
le moment, nous nous contenterons de préciser le comportement asymptotique de la fonction
au voisinage des pôles.
Soit F une fraction rationnelle et soit m E N*.
◊ Le nombre u E 1K est 1 un zéro de F de multiplicité m s'il existe deux polynômes S et Q tels
que
o Le nombre u E 1K est un pôle de F d'ordre m s'il existe deux polynômes Pet T tels que
(14.3)
1
On dit aussi que F possède un zéro en un point a (et de même pour les pôles).
357
lim lcp(x)I
x---tak
= +oo.
Un pôle est donc caractérisé par la propriété que les valeurs de la fonction rationnelle de-
viennent infiniment grandes lorsqu'on s'approche du pôle.
Pour les limites à l'infini on a
0 si deg F < 0 ,
lim jcp(x)I = +oo si deg F > 0,
lxHoo { ~ . d F-0
lf3I s1 eg - ,
. X2 (2X+l)
EXEMPLE 14.3. S01t f = ~ .
o Si on considère F comme une fraction rationnelle dans JR(X), alors F n'a pas de pôle. La
2
fonction rationnelle associée est la fonction cp : lR ----, lR définie par cp (x) = x ~ : l . t1
◊ Si on considère F comme une fraction rationnelle dans C(X), alors F a exactement deux
pôles, les nombres -i et i, et ce sont des pôles simples. La fonction rationnelle associée est
la fonction cp: (C \ {-i, i}----, (C définie par cp(z) = z
2 1
l. ;?:~
o Par division euclidienne 2X 3 + X 2 = (2X + 1)(X 2 + 1) - 2X - 1, donc
2X+ 1
F = 2X + 1 - X2 + l . (14.4)
Sur cette décomposition, on voit que la fonction rationnelle cp a pour asymptote la fonction
x H 2x + 1 lorsque lxl ----+ +oo. Cela signifie que pour x E JR, cp (x) - 1 - 2x tend vers zéro
quand lxl tend vers +oo.
On retient de cet exemple que l'existence des pôles dépend du corps dans lequel on tra-
vaille. En outre, on observe que la division euclidienne nous a permis de décomposer la fonction
rationnelle en la somme de deux fonctions dont l'une rend compte du comportement asympto-
tique de la fraction quand lxl tend vers +oo et dont l'autre rend compte de ses comportements
asymptotiques au voisinage des pôles.
.....
..... On retiendra que la partie polaire de ~ est égale à ~, où R est le reste de la division
euclidienne de P par Q, et que la partie entière est le quotient de cette division.
EXEMPLE 14.5. Dans l'équation 14.4 de l'exemple 14.3, on voit que la partie entière de F
est 2X + 1 et sa partie polaire est-~~!~. Cette décomposition ne dépend pas du corps. En
particulier dans JR(X), bien que F ne possède pas de pôle, F possède une partie polaire non
nulle.
X4 + x 3 -1 1 2 1
X(X + 1) 2 ç,
partie entière
+ (X+ 1)2 + X+ 1 - X. (14.6)
éléments simples
x4 + x 3 -1
La fonction rationnelle cp IR\{O, -1} ---, IR, x H ---- a donc pour primitive
x(x + 1) 2
(14.7)
Nous supposons que cette écriture est minimale, dans le sens que les nombres u1, ... , Ur sont
tous distincts et que les coefficients des plus hauts ordres C1m,, ... , Crmr sont tous non nuls.
Alors les nombres u 1 , ... , Ur sont précisément les pôles de F d'ordres respectifs m 1 , ... , mr.
Questions:
1) Quand existe-t-il une décomposition de la forme (14.7)?
2) Cette décomposition est-elle unique?
3) Existe-t-il un algorithme permettant de trouver cette décomposition?
Le théorème 14.8, page 361, et sa preuve répondront à ces questions. On peut cependant dès
à présent répondre partiellement à la première question. On observe en effet qu'une condition
nécessaire pour l'existence de la décomposition est que l'écriture irréductible de F ait un
dénominateur scindé. En effet, si on réduit le membre de droite dans (14.7) au même dénomi-
nateur, on obtient le polynôme {X - u,im, ···{X- Ur)=, qui est clairement scindé - et c'est
donc aussi le cas de tous ses diviseurs. Nous verrons que cette condition est aussi suffisante.
La preuve de ce fait repose sur un algorithme dont le lemme suivant, consistant à diminuer
l'ordre d'un pôle, est le chaînon élémentaire.
360
Lem:me 14i'.1'. :,Sé{t,,u iEIJK: ~ pôte41o~;m;;d ~~:frrv;tiô~ ~~Useif. Sôit P,,èt î::;àoo:c
pul1fnm,i~ ~E{X}, teœ: ~J,>( fii}4 O,ff(nr,é G: ·et , 5 ~ .
p · •·
F ;=, rx='a.J~l'' ·
• •. J Pftir/Tt«F '
J,/r=F.- (X-oJ,.
Alors f{possèdën'IÎ pâle i;c'«':i,Ôrdre ni1tm {si m1 ~ ôJàlbrfî=1 n'a plùtJdê pâle ~na).
Ve pltis, ft a le!Jmimesp6lès que f autres que a et leurs multiplicités sont ronservées. ·
Il)
j
..... PREUVE.
P1
OnaF 1 =(X-uJmT'avecP1=
T(a)P- P(a)T
T(a)
[ ]
ElKX.
avec n = k - f > 0, et P2, T1 deux polynômes tels que T1 (b) -j. 0 et P2(b) -j. O. On a donc
Le polynôme T( a)P2 - P( a)T1 (X - b )n ne s'annule pas en b car P2(b )T( a) -j. 0 et n > O. Il en
résulte que b est un zéro de P 1 de multiplicité t Comme b est un zéro de T de multiplicité k,
le nombre b est bien un pôle de F1 = (X-~JmT, de multiplicité k-f = n. Inversement, si b est
un pôle de F1 autre que a, le même raisonnement montre, en échangeant les rôles de P et de
P1, que b est aussi un pôle de F de même multiplicité, ce qui démontre la dernière assertion
du lemme. ■
Dans cette partie, nous donnons une méthode générale pour décomposer en éléments simples
une fraction. L'idée est de réduire par étapes les ordres des pôles en utilisant le lemme 14.7.
361
Théorènle 14~8•. ,(mcciin.pMi.ti()n en 'éléments s,implés} $o4t u1~; ;"i, a,; E K lu ~es
d'une fraction .rationnelle F, .d'ordres re8pectifs m1, : j . . ~ • · Qn:süpfJ(>sè qu'il· ~tdi é'·• K:fX} U)
~~
î
.
r <12 ~
Alors ïl existe un uniqire pôlynllmtfl:.' ~f K.00 et des t!onstàn'tês'tJnîqûJ Cld Ê K,
r, l ~ tE;; mk; tels que
.f:.::: E+ frt fr
:-r..
·
mi.,
(X~:~/~ • (14.10)
1
,:j<
......
..ci
ü
Le pohf,wme E est la partie entière de F. La stJmpie des .éléments simples esUa partie polaire.
PREUVE. Commençons par constater que le degré d'une somme d'éléments simples est stricte-
ment négatif. Ainsi (14.10) donne en particulier la décomposition en parties entière et polaire,
définie par la proposition-définition 14.4.
o Montrons l'existence de (14.10). Le lemme 14.7 fournit deux informations importantes:
- La fraction retranchée dans (14.8) est un élément simple.
- La soustraction de cet élément simple n'affecte pas les autres pôles de F.
Cela donne l'algorithme suivant. Posons F0 = F. On commence à éliminer le pôle a 1.
On réitère les opérations 1) et 2) pour chaque fraction F1, F2 , ••• Fv ainsi obtenue. L'algorithme
s'arrête quand a 1 n'est plus un pôle de F,.,, soit en -v::; m 1 étapes. On obtient ainsi une fraction
m,
'\""" Cu
F,,, = F- L (X- ai)r
f=l
sans pôle en a 1- De la même manière, on élimine les autres pôles a 2 , ... , Ur. Il en résulte la
fraction sans pôle
(14.11)
362
Multiplions cette équation par (X - a 1 )m1 et simplifions chaque fraction de la somme ainsi
obtenue dans le terme de gauche. Il vient
m1 T 111.k ,._,
L_(Cie - c1d(X- a1)mi-f + (X- ai)m1 L. L. (~kl',--:k)ff = 0.
f=l k=2 f=l
On multiplie par (X- ai)mi-l pour montrer que C1,m1 -1 -c1,m1 -1 = 0, et ainsi de suite. ■
L. (X ~:)lîlp
ka
Soit ka~ 0 le plus grand entier tel que que mk ~ 1. Alors la somme Fa=
p=O
est la décomposition en éléments simples de la partie polaire de F associée au pôle a.
Remarque.
◊ D'après le théorème fondamental de l'algèbre, tout polynôme complexe est scindé, donc
toute fraction rationnelle dans IC(X) possède une décomposition en éléments simples.
o Pour alléger les calculs, il peut être intéressant de commencer par décomposer la fraction en
partie polaire et partie entière à l'aide d'une division euclidienne, puis d'appliquer l'algorithme
de décomposition en éléments simples à la partie polaire. On manipulera ainsi des numérateurs
de degrés moindres.
◊ Pour chaque pôle ak, l'élément simple d'ordre 1 est de la forme x~~k. Le coefficient ckl est
appelé résidu de F au pôle ak.
o Dans la décomposition (14.10), les éléments simples d'ordres les plus élévés figurent né-
cessairement, ce qui se traduit par le fait que les constantes C1m,, ... , CrmT sont toutes non
nulles. En revanche, les éléments simples d'ordres plus petits n'apparaissent pas forcément car
la soustraction dans le lemme 14.7 peut faire disparaître le pôle complètement ou baisser son
ordre de plusieurs degrés. Par exemple la fraction F(X) = 1 + :;b-, qui est déjà décomposée, ne
possède pas d'élement simple d'ordre 1.
363
◊ Il n'est pas nécessaire d'apprendre par cœur la formule P(a)/T(a) du coefficient qui figure
dans le lemme 14. 7 car la démonstration de l'unicité de la décomposition permet de la retrouver r/J
i
facilement. En effet, si on multiplie F par (X - u)m et que l'on évalue en X = a la fraction
ainsi obtenue après simplification, chaque élément simple donne
EXEMPLE 14.9. Reprenons l'exemple 14.6 (page 359) et appliquons notre algorithme à
X4 + X3 -1
F = X(X+ 1)2
Nous allons d'abord éliminer le pôle O (une étape suffira car c'est un pôle simple) et ensuite
le pôle -1 (en au plus deux étapes puisque l'ordre du pôle est 2). Dans chaque étape le
lemme 14.7 indique l'élément simple à soustraire.
1 X4 + x 3 + x 2 + 2x X3 + x2 + x + 2
F1 = F+ X= X(X + 1)2 (X+ 1) 2
1 X + x + x + 1 x2 + 1
3 2
a b C X2 +X-1
X + X+ 1 + (X+ 1) = X(X + 1)2
2 .
364
a(X + 1) c X2 + X - 1
X + b + X+ 1 = X(X + 1) .
X4 +2x 2 -1
G = X2(X2+ 1)2 E IC(X)
est de degré négatif, donc sa partie entière est nulle. Nous remarquons que G est paire, ce
qui suggère de comparer les décompositions de G (X) et G (-X).
X4 + 2X 2 - 1 a2 b1 b2 b1 b2
X 2 (X 2 + 1)2 = X 2 + X - i + (X - i)2 - X+ i + (X+ i)2.
X4 + 2x 2 - 1 . x2 + 1 x+ i X-i
X2 (X 2 + 1) = libi - X2 - 2(X - i) l(X+i).
Proposition 14.12. Pour tout couple de polynômes (P, S) E {K[YJ)2 tel que S(0) # 0,
pour tout entier n. ~ 0, il existe un unique couple de polynômes (Qn., Rn) E K[YJ) 2 tels que
P = QnS + ynRn., avec deg Qn. < n.
On a donc
P Qm Rm
F = xmT = xm + T.
Soit encore, en écrivant Qm = c0 + c1X + · · · Cm-lxm-l,
m-1 m
F = , ~ Rm = , Cm-k Rm
L xm-k + T L Xk + T .
k==O k=l
Comme le nombre O n'est pas un zéro du polynôme T, la fraction~ n'a pas de pôle en O et
la somme du terme de droite est bien la décomposition polaire de F associée au pôle nul.
Supposons a E 1K quelconque. On se ramène au cas a = 0 par un changement de variable.
Posons Y = X - a. Le polynôme Y est élément de lK[X] mais P = a 0 + a1X + · · · apXP =
a 0 +a 1(a+Y)+- • • ap(a+Y)P peut aussi être vu2 comme un polynôme P1 E lK[Y] d'indéterminée
Y. Il est défini par la relation P1 = P(a+ Y). De même, on note Î1 E lK[Y] le polynôme obtenu
à partir de T, soit encore T1 = T(a + Y) et on note F1 = F(a + Y) E lK(Y). Alors
On peut donc appliquer le cas précédent. la division suivant les puissances croissantes de P 1
par î1 à l'ordre m donne deux polynômes R1,m et Q 1,m = Co + · · · + Cm-1 ym-l tels que
2
Formellement, on peut voir P 1 comme l'évaluation de P dans l'anneau JK[Y] au point a+ Y.
366
-1 + x 3 + X4 11 + 2x + x2
2x + x2 + X3 + X4 -1
On a donc
-1 +x 3 +X 4 1 2+x+x 2 +x 3
X(l + X) 2 =-X+ (1 + X) 2
- Il en résulte que
1 + 2Y - 2Y2 + Y3 2 1 2 1
y2 = y + y2 - 2 +y= X+ 1 + (X+ 1 )2 + X - 1.
3
EXEMPLE 14.14. Décomposons la fraction F = X 2 ~X++ l )2 en éléments simples.
7 + SX SY + 2 5 2 5 2
(1 + X)2 = Y2 =Y+ Y 2 = X+ 1 + (X+ 1) 2.
3 5 5 2
Ainsi F = X2 - X + X+ 1 + (X+ 1)2"
Soit F une fraction rationnelle réelle. Faisons un détour 3 par le complexe en considérant F
comme un élément de C{X). Nous avons donc la décomposition dans C(X)
(14.12)
où E est la partie entière et où S 1 (respectivement S2 ) est la somme des éléments simples
de pôles réels (respectivement non réels). Les pôles non réels viennent en paires conjuguées
(voir le chapitre 13). Notons que E est un polynôme réel, comme partie entière d'une fraction
rationnelle réelle, et que, par construction, tous les coefficients de S 1 sont réels. Si on prend
le conjugué complexe des deux membres de (14.12), on obtient F = E + S1 + 52 . L'unicité de
la décomposition montre que 52 = S2 . Ainsi S2 est une somme de termes de la forme
C C c(X - a:Jf + c(X - a)i R
4 3
(X - a)i + (X - a)i = (X 2 - (a+ a)X + JaJ 2)i = (X2 - l(X)( + f3 )i (l .i )
où l'on a posé ex = ~e(a), f3 = JaJ 2 et où R est un polynôme à coefficients réels, comme
somme de deux polynômes conjugués. En effectuant des divisions euclidiennes successives par
X 2 - lcxX + f3, on décompose (14.13) en une somme de fractions rationnelles réelles de la forme
La décomposition en éléments simples de second espèce sur IR est utile pour l'intégration
des fonctions rationnelles réelles. Toutefois, il est bien souvent plus pratique de décomposer
sur C, d'intégrer et de rassembler le termes conjugés pour retrouver une fonction réelle, comme
le montre l'exemple suivant.
EXEMPLE 14.15. On cherche la primitive de la fonction rationnelle
2x 2 -4x-2
<p: IR -l IR, x H (x2+1)2
3
En fait, c'est un raccourci! Comme le disait le mathématicien Jacques Hadamard :
« le plus court chemin entre deux énoncés réels passe par le complexe. »
368
rn
III.4. Résidu d'un pôle simple
1
'8
.a
Soit F une fraction rationnelle ayant un un pôle simple en a. Nous allons donner une formule
permettant de calculer facilement le résidu du pôle a, c'est à dire le coefficient devant la
fraction x~a dans la décomposition en éléments simples de F.
Par hypothèse, il existe deux polynômes Pet T tels que P(a) =J 0, T(a) =JO et
F= p
(X-a)T
J Posons Q = (X- u)T et remarquons que Q' = (X- a)T' + T, donc Q'(a) = T(a). Le lemme
- 14.7 donne la partie polaire de Fen a, soit
P(a)/T(a) P(a)
X-a Q'(a)(X- a)·
Nous avons donc démontré le résultat suivant.
Proposition 14.16. (Résidu d,un pôle simple) SoitF = ~ a'l1ec Pet Q de'UX polynômes
dans K[X]. Soit a E K. On suppose que Q(a) = 0 et Q'(a) f. O. Alors on a la décomposition
P{a}
avec c1 = Q'(a)'
où F1 E K(X} est une fraction sans pble en a.
Cette formule est très pratique. Nous verrons en troisième année qu'elle est encore valable
pour des quotients plus généraux, comme le quotient de deux séries entières convergentes,
dans le cadre du calcul des résidus de Cauchy. Considérons le cas particulier d'une fraction
rationnelle dont le dénominateur est scindé et dont tous les pôles sont simples. Elle s'écrit
donc sous la forme
w k = exp (2ki7î)
n , k = 0, ... , n - 1 , avec w = exp (n2in) .
D'après (14.15), le résidu de F relatif au pôle wk vaut
369
Attc11tio11
Il est important de supposer que F ne puisse plus être simplifiée par aucun facteur X - a.
Par exemple, pour P E JK[X] non constant, la fraction pP' a tous ses pôles simples et
P'(a)
pourtant les résisdus ne sont pas nécesairement égaux à P'(a) = 1, car P'(a) = 0 pour
une racine multiple de P.
P'
EXEMPLE 14.18. Soit P un polynôme non nul. Décomposons la fraction p·
Si a E 1K est une racine de multiplicité m de P alors a est une racine de multiplicité m- 1
du polynôme dérivé P'. Par conséquent, les pôles de f
sont les zéro de P et ils sont tous
simples. La formule (14.15) n'est pas utilisable directement car la dérivée du dénominateur
s'annule en a, soit encore P'(a) = 0 si m > 1. On peut cependant s'inspirer de la même
méthode. Écrivons P = (X - a)mS avec SE JK[X] et S(a) f O. Alors P' = m(X - a)m- 1 5 +
(X- a)mS'. Ainsi
P' m1 ffir
-
P
= X-u
- - + · · · +X-ar
--. (14.16)
1
Autrement dit, chaque pôle de la fraction rationnelle f est simple, de résidu la multiplicité
du pôle vu comme racine de P.
Donnons une application de ce dernier exemple. Soit z 0 une racine du polynôme P', autre
que n1, ... , nr. Alors on a
0= P'(zo) =~+-··+~.
P(zo) zo - a, zo - ar
Soit encore, en prenant la conjugaison de cette équation,
0 = - m,_ + ... + - m.,. .
Zo-n1 Zo-ar
Mais, pour 1 ~ k ~ r, on a
mk mk
=-=
½-~
= <Xk(zo - ak), avec <Xk = _ _
1½-~ 12
.
On a donc trouvé des coefficients <Xk E IR, avec <Xk > 0, tels que O = cx1(z0 - a 1) + ••• +
<Xm(Zo - am)- Ainsi zo s'exprime comme un barycentre des zéros u 1,... , nr. En effet
<X1n1 + · · · + <Xmnm
Zo =- -------
<XJ + ... + <Xm
On peut montrer que cette propriété entraîne que ½ est à l'intérieur du plus petit polygone
convexe contenant les zéros de P.
l 370
r/J
a)
'@
III.5. Coefficient d'indice maximal associé à un pôle multiple
Soit F une fraction rationnelle ayant un un pôle d'ordre p ~ 2 en a. Nous allons généraliser
1::
a) la formule du résidu d'un pôle simple. Cette formule est moins utilisée, mais elle peut rendre
§ service si le dénominateur de F n'est pas factorisé. Par hypothèse, il existe deux polynômes P
'O
.: et T tels que P(a)-/- 0, T(a)-/- 0 et
..Si
r/J
~ F= p
B<:.)
(X-a)PT
Ê
rJ) Posons Q = (X - a)PT et calculons sa dérivée kième par la formule de Leibniz
~
~
o..
En particulier Q(Pl(a) = p!T(a). Or, le lemme 14.7 montre que le coefficient devant (X~a)P
où F1 E K(X) est une fraction dont le pôle en a est d'ordre p' < p.
IV. EXERCICES
14.1. 14.4.
Dans cette partie, nous donnons une construction générale du corps des fractions d'un anneau
commutatif unitaire intègre et nous en tirons quelques conséquences. Nous allons notamment
montrer que ce corps est unique dans un sens très précis : non seulement deux corps des
fractions d'un même anneau intègre sont «identiques» parce qu'il existe un isomorphisme
entre eux qui transporte la structure de corps, mais aussi cet isomorphisme est unique dans un
sens que nous préciserons. Certes, les mathématiques ne sont pas une philosophie, mais elles
ont développé pour les besoins de leur cause une science de l'identique qui la rapproche le plus,
parmi les sciences, d'une ontologie (qui a pour objet l'élucidation des propriétés générales de
l'être, de ce qui fait que les choses tiennent ensembles, avant même d'examiner le sens que
l'homme leur donne concrètement). La proposition 14.20 en est une belle illustration.
Propqsition 14.20. Soit A un anneau intègre. Alors it existe un corps (Q(A}, +, ·) et une
application t : A-t Q(Aftelle gue . ·. . . . · . .. . . .·
K 1) l 1appliéation i définît un morphisme d'anneaux de A dans Q(A);
;/f~
A--.!"Q(A)
2) l'application L est injective;
3) poor tout corps K et pour tout morphisme d'anneaux èp :,A....:.+ K, il
existe un unique morphisme de corps q> : Q{A).-t K tel que q> = .êp o t.
On appelle corps dœ frà.ctions del'anneaù A le couple formé dti corps Q{A) etdu morphisme
t:A..:.+ Q(A).
EXEMPLE 14.21. Pour une définition rigoureuse du corps des nombres rationnels ou du
corps des fractions rationnelles sur un corps JK, il suffit de poser (Ql = Q(Z) et JK(X) =
Q (JK[Xl). À ce point du programme de Licence, ce sont les deux principaux exemples que
ron pourra garder à l'esprit tout au long de cette partie.
La proposition 14.20 requiert une démonstration, mais avant d'y venir, il est peut-être plus
important encore de comprendre la manière dont elle fonctionne.
1. Qu'est-ce qu'un diagramme? Il est commode de schématiser un ensemble de mor-
phismes d'anneaux par un graphe dont les sommets sont les anneaux considérés et dont les
arêtes (orientées) représentent les morphismes. On appelle diagramme un tel graphe. Un che-
min dans le graphe est une suite finie d'arêtes A1 -t Az -t · · · -t An donc chaque but coïncide
avec la source de la suivante. En composant les morphisme associés, on obtient un morphisme
A1 -t An. Il existe en général plusieurs chemins entre deux anneaux A1 et An donnés. On dit
que le diagramme est commutatif si pour deux sommets quelconques, le morphisme obtenu
par composition le long d'un chemin est indépendant du choix de celui-ci. Par exemple, dans le
diagramme qui figure dans la proposition 14.20, il existe deux chemins de A à K. Nous avons
en effet d'une part la flèche A~K, et d'autre part le chemin A~Q(A) q, K. Dire que
le diagramme est commutatif, c'est dire que ces deux chemins définissent le même morphisme,
soit encore que <p = cp o t. La condition 3) exprime donc le fait qu'il existe une unique flèche
Q(A) ---, K qui rende le diagramme commutatif. On observera que c'est la collection de tous
les corps K et des morphismes possibles A ---, K qui définissent le corps Q(A). Pour cette
raison, on appelle propriété universelle la condition 3). Ces diagrammes sont très pratiques
pour manier de telles propriétés universelles. Il est même souvent plus rapide de visualiser la
preuve que de la rédiger.
Cette idée qu'il existe des flèches naturelles entre des objets algébriques est apparue au
milieu du xxe siècle dans le cadre de l'étude de la cohomologie des groupes, alors en plein
essor. La première mention du terme de « morphisme naturel» date de 1942 dans un article
des mathématiciens polonais Samuel Eilenberg (1913-1998) et américain Saunders Mac Lane
(1909-2005) : premier pas vers ce qui deviendra la théorie des catégories.
Le terme de catégorie est, aux dires de Mac Lane, emprunté à la Critique de la raison pure
d'Emmanuel Kant, bien que la théorie mathématique n'ait pas de rapport avec le concept
philosophique.
Après-guerre, cette théorie s'est développée sous l'égide de Bourbaki (André Weil, Samuel
Eilenberg, Henri Cartan ... ). Il faut entendre sous ce patronyme un petit groupe de brillants
mathématiciens, pour l'essentiel de l'école française, qui, sous couvert d'un anonymat tout
relatif, entreprit dans une vaste collection de traités de dégager les structures algébriques du
matériel mathématique que tout mathématicien se doit de connaître. Par la suite, Alexandre
Grothendick donna ses lettres de noblesse à cette théorie en inventant littéralement une nou-
velle façon de penser en mathématiques dans le langage des catégories. Aujourd'hui, cette
théorie a « algébrisé » l'ensemble des mathématiques; c'est aussi un champ de recherche tou-
jours très actif.
Dans la suite de cette partie, tous les diagrammes représentés seront commutatifs. Nous
invitons chaleureusement le lecteur à suivre les étapes des démonstrations rédigées ci-dessous
en se reportant aux diagrammes afférents.
3. Signification de la conditions 3) Le point de vue qui prévaut ici est de mettre l'ac-
cent moins sur les objets que sur leurs relations. Peu importe l'essence du corps Q(A), seules
comptent ses relations avec les autres corps, c'est-à-dire les morphismes de corps que l'on
peut construire entre Q(A) et un corps K donné. La condition 3) donne le mode opératoire
de ces constructions. Si on dispose d'un morphisme d'anneaux A --, K, on en déduit au-
tomatiquement un morphisme de corps Q(A) --, K. Inversement, tout morphisme de corps
1j, : Q(A) --, K est obtenu par ce procédé. En effet, l'application cp = 1j, o L: A--, K est un
morphisme d'anneaux.
Il existe donc un unique morphisme de corps 1j, o L : Q(A)--, K tel
Q(A) îVo"i K que (tj, o L) o L = cp. Mais 1j,: Q(A)--, K est un morphisme de corps
et il vérifie évidemment la condition 1j, o L = cp. Donc 1j, o L = lj,,
'Î~
A
ce qui montre bien que 1j, peut être obtenue par le procédé décrit
dans la condition 3).
4. Unicité à unique isomorphisme près. Nous allons démontrer que le corps des fractions
est unique dans un sens très précis: non seulement deux corps des fractions Q(A) et Q(A) d'un
même anneau intègre A sont «identiques», dans le sens qu'il existe un isomorphisme de corps
de Q(A) --, Q(A) qui identifie les structures de corps, mais en outre, cet isomorphisme est
unique si on veut qu'il soit compatible avec les conditions 1 ), 2) et 3) de la proposition 14.20.
Proposition 14.25. Soit A un anneau intègre.et K un corps. On suppose (J'll,e 1.: A ----t K
est un morphisme d'anneaux injectif On pose
Alors Q(A} est un sous-corps de K contenant i(A) et si on note 1.1 : A -t Q(A} le1 restriction
de .1. au but Q(A), alors le couple {1/,Q{A}) vérifie les œnditions de la proposition 14;2.Q.
Autrement dit, le morphisme t': A., Q(A) définit le corps des fractions de A;
PREUVE. o Montrons que Q (A} est un sous-corps de K. On note 1K et 1 A les éléments neutres
de K et de A respectivement.
1) Q(A} est non vide car lK = t(lA}/L(lA} E Q(A).
2) Soit x = L(a}/L(b} E Q(A}, avec a E A et b E A\ {0} alors -x = l(-a}/t(b} E Q(A}.
3) Soit (x, y} E Q(A)2. On a x = '.\:l
et y = ~/~\, avec (a, c} E A 2 et (b, d) E (A\ {0})2.
Alors,
- l(a} l(c} - l(a}. t(d} + l(c}. l(b} - l(ad + be} Q( )·
x+y - l(b} + l(d} - l(b} · l(d} - l(bd} E A'
X. y= L(a} . l(c} = l(a}. l(c} = l(ac} E Q(A}.
l(b} l(d) t(b). l(d) l(bd}
1 t(b)
4) Enfin, pour x E Q(A) \ {0}, x = t(a)/t(b) avec (a, b) E (A\ {0})2. On a - = -(-) E Q(A).
X la
Les propriétés 1), 2) et 3) montrent que Q(A) est un sous-anneau de K et la propriété 4)
montre que tout élément non nul de Q(A) est inversible dans Q(A). Il en résulte bien que
Q(A) est un sous-corps de K.
◊ Montrons que t': A-----, Q(A) définit le corps des fractions de A. Soit K' un corps et soit cp:
A-----, K' un morphisme de corps. Supposons qu'il existe un morphisme de corps ëp: Q(A) -----, K'
tel que ëp o t' = cp. Soit x E Q(A) et soit (a, b) E A x A\ {0} tel que x = t(a)/t(b). Alors,
_ -(t(a)) -(t'(a)) ëp(t'(a)) cp(a)
cp(x) = cp t(b) = cp t'(b) = ëp(t'(b)) = cp(b).
Ce calcul montre que ëp(x) est déterminé. Ainsi, le morphisme ëp est unique s'il existe. Inver-
sement, pour x = t(a)/t(b) E Q(A), on définit
w G;:D = :;:; ·
Vérifions que ëp est bien définie. Il s'agit de vérifier que ëp(x) ne dépend pas du choix du
représentant de x. Six= t(a)/t(b) = t(e)/t(d), alors t(ad) = t(a)t(d) = t(b)t(e) = t(be).
L'injectivité del montre alors que ad= be. Il en découle que cp(a)cp(d) = cp(ad) = cp(be) =
cp(b)cp(e). On en déduit que :i;! = !i~j,ce qui démontre que la définition de ëp(x) est
indépendante du choix du représentant de x.
On vérifie aisément que ëp(x + y) = ëp(x) + ëp(y) et que ëp(xy) = ëp(x)ëp(y) pour tout
(x,y) E Q(A)2. En outre, on a ëp(t(a)) = ëp(t(a))/ëp(t(lA)) = cp(a)/cp(lA) = cp(a) pour
tout a E A car t(lA) = lK, et cp(lA) = h,. Cela démontre que ëp: Q(A)-----, K' est l'unique
morphisme de corps qui satisfait la condition ëp o t' = cp, ce qui prouve notre assertion. ■
· . 2 . t( a) l(C) . . .
2
De plus, pour (a, c, b, d) E A x (A\ {0}) , on a L(b} = t(d) dans Q(A) 81 et seulement 81
ad = be dans A.
est un sous-corps de Q(A). On a donc t(A) C q(A) C Q(A). D'après la proposition 14.24, il
en résulte que q(A) = Q(A).
De plus, '.i;!
= ~[~( si et seulement si t(a)t(d) = t(b)t(e), soit encore t(ad) = t(be). Cette
dernière condition est équivalente à l'égalité ad= be par l'injectivité de l, ce qui démontre la
proposition. ■
Jusqu'ici, nous avons repoussé la construction du corps Q(A) autant que possible. Toute-
fois, par honnêteté intellectuelle, il faut s'assurer au moins une fois qu'un tel corps existe. La
démonstration de la proposition 14.20 n'est pas difficile, si on sait ce que l'on cherche. L'idée
est de regrouper en classes d'équivalence tous les représentants possibles d'un même quotient,
puis de définir les lois d'addition et de multiplication sur l'ensemble des classes obtenues, en
se laissant guider par la définition des lois usuelles sur Q.
PREUVE DE LA PROPOSITION 14.20.
◊ Définissons sur A x A\ {0} la relation
(a,b) ~ (c,d) {=} ad=bc.
Il est facile de vérifier que nous obtenons ainsi une relation d'équivalence de A x A\ {0}.
-- a
On note la classe d'équivalence d'un couple (a, b) sous la forme (a, b) = b et soit Q(A)
l'ensemble des classes d'équivalence. On définit sur Q(A) deux opérations en posant
a c ad + be a c ac
b+ d= bd b d bd"
Notons que bd -1- 0 car b -1- 0, d -1- 0 et A est intègre. Les classes de (ad+ be, bd) et (ac, bd)
sont donc bien définies. Montrons qu'elles ne dépendent pas du choix des représentants des
classes~ et t
Soit (a',c', b', d') E A 2 x (A\ {0}) 2 tel que (a, b) ~ (a', b') et (c, d) ~ (c', d').
Alors ab'= a'b et cd'= c'd. Nous en déduisons les deux identités
b'd'(ad +be)= ab'dd' + bb'cd' = a'bdd' + bb'c'd = (a'd' + b'c')bd;
1
(b'd')(ac) = ab'cd' = a'bc'd = (a'c')(bd),
ce qui montre que (ad+ be, bd)~ (a'd' + b'c', b'd') et (ac, bd)~ (a'c', b'd'), et les lois sont
bien définies.
◊ Montrons que ( Q(A), +, •) est un corps. Soit a, b, c, d, e, f dans A. On suppose que b,d et
f sont non nuls. Nous avons les propriétés suivantes.
1) Associativité de l'addition :
~ ~) :_ _ ad+ be :_ _ adf + bcf + ebd _ ~ de+ cf _ ~ (~ :.)
(b + d + f - bd + f - bdf - b + df - b + d+ f .
. a c ad + be cb + da c a
2) Commutativité de l'addition : b + d = bd = db = d + b.
, a O O a a· lA + 0 a
3) Elément neutre : - + - = - + - = - - - -
b lA lA b b b
a -a -a a ab - ab
4) Opposé : b + b = b + b = b2 = O.
. . (a c) e ac e ace a ( c e)
5) Associativité de la multiplication: b ·d ·f =bd· f = bdf = b · d · f ·
- a lA lA a a•lA a
6) Elément neutre multiplicatif: - · - = - · - = - - = -.
b lA h b b - lA b
. , . . . a c ac ca c a
7) Commutativite de la multiplication : b • d = bd = db = d · b'
8) Distributivité de la multiplication sur l'addition :
~ . (~ :.) _ ~ . cf+ de _ a( cf+ de) _ acf + ode _ acf ode _ ~ . ~ ~ . :_
b d+ f - b df - bdf - bdf - bdf + bdf - b d + b f.
a b b a ab lA
9) Inverse: - · - = - • - = - = - pour a -1- 0 et b -1- 0, car (ab, ab)~ (lA, lA),
b a a b ab 1A
Les conditions 1) à 4) montrent que Q (A) muni de l'addition est un groupe commutatif.
Les conditions supplémentaires 5), 6), 7) et 8) montrent que (Q(A), +, ·) est un anneau
commutatif. Enfin, la condition 9) montre que tout élément non nul est inversible, et donc
que Q(A) est un corps.
o Il est immédiat que l'application t : A -, Q(A) : a H : est un morphisme d'anneaux
1
injectif. De plus, pour a E A et b E A\ {O}, on a
t(a) a lA a
t(b) = lA. b = b.
Qu'est-ce que l'algèbre linéaire? Les mathématiciens répondront qu'il s'agit stricto sensu
d'une théorie mathématique qui étudie une structure algébrique particulière, celle de la caté-
gorie linéaire constituée des espaces vectoriels et de leurs applications linéaires. Cette théorie
englobe l'étude classique des systèmes d'équations linéaires, avec ses ramifications actuelles de
calculs effectifs. Mais elle est devenue surtout l'une des pierre angulaire de l'édifice mathéma-
tique, par son efficacité et la richesse de ses applications dont il est difficile de rendre compte,
tant elle présente partout, de la géométrie, à la théorie des représentations, en passant par la
théorie des nombres, l'analyse, la topologie ou la physique théorique.
De manière plus générale, on peut dire que l'algèbre linéaire est la théorie mathématique
qui formalise l'idée de « linéarité », ou encore de « proportionalité » des sciences de la nature.
1
OH'= ;\OH# OH+ HH' =;\OH# (1 - À)OH = H11 # HO = -
1-À
-HH'.
1
Dans Vies, Doctrines et sentences des philosophes illustres, vol. 1
381
Il nous reste à vérifier que si un rayon de soleil passe par les points A et A', il touche le sol
au point O, ce qui montrera que les ombres de la pyramide et du bâton sont bien données
par les segments [H, O] et [H', O] respectivement. Autrement dit, il s'agit de vérifier que les
vecteurs 0A et 0A' sont colinéaires. Or
OA =OH+ HA= ÀOH' + ÀH'IV = À(oï=ïi + H'IV) = ÀOA',
ce qui démontre bien la colinéarité souhaitée. Ainsi, le coefficient
À= H'O/HO = A'H'/AH
est aussi bien le rapport des hauteurs que celui des ombres.
En conclusion, deux petits calculs évidents sur
des vecteurs se sont substitués à la démonstratio n
classique utilisant des triangles semblables. L'al-
gèbre linéaire permet d'exprimer ici très clairement
la proportionali té de deux longueurs dans chacune
des directions (OA), (OH) et {AH). En quelque
H H' 0
sorte, le théorème de Thalès exprime une règle de
trois en dimension deux. Figure 1 : un calcul de
hauteur
L'algèbre linéaire, comme science des petites
variations
1
Si une voiture roule à un instant t donné à la vitesse v = 20ms- , quelle distance aura-
t-elle parcourue entre cet instant et une seconde, deux secondes, dix secondes plus tard?
Évidemment, nous ne connaissons pas la loi d'évolution de la vitesse de la voiture et nous ne
pouvons donc donner de réponse exacte à cette question. Mais en première approximatio n,
nous pouvons considérer que la vitesse de la voiture est constante. Ainsi la distance parcourue
entre deux instants t <t'est donnée approximativ ement par la formule v~t, avec ~t = t' -t.
Il est important de noter que cette approximatio n est d'autant meilleure que ~test petit, c'est-
à-dire que la variation de la vitesse est faible sur l'intervalle de temps considéré. Autrement dit,
la distance parcourue est proportionell e - avec le facteur de proportionali té v - à la variation
temporelle ~t, avec une précision d'autant meilleure que cette variation temporelle est petite.
identiques de resistance k > 0 fixés aux sommets d'un tétraèdre régulier (voir figure 2).
On néglige ici la pesanteur et on suppose que chaque ressort est au repos quand il a pour
longueur un nombre€> 0 donné. Quelle force s'exercera sur la bille si on lâche celle-ci d'une
position M -/- G, où G est le centre de gravité du tétraèdre ?
La physique nous apprend que cette force est donnée par la formule
2
Les raisonnements mathématiques exposés dans cet exemple pouront aisément être rendus parfaitement rigou-
reux après le cours de géométrie de deuxième année. Mais les connaissances du lycée suffisent ici pour saisir
comment la linéarité se manifeste. Bien sûr, les concepts de l'algèbre linéaire seront exposés dans les chapitres
qui suivent sans qu'aucune connaissance de géométrie ne soit nécessaire.
382
11111 l!llllliiliill
où IIMAnll désigne la norme euclidienne usuelle de MAn- Dans la formule MAn - e ~ ~ ,
11 11
le premier terme de la somme exprime le fait que la force exercée par le n-ième ressort est
proportionnelle à son élongation, le second terme exprime que cette force est nulle non pas
quand M = An, mais quand le ressort est~u repos, c'est-à-dire quand IIMAnll = t Peut
importe finalement d'où vient la formule de F, nous la considérons désormais comme acquise.
A1
Ainsi
4 4
LkMAn= Lk(MG+GAn) =4kMG.
n=l n=l
et
4 --
- ~ ,MAn
F =4kMG-keL - = - •
n=l llMAnll
Notons que pour M = G, on a F = 0, le bilan des forces exercées sur la bille est nul. Si
la bille est placée au point G sans vitesse initiale, elle n'en bougera pas : le point G est une
position d'équilibre. Il convient de noter que si Mi- G, alors F n'est pas proportionnelle à la
«variation» GM, à cause des termes ~!11" Mais qu'en est-il si GM est petit?
11
Notons que pour tout point A, il existe une fonction continue E : g ~ JR, définie sur
l'espace des vecteurs muni du produit scalaire usuel, telle que
quand Etend vers zéro. En négligeant des termes de l'ordre de IIGMl!z, il est aisé d'en déduire
que
383
FFtml ! !
Pourquoi cette formule est-elle plus simple que la formule exacte? Supposons un instant que
l'approximation ci-dessus soit en fait une égalité. On notera alors que si on lâche la bille de
deux fois plus loin selon une même direction, la force exercée par les ressorts est deux fois plus
forte. Plus précisément, si M' et M sont tels que GM' = ÀGM pour un nombre À E IR, alors
F' = À F, avec des notations évidentes, les forces correspondantes sont ainsi dans les mêmes
proportions. De plus, si M, M', M" sont trois points tels que GM" = GM + GM', alors les
forces correspondantes vérifient la relation F" = f + F'.
Autrement dit, la force exercée sur la bille dépend linéairement, en première approximation,
du déplacement GM, et cette approximation est d'autant meilleure que les termes négligés
sont petits, c'est-à-dire que l'écart à la position d'équilibre M = G est faible. On dit que la
formule approchée de F est une linéarisation de la formule exacte.
Bien sûr, si M est loin de G, la formule approchée pour F devient grossièrement fausse.
En fait, même la loi physique qui modélise la force d'un ressort ne convient plus, puisque si
l'on tire trop fort sur un ressort, son élongation n'est plus élastique, et il finit même par céder.
Mais proche de l'équilibre, le modèle linéaire donne un traitement mathématique beaucoup
plus simple et satisfaisant.
L'exemple ci-dessus est très particulier mais il illustre un principe très général : les lois
fondamentales de la physique classique sont linéaires. L'essentiel de la physique connue porte
en effet sur les systèmes proches de l'équilibre. Comme mathématique et science de la nature se
sont développées de concert, on ne s'étonnera donc pas que les mathématiciens ont su identifier
également des structures linéaires dans les problèmes auxquels ils se sont attelés. Même la
sacro-sainte géométrie euclidienne peut être vue comme une «linéarisation» de l'espace
ambiant. On sait en effet depuis Einstein que l'espace-temps n'est qu'approximativ ement
3
linéaire dans un « petit »voisinage de l'observateur.
Progression
Le matériel que nous présentons était pour l'essentiel sans doute déjà connu par Cayley et
Grassmann à la fin du XIXe siècle et constitue les fondements d'algèbre linéaire dont tout
étudiant aura besoin, quelles que soient les études scientifiques qu'il suivra ultérieurement.
Pour nous familiariser progressivement avec la notion de linéarité, nous avons choisi d'ex-
périmenter longuement les notions de bases qui seront axiomatisées plus tard, au chapitre 17,
puis revisitées dans leur cadre général aux chapitres 18 et 19. Aussi, dans un premier temps, les
espaces vectoriels se présenteront avec un système de coordonnées priviligiées. C'était le point
de vue de Cayley et c'est souvent aussi celui retenu en physique, quand les coordonnées sont
des variables physiques significatives. De tels espaces s'identifient naturellement à l'espace des
n-uplets, l'espace canonique !Kn, où nous nous bornerons par simplicité aux cas où lK désigne
le corps IR ou C, et dont l'étude occupera l'intégralité du chapitre 15.
Dans de tels espaces, il est déjà possible de développer les notions de famille libre, de famille
génératrice et de base, avec la possibilité de faire des calculs très concrets. Nous introduirons
en outre la notion de sous-espace vectoriel, idée principalement due à Grassmann, qui nous
fournira une première raison de ne pas limiter notre présentation de l'algèbre linéaire aux seuls
espaces canoniques. En effet, il n'existe pas en général de coordonnées privilégiées sur un sous-
espace d'un espace canonique. Et pourtant toutes les notions que nous aurons développées
dans les espaces canoniques s'étendent sans difficulté à ces sous-espaces.
3
Cette approximation est excellente dans la vie quotidienne, mais, par exemple, les GPS actuels utilisent des
calculs relativistes pour connaître avec la précision requise la position des satellites.
384
Après avoir étudié les espaces canoniques, nous introduisons au chapitre 16 les applica-
tions linéaires entre espaces canoniques, qu'il est commode d'écrire sous la forme de tableaux
de nombres, c'est-à-dire de matrices. La loi de composition des applications de la théorie des
ensembles induit une loi de composition des matrices, multiplicative associative mais non com-
mutative. En particulier, l'espace des matrices carrées forment une algèbre non commutative
en dimension plus grande ou égale à deux, dont l'ensemble des éléments inversibles forment
un groupe particulièrement riche, le groupe linéaire. Mais un tableau de nombres peut servir
à représenter bien d'autres objets qu'une application linéaire. Par exemple, nous avons déjà
fait un usage limité de l'écriture matricielle pour noter une permutation dans le chapitre sur
le groupe symétrique.
Historiquement, bien que le terme de matrice soit dû au mathématicien anglais Sylvester, le
premier mathématicien à avoir employé une notation matricielle est le mathématicien allemand
Gauss, pour représenter une « substitution » linéaire dans une forme quadratique, de même
qu'il notait une forme ax2 + 2bx-y + c-y 2 par le triplet (a, b, c). Une grande place est consacrée
dans le chapitre 16 à la méthode du pivot de Gauss qui décrit un algorithme de résolution des
systèmes linéaires et qu'il est commode de présenter sous forme matricielle.
Le chapitre 17 est un chapitre de synthèse, où nous reprenons les idées développées dans les
deux chapitres précédents, mais cette fois dans le cadre général des espaces vectoriels, présentés
sous forme axiomatique. Plus que pour les autres structures algébriques rencontrées jusqu'ici,
nous avons essayé de préparer le parachutage de la définition générale d'un espace vectoriel en
insistant sur la signification du renversement opéré par le point de vue axiomatique. Bien sûr,
ce travail de fond aurait pu être fait pour chacune des structures algébriques précédemment
rencontrées, mais il est toujours difficile, dans la place impartie d'un seul volume, de présenter
en détail à la fois un problème et sa résolution. Il nous a semblé que l'algèbre linéaire, par la
place qu'elle occupe dans le programme de première année, était le lieu pour montrer en quoi
l'abstraction d'une structure algébrique était source de clarifications et de progrès.
Ainsi le point de vue change, et la famille des objets considérés s'agrandit. Nous présentons
de nouveaux exemples d'espaces vectoriels avec leurs satellites (espaces-vectoriels et sous-
espaces vectoriels, algèbres et sous-algèbres), ainsi que les morphismes entre ces objets, soit
principalement les applications linéaires.
Contrairement au cas des espaces canoniques, la notion d'espace vectoriel peut maintenant
se développer séparemment de l'idée de dimension, celle-ci faisant l'objet d'un traitement
spécial. Nous reprenons au chapitre 18 les notions de famille libre, de famille génératrice et
de base développées dans le cadre étroit des espaces canoniques au chapitre 15.
Les techniques de changements de bases sont détaillées, pour les systèmes de coordonnées et
pour les représentations matricielles des applications linéaires. Dans le dernier cas, soulignons
qu'il ne s'agit plus de comprendre comment deux structures vectorielles se transportent à l'aide
d'un morphisme, mais comment les morphismes eux-mêmes se transportent par changement
de coordonnées. Le bon outil est la matrice de passage que l'on verra comme un foncteur4 ,
sans bien sûr employer cette terminologie trop avancée pour un cours de licence.
Le chapitre 19 expose l'idée sans doute la plus géométrique contenue dans le programme
d'algèbre linéaire de première année, qui discute de la position relative de sous-espaces vec-
toriels donnés au sein d'un même espace vectoriel. Le cas le plus intéressant pour l'algèbre
linéaire est celui de deux sous-espaces se coupant transversalemen t uniquement en l'origine
4
Un foncteur est un « morphisme » de morphismes, qui transforme les objets d'une catégorie en des objets
d'une autre catégorie, et les morphismes de la première catégorie en des morphismes de la seconde.
385
et dont la somme permet de reconstituer l'espace total (c'est par exemple le cas d'une droite
vectorielle et d'un plan vectoriel en position générale dans un espace de dimension 3). Il a fallu
certainement une certaine audace aux précurseurs pour appliquer ce point de vue géométrique
aux espaces vectoriels généraux et à leurs sous-espaces, indépendammen t de leurs dimensions.
Nous verrons comment ce point de vue est très éclairant pour comprendre la structure d'une
application linéaire.
Enfin, le chapitre 20 traite non pas d'algèbre linéaire mais d'algèbre multilinéaire, c'est-à-
dire des applications de plusieurs variables, linéaires en chacune de leur variable. Nous nous
5
intéresserons aux déterminants, c'est-à-dire aux formes multilinéaires alternées • Inventée pour
l'étude des systèmes d'équations linéaires, les déterminants sont historiquement indissociables
du développement du calcul matriciel. Ainsi, Cauchy savait calculer le produit de deux déter-
minants, mais non celui de deux matrices. De cette tradition, nous verrons la règle de Cramer
(explicitée par ce dernier en 1754). Mais cette technique de résolution par des quotients de
déterminants est plus théorique que pratique. Aussi avons-nous préféré ici encore mettre en
avant des idées géométriques, celles des travaux de Jacobi, plutôt que de celles de Cramer.
Ainsi le déterminant est avant tout pour nous le calcul algébrique d'un volume.
5
Une fonction alternée est une fonction qui ne peut prendre que deux valeurs ±ksi on permute les variables.
Chapitre 15
CALCUL VECTORIE L DANS IT(n
D deux vecteurs du plan euclidien, et à multiplier un vecteur par un nombre réel. Or, il
est possible de définir des opérations analogues sur beaucoup d'autres objets mathé-
matiques. Par exemple, la définition de l'addition de deux fonctions ou de la multiplication
d'une fonction par un nombre réel sont très naturelles. Dès lors que sur un ensemble donné il
est possible d'additionner entre eux deux éléments quelconques, et de multiplier les éléments
par les scalaires, nous dirons que cet ensemble peut être muni d'une structure d'espace vecto-
riel (et que ses éléments sont des vecteurs), sous réserve que les deux opérations ainsi définies
obéissent à un certain nombre de règles raisonnables que nous préciserons.
Dans ce chapitre, nous commençons par l'exemple simple des espaces constituées de n-
uplets. Cet exemple est fondamental car d'une part il peut être considéré comme le modèle
de tous les espaces vectoriels de dimension finie, et d'autre part parce que presque tous les
autres exemples d'espaces vectoriels que nous considérerons dans ce cours seront construits à
partir de celui-là.
1
Dans tout ce qui suit, II{ désigne le corps des réels ou le corps des complexes.
où (x1, x2l, (yi, Yzl et (z1, z2) sont les coordonnées respectives de û, v et w.
L'ensemble lî2
est donc une sorte de « modèle »du plan.
Si on choisit un repère dans l'espace ambiant, l'addition de deux vecteurs conduit à une
3
équation similaire dans lî3 , car les coordonnées d'un vecteur constituent un triplet de lî .
lî 3 est un « modèle »de l'espace ambiant.
Ainsi, on peut dire que l'ensemble
Au passage, soulevons une question fréquente : lî3 est-il l'espace ambiant dans lequel nous
vivons ? La réponse est non. Que notre perception de la spacialité puisse se formaliser par
un espace euclidien de dimension 3 suppose déjà toute une construction de l'esprit, tout un
apprentissage que nous avons tous commencé dès la plus tendre enfance. Il ne s'agit cependant
1
Tous les énoncés restent valables si lK est un sous-corps quelconque de IC, comme ffi., IQ! ou un corps de nombres
algébriques. Presque tous les énoncés restent valables pour d'autres corps, comme par exemple Z/pZ, avec p
premier.
388
que d'un modèle, d'un outil qui nous aide à penser ce qu'est un certain aspect de l'espace,
bien adapté à un certain domaine du savoir scientifique.
Quand bien même on voudrait croire que l'espace dont nous avons l'expérience est parfai-
tement représenté par une structure vectorielle, il n'en est pas plus constitué, intrinsèquement,
de triplets de nombres réels ... Il faut pour cela choisir une origine et un repère.
Nous allons maintenant établir des règles de calcul dans nos «modèles» JR. 2 et JR. 3 . Bien
sûr, ces règles rassemblent le calcul vectoriel dont nous avons l'habitude. Or, nous ne faisons
essentiellement que deux opérations avec les vecteurs, qui se traduisent par deux opérations
dans JR. 2 .
Opérations dans le plan : Opérations dans JR. 2 :
1) Additionner deux vecteurs ; 1) (x1, x2) + (y1, Y2) = (x1 + Y1, x2 + Y2l;
2) multiplier un vecteur par un nombre 2) À(x1,x2) = (ÀX1,Àx2l,
réel. où (x1, x2l, (y1, Yi) sont dans JR. 2 et À ER
On calcule donc dans JR. 2 formellement comme avec les vecteurs du plan, et c'est pourquoi
l'ensemble JR. 2 , muni des deux opérations décrites dans le tableau ci-dessus, est aussi appelé
un espace vectoriel. Les éléments de JR. 2 sont des vecteurs et les éléments de lR des scalaires.
De même, on définit dans JR.3 les opérations suivantes :
1 Opérations dans JR. 3 :
1) (x1, x2, X3) + (Yi, Y2, Y3l = (x1 +Y1, x2 +Y2, X3 +y3);
2) À(X1, X2, X3) = (ÀX1, ÀX2, ÀX3),
où (x1, X2, X3), (Y1, Yi, y3) sont dans JR. 3 et À ER
Les espaces JR. 2 et JR. 3 portent aussi les noms d'espaces vectoriels canoniques de dimension
deux et trois sur R L'adjectif« canonique» (ou son synonyme «naturel») apparaît souvent
en algèbre. En français, le substantif« canon» est un terme d'origine juridique qui désigne un
ensemble de règles (penser au droit canon de l'Église romaine, ou au canon de beauté en art).
En mathématiques, il qualifie une situation (ou une équation, ou un ensemble de règles) qui
sert de modèle pour de nombreuses autres situations. Il est notamment employé lorsque l'on
veut privilégier un choix que l'on juge le plus naturel parmi d'autres. Il faut toutefois noter
que l'adjectif «canonique» n'est pas «canoniquement» défini : il n'existe pas de méthode
mathématique pour décider si un choix est canonique, cela reste une convention plus ou moins
justifiée par l'usage.
Par exemple, JR. 3 est un espace vectoriel canonique qui représente l'espace ambiant, mais la
correspondance entre l'espace ambiant et JR. 3 n'est pas canonique, car pour identifier l'espace
ambiant à JR. 3 , il faut choisir un repère et il n'en existe pas de privilégié : chaque observateur
a le droit de choisir le repère qu'il veut.
Comme les opérations dans JR.2 ou JR.3 se font composante par composante, il n'y a aucune
raison de limiter notre étude à la dimension 2 ou 3 : on peut définir des opérations analogues
sur l'ensemble ]Rn pour tout entier n. Par ailleurs, il est possible de remplacer les nombres réels
par les nombres complexes, c'est-à-dire de considérer les opérations analogues sur l'ensemble
en. La notation ocn désigne donc soit lRn, soit en.
Muni des opérations définies par (15.la) et (15.lb ), l'ensemble ocn est appelé l'espace vecto-
riel canonique de dimension n sur OC. Ses éléments, les n-uplets de nombres, sont des vecteurs.
La définition fait intervenir l'addition et la multiplication dans 1K dans chaque composante.
Ainsi les règles de calcul dans 1K (commutativité, associativité, élément neutre, etc.) induisent
les huit règles suivantes dans ocn.
Notons qu'un sous-espace vectoriel contient toujours .le n-uplet nul : cela résulte de la
définition ci-dessus en prenant À= 0 et v un vecteur arbitraire de F. Des calculs « linéaires»,
c'est-à-dire constitués d'une succession finie de sommes finies de vecteurs et de multiplications
par des scalaires, à partir de vecteurs d'un sous-espace vectoriel fixé F C E ne feront jamais
sortir de ce sous-espace vectoriel. Nous pouvons donc considérer les deux opérations
Il est clair qu'une combinaison linéaire de vecteurs de ocn est encore un vecteur dans ocn.
Rêgle.15.5. Soit F•un sous-ensemble non vide de gn~·Alors Fest uns(J1),S-espace vect6riel
si et seulement si toute combinaison linéaire ile vecteurs de f est dansF. ·
PREUVE.
► Supposons que F est un sous-espace de ocn. Soient v 1, ... , Vp dans le sous-espace vectoriel
F de ocn et soient À1, ... , Àp dans JK. Alors ÀjVj E F pour j = 1, ... , p, et par récurrence la
somme À1v1 + À2V2 + · · · + ÀpVp est aussi dans F.
► Inversement, supposons que F est stable par combinaison linéaire. Alors évidemment, pour
u, v dans F et À E JK, les vecteurs v+u et ÀV sont dans F car ce sont des combinaisons linéaires
particulières de v et u. ■
Notation. On note
par un nombre À E IK, on obtient encore une combinaison linéaire de V1, ... , Vp . Comme
vect(v 1, ... , vvl contient le vecteur nul, cette partie n'est pas vide et il résulte de cette dis-
cussion que l'ensemble vect{v 1, ... , vvl est un sous-espace vectoriel de ocn.
Définition 15.6. On appelle F = vect(v1, ... , vp) le sous-espace vectoriel engendré par
v 1, ... , Vp. On dit alors que la famille (v 1, ... , Vp) est une famille génératrice de F ou que
les vecteurs v1 , ... , Vp sont des générateurs de F.
Ainsi, pour construire des exemples de sous-espaces vectoriels de !Kn, il suffit de choisir
des vecteurs v 1, ... , Vp dans JKn et de prendre le sous-espace vectoriel engendré par ceux-là.
Nous verrons bientôt dans le théorème 15.20 que tout sous-espace vectoriel de !Kn est de cette
forme.
I
I
__vf>->
I
FIGURE 15.1. Espaces vectoriels engendrés par un, deux, ou trois vecteurs
{
Um1X1 + Um2X2 + · · · + UmnXn ~ 1Jm.
392
Les nombres aek et lJe, pour k = 1, ... , net e= 1, ... , m, sont des éléments donnés de JK. Les
inconnues sont les variables x 1, ... , Xn.
Une solution du système est un n-uplet x = (x 1, ... , Xn) E ocn qui vérifie toutes les
équations du système. La méthode par substitution est particulièrement simple si le système
est de la forme donnée par l'exemple 15.7. Plus tard, nous étudierons l'algorithme de Gauss
qui permet de ramener essentiellement tout système à cet exemple.
Xn-1 + Xn = lJn-1
Xn =lJn
On résout facilement du bas vers le haut. Le lecteur vérifiera que l'on obtient l'unique solution
(xi,•.•, Xn) = (111 -112, 112 -113, • • •, lJn-1 -lJn, 11n) ·
Un système homogène est un système dont le membre à droite est nul, c'est-à-dire s'il est
de la forme suivante.
+ Um2X2 + · · · + UmnXn ~ 0
{
Um1X1
PREUVE. Un système homogène possède toujours une solution, par exemple la solution
triviale x = O. L'ensemble des solutions est donc non vide. Montrons que six, x' dans ocn sont
solutions et si À E JK, alors x + x' et ,\x sont également solutions. Six et x' sont solutions de
(15.2), alors, pour tout 1 ~ e ~ m
et (15.3)
En ajoutant ces deux équations, nous obtenons
ae1 (x1 + x\) + adx2 + x~) + · · · + aen(Xn + x~) = O.
En multipliant la première équation de (15.3) par À, nous obtenons
+ aei(.\x2) + · · · + aen(Àxnl = O.
ae1(.\xi)
Comme les deux équations obtenues sont valables pour tout e= 1, ... , m, la première équation
montre que x + x' est aussi solution, et la seconde équation montre que ÀX est solution. ■
Dans les exemples suivants les sous-espaces vectoriels sont tous des ensembles de solutions
d'un système linéaire homogène.
3
o L'ensemble {(x 1, x 2, x 3) E JR. 3 x 1 - 2x2 + 4x3 = O} est un sous-espace vectoriel de JR. .
1
==}
Autrement dit, une famille de vecteurs est libre si la seule manière d'obtenir le vecteur nul
comme combinaison linéare de la famille consiste à prendre tous les coefficients nuls.
2) Des vecteurs v 1 , ..• , Vp dans :ocn forment une famille liée s'il existe À 1 , ... , Àp dans 1K
non tous nuls et tels que
394
Notez bien que ces notions ne portent pas sur des vecteurs isolés mais sur la famille
tout entière des vecteurs donnés. De plus, les notions de famille libre et de famille liée sont
évidemment antinomiques, c'est-à-dire qu'une famille est soit libre, soit liée.
Une équation ;\ 1v 1 + •••+ ÀpVp = 0, où l'un des coefficients au moins est non nul, s'appelle
relation de dépendance linéaire. On dit que les vecteurs sont linéairement indépendants ou
libres s'ils forment une famille libre. Dans le cas contraire, on dit qu'ils forment une famille
de vecteurs linéairement dépendants ou liés. Deux vecteurs liés sont dits colinéaires, et trois
vecteurs liés sont dits coplanaires.
Q)
~ EXEMPLE 15.12.
o Les vecteurs u = (1, 2, 3), v = (3, 1, 2), w = (2, 3, 1) sont libres dans ~ 3 .
En effet soient ;\ 1 , Àz, ;\3 E ~ tels que À 1u + ÀzV + À3W = O. Cela équivaut au système
==}
◊ On en déduit que toute famille ~qui contient une famille liée est liée. En particulier toute
famille contenant le vecteur nul ou deux fois le même vecteur est liée.
(15.4)
Pour isoler le vecteur vk dans (15.4), nous avons utilisé le fait que l'on peut diviser par tout
élément non nul du corps OC. C'est pourquoi nous nous sommes placés dans !Rn ou icn, et non
dans zn. L'ensemble zn peut cependant être muni naturellement d'une opération d'addition
et d'une opération de multiplication par les scalaires (éléments de Z). On obtient ainsi une
structure algébrique très naturelle et très intéressante sur zn, mais ce n'est pas une structure
d'espace vectoriel. C'est ce que l'on appelle un module. La structure algébrique de module est
importante mais plus délicate, elle ne sera étudiée qu'en troisième année de licence.
Nous donnons maintenant un critère simple pour qu'une famille de deux vecteurs de OC2
soit libre. Ce résultat est à rapproché de l'idée intuitive que l'aire d'un parallélogramme formé
par deux vecteurs donnés dans le plan est nulle si et seulement si le parallélogramme est
plat, c'est-à-dire si les deux vecteurs sont colinéaires. Plus tard, dans le chapitre 20 sur le
déterminant, nous généraliserons cette proposition à ocn, avec n quelconque.
Proposition 15. 14, Deux vecteurs (a, b) et (c, d) de OC2 sont colinéaoos si et seulement
si leur détermill9Jlt ad -:- be est nul.
► Supposons que ad - be= O. Il faut prouver que les vecteurs u et v sont liés. Si v = 0 ils
sont certainement liés car O• u - 1 · v = 0 par exemple. Considérons le cas v-=/ O. On a alors
e -=/ 0 ou d-=/ O. Si e -=/ 0, alors b = acd. Ainsi, il existe une relation de dépendance linéaire
entre u et v, à savoir
a a ad
u- -v = (a,b)- -(e,d) = (a,b)-(a,-) =0.
e e e
La preuve est similaire si d -=/ O. ■
Il est important de comprendre que deux vecteurs quelconques de OC 2 sont presque toujours
libres, tandis que la non-liberté est le cas singulier : choisissez deux vecteurs « au hasard »,
ils ne seront pas colinéaires en général. En effet, pour que deux vecteurs (a, b) et (c, d) soient
colinéaires, nous venons de montrer qu'il faut et il suffit que le quadruplet ( a, b, e, d) appar-
tienne à la partie J/ = {(x, y, s, t) E OC4 1 xt -ys = O} C OC4 . Or, J/ est toute «petite» dans
OC4 . Pour une justification rigoureuse de cette dernière assertion, il faudra attendre le cours
de théorie de la mesure de troisième année. En attendant, donnons l'explication suivante, non
parfaitement fondée puisque nous ne disons pas ce qu'est une probabilité sur OC4 .
Pour prendre au hasard ( a, b, e, d) dans OC4 , choisissons d'abord b, e, d. La probabilité
que d = 0 est nulle. Donc, presque sûrement, la fonction affine OC -t OC : a H ad - be n'est
pas constante. Elle s'annule ainsi en un unique p9int isolé, et la probabilité de choisir ce point
est nulle. Ainsi, en appliquant la règle des probabilités conditionnelles, puisque les choix de
a, b, e, d sont indépendants, la probabilité que ad - be= 0 est nulle.
De même, si on choisit trois vecteurs au hasard dans OC3, il est presque certain qu'ils ne
seront pas coplanaires. Plus généralement, une famille de vecteurs choisis au hasard dans
ocn est presque toujours libre, pourvu que le nombre de vecteurs choisis ne dépasse pas la
dimension n (voir la règle 15.18).
396
Le but de cette partie est d'expliquer comment trouver une famille génératrice aussi petite que
possible. À cette fin, en partant d'une famille génératrice donnée, il est nécessaire de savoir
discriminer les générateurs «superflus», c'est-à-dire ceux qui peuvent être supprimés sans
diminuer le sous-espace vectoriel engendré. Inversement, en partant d'une famille libre donnée,
nous pouvons nous demander comment «enrichir» cette famille, c'est-à-dire l'augmenter de
vecteurs supplémentaires sans que la famille obtenue ne devienne liée. Le lemme suivant
répond à ces questions et sera le pivot de beaucoup de nos démonstrations d'algèbre linéaire.
Lemme 15.15. Soientv1, . •• ,vp des veèteurs deKn et k-E {1,u .,v} un indice fixé.
1) Remplacer un générateur.
Soil u = !:.f=1 Ajv; une combi1W.ison linéaire twec Àk ::/- O.
Alors vect {v1, ... , Vp) = vect (v1, ••• ; Vic-1, u, Vtc+tt ••• , v..),
2) Additionner à un générateur une combinaison linéaire des autres2 •
Pour tout· (À1, ••• , fic, ... ,Àp) E ](fP-1
vect {vi, ... , Vp) = vect (v1, ••• , V1c-t, '1k.+ Lj#k ;\Jv;, Vk+t, ••• , Vp),
3) Supprimer un générateur d'uue famille liée.
Supposons que [.f=t ÀjV; = 0 est une relation de dépendance linéaire, avec Àk # O.
Alors vect (v1, ... , Vp) = vect (v1, ••. 1 vi:, ... ,vp).
4) Enrichir un famille libre.
Supposons que (v1, ••. , vp} est libre et soit u E Kn\vect(v1, ... , vp}-
Alors la famille (u, Vt, •.• , Vp) est encore libre.
397
PREUVE.
1) Il s'agit de montrer l'égalité de deux parties de ocn. Montrons d'abord l'inclusion::>. Consi-
dérons une combinaison linéaire des vecteurs v 1, ... , vk-1, u, Vk+l, ... , Vp· Si nous remplaçons
le vecteur u par son écriture Lf=1 ÀjVj et que nous regroupons les termes, la combinaison
linéaire ainsi obtenue s'écrit aussi comme combinaison linéaire de vecteurs de V1, ... , Vp·
Montrons maintenant l'inclusion contraire C. Comme u = Lf=
1 ÀjVj et que ,\k =/. 0, nous
pouvons isoler vk en écrivant
Vk = ;k ( U - ~ ÀjVj) , (15.5)
Considérons une combinaison linéaire de vecteurs de v 1, ... , Vp, Si nous remplaçons le vecteur
vk par l'expression donnée par (15.5), alors la combinaison linéaire ainsi obtenue s'écrit aussi
comme combinaison linéaire de vecteurs V1, ... , Vk-1, u, Vk+l, ... , Vp,
2) est un cas particulier du cas 1) avec ,\k = 1.
3) est un cas particulier du cas 1) avec u = O. En effet,
4) Soit u E lKn \ vect (v 1, ... , vp) et supposons que ,\u + Lf=1 ÀjVj = O. Si,\=/. 0, alors
qui est donc combinaison linéaire des v 1, ... , Vp , contrairement à l'hypothèse. Ainsi, ,\ = 0
et il reste que Lf= 1 ÀjVj = O. Il en résulte que Àj = 0 pour tout j = 1, ... , p. La famille
(u, v 1, ... , vp) est donc bien libre. ■
Utilisons le lemme 15.15 pour montrer une inégalité importante : il ne peut y avoir plus
de vecteurs libres que de générateurs.
Prop~tîo~ l-~•J.&. ·soienfu.1., ... 'Ûq oons it.n; $(v1, ••. 1 Vp sont des véitè'llrs linéaire-
mènfltid€pendànfs i/,d,riJJ vei:f(Ü'.ÎJ. -'·; Uq}, f1Î()rs·1H, q'. · .
PREUVE. Posons F = vect(u 1, ... , Uq), Supposons par l'absurde que p > q. L'idée de la
preuve consiste à remplacer, les uns après les autres, les générateurs U1, ... , Uq de F par les
vecteurs V1, V2 ... , Vq.
Étape 1. Écrivons v 1 = L~i CX-jUj, avec au moins un des CX-j non nul (car v 1 =/. 0). Quitte à
renuméroter les générateurs, nous pouvons supposer que <X1 =/. O. En vertu du lemme 15.15,
remplaçons u 1 par v 1 . Nous obtenons ainsi une famille génératrice (v1, u2, ... , Uq) de F.
Étape 2. Écrivons v 2 = j3 1v1 + L~z /3jUj. Au moins un des coefficients l3i, j ~ 2 est
non nul, car Vz n'est pas combinaison linéaire de V1. Quitte à rénuméroter Uz, ... , Uq, nous
pouvons supposer que 13 2 =/. 0 et remplacer u 2 par v 2 . Ainsi, (v 1, Vz, u 3 , ••• , uq) est une famille
génératrice de F.
2 La notation Àk est très commode pour indiquer la suppression du coefficient Àk dans une liste de nombres. Au-
trement dit, (À1, ...,4, ... ,
Àp) = (À1, ... ,Àk-1,Àk+l, ... ,Àp), Le chapeau - est en quelque sorte le symbole
mathématique du Tarnhelm wagnérien !
398
Itérons le procédé. Après q étapes, nous obtenons la famille (v 1, ... , Vq) qui est encore gé-
nératrice de F. En particulier, le vecteur Vq+l est combinaison linéaire des vecteurs v 1, ... , Vq,
ce qui montre que la famille (v1, ... , Vq, Vq+l) est liée. C'est une contradiction. On a donc
p ~ q. ■
Il.3. Bases
Nous venons de présenter deux procédés, l'un pour enrichir une famille libre, l'autre pour
épurer une famille génératrice de tous ses éléments superflus. Dans cette partie, nous étudions
les familles obtenues en poussant ces deux procédés à leur maximum. Il est remarquable que
l'on obtienne dans les deux cas le même type de famille.
Proposition-définition 15.17. . .· . . . . . .
Soit F c lKn u'n sous-espace vectoriel. Une base de
f est une famûle (b1, ... , b 11) de vecteurs
dans F qui vérifie les deux propriétés équivalentes suivantes : ·
1) la famille (b1, ..• , b11 ) est libre et génératrice de f;
2) tout vecteur de F s'écrit de manière unique comme comtrinaison linêaire desb1, ... , b 9 .
On convient que la famille vide i2J est ùné base de l'éspa'ce ntil f '= {O};
PREUVE.
1) =} 2). Soit u E F. Comme b 1, ... , bv sont des générateurs de F il existe À1 , ..• , Àn tels que
u = L.J=l Àjbi. Pour montrer l'unicité des coefficients Àj, on prend une autre combinaison
linéaire u = L.J=l ~bi. Alors I'.f=1(Àj-µj)bi = 0 et par liberté on obtient Àj- µi = 0 pour
tout j = 1, ... , p.
2) =} 1). D'après l'hypothèse on sait déjà que (b 1 , ... , bµ) est génératrice de F. Pour la liberté
on suppose L.J=l Àjbi = 0. Le vecteur nul s'écrit de manière unique comme combinaison
linéaire des b1, ... , bv, donc Àj = 0 pour tout j = 1, ... , p. ■
Dans le cas où F = ocn, il existe une base privilégiée. Considérons en effet les n-uplets
Cela montre d'une part que tout vecteur de ocn s'écrit comme combinaison linéaire des
e 1, ... , en, et d'autre part que cette écriture est unique (car les coefficients de la combinaison
linéaire sont précisément les composantes du n-uplet). Donc (e1, ... , en) est une base de ocn.
On l'appelle la base canonique ou la base naturelle de ocn.
Règle :,.5.18. . .
Toµte f<tmil.le libre dans Kn contient a'll plus n vecteurs.
Toutè famîlte gé1iératriœ de K_n possède au moins n vecteurs.
Lorsque Fest un sous-espace vectoriel strictement inclus dans ocn, l'existence d'une base est
moins évidente.De plus, même si une telle base sur F est pratique pour ramener des calculs
sur des vecteurs à des calculs en coordonnées sur des scalaires, il n'existe pas, en général, de
base privilégiée, de sorte qu'il n'y a pas lieu d'identifier F à un espace canonique.
Et pourtant, il est bien évident que la distinction entre la structure algébrique d'un espace
canonique et celle d'un sous-espace est artificielle : dans les deux cas, tout repose sur les
mêmes règles 15.2. Au chapitre 17, nous étendrons la définition des espaces vectoriels pour
pouvoir traiter les espaces vectoriels et les sous-espaces vectoriels de la même façon.
Il est à noter qu'ici encore, le fait de travailler sur un corps est essentiel. La proposition
qui suit n'a pas d'équivalent en général pour les modules.
PREUVE.
1) L'idée de la preuve est d'agrandir la famille libre (v1, ... , Vm) en une famille libre maximale.
Si F = vect (v1, ... , Vm) alors la famille est génératrice et libre, donc c'est une base de F. Dans
le cas contraire, on a vect (v 1 , ... , Vm) ~ F et on choisit un vecteur Vm+l E F\ vect (v 1 , •.. , Vm).
D'après la règle 15.15, la famille augmentée (v 1 , ... , Vm+il est libre. Si elle est génératrice de
F, alors c'est une base de F. Sinon, on itère le procédé jusqu'à ce que ce ne soit plus possible,
ce qui finit toujours par arriver car d'après la règle 15.18, une famille libre de Kn ne peut
contenir plus de n vecteurs libres. Cela signifie qu'à une certaine étape, on atteint l'égalité
F = vect (v1, ... , vp) , ce qui donne la base (v 1, ... , vp) de F.
2) L'idée de la preuve est d'extraire de la famille génératrice (v1, ... , Vml de F une famille
génératrice m_inimale. Si (v 1 , ••• , vml est libre, alors c'est une base de F. Sinon, il existe
une relation de dépendance linéaire et la règle 15.15 permet de supprimer un vecteur de
400
(v1, ... , Vml pour obtenir une famille encore génératrice de F. On itère le procédé tant que
possible, c'est-à-dire tant que la famille obtenue n'est pas libre, ce qui ne peut durer que
pendant au plus m étapes puisque la famille vide est libre. Ainsi le procédé finit par s'arrêter.
On obtient alors une famille libre et génératrice de F, c'est-à-dire une base de F.
■
- Théorètne;15.20. . ·. . <
< ;. , ;\ , . ;° •. >,
Tout s~-espace veetorîelf CKn possidéurieliâse {b1, ... ,b;}. ..•· ..· . ·• .·
Deux bases de f contiennent toujours le méme nombre. de vecteurs; appeltJa dimension de f
et noté dîmF. · · ·
PREUVE.
► Existence d'une base : il suffit de compléter la famille vide en une base.
► Cardinal des bases : soient (b 1, ... , hp) et (b\, ... , b~) deux bases de F. Alors b 1, ... , bp
sont dans vect (b;, ... , b~) et la proposition 15.16 montre que p ~ q. L'inégalité contraire
q ~ p s'obtient en échangeant les rôles de p et q. ■
{ :: : g_
Les vecteurs e 3 = (O, 0, 1, O) et e4 = (0, 0, 0, 1) sont des générateurs de F et sont libres. Donc
(e 3, e4 ) est une base de F qu'on pourrait appeler base naturelle. Mais le cas est rare où une
base semble réellement plus naturelle parmi toutes les autres.
EXEMPLE 15.24. Soit
Définition 15.25. Le rang d'une famille (v 1 , ••• , vvl de vecteurs de ocn est la dimension
de l'espace engendré par cette famille, soit encore rg (v 1 , ••• , Vv) = dim vect(v 1 , ••• , vvl.
EXEMPLE 15.26. Dans l'exemple 15.12, nous avons vu que la famille
1 0 -1 0 1 -1 0 0 0 0 0 0
0 0 0 , M2= 0 0 0 1 0-1 0 1 -1
-1 0 1 0 -1 1 -1 0 1 0 -1 1
1 0 0 4 2-8
li= 0 1 0 et A= -1 0 -1
0 0 1 -5 -4 7
sont des carrés magiques de caractères 1 et -2 respectivement.
Nous notons X l'ensemble des carrés magiques de type 3 x 3. Tout carré peut s'écire sur
une seul ligne (x11, X12, xn, X21, X22, X23, X31, X32, X33). Cela permet de considérer X comme
sous-ensemble de l'espace vectoriel canonique OC 9 . En effet, soient (i\, i\') E JR 2 et Met M' des
carrés magiques de caractères respectifs E., et E.,'. Alors on voit facilement que la combinaison
linéaire i\M + i\'M' est encore un carré magique et que son caractère est i\E., + i\'E.,'. Nous en
déduisons deux conséquences :
- X est un sous-espace vectoriel de OC 9 .
- Toute combinaison linéaire de deux carrés magiques à caractère nul est encore un carré
magique à caractère nul. Ainsi l'ensemble Xo des carrés magiques à caractère nul est
aussi un sous-espace vectoriel de OC 9 . Autement dit Xo C XC ]1( 9 .
Quelle est la dimension de X? On devine que la réponse est 5. En effet, pour construire
une carré magique, fixons arbitrairement son caractère (1 degré de liberté) et les quatre
composantes du sous-carré nord-ouest (4 degrés de liberté) - pour les cinq autres composantes,
il n'y a alors plus le choix. Formalisons cette intuition.
403
Proposition 15.2'T. L 'espacè .Jt:- de ça:rtés mtJ,fJiifues tk. type 3 x 3 ·e11fde dîme~on 5.
Les carrés magîqtJ,es M1, . .. , M.i, l[ ci-dessus forme_nt une base de .}((.
Pour prouver que M 0 est une combinaison linéaire de M 1 , ... , M4 , il suffit de montrer que
M = 0. Notons Yrk les coefficients de M. Il est immédiat que les quatre composantes nord-
ouest y 11 , Y12, y 21 , Y22 de M sont nulles. Pour la composante nord-est YB, un calcul immédiat
donne
Un calcul analogue montre que les autres composantes de M sont également nulles - seul le
calcul pour la composante sud-est y33 est légèrement différent :
Corôllaîre 15.33. Sint-à. é Il, Al~ ·lu carrés magiqiû!s de tJm'àitèffe U zSf!ntles cfJ'r'l'é!I de
la Jarm.e ·
••• •• 4.
UT L ~Mk,
C
k=l
IV. EXERCICES
15.1. 15.5.
Soit 15.6.
15.3. 15.7.
Soient u, v, w trois vecteurs de ocn et a., j3, y Lesquels des ensembles suivants sont des sous-
des scalaires tels que a.j3 =/= 0 et espaces vectoriels de R 3 ?
1. L'ensemble E des (x,11,z) E R 3 tels que
a.u + j3v + yw = O.
x2 + 112 + z2 = 0;
Prouver que vect (u, w) = vect (v, w).
2. L'ensemble F des (x, 11,z) E R 3 tels que
15.4.
2 2 2
x + 11 + z = -2(x11 + xz + 11z);
Expliquez pourquoi les ensembles suivants sont
des sous-espaces vectoriels de R 3 et déterminez 3. L'ensemble G des triplets de la forme
leurs dimensions.
(µ,À+ µ,À 2 - µ), où (À,µ) E R 2 ;
1. E =vect((l,2,3),(3,2, 1),(1, 1, 1));
2. F={(x,11,z) lx=11}; 4. L'ensemble H des triplets de la forme
3. G ={(x,11,z) 1 x+311 =11+z=2x-z=0};
4. H = {(x, 11, z)lx+311 = 11+z = x+211-z = O};
5. l={(x,11,z)lx+311=11+z=2x -z}. Reprendre l'exercice en remplaçant R par <C.
Chapitre 16
CALCUL MATRICIEL
NE matrice se présente sous la forme d'un tableau de nombres, mais peut donner lieu
U à plusieurs interprétations selon ce que l'on veut en faire. Cela ne peut être qu'un
simple tableau de nombres, sans structure, comme dans le cas des carrés magiques du
chapitre précédent, ou bien on peut la voir comme une liste de vecteurs colonnes ou une liste
de vecteurs lignes. Elle peut aussi coder les coefficients d'un système linéaire. Enfin et sur-
tout, nous verrons qu'elle peut modéliser toute application linéaire entre espaces vectoriels de
dimension finie. Cette dernière interprétation, fondamentale, explique pourquoi il est possible
de munir l'espace des matrices carrées de taille donnée d'une structure naturelle d'algèbre non
commutative. Aussi consacrerons-nous la majeure partie de ce chapitre à étudier le produit
de deux matrices. Comme dans le premier chapitre d'algèbre linéaire, nous insisterons ici sur
les aspects calculatoires.
1. MATRICES
Nous introduisons dans cette partie l'objet principal de ce chapitre d'abord comme simple
tableau de nombres. Puis, en l'interprétant comme représentant d'une application linéaire,
nous définirons le produit de deux matrices de formats adaptés.
A= (aekli,:;e,:;m =
1,:;k,:;n
L'indice C est appelé l'indice ligne, l'indice k est appelé l'indice colonne1 . On note Amn(lK)
l'ensemble des matrices m x n à coefficients dans 1K. Sim= n on note An(lK) = Ann(lK)
et on parle de matrices carrées d'ordre n.
Par exemple, les carrés magiques sont des matrices carrées d'ordre 3.
- Pour alléger les notations nous avons écrit aek à la place de O(f,k) pour tout indice
(C, k) E {1, ... , m} x {1, ... , n}.
On peut toujours insérer une virgule lorsqu'une confusion est à craindre. On distinguera
par exemple l'ensemble A2,4(1K) des matrices 2 x 4 et l'ensemble A24(lK) des matrices
carrées d'ordre 24.
1
Souvent, mais pas toujours, nous choisirons de noter f l'indice des lignes et k l'indice des « kolonnes ».
406
- Nous notons simplement A= (aekl lorsque le contexte ne laisse aucune ambiguïté sur
l'ensemble décrit par les indices.
Lignes ou colonnes. Une matrice 1 x n est une ligne et une matrice n x 1 est une colonne.
Comme les deux sont des n-uplets nous identifions l'espace canonique ocn à At'1n(lK) ou encore
à Ani (JK), c'est-à-dire que nous écrivons les n-uplets de ocn en ligne ou en colonne, selon nos
besoins. On parle alors de vecteur ligne ou de vecteur colonne.
Identification avec ocmn. Nous pouvons écrire les coefficients d'une matrice m x n en une
seule ligne, c'est-à-dire en un mn-uplet. Pour cela, il suffit de choisir un ordre de lecture des
coefficients, par exemple ligne après ligne
Une fois un tel ordre arbitrairement fixé, At'mn(lK) s'identifie à ocmn_ Ainsi, les opérations
d'addition et de multiplication par un scalaire dans ocmn induisent des opérations analogues
sur At'mn(lK) : nous avons défini l'addition de deux matrices m x net la multiplication d'une
matrice par un nombre dans JK. Évidemment, ces définitions ne dépendent pas du choix de
l'ordre de lecture des coefficients qui a servi à réaliser l'identification. En effet, il est facile
de vérifier que ces opérations se définissent directement sur les matrices par les formules
suivantes:
(
a~1 a~ ... U~n + b~1 b~ ... b~n
De même, les notions de famille libre, famille génératrice et de base sont valables aussi
pour les familles de matrices. En particulier, At'mn(lK) possède une base canonique : elle est
constituée des matrices Eek, 1 :::;; f :::;; m, 1 :::;; k :::;; n, où Eek est la matrice dont tous les
coefficients sont nuls sauf celui d'indice (!, k) qui vaut 1. Par exemple, dans At'24 (JK),
0100) 0000)
E12 = ( 0000 ' Ez4 = (000 1 .
1 sia=j3,
.Eek = (ô(t,k).(p,qJli,;;v,;;m avec le symbole de Kronecker ôcx,/3 = .
1,S:q,S:n { O SI <X=f j3
407
Toute matrice A = (Ufkl E Atmn(lK.) se décompose alors d'une unique façon sous la forme
L.
A =
1,;;f,;;m
1,;;k,;;n
UfkEfk·
1
Test 16.1. Test 16.3. i
ü
À quel espace appartient la matrice Exprimer cô
y'3 13) 7
13) +2! (-2260)
......
a
( i+2 0 1 .
Test 16.2.
(01
Quelle est la dimension de AlmnOK)? sous la forme d'une matrice.
Dans cette partie, nous allons voir comment une matrice peut s'interpréter comme une appli-
cation entre espaces canoniques.
Définition 16.2.
Le produit d'une matrice A= (akd E Atmn(lK.) et d'un vecteurx E ocn est défini par:
(16.1)
m~
colonne, ce qui donne un élément de JK..
Cl)
(1; ~ 6) (-i) = (1) +
2 -4 0 -7
-1
-2
2
3 ( ;)
-4
( 6) ( ~)
-7 -9
~
o..
Notation. Pour toute matrice A E Atmn(lK), nous noterons  : ocn -+ ocm l'application
définie par Â(x) = Ax.
La propriété qui suit exprime le fait que l'application A préserve les structures d'espaces
vectoriels de ocn et de ocm.
Règle ·16.f.i. Soit A E .Af(K)mn. :Ptn1,r tbûs t;y dàiÎil~:~))êt"îkiif !Qtd XÊ{ Xi·•.
Â{x+vr=,Â(x)+Âfy) .. et.. Âf'-if==iÂ{xJ.·
PREUVE. Utilisons la règle 16.3.
n n n
A(x+y} = L_(Xk +Yk)Ck = L. xkCk + L_ YkCk = Ax+ Ay,
k=l k=l k=l
n n
EXEMPLE 16.6. Dans un pays démocratique imaginaire, trois partis tout aussi imaginaires
se partagent les suffrages des électeurs : les partis bleu, rose et vert. 2 Convenons d'appeler
sympathisant d'un parti donné tout électeur ayant voté à la dernière élection pour le candidat
de ce parti. Nous l'appellerons bleu, rose ou vert selon sa couleur politique. Supposons que, à
chaque nouvelle élection, 80 % des bleus conservent leur couleur politique, que 8 % passent
aux verts et que 12 % passent aux roses. Pour les sympathisants roses, 70 % restent roses,
20 % deviennent verts et 10 % passent aux bleus. Enfin, pour les sympathisants verts, 60 %
restent verts, 25 % passent aux bleus et 15 % passent aux roses.
Question : si on note b, r et v la répartition (en pourcentages) des électeurs portant leur
sympathie pour les partis bleu, rose et vert respectivement, quelle sera la nouvelle répartition
B ,R et V à l'élection suivante?
Réponse : ► il est facile de vérifier que les données s'expriment par la formule suivante :
l (80 10 25)
avec A = 00 12 70 15 .
1
8 20 60
1
Bien sûr, toute ressemblance avec un pays existant ne serait que pure coïncidence.
409
Or il apparaît que l'application ainsi obtenue s'écrit encore sous forme matricielle. On
montre en effet aisément par récurrence sur n qu'il existe une matrice An E .4l33 (JR) telle
que ( Â) n= An.
Peut-on calculer An directement à partir des coefficients de A? La réponse
est oui, c'est l'objet de la partie qui suit. li
ü
1.2.2. Produit de deux matrices cô
.....
Calcul préliminaire. ..d
ü
Si A = (uktl E AtmnOK) et B = (b;_j) E Atnp(][{), nous avons vu dans la partie précédente
qu'il leur correspond deux applications  : ][{n ----+ ][{m et B : ][{P ----+ ][{n_ Considérons alors
l'application composée  o B : ][{P----+ ][{m. Comme nous l'avons vu dans l'exemple 16.6, il est
naturel de se demander s'il existe une matrice C E Atmp(K) telle que ê = Â o B.
► Soit ( eili,s;j,s;p, ( fk)l,s;k,s;n et (gf) 1,s;f,s;m les bases canoniques de ][{P, !Kn et ][{m respectivement.
Alors, par définition des applications  et B, pour tout (x;_) E ][{P et tout (1Jj) E ][{n,
p
B ( ~ xiei
)
) =;
n p
~ bkix/k;
m n
f=l k=l
= t t, (t,
m p
Ufkbk) Xj9f
En posant C = (Cfj), on a bien ê = Â o B, ce qui montre qu'il existe au moins une matrice
qui satisfait l'identité souhaitée.
► Inversement, si C = (C 1, ... , Cn), vue comme matrice de m-uplets écrits en colonne, est
une matrice quelconque telle que ê = Â o B, alors la règle 16.3 montre que pour 1 :,:; i:,:; p,
p
Pour tôut (A, B}.·e ;A'rttn'(KJ x .Artfl(K}; le pf'bd'Ûif A l'.f êst ·1\tntquê mahiée :élëftœnt de
.Anp(K} tel que:ÂB == Â'.o B.
Revenons sur la formule (16.2). Le coefficient Crj est le produit de la f-ième ligne de A par
la j-ième colonne de B, soit encore
EEj [Ill] ~1
A B AB
La définition 16.2 et la formule (16.2) entraînent alors facilement les deux identités
- (16.3)
Règle· 1&..8. . ..
Les cofonnes de AB sorit de$ co~btnaisons lirJéairea'des ?.t>to~nes fie A; Plt1S précisdment,. la
Hème colonne de AB est la eombinaison linéttiii 'des coloniJes de A. qui à.JtfJUr eoejftcients
les éléments de la j-ième. colonne de B :
• :n
hième colonne de AB = Aq ::; E b1qCtc,
b=l
EXEMPLE 16.9. Nous ne pouvons inverser l'ordre des deux matrices dans le produit
Si les deux matrices sont carrées, le produit a encore un sens si on inverse l'ordre des
matrices, mais le résultat est différent en général : la multiplication n'est pas commutative.
Contrairement au calcul dans un corps, le produit de deux matrices non nulles peut donner
la matrice nulle. On appelle de telles matrices des diviseurs de zéro.
m, ~ m
Soit A E Atmn(K) et soit er le f-ième vecteur
de la base canonique de Km et e( le k-ième
C = (1,2,3] D (1,2,3]. vecteur de la base canonique de Kn. On note er
comme ligne et e( comme colonne. Calculer les
produits eeA et Ae(.
Test 16.5.
Test 16.8.
Que pensez-vous des affirmations suivantes?
Notons Erk les vecteurs de la base canonique de
a. L'espace engendré par les lignes de AB
Atn(K). Soit A E Atmn(K) et B E Atnm(K).
contient l'espace engendré par les colonnes de Calculer les produits AEek, EekB et ErkEpq .
A.
b. L'espace engendré par les lignes de B Test 16.9.
contient l'espace engendré par les lignes de AB. Pour multiplier deux matrices n x n combien
c. L'espace engendré par les colonnes de AB est de multiplications dans K doit-on effectuer? Et
le même que l'espace engendré par les colonnes combien d'opérations faut-il au total (additions
de B. et multiplications)?
412
Nous venons de définir une opération de multiplication sur les matrices. Comme toujours
quand on rajoute une structure algébrique sur un ensemble, il est intéressant d'en étudier la
compatibilité avec les structures déjà existantes, comme ici la structure d'espace vectoriel de
.4l1nnOK). Ceci sera particulièrement remarquable dans le cas où m = n, pour lequel nous
obtiendrons une structure d'algèbre. Nous commençons par introduire une notation pour le
futur élément neutre de cette algèbre.
Définition 16.12. La matrice identité d'ordre n est la matrice ITn = (ôekl E .4ln(OC). Tous
ses coefficients diagonaux sont égaux à 1 et tous les autres sont nuls.
Notation. Lorsqu'on laisse un vide dans une région d'une matrice, cela signifie que tous les
coefficients dans cette région sont nuls.
On vérifie facilement que la matrice identité joue bien le rôle d'un élément neutre dans la
multiplication matricielle.
Nous avons vu que le produit matriciel n'est pas en général commutatif, même quand cela
a un sens d'inverser l'ordre des matrices. Toutefois, la multiplication matricielle satisfait fort
heureusement les autres règles habituelles de calcul comme la distributivité et l'associativité.
Il faut seulement veiller à respecter l'ordre dans lequel les matrices sont multipliées.
Rêgle 16~14.
Pour A,À' dans .A'mn(K), B,l3 1
da'IUJ .4,w{K}, CE .A'pq{K} et AE K., on a
. J.lA{B +B') =,A1J+AB 1
; 3} >.(AB) - (M)B= A(}.B);
·2l (A+A')B=AB +A'B; 4) A{BC}=(AB)C.
D'après 3) et 4), il n'y a pas d'ambiguïté à écrire sans parenthèses les produits ÀAB et ABC.
PREUVE.
Les deux premières règles sont des conséquences faciles des règles 16.3 et 16.5. La règle 3)
découle immédiatement de la définition du produit matriciel. Seule la preuve de l'associativité
du produit matriciel, c'est-à-dire la règle 4) requiert quelques détails.
Par définition, la matrice A(BC) est l'unique matrice de .4i'Tnq(l[{) telle que A(BC)
 o Éè. Or, BC est l'unique matrice de .4tnq(OC) telle que Éè = Ê o ê. Il en résulte que
Ainsi
ÂoBC=Â(Bel = (AB)C.
Il s'ensuit que A(BC) = (AB)C par unicité de la matrice représentant le produit  o BC. ■
Remarque. Au passage, notons que par une simple récurrence sur r, les règles 1) et 3)
montrent que pour A E Atmn (]K), B1 , ••• , Br dans Atnp (1K) et À1 , ..• , Àr dans IK, on a
(16.4)
Dans le cas où m = n, ces règles de calculs montrent que l'ensemble des matrices carrées
est muni d'une structure d'anneau. La démonstration se fait en vérifiant point par point les
axiomes d'un anneau. C'est un exercice facile laissé au lecteur.
Ptol)~tiqn 16.11). Eimstimble .4ltn{Kl des 1t1,(Jtri,cei; eiJ,'f!fées d~ordn n, muni de 1'additîon
et clé la multîpliëutioomatrtcîêllësrtst'un an~u; Son tlêmerit n ~ pour la multîplic4tion
esNa miÎ~ 1,,::: ;. ··. · " · · · · ·· · · <
Terminons cette partie par une remarque. Nous avons insisté sur l'idée que la définition
du produit matriciel est induite de la composition des applications correspondantes entre
espaces canoniques. En retour, on peut se demander quelle est la structure de l'ensemble des
applications de ocn dans ocm qui sont de la forme Â, avec A E Atmn(IK), muni de l'addition
et de la multiplication par les scalaires usuelles.
Nous étudierons cet ensemble, notamment dans le cas m = n, ainsi que la correspondance
A H Â, au chapitre 17. Pour le moment, nous nous bornons à mentionner quelques propriétés
immédiates ou qui se déduisent clairement des règles que nous venons d'énoncer.
D'après le théorème 15.20, il existe une base (b 1, ... , bp) de vect (l 1, ... , lm)- Les lignes sont
des combinaisons linéaires des vecteurs de cette base. Ainsi
l1 i\11b1 + i\12b2 + · · · + i\1pbp,
l2 i\21 b1 + i\22b2 + · · · + i\2pbp,
(16.5)
{
lm= Àm1b1 + i\m2b2 + · · · + Àmpbp.
Chacune de ces équations est une égalité entre n-uplets, que l'on peut donc écrire composante
par composante. Notons
b1 = (1311, 1312,. • •, 131n), b2 = (1321, 1322, ... , 13zn), ... , bp = (l3p1, 13p2, ... , 13pn).
La première composante de chaque équation du système (16.5) donne
Donc le rang des colonnes de A est majoré par p, c'est-à-dire par le rang des lignes. Que
le rang des lignes soit majoré par le rang des colonnes se démontre de manière analogue,
d'où l'égalité de ces deux rangs. La majoration rg A~ min(m, n) est alors une conséquence
immédiate du fait que les lignes sont dans ocn et que les colonnes sont dans ocm. ■
Pour mieux apprécier ce qu'il y a d'étonnant dans ce résultat considérons l'exemple suivant.
12 3)
EXEMPLE 16.18. Considérons la matrice carrée A=
(32 46 51 E ..4t3(lR).
Nous remarquons toute de suite que la deuxième colonne est un multiple de la première.
Donc il y a une relation de dépendance linéaire entre les colonnes. Ainsi rg A < 3. Les
deux dernières colonnes étant non colinéaires, on a rg A > 1. Ainsi rg (A) = 2. D'après la
proposition 16.17, il existe alors aussi une relation de dépendance linéaire entre les lignes et
cela ne saute pas aux yeux! Ni les colonnes ni les lignes de A ne forment une base de JR 3 .
Remarque.
1) Choisissons une matrice 3 x 6 avec des coefficients pris au hasard. Quel est son rang ?
Réponse : son rang est presque sûrement 3. En effet, les trois vecteurs lignes sont pris au
hasard dans l'espace vectoriel IK 6, de dimension 6. Aussi seront-ils libres avec une probabilité
de 1.
2) En général, une matrice A choisie au hasard dans ..4tnm(IK) est de rang maximal, c'est-à-
dire rgA = min(m, n).
3) Si un professeur cherche, par exemple pour « inventer » un exercice, n vecteurs liés dans
ocn, il peut procéder de deux manières :
o Choisir n- 1 vecteurs quelconques dans ocn, puis prendre comme n-ième vecteur n'importe
quelle combinaison linéaire des n - 1 premiers vecteurs.
o Prendre n vecteurs colonnes liés dans ocn, en utilisant la première méthode, les rassembler
en une matrice n x n, puis considérer les vecteurs lignes de cette matrice.
Voici la différence entre les deux méthodes : dans la première, le professeur connaît une relation
de dépendance linéaire car il l'a construite lui-même. Dans la seconde méthode, il ne la connaît
pas plus que les étudiants auxquels l'exercice est destiné; il sait seulement que les vecteurs
sont liés.
Test 16.15.
Soit A E .4'mn0K). Que pensez-vous des pro-
positions suivantes ?
416
A= (An A12) _
A21A22
On convient qu'une matrice de format O x n ou m x O est vide. Si par exemple m 2 = 0 la
matrice est partitionnée en deux blocs A = (A 11, Au).
Un tel découpage d'une matrice peut être intéressant pour calculer son rang. Nous nous
appuyons sur l'observation élémentaire suivante :
Prenons une famille (v 1 , ... , Vp) de vecteurs de ocn et complétons chaque Vj = (vi 1 , .•• , Vjn)
d'un nombre n' de composantes arbitraires. On obtient un famille de vecteurs
Vj = (vjl, ... , Vjn, *, ... , *)
de ocn+n', où les étoiles désignent des scalaires qu'il n'est pas utile d'expliciter. Si certains
vecteurs parmi les v 1 , ... , Vp constituent une famille libre, alors les mêmes vecteurs étendus
forment encore une famille libre. En effet, une relation de liaison sur les vecteurs étendus
induit automatiquement une relation sur les vecteurs correspondant dans ocn, avec les mêmes
coefficients. Aussi rg(v 1 , .•. ,vp) ~ rg(v1 , .•. ,vp)-
EXEMPLE 16.20. La matrice suivante est de rang au moins 2, peu importe les valeurs des
étoiles.
****)
( 21 31 ** ** .
Notation. Il est commode de remplir les composantes que l'on ne souhaite pas expliciter
par un symbole conventionnel, par exemple une étoile, ou des hachures. L'espace vide est
traditionnellement réservé au cas où la composante est nulle. Les barres dans les matrices
sont des séparations pour distinguer les blocs.
Il est clair que la somme de deux matrices de même format et de même partition en
blocs peut s'effectuer blocs par blocs. De plus, on peut remarquer que le produit matriciel
peut également s'effectuer en utilisant des blocs. Le produit généralise la formule du produit
matriciel avec des coefficients scalaires. Il faut cependant être attentif ici à bien respecter
l'ordre dans les produits de blocs, car ceux-là ne sont en général pas commutatifs.
417
ét (~1:t:);r;; ls
d~ fuâtriêes ~ des 1>loés B~ ~~format T:1 x mp ~t Al></
i
·{t::I:).(ltt:)·~•·~:;1::t:~:!~!kZiZ1~'
ü
(0
,....,
..d
ü
Dans le cas particulier où tous les blocs sont de format 1 x 1, nous retrouvons bien entendu
la formule habituelle du produit matriciel.
Le lecteur vérifiera aisément cette règle par un calcul direct. Nous la redémontrerons plus
tard, au chapitre 19, page 529, par des considérations plus ll,bstraites. Bien évidemment, nous
pouvons généraliser les deux règles à un nombre de blocs quelconque.
Dans la formule ci-dessus, nous avons implicitement supposé les conditions suivantes :
- les indices j des sommes de la matrice du terme de droite parcourent chacun l'ensemble
{1, ... , m};
- les blocs A1k •.. ,Amk d'une même colonne ont tous le même nombre de colonnes, et
les blocs An ... , Ain d'une même ligne ont tous le même nombre de lignes. Il en est de
même pour B;
- tous les produits matriciels ont un sens, c'est-à-dire que le nombre de colonnes du bloc
Bei est égal au nombre de lignes du bloc Aik·
EXEMPLE 16.22.
2)
10 12
10
15 18 .
(
15 8
Vérifions que Gl(n, lK) est bien un groupe. L'associativité de la multiplication et le fait
que ITn est l'élément neutre découle des propriétés du produit matriciel que nous avons déjà
vues. En outre, si A, B dans .4tn(1K) sont inversibles, alors
(B- 1A- 1 )(AB) = B-1 (A- 1 A)B = B-1ITnB = B- 1B = ITn,
1
(AB)(B- 1A- 1 ) = A(BB- 1)A- 1 = AITnA- 1 = AA- 1 = ITn,
ce qui montre que AB est inversible avec (AB)- 1 = B- 1 A- 1 •
(011)1 (10-1)
1 = (10-1)
1 (11)
01 = (01)
2
1O = [ IT 2 , 2.
Si n ~ 3, on voit par multiplication en blocs que les matrices suivantes sont inversibles et ne
commutent pas :
Nous allons maintenant donner plusieurs critères pour reconnaître les matrices inversibles.
Pour cela, le lemme suivant sera utile.
Lemme 16.25. La multiplication matrièielle n'augmente pas le rang. Autrement dit, pour
tous A E -4.mnf!K) et BE ;A'np{K), ona rg(AB} ~ min(rg(A),rg(B}).
PREUVE. Les colonnes de AB sont des combinaisons linéaires des colonnes de A, d'où la
majoration rg (AB) ~ rg (A). Les lignes de AB sont des combinaisons linéaires des lignes de
B, d'où la majoration rg (AB) :,;; rg (B). ■
419
On retiendra notamment que les inverses à gauche ou à droite d'une matrice carrée sont
identiques, et qu'ils sont donc l'inverse. Cela signifie que pour vérifier que deux matrices
carrées A et B sont inverses l'une de l'autre, il suffit de calculer un seul des deux produits AB
ou BA et de montrer qu'il égale lin.
PREUVE. Le fait que ad-be cf. 0 soit une condition nécessaire et suffisante pour l'inversibilité
est une conséquence de la proposition 17.14. Le lecteur vérifiera la formule donnée en calculant
par exemple le produit
(ab) ( d-b) = (
ed -e a ad - be) ll2 • ■
420
II.4. Transposition
Les considérations précédentes sur le rang d'une matrice ont fait apparaître que des raisonne-
ments peuvent se faire aussi bien sur les lignes que sur les colonnes. Dans cette partie, nous
allons formaliser cette symétrie entre lignes et colonnes.
La transposition d'une matrice intervertit les rôles des colonnes et des lignes.
14
EXEMPLE 16.29. S1 A= . (123)456
, alors tA = ( )
; ~ .
PREUVE.
1) Cela résulte immédiatement de la définition : si aek est le coefficient de A d'indice (C, k),
alors au est le coefficient de tA pour ce même indice et, par suite, aek est bien le coefficient
de ttA d'indice (C, k), ce qui prouve l'identité souhaitée.
2) C'est une conséquence immédiate de la proposition 16.17.
3) Notons A= (aekl et B = (bkil- Considérons le coefficient d'indice (j,C) de t(AB), c'est-à-
dire le coefficient Cej de AB.
Cej = (ae1, ... , Uenl t(b1j, ... , bmj) = I:~1 Uekbki = (b1j, ... , bmj) t(an, ... , Uenl-
Donc Cej est le produit de la j-ième ligne de tB par la C-ième colonne de tA, ce qui prouve
que Cej est le coefficient d'indice (j, C) de tB tA.
421
4) Calculons: t(A- 1 )(lA) = t(AA-1 ) = trrn = Iln, Ainsi, la matrice t(A- 1 ) est l'inverse à
gauche de tA et le résultat s'ensuit d'après la proposition 16.26. ■
Notons qu'en vertu de la quatrième règle, nous pouvons supprimer sans ambiguïté les paren-
thèses pour calculer l'inverse d'une transposée que nous noterons désormais tA _,.
IIl.1. La méthode
La méthode du pivot ou le procédé d'élimination de Gauss est un algorithme qui permet de
calculer le rang d'une matrice, soit encore - et nous avons vu que cela revenait au même - le
rang d'une famille finie de vecteurs de Il{n_ Nous verrons également dans cette partie comment
il permet de résoudre les systèmes linéaires.
Soit A une matrice m x n. Notons l 1 , ... , lm ses lignes et C 1, ... , Cn ses colonnes. Nous
avons donc
Pl'.oposition 16.31.
l} l,e,s opé~fJ;S{lérnentaires sur les lignes ne dumgent pas le sous.;espacè 11tdoriel c1e Kn
e~ge:n,âté par les ligt,,es.
2) w opéràtiôns 'êlémente;ires sur- les· colonnes ne chàngent pas le· sous~espace v(!ctoriel ·de
K.m engendré pat les colonn.es:
3) Aucune opératiôn élémentaire ne change le rang de la matrice.
PREUVE.
1) Il est évident qu'une permutation des lignes ou la multiplication d'une ligne par un scalaire
non nul laisse vect {l 1 , .•. , lml inchangé. Pour l'addition d'un multiple d'une autre ligne, c'est
une conséquence du lemme 17.15.
2) La démonstration est analogue.
3) C'est une conséquence de 1) et 2) et du fait que le rang des lignes est égal au rang des
colonnes d'après la proposition 16.17. ■
422
L'idée de la méthode du pivot est d'arriver, par une succession finie d'opérations élémen-
taires sur les lignes, à une matrice dont le rang se calcule de tête.
1 * ... *
0 * ... *
U31 U32 .. · U3n
► De même, par le même type d'opération élémentaire, le pivot peut «nettoyer» toutes les
entrées en-dessous dans sa colonne. Nous obtenons la matrice
3) Suite de l'algorithme
On applique au bloc A' les deux étapes que nous venons de décrire (installation d'un pivot,
puis «nettoyage» en-dessous). Comme le bloc à gauche de A' est nul, il n'est pas affecté par
ces opérations. À l'intérieur du bloc A', on obtient un nouveau bloc A" et on recommence ...
1 * * * * * * * ... *)
1 ******···*
1****···* (16.6)
( 1 ***···*
1 * ... *
La matrice (16.6) n'est qu'un exemple. Plus généralement, on obtient une matrice A dans
.4i'mn0K) qui peut commencer par des colonnes nulles (si les premières colonnes de A sont
423
nulles, on n'y trouve pas de pivot) et finir par des lignes nulles (l'algorithme s'arrête lorsqu'on
ne trouve plus de pivot). En général, le résultat final de l'algorithme de Gauss est donc de la
forme
1
A = ( Or p escalier ) (16.7) i
ü
cri
......
Om-r,p Om-r,n-p
.d
ü
où Op,q désigne la matrice nulle de format p x q. Les cas p = 0 ou m = r sont néanmoins
possibles. L'entier r est le nombre de pivots ou encore le nombre de «marches» de l'escalier.
La hauteur des «marches» de l'escalier est toujours d'une unité tandis que la largeur des
«marches» peut varier. Il existe un entier r E {l, ... , min(m, n)} et une suite finie k1 < k2 <
... < kr tels que
sii=l, ... ,r
si € = 1 , ... , r et k < ke (16.8)
si€> r.
Bien sûr, il n'est pas utile d'apprendre par cœur les formules (16.8), mais il est plus important
de comprendre la forme d'escalier sur la matrice de (16.6). Les équations (16.8) traduisent
le fait que les indices k 1 , ••• , kr indiquent les colonnes qui portent un pivot. Par exemple,
dans (16.6), nous avons r = 5 et (k 1, ••• , k 5 ) = (1, 2, 4, 5, 7).
Avec des opérations élémentaires sur les colonnes, nous pouvons aller plus loin et trans-
former l'escalier« irrégulier» A de (16.7) en un escalier dont les «marches» sont toutes de
largeur 1. Nous permutons les colonnes de A pour obtenir une matrice de la forme
1* *
:* *
.. * : (16.9)
1* *
Ensuite, nous « nettoyons » tout ce qui se trouve à droite des pivots par des combinaisons de
colonnes, en utilisant la sixième des opérations élémentaires que nous avons énoncées. Nous
obtenons une matrice de la forme
(16.10)
EXEMPLE 16.32. Nous allons appliquer la méthode du pivot de Gauss pour calculer le
rang des trois vecteurs (1,2,3), (2,4, 1), (3,6,5) de JR. 3 .
Nous écrivons plusieurs opérations en une seule étape et les indiquons, l'une après l'autre,
par des petites flèches. Dans la deuxième étape, par exemple, nous multiplions la deuxième
ligne par -i, puis nous ajoutons à la troisième ligne la deuxième multipliée par 4.
A=
123)
241
( 3 65
=]2 -3
+
12 3)
00-5 I x
( 00-4 <
(-D J4 A=
123)
001
( 000
+ +
L'algorithme de Gauss s'arrête ici, on trouve rg (A) = 2. On pourrait continuer avec des
transformations élémentaires sur les colonnes, d'abord en permutant des colonnes, ensuite
en « nettoyant » la matrice, pour obtenir
132) _ (100)
0 10 A= 010 ,
( 000 000
mais cela est inutile si on ne souhaite calculer que le rang, qui, en fait, pouvait se calculer
de tête dans ce cas (voir l'exemple 16.18).
En général, il n'est pas nécessaire de normaliser les pivots par le nombre 1. Nous pouvons
laisser des pivots avec des valeurs quelconques pourvu qu'elles soient non-nulles. En effet, cela
n'empêche pas le «nettoyage».
EXEMPLE 16.33. Nous allons appliquer l'algorithme de Gauss à une matrice réelle de type
4 x 6. Remarquez que nous commençons par permuter deux lignes pour ne pas avoir -3
comme premier pivot, ce qui évite l'apparition de fractions, et que nous simplifions la 3ième
ligne pour éviter de manipuler de grands nombres.
425
A=
c~ -1
8
-3
-24
9
3
-2
-1
4 -12
0 -2
3 5
-2
-4
7
_;) ?i
10
~
~
s
'3
<:)
cil
ü
-co
(-~ -1
-3 -2
-1
-6
3
9 -2
0
3
-3
-2
5
-1
7
-~)~10 +
..d
ü
( 0
-3
0
-1
0
-2
-1
_q
0
0
0
0
-1
1
-1
-3
3
5 10 :J
1 -3 -1 -2
( 0
0
0
0
0
0
0
0 -1
0 -3
-1
2
6 i) '.. (-1) 1:
~ ~
-3 -1 -2
A~( 0
0
0
0
0
0
0
0
0
0
-1
-2
0
-2
0
) , donng(A) 3.
a. Dans l'exemple 16.32, combien d'opérations Les matrices suivantes forment-elles une base
élémentaires a-t-on utilisées pour passer de A à de Al2(IK)?
A?
b. Les vecteurs (0,0, 1) et (1,2,0) forment-ils
une base de l'espace engendré par les lignes de
A?
IIl.2. Application à la résolution des systèmes linéaires
Forts de notre algorithme, nous revenons sur l'étude des systèmes linéaires. Nous allons voir
dans cette partie comment l'algorithme du pivot donne une méthode systématique et efficace
pour les résoudre.
Commençons par reformuler le problème dans le langage des matrices. Le système linéaire
peut s'écrire de manière plus concise sous la forme Ax = y, où A = (Ufkl est de format m x n
et x E :ocn et y E :ocm sont notés en colonnes. Le système homogène associé est le système
Ax=O.
ouhienS=0, ou bûinS,;,x+So~
qù 'i E S est une solutiq_n arbitraire Ji,xéè et S-OC désigne l'ensemble des solutions du système
homogène associé, c'est-à~dire du système Ax =Q. .Autmment dit
solution générale =·solt.ttiou. pa,rtic'Ulière + :11olution générale dit systèmt hômogên~.
Notation. La dénomination de solution particulière pour x ne signifie pas que cette solution a
des propriétés particulières, mais seulement qu'il s'agit d'une solution que l'on a su déterminer
parmi d'autres et que l'on fixe une fois pour toute.
D'après la règle 17.8, nous savons que S 0 est un sous-espace vectoriel de :ocn. La notation
suggestive x+ S 0 désigne l'ensemble des n-uplets de la forme x+ z, où z parcourt S 0 . Ainsi, S
est en quelque sorte un « sous-espace vectoriel translaté» ; on l'appelle un sous-espace affine3
de :ocn.
3
Le mot« affine» renvoie à l'idée que x+So ressemble au sous-espace vectoriel So. Nous étudierons les aspects
géométriques de cette notion dans le cours de deuxième année.
427
Le système (16.11) est entièrement donné par la matrice (A,y) E Atm,n+1(IK), nous identi-
fions donc les deux points de vue. Ainsi les opérations élémentaires sur les lignes de (A, y)
correspondent aux opérations suivantes :
- permuter deux équations ;
- multiplier une équation par un nombre non nul ;
- ajouter à une équation le multiple d'une autre.
Comme toute solution du système initial est encore solution du système transformé, l'en-
semble-des solutions ne peut qu'augmenter après chaque opération élémentaire. Or, ces opéra-
tions sont réversibles : après chaque transformation, il est possible de revenir au système initial
par une opération du même type. Il en résulte que l'ensemble des solutions reste invariant.
Règle 16.35. Si on transforme (A,y) en (A,y) par des opérations élémentaires sur les
lignes, alors ces deux systèmes sont équivalents : ils possèdent le mime ensemble de solutions.
*
3) On isole les inconnues qui correspondent aux colonnes avec pivots, puis on les exprime
successivement, du bas vers le haut, en fonction des autres inconnues.
-3 9-2 3 5 4)
1 -3 1 -1 -2 0
(A,y) = 8-24 4-12-4-8
(
-1 3 0 -2 7 10
428
1 -3 1 -1 -2 0)
- _ 0 0 1 0-1 4
(A, 1J) = 0 0 0 1 -2 -2
(
0 0 0 0 0 0
On isole successivement les inconnues des colonnes pivots, à savoir x4 , x 3 , x 1 , puis on les
exprime en fonction de x2 et Xs :
Ce système a pour solution x 1 ::::; 0, 5025 et x 2 ::::; 0, 4975, ce qui dans notre machine serait
arrondi à X1 ::::; x 2 ::::; 5, 0 x 10- 1 .
o Par la méthode de Gauss, avec le pivot 0, 005, le système est équivalent à
0,005 1 )(Xi)-(0,5)
( 0 -199 X2 - -99 .
Or, notre machine ne reconnaît pas le nombre à trois chiffres 199, qu'elle arrondit donc à
2, 0 x 10 2. Ainsi, pour elle, le système s'écrit
◊ Voyons si le choix d'un autre pivot produit un résultat plus précis. Choisissons dans le
système initial le pivot 1 en bas à gauche. Nous obtenons
Retenons de cet exemple qu'entre deux pivots possibles, il vaut mieux écarter le plus petit,
en général.
Remarquons d'abord qu'un système linéaire ne possède pas toujours une solution. En effet, le
système en escalier (A, y) peut présenter des lignes impossibles.
EXEMPLE 16.38. Considérons le système (16.12) mais avec pour second membre
1 -3 1 -1 -21 0 )
(4,0,-8,0) au lieu de (4,0,-8, 10).Alors nous obtenons (A,y) = (
g g 6 ~ =1 J. .
0 0 0 0 0 -10
La dernière ligne du système signifie que O = -10, ce qui rend le système impossible.
3) =} 1). Supposons par l'absurde qu'il existe e > r tel que Yi =J O. Alors ij n'est pas com-
binaison linéaire des colonnes de A car ses colonnes ont toutes des coefficients nuls à partir
du (r + 1 )-ième coefficient. Ainsi rg (A, ij) > rg A. Or rg A= rg A et rg (A, ij) = rg (A, y),
d'où on est en contradiction avec l'hypothèse rg (A, y)= rg A. ■
PREUVE. S'il existe une solution x, alors l'ensemble des solutions est de la forme S = x+ So,
où S0 est le sous-espace vectoriel de ocn formé par les solutions du système homogène associé
et qui a une base b1, ... , bp. Il nous reste à voir que p = n -T. Lorsque l'on résout le système
homogène en escalier Ax = 0, on exprime les inconnues correspondantes aux colonnes pivot en
fonction des inconnues restantes, soit encore T inconnues en fonction de n-r autres inconnues,
ce qui prouve que la dimension de So est bien n - T. ■
EXEMPLE 16.41. Dans l'exemple 16.36 nous avons écrit la solution générale en fonction
1
PREUVE.
1) Si rg (A) =net s'il existe une solution, alors d'après la proposition 16.40, elle ne dépend
d'aucun paramètre, donc elle est unique.
2) Si rg (A) = m, alors A ne peut contenir de ligne nulle et donc une solution existe d'après
la proposition 16.39.
3) C'est une conséquence de points 1) et 2) mais on peut le montrer aussi directement :
rg (A) = m = n implique que A est une matrice carrée inversible, donc l'unique solution du
système Ax = y est le vecteur x = A- 1-y. ■
Remarque. La démonstration du point 3) suggère une méthode pour inverser une matrice.
Si A est une matrice carrée de taille n, alors A est inversible si et seulement si le système
431
Ax = y admet une unique solution pour tout y E ocn. En écrivant y = (Y1, ... , Yn) en colonne
sous la forme d'un n-uplet quelconque et en résolvant le système Ax = y par la méthode du
pivot, nous pouvons exprimer x en fonction de y sous la forme x = By, où Best précisément la
matrice inverse de A. Nous reviendrons sur cette technique d'inversion à la fin de ce chapitre.
x 1 +2x 2 =y 1
{ 2x1+Sx2=Y2,
soit encore
x1+2x2=Y1 . {x1=Y1-2x2=Y1-2(yz-2 yi)=5y1-2Y2
{ pms
X2=Y2-2Y1, X2=Y2-2Y1-
b. S'il n'existe pas de solution, alors il y a plus a. Pour décrire une droite dans JR 5 , trois équa-
d'équations que d'inconnues. tions suffisent.
c. Il existe une solution si et seulement s'il y a b. On peut décrire un plan dans JR4 par deux
autant d'équations que d'inconnues. équations.
XE JK:m.
Trouver un système à partir des solutions. Dans le chapitre 15 (voir règle 15.8) nous
avons démontré que l'espace de solutions d'un système homogène est un sous-espace vectoriel
de ocn_ Mais la réciproque est vraie aussi :
Proposition 16.44. Tout SOUlf•espace vectoriel de JKll est l'espace de solutions d'un système
linéaire homogène à n inconnues.
432
PREUVE. Soit F un sous-espace vectoriel de ocn. On sait que F est engendré par un nombre
fini de vecteurs v 1 , ... , Vp de ocn. On note A la matrice p x n dont les lignes sont précisément
les vecteurs Ve. On poser= rg A= dim F. L'espace des solutions du système linéaire Ax = 0,
pour x E ocn, est un sous-espace vectoriel de ocn. Il est de dimension m = n - r et possède
donc une base formée de vecteurs l'on note
j = 1, ... ,m.
Soit F' l'espace des solutions du système tBx = 0, pour x E ocn. Chaque vecteur colonne de
tA est dans F'. Or les colonnes de tA engendrent F. On en déduit que F CF'. On conclut en
notant que dim F' = n - rg B = n - m = r = dim F. ■
EXEMPLE 16.45.
Soit F le sous-espace vectoriel de 11(5 engendré par les vecteurs v 1 = [-3, 9, -2, 3, 5, 4),
v2 = (1,-3, 1,-1,-2,0), v 3 = (8,-24,4,-12,-4,-8) et v 4 = (-1,3,0,-2,7, 10). Nous
allons déterminer un système linéaire dont Fest l'espace de solutions. On pose
forment une base de l'espace de solutions de système Ax = O. Ainsi Fest l'espace de solutions
du système tBx = 0, x E 11(5 , c'est-à-dire
Dans cet exemple la famille (v 1 , ••• , v 4 ) dans 11(5 est de rang 3. Il est donc pas étonnant
que deux équations soient nécessaires pour décrire le sous-espace vectoriel qu'elles engendrent.
Bien sûr on pourrait aussi prendre 3 équations ou plus, mais évidemment on cherche plutôt
un système sans équations superflues.
433
La première question est celle que nous avons traitée. Elle aboutit à un système homogène,
tandis que la deuxième aboutit en général à un système inhomogène.
Par exemple dans JR. 3 muni de sa base naturelle e 1, e 2, e 3, un système linéaire dont l'espace
des solutions est le sous-espace vectoriel engendré par e,, e2 est
X3 =0.
En revanche un système linéaire dont l'espace des solutions contient e,, e2 est
x, +x2 = 1,
{ X3 =0.
Trouver des relations de dépendance linéaire des lignes par une colonne témoin.
Soit B = (bfkl E AmnOK). Nous cherchons des relations de dépendance entre les lignes
l 1 , .•• , lm les lignes de B. Pour cela nous constatons que les lignes de B sont les colonnes
C,, ... , Cm de tB. Or écrire À1C1 + · · · + ÀmCm = 0 revient à écrire que tB (:~) = 0.
Règle 16.46, .Chercher une relation de dépendance linéaire entre lès lignes de B revient à
che1'Cher une solution non nulle du système transposé tBx = O.
Ainsi le problème de trouver des relations de dépendance linéaire entre les lignes se résout
par la méthode du pivot en passant au système transposé tBx = O. Nous allons donner une
seconde méthode de résolution du problème des relations de dépendance en appliquant la
méthode du pivot au système non transposé Bx = O.
Pour cela nous rajoutons une « colonne témoin» T, constituée de variables indéterminées
T1, ... , În, analogues à l'indéterminée X des polynômes (voir le chapitre 13),
Les variables T1 , ••• , În sont des notations commodes pour représenter n'importe quel vecteur,
noté en ligne, d'un espace ][(P, où p est un entier arbitraire, le même pour toutes les variables,
et qu'il n'est pas nécessaire de connaître explicitement dans les calculs qui vont suivre.
En appliquant la méthode du pivot à la matrice (B, T), nous obtenons une matrice de la
forme
escalier
0
434
où r = rg B et où (i\fkl E .4lm(]K). La colonne des blocs de droite garde la trace des opérations
élémentaires effectuées sur les lignes de B .
.Proposition 16.47.
1) Les vecteurs (Àtt, ••. , i\em), r < t ~ · m, forme nt· une base. de Fespace de .solution du
système transposé tB,c =.O, x E.Km,
2) · Toute relation de dépendance liriéaire entre les lignes l h .• , , lm de B est une aombinaisort
linéaire des relations· i\n l1 + ·· · + Àtmlm =.0, pour r < t ( m.
PREUVE.
1) L'idée de la preuve est d'utiliser les «témoins» Îf comme des «jokers», que l'on peut
remplacer par des vecteurs bien choisis.
► Substituons à Îf la ligne lf de B, f = 1, ... , m. Alors la colonne témoin du départ n'est
autre que la matrice B. Nous obtenons donc les relations
tB ( i\; ) = O,
Àfm
ce qui montre que les m - r vecteurs (i\fl, ... , Àfml, r < f ( m, sont solutions du système
transposé. Il suffit maintenant de voir pourquoi ces m - r vecteurs sont linéairement indépen-
dants. En effet, nous pourrons alors conclure par un argument de dimension, puisque l'espace
des solutions du système transposé est de dimension m - rg (tB) = m - r.
► Substituons à Îf le vecteur ef, écrit en ligne, de la base naturelle de ocm. Alors la colonne
témoin du départ n'est rien d'autre que la matrice identité Ilm et par des opérations élémen-
taires celle-ci est transformée en la matrice (i\fkl qui est encore de rang m. En particulier ses
dernières m - r lignes (i\fl, ... , Àfml. pour r < f ::,;; m, sont linéairement indépendantes.
2) C'est une conséquence immédiate de 1) et de la règle 16.46. ■
En résumé: si on applique l'algorithme de Gauss avec une matrice munie d'une ligne témoin
on trouve une base de l'espace de solutions du système homogène transposée ou encore une
« base » de toutes les relations de dépendance linéaire entre les lignes de la matrice.
EXEMPLE 16.48. Nous cherchons toutes les relations de dépendance linéaire entre les cinq
vecteurs (-3, 1,8,-1), (9,-3,-24,3), (-2, 1,4,0), (3,-1,-12,-2), et (5,-2,-4,7). Pour
cela nous les écrivons en lignes dans une matrice B que nous complétons par une colonne
témoin,
-3 1 8 -1 T1 ) -3 1 8 -1 T1 )
0 0 0 0 T2+3T1 0 -1 28 16 3Ts+5T1
0 1 -4 2 3T3-2T1 0 1 -4 2 3T3-2T1
( 0 0 -4 -3 T4+T1 ( 0 0 -4 -3 T4+T1
0 -1 28 16 3Ts+ST1 0 0 0 0 T2+3T1
435
8 -1 Ti ) ( -03 -11 28 1
8 16 Ti )
0 -11 28
-3 16 3Ts+ST1 3Ts+ST1
0 0 24 18 (3T3-2Ti)+(3Ts+5Ti) O O 8 6 T1+T3+Ts
( 0 0 -4 -3 T4+T1 0 0 0 0 3T1+T3+2T4+Ts
0 0 0 0 T2 +3T1 0 0 0 0 3T1 + T2
Les lignes l 1 , ••. , l 5 de B (c'est-à-dire les colonnes de A = tB) vérifient les relations de
dépendance linéaire 3l 1 + l2 = 0 et 3l1 + l3 + 2l4 + ls = 0, et toute autre relation de
dépendance linéaire entre l 1, ... , l 5 est une combinaison linéaire de ces deux équations. Les
vecteurs (3, 1, 0, 0, 0} et (3, 0, 1, 2, 1} constituent une base de l'espace de solution du système
transposé tBx = O.
Prenons les différences entre X11 + X12 + X13 et les cinq autres sommes. Ainsi le carré est
magique si et seulement si ses coefficients vérifient le système linéaire homogène suivant :
C'est un système à neuf inconnues X11, X12, X13, X21, X22, X23, X31, X32, X33 et cinq équations. Il
est donc de la forme Ax = 0 où la matrice A est de format 5 x 9. On transforme A en
escalier (ce n'est pas la peine de considérer la matrice (A, y), car ici y = 0). Nous obtenons
successivement les matrices suivantes :
11 -1 -1 -1 0 0 0
~JI
11 0 0 0 -1 -1 -1
A= 01 -1 0 0 -1 0 0
10 0 -1 0 0 -1 0
11 0 0 0 -1 0 0 -1
1 1 -1 -1 -1 0 0 0
0 0 0 1 1 1 -1 -1 -1
0 1 1 -1 0 0 -1 0 0
0 -1 0 1 0 1 0 -1 0
0 0 -1 1 0 0 0 -1
:11
1 1 1 -1 -1 -1 0 0 0
0 1 1 -1 0 0 -1 0 0
00 0 1 1 1 -1 -1 -1
00 1 0 0 1 -1 -1 0
00 -1 0 0 0 -1 :11
111 -1 -1 -1 0 0 0
011 -1 0 0 -1 0 0
001 0 0 1 -1 -1 0
000 1 1 1 -1 -1 -1
000 1 -1 -1 -1 J~l
111 -1 -1 -1 0 0 0
011 -1 0 0 -1 0 0
A= 001 0 0 1 -1 -1 0
000 1 -1 -1 -1
000 0 0 0 0 0 0
437
Cette dernière matrice est de rang 4, donc dimX = 9 - 4 = 5. Pour trouver une base, on
résout le système en escalier du bas vers le haut.
X21 = -X22 - X23 + X31 + X32 + X33
X13 = -X23 + X31 + X32
X12 = -X13 + X21 + X31 = -X22 + X31 + X33
XJ 1 = -X12 - X13 + X21 + X22 + X23 = X22 - X3J + X23
Reformulons ce résultat avec les notation des carrés magiques. Nous obtenons
X11 X12 X13 X22 -x220 X23 0-X23 -X31 X31 X31
X21 X22 X23 -X22 X22 0 + -x 23 0 X23 + X31 0 0
X31 X3z X33 0 0 0 0 0 0 X31 0 0
0 0 X3z 0 X33 0
+ X32 0 0 + X33 0 0
0 X32 0 0 0 X33
1 -1 0 1 0 -1 -1 1 1 001 0 10
avec B1 = >---+---+-<
-1 1 0 , B2 = -10 1 1 0 0 , B4 = 10 0 , Bs = 10 0
0 00 00 0 100 010 001
pour base de X.
Nous avons vu que pour tout entier n E N*, l'ensemble An(]K) des matrices carrées est
muni naturellement d'une structure d'anneau et même d'algèbre (qui n'est rien d'autre qu'un
anneau compatible avec la structure d'espace vectoriel sur JK). Cette algèbre est d'autant
plus extraordinaire qu'elle est non commutative et qu'elle permet de construire beaucoup
d'autres exemples d'algèbres non commutatives intéressantes en considérant certaines parties
(sous-algèbres) de An(lK).
D'autre part, nous avons également vu que An(lK) contient un groupe remarquable, le
groupe linéaire Gl(n, JK), lui aussi non commutatif. Ici encore, ce groupe permet de construire
explicitement beaucoup d'autres groupes intéressants, en considérant certaines parties (sous-
groupes) du groupe linéaire. Il s'agit d'ailleurs d'une question mathématique à part entière,
et encore actuelle, que d'étudier de quelles facons un groupe donné peut se voir comme un
sous-groupe de Gl(n, JK) : c'est le point de départ de la théorie des représentations.
Dans cette partie, nous allons introduire quelques classes de matrices que l'on rencontre
très souvent dans ces contextes, bien qu'il ne soit pas toujours possible à ce stade d'expliquer
l'intérêt de ces exemples. Nous nous bornerons essentiellement à présenter les objets et le
vocabulaire qui leur est associé. Il faut donc prendre les considérations qui suivent comme une
première sensibilisation à un monde mathématique dont nous levons à peine le voile.
Ce sera aussi pour nous l'occasion de présenter deux méthodes efficaces pour inverser les
matrices de Gl(n, JK).
438
123) . (0 -2 -3)
(2 4 5
356
, 2 0 -5
350
.
Matrices triangulaires.
Les matrices triangulaires supérieures (respectivement inférieures) constituent une sous-algèbre
de An(OC). Cela résulte du fait que ces deux classes de matrices forment deux sous-espaces
vectoriels stables pour le produit matriciel. L'intérêt principal des matrices triangulaires est
qu'elles se comportent bien au regard de la question de l'inversibilité : il est facile de voir si
une matrice triangulaire est inversible, et le cas échéant de l'inverser.
Définition 16.51. Soit A= (afkl une matrice carrée d'ordre n.
1) La diagonale de A est le n-uplet (a 11, ... , Unnl.
2) A est une matrice diagonale si tous ses coefficients en dehors de la diagonale sont nuls.
3) A est triangulaire supérieure si tous ses coefficients en-dessous de la diagonale sont nuls,
c'est-à-dire si Ufk = 0 dès que f > k.
4) De manière analogue, A est triangulaire inférieure si Ufk = 0 dès que f < k, soit encore
si la transposée t A est triangulaire supérieure.
Prop0$ition ·;1$,IS:2. ·• .. . . . .· . .
Soient rt. E .N* êtA.e ....Hn,(~}et,soit e1,.,. , en la btJ,s.e canpni,que de ~- La màtrîce A est
f:ri.angumire s~tfaffl si et seulement si l 'app1icâtion linéaitré Â : .K~ 4 gn estttlle que
A(vect(e,, ••• ,et.Hè vect(e1,•... ,~) pour k = J ,•; •. , n.·
PREUVE.
► Soit A triangulaire supérieure et soit k un entier tel que 1 ,( k ,( n. Alors
n k
Â(ek) = L Ufk ef = L Ufk ef E vect(e1, ... , ek), car Ufk = 0 pour f > k.
f=l f=l
Supposons de plus, dans le cas où k 2: 2, que Â( vect ( e,, ... , ek-l)) C vect ( e1, ... , ek-l) (si
k = 1, on ne suppose rien). Comme tout vecteur de vect ( e,, ... , ek) peut s'écrire comme
439
combinaison linéaire d'un vecteur de vect (e1, ... , ek-l) et de ek, il résulte de la linéarité de
 (voir la règle 16.5, page 408) que toute combinaison linéaire de e 1, ... , ek est transfor-
mée par  en une combinaison linéaire d'un vecteur de vect(e1, ... ,ek-il et d'un vecteur
de vect (e 1, ... , ek), soit encore en un vecteur de vect (e1, ... , ek) car vect (e1, ... , ek-1) C
vect (e 1, ... , ekl- Nous avons donc démontré les n conditions souhaitées par récurrence sur k.
► Inversement, supposons que les n conditions de l'énoncé soient satisfaites. Alors pour 1 ~
k ~ n, comme ek E vect ( e 1, ... , ek), nous en déduisons que
n
Â(ek) = L aek ee
e=l
peut s'écrire comme une combinaison des vecteurs e1, ... , ek, soit encore que Uek = 0 pour
tout e > k puisque la décomposition de Â( ek) dans la base e1, ... , en est unique. ■
Rêgle 16.53. Le produit de d,eux matrices triangulaires supériev:res de .lnfK) est une
matrice triangulaire su:péri,eure.
Règle 16.54. Une matrice triangulaire de .lnfK} est de rrsng n si et seulement si tous ses
éléme.nts diago?iaux sont nim,.nt,J,s. ·
PREUVE. Considérons une matrice triangulaire supérieure (pour une matrice triangulaire
inférieure on passera à la transposée).
(===}) Supposons que rg A = n. Supposons par l'absurde qu'il existe p E {1, ... , n} tel que
uPP = O. Alors les n - p + 1 lignes lp, ... , ln sont liées car elles sont engendrées par les
n-p vecteurs ep+l, ... , en tirés de la base canonique de !Kn, ce qui contradit l'hypothèse que
A est de rang n.
({==) Si les éléments sur la diagonale sont tous non nuls, alors la matrice triangulaire est en
escalier. Elle a donc n pivots et elle est bien de rang n. ■
PREUVE. Soit A une matrice triangulaire. Quitte à considérer t A, nous pouvons supposer
que A est triangulaire supérieure. Notons A = ( urkl avec urk = 0 pour f > k et Ukk =/- 0 pour
k = 1, ... , n. Pour inverser la matrice A, nous allons résoudre l'équation Ax = 11 pour tout
n-uplet 11 = t(111, ... , 1lnl E !Kn. Il s'agit donc de résoudre le système suivant :
Ce système se résout sans difficulté en partant du bas. Nous obtenons que pour tout entier k
tel que 1 ~ k ~ n, il existe des coefficients bkk, ... , bnk, fonctions des aii, tels que
n
Xk = L, bkm11m·
m=k
-- Uk,k
1
bk,k+l = ---ak,k+l bk+1,k+1,,
Uk,k
1
bk,k+2 = ---(ak,k+l bk+l,k+2 + ak,k+2bk+2,k+2l,
Uk~ ·
1
= ---(akk+lb k+l n + Ukk+2bk+2n + · · · + Uknbnnl-
ak,k , , ' ' '
Ainsi, par récurrence descendante sur k, nous obtenons des coefficients bkp pour tous les
couples d'entiers (k, p) tels que 1 ~ k ~ p ~ n. En posant bkp = 0 pour k > p, nous
définissons une matrice B = (bkp) triangulaire supérieure telle que
Ax = 11 si et seulement si x = B11
pour tous x, 11 dans ocn, ce qui montre que B = A- 1 et donc que l'inverse de A est bien
triangulaire supérieure. ■
Au passage, notons que la démonstratio n ci-dessus donne aussi une méthode rapide pour
inverser une matrice triangulaire : il suffit d'écrire le problème sous la forme d'un système et
de le résoudre en partant du bas.
Ainsi,
441
Matrices nilpotentes.
Définition 16.57. Une matrice A E .4tn(]K) est nilpotente s'il existe un entier p ? 1 tel
que AP = O. Le plus petit entier p qui vérifie cette propriété est appelé l'ordre de nilpotence
de A.
L'exemple typique d'une matrice nilpotente est une matrice triangulaire de diagonale nulle,
par exemple de la forme
Le lecteur vérifiera que An = O. En fait, toute matrice nilpotente de .4lnCIK.) vérifie que An = 0,
mais ce n'est pas une propriété évidente. Nous la démontrerons dans le cours de deuxième
année.
Par la méthode du pivot, nous pouvons transformer toute matrice inversible en la matrice
identité. Cette idée est le point de départ pour deux procédés : trouver une famille de
générateurs du groupe linéaire et obtenir un algorithme pour inverser une matrice.
L.:. IV .2 .1. Les matrices élémentaire s engendrent Gl( n, JK)
Définition 16.58.
Les matrices élémentaires n x n définies pour (C, k) E {1, ... , n}2, C -/- k, À E JK*, µ E lK
sont les matrices suivantes :
1) Uek se déduit de la matrice identité en permutant la Cième et la kième ligne ;
2) Ue[;.\] se déduit de la matrice identité en substituant au fième chiffre 1 de la diagonale le
nombre À;
3) Uedµ] se déduit de la matrice identité en substituant au coefficient nul d'indice (C, k) le
nombreµ.
Les schémas suivants représentent les matrices élémentaires. Les pointillés sur la diagonale
sont des 1. Comme d'habitude, il n'y a que des zéros dans les espaces vides.
k e e
l 1 l
k-, 0
Uek= Ue[À] =
e-, 0 e-, À
k
1
e-, µ
Soit U une matrice élémentaire de Gl(n, JK). Considérons les multiplicatio ns à gauche et
à droite par U.
.4tnm(lK) --t .4tnm(lK), A H UA,
.4tmn(lK) --t .4tmn(lK), AH AU.
Il existe un « dictionnaire » entre ces applications et leurs effets sur la matrice A. Plus
précisément, multiplier à gauche A par une matrice élémentaire se traduit par une opération
élémentaire sur les lignes de A; multiplier à droite par une matrice élémentaire se traduit par
une opération élémentaire sur les colonnes de A. Nous pouvons résumer ces correspondan ces
par le tableau suivant :
443
Par exemple, multiplier par U 3 ,1 [2] à droite (resp. à gauche) a l'effet suivant :
7 221)
= 6240 .
( 2211
Par conséquent, les matrices élémentaires sont inversibles, c'est-à-dire dans Gl(n,JK), et leurs
inverses sont encore des matrices élémentaires.
Proposition 16.59. Les matri~s élémentaires engendrent le groupe Gl(n, JK). Autrement
dit, toute matrice A E Gl(n,JK) peut s'écrire sous la forme d'un produit d'un nombre fini
de matrices élémentaires.
PREUVE. Soit A E_Gl(n, JK). Par la méthode du pivot, nous pouvons tran~former A en une
matrice en escalier A. Comme A est de rang n, la règle 16.54 montre que A est triangulaire
supérieure inversible avec des 1 pour pivots sur la diagonale, c'est-à-dire qu'elle est de la forme
** *
1 * *
A=
*
Toujours par des opérations élémentaires sur les lignes, nous « nettoyons » A au dessus des
pivots, en commençant avec la dernière ligne, pour obtenir finalement la matrice identité.
Nous avons donc transformé, par un nombre fini d'opération élémentaires sur les lignes, la
matrice A en la matrice lin. Soient U 1, ... , Um les matrices élémentaires correspondant à ces
opérations (dans l'ordre où elles sont effectuées). Alors
(16.14)
La preuve de la proposition 16.59 nous donne une méthode élégante pour calculer l'inverse
d'une matrice par la méthode du pivot de Gauss. En effet, la relation donnée par (16.14)
s'écrit encore
A- 1 =lim···U1lln,
..... Donc les opérations élémentaires sur les lignes qui transforment A en lln transforment pareille-
.....
.....
V
ment, si elles sont effectuées dans le même ordre, la matrice lln en A- 1 .
PREUVE. Il nous reste à montrer la seconde partie de la règle. Le procédé s'arrête en cours
de processus exactement lorsque la matrice transformée contient une colonne sans pivot. Il
est alors clair que cette colonne peut s'exprimer comme combinaison linéaire des colonnes
précédentes, ce qui montre que la matrice n'est pas inversible. ■
Donc
11/20)-l l ( 1 1-2)
2 0 1 =
( -4 1 2 5 -28 -23 11 .
► La matrice (~ ~) n'est pas dans Gl{2, Z) car son inverse (~ 1~2) n'est pas à coefficients
entiers.
Le groupe des matrices de permutation.indexM atrices !de permutation
Proposition-définit ion 16.64. (Matrices de permutation).
1) Pour toute perrnutation o- E 6n, la matrice
Pa= (6t,a{k)h~.~h.
est dans Gl( n, Z) .. Une matrice de cette forme est appelée matrice de permutation.
2) L'application
P : 6n -¼ GL(n,Z), o- H Pa,
un
est un m01j>his1M injectif de groupes. Son i'mage est sii'tl,S-fll'O't,jpe de Gl.{ n; Z}, iso:rr/bl'phë
au groupe symétriqtJ,e Sn. On l'appelle le groupe de matrices de permutation.
~) Multiplier une matrice A E .A'nm(lK) à gauche par Pa se traduit par une permutation des
lignes L1, ••• , ln de l\ .selon la/ormy.le ·
Remarque. Il est facile de vérifier qu'une matrice carrée est une matrice de permutation si
et seulement si chaque colonne et chaque ligne contiennent exactement un seul coefficient non
nul, égal à 1. Un calcul immédiat montre alors que Pcr tp cr = lin.
PREUVE. Cela résulte des relations P cr tp cr = lin et P cr Pcr' = Pcrcr' pour toutes permutations
cr, cr' dans 6n. ■
Pl"oposition J;tUi6. Le grouw de$ m,tJtrices de perm'/Jitation èst-eo!J(mdfré. tmr Ici, matrices
élémentaires Ukt.
1) Remarquons que les générateurs proposés sont bien triangulaires supérieurs de rang n, ils
sont donc dans T+. De plus, nous savons grâce à la régle 16.53 que le produit de deux matrices
de T+ est encore dans T+. Soit A E T+. Alors par des opérations élémentaires sur les lignes,
nettoyons, en partant du bas, tout ce qui se trouve au-dessus de la diagonale.
U1 * ·. · ~)
Uz ·
A= devient A'=
( *
Un
Nous avons utilisé exclusivement des opérations élémentaires de la forme le H le+ µlk, avec
e< k. Il existe donc une matrice M produit d'un nombre fini de matrices de la forme Uek[µl,
avec e< k, telle que MA= A'.
Transformons maintenant A' en la matrice lin par des opérations élémentaires de la forme
le H Àle. Donc il existe une matrice M' produit de matrices de la forme Ue(;\] telle que
M'A' = lin- Ainsi M'MA = lin. Nous en tirons deux conséquences :
Remarque. Il existe des énoncés analogues pour T_ et N_. Pour les démontrer, il suffit de
se ramener par transposition au cas des matrices triangulaires supérieures.
Test 16.39.
Déterminer l'inverse de
IV.2.4. La décomposition LR
Dans cette partie, nous allons montrer que toute matrice inversible se décompose en un produit
de trois matrices, éléments des trois sous-groupes remarquables de GL(n,JK:) introduits plus
hauts. L'intérêt de cette décomposition vient de ce que les trois matrices obtenues sont plus
faciles à inverser en général que la matrice d'origine.
Nous notons WC GL(n,JK:) le sous-groupe des matrices de permutation. Rappelons que
N- (respectivement T+) est le groupe des matrices L (respectivement R) de la forme
Rappelons que chacun de ces éléments est très facile à inverser. La dénomination L (respec-
tivement R) vient de left ou links (respectivement right ou rechts) et se réfère à la position
relative des coefficients non nuls par rapport à la diagonale.
qui est une notation sibylline pour rappeler que l'application W x T- x T+ ---+ GL(n, JK:) :
(P, L, R) H PLR est surjective.
Attention : la notation W T- T+ est trompeuse. Elle ne signifie pas que cette application
est un morphisme de groupes, et encore moins que GL(n,JK:) est isomorphe au produit des
groupes W x T- x T+.
PREUVE. Soit A E GL(n,JK:). Par l'algorithme de Gauss, sans normalisation des pivots,
transformons la matrice A en une matrice R triangulaire supérieure inversible. L'algorithme
comprend n - 1 étapes, chacune consistant à installer un pivot et à nettoyer en dessous dans
la colonne du pivot. Par conséquent,
Mn-lMn-2 · · · M1 A= R,
4
Évidemment « décomposition PLR » serait une appellation plus appropriée.
449
où la matrice Me se traduit par une série d'opérations élémentaires sur les lignes correspondant
à la fième étape. Précisons la forme de la matrice Me : elle correspond à l'installation d'un
pivot à l'emplacement d'indice (e, f), puis d'un « nettoyage» en-dessous du pivot. Donc
1
S'il n'est pas nécessaire de permuter deux lignes pour installer le pivot, nous prendrons k = €,
~ü
car Uee = ITn. Si le nettoyage est superflu, nous prendrons ~ = 0 car Uu[O) = ][n· Dans cette (C
......
fième étape, le nettoyage complet en-dessous du pivot est donc réalisé en multipliant par la ..d
ü
matrice
e
l
(16.17)
e.
Soient pet q deux entiers tels que n ~ p > q > Échangeons les colonnes pet q de Ne, puis
les lignes p et q, alors les 1 de la diagonale reviennent sur la diagonale et le seul effet obtenu
sur Ne est de permuter les coefficients ~ et µq. Ainsi la matrice Nf = UpqNeUpq est encore
de la forme (16.17). Nous venons de montrer le résultat suivant.
Lemme 16.69. Soient p et q deux entiers tels que n ~ p > q > t. Alors lèS matrices
élémen~aires Up4 ,commutent presq1te avec. l.es ~trit;es Nt de la /01'f11,e do?'Jmé:e pg,r.JUi.17)
dans le sens sui.voot:' : pour tmite matri,ce Ni, il ex#,te une matrice Nt de. la matiu: fo~
telle que Upq Ne= Nf Upq.
Mn-lMn-2 · · · M1 = NQ
où N est un produit de matrices de la forme (16.17), avec € = 1, ... , n - 1, et où Q est un
produit de matrices élémentaires du type Uu. Donc N est dans le groupe r- des matrices
5
Cette propriété rappelle la définition de sous-groupe distingué. Mais ici les matrices du type Ne ne constituent
pas de sous-groupe de Gl( n, OC).
450
triangulaires inférieures avec uniquement des sur la diagonale et Q est une matrice de
permutation. Or
R= Mn-1Mn-2 · · · M1 A= NQA =} A= Q- 1 N- 1 R.
i::: On conclut en posant P = Q- 1 et l = N- 1 .
,.c
•V
■
~
EXEMPLE 16.70. Déterminons la décomposition lR de la matrice ( ~ âl E Gl(n,JK}.
D'après la règle 16.27, nous savons que ad - be -1- O. Ainsi a -1- 0 ou b -1- O.
► Considérons d'abord le cas a -1- O. Alors nous nettoyons avec le pivot a et il est superflu
n(: !) ud:bc)
de permuter les lignes.
(~~ = (~
Gn(~ ud:bc) .
D'où la décomposition
(; : ) = (16.18)
► Considérons maintenant le cas c -1- O. Alors nous permutons les deux lignes, puis nous
nettoyons avec le pivot c.
D'où la décomposition
(16.19)
Si l'algorithme de Gauss ne fait pas appel à une permutation de lignes, il existe une
décomposition lR où la matrice de permutation est l'identité, comme dans (16.18). Voici un
critère plus maniable pour prouver l'existence d'une telle décomposition.
Réciproquement, nous raisonnons par récurrence sur n pour montrer l'implication b) =} a).
Le cas n = 1 est immédiat. Soit n ~ 2 et supposons l'implication a)=} b) démontrée pour les
matrices dans Gl(n-1, K). Soit A E Gl(n, K) telle que tous les blocs Ap, pour p = 1, ... , n,
sont de rang p. Posons A' = An-l· Par hypothèse, nous savons que l'A' = R' avec des
matrices l', R' de format (n - 1) x (n - 1) et de la forme
r, * .. . * *
* Tz
*
* ... * 1 Tn-1 *
Unl • • • • • • Un,n-1 Unn * * *
Écrivons cette égalité sous la forme MA = S. Les éléments diagonaux de R' étant non nuls,
nous pouvons, par des opérations élémentaires sur les lignes sans permutations, transformer
Sen une matrice RE T+. Il existe donc M' ET- telle que M'S = R. Ainsi M'MA = R, soit
encore A= lR, où nous avons posé l = (M'M)- 1 ET-, ce qui démontre la condition a) et
donc l'implication réciproque pour les matrices de taille n.
2) Supposons que A = l 1R, = l2R2 avec li E T- et Ri E T+. Alors l 21 l, = R2R11 est
dans T- n T+. Or il est clair que cette intersection ne contient que la matrice identité. Donc
l 21 l, = R2R11 = In ce qui implique que l, = l2 et R, = Rz. ■
Évidemment, ce critère est un résultat plutôt théorique car vérifier que tous les blocs Ap
sont de rang maximal prend plus de temps que d'appliquer l'algorithme de Gauss sur A.
V. EXERCICES
16.1. 16.2.
X+ 1J + 2z + t 1
X + 4-y + Sz + 2t -1
{ 2x - y + z + t 4
7x + 4-y + 11z + 6t 9
452
16.7.
16.3.
Soit A = (aekl E An(<Cl une matrice carrée
complexe.
Soit A = (aek) E Amn(lR) une matrice et
1. On suppose que A est « diagonal-
b = ( :~) un vecteur non-nul de JRm tel que dominante », i.e., pour tout (i, k) E {1, ... , n}2
avec i i= k on a
pour tout k = 1, ... , n
16.4.
*
3. On suppose que laekl < pour tout (i, k) E
{l, ... , n}2. Montrer que Iln + A est inversible.
PRÈS avoir traité en détail le cas de l'espace canonique, nous allons généraliser les
A notions que nous avons introduites dans les deux précédents chapitres. Mais pourquoi
ne pouvons-nous nous contenter de nos calculs explicites dans ocn?
Le développement de l'algèbre linéaire relève de ce que l'on appelle l'abstraction ma-
thématique : plutôt que de refaire les mêmes preuves dans chaque situation rencontrée, il
est intéressant de rassembler toutes ces situations et d'en abstraire une notion générale qui
pourra se spécialiser dans chaque cas. Le gain évident en est que les preuves sont faites une
fois pour toutes, l'autre intérêt étant que l'abstraction épure les preuves de leurs contingences,
et qu'ainsi il est plus facile de comprendre comment elles fonctionnent : la notion générale
peut alors devenir objet d'étude en soi et permet d'aller plus loin.
Mais il n'est pas simple d'abstraire une notion mathématique. C'est un acte de création
au même titre qu'un philosophe crée des concepts ou qu'un peintre peint un tableau. Ce n'est
pas arbitraire, cela répond à une problématique 1 .
Longtemps les mathématiciens ont calculé sans avoir besoin de formaliser la notion explicite
d'espaces vectoriels parce qu'ils manipulaient des objets particuliers, représentés dans des
systèmes de coordonnées. Mais certains espaces ne se présentent pas avec un système de
coordonnées privilégié. C'est le cas notamment des espaces de fonctions. Par exemple, si l'on
considère l'ensemble 'b"(IR) de fonctions continues de IR dans IR, la somme de deux fonctions
continues ou le produit d'une fonction continue par un nombre réel ont un sens, et pourtant,
il n'existe pas de système de coordonnées naturel sur 'b"(IR).
Le point de vue axiomatique opère un renversement dans la définition d'un espace vecto-
riel. Au lieu de le définir par l'existence d'un système de coordonnées, on modélise un espace
vectoriel par les règles que doivent suivre les calculs possibles en son sein. Il s'agit donc de
répondre à la question suivante : si on veut manipuler des objets quelconques qui peuvent
s'additionner et être multipliés par des scalaires, sans avoir recours à un système de coor-
données particulier, quelles sont les règles qu'il faut respecter au minimum pour que cela soit
raisonnable?
1
Dans ce sens, une abstraction mathématique est toujours littéralement concrète.
454
Les mathématiciens ont fait le pari que les huit axiomes de la définition d'espace vectoriel ci-
dessous répondent à la question. Ces axiomes ne tombent pas du ciel. Il faut bien comprendre
qu'ils n'expriment pas les conditions a priori de tout calcul possible, mais au contraire les
conditions a posteriori de tout calcul que l'histoire des mathématiques a retenues. Ces huit
règles doivent donc être comprises comme un cahier des charges minimal pour que les calculs
soient raisonnables. Ils sont bien évidemment calqués sur les huit règles (cf. 15.2) que nous
avions énoncées dans ocn.
Définition 17 .1. Un OC-espace vectoriel ou espace vectoriel sur OC est un ensemble E muni
de deux lois,
Remarque.
o Les quatre premiers axiomes ne concernent que la loi interne. Elles expriment que (E, +)
est un groupe abélien.
◊ Quand on munit un ensemble d'une structure comportant plusieurs lois, on impose des
conditions de compatibilité. C'est un fait très général. Les axiomes EV7 et EV8 expriment
la compatibilité de la loi · avec la loi +, l'axiome EV6 exprime la compatibilité entre la loi
· et la multiplication dans le corps 1K.
◊ Tout C-espace vectoriel est aussi un :IR-espace vectoriel. En effet, lR est un sous-corps de C ;
donc si les axiomes EVs à EVs sont vérifiés pour les scalaires complexes, ils le sont a fortiori
pour les scalaires réels.
◊ Si E est un OC-espace vectoriel et si F est un sous-espace vectoriel de E, alors F est un OC-espace
vectoriel. En effet, les deux lois sur E induisent deux lois sur F qui vérifent immédiatement
les huit axiomes par restriction, à ne pas confondre avec celle du point précédent où nous
avons restreint le corps des scalaires mais non l'ensemble des vecteurs.
455
Nous démontrons maintenant deux autres règles de calcul. Ces dernières pouvant se déduire
des huit règles de la définition, elles n'ont pas le statut d'axiome.
l_lègl~ l,7~3:~ .S~E itn ~~e$pjl~ vectt>rlel. §Qient v E .E etÀE,llC.• Alor$ on a>
1) À • v ::;: 0 · Ri.et .stulement ai À =Ût<· nu V= 01: ;
2)'(-1) ·V~ '-V.
PREUVE.
1) Rappelons que dans tout groupe (E, +), l'équation u + u = u a pour unique solution
u = 0E (voir le chapitre 9).
({=) Supposons que v = 0E et soit À E K Alors À· ÜE +À· ÛE = À· (0E +0E) =À· ÜE d'après
l'axiome EVs. Donc À· 0E = 0E.
Supposons maintenant que À= OK et soit v E E. Alors 0JK · v + ÛJK · v = (0JK + 0JK) · v = ÛJK · v
d'après l'axiome EV7 . Donc 0JK · v = 0E.
{==}) Inversement soit À E 1K et v E E tels que À· v = 0E. Supposons que À f. 0oc et
montrons que v = 0E. En utilisant EV5 , EV6 et la direction({=) que nous venons de prouver,
1
nous calculons: v = 1 • v = (À- 1 À) • v = À-1 •(À· v) = À- · 0E = 0E.
2) Nous calculons: v+ (-1) ·v = 1 ·V+ (-1) •v = (1 + (-1)) •v = Ooc •v = 0E, en vertu
des axiomes EV5 , EV7 et du point 1) démontré ci-dessus. Ainsi (-1) · v est bien l'opposé de v
dans le groupe (E, + ). ■
Lors de nos calculs dans ocn, nous avons à de nombreuses reprises utilisé ces règles sans
nous en rendre compte. En effet, dans JKn, ces règles étaient des propriétés immédiates des
n-uplets et elles ne nécessitaient pas de démonstration.
Notation. Nous noterons éventuellement ÀV au lieu de À· v, et u -vau lieu de u + (-v).
De même que la définition générale d'un espace vectoriel était induite des propriétés de ocn, la
définition d'une algébre s'appuie sur l'exemple de At'n(lK). Une algèbre est un espace vectoriel
dans lequel les vecteurs peuvent aussi se multiplier entre eux. Nous rajoutons donc une loi
interne multiplicative à la structure d'espace vectoriel. Comme toujours, nous obtenons ainsi
une structure intéressante uniquement si des conditions de compatibilité sont satisfaites.
2
Dans ce chapitre, la plupart des vecteurs portent des lettres latines b, f, g, u, v, w, ... et les scalaires des lettres
grecques À, µ, E,, ...
456
\f(u,v,w) E A 3 , w X (u X v) = (w X u) X V.
\f (u, V) E A 2 , \f À E OC , À· (u X v) =(À. u) X V= u X (À· V),.
:31EA,\fuE A, uxl=lxu= u.
w x (u+v) =w x u+w x v,
\f(u,v,w) E A 3 ,
{ (u+v) X w =U X w+v X W.
En somme, une OC-algèbre est à la fois un OC-espace vectoriel et un anneau, avec une
condition de compatibilité des multiplications dans l'anneau et dans OC, donnée par l'axiome
Al 2 . Le vecteur 1 du troisième axiome est appelé unité. Certains auteurs n'exigent pas son
existence et appellent notre algèbre une algèbre avec unité, ou encore une algèbre unitaire.
Notation.
◊ Pour distinguer le vecteur 1 de A du scalaire 1 de OC, on peut écrire 1A et 1IK·
◊ Souvent, on écrira uv au lieu du produit u x v si le contexte est suffisamment clair pour
savoir de quelle multiplication il s'agit.
◊ Comme toujours quand il y a associativité, on peut supprimer des parenthèses et noter
uvw = (uv)w = u(vw) et Àuv = À(uv) = (Àu)v.
PREUVE. Cela est vrai dans tout anneau (voir la proposition 11.4). On a v x OA = v x
(OA + OA) = v x OA + v x OA donc v x OA = OA. La formule OA x v = OA se démontre
de manière analogue. ■
Évidemment, comme dans le cas des espaces vectoriels, les lois d'une algèbre A induisent sur
une sous-algèbre B une structure d'algèbre. C'est la raison pour laquelle nous avons exigé que
B contienne l'unité de A.
I.2. Exemples
1.2.1. Exemples d'espaces vectoriels
L'espace ocn est bien sûr un exemple d'espace vectoriel. En voici d'autres.
◊ L'espace nul {O} qui ne contient que le vecteur nul est l'espace vectoriel le plus petit possible.
On le note souvent simplement O au lieu de {O}.
◊ Les translations dans le plan forment un lR-espace vectoriel.
◊ L'espace JK[X] des polynômes est un OC-espace vectoriel (voir le chapitre 13).
◊ Le corps JK(X) des fractions rationnelles est un OC-espace vectoriel (voir le chapitre 14).
◊ Pour tout ensemble J non vide, et pour tout espce vectoriel E sur lK (par exemple E
JK), l'ensemble ET des applications définies sur J à valeurs dans E est un OC-espace vectoriel.
Les vecteurs de cet espace sont les applications de J dans E, soit encore les familles (xj)iEJ
d'éléments de E indexés par J. L'addition de deux vecteurs de cet espace et la multiplication
par les scalaires sont définies composante par composante, dans le sens que pour tous (xj)jEJ
et (YiliEJ dans Eî, et pour tout À E lK
La vérification des huit axiomes ne pose aucun problème car elle se ramène sur chaque com-
posante aux règles afférentes dans E, ce qui se voit très bien puisque nous avons adopté le
point des familles. Du point de vue des applications, les lois de ET sont définies pour toutes
applications f : J ---t E et g : J ---t E et pour tout À E lK par les conditions
En somme, l'espace JM;J est le prototype de nombreux espaces vectoriels. On peut alors construire
beaucoup d'autres exemples à partir de ceux-là, notamment en utilisant les trois opérations
suivantes.
o Prendre un produit d'espaces vectoriels (page 460).
o Prendre un sous-espace d'un espace vectoriel (page 468).
o Prendre le quotient d'un espace vectoriel par un sous-espace.
En tant que brique élémentaire de ce jeu de construction, l'espace JKJ porte encore le nom
d'espace canonique.
L'exemple fondamental est l'algèbre .4tn(OC), avec pour loi interne multiplicative la multipli-
cation matricielle, dont l'élément neutre est la matrice identité Iln. Pour n > 1, elle est non
commutative (voir la règle 16.24). Voici d'autres exemples importants d'algèbre.
o Le corps OC est une OC-algèbre commutative.
o OC[X) est une OC-algèbre commutative, d'unité le polynôme constant de valeur 1.
o OC(X) est une OC-algèbre commutative, d'unité la fraction constante de valeur 1
o ][{J est une OC-algèbre commutative. La multiplication interne est définie composante par
composante pour tout (xj)jEJ et (-YïliEJ dans OC 1 par
L'élément neutre est la famille constante de valeur 1. La vérification des axiomes de OC-algèbre
ne pose aucun problème car elle se ramène sur chaque composante aux règles afférantes dans
K Du point de vue des fonctions à valeurs dans OC, le produit est défini pour toutes fonctions
f : J ---+ OC et g : J ---+ OC par la condition
o L'espace canonique JR 3 muni du produit vectoriel défini pour tous (x, -y, z) et (x', -y', z') dans
JR 3 par
(x, -y, z) /\ (x', -y', z') = (-yz' - z-y', zx' - xz', x-y' - -yx') (17.1)
n'est pas une algèbre. Géométriquement le produit vectoriel donne un vecteur orthogonal aux
deux facteurs. Montrons que ce produit n'est pas associatif. Soient i = (1, 0, 0), j = (0, 1, 0)
et k = (0, 0, 1) les vecteurs de la base canonique de JR 3 ; alors un calcul direct montre que
(i/\j) /\j = k/\j = -i, alors que i/\ (j /\j) = O.
459
Nous donnons dans cette partie un dernier exemple d'algèbre. Une série formelle à coefficients
dans 1K est une suite a : N -, JK, k H Uk. On la note généralement comme une somme formelle
.[_akxk,
kEN
sans faire intervenir directement de notion de convergence. Le symbole X désigne donc la suite
qui vaut O pour tous les indices, sauf pour l'indice 1 pour lequel la suite prend la valeur 1. On
appelle X l'indéterminée et on note JK[[X]] l'ensemble des séries formelles à coefficients dans 1K.
Les séries formelles complètent en quelque sorte l'algèbre des polynômes. Plus précisément,
un polynôme est une série formelle dont tous les coefficients sont nuls à partir d'un certain rang
(l'indice du dernier coefficient non nul étant le degré du polynôme). Pour définir l'addition et
la multiplication de deux séries, ainsi que la multiplication par un scalaire, on s'inspire des
lois connues pour les polynômes en posant pour tous L kEN ukXk et L kEN bkXkdans JK[[X]], et
pour tout À dans 1K
À· L. akXk = L (Àuk)Xk.
kEN kEN
Alors JK[[X]] est une OC-algèbre commutative. Son élément unité est la série 1, c'est-à-dire
la série LkEN ukXk telle que ao = 1 et uk = 0 pour tout k):: l. La vérification des axiomes
d'algèbre et de la commutativité est laissée en exercice (comme pour les matrices, le seul
axiome non immédiat est l'associativité de la multiplication, voir la question-test 17.9).
Expliquons le choix du terme de « série formelle ». A priori, une série formelle n'est pas
un objet plus formel qu'un polynôme qui contient également le symbole X. Or, il y a une
grande différence : dans un polynôme, la fonction de l'indéterminée X est de représenter
potentiellement toute quantité algébrique qui pourrait lui être substituée. Par exemple, X peut
être remplacé par un nombre, mais aussi par un autre polynôme ou même par une matrice
carrée. Plus généralement, si A est une OC-algèbre et si P = .L.~ ukXk est un polynôme dans
lK[X], alors nous avons l'application polynomiale associée définie sur A par
p
avec pour convention que x 0 = 1A pour tout x E A. En revanche, dans une série formelle,
la seule quantité qui peut être substituée à X avec certitude est l'élément nul. Par exemple,
considérons la série
............
dite « exponentielle ». Par quoi pouvons-nous remplacer X? Si nous ne voulons pas utiliser de
notion de convergence, il nous faut substituer une quantité dont la puissance s'annule à partir
d'un certain rang. Ainsi, dans le cas où X devient une matrice, elle doit être nilpotente.
Dans cette partie, nous introduisons un premier procédé pour construire d'autres exemples
d'espaces vectoriels à partir d'exemples connus. Nous avons déjà rencontré le cas particulier
de l'espace E1 pour un espace vectoriel E donné.
461
Proposition-définit ion 17.7. 8-oit J un ensemble non vide et soit (Ei)Jer 11,ne famille de
K-espaces vectoriels. .On. note
TIE;
iEJ
l'ensemble de toutes lesfàmilles (Uj)jeJ telles que Uj E Ej pour tout j E J que l'on munit de
deu:flois comme suît.
loi. interne : (Uj)jEJ + {Vj)jEJ == (Uj+Vi};EJ,
loi externe : À· {Uj);eJ =
{:\UjheJ •
On obtient ainsi un espace vectoriel appelé espace produit de la famille (EiheJ·
Si J est l'ensemble fini J= {1, ... , n}, on note
·n
fitj = E1 .x ···X .En.
j=l
PREUVE. La vérification des huit axiomes s'effectue composante par composante, en utilisant
les axiomes correspondants de chaque espace vectoriel Ei . Montrons le premier axiome, c'est-
à-dire la commutativité de l'addition dans njEJ Ej. Soit (Uj)jeJ, (vj)jeJ E njEJ Ej. Pour tout
j E J, on a l'équation Uj +vj = Vj +uj dans l'espace vectoriel Ej, Cela signifie que dans njEJ Ej'
on a l'identité
(uj)jeJ + (viliEJ = (vj)jeJ + (Uj)jeJ.
Les autres axiomes se démontrent de manière analogue. ■
Plus particulièrement au cours du xxe siecle, il s'est souvent avéré fructueux d'étudier un
type d'objet mathématique donné non pas en considérant les objets eux-mêmes mais plutôt
les applications définies entre ces objets. Les objets qui nous intéressent ici sont les espaces
vectoriels. Évidemment, nous n'allons pas considérer toutes les applications entre ces espaces
- qui constitueraient un ensemble beaucoup trop gros pour refléter les structures des espaces
considérés - mais seulement celles qui préservent la structure des espaces vectoriels, c'est-à-
dire celles qui sont compatibles avec les calculs dont nous avons fixé les règles. Dans tout ce
qui suit E et F sont deux OC-espaces vectoriels.
Définition 17.8. Soit f: E-, F une application. On dit que f est une application linéaire,
ou un morphisme d'espaces vectoriels, si
o Si E, F sont des C-espaces vectoriels alors ce sont aussi des IR-espaces vectoriels. Il est
nécessaire de distinguer les morphismes entre E et F, en tant que C-espaces vectoriels, et les
morphismes entre E et F, en tant que IR-espaces vectoriels. Les premiers sont dits C-linéaires et
les seconds IR-linéaires. En tout état de cause, lorsqu'on parle d'application linéaire, l'espace
de départ et l'espace d'arrivée sont supposés avoir le même corps de scalaires.
3
Certains ouvrages appellent monomorphisme une application linéaire injective et épimorphisme une application
linéaire surjective.
463
EXEMPLE 17.9.
r/J
o Pour deux lK-espaces vectoriels E, F. considérons les applications
(u,v) et Exf (u,0).
i
,Q)
Exf ll
l
E
1
u
î
E
1
u i
r/J
;!:l
L_ akxk
k=0
HP'=
p
L_ kakxk-l
k=l
est linéaire. i[
r/J
o L'application f lK[X] -----, JK[X] , P(X) H P(X) 2 n'est pas linéaire. En effet,
~
f(l +X)= (1 + X)2 # 1 + X2 = f(l) + f(X).
r..:
....
..d
Application linéaire définie par une matrice. La règle 16.5 du calcul matriciel implique (.)
que pour tout A E .A'mn(lK), l'application  : lKn -----, ]Km, x H Ax est linéaire. Pour que
le produit Ax ait un sens, on écrit x en colonne de sorte que l'application soit définie par la
correspondance
où les Ck sont les colonnes de la matrice A. Ainsi nous retrouvons l'interprétation fondamentale
d'une matrice au regard du produit matriciel que nous avons déjà rencontré au chapitre 16.
Soit par exemple la matrice A = ( ~?). Alors  : !R JR 2 est définie par  ( ~) = ( tx).
2
-----,
(2,0)
Nous constatons que l'image de la droite est encore une droite, mais que l'image du cercle
n'est plus un cercle. Autrement dit, la notion de cercle «rond» n'a pas de sens dans le monde
linéaire : ce n'est pas une notion qui est préservée par tout automorphisme linéaire. Nous
verrons en deuxième année qu'il faut une structure supplémentaire dite euclidienne, c'est-à-
dire un produit scalaire, pour pouvoir parler de cercle. En revanche, la notion de droite est bien
464
une notion linéaire. Avec un peu d'habitude, le lecteur gagnera en intuition pour distinguer
ce qui est linéaire de ce qui ne l'est pas.
Morphisme d'algèbres. Lorsque les espaces vectoriels sont aussi des algèbres, il est naturel
de considérer les applications linéaires qui conservent, en outre, la multiplication interne. On
notera que l'on exige que les morphismes d'algèbres préservent les unités.
Définition 17.11. Soit A, B deux OC-algèbres. Un morphisme d'algèbres est une application
linéaire f: A ----t B telle que f(lA) = 18 et telle que f(uv) = f(u)f(v) pour tout (u, v) E E2.
EXEMPLE 17.12.
◊ Pour toute OC-algèbre A, l'application OC ----t A, i\ H i\ · 1A est un morphisme d'algèbres.
◊Soit M E .4"1n(IK) une matrice carrée fixée. Alors IK[X] ---+ Atn(OC), P H P(M) est un
morphisme d'algèbres.
~ y:
Tl ~
f . .An(K) --, .An(K) , A H BAC.
g . .Amn(K) --, .4é'nm(K) , A H tA.
Test 17.17.
Soit f: E--, IKn, v H (f1 (v), ... , fn(v)). Que
pensez-vous de. la proposition
Test 17.14. « f est linéaire si et seulement si les applications
La conjugaison complexe C --, C , z H z, fk : E --, K sont linéaires pour k = 1, ... , n. » ?
est-elle C-linéaire? Est-elle lR-linéaire? Test 17.18.
Test 17.15.
Pour chacune des conditions ci-dessous, indi-
Pour a E IK, posons fa : 1K --, IK, x H ax . quer si elle est nécessaire et/ou suffisante pour
a. Montrer que fa est linéaire. que f : E --, F soit linéaire.
b. Montrer que pour toute application linéaire a. v'u,v E E v'i\ E K•: f(O) = 0 et f(u+i\v) =
f : 1K --, IK, il existe a E lK tel que f = fa . f(u) + i\f(v).
Test 17.16. b. v'u, v E E v'i\ E K: f(u+i\v) = f(u) +i\f(v).
Fixons a E IK, Q E K[X] et B, C dans .An(K). c. v'u v'n E .Z: f(nu) = nf(u).
Pour chaque application ci-dessous, indiquer s'il
d. v'u E E v'i\ E K: f(i\u) = f(i\)f(u).
s'agit d'une application linéaire ou même d'un
morphisme d'algèbres. e. v'u E E v' i\ E K: f(i\u) = f(i\) + f(u).
a. JK(X] --, K, P(X) H P(a). f. v'u E E: f(-u) = -f(u).
commes des application s linéaires entre espaces canoniques. Il est remarquab le qu'ici encore
nous obtenions un espace vectoriel, et même une algèbre dans le cas où les deux espaces
vectoriels sont identiques.
Pour deux K-espaces vectoriels E et F, on note 2'(E, F) l'ensemble des applications linéaires
de E dans F, et 2'(E) = 2'(E, E) désigne l'ensemble des endomorphismes de E.
PREUVE. D'abord nous remarquon s que 2'(E, F) est non vide car l'applicatio n nulle est
linéaire et appartient donc à 2'(E, F). Soit f et g : E --t F deux applications linéaires et À E2 K
Nous devons montrer que les application s f + g et Àf sont linéaires. Pour tous (u, v) E E et
<XE K, on a
(f + g)(u+ <XV)= f(u+ <XV)+ g(u+ <XV)= f(u) + <Xf(v) + g(u) + <Xg(v))
= f(u) + g{u) + <X(f(v) + g{v)) = (f + g)(u) + <X(f + g)(v),
("Af)(u +<XV)= "Af(u) + À<Xf(v) = ("Af)(u) + <X("Af)(v).
■
Remarquon s que la preuve utilise le fait que À<X = <XÀ. Pour des espaces vectoriels sur un
corps non commutati f (cela existe!), la proposition est fausse. Dans ce livre, les corps sont
commutati fs par définition (voir le chapitre 11).
Propositi on 11\14. Smènt E, f, G des espaces vectoriels, soit i\ E K, et soie11.t f, f' dans
Z(E, f) et g, g' dans .2"(F, G}. Alors,
1) la composéeg of est dans.2'(E, G);
2) go {f + f') = g o :f+ g o f1 et
3) Â(g of)= ("Ag) of= go ("Af).
PREUVE.
Corollaire 17;15.
L'espace 2'(E) des endomorphismes de E, muni de la multiplication donnée par la eomposi-
=
tion; est une K.-algèbre, dont l'élbnent unité est l'application ide11J,ité 12 cE) idE,
Propositi on 17.16.
L'application réciproque d'un isomorpbisme d'espaces vectoriels est encore linéaire.
4
Comparer avec l'équation (17.2, page 459).
466
Par injectivité de f, on obtient que g(u + Àv) = g(u) + Àg(v). Donc g est bien linéaire .
•
Définition 17.17.
Deux espaces vectoriels E et F sont isomorphes s'il existe un isomorphisme f : E -t F.
Le terme d'« isomorphe» vient du grec, de isos, même, et morphê, forme. Deux espaces
isomorphes ont la même forme, dans le sens qu'il n'est pas possible de distinguer un espace
d'un autre espace isomorphe par ses propriétés: tout énoncé dans l'un se traduit par un énoncé
similaire dans l'autre, où seuls les noms des objets ont changés via un isomorphisme. Deux
espaces isomorphes sont donc différents nominalement mais indiscernables intrinsèquement.
EXEMPLE 17.18.
o Si A E Gl( n, JK) alors l'application linéaire  : lKn -t lKn, x H Ax est un automorphisme.
En effet x H A- 1x est son inverse.
◊ La transposition A'tmn(IK) -t A'tnm(IK), AH 1A est un isomorphisme d'espaces vectoriels.
Dans le cas particulier où E = F, les isomorphismes sont des automorphismes (du grec
autos, soi-même). Ce sont précisément les éléments inversibles de l'algèbre 2"(E), soit encore
les applications bijectives de E dans E qui sont de plus linéaires. Les bijections de E dans E
forment un groupe, le groupe symétrique 6(E), vu au chapitre 10. Les automorphismes de E
en constituent un sous-groupe.
Test 17.19.
Quel est l'élement neutre de Gl(E}? Comment peut-on généraliser ce résultat?
Test 17.20. Test 17.22.
La relation ':::'. est-elle d'équivalence? L'application JK:1'' -, lK[[X)] , ( ak)kEN H
Test 17.21. LkEN akXk est-elle un isomorphisme d'es-
paces vectoriels? Est-elle un isomorphisme d' al-
Pour chacune des deux applications ci-dessous,
gèbres?
montrer qu'il s'agit d'un automorphisme d'es-
paces vectoriels et donner son inverse. Est-ce Test 17.23.
des automorphismes d'algèbres? La transposition Atn(lK) -, Atn(lK), A H
1
A est-elle un automorphisme de l'algèbre
Atn(lK)?
467
Comme nous l'avons vu, toute matrice A E .4'lmn0K) induit une application de  de ocn dans
ocm, définie par Â(x) = Ax pour tout x E ocn. Bien entendu, cette application est linéaire,
comme le montre la règle 16.5. Avec le vocabulaire introduit dans ce chapitre, nous pouvons
maintenant résumer la construction du produit matriciel du chapitre 16 par la proposition
suivante.
Prc>position· 11.20.
1) .L '#!l'lication
.4~{lKJ -+ 2{r')tfu) : À ~X
est un isomorp1ii$me â •~~s dlwtone~ tje .r€d.prolftie ,: -
t - - ~ ~
De la même manière, nous identifions les algèbres .4'ln(1K)::::: 2'(1Kn). Sous cette identifica-
tion, les matrices inversibles correspondent aux automorphismes de ocn. Aussi nous identifions
Gl(n,JK)::::: Gl(JKn).
468
Il suffit de calculer les images f(ei) = (2, 1), f(e2) = (-5, 1), f(e3) = (0,4) et de les juxtaposer
en colonnes dans la matrice
2-5
At= ( 1 1 4 .
0)
Bien entendu, nous aurions pu écrire directement les vecteurs de ocn en colonnes, ce qui
aurait donné immédiatement le résultat car
Mais pour une question de place, il est fréquent d'éviter l'écriture en colonnes.
Dans tout ce qui suit, E est un OC-espace vectoriel. Jusqu'à présent, nous avons vu peu
d'exemples d'espaces vectoriels autres que l'espace canonique JK.T ou l'espace ET et leurs cas
particuliers ocn, JK.N et A'tmn(lK.). Dans cette partie, nous montrons comment il est possible
de construire beaucoup d'autres espaces vectoriels comme sous-espaces vecoriels d'un espace
vectoriel donné. En effet, comme nous l'avons noté page 454, un sous-espace vectoriel est
lui-même un espace vectoriel car les lois sont induites par l'espace qui le contient et les huit
axiomes sont automatiquement satisfaits.
vectoriel E bien connu qui le contient et de vérifier des conditions de stabilités par addition
et par multiplication par les scalaires; ce qui s'écrit en une seule condition comme suit.
EXEMPLE 17.22.
◊ JK[X] est un sous-espace vectoriel de l'espace OC[[X]] des séries formelles.
◊ L'ensemble OCn[X] des polynômes de degré au plus n est un sous-espace vectoriel de JK[X]
(et donc aussi de OC[[Xll).
◊ Soit I C lR un intervalle et k E NU{oo}. Alors l'ensemble <tfk(I) est un sous-espace vectoriel
de l'espace canonique JE.I. En effet, la fonction nulle est de classe 'tfk, et toute combinaison
linéaire de fonctions de classe <tfk est aussi de classe <tfk (voir les chapitres d'analyse).
◊ De même, on montre que l'ensemble C des suites réelles convergentes est un sous-espace
vectoriel de JE.N_
Pour obtenir l'espace vectoriel des suites convergentes ou l'espace vectoriel des fonctions
dérivables, nous avons fait le détour par les espaces ]RN et ]RI_
Remarque.
◊ Un sous-espace vectoriel contient toujours le vecteur nul.
◊ L'espace nul et E sont deux sous-espaces vectoriels de E; on les appelle les sous-espaces
triviaux. Chaque espace vectoriel E a «son» espace nul {OE}. Ainsi, il y a autant d'espaces
nuls que d'espaces vectoriels. Cependant, on parle toujours de « l'espace nul », car ils sont
tous canoniquement isomorphes : il existe5 un unique morphisme entre deux espaces nuls
donnés, l'application nulle, et c'est un isomorphisme.
◊ Un sous-espace vectoriel strict est un sous-espace vectoriel F tel que F ~ E.
◊ Si F est un sous-espace vectoriel de E et si G est un sous-espace vectoriel de F, alors G est
un sous-espace vectoriel de E. Évidemment, la relation d'inclusion définit ainsi une relation
d'ordre sur l'ensemble des sous-espaces vectoriels d'un espace vectoriel E fixé.
5
En revanche, deux espaces nuls sur des corps de bases différents ne sont pas isomorphes.
470
PREUVE.
1) Soit F CE un sous-espace vectoriel. Soit u', v' E f(F) et i\, µ E lK. Alors il existe u, v E F
tels que f(u) = u' et f(v) = v'. Donc i\u' + µv' = i\f(u) + µf(v) = f(i\u + µv) E f(F).
2) Soit maintenant F' C E' un sous-espace vectoriel. Soient u, v E f- 1 (H) et i\, µ E lK.
Alors f(u) et f(v) sont dans F'. Donc f(i\u + µv) = i\f(u) + µf(v) E F', ce qui montre que
i\u + µv E f- 1 (F'). ■
lm (f) = f(E) = {v E E :3 u E E, v
1 = f(u)}.
Il résulte de la proposition 17.23 que le noyau est un sous-espace vectoriel de l'espace de départ
et l'image un sous-espace vectoriel de l'espace d'arrivée. La propriété la plus importante du
noyau est la suivante (comparer avec les homomorphismes de groupes du chapitre 9).
EXEMPLE 17.26.
o Soit A E AlmnOK). Alors l'espace des solutions du système linéaire homogène Ax = 0 est
le noyau de l'application linéaire A: ocn-) ocm.
5
La notation Ker pour le noyau vient de l'allemand« Kern » et de l'anglais« kernel ».
471
En analyse, on montre que la solution générale de cette équation différentielle est une com-
binaison linéaire des fonctions sin et cos.
Propositionl7.27. ·•Soitf :·E ➔ F une application linéaire ej soit l-t·un sous-espace vectoriel
de E:.Ators ~. restriction ftH de f à H est une applièation tinéàire de noyau Ker(f1wl =
HnKëtf.
En résumé, nous disposons des trois méthodes suivantes pour montrer qu'une partie H
non vide de E est un sous-espace vectoriel.
- En montrant la stabilité de H par combinaisons linéaires. Par exemple : 'i!f(I).
- En consid'erant H omme image réciproque d'un sous-espace vectoriel par une ·applica-
tion linéaire, en particulier comme un noyau. Par exemple : Ker A, comme l'espace des
solutions du système linéaire homogène Ax = O.
- En considérant H comme image d'un sous-espace vectoriel par une application linéaire,
en particulier comme image de l'espace de départ. Par exemple : si v 1 , .•. , Vp sont des
vecteurs de ocn, alors vect (v 1 , ... , vp) est l'image lm (f) de l'application linéaire f :
JKP ---t ocn, (À1, ... , Àp) H Lj=l ÀjVj ·
Le noyau d'une application linéaire est l'exemple par excellence d'un sous-espace vectoriel.
En effet, nous verrons que tout sous-espace vectoriel est le noyau d'une application linéaire
(voir le corollaire 19.18, page 523). Mais nous verrons aussi que ce point de vue n'est pas
toujours instructif. Par exemple, même s'il existe une application linéaire f définie sur JR 1 telle
que Ker (f) = 'i!f(I), l'espace d'arrivée serait trop« théorique» pour être exploitable. En effet,
il faudrait dans ce cas définir f à partir de 'i!f(I). La connaissance de l'application f ne nous
apprendrait donc rien de plus sur 'i!f(I). C'est pourquoi les deux autres méthodes ci-dessus ne
doivent pas être negligées.
d. f: OC[X]----, OC[X], P(X) H P(X 2 +X+ 1) « Pour faire partie du "petit noyau",
e. <l> : 'i&' 2 (I) ----+ 'if(I), f H f' - f. du ''petit groupe", du "petit clan"
des Verdurin, une condition était
Test 17.31. suffisante, mais elle était nécessaire
[... ]))
Soient f : E ----, F et g : F ----, G deux applications
linéaires. Que pensez vous des propositions sui- a. Dresser la liste de tous les mots de cette
vantes? phrase qui sont aussi des notions mathéma-
tiques.
Ker ( g o f) = Ker (f) n Ker (g)
Ker ( g o f) C Ker (f) ; b. Il y a un mot qui devrait déranger le logicien
Ker ( g o f) :::i Ker (f) ; en herbe que vous êtes. De quel mot s'agit-il?
Im (f) C Ker{ g) # gof = 0. Test 17.33.
Test 17.32. Soit f : E ----+ E' une application linéaire. Le
Voici la première phrase du livre Un amour de graphe de f défini par {(v, f(v)) v E E} est-il un
1
III.3. Sous-algèbres
D'après la définition 17.4, une sous-algèbre de A est un sous-ensemble qui contient le vecteur
1A , qui est un sous-espace vectoriel (c'est-à-dire qui est stable par combinaisons linéaires), et
enfin qui est stable pour la multiplication interne. Nous donnons dans cette partie quelques
exemples de sous-algèbres, à la lumière de la notion de morphisme que nous avons développée.
EXEMPLE 17.28.
o JK[X] est une sous-algèbre de JK[[X]].
o 1Kn[X] n'est pas une sous-algèbre de JK[X] (sin> 0).
o 'i!fk(I) est une sous-algèbre de JR 1.
En effet, c'est un sous-espace vectoriel (exemple 17.22) ; la fonction constante égale à 1 est
de classe 'i!fk, et en analyse nous apprenons que le produit de deux fonctions de classe 'i!fk
est aussi de classe 'i!fk.
o De même, on montre que l'ensemble C des suites réelles convergentes est une sous-algèbre
de ]RN_
Dans ce qui suit, nous écartons le cas de l'algèbre nulle, c'est-à-dire que nous supposons
que O /. 1 (voir question-test 17.6).
Image et image réciproque par un morphisme. Soit f: A----, A' un morphisme d'algèbres.
Comme dans 17.23, on montre que l'image réciproque d'une sous-algèbre de A' est une sous-
algèbre de A et que l'image d'une sous-algèbre de A est une sous-algèbre de A'.
est une sous-algèbre de A, notée lK- lA. Comme ce morphisme est injectif (son noyau est nul),
on peut identifier 1K avec 1K · 1A· Par ailleurs, une sous-algèbre de A contient forcément tous
les vecteurs de la forme À· 1A où À E K Il s'ensuit que 1K · 1A est la plus petite sous-algèbre
de A.
473
où À E lK.
Dans m.JR on considère les sous-ensembles formés Dans JR1>1, on considère les sous-ensembles for-
més
a. Par les fonctions polynomiales ;
b. Par les fonctions en escalier ; a. Par les suites de limite nulle ;
c. Par les fonctions de période 1 ; b. Par les suites majorées ;
d. Par les fonctions f telles que f( 1) = 0; c. Par les suites bornées ;
e. Par les fonctions f telles que f(O) = 1; d. Par les suites arithmét iques;
f. Par les fonctions monoton es ; e. Par les suites géométri ques;
g. Par les fonctions à support borné (nulles en f. Par les suites périodiques ;
dehors d'un segment) ;
g. Par les suites de Fibonacci, c'est-à-di re telles
h. Par les fonctions ayant +oo ou -oo pour li-
que Un+2 = Un+l + Un, \l'n E N;
mite en +oo;
h. Par les suites positives.
i. Par les fonctions affines.
Dans chaque cas, indiquer s'il s'agit d'un sous- Dans chaque cas, indiquer s'il s'agit d'un sous-
espace vectoriel, d'une sous-algèbre de m.JR. espace vectoriel, d'une sous-algèbre de RN.
17.1. 17.3.
3
Dans l'espace vectoriel E = JR , on considère les
G = { (unlnEN E E \Un= o(n2)}
I Un ~ *}
sous-ensembles
2
E R },
H = { (un)nEN E E
F = {(À-3µ ,2À+3µ ,À), (À,µ)
G = { (x,y,z) E E I x+2y =Ô }· L = { (unlnEN E E 1 :lk E lR, Un ~ ~}
1. Prouver que les ensembles F et G sont des
sous-espaces vectoriels de E. (Voir définitions 25.84 et 25.94 pour les sym-
2. Détermin er le sous-espace vectoriel F n G. boles des O et ~ .)
Chapitre 18
BASES
ANS ce chapitre, nous allons nous intéresser à la façon de repérer la position d'un
D vecteur dans un espace vectoriel donné. L'idée repose sur le fait que l'on dispose
de beaucoup d'applications linéaires à valeurs dans 1K. Ce sont les valeurs prises
par ces fonctions en un vecteur donné qui vont déterminer la position de ce dernier. Par
exemple, dans le cas de l'espace canonique :ocn, l'ensemble constitué des projections :ocn-, :OC,
(x 1 , ... , Xn) H Xk pour k = 1, ... , n détermine la position de tout vecteur.
Nous distinguerons deux types d'espaces vectoriels : ceux de dimension finie pour lesquels
un ensemble fini d'applications linéaires à valeurs dans 1K suffit pour déterminer la position
de tout vecteur, comme dans le cas de :ocn, et ceux de dimension infinie, pour lesquels un
ensemble infini est nécessaire. Il est cependant remarquable qu'un ensemble optimal de fonc-
tions linéaires existe toujours. Ce fait repose sur l'existence, pour tout espace vectoriel, d'une
notion que nous avons déjà rencontrée pour l'espace canonique: tout espace vectoriel possède
une base.
Dans le cas de la dimension finie, ce point de vue est particulièrement intéressant car
il permet de ramener l'étude des applications linéaires entre espaces de dimension finie au
calcul matriciel, et ainsi à des calculs sur des scalaires. Toutefois, l'isomorphisme par lequel
un espace vectoriel de dimension finie s'identifie à un espace canonique n'étant pas unique, il
nous faudra faire preuve ici de la plus grande vigilance sur la façon dont le calcul matriciel
entre en jeu. Comme précédemment, E désigne un :OC-espace vectoriel dans tout ce qui suit.
Étant donnée une partie d'un espace vectoriel, il existe un plus petit sous-espace vectoriel
qui la contient pour la relation d'ordre définie par l'inclusion. On l'appelle le sous-espace
vectoriel engendré par cette partie. Nous avions déjà rencontré cette notion dans le cas de
l'espace canonique :ocn et nous la reprenons ici dans le cas plus général d'un espace vectoriel
quelconque. C'est une première étape en vue de la définition d'une base.
est une combinaison linéaire des vecteurs Xk pour k = 0, ... , p. Si on souhaite ajouter à P le
polynôme
on se heurte à une petite difficulté d'écriture : la somme P + Q devrait être le polynôme dont
le j-ième coefficient est la somme Cj =ai+ bi. Or si p -=/ q, la formule n'est pas correcte pour
476
les indices j > min(p, q). Il faut en effet distinguer le cas où p > q, dans lequel Cj = Uj, du
cas où q < p, dans lequel Cj = bi. Évidemment, cette discussion alourdit les démonstrations.
Pour remédier à ce problème, il suffit de compléter le polynôme de plus petit degré par
des coefficients nuls jusqu'à l'indice max(p, q) car alors la formule des coefficients de P + Q
est bien ci = ai + bi pour tous les indices. Mais par exemple dans le cas où p > q, il a fallu
compléter Q, alors que dans le cas où q < p, il a fallu compléter P. Nous n'échappons donc
pas complètement encore à une discussion.
L'idée est alors de compléter les polynômes par une infinité de coefficients nuls. Ainsi nous
écrivons P et Q comme des séries formelles
+oo +oo
P- ~a-Xi
- L._ J ' Q = LbiXj
j=O j=O
Notation. Dans les deux points de vue, on note ocm le sous-ensemble de ocJ formé par les
familles (ou fonctions) presque nulles.
Proposition 18.2.
L'ensemble grn des familles presque nulles est un S-Ous-espace vectoriel de JK:1.
PREUVE. On voit facilement que, pour tous f, g dans oc1 et tout,\ E OC*,
supp(f + g) C supp(f) U supp(g) et supp(M) = supp(f).
On en déduit qu'une combinaison linéaire de deux fonctions à supports finis a encore un
support fini. ■
Soit maintenant (viliEJ une famille quelconque de vecteurs d'un OC-espace vectoriel E et
soit (Àj)jEJ une famille de scalaires dans K Alors l'expression
LÀjVj
jEJ
477
est une combinaison linéaire si Jest fini. Mais si J est infini, il s'agit d'une somme infinie dont
il est difficile de donner un sens sans notion de convergence. Cependant, si seul un nombre fini r/J
de termes sont non nuls, on convient que seuls ceux-là sont pris en compte dans la somme. ~
o:l
La somme infinie n'est alors qu'une notation commode qui cache en réalité une somme finie.
00
Plus précisément, si (;\i)iEJ E ocm, il existe des indices j 1 , ••• , jn E J tels que Àj = 0 pour tout ......
.d
j E J\01, ... , jn}- Alors on pose ü
n
.L_ ÀjVj = .L_ Àjk Vik .
jEJ k=l
Notons que l'ensemble {j 1 , ... , jn} n'est pas unique car il peut comporter un nombre arbitraire
mais fini d'indices dont le coefficient associé est nul. Heureusement le terme de droite est bien
indépendant de ce choix. Sauf mention contraire, les sommes infinies que nous rencontrerons
en algèbre linéaire seront formées par des familles de coefficients presque nulles.
Règlé l8;!k Dans 'linè comlnnaisbn tiriéaire d/un nomb~ infini de' vecteurs de E., toy,s lès co-
effièîènts saufun nombre fini dàivent 'tire nuls. :Autremènt dit, èltè est de la Jorrnè rJEtÀjVj,'
avec \lj E E et {Àj)JeJ dans JK.Ul. .
PREUVE. Soit (Fj)jE) une famille de sous-espaces vectoriels de E. Notons F = njEJ Fj leur
intersection. Nous constatons que le vecteur nul est dans F car chacun des Fi le contient. Soit
(u, v) E F2, (;\, µ) E JK2 et j E J. Alors (u, v) E Ff, donc ;\u+ µv E Fi car Fi est un sous-espace
vectoriel. Comme cela est vrai pour tout j E J, il en résulte que Àu + µv E F. ■
478
Remarque. En particulier vect (0) = O. Nous obtenons ainsi une application vect : V H
vect (V) de l'ensemble des parties de E dans l'ensemble des sous-espaces vectoriels de E.
o L'application vect est surjective car vect (F) = F pour tout sous-espace de E.
o L'application vect est croissante : si V C U C E, alors vect(V) C vect(U).
o L'application vect est idempotente: vect(vect{V)) = vect(V).
La définition 18.5 est conceptuellement satisfaisante, mais n'est guère opératoire. Voici
une description plus explicite du sous-espace vectoriel engendré.
txv".,
'-\iâv'· •1·•· J.À,,···•.•.·,·.!••.
ve.•·· ~
Y. . . . .•l[{(V)·.l··.·••:.
} .
Le sous-espaee véctoriel enge'ndréJHJr\' estJ'ensemble
de vecteurs âeV. · · · ·· ·
d,: toût~sles combinaisons
·
linéaires
naison dans H et, de même, pour le produit d'une combinaison linéaire de vecteurs de V par gJ
i:o
un scalaire. De plus, H contient évidemment V. Par conséquent, H est un sous-espace de E et
cxi
vect (V) C H d'après la condition 3) de la définition 18.5. ■ '""
..d
ü
Sous-espace vectoriel engendré par une famille.
Définition 18.7. Soit (vj)iEJ une famille de vecteurs de E. Le sous-espace vectoriel engendré
par la famille (viliEJ est le sous-espace vectoriel engendré par la partie {vi I j E J}. On le note
vect ((viliEJl-
Autrement dit,
Test 18.5.
Soient U, V des parties de E. Que pensez-vous Test 18.7.
des assertions suivantes?
On considère l'espace vectoriel JRIR des fonctions
continues. Pour chacun des sous-espaces vecto-
a. vect (V n U) = vect (V) n vect (U). riels ci-dessous, dresser la liste des fonctions
constantes qu'il contient.
b. vect (V n U) c vect (V) n vect (U). a. F=vect(sin,cos).
b. G = vect(sin 2 , cos 2 ).
c. vect (V\U) C vect (V)\vect (U).
Nous allons reprendre les notions de famille libre, de famille génératrice et de base que nous
avons rencontrées dans le cas particulier de l'espace canonique ocn. L'idée est que la plupart
des raisonnements que nous avions tenus au chapitre 15 ne requiert pas l'existence d'une
base canonique et donc qu'ils s'étendent sans difficulté aux espaces vectoriels généraux. Nous
séparerons les espaces vectoriels en deux grandes catégories : ceux qui sont isomorphes à un
espace canonique ocn et les autres. Nous verrons de plus que ceux de la première catégorie sont
complètement classés par les entiers naturels, ce qui nous conduira à la notion de dimension.
Avant d'expliquer ce qu'est la dimension d'un espace vectoriel, donnons une première définition
grossière qui distingue les espaces vectoriels de dimension finie des autres espaces vectoriels.
Définition 18.8. Une partie V C E est une partie génératrice de E si vect(V) = E. On dit
aussi que V constitue un ensemble de générateurs de E. De manière analogue, une famille
est génératrice si son image l'est.
Définition 18.9. On dit que E est de dimension finie s'il existe une partie génératrice finie
de E et on note alors dimE < oo. Dans le cas contraire, on dit que E est de dimension infinie
et on note dimE = oo.
Remarquons que tout espace vectoriel E possède une partie génératrice V : il suffit de prendre
V = E. La notion ne sera évidemment intéressante que si nous sommes capables de déterminer
des parties génératrices beaucoup plus petites.
EXEMPLE 18.10.
o Au chapitre 15, nous avons déjà montré que ocn et tous ses sous-espaces vectoriels sont de
dimension finie.
o L'espace des polynômes OC[X] possède les générateurs naturels Xk, k E N. Montrons que
OC[X] est de dimension infinie. Supposons par l'absurde qu'il existe une partie génératrice
finie {P 1, ... , PT} de OC[X]. Soit m le plus haut des degrés de ces générateurs. Alors toute
combinaison linéaire des Pk est de degré au plus m. Donc le polynôme xm+l n'est pas dans
vect (P1, ... , PT}, ce qui contredit l'hypothèse.
o Soit F l'ensemble des solutions de l'équation différentielle 11" + 11 = O. Alors Fest le sous-
espace vectoriel de 'tf' 00 (JR) engendré par les fonctions sin et cos. Par conséquent, F est de
dimension finie.
481
Rien ne change pour les familles libres par rapport au cas de l'espace canonique sinon qu'il
peut exister maintenant des familles libres infinies. Notre travail sur les familles presque nulles
facilite cependant grandement leur maniement.
Définition 18.11.
1) Une famille (vi)iEJ de vecteurs de E est libre si pour toute famille (Ài)iEJ E JKOl on a
l'implication
L_ ÀjVj = 0 =} 't;/ j E J, Àj = 0.
jEJ
2) Une famille (vj)iEJ de vecteurs de E est liée s'il existe une famille non nulle (Àj)iEJ E JK.Ol
telle que LiEJ ÀjVj = 0.
Évidemment, toute famille est soit libre, soit liée, et les deux notions s'excluent mutuellement.
Nous avons bien sûr une définition analogue pour les parties : une partie V CE est libre si la
famille (v)vEV est libre, c'est-à-dire si, pour tout (Àv)vEV E JK,(Vl, on a l'implication
L. ÀvV = 0 =} 't:/ V E V, Àv = 0.
vEV
EXEMPLE 18.12.
◊ Les fonctions sinus et cosinus forment une famille libre dans le .IR.-espace vectoriel 'i&' 00 (JR.).
En effet, soient À, µ deux réels tels que Àsin x + µ cos x = 0 pour tout x E R Alors en
évaluant cette relation d'abord en x = 0, puis en x = n/2, il vient que µ = 0, puis À = O.
Donc les fonctions sin et cos forment une partie libre.
◊ La famille (Xk)kEN dans JK[X] est libre : un polynôme est nul si et seulement si ses coeffi-
cients sont nuls.
◊ Soit fk: lK-, lK définie par h(x) = xk pour tous x E lK et k EN. Alors la famille (fklkEN
à valeurs dans JKiK est libre. En effet, c'est une propriété des fonctions polynomiales définies
sur lK = lR. ou C: la fonction polynomiale lK.-, JK, x H P(x), définie par P E JK.[X], est nulle
si et seulement si P = 0 (voir la proposition 13. 71).
482
Remarque. Un C-espace vectoriel est aussi un :IR-espace vectoriel. Toutefois une famille
liée dans un C-espace vectoriel E ne l'est pas nécessairement dans E en tant que :IR-espace
vectoriel. S'il y a lieu de préciser, on parlera alors de familles liées ou libres sur C ou sur R
EXEMPLE 18.13. La famille des vecteurs (1, i) et (i+ 1, i-1) de C 2 est liée sur C (car son
1 déterminant 2 x 2 est nul), mais libres sur R
Proposition 18.14.
Po-ur toute famille (vj}1eJ de vecteùrs de. E, les propriétés. suivantes sont éqùivalentes :
1) lafamille {viljeJ es.t libre;
2) poùr chaque t E J; le vecteur Vt n'est pas combinaison linéaire des vecteurs VJ pour
j E J\{t}; .
3) tout vecte-ur du sous-espace F engendré par la Jam:l,lle (vJ)ieJ s'écrit de m~ière unique
comme combinaison linéaire des VJ ;
4) si un vecteur de E peut· s'écrire comme combinaison ·tméaite· des VJ, cette écriture est
ùniqué.
PREUVE.
1) =} 2). Montrons la contraposée. Supposons qu'il existe un indice C E J tel que Vt soit
combinaison linéaire des vecteurs Vj pour j =J C. Ainsi il existe une famille presque nulle de
coefficients (i\liEJ\{il telle que Vt = Lïµ ÀjVj. On complète cette famille de coefficients en
posant Àt = -1 et on obtient que LiEJ Àivi = 0. Donc la famille (viliEJ est liée.
2) =} 3). Soit v E F = vect({vj I j E J}). Par définition, le vecteur v s'écrit sous la forme d'une
combinaison linéaire des vecteurs Vj, soit encore
V= _L ÀjVj,
jE)
avec (Àj)jEJ une certaine famille presque nulle de coefficients. Montrons que cette écriture est
unique. Supposons par l'absurde que v = LiEJ ~vi pour une autre famille (~liEJ presque
nulle. Cela signifie qu'il existe un indice C tel que Àt =J µf. Et comme .L. (Àj - µj)Vj = 0, on
jEJ
obtient que Vt = -(Àt - µt)~ 1 .L (Àj - ~)vi, ce qui contredit l'hypothèse 2).
jµ
3) =} 4). Supposons la condition 3) satisfaite. Soit v un vecteur de E. Ou bien v est dans
F = vect ({vi I j E J}) et dans ce cas la condition 3) montre que v possède une unique écriture
comme combinaison linéaire des Vj, ou bien v n'est pas dans F et dans ce cas il ne s'écrit pas
comme combinaison des Vj .
4) =} 1). Supposons la condition 4) satisfaite. Soit (Àj)iEJ une famille presque nulle de coef-
ficients telle que LiEJ ÀjVj = O. Alors le vecteur nul est combinaison linéaire des Vj. D'après
la condition 4), cette écriture est unique. Comme 0 = LiEJ0 · Vj, la famille nulle convient et
donc Àj = 0 pour tout j E J. ■
Jusqu'ici, pour montrer qu'un espace vectoriel est de dimension infinie, nous ne disposons que
de la définition : il faut montrer que toute famille génératrice est infinie. Ce n'est pas une mé-
thode facile parce qu'il faut envisager toutes les familles génératrices possibles et celles-ci sont
infiniment nombreuses. Nous allons voir dans cette partie qu'il est possible de remplacer cette
définition par un critère beaucoup plus simple. Un espace vectoriel est en effet de dimension
finie si et seulement s'il possède une famille libre infinie. Il suffit donc d'exhiber au moins une
telle famille pour montrer que l'espace est de dimension infini.
Ce sera pour nous l'occasion de revoir succintement les opérations élémentaires sur les
familles que nous avons étudiées dans ocn. Leur généralisation aux espaces vectoriels quel-
conques est immédiate et nous renvoyons le lecteur à la preuve du lemme 15.15 pour tous les
détails.
tëriime 1s.15~; · ·
Soientv € E~ (vjheJ unef11,mil!e de vecteurs de E et fixons un indice k € f.
Remphleer un générateur; ·
Si:11.s'~rii com1neu'lte i:oml;~on l~ire des Vi ~pec un coe,fficient d'irulice. k non
}• :~,; itlory~•Pf!ttt~~}<i flê1;tew'vir.··•~.Y.sims fi]frtct~lë sôtis~~ tJéet(Jrlel
engendré iô,r:Îilfamüle{
. .. . .
Additionner à un générateur une combinaison linéaire des àutres.
Si ~n,11,dditùmn: avk une com,bin~isonJinéaire dep autres vecteûrs de la famille (v,heJ,
t:ela ne ého,1Jg(tpas·le~o~esp<iœ Vllcloriel'engeooré.··
0
Avant d'aborder la question des espaces de dimension infinie, rappelons quelques notions
sur les cardinaux. 1 Un ensemble J est fini si J = 0 ou s'il existe un entier n E N* et une
bijection {j E N 11 ~ j ~ n} --t J. Dans ce cas, cet entier est unique, on l'appelle le cardinal
de J et on le note card J = n. Autrement dit, chaque ensemble fini est en bijection avec un
unique ensemble «modèle», de la forme {j E N 1 ~ j ~ n} pour J -/- 0. Dans le cas des
1
ensembles infinis, nous pourrions aussi bâtir une liste d'ensembles modèles pour classer tous
les ensembles à bijection près, mais ce serait aller beaucoup trop loin dans le formalisme de
la théorie dites des ordinaux. Bien plus modestement, nous nous contenterons d'écrire que
card J = oo si J n'est pas fini .
Pl'()positj9n ÎSrÎI!· SQit J:\lt}Ji;J y~/0:mille libre <le t1it~ùr;s de !- et.{tt,e)~1, ~11,ef<1'fT!;ilJe
générutri~. AlorB eardJ ~ carciL . . . . . . ..
PREUVE. Si card l = oo alors il n'y a rien à démontrer. Nous traitons donc seulement le cas
où E possède une famille génératrice finie (u 1, ... , Uql, c'est-à-dire le cas où E est de dimension
finie. Supposons par l'absurde que card J > q. Alors la famille (vj)jEJ contient une sous-famille
libre (v1, ... , Vq+l ). Exactement comme dans la preuve de la proposition 15.16, page 397, on
utilise le lemme 18.15 pour remplacer l'un après l'autre les vecteurs de la famille génératrice
par des vecteurs de la famille libre. À la fin du processus, on obtient une famille génératrice de
vecteurs pris dans la famille libre, autrement dit de la forme (v 1, ... , vq), quitte à réindexer
la famille. C'est impossible car le dernier vecteur Vq+l serait une combinaison linéaire des
vecteurs v 1 , ••• , Vq. ■
PREUVE.
( {=) Si un espace vectoriel possède une partie libre infinie, alors d'après la proposition 18.16,
il n'existe pas de famille génératrice finie. Donc l'espace est bien de dimension infinie.
( ==}) Soit E un espace vectoriel de dimension infinie. Nous allons définir par récurrence une
suite Vo, V1, v2, ... de vecteurs de E comme suit.
► Comme E est de dimension infinie, on a E-/- {O} et on choisit pour v 0 un vecteur arbitraire
non nul.
► Soit k E N. Supposons que nous avons déjà choisi les vecteurs v 0 , ••• , vk. Ces vecteurs
n'engendrent pas E, qui est de dimension infinie. Alors on choisit arbitrairement vk+ 1 E E \
vect{vi 11 ~ j ~ k}.
1
Pour plus de précision, voir le chapitre 8 sur le dénombrement.
485
D'après la quatrième opération décrite dans le lemme 18.15, on obtient ainsi pour tout k EN
une famille (v 0 , ... , vk) libre. La famille infinie 2 (viliEN est libre. ■
i'.l
~
Cœ:olhûm 18~18. cxi
.....
'foût §~~ésp<i&e'ieètorlèl d'ûn ~'spad fliêti>rteîde:.dimet&à:wn fime es'i"dê dimensi<:m fi,nte. ..d
ü
Dans JKN notons C le sous-espace vectoriel des suites convergentes, Co celui des suites
convergentes avec limite nulle et S celui des suites stationnaires, c'est-à-dire constantes à
partir d'un certain rang. Or, dans JK(NJ, nous connaissons la famille libre infinie
Donc ][((NJ est de dimension infinie. Comme nous avons les inclusions
et comme de plus JKN ':::'. JK[[X]] et JK(NJ ':::'. JK[Xl, nous en déduisons la liste suivante d'espaces
vectoriels de dimension infinie.
2 Pour construire chaque famille finie (vo, ... , vk), nous avons dû faire un nombre fini de choix. Pour « emboî-
ter » toutes ces familles en une famille infinie (v 0 , ... , vk, ... ), il faut donc opérer une infinité dénombrable
de choix. Le passage dans cette construction des familles finies arbitrairement grande à la famille infinie est
en fait un point délicat, bien que correct si on dispose de l'axiome du choix de la théorie des ensembles, que
nous n'exposerons pas dans ce livre.
486
Il
Il.2. Bases et dimension
~
.
Il)
•Il)
Nous allons établir que tout espace vectoriel admet une base. Ce fait repose sur le résultat
;§ classiquement connu sous le nom du théorème de la base incomplète et sera la clef de voûte de
.
Il)
.c
,Il)
la classification des espaces vectoriels de dimension finie. Il est à noter que, même en dimension
finie, extraire une base d'une famille génératrice n'est pas complètement évident.
'01)
< Le cas de la dimension infinie est très similaire à celui de la dimension finie mais le trai-
- tement de l'infini requiert plus de technicité dans le maniement de la théorie des ensembles
~
que nous avons pris le parti de ne pas exposer dans ce cours de première année. Aussi, bien
11. que le résultat soit valable pour tous les espaces vectoriels, nous limiterons la démonstration
de l'existence d'une base (théorème 18.22) au cas des espaces de dimension finie.
Par famille génératrice minimale, nous entendons une famille génératrice {viliEJ de E telle
que, pour tout € E J, la famille «diminuée» (vj)jEJ\{f} n'est pas génératrice de E. Par famille
libre maximale, nous entendons une famille libre {viliEJ telle que pour tout v E E, la famille
«augmentée» (viliEJ U {v} est liée.
Propositwn~di,finition 18.21.
Soit éA = (bf)ièJ une famille dans E,. Les propriétés suivantes !JO~ .élf,d.110,},ent~ .:
1) ·!JB est lilrre et génémtnœ âe E ;
2) T<JUt vect~ur ~e Ese déœ~JX>$e ên ~e 11,niqtie mmbi~n(i~ aè~; ·
3} ~ est une famille libre ma:rimalé; . . . . .. . . . ...
4) éA .est.'!!,nt partie génfmtrice minimale;
Si Èllf vérifie ces propriétés, ord'appelle ùne: basé de E.
PREUVE.
Définition 18.23. Soit E un espace vectoriel et !JlJ = (biliEJ une base de E. On appelle
dimension de E le cardinal de J et on le note dim E cardJ. C'est donc un élément de
NU {oo}, indépendant du choix de la base !Jll.
La notion de dimension formalise l'intuition que nous avons d'un nombre de degrés de liberté.
Avec de l'habitude, on peut deviner la dimension d'un espace donné avant de chercher à la
calculer : il s'agit d'appréhender le nombre minimal de paramètres nécessaires pour décrire
une position quelconque d'un élément de l'espace.
1 1
EXEMPLE 18.25. A
1
1
1
1
f(x) = {ax+ b
si -1::;; X< 0,
ex+ b si O ~X::;; 1 .
On retrouve que trois paramètres sont nécessaires pour décrire cette fonction. En fait, on
montre alors facilement que les trois fonctions f1, fz et f3 définies par
si -1 ::;;x<0, si-1::;;x<0,
s1 0~x~l, si 0 ::;; X ::;; 1 ,
forment une base de F et que les coefficients qui figurent dans la définition de f sont donnés
par la décomposition f = af1 + bf2 + ch
PREUVE.
1) Si E est de dimension infinie, alors il n'y a rien à prouver. Considérons donc le cas où
n = dimE < oo. D'après le corollaire 18.18, la dimension du sous-espace Fest également finie.
Alors il existe une base de F formée de p vecteurs, avec p = dimF. Cette base de F est une
famille libre de E. D'après le point 3) du corollaire 18.24, on a donc p ~ n.
2) Si dimF = dimE = n, il existe une base de F formée den vecteurs. D'après le point 4) du
corollaire 18.24, c'est aussi une base de E, d'où F = E. ■
Une base canonique d'un espace vectoriel E est une base que l'on estime naturellement asso-
ciée à sa structure d'espace vectoriel. C'est une base que l'on choisit de privilégier. Comme
nous avons déjà eu l'occasion de le mentionner, il n'y a pas de définition universelle du mot
«canonique» en mathématiques. C'est une affaire de convention.
A contrario, il existe des espaces qui n'ont pas de base canonique. Ce sont ceux pour
lesquels il n'existe pas de procédé pour construire algorithmiquement la moindre base. Ce
sont donc en particulier des espaces de dimension infinie. Il y a en effet une grande différence
entre démontrer qu'une base existe toujours et en construire explicitement une. Par exemple,
il n'est pas possible d'expliciter une base pour les espaces vectoriels ][(N, ][(IK et 'i&'k(I) où I est
un interval non trivial de IR et k E NU {oo}. Dans cette partie, nous allons passer en revue
quelques espaces dont il est bon, pour sa culture générale, de connaître les bases canoniques.
o ocn possède la base naturelle
e0 =(1,0,0, ... ,0) e1 = (0, 1,0, ... ,0) en= (0,0,0, ... , 1).
490
l>o=(l,0,0,0, ... )
ÔJ = (0, 1,0,0, ... )
1>2=(0,0,1,0, ... )
◊ Montrons que l'espace J[(Ol où J est un ensemble arbitraire, possède également une base
naturelle.
Pour cela rappelons le symbole de Kronecker défini par la formule
ô -{1
if -
sij=f,
0 si j-=/- f
Pour tout j E J, la famille ôj = (ôitltEJ peut donc aussi être vue comme la fonction Ôj : J --,
OC, f H Ôjf qui prend la valeur 1 en j et qui est nulle partout ailleurs.
Proposition 18.28. L'espace Km des- familles presque nulles a pour base (h;heJ · E~ parti-
culier dimJKŒ = card f.
PREUVE.
► Montrons d'abord que (l>iliEJ est libre. Soit (Àj)jEJ une famille de scalaires presque nulle
telle que LiEJ Àiôi = O. C'est une identité de fonctions que nous pouvons évaluer en un point
f E J arbitraire, ce qui donne les relations
Tous les coefficients Àt sont nuls, ce qui montre bien que ( Ôj) iE J est libre.
► Montrons que {ôi I j E J} est une partie génératrice. Soit f E ocm. Notons S le support de
f. Alors S est fini et
Comme cette dernière relation est vraie pour tout f, nous obtenons l'égalité des fonctions
f = LiES f(j)l\i, ce qui démontre bien que {ôi I j E J} est génératrice. ■
Remarque. Évidemment, on décide que la base (&rliEJ est une base canonique. Pour J=
{1, ... , n} (resp. J = N) on retrouve la base naturelle de ocn (resp. ][((Nl).
491
-
cxi
.d
(.)
Pour décrire la position d'un vecteur de plan, il suffit de fixer un repère constitué de deux
vecteurs non colinéaires, puis d'identifier tous les vecteurs du plan aux couples de coordonnées
dans JR'. 2 à l'aide de la décomposition dans cette base. Ce procédé se généralise à tout espace
vectoriel de dimension quelconque et conduit à la notion de système de coordonnées.
De plus, comme nous l'avons vu, les bases canoniques sont très rares. Ainsi il est presque
inévitable qu'en de multiples occasions nous choisissions diverses bases pour un même espace
vectoriel. Or pour deux choix de base donnés, les coordonnées d'un vecteur fixé seront en gé-
néral différentes. Il nous faudra donc apprendre à faire le passage d'un système de coordonnées
à l'autre.
Pour fixer les idées, nous commençons par considérer les espaces vectoriels de dimension finie.
L'idée sous-jacente à cette partie est qu'il existe toujours suffisamment de fonctions linéaires
sur un espace vectoriel pour distinguer chacun des vecteurs. Pour un espace de dimension n,
nous allons voir qu'il suffit de n fonctions bien choisies pour distinguer chacun des vecteurs.
Définition 18.29. Soit E un espace vectoriel de dimension n et soit pg = (b 1 , ... , bn) une
base de E. Alors l'application linéaire
<D.@ : ocn-) E' (i\,, ... ,i\n) H i\,b, + ... + Ànbn.
est un isomorphisme d'espaces vectoriels. Si on décompose un vecteur sous la forme v =
.[_~1 i\ibi,
alors les coefficients i\i sont appelés les coordonnées de v dans la base /!g_ L'iso-
mophisme réciproque <D .sW = (<D.@')- 1 défini par
n
<D,@' : E-) ocn, VH (i\,, ... ,i\n) tel que V= L i\kbk
k=l
est appelé un système de coordonnées associé à la base /!g. On peut le voir comme un n-uplet
<D.@ = ( <p 1, ... , <rnl de fonctions linéaires <ri : E -, 1K pour j = 1, ... , n, appelées fonctions
coordonnées associées à /!g.
Le système de coordonnées associé à /!g envoie donc tout vecteur v E E sur le n-uplet de
ses coordonnées dans la base /!g.
Remarque. Rappelons que les fonctions coordonnées sont linéaires parce que ce sont les
composantes d'une application linéaire à valeurs dans ocn (voir la question-test 17.17). Ces
fonctions sont très sensibles au choix de la base : si on change un seul vecteur d'une base il se
peut que toutes les fonctions coordonnées changent, comme le montre l'exemple ci-dessous.
492
b1 b1
le vecteur v a pour coordonnées ( 1, 1) . le vecteur v a pour coordonnées (3, 0).
Proposition 18.30. Deux espaces vectoriels de dimensions finies sont. isomorphes si. et
seulement s'ils ont m~e dimension.
PREUVE.
Soient E, E' deux OC-espaces vectoriels de dimensions net m respectivement.
( ==}) Si n = m, alors on a deux isomorphismes E é:-:é ocn et E' é:-:é ocn (via des systèmes de
coordonnées), donc E é:-:é E'.
( ==}) S'il existe un isomorphisme f : E -2t E', alors l'image par f d'une base de E est une base
de E'. Donc les deux espaces ont la même dimension. ■
La démonstration de la proposition 18.30 peut s'interpréter comme suit. Nous avons étudié
au chapitre 15 une liste d'espaces vectoriels
IK, IK2 , ... , ocn, ...
Or, tout espace vectoriel de dimension finie est isomorphe à un unique élément dans cette
liste. Autrement dit, à chaque entier n ;;?; 1 correspond un unique espace vectoriel ocn, et à
chaque espace vectoriel E de dimension finie correspond un unique entier n tel que E soit
isomorphe à ocn. La liste des espaces canoniques est une classification des espaces vectoriels
de dimension finie. Il est très remarquable d'avoir ainsi pu mettre en correspondance un objet
infini et «continu», tel qu'un espace vectoriel, avec un objet fini et discret, sa dimension.
Toutefois, comme nous l'avons déjà évoqué en introduction du chapitre 17, ce serait une
erreur de vouloir faire de l'algèbre linéaire uniquement sur ocn, même en dimension finie. En
voici quelques raisons supplémentaires.
◊ Raison naturelle. L'isomorphisme <I>a1 entre E et ocn n'est pas naturel, il dépend du choix
de la base /1' dans E. En général il n'y a pas de base naturelle donc pas de choix naturel.
◊ Raison nominale. En identifiant tout espace de dimension finie avec l'espace canonique on
perdrait vite le contact avec la question posée. Les objets mathématiques portent des noms et
sont notés d'une certaine façon, ce qui n'est pas anodin dans notre manière de les penser. Par
exemple, l'espace engendré par les colonnes d'une matrice a la même dimension que l'espace
engendré par ses lignes. Donc les deux sont isomorphes. Or il serait complètement absurde
d'identifier ces deux espaces.
◊ Raison efficiente. Passer en coordonnées signifie en général que l'on va faire des calculs,
avec toujours une possibilité d'erreur et le risque de perdre le fil de ce que l'on souhaite prouver.
Nous savons par expérience que beaucoup de problèmes de géométrie ont des solutions courtes
et élégantes sans calcul en coordonnées. Il faut garder le passage en coordonnées comme une
roue de secours quand on a plus d'idée.
493
EXEMPLE 18.32. Soit l'espace vectoriel E = {(x 1, x2, X3) E JR. 3 X1 - 2x2 + 4x3
1 = O}. Dans
l'exemple 15.24, nous avons exhibé deux bases de E,
Chaque système de coordonnées définit un isomorphisme E _:::, JR. 2 . Les formules pour les
fonctions coordonnées sont
et
Soit E un espace vectoriel (de dimension arbitraire) et soit ff.l = (bi )jEJ une base de E. Le
système de coordonnées associé à la base ff.l est l'isomorphisme réciproque <D /Jè E --+ JKOl
de l'isomorphisme
<D/]è : JKOl --+ E, (Àj)jEJ H .L.
Àjbj.
jEJ
494
Le système de coordonnées <DaJ est donc une famille ( <rïljEJ de fonctions de E dans OC., les
fonctions coordonnées associées à la base !JIJ. Comme en dimension finie, ces fonctions sont
caractérisées par les deux propriétés équivalentes
a) Vv E E, v = L, cpi(v)bi ,
jEJ
b) Vj E J, <ri est linéaire et V€ E J,
--
EXEMPLE 18.33. Soit !JiJ = (Xi)iEN la base naturelle de OC.[X]. Alors le système de coor-
données <D 86 est un isomorphisme qui, à un polynôme, associe la suite quasi nulle de ses
coefficients.
<DM : JK.[X] ----+ oc_(Nl, P=L_aiXi H (aj}jEN•
jEN
La fonction coordonnée <ri envoie un polynôme sur son coefficient d'ordre j.
est le vecteur bk de la « nouvelle » base exprùmé ·en coordonnées dans l '« ancienne » base fJlJ. ~
o::i
Autrement dit3
(J:) = tcfflffl'( J). (18.1)
....00
a
Soit v E E un vecteur et soient x1, .•. , Xn. ses coordonnées dans la base fJlJ et soient x1, ... , x:.
celles dans fJlJ'. Alors
(18.8)
Remarque. L'usage de la terminologie « ancienne base » pour fJlJ et « nouvelle base » pour
est très commode pour apprendre ces formules. On retiendra les deux propriétés suivantes
!li)'
des matrices de passage.
- Les colonnes de la matrice de passage sont les vecteurs de la nouvelle base écrits en
coordonnées selon l'ancienne base.
- La multiplication par la matrice de passage exprime les anciennes coordonnées en fonction
des nouvelles.
Remarquons le chiasme : la matrice de passage permet d'exprimer les vecteurs de la nou-
velle base en fonction de ceux de l'ancienne, mais elle permet d'exprimer les anciennes coor-
données en fonction des nouvelles. C'est à rapprocher du problème de changement d'heure
effectués dans beaucoup de pays européens deux fois par an : si par exemple on passe directe-
ment de 3h à 4h du matin, ou bien on considère que l'on a avancé les aiguilles de la montre
d'une heure (point de vue des coordonnées), ou bien on considère que le minuit de l'ancien
temps a lieu une heure plus tard que le minuit du nouveau temps (point de vue du choix de
l'origine, c'est-à-dire de la base). Le mélange des deux points de vue est source de bien des
confusions. Il faut faire très attention.
et
b;=½b1-½b2
On a le système entre vecteurs
{
b~ = ½b1 + ½b2.
On transpose la matrice de ce système et on obtient la matrice de passage de fJlJ à !llJ',
c~.@' = ; ( ~ 1 ~) .
Notons x et y les coordonnées associées à fJlJ (coordonnées naturelles) et x' et y' les coor-
données associées à !llJ'. Pour les coordonnées on a donc le système
X= ½x'+½y'
{
li= -½x' + ½11'
3
Il s'agit d'un système den équations entre vecteurs (et non entre scalaires!). Le produit d'une matrice avec
un élément de En est défini de manière analogue au produit d'une matrice avec un élément de IKn.
496
qui permet de traduire toute équation avec les «anciennes» coordonnées x, 11 en une équation
avec les «nouvelles» coordonnées x', 11'- Remplaçons par exemple les «nouvelles» coor-
données dans l'équation de l'hyperbole x 2 - 11 2 = 1 .
'' 1
'' 1
1
'' 1
'' b2
''
''
''
X
Dans les deux systèmes d'équations l'hyperbole possède deux équations différentes. On
notera que l'hyperbole reste la même et que c'est le système de coordonnée qui change. Cette
situation est à distinguer du cas où on envoie l'hyperbole H sur une autre hyperbole f(H) par
un automorphisme f du plan, le système de coordonnées restant le même; la question qui
se pose alors est savoir comment on déduit, toujours dans le même système de coordonnées,
l'équation de f(H) de l'équation de H (voir l'exercice 18.14 pour la réponse).
Nous identifions ici la matrice C~~, avec son application linéaire. D'après la formule (18.8),
on a <I>~ = CfiB!iB' o <I>fiB'· Cela signifie que dans le diagramme ci-dessus, si on part du nord,
nous pouvons aller directement vers le sud-ouest ou bien faire le détour par le sud-est, mais
le résultat sera le même. On dit que le diagramme est commutatif
Ces diagrammes sont très utiles pour garder une vue d'ensemble des divers changements de
base que nous considérerons. Par exemple, avec trois bases 8ll, 8ll', et 8ll" de E, les changements
de base possibles sont représentés par le diagramme suivant.
497
j
00
....
6
Comme chacun des trois petits triangles commute, le grand triangle commute aussi. On déduit
que C$$' C$'$" = C$$". Si on prend en particulier !!li= !!li" on trouve C$$' C$'$ = C$$ ;
or la matrice de passage de !!li à elle-même est certainement la matrice unité.Cela prouve la
relation de Chasles suivante, à rapprocher par exemple de celle bien connue des vecteurs du
plan (BB' +WB"= 8"13).
Règle 18.36. Toutes !!li, !!li' et !!li"· de E vérifient les propriétés suivantes.
1) C111grCM'•" = C••"·
2) La matrice de passage c••, est inversible et ( c:~•' )- 1
= C111'M·
Test 18.30. Test 18.33.
Considérons l'exemple 18.35. Soient ( (1)1, cpz) et ( cp 1, cp 2) les systèmes de co-
a. Donner la matrice de passage de :JIJ' à :JIJ. ordonnées d'un même espace vectoriel, associés
à deux bases (b1, bz) et (b 1,b 2) respectivement.
b. Soit v = (3, -2) E JRZ. Quelles sont les coor-
On suppose que
données de v dans la base :J1J ? Et dans la base
:JIJ'?
Test 18.31.
Toute matrice de passage est-elle carrée ? Toute Parmi les systèmes suivants, trouvez les intrus !
matrice de passage est-elle inversible ? Toute
matrice inversible est-elle une matrice de pas- cp 1= 3cp1 + 2cpz (/)] = 3cp, + 7cp 2
{ <pz= 7cp1 +Scpz { cpz = 2cp + Scp
sage? 1 2
Test 18.32.
b1 = Sb 1- 2b 2 cp 1= Scp1 - 7cpz
Soit C$$' = (Yrkl une matrice de passage. Que { bz = -7b 1+ 3b 2 { (/)z = -2cp1 + 3cpz
pensez-vous de ces assertions?
a. 'Yik = cpf(bkl, d. 'Yik = cpl'.{b~), b1 = 5b 1+ 2b 2 (/)] = 3cp, + 2cpz
{ bz = 7b 1+3b 2 { cpz = 7cp 1+5cp 2
b. 'Yik = cpUbr), e. 'Yik = cpk(bf).
c. Y ik = <p f{b0 ,
Proposition 18.37.
Soit f : E -'-+ F une application linéaire. Alors les propriétés suivantes sont équivalentes :
1) f est injective;
2) pour toute famille libre (v;);eJ dans E, la famille (f(v;) heJ est libre;
-
::::: 3) pour toute base (b;)jeJ de E, la famille (f(b;));er est libre;
4) il existe une base {biheJ de E telle que la famille {f(biJl;er est libre.
PREUVE.
1) =} 2). Soit f injective et soit (vj)iEJ libre dans E. Pour montrer que la famille (f(vj))jEJ est
libre, soit LiEJ Àjf(vi) = 0, avec une famille presque nulle de coefficients (Ài)iEJ E ocm. Alors
f(LiEJÀivi) = LiEJÀif(vi) = 0, donc par injectivité de f, on a LiEJÀivi = 0, d'où Àj = 0
pour tout j E J.
2) =} 3). Toute base est libre.
3) =} 4). Tout espace vectoriel possède une base.
4) =} 1). Soit v E Ker (f). Nous décomposons v dans la base (viliEJ fournie par l'hypothèse 4),
v = LiEJÀibi. Alors LiEJÀif(bj) = f (LiEJÀibi) = f(v) = 0. Par hypothèse (f(bj))iEJ est
libre, d'où Àj = 0 pour tout j E J. On conclut que v = 0, donc le noyau de f est nul. ■
De la même manière que les applications linéaires injectives sont adaptées aux familles
libres, les applications linéaires surjectives le sont aux familles génératrices.
Proposition 18.38. .. . .
Soit f : E ~ F une application linéaire. Alors les propriétés suivantes ·sonté<jrJ:ivalentes :
1) f est surjecti'fle ;
2) pour toutefamille génératrice (vihëJ de Ela famille (f(v1)heJ est génératrice de F;
3) pour toute base (b;heJ de E la famille (f(b;)he, est génératrice de f; .
4) il existe une base O>;}ieJ de 1:. telle que (f(bj)}iEJ est génératrice de F;
5) il existe une famille génératrice (vj);er de E telle ~ue (f(v;HieJ est génératrice de F.
PREUVE.
1) =} 2). Soit f surjective et soit (vj)iEJ une famille génératrice de E. Montrons que la famille
(f(vïlliEJ est génératrice de F. Soit u E F arbitraire. Alors il existe v E Etel que u = f(v). On
écrit v = LiEJ ÀjVi avec une famille presque nulle de coefficients. Alors
u = f(v) = f (LiEJÀivi) = LiEJÀif(vj).
2) =} 3). Toute base est génératrice.
3) =} 4). Tout espace vectoriel possède une base.
4) =} 5). Toute base est génératrice.
5) =} 1). Soit (viliEJ une famille génératrice de E telle que (f(vj))iEJ est génératrice de F. Soit
u E F. Nous pouvons écrire u comme combinaison linéaire de la forme u = LiEJÀif(vi)·
Posons v = LjEJÀivi E E. Alors on a f(v) = f (LiEJÀivi) = LiEJÀif(vi) = u ce qui montre
la surjectivité de f. ■
Prop0$itio:n 18;3'9.
Soit f: E.-4 F•une application linéaire. Alors les propriétés suivttntes·sont équi11alentes ..-: (/J
Q,)
11.4.2. Définir une application linéaire par les images d'une base
Il est possible de construire une application linéaire en prescrivant dans l'espace d'arrivée
l'image de chacun des vecteurs d'une base choisie dans l'espace de départ.
Prtlposition 18.40. Soient f;g àtlns 2(E, f) fPôit tvj)jEJ .uneJam:i,lle g'énémtrif,è 1e t.;
Alors f.= g F} f(v1) ~ g(vj) pour toùt fE J. · ·· ··
Autrement. dit, une application linéaire est déterminée par_les images de générateurs.
PREUVE.
(===}) Immédiat par définition.
({c=) Soit w un vecteur arbitraire de E. Il s'écrit comme combinaison linéaire w = LjEJÀivi
avec une famille presque nulle de coefficients. Alors
f(w) =f (.L.
jEJ
Àjvi) = .L. À/(vj) = .L. Àjg(vj) = g (.L. Àjvi) = g(w),
jEJ jEJ jEJ
ce qui montre que f = g. ■
Remarque. La proposition 18.40 n'affirme pas que l'on peut définir une application linéaire
f par la prescription des images des générateurs. Par exemple, on ne peut pas demander
simultanément que f(v) = u et f(2v) = u pour v et u fixés non nuls. La proposition dit
seulement que si les valeurs d'une application linéaire sont connues sur une partie génératrice,
alors elle est entièrement déterminée.
ProP9Sition 18.41. ..
Soient (b1heJ une base de E et (UjheJ une JamîUe arbitraïré dans f; Alors il existe une unique
application linéaire f : E -4 F telle que pour tout j E J ·
f(bi}=Uj.
Autrement dit, une application linéaire est définie -par les tràleurs qu'elle prend sur une base.
PREUVE.
► Unicité : c'est une conséquence de la proposition 18.40.
► Existence : Posons
f(v) = L
cpi(v)ui
jEJ
où ( cpilîeJ est le système de coordonnées associé à la base (bj)jEJ· Vérifions que f satisfait les
conditions demandées. Grâce à la propriété (18.4, page 493) des fonctions coordonnées,
La linéarité de f découle de celle des fonctions coordonnées. En effet pour tous (v, w) E E2 et
À E OC, on a
= L <Pi(v)ui + ÀL <Pi(w)ui
jEJ jEJ
=f(u) +M(v).
■
Nous allons définir une notion de rang sur les applications linéaires et étudier ses principales
propriétés. En particulier, toute matrice, élément de Atmn(!K) canoniquement isomorphe à un
élément de 2"(:IKn, ocm), héritera d'une nouvelle notion de rang. Comme il existait déjà une
notion de rang sur les matrices, nous allons vérifier la compatibilité des définitions.
Le rang d'une application linéaire f : E -, F est la dimension de son image, soit encore
Règle 18.43.
1) Si f:.E ~ f es,tlinmire injective, al(.)Ts dimE ~ dimf.
!1) Si .f : f. ~- f est linéairè surjectwe, alors dimE -~ dimf .
PrQpoaitiOll 18.45. Le ro,ng d'une matrice A E J(m.tl,.f)Kfèst égal à:u rung dèfappliêati(ln
linéaire A.: Kn ---, K.11\ x H Ax. · ·
PREUVE. Pour être plus clair dans la preuve nous réutilisons (provisoirement) la notation Â
pour l'application induite par la matrice A. Si on écrit la matrice A E .4tmn0K) en colonnes,
A= (C,, ... , Cn), alors
Théorème 18.46. (Théorème du rang dans 2(JKn ,.:WO)} &nt A E .Amn.(KJ. ·Alors
n:;::: ditnKer A+ rg (A). ·
PREUVE. Nous allons déduire cette proposition de la théorie des systèmes linéaires (voir
chapitre 16). Comme le système Ax = 0 a toujours au moins une solution, la solution nulle
x = 0, la proposition 16.40, page 430, montre que l'espace des solutions est de dimension
n - rg (A). Mais cet espace des solution est aussi le noyau de l'application A : ocn ---, ocm.
L'identité annoncée en découle immédiatement. ■
502
4
C'est-à-dire obéissant à une sorte de relation de Chasles.
503
Les systèmes de coordonnées <l>~ est un isomorphisme entre E et ocn. De même <l>~, est un ~
Ill
isomorphisme entre F et ocm. Cela permet de « transporter » une application linéaire f : E --, F
cxi
vers l'application linéaire entre ocn et ocm, ,-(
6
Or, nous avons identifié les applications linéaires entre espaces canoniques avec les matrices.
La correspondan ce f H <l>~, of o <I>_;;/ permet donc d'identifier 2'(E, F) et -4'mn(OC).
Définition 18.48. La matrice de f E 2'(E, F) dans les bases /jg et Çg' est l'unique matrice 1
A E -4'mn(OC) qui définit la même application linéaire dans 2'(0Cn, ocm) que <l> ~, of o <1>.i •
On la note A= M~,~(f).
Autrement dit, la matrice de f est l'unique matrice qui rend commutatif le diagramme suivant.
E f F (18.13)
~@ t t ~@'
Cette présentation est très satisfaisante pour l'esprit mais n'est peut-être pas des plus parlantes
au premier abord. Voici ce qu'elle signifie en pratique.
Rêgle 18.49.
l} La k-ième·eol<1nne âe la matri.œ M~•s,(f} est le mAtplet des COl11dmmées dé f(bi.J dans
là base Çg';
2) Bi x1 1 •••• , ~ _sont{es ctJOrdonnéesdev E E dans la base di et si.y1, .•• t.1Jm s.ontcelles
1
de f{v). darts la: btise $ , alojs . _ _
•. .~,f111}< ._ •· ("l'
: ;.~M$ x~r· 1
i(f}
PREUVE.
1) L'application <l>~, étant inversible, nous pouvons emprunter dans le diagramme commu-
tatif (18.13) deux chemins différents de ocn à ocm.
Suivons le vecteur ek de la base naturelle de ocn, faisons-le d'abord par le chemin du haut.
Ce chemin mène donc à <l>~,(f(bk)) qui n'est autre que le m-uplet de coordonnées de f(bk)
dans la base Çg'.
Maintenant, suivons le chemin direct
504
Cette règle fait étrangement penser aux propriétés de matrices de passage de la règle 18.34.
Cela n'est bien sûr pas un hasard.
Règle 18.50.
- Soient E un espace vectoriel de dimension finie et fjlJ et fJIJ' deux bases de E. On note id1:.
E """7 E l'application identité. Alors · ·
(18.14}
PREUVE. En effet, la k-ième colonne de M!liJ!liJ'(idE) donne par définition les coordonnées du
k-ième vecteur bt = idE(bU de !!,6 1 , exprimé dans la base !!,è, et on retrouve exactement la
définition de la matrice de passage de !!,è à !!,è'. ■
Attt:.•11t iun à l'ordre des bases dans les règles 18.49 et 18.50
La matrice MM~,(idE) est la matrice de passage de !!,è à !!,è'. Elle exprime les coordonnées
des vecteurs de la nouvelle base !!,è' dans l'ancienne base !!,è.
Nous arrivons au résultat principal de cette partie. Il exprime comment la matrice d'une
application linéaire est modifiée en cas de changement de bases. Ce résultat se retient très
facilement si on veut bien se rappeler que les formules de composition et de passages sont des
relations de Chasles.
Théorème 18.51.
1) L'application Ma,a 2(E, F) """7 Al=(JK), f i-t Ma•M(f) est un iso;,,iorphisme
qui conseroe le rang.
2) Pour tout g E 2(F, G} où G est un espace vectoriel de:base lll"; on a
L'application M[JJ induit un isomorphisme de groupes entre les groupes linéaires Gl(E) et
Gl(n,K). En particulier pour tout f E GL(E} on a M[JJ(f-1 ) = Ma(f)- 1 •
505
PREUVE.
rJJ
1
1) Par définition on a Mal''al'(f) = <Dai'' of o <I>i . La linéarité découle donc de celle de <Dai'',
<1)
gi
par exemple pour l'addition
'°
-
00
d
1
De plus, l'applicatio n f H Mal''al'( f) = <I> al'' of o <I>i est bijective et d'inverse l'applicatio n
définie par A H <I>i , o A o <I>.'Jl'. Comme le rang de la matrice Mal''al'(f) est aussi le rang
1
de l'applicatio n linéaire <Dai'' o f o <I>i (proposition 18.45) et que la composition par des
1
Les circuits intérieurs sont commutati fs, donc le grand circuit triangulair e extérieur l'est aussi.
Cela démontre la formule exposée. Si le lecteur est plus à l'aise avec les calculs, il préférera la
preuve suivante. Notons Mal''al'(f) = (cxkj) et Mal'"al''(g) = (f3ekl- Alors pour tout vecteur bi
de la base canonique de Kn, on a
Cela signifie que l'élément d'indice (C, j) de la matrice Mal'"al'(g of) est Lk f3ekCXkj. C'est
donc exactemen t le produit matriciel Mal'"al'(g of) = Mal'"al''(g) Mal''al'(f).
3) Rappelons que Cal'.<11 = Mal'.<11(idE) et utilisons la formule de composition prouvée au
point 2).
4) Le fait que Mas soit un morphisme d'algèbre découle des points 1) et 2) avec Çg' = f!g et
du fait que la matrice de l'applicatio n identité dans une base donnée est toujours la matrice
identité. La formule de passage est une conséquence de 3) et le reste de l'assertion est vrai pour
tout isomorphisme d'algèbres, les groupes linéaires étant les groupes des éléments inversibles
des algèbres considérées.
■
506
Remarque. Si dans le théorème, on prend E = ocn et F = ocm et si !JiJ, !JiJ' sont les
bases naturelles de ces espaces, alors l'isomorphisme est précisément l'identification entre
.Y(lKn, lKm) et Atmn(lK) que nous avons déjà rencontrée.
Chaque énoncé sur les applications linéaires a donc une traduction en terme de matrices.
Ainsi le théorème 18.46 du rang se traduit sur les applications linéaires f : E 4 F en prenant
pour A la matrice de f dans des bases choisies. Pour que cette écriture matricielle soit possible,
-:::: nous exigeons que E soit de dimension finie. La dimension de l'espace d'arrivée F n'a pas
d'importance : si F est de dimension infinie on le remplacera par f(E), qui est de dimension
finie. Nous obtenons donc le
Dans ce cas l'hypothèse s'écit encore µ 1b;' + • · · + µµb; = O. Comme (b;', ... , b;J est
une famille libre, en tant que base de Ker f, il en résulte que
~ = 0 pour j = 0, ... , p.
Le premier point montre que la famille (b;, · · · , b;, b;', ... , b;) est génératrice de E, le second
point montre qu'elle est libre. Il s'agit donc bien d'une base. Il ne reste qu'à compter les
vecteurs : on an= r + p, avec r = rg (f) et p = dim Kerf, par unicité de la dimension. ■
507
PREUVE.
matrices carrées équivalentes ne sont pas forcément conjuguées. Par exemple, toute matrice
carrée inversible A est équivalente à la matrice identité (prendre l'inverse de A pour C et
l'identité pour C'), mais la seule matrice conjuguée à l'identité est l'identité elle-même.
Par la formule de passage, ces deux notions peuvent s'interpréter en terme de représenta-
tion d'applications linéaires.
- Deux matrices sont équivalentes si et seulement si elles représentent une même application
linéaire avec des bases éventuellement différentes à la source et au but.
- Deux matrices sont conjuguées si et seulement si elles représentent un même endomor-
phisme dans deux bases, chacune prise simultanément comme base de départ et comme
base d'arrivée.
L'un des chapitres importants en deuxième année sera le problème de la réduction d'un
endomorphisme. On entend par là la recherche, pour f E 2(E) donné, d'une base /!.i telle que
la matrice M$(f) soit d'une forme la plus simple possible, par exemple triangulaire et même
diagonale 5 si possible. Évidemment cette base dépendra de l'endomorphisme f.
Dans l'algèbre .4i"nCIK) des matrices, ce problème revient à examiner si, dans une classe
de conjuguaison donnée, il existe une matrice triangulaire (ou encore mieux, diagonale). En
effet, pour une base /!.i quelconque fixée, posons A = M$(f). S'il existe une base f!.i' telle
que A'= M$,(f) est triangulaire alors A et A' sont conjuguées car A'= (C$$' i-1 AC$$'.
Réciproquement s'il existe A' triangulaire et conjuguée à A = M$( f), alors A' = c- 1AC pour
un certain CE Gl(n, IK). Or toute matrice inversible est la matrice d'un changement de base,
donc pour la base !!.i' telle que C = C$$' on a la représentation triangulaire A'= M$,(f).
En deuxième année, nous verrons des critères d'existence de cette réduction en matrice
triangulaire (ou encore mieux, diagonale). Dans la dernière partie de ce chapitre, nous en
donnons un exemple concret élémentaire.
Remarque. La notion de conjugaison existe dans tout anneau.
Supposons maintenant que n = dim E est fini. Alors comme il est isomorphisme à l'espace
des matrices carrées, la dimension de 2(E) est n 2 . Comme la dimension de OC[X] est infinie,
le noyau de evf est non nul. Ainsi tout endomorphisme d'un espace vectoriel de dimension
finie possède un polynôme annulateur.
donc les matrices P(A) et P(A') sont conjuguées. En particulier un polynôme annulateur
d'une matrice annule aussi toute sa classe de conjugaison.
5
On dit alors que l'on a «diagonalisé» l'endomorphisme f.
509
Tes t 18.4 1.
Ma,,(f) le sont dans Mn(IK).
Que pensez-vous des assertions
suivantes?
a. Deux matrices carrées con Tes t 18.4 2.
juguées sont for- ~
cément équivalentes. gj
Si dim E =n et f E .Z(E ), donner o:l
b. Deux matrices sont équival une majora-
tion du plus petit degré des poly
e-
entes si et seule- nômes annula- cri
ment si elles ont le même rang. teurs de f.
c. Si b est un élément inversib
le de l'algèbre A, Tes t 18.4 3.
alors a H b~l ab est un automor
phisme d'al-
gèbres. Soit fun endomorphisme et soit
P un polynôme
d. Soi t~ une base de E. Alors annulateur de f. Montrer que si
f, g dans .Z(E ) P(O) =f O alors f
sont conjugués si et seulement est un automorphisme. ( Indicati
si Ma,,(f) et on : fact oris er
P(f) par f.)
(18.15)
Par définition, les vecteurs v
1 et Vz son t les deu x colonne
par ticu lier , ils son t non nuls. Cel s de la mat rice inversible C. En
a implique que Ker (A - f3kli )
Or le noy au Ker (A - f3kll2) est 2 est non nul pou r k E {1, 2}.
non triv ial si et seulement si
inversible, c'es t-à- dire si et seu la mat rice A - f3[z est non
lem ent si le déte rmi nan t
et
(-p p)
p- p
V2 = 0.
510
Le lecteur vérifiera facilement que AC = CB, ce qui montre bien que A= CBC-1 •
Application.
CU Considérons le problème suivant. On dispose deux verres remplis d'une même quantité de
~
liquide, l'un de vin, l'autre d'eau. On verse une partie du vin dans le verre d'eau. Puis on
reverse la même quantité du mélange obtenu dans le verre de vin, de sorte que les niveaux
de liquide dans les deux verres restent égaux. On itère le procédé en transvasant toujours la
même proportion de liquide.
1) À chaque étape, la proportion de vin dans verre d'eau est-elle plus grande, égale ou plus
petite que la proportion d'eau dans le verre de vin?
2) Quelle est la limite du mélange dans chaque verre lorsque le nombre d'étapes tend vers
l'infini?
Réponses.
1) Les deux proportions sont égales ! On peut raisonner sans calcul : après chaque opération,
la partie de vin dans le verre d'eau prend un certain volume V. Au début du processus, ce
volume V était occupé par de l'eau. Or, nous n'avons pas perdu de liquide. Ainsi ce volume
V est précisément celui de l'eau qui se trouve maintenant dans le verre de vin.
2) On a l'intuition que l'on mélange de mieux en mieux les liquides, c'est-à-dire que les
proportions vont s'approcher de 50%. Nous allons le démontrer en utilisant le calcul matriciel.
Pour n EN, soit
Rappelons que Xn est aussi la proportion de vin dans le verre d'eau. Nous avons donc toujours
Xn + 1:Jn = 1. Évidemment, au départ, Xo = 0 et 1:Jo = 1.
Notons p E]O, 1] la proportion de liquide transvasé. En versant une portion du verre d'eau
dans le verre de vin, nous obtenons
1
1:/n+l = l + p (1:/n + PXn),
Et comme Xn+l + 1:Jn+l = 1, on obtient
1 (1-xn) +p(l -xn) 1
Xn+l = 1 -1:Jn+l = 1 - l +p (1:Jn +PXn) = l +p = l +p (1:/n +PXn).
Xn+l)
( 1:/n+l = 1+ p
1 (1P p)1 (Xn)
1:/n
Xn+l)-
( 1:ln+l - (1 +p)n
An 1 (0) 1
511
Pour calculer les puissances An, le plus simple est d'utiliser la matrice diagonale B conjuguée
àA.
Par conséquent,
converge bien vers ½( l ) car la suite géométrique de raison ~ converge vers zéro. Ainsi les
proportions d'eau et de vin tendent à s'équilibrer dans chaque verre.
IV. EXERCICES
18.6. 18.10.
Soit Fun sous-espace vectoriel d'un espace vec- Pour tout t E R, on pose
toriel E.
1. E\F est-il un sous-espace vectoriel de E ?
2. Montrer que Prouvez que la famille (f tltEJR est libre dans JRlR.
1. Donnez une équation cartésienne ainsi 3. Pour chaque j = 1, ... , 6, donnez des équa-
qu'une écriture paramétrique de O. Dessiner C tions des images q = Aj(C) et o; = Aj(D) du r/J
OUS avons déjà rencontré des exemples de sommes directes sans le savoir. En effet,
N nous savons que tout JK-espace vectoriel E admet une base. En terme de sous-espaces
vectoriels, cela signifie que E contient une famille de droites vectorielles, les droites
engendrées par chaque vecteur de la base, telle que tout vecteur de E se décompose de manière
unique en une somme presque nulle de vecteurs, chacun dans une de ces droites. Nous dirons
que E se décompose en la somme directe de cette famille de droites.
En somme, les droites engendrées par une base constituent des sortes d'« atomes» de
l'espace vectoriel : elles sont indécomposables et leur somme permet de reconstituer l'espace
vectoriel tout entier. Dans certains problèmes, notamment liés à l'étude des applications li-
néaires, on peut souhaiter pouvoir décomposer l'espace en sous-espaces plus gros. Par exemple,
pour un endomosphisme f E .2"(E) donné, il peut être instructif pour étudier f de décomposer
E en une somme directe de sous-espaces Ei tels que f(Ed C Ei, puis d'examiner les restric-
tions de f à chaque Ei, Mais en général, les espaces Ei obtenus ne sont pas de dimension 1.
C'est pourquoi nous allons étudier dans ce chapitre la notion générale de somme directe de
sous-espaces vectoriels.
coupent en général le long d'une droite vectorielle (passant par l'origine). En revanche, deux
droites vectorielles se coupent transversalemen t, à moins d'être confondues, et de même, une
droite et un plan vectoriel se coupent également transversalemen t, à moins que la droite ne
soit contenue dans le plan. Dans les deux cas, la transversalité des deux sous-espaces vectoriels
considérés signifie que leur intersection se réduit à l'espace nul. Le cas du plan et de la droite
est plus intéressant, car tout élément de JR se décompose de manière unique comme somme
3
d'un vecteur de la droite et d'un vecteur du plan : on dit alors que le plan et la droite sont
3 tout ce qui suit, E est un JK-espace vectoriel.
supplémentaires dans JR • Dans
Proposition-définition 19.1.
Soit (fj)JEJ une famille de so'US-espaces 1Jectoriels de E. Alors
PREUVE. Il est évident que le vecteur nul est dans cette somme. Montrons la stabilité par
combinaisons linéaires. Soient u, v dans LiEJ Fi et (À,µ) E OC2 . Il existe deux familles (vj)jEJ
et (ui)iEJ presque nulles dans E, avec (vj, Uj) E Ff pour tout j E J, telles que v = LjEJ Vj et
u = LiEJUj• Alors,
■
jEJ jEJ jEJ jEJ
Règle 19.3.
Soit (V;};eJ une famille de parties de E . Alors, vect (LJvi) = L.vect{Vj).
jEJ !EJ
PREUVE.
► Il est évident que la somme LiEJ vect (Vj) contient chaque Vi et donc leur union. Or,
vect ( ujEJ Vj) est le plus petit des sous-espaces vectoriels qui contient cette union, ce qui
prouve l'inclusion
vect ( LJ Vi) C L_ vect (Vj),
jEJ jEJ
Remarque. Cette règle montre que nous aurions pu définir la somme de sous-espaces vec-
toriels comme le sous-espace vectoriel engendré par leur union, c'est-à-dire par la formule
Tandis que l'intersection et la somme de sous-espaces vectoriels sont toujours des sous- ~u
espaces vectoriels, leur union, en général, ne l'est pas. ~
rJl
(1)
EXEMPLE 19.4.
i
(1)
Dans JR. , on considère les deux axes lR. x {O} et {O} x R Ce sont des sous-espaces vectoriels
2
2
de JR. 2 . L'intersection des deux axes est l'espace nul. La somme des deux axes est JR. . L'union
~
(1)
2 "O
des deux axes n'est pas un sous-espace vectoriel du plan JR. . rJl
PREUVE.
1.2. Supplémentaires
1.2.1. Somme directe
Nous venons de définir la somme de sous-espaces vectoriels. Nous nous demandons, à présent,
dans quel cas tout vecteur dans cette somme admet une unique décomposition. Dans le cas
où chaque sous-espace est une droite engendrée par un vecteur, cela revient à se demander si
la famille de ces vecteurs est libre.
Vj E J. . Vt =.o.
PREUVE. Soit (FiliEJ une famille de sous-espaces vectoriels de E. On pose H = LiEJ Fi.
( {==) Soit u E H. Par définition u = LiEJ Vj avec des vecteurs Vj E Fi formant une famille
vf
presque nulle. Soit v = LjEJ une autre décomposition de la sorte. Alors,
LiEJ(vi - v;J = O.
La condition implique que vi - vf = 0 pour tout j E J, et la décomposition est bien unique.
(===}) Le vecteur nul se décompose en une somme de termes nuls et la décomposition est
unique, donc chaque vi est nul. ■
Corollaire 19.8. Soit (v;hef une famille de vectew-s non .nul$ dans E. Alors les cooditiô'fl;$
suivantes sont équivalentes :
1) la famille (vj);eJ estlïbre;
2) vect{v,ljEJ}=(BK vi.
iEJ
Corollaire 19.9. SoifFi, ... ,În. ri.es SO'IJ,$~espaces vectoriels de E. Alors les cond#ifJne sui-
vantes sont équivalentes : ·· · · · · · ·
1) E = F1 E9 · • · E9 Fn ;
2) f: F1 x ... x Fti-t E,{Vt.-•'i"n.) i--t v1 + ... +v'll-, est 'liilJ, isomorpliisme d'espaœs
vectoriels. · ·
519
EXEMPLE 19.10.
◊ La somme .L. 1Kn[X] n'est pas directe.
$J
Cl)
,:::
nEN .8u
◊ La somme E9 JKX 2k est directe. Elle donne l'espace des polynômes pairs. ~
r/J
Cl)
kEN
n ~
~
◊ La somme E9(1KX 2k + JKX 2k+l) est directe. Elle donne l'espace lK2n+l [X]. Cl)
11)
k=O ::l
0
On a même n
r/J
Ainsi, il arrive que les termes d'une somme directe puissent aussi se décomposer en sommes
directes.
J
cri
......
Jtêgle 9 t . . "'<; ; 6
Ji};~1fI!:.;~,~.u.;;'"T4,J~w,~l.î{~),;1~;\fî~,';f:~l;
2) ·P~r to~ sok~es~cefv~torielsF[G- de E, on_ a F$ G.
termes.a un sens, l'au~!,tan.t all;rs.~~tpmatiqu~eiit Wài;- •· · • •· _.· ............ _·
3) -PQV,r:toussmtS-es~ces.vecj~f.~,Hde E, ~ri-af@(;$'t{;;(F@ ç;)$M.~F$(G@ij)
-dès- ~i•z 100 âei.i trois te~.a v.n stns,. les-de11i1;. av.Cret ~iJ/n,t iJl<ir"s 4i.t,tpmg,t~e,tt ~. .
Ainsi, l'ordre et le parenthèsage dans une somme directe n'ont pas d'importance. Par
exemple,
(F1 ffi G1) ffi (F2 ffi G2) = F1 ffi G, ffi F2 ffi G2 = (F1 ffi F2) ffi (G1 ffi G2).
Cela est encore vrai pour une famille de sous-espaces indexée par un ensemble infini, mais la
notion de parenthèsage serait alors plus difficile à formaliser.
1
On convient qu'une somme d'éléments de NU {oo} vaut oo si elle contient une infinité de termes non nuls ou
si au moins l'un des termes est infini.
520
Soit E = EBiEJ Fi. Alors pour chaque j E J, nous pouvons associer à cette décomposition deux
applicat ions linéaires.
L'inclu sion naturel le Lj : Fi ----) E , v ----) v.
Le project eur sur Fi Pi : E ----) Fi , v ----) vi .
Cette dernière applicat ion est définie par la l'unicité de la décompo sition
de chaque vecteur
v E E en une somme presque nulle de vecteurs Vj E F;. On pose en effet Pi(v)
= vi. Autreme nt
dit, la famille des projecte urs Pi est caractéri sée par la conditio n
\lv E E, V= L. Pi(v).
jEJ
Nous reverron s les projectio ns à la fin de ce chapitre .
Test 19.6. v 1-) (p, (v), ... , Pn(v)) est l'inverse de l'isomor-
a. Vérifier la linéarité de ij et de Pi· phisme f: F1 x · · · x Fn--+ E, (v,, ... ,vn) 1-)
v, + · ·· +vn.
b. Détermin er Pi o lk.
c. Détermin er lk o Pi . b. Soit E = F1 + · · · + Fn de dimension finie.
Alors cette somme est directe si et seulemen t si
Test 19.7. dimE = dimF1 + · · · + dimFn.
Que pensez-vous des assertions suivantes ?
c. Soit E = F1 EB F2 = F; EB F~. Si F1 = F;, alors
a. Soit E= F1 ffi · · · œ Fn. Alors l'applicat ion Pl= p;.
521
Dans le cas particulier d'une somme de deux facteurs, nous avons le critère suivant.
i
i'.l
i
Ill
rl:,
§
rJJ
PREUVE. Ill
'O
1) =} 2). Si H = F EB G, alors H = F + G. Montrons que F n G = O. Soit v E FU G. Alors
r
rJJ
0 = v + (-v). Comme VE F et -v E G, la proposition 19.7 montre que v = O.
2) =} 1). Il faut prouver que tout vecteur u E H s'écrit de manière unique comme somme d'un 0
rJ)
vecteur de F et d'un vecteur de G. L'existence de cette décomposition vient de l'hypothèse
H = F + G. Pour montrer l'unicité, la proposition 19.7 affirme qu'il suffit de le faire pour le ai
.....
vecteur nul. Supposons donc que O = u + v avec u E F et v E G. On sait que v est dans G et ..d
ü
-u est dans F. Ainsi v = -u E F n G = O. Cela montre u = v = O. ■
... _..-'\ \
,. ... G ' \
(
\ \
\ \
.,,,,, ,,,-""'\······
\ ·. ------,,. ,,,.,,
______
, .,,,,,,, F ·..
' -----,-"" .,,,,,,.
\ \
\ \
\\ >
\
v,.
... ......
La somme F + G est directe La somme F + G n'est pas directe car
car F n G est l'espace nul. F n G est une droite donc n'est pas nul.
EXEMPLE 19.14. Considérons par exemple les trois sous-espaces vectoriels de JR. 2 suivants:
On a Fin Fk = 0 si j =/- k, mais la somme F1 + F2 + F3 n'est pas directe car le vecteur (1, 1) a
les deux décompositions distinctes : (1, 1) = (1, 0) + (0, 1) + (0, 0) = (0, 0) + (0, 0) + (1, 1).
EXEMPLE 19.16. Dans l'espace F(JR., JR.) = JR.IR des fonctions de lR. dans JR., l'espace de
fonctions paires est un supplémentaire de l'espace des fonctions impaires,
► Soit h: lR.---+ lR. une fonction arbitraire. Supposons que l'on a la décomposition souhaitée
h = h+ + h_. Alors h+(-x) = h+(x) et h_(-x) = -h_(x). Donc,
L'unicité de la solution de ce système montre que la somme des deux espaces est directe.
► Inversement, pour h : lR. ---+ lR. une fonction arbitraire, on définit h+ et h_ par les formules
de (19.1) et on vérifie immédiatement que h = h+ + h_ d'une part, et que h+ est paire et
h_ est impaire d'autre part.
Ainsi toute fonction s'écrit de manière unique comme somme d'une fonction paire et
d'une fonction impaire.
PREUVE. L'idée est de compléter une base du sous-espace en une base de l'espace entier; les
vecteurs ajoutés engendreront le supplémentaire.
Soit Fun sous-espace vectoriel de E. D'après le théorème 18.22 il existe une base V de F (ici
nous considérons les bases comme des parties et non comme des familles). En particulier V
est une partie libre dans E. D'après le même théorème, on peut la compléter en une base de
E, c'est-à-dire, il existe une partie U C E telle que
Soit maintenant w E F n G. Alors w est combinaison linéaire des vecteurs de V, et aussi des
vecteurs de U.
w = ÀvV = L ~u. L
vEV uEU
523
Donc
L. ÀvV - L. ~u = 0.
vEV uEU
Comme V et U sont disjoints et comme VU U est libre, tous les cofficients Àv et ~ sont nuls,
ce qui implique que w est nul. Cela prouve F n G = 0 et achève la démonstration. ■
~~~ .~il}ïf;.·
~t$etllew:eüt~'il -Pt?
~tte·~Û, sr J.LW,w,• 6W«:m•<-
·•·r:...::.r:.,c·.1!!:··•.~ 'èst:tt,'is~~~ ~ è l si
f/nfj:e. p'·,.·.f.~_,s:...~. . .~.-
PREUVE. Nous savons que le noyau est un sous-espace vectoriel. Réciproquement, soit F C E
un sous-espace vectoriel. Alors il possède un supplémentaire G, c'est-à-dire E = F EB G. Donc
F est le noyau du projecteur sur G associé à la décomposition E = F EB G. ■
Forts de la notion de supplémentarité, nous allons dans cette partie approfondir notre connais-
sance des applications linéaires. Nous commençons par un exemple très simple : le cas où
l'espace d'arrivée est le corps OC des scalaires.
Remarque. Le rang d'une forme linéaire est majoré par la dimension de l'espace d'arrivée
OC, donc par l. Une forme linéaire est non nulle si et seulement si elle est surjective.
EXEMPLE 19.22. Les fonctions coordonnées cp 1, ... , <rn associées à une base (b 1, ... , bn)
de E sont des formes linéaires. Elles sont non nulles car <ri (bi) = 1 pour tout j = 1, ... , n.
Par ailleurs, <ri(bk) = 0 pour tout k / j, donc l'hyperplan Ker(cpi) est l'espace engendré
par tous les vecteurs de la base à part bi .
est un hyperplan de ocn, car F est le noyau de la forme linéaire non nulle f : (x 1 , ... , Xn) H
L~i aixi . Soit k E {l, ... , n} tel que ak-=/ O. Alors f( ek) -=/ 0, c'est-à-dire que ocn = lKek EB F.
1
~
La résultat suivant est à rapprocher du théorème du---rang pour les systèmes linéaires. La
i
'liUJ
dimension de l'espace des solutions est égale au nombre de variables diminuées du nombre
d'équations indépendantes, donc ici de 1 pour un hyperplan donné par une équation. En ~
particulier, dans un espace de dimension 3, un hyperplan est de dimension 2, donc un plan ~
UJ
vectoriel. Dans un espace de dimension 2, un hyperplan est de dimension 1, donc une droite
vectorielle. Dans un espace de dimension 1, l'unique hyperplan est l'espace nul.
Il est bien connu que les équations d'une droite vectorielle dans R 2 ou d'un plan vectoriel
dans R 3 sont uniques, à un facteur multiplicatif près des coefficients. Le résultat suivant
montre plus généralement que l'équation linéaire d'un hyperplan est essentiellement unique.
Prop0${tion 19.26. Soit f E E* unefome linéaire non nulle et soit li= Ker f l'hyperplan
.fJ.88~, Soit if €J!.* une forme li:tîéâire quelconque. Alors,
l)'rtq:Kèrg~1:JÀEk, g=M;
2) à:== K,r g ~ 3Â. eJ(*, =
g Af.
PREUVE.
1) (~) Supposons que g = Àf. Alors pour x EH, on a f(x) = 0, donc g(x) = M(x) = O.
(===}) Supposons que H C Ker g et soit v E E \ H. Alors f(v) # 0 et E = H EB lKv. Posons
À = g(v) C f(v). La forme linéaire f - Àg s'annule sur H par hypothèse, et sur lKv par
construction de À, donc elle s'annule sur H EB lKv = E et ainsi f = Àg.
2) (~) C'est immédiat.
(===}) Le point précédent montre qu'il existe À E 1K tel que g = Àf. Le scalaire À est non nul
sinon H = Ker g = E ne serait pas un hyperplan. ■
On appelle les coefficients Àk des multiplicateurs de Lagrange. Ils joueront un rôle en deuxième
année en analyse dans le chapitre des fonctions de plusieurs variable, lorsque l'on déterminera
les extrema d'une fonction sous conditions.
PREUVE. Nous avons clairement 2) =} 1). Montrons l'implication 1) =} 2) par récurrence sur
m. Le cas m = 1 est déjà connu : on reconnaît le point 1) de la proposition 19.26.
Soit m 2'. 2 fixé et supposons que le cas m - 1 est démontré. On se donne m formes
linéaires f,, ... , fm dans 2'(E) telles que
-
n
m
Ker g :::> Ker f P (19.2)
p=l
et Fk = nk
p=l
Hp, pour k = 1, ... , m.
Il en résulte que f m induit par restriction une forme non nulle sur Fm-1. En outre, la propo-
sition 19.23 montre que si on choisit Vm E Fm-l \ Fm, alors
Posons
À _ g{vm)
m- fm{Vm).
Alors par construction la forme g - Àmf m s'annule sur la droite OCvm, et clairement elle
s'annule aussi sur Fm. Donc g-Àmfm s'annule sur FmEBOCvm = Fm-1· On peut donc appliquer
l'hypothèse de récurrences aux formes g - Àmf m, au lieu de g, et f1, ... , f m-l · Il existe des
coefficients À1, ... ,Àm-1 dans][{ tels que g -Àmfm = À1f1 + · · · + Àm-lfm-1, ce qui prouve
l'hypothèse de récurrence au rang m. ■
PREUVE. ~
1) Soit G un supplémentaire de Ker (f), c'est-à-dire E = G EB Ker (f). Montrons que l'appli- ~
r/J
cation f : G -* f(E), u H f(u) est un isomorphisme. La linéarité de f vient de celle de f. On
a
Ker (f) = {u E G I f(u) = O} = G n Ker (f) = 0, J
oi
d'où l'injectivité de f. Pour la surjectivité, soit v E f(E). Alors il existe u E Etel que f(u) .....
= v. ..d
On décompose u = w + w' avec w E G et w' E Ker (f). Donc ü
CU
On définit de manière analogue tf et pf associées à la décomposition de E'.
~
Pour tout f E 2'(E, F), on pose
ftk= pf of o tk : Fk -+ Fe de fa-
çon à obtenir le diagramme com-
mutatif ci-contre.
Les applications ftk sont linéaires comme composées d'application s linéaires. Elles définissent
l'application
2'(E, F) -; TI 2'(Fk, F~), f H (ftk)l~i~m
l~k~n
(19.3)
l~i~m
l~k~n
Elle est linéaire car les applications pf le sont. Réciproquement, à partir des ftk on reconstruit
f par la formule 2
f = L t;fekPk-
t,k
Ainsi l'application définie par (19.3) est un isomorphisme.
■
Compositio n de deux applications .
Soit maintenant E" = F;' EfJ • • • EfJ F; un troisième espace vectoriel décomposé en somme directe
et soit g : E' -; E" une application linéaire. Alors,
où les indices parcourent les ensembles {1, ... , p,} 3 j, {1, ... , m} 3 q, {l, ... , m} 3 k,
{1, ... , n} 3 t Pour la composée p~ tf, on a
siq=i,
siq-:/=i.
2
Pour simplifier l'écriture nous omettons le symbole o.
529
Cette formule est similaire à la formule du produit matriciel. Ce n'est pas un hasard.
1
Lien avec les matrices en blocs.
Supposons maintenant que E, E', E" sont de dimensions finies. Prenons pour chaque Fk une
base !JIJk. En les rassemblant, on obtient la base !1iJ = (!JIJ1, ... ,!JIJn) de E. Faisons l'opération
<Il
analogue dans E' et E". Posons
~
î'
<Il
::,
Alors les matrices de f et de g sont les matrices en blocs 5l
~
<Il
_ (A-11 ... A_1n)
et A- : :
Ami ... Amn J
a5
.....
Et de même, on peut écrire en blocs la matrice M.'lll".'lll(gf) de la composée gf. La for- .ci
ü
mule (19.4) exprime alors précisément le produit en blocs des deux matrices ci-dessus (voir
page 417).
p :E -t E, v=u+wHp(v)=u, }
avec u E F, w E G .
s : E - t E, v = u+wH s(v) = u-w,
Ces applications sont bien définies, car la somme directe garantit l'unicité de la décomposition
de v E E en somme de u E F et w E G. On vérifie facilement que p et s sont linéaires. Ce
sont donc des endomorphismes de E.
I
I V
I
.
s(v) __
.-·
_:
__ .,,,.,
-
G .:·--- I
--- F
Remarque. Le dessin ci-dessus schématise une projection et une symétrie générales. Les
espaces F et G représentent des sous-espaces vectoriels quelconques qui peuvent même être
de dimensions infinies. Le plan de la feuille ne représente donc pas un espace de dimension
deux. C'est un dessin d'une nature très différente de celui que nous avons donné page 521
pour illustrer des sous-espaces supplémentaires dans l'espace ambiant, de dimension 3.
530
Définition 19.31.
i 1) p est la projection sur F parallèlement à G.
•v 2) s est la symétrie par rapport à F parallèlement à G.
il
] Notons que s 2 = idE. Par conséquent la symétries est un automorphisme avec ç 1 = s.
,v En outre, p 2 = p et nous avons
i Ker(p) = G et lm (p) = F. (19.5)
On en déduit que la projection p n'est ni injective, ni surjective, sauf dans le cas peu intéres-
sant F = E ou F = O.
PREUVE.
2) Les parties F et G sont bien des sous-espaces vectoriels car ce sont les noyaux des applica-
tions linéaires f - idE et f + idE. Montrons que E = F EB G.
► Montrons que E = F + G. Soit v E E. On écrit
v+f(v) v-f(v)
V= 2 + 2 . (19.8)
Le premier vecteur de cette somme est invariant par f car f(v+f(v)) = f(v) +f 2 (v) = f(v) +v,
donc il est dans F. De même on montre que le deuxième est dans G.
► Montrons maintenant que la somme E = F + G est directe. Pour cela soit u E F, w E G tel
que u+w = O. Donc O = f(u+w) =u-w. On déduit u =w = O.
531
~
Définition 19.33.
1) Une projection est un endomorphisme p de E tel que p 2 = p. rn
CL)
-1
-1
où le nombre des 1 est la dimension de l'espace des vecteurs invariants par f.
0 -1
A= -1 0
( 1 1
-1 -1
-1 -1
( 1 1
1 -1
-1 1
( 1 1
Si on prend une base de F, disons b 1 = (-1, 1, 1) et b 2 = (1,-1, 1), ainsi qu'une base de G,
disons b 3 = (1, 1, -1), alors dans la base fig= (b 1 , b 2 , b 3 ) de JR 3 , on a
10 0)
B=M8ll(f)= 01 0 .
( 0 0 -1
c8ll'8ll =
-1 1 11)
1 -1 , (C8ll'8ll)- 1 =
l (010111) .
( 1 1 -1 2 110
Le lecteur vérifiera que (C8ll'8ll)- 1 A C8l/'8li = B. Bien évidemment, on aurait pu choisir une
autre base de F et une autre base de G. On aurait alors obtenu une autre matrice de passage
qui transforme la matrice A en la matrice B.
III. EXERCICES
19.1. 2. Si f et g sont deux automorphismes comme
ci-dessus, alors il existe À E OC* tel que g = M.
Soient E et F des OC-espaces vectoriels et
f, g E 2'(E, F). On suppose E de dimension 19.3.
finie n.
1. Montrer que Toute permutation a E 63 définit un automor-
phisme ëf de R 3 par permutation de coordon-
1rg (f) - rg (g)I,:;; rg (f + g) ,:;; rg (f) + rg (g). nées, c'est-à-dire
2. Prouver que rg (f + g) = rg (f) + rg (g) si et ëf( XJ, Xz, X3) = XJ err(l l + x2err(2) + x3err(3) .
seulement si (Autrement dit, ëf(x) = Prrx avec la matrice de
permutation de la proposition 16.64.) Considé-
lm (f) n lm (g) = {O} et Ker (f) + Ker (g) = E.
rons les sous-espaces
(Indication: montrer que dans ce cas on a l'éga-
G ={(x1,x2,x3) E R 3 I x1 =X2 =x3}
lité Ker( f + g) = Ker( f) n Ker ( g).)
F ={(x1,x2,x3) E R 3 I x1 +x2 +x3 =0}
pace nul. (Indication : Observez que si un sous- 2. Démontrez qu'on o un isomorphisme cano-
espace invariant n'est pas contenu dans F, alors nique
il contient bi-)
5. Pour tout cr E 63 on note ô' l'automor-
phisme de F induit par l'automorphisme o' de
19.7.
JR 3. Montrez que les matrices Mai(ô'), cr E 63,
sont précisément les six matrices dans Gl(2, Z) Pour un K-espace vectoriel E on note E** =
renconytrées dans l'exercice 16.8. (E*)* le bidual de E, c'est-à-dire le dual de son
dual.
19.4.
1. Pour tout v E E et tout f E E* on pose
x(v)(f) = f(v). Démontrez que
On reprend les notations de l'exercice 19.3.
Dans toutes les questions suivantes on munit le X : E --t E** ' V H x(v) '
plan complexe (C de sa structure naturelle de
IR-espace vectoriel. est un morphisme injectif.
1. Montrez qu'il existe un unique isomorphisme 2. Si E est de dimension fini on écrit E = E**
et non seulement E -::::; E**. Justifiez.
f:F--tC,
Nous allons prouver, avec les méthodes de l'algèbre linéaire, un résultat bien connu de la
théorie des équations différentielles.
=~:fflm~~ri~~.#~~~~2~-··
ftr~:~i;,
z;I~.,
~~r~, à.t<~t~1 P:t1t~K~' Q(if. ·•
0
PREUVE. Appliquons le théorème de Bézout (13.51) à Pet Q : il existe R, S dans ][{[X] tels
que RP + SQ = 1. Alors R(f)P(f) + S(f)Q(f) = idE.
► Montrons que Ker (PQ)(f) = Ker P(f) + Ker Q(f). Soit v E Ker (PQ)(f). Alors,
(19.9)
2
PQ ( -d) = -d + - d- 2 .
dx dx 2 dx
Les solutions de (19.9) sont précisément les éléments de noyau de PQ ({x) . Or ce noyau
est la somme directe du noyau de P (-fx) = -fx + 2 et du noyau de Q ( d;J = -fx - 1. Ces
deux noyaux sont faciles à déterminer : la fonction x H e-2x est une base du premier et la
fonction x H ex une base du second.
Ainsi l'espace des solution de (19.9) a pour base les fonctions e-2x et ex.
(19.10)
a pour base les fonctions x H e<Xkx, k = 1, . .. , n.
Le fait que la somme est directe assure que ces fonctions soient libres, donc elles forment une
base de l'espace de solutions de l'équation différentielle. ■
Comment peut-on procéder lorsqu'il y a une racine double? Ici encore, le lemme des noyaux
donne la réponse. Supposons que P a des racines distinctes CX1 , ••• , CXr de multiplicités
respectives m1 , ... , ffir. L'espace des solutions de l'équation différentielle est donc
On a ( ! - ex) (xPecxx) = pxP-1e=, et par récurrence pour tout q EN,
En particulier(! - ext (xPecxx) = 0 pour p < q. On en déduit que les fonctions xPecxx, pour
p = 0, ... , m - 1, sont dans Ker (d~ - ex) m . En outre, elles forment une famille libre.
En résumé, l'espace des solutions de (19.10) a pour base les fonctions
L volume. Nous en verrons l'emploi dans le chapitre d'analyse des fonctions de plusieurs
variables du cours de deuxième année. Dans ce chapitre, nous allons présenter une
courte introduction géométrique en dimension deux, avant de nous consacrer aux aspects plus
calculatoires, notamment pour la résolution des systèmes linéaires.
a(u, v) = a(v, u)
a(-u,v) = a(u,v)
a(Àu,v) =Àa(u,v)
(20.1)
a(u+u',v) = a(u,v) + a(u',v)
a(v,v) =0
a( u, v) = 1 si (u, v) est une base orthonormée.
En effet, seules les deuxième et quatrième propriétés ne sont pas évidentes. Nous les illus-
trons par les dessins suivants.
V ---7
,--- I
I
I
I
/a(-u,v) I
I
I
I
I
-u
--"7' ....
---- I ',
................ .., --:=-------:..·.,
I I
a(u',v) I a(_ii+u',v) I
I I
I I
I
I ----..Ji,Ljt.,_!;!U!:_i_•·_··.:_··:.:_·.:_;·.:..:.... /
Or, ces conditions sont incompatibles. En effet, les première, quatrième et cinquième condi-
tions montrent que
On se propose de chercher une expression algébrique vérifiant le plus possible des condi-
tions de (20.1), sous la forme d'une fonction des coordonnées dans une base !!.i = (b 1 , b 2 )
de E. En particulier, on souhaite que si u = xb1 + yb2 et v = x'b1 + y'b2, alors on cherche
une fonction f de quatre variables réelles telle que lf(x, y, x', y')I = a(u, v). Le mot « algé-
brique» veut dire ici que les seules opérations permises sur les variables x, x, y, y' sont les
opérations élémentaires dans un corps : addition, multiplication, soustraction, division. La
valeur absolue, par exemple, n'est pas admise.
Notre discussion sur la compatibilité des conditions nous conduit à abandonner notre
notion d'aire a à valeurs positives et à adopter la notion d'aire orientée d(u, v) qui peut
prendre des valeurs dans tout lR. Le principal avantage est que nous pouvons multiplier les
vecteurs u et v par des scalaires de signe quelconque. Fixons une base de E de référence
!l.io = (Uo, Vo). Nous cherchons une fonction qui vérifie maintenant les conditions suivantes
pour tout u, v, w dans E et pour tout À E lR :
d(u,v) =-d(v,u)
d(Àu, v) = Àd(u, v)
d(u+v,w) =d(u,w) +d(v,w). (20.3)
{ d(v,v) =0
d(Uo,vo) = 1
De plus, la quatrième de ces conditions est une conséquence de la première. En effet,
d(v, v) = -d(v, v) entraine que 2d(v, v) = O. Enfin, la deuxième et la troisième des conditions
peuvent être reformulées en terme d'applications linéaires.
Ainsi la fonction d est complètement déterminée. Remarquons que cette expression est pré-
cisément le déterminant auquel nous sommes habitués. On convient qu'appeler base directe
tout couple de vecteurs (u,v) tel que d(u,v) > 0, et base indirecte tout couple de vecteurs
(u,v) tel que d(u,v) < O. On notera de plus que nous n'avons pas fait appel à la notion
de base orthonormée pour définir la fonction d. Ce sont deux notions distinctes. Bien sûr,
comme les isométries préservent les aires, il est d'usage de prendre pour référence une base
orthonormée. Toutes les bases orthonormées seront alors de déterminant 1 ou -1 selon leur
orientation.
Évidemment, il y a des preuves plus directes de cette proposition. Mais notre approche
est conceptuellement plus intéressante. Sans faire appel à des notions métriques comme la
longueur des deux vecteurs ou la mesure de l'angle qu'ils forment, nous avons trouvé cette
formule seulement en réfléchissant à une axiomatique possible de ce qu'une mesure d'aire doit
raisonnablement être.
Nous allons maintenant étendre la définition du déterminant à toute dimension finie. Il faut
garder à l'esprit que le déterminant mesure un volume (c'est-à-dire une aire en dimension 2),
celui du parallélépipède de côtés formés par les vecteurs. Il est alors clair que si les vecteurs
sont liés, alors ils sont contenus dans un hyperplan et donc le volume est nul. Le déterminant
doit donc avoir en toute dimension une propriété analogue à la condition (20.4) : c'est la
propriété essentielle d'une application alternée.
II.1. Formes multilinéaires alternées
Définition 20.2. Soit E un espace vectoriel et
une fonction. On dit que f est multilinéaire alternée si elle vérifie les deux conditions sui-
vantes:
1) pour tout k = 1, ... , n, et pour tout (v 1, ... , Vic, ... ,Vn) E En~l, l'application
est linéaire;
2) on a f(v 1, ... , Vn) = 0 dès que vk = Vj avec k /- j.
La première condition signifie que f est multilinéaire, c'est-à-dire qu'elle est linéaire en
chaque variable. La seconde condition est clarifiée par la proposition suivante, qui justifie de
plus la terminologie : le signe de f «alterne» lorsqu'on permute les vecteurs V1, ... , Vn.
~l5é,$ftf~Î',cJJi? .s'iiU}f:E~9"~û#t
ir
,' ,'_,
1) Commençons par le cas de la transposition qui échange les deux premiers indices. En
développant
0 = f(v1 + Vz, V1 + Vz, V3, ... )Vn) )
on montre comme pour (20.4) que
f(vz, V1, V3, ... , Vn) = -f(v1, ... , Vn) .
De la même manière, on prouve la formule (20. 7) pour toutes les autres transpositions. Comme
E ( <J) = (- 1) m, où m est un nombre de transpositions dont la permutation <J est le produit,
on conlut alors par récurrence sur m.
2) Si les vecteurs v 1, ... , Vn sont liés, alors il y en a un parmi eux qui est combinaison linéaire
des autres. À un signe près (voir le premier point), nous pouvons supposer que c'est le premier.
Alors,
3) f(v1, ... , Vk-h vk+ L ÀjVj, Vk+l, ... , Vn) = f(v1, ... , Vk-1, Vk, Vk+l, ... , Vn)
j,fk
+f(v1, ... , vk-1, .L, Àivi, Vk+l, ... , Vnl-
i,ék
Le dernier terme est nul car les vecteurs sont liés. ■
ft!!ritTI=:!!~~"~i·~~~
3) . ·sî ,h ~Jfl(h•·f,1'!•~'.fjtJ$b,'lfÎftfa~tt(!ii;,m'lliffiiî~.al~étf ên ·les. çolonnès;·alors
1
po~r.totstAEAn{l{êt •.
Soit À E JK, soient v 1, ... , Vn des vecteurs colonnes et soit u 1 = ( b; ) un vecteur quelconque
bnn
de ocn. Alors,
det(v, + ÀU1, Vz, ... , Vn) = .L_ e( o-)( Ucr(l)l + Àbcrrnilucr(2)2 · · · Ucr(n)n
= L, e(o-)Ucr(1)1Ucr(2)2 · · · Ucr(n)n
CYE6n
Ainsi dans la somme (20.8), on peut regrouper les termes d'indice <Y E .!dn (tels que do-) = 1)
et ceux d'indices <Y'T (tels que t:(o-T) = 1). Les termes viennent donc en couples dont les
membres s'annulent mutuellement.
2) On a detlln = .LcrE'5n t:(o-)Ôcr(lll · · · Ôcr(n)n = 1, car la seule permutation <Y telle que les
symboles de Kronecker Ôcr(l)l , ... , Ôcr(n)n sont tous non nuls est l'identité.
3) Nous procédons comme pour montrer (20.6) : nous écrivons chaque vecteur colonne de
A comme combinaison linéaire des vecteurs e 1, ... , en de la base canonique de ocn et nous
utilisons la multilinéarité de d.
d(A) =d (tk1=l
ak, 1ek, , , , , , t
kn=l
aknnekn)
n
L_ ak, 1 · · · Ukn n d( ek, , . , , , ekn) .
k1 ,... 1kn=l
Par conséquent,
011 U121
= U11U22 - Uz1U1z.
1 U21 Uzz
On retrouve donc notre formule habituelle du déterminant en dimension 2.
545
(1,2,3), (3, 1,2), (2,3, 1) paires etsur (1,3,2), (3,2,1), (2,1,3) impaires.
PREUVE. Il suffit de montrer l'invariance par transposition, le reste de l'énoncé sera ensuite
une conséquence de la proposition 20.4. Soit A= (iltk) E .4'n0K). Nous notons tA = B = (bkt)
sa matrice transposée. Ainsi bkt = ilfk. Alors, en utilisant le fait que la signature d'une
permutation est la même que celle de son inverse , on trouve
Rêglê 20.-6. · l,e :dé~~o,nt d1üne ma~ dé perm,utati<m est la, signll,turè <Ïf'fla'permtitat~n
0
• det(Pir} z e( a) •
546
0123 45
1012 34
2101 23
A=
3210 12
4321 01
5432 10
Si on ajoute à une colonne une combinaison linéaire des autres
colonnes, le déterm inant ne
change pas, et de même pour les lignes. On soustra it success
ivement la k-ième colonne de la
(k - 1)-ième colonne, k = 2, ... , 6. On obtien t
-1 -1 -1 -1 -1 5
1-1- 1-1- 1 4
1 1 -1 -1 -1 3
detA=
1 1 1-1- 12
1 1 1 -1 1
1 1 1 0
Mainte nant on additio nne la premiè re ligne à toutes les autres.
-1 * * * * *
-2 * * **
-2 *
detA =
-2 *
* * = (-1 )(-2) 4 X 5 = -80.
*
Volume d'un parallélépipède. Soit !!lJ une base orthonormée de l'espace à 3 dimensions.
Pour des vecteurs u, v, w quelconques dans l'espace, notons A la matrice dont les colonnes
(ou lignes) sont les coordonnées de u, v, w. Alors on démontre, comme dans le paragraphe
introductif, que le volume du parallèlépipède défini paru, v, w est le nombre Vol(u, v, w) =
ldetAI. Î
,<l)
Cl
ci
C'I
.d
ü
.w
Nous remarquons que toutes les matrices élémentaires sont de déterminant non nul.
<D(M) = det(ÀAM; +µAM;', ... ,AMn) = Àdet(AM;, ... ,AMnl + µdet(AM;', ... ,AMnl-
11 en résulte que la fonction <D est linéaire en la première colonne de M. Bien entendu, la
linéarité de <D en les autres colonnes se démontre de manière analogue.
► Si Mi = Mk pour deux indices 1 ~ k < j ~ n, alors AMi = AMk et
Ainsi, la fonction <l> est bien multilinéaire alternée en les colonnes de M. D'après le point 3)
de la proposition-définition 20.4, on a
det(AB) = <I>(B) = <l>(lln)detB =detA detB,
Corollmê 20:10;
1). Une ~~~~•J1•.~~4Bi~t~~1ttsî~it~f~t~}i~~~~é
Autremrnt dit, on à · ·
1) ({=) Supposons que A est inversible. Alors il existe A - l tel que AA -l = lin. Ainsi
1 = det lin= det(AA- 1 ) = detA det(A- 1 ), ce qui montre que det A -1 O.
(===}) Supposons inversement que A n'est pas inversible. Alors les colonnes de A sont liées
et det A = 0, d'après la proposition 20.3.
2) est une conséquence de 1) et de la proposition 20.9. ■
Page 545, nous avons détaillé les formules des déterminants d'ordres 2 et 3. Pour les dimensions
supérieures, les formules deviennent péniblement longues. En dimension 4, il y a déjà 4! = 24
termes. Nous allons maintenant voir comment le déterminant d'ordre n peut s'exprimer en
fonctions de déterminants d'ordre n - 1.
Proposition 20.12. Soit A = atk) E Afn{JK) une matricecarrée. Pour (f, k} E {1, ... , n}2,
on note Aek E Afn.-l (K} la matrice obtenue en supprimant de A la f-ième ligne et la k:-ième
colonne. de A. Alors on peut calculer le déterminant de A = (Otk) E .An.(K) :
t\
1) ·Par un développement suivant la k-ième colonne : det A = L (-1 )t+katk det Atk;
f=l
t\
2) Par un développement suivant la f-ième ligne det A = L (-1 )t+katk det Atk •
k=l
et que c'est une union d'ensembles disjoints. On peut donc séparer la formule du déterminant
en plusieurs sommes.
550
n
= L, L, é:{<J)Ocr(l)l · · · Ocr(n)n
f=l crE6n,I
n
-- = L, Ue1
f=l
L,
crE6n,!
E( <J)Ocr(2)2 · · · Ocr(n)n·
► Par ailleurs, on peut transformer Af; avec € - 1 transpositions sur les lignes en
0 0
0 a12 ... U1n
(20.11)
Toute permutation <J E 6n,1 définit par restriction une permutation 0" 1 de {2, ... , n}; cela
permet de considérer 0" 1 comme un élément de 6n-1· Il est évident que <J 1 a la même signature
que <J. Ainsi la somme (20.11) est celle du déterminant de la matrice An E A'tn-l (JK) obtenue
de A par suppression de la première colonne et €-ième ligne. On a donc
a12 U1n
En résumé,
L, t:( cr)a"(l)l · · · UCJ(nln = det Af1 = (-1 )f-l det A~ 1 = (-1 )e-l det Aei ,
CYE6n,f
Nous allons montrer dans cette partie comment le développement suivant une ligne ou une
colonne permet d'établir facilement une équation d'un hyperplan dans ocn.
Soient Ve = (ve 1, ... , Venl. e= 1, ... , n - 1, des vecteurs linéairement indépendants de ocn.
Si un vecteur (x 1, ... , Xn) est dans l'hyperplan F = vect (v1, ... , Vn-1) alors
XJ Xn
V11
o.
Vn-1,1 • • • Vn-1,n
(20.12)
Au signe près, le coefficient Uj est le déterminant de la matrice (vekl privée de sa j-ième colonne.
La matrice (vekl étant de rang n-1 l'espace engendré par ses colonnes est de dimension n- 1.
Par le théorème d'extraction d'une base, on sait alors qu'il existe n - 1 colonnes parmi les n
qui sont linéairement indépendants. Ainsi les ai ne sont pas tous nuls et (20.12) est l'équation
d'un hyperplan F'. Or F CF' donc F = F'.
552
EXEMPLE 20.13.
◊ Une équation du plan vectoriel dans JR 3 engendré par les vecteurs (2, 1, 0) et (-1, 3, 2)
X 11 Z
2 1 0 2x-411 + 8z O.
-1 3 2
◊ Pour déterminer une équation du plan affine dans JR 3 passant par les trois points A(l, 0, 2),
B(-2, 2, 2), et A(l, 2, 3), on remarque que le point M(x, 11, z) est dans ce plan si et seulement
si AM, AB, AC sont linéairement dépendants. On obtient alors l'équation
x-1 11 z- 2
-3 2 0 2x + 311 - 6z + 10 = 0.
0 2 1
Nous allons calculer par récurrence sur n le déterminant suivant, « classique » mais fort utile.
PREUVE. Notons Yn le déterminant ci-dessus. Il est clair que la formule est correcte pour
n = 1 (on convient qu'un produit vide vaut toujours 1). Supposons maintenant la formule
démontrée pour n - 1 et calculons le déterminant Vn. On a
La première égalité ci-dessus est obtenue par soustraction de la première ligne de toutes les
autres, et la deuxième égalité en est le développement suivant la première colonne. Rappelons
que uk- bk = (a - b)(bk-l + bk-la + • · · + buk-2 + ak-l). Nous pouvons donc factoriser
chaque ligne par (Xt - x il. Ainsi
Yn=D TI (Xt-X1l,
l<t:s;n
Maintenant, on utilise la première colonne pour« nettoyer» les suivantes. Plus précisément,
on additionne à la k-ième colonne la première multipliée par -x~- 1 , où k = 2, ... , n - 1 . Il
reste
Xz X1X2 + X~ 2
x~- x 2+ x~-3x~ + · · · + x 2-2
X3 X1X3 + xi X~-2X3 + X~-3X~ + ... + xr-2
D=
Ensuite, on utilise la deuxième colonne pour « nettoyer » les suivantes. Plus précisément,
on additionne à la k-ième colonne la deuxième multipliée par 2
-xt
, où k = 3, ... , n - 1 . Et
ainsi de suite. On obtient finalement une expression fonction de x2, ... , Xn, de la forme
x2 n-2
Xz 2 Xz
x2 n-2
X3 3 X3
D=
Xn x2 x~-2
n
Nous montrons maintenant comment les déterminants peuvent résoudre des systèmes linéai-
res. Il faut toutefois noter que cette méthode, bien que tentante, n'est guère pratiquable, sauf
peut-être en dimension 2 ou 3, du fait du nombre considérable d'opérations qu'elle requiert
dans le calcul des déterminants. La méthode de Gauss est en général beaucoup plus rapide.
Autrement dit, un système linéaire est de Cramer si et seulement si le nombre d'équations est
égal au nombre d'inconnues et s'il n'y a pas d'équation superflue.
Règle 20.16. (Règle de Cramer;) Tout système de GramerAx = y possède une solùtion
unique qu'on peut calculer comme suit. .On remplace la k-ième colonne de A par y et on note
Ak la matrice ainsi obtenue, pour k = 1, ... ; n: Alors la k-ième com:posantède la 'solution x
est donnée par la forrm.de
detAk
Xk= detA ' k=1, ... ,n.
Notons Ci, ... , Cn les colonnes de A. On a donc 1J = x1C1 + · · · + XnCn. La k-ième colonne
de Ak est donc égale à x1C1 + · · · + XnCn. Par linéarité du déterminant suivant la k-ième
colonne, nous obtenons que
où on a noté Bkj la matrice A dans laquelle on a remplacé la k-ième colonne par la j-ième
colonne Ci. Si j -f. k, la matrice Bki possède deux colonnes identiques et par conséquent
det Bki = O. Si j = k, alors Bkk = A. On obtient alors
detAk = xkdetA.
La formule annoncée en résulte car on peut diviser par det A -1- O. ■
3x1 + 2x2 = b1 ,
{ 4x1 + 3x2 = b2.
Le déterminant de la matrice du système vaut
I! ;I = 3 x 3 - 2 x 4 = 1 -f. 0.
b1 21 3 b11
lb23 14 b2
X1 = I! ;I = 3b1 - 2b2, Xz = I! ;I = 3b2 - 4b1 .
111.2.5. La comatrice
Nous allons démontrer dans cette partie une formule explicite de l'inverse d'une matrice en
fonction des coefficients de la matrice inversible.
Définition 20.18. Soit A E .4"n(1K). On note Afk E .4"n~l (OC) la matrice obtenue par
suppression de la f-ième ligne et k-ième colonne de A. La comatrice de A est la matrice
comA dont le coefficient d'indice(€, k) est (-l)Hk detAfk·
Pour des matrices de grande taille cette formule de l'inverse est peu utile car elle de-
mande beaucoup trop de déterminants à calculer; inverser par la méthode du pivot est plus
rapide. Néanmoins la formule est utile pour démontrer certains résultats théoriques, comme
par exemple une caractérisation du groupe Gl(n, Z) qui est plus belle que notre définition de
la page 445. Rappelons que nous y avons défini Gl( n, Z) comme l'ensemble des matrices de
Gl(n, IR) à coefficients entiers et dont l'inverse est également à coefficients entiers.
PREUVE. Tout d'abord nous remarquons une chose simple mais importante: le déterminant
d'une matrice à coefficients entiers est un entier. Cela se voit directement sur la formule de la
définition du déterminant.
► Soit A dans Gl(n,Z). Alors A et A- 1 sont à coefficients entiers. Donc detA et det(A- 1 )
sont des entiers. Or
On devine qu'une arithmétique se dessine sur le groupe linéaire. Nous ne pouvons qu'effleu-
rer le sujet et nous nous contentons de mentionner l'existence d'un sous-groupe remarquable
de Gl(n,Z).
PREUVE. Sl(n,Z) est le noyau du morphisme de groupes det: Gl(n,Z) --t {-1, l}. ■
IV. EXERCICES
20.3.
<let(~).
20.7.
3. On suppose maintenant que n = m. Mon-
trer qu'en général Soient a et x dans K Calculer
<let ( ~~
1 ) # <let A <let D - <let B <let C .
a11 xaa
1a 1 et Ll2 axa
11a aax
20.5.
20.6.
1 w2 w
w 1 w2 0
w2 w 1
où Gj = lK(Xj, 1/jl. j = 1, ... ,4.
1. Expliquez pourquoi le birapport est bien dé-
fini et pourquoi il n'est jamais nul.
558
20.10. 20.12.
Soient a, b, c E lK. Calculer les déterminants Soient a, b E IC. Calculer sous forme factorisée
suivants, (on factorisera les expressions obte- a2 ab ab b2
nues !)
ab a2 b2 ab
11= b2 a2
0 ab ab ab
b2 ab ab a2
111 aOc
bcO
Indication : penser aux blocs ( ~ ~).
1 1 1
112 a b c 20.13.
a2 b2 c2
a+b b+c c+a Soit f l'endomorphisme de IK2[X] défini par
113 a2+ b2 b2+c2 c2+ a2
a3+ b3 b3+c3 c3+ a3 pH P+ P'.
( b
a b
c ab
c) ( 1 112 )
1. j )
Discuter en fonction de a E 1K l'inversibilité de
la matrice
c a 1 J2 J
a+l 1 1 )
Ma 2 a+2 2
(
3 3 a+3
20.11.
Soient a, b, c, d E IC et 20.16.
4
a a2 a
Soit n 2:: 2 et soit A E .4ln(]R) une matrice telle
b b2 b4
que VM E .4ln(R),
c c2 c4
d d 2 d4 det(A + M) = detA + det M.
1. Montrer que pour tout polynôme de la forme Prouver que A= O.
p = X 4 + cx2X 2 + CX] X+ CX(J on a
20.17.
a a 2 P(a)
b b 2 P(b)
Déterminer une condition nécessaire et suffi-
c c 2 P(c)
sante sur m E 1K pour que l'ensemble des solu-
d d 2 P(d)
tions du système suivant contienne une droite
vectorielle.
2. Montrer qu'il existe un unique polynôme de
la forme ci-dessus et ayant pour racines a, b, c. 2-y + z mx
Le déterminer (sous forme factorisée). 1J 2z my
3. Utiliser le polynôme de la question 2. pour 2y - z mz
factoriser 11.
COMPLÉMENT 1. QUESTIONS D'ORIENTATION
Si Çg = (e 1 , ••• , en) et Çg' = (e;, ... , e.;,) sont deux bases de lRn, nous savons qu'il existe un
unique automorphisme f de ]Rn qui envoie Çg sur fg', c'est-à-dire tel que f(ek) = e~ pour
k = 1, ... , n. Nous allons nous poser une question beaucoup plus subtile :
Pour deux bases données jjg et Çg' de JRn, peut on déformer de manière continue la famille
jjg en la famille Çg' parmi les bases de !Rn ?
Écrivons les vecteurs des bases Çg et Çg' en colonnes et regroupons les sous forme de matrices
carrées. La question peut se reformuler alors sous la forme beaucoup plus précise suivante :
Soient A et A' dans Gl(n,JR). Existe-t-il des fonctions Atk : [0, 1]----, lR continues, pour
1 :'( k,f :'( n, telles que si on note A(t) = (Ardt)), alors
Il est clair qu'une condition nécessaire est que det A et det A' soient de même signe.
En effet supposons au contraire que det A > 0 et det A' < 0, par exemple. L'application
[O, 1] ----, lR : t H det A(t) est une fonction continue puisque det A(t) est une fonction
polynomiale des coefficients Ark(t). Par le théorème des valeurs intermédiaires (voir la partie
analyse), il existe donc un réel O < to < 1 tel que det A(to) = 0, ce qui est absurde.
Il est beaucoup plus remarquable que cette condition soit également suffisante.
Propositiotr20.24. Soient A= et A' dans Gl(n,R}. Pour qu'existe des Jonctions conti-
nues An, : [O, t] ~ R, pour 1 ¾ k, t ¾ n, telles
PREUVE. Nous avons déjà montré le sens facile de cette équivalence. Montrons le sens difficile.
► Commençons par considérer le cas où A' = lin et où det A> O. Il s'agit donc de déformer
continûment la matrice A parmi les matrices inversibles en la matrice identité. Nous savons
que toute matrice inversible s'écrit comme un produit fini de matrices élémentaires (voir
chapitre 16) sous la forme A = A 1 · Ap. Nous allons déformer simultanément chacune des
matrices élémentaires de la façon suivante.
- Si Ai= Urk[µ] =lin+ µEtk, avecµ E lR et f-/- µ, alors on pose Aj(t) = Urk[(l - t)µ] =
lin + (1 - t) µEfk pour déformer Ai en lin.
- Si Ai= Ur(À] =lin+ (À-1 )Ere, avec À E JR:;_, on pose Ai(t) = ur[t + (1 -t)À] (car alors
t + ( 1 - t )À > 0, pour tout O :'( t :'( 1), pour déformer Ai en lin.
- Si Ai= Ur[À], avec À E JR~, on pose Aj(t) = ur[-t+ (1-t)À] (car alors -t+(l -t)À < 0,
pour tout O :'( t :'( 1), pour déformer Ai en Ud-1], qui est une matrice diagonale, formée
de 1 et d'un seul -1 pour l'indice (f,f).
- Enfin, si Ai = Uek = lin - Eu - Ekk + Eek + Eke, on pose Ai(t) = lin - Eee - Ekk +
sin(tn/2)(Eee-Ekk)+cos(tn/2)(Eek+ Ekel- Autrement dit, si on considère la sous-matrice
des indices (k, k), (k, i), (e, k) et (e, i), cela revient à déformer la matrice
Posons
1
pour O :( t :(
2.
Nous obtenons ainsi une déformation de la matrice A sur la matrice A( 1/2) qui est un produit
de matrices diagonales formées de 1 et de -1. Autrement dit
De plus, puisque det A(t) ne s'annule pas, on a det A(l /2) > 0 donc le nombre d'indices k
tels que t:k = -1 est pair. Regroupons les -1 de la diagonale par paire deux à deux disjoints
d'indices {k, i} telle que Ek =Et= -1 et déformons la matrice extraite d'indices (k, k), (k, i),
(i, k) et (i,i)
Cette propriété conduit à la notion importante d'orientation. Nous dirons que deux bases
définissent la même orientation s'il est possible de déformer continûment l'une en l'autre parmi
les bases. Nous venons donc de montrer qu'il existe exactement deux orientations possibles
sur Rn.
Définition 20.25. Soit !!il la base canonique de Rn et soit !!Il' une base quelconque. On
rappelle que l'on note Cf%Jf%J' = Mf%Jf%J'(id) la matrice de passage de !!il à !!Il', c'est-à-dire la
matrice des coordonnées des vecteurs de !!Il' dans la base !!il.
1) On dit que !!Il' est une base directe si det Cf%Jf%J' > O.
2) On dit que !!Il' est une base indirecte si det Cf%Jf%J' < O.
Les premier et troisième de ces ensembles sont des sous-groupes distingués de Gl(n, OC), le
premier parce qu'il est l'image réciproque du sous-groupe IR~ par le morphisme de groupes
M 1 (IR) est consistuée de deux grandes parties, séparées par la partie toute fine {O}. À l'inté-
rieur de Gl+{l, IR), nous avons la partie toute petite Sl(l, lR) = {1}. Elle sépare Gl+( 1, lR) en
deux parties, à savoir ]O, 1[ et ]1, oo[.
Il est remarquable que la situation est la même lorsque n > 1. Pour fixer les idées nous
nous limitons ici au cas n = 2.
► Il faut s'imaginer Z comme une sorte de paroi toute fine qui sépare la partie Gl_(2,lR), où
ad-be< 0, de la partie Gl+(2,lR), où ad-be> O. La situation est similaire à un hyperplan
d'équation
a.a+ l3b +ye + M = 0,
avec ( a., 13, y, 1\) =I= 0, qui sépare JR4 en deux parties, celle où a.a + 13 b + ye + l\d > 0 est celle
où a.a+ 13b + ye + l\d < 0. La seule différence est que Z n'est pas un hyperplan, car Z est
défini par l'équation ad - be = 0 et (a, b, c, d) H ad - be n'est pas linéaire. On appelle Z
une « hypersurface ».
Notre discussion sur l'orientation montre qu'il est possible de «voyager» de manière
continue de n'importe quel point de départ dans Gl+(2,lR) à n'importe quel point d'arri-
vée dans Gl+(2, lR), sans jamais sortir de Gl+(2, lR); et la partie GL(2, lR) possède une
propriété analogue. On dit que les parties Gl+(2, lR) et GL(2, lR) sont connexes par arcs.
En revanche, il n'est pas possible de voyager continûment d'un point de Gl+(2, :IR) à un point
de Gl_(2, :IR) sans jamais traverser la paroi Z.
► L'ensemble Sl(2, :IR), défini par l'équation ad - be = 1, est contenu dans Gl+(2, :IR). On
montre avec les mêmes raisonnements que ci-dessus que Sl(2, :IR) est une hypersurface qui
sépare Gl+(2, :IR) en deux parties, celle formée des matrices de déterminant 0 < ad - be < 1
et celle formée des matrices de déterminant ad - be > 1. De plus, l'équation ad - be = 1
s'écrit encore
.4l2(lR) est constitué de «feuilles» ZÀ, À E :IR, deux à deux disjointes. Chacune d'entre
elles sont connexes par arcs. La feuille Zo est singulière, elle sépare Gl(2, :IR) en deux parties
connexes par arcs, Gl+(2,JR) et Gl_(2,JR). Les feuilles ZÀ, pour À E :IR*, ressemblent toutes
à la feuille particulière Z 1 = Sl(2,JR).
- Pour À > 0, ZÀ sépare Gl+(2,JR) en deux parties connexes par arcs, l'ensemble des
matrices telles que ad - be> À et l'ensemble des matrices telles que O < ad - be< À.
- Pour À < 0, ZÀ sépare Gl_(2,JR) en deux parties connexes par arcs, l'ensemble des
matrices telles que ad - be< À et l'ensemble des matrices telles que À< ad - be< O.
Quatrième partie
ANALYSE
ETTEpartie est conscrée à la mise en forme de la plupart des notions rencontrées dans
C le cadre des études de fonctions, dans les classes secondaires. Les fonctions considérées
sont définies sur :IR et à valeurs dans :IR ou C, il faut donc commencer par préciser
exactement ce que nous entendons par nombre réel et droite réelle.
o Les nombres. Commençons par quelques considérations très naïves sur ce que pourrait
être un nombre réel. Nous sommes habitués depuis l'école primaire à manipuler des nombres
dits décimaux, qui s'obtiennent comme quotients d'entiers par des puissances de 10, soit donc
des nombres de la forme n/lOm, avec n E Z et m E N. Ces nombres peuvent toujours être
écrits de la manière suivante
où les entiers ak, -q ::; k ::; p, sont compris entre O et 9. Cette écriture signifie simplement
que
(Il
Si l'on se donne deux nombres décimaux au moyen de leur développement (Di), il est possible
par exemple d'en faire la somme, ou la différence, ou le produit, au moyen d'opérations posées
d'une manière systématique et effectuée de façon algorithmique.
Les nombres rationnels sont plus complexes. En effet, on sait aussi depuis les classes
primaires que par exemple
i =0,33333333333333
1
6= 0, l 66666666666666 ... , (D2)
les développements obtenus sont alors dits illimités. On se convainc intuitivement du bien
fondé de ces écritures en posant la division 1/3 ou 1/6, et en notant que son reste se répète
indéfiniment. Mais le sens même de ces développements est quelque peu obscur.
Admettons maintenant que l'on décide qu'un nombre réel est simplement une expression
de la forme
où le développement se poursuit indéfiniment, les entiers ak, k E Z, k::; p, étant tous compris
entre O et 9. Une question très naturelle est alors de se demander s'il est possible de définir
une addition sur ces nombres, définie à partir de leurs développements. Reprenons pour cela
les expressions (Dz). On obtient sans difficulté
et l'on peut se convaincre que cette suite illimitée de 9 correspond à l'addition de 1 au terme qui
la précède (ou à tout le moins proposer cette règle comme règle opératoire). On obtient alors
1/3 + 1/6 = 0,5 = 1/2, ce qui concorde avec nos conventions d'opérations sur les rationnels.
Mais supposons que nous voulions calculer 1/6 + 1/6. Il se pose alors un problème autrement
plus difficile, celui de la Êretenue. En effet, il est facile d'additionner 0, 756 + 0, 877 = 1,633 :
564
on « commence par la droite », on effectue les sommes des chiffres de même rang terme à
terme, si cette somme est comprise entre O et 9 on considère que l'on a obtenu le terme de
rang correspondant dans la somme, si elle dépasse 10 on lui ote 10, on considère que le résultat
est le terme de rang correspondant dans la somme, et on ajoute 1 au terme du rang précédent
de l'un des deux nombres initiaux (c'est la retenue); on réitère alors la même opération au
rang précédent. Comme le nombre de termes est fini, on arrive au bout d'un nombre fini
d'étapes à une expression de la forme (Di), que nous considérons comme la somme des deux
nombres, ce qui est bien conforme à (I).
Mais cet algorithme ne peut pas être utilisé pour additionner des développements infinis
généraux : on ne peut plus commencer par la droite lorsque des retenues se présentent pour
des termes de rang arbitrairement élevé. On ne peut donc pas procéder aussi naïvement pour
construire une addition, et la notion de nombre définie par leurs développements illimités
semble inadéquate.
Le problème vient clairement de ce que l'on doit manipuler une infinité de termes, c'est-à-
dire que l'on doit sortir du domaine de l'algèbre, où toute opération peut-être effectuée en un
nombre fini d'étapes, pour établir dès le départ des procédés adaptés à cette nouvelle difficulté.
L'idée nouvelle fondamentale, qui peut-être considérée comme à la base de toute la construc-
tion de l'analyse, est celle de limite. Notre intuition de la notion de limite repose certainement
sur le fait qu'il n'est pas possible de trouver un rationnel strictement positif qui soit plus petit
que tous les rationnels strictement positifs, ou en d'autre termes, que (Ql~ n'a pas de plus petit
élément. En effet, suppposons que r E (Ql~ soit le plus petit élément de (Ql~, on voit que r/2 < r
car la différence r - r /2 = r /2 est strictement positive, ce qui montre que r n'est pas le plus
petit élément, puisque r /2 E (Ql~.
On dit qu'une suite (rnlnEN de rationnels a pour limite un rationnel C lorsque pour tout
E E (Ql~, il existe un entier no tel que Irn - Cl < E lorsque n 2 no. On note alors C = limn--->oo r n,
et on dit que la suite converge vers C. Il existe bien sûr des suites qui ont des limites (toutes les
suites constantes par exemple) et d'autres qui n'en ont pas, comme la suite de terme général
r n = (-1 )n. Mais la limite, lorsqu'elle existe, est unique. On peut donc définir sans ambiguïté
la limite d'une suite de rationnels, lorsqu'elle existe.
Cette nouvelle notion permet de donner un sens parfaitement clair aux développements
décimaux illimités que nous manipulions plus haut. Considérons le développement (D 3 ). On
pose
p
Yn = L. aklOk (S)
k=-n
Il est facile de montrer que toute suite de rationnels convergente possède la propriété de
Cauchy, mais ce que nous venons de voir montre que la réciproque n'est pas vraie.
L'idée est alors très simple. On considère l'ensemble C(/ de toutes les suites de Cauchy de
rationnels, et on veut construire un ensemble !fi, qui sera nécessairement plus gros que Q, dont
chaque élément joue le rôle de limite généralisée pour une certaine suite de"(!_ Il est inutile de
définir précisément cette notion, il suffit de pouvoir dire dans quel cas deux suites de Cauchy
doivent avoir la même limite généralisée. On adopte la convention suivante : deux suites de
Cauchy étant données, elles auront même limite généralisée lorsque leur différence (dont le
terme général est la différence des termes généraux des deux suites) converge et a pour limite
O. On vérifie que ce procédé définit une relation d'équivalence dans"(!_ Une classe d'équivalence
est donc un ensemble de suites de Cauchy qui possèdent la même limite généralisée. Et ceci
permet maintenant de définir notre ensemble !fi comme l'ensemble quotient de "(! par cette
relation d'équivalence, dont on se convainc facilement qu'il vérifie la propriété souhaitée.
Il est ensuite possible de montrer que cet ensemble !fi contient Q, a une structure de corps
totalement ordonné, que Q est un sous-corps de !fi, et que toute suite de Cauchy de rationnels
possède une limite dans R Cet ensemble !fi est traditionnellement noté :IR, on l'appelle la
droite réelle. Et notre procédé initial pour définir les nombres réels a maintenant un sens,
puisque la suite (rn) définie par (S) est une suite de Cauchy. Sa limite dans lR est le réel
représenté par le développement (D 3 ).
Les propriétés de la droite réelle, ainsi que l'étude détaillée des suites réelles et complexes
seront étudiées aux chapitres 21, 22 et 23.
◊ La notion de continuité. La droite réelle étant convenablement construite, de même
que la notion de convergence des suites de réels, il est ensuite possible de fonder de manière
satisfaisante la théorie des fonctions de variable réelle. La première notion à définir est encore
celle de limite pour une telle fonction. Si une fonction f est définie sur un intervalle ] a, b], et à
valeurs dans C, on dit qu'elle possède une limite à droite e E (C au point a lorsque pour tout
t: > 0 (qu'il faut comprendre comme arbitrairement petit), il existe un réel a> 0 (à choisir en
fonction de t:) tel que six E ]a, a+ a[, lf(x) - fi < t:. Intuitivement, les valeurs de la fonction
deviennent de plus en plus proches de eà mesure que la variable se rapproche de a. La limite
à gauche se définit de manière analogue, et on peut se livrer à diverses variations sur la même
notion, qui seront développées au chapitre 25.
Il est alors possible de parler de continuité. Une fonction définie sur un intervalle [a, b]
est dite continue à droite au point a si sa limite à droite en a est égale à sa valeur en a.
La continuité à gauche se définit de la même manière et une fonction est dite continue en
un point x 0 de ]a, b[ lorsqu'elle est à la fois continue à droite en à gauche en x 0 . Enfin, une
fonction est dite continue si elle est continue en tout point.
La continuité est une propriété de régularité des fonctions. La meilleure manière de pré-
senter cette idée est certainement de montrer que le comportement des fonctions continues
peut être complètement décrit au moyen celui de leur restriction à certaines parties de leurs
domaines de définition, ces parties pouvant être très «petites». Par exemple, deux fonctions f
et g continues sur [a, b] qui prennent la même valeur en tout point rationnel de [a, b] prennent
nécessairement la même valeur en tout point de [a, b]. Ce théorème est remarquable dans le
sens où les rationnels forment (dans un sens à préciser) une toute petite partie dans l'ensemble
[a, b]. Ceci est à rapprocher du résultat algébrique affirmant que deux fonctions polynômes
de degré n sont égales sur lR si elles sont égales en n + 1 points.
L'autre résultat remarquable sur les fonctions continues est le théorème des valeurs inter-
médiaires, qui affirme que si une fonction f: [a, b] -) lR est continue, alors f prend toutes les
valeurs comprises entre f(a) et f(b). Une conséquence fondamentale de ce théorème est le fait
566
qu'une fonction continue et strictement monotone définie sur un intervalle est une bijection
de cet intervalle sur son image, qui est aussi nécessairement un intervalle ; et la réciproque
de cette bijection est elle aussi continue. Comme nous le verrons, ce résultat va s'avérer être
crucial pour la construction des fonctions élémentaires, mais nous allons ici en donner une
illustration plus imagée, que nous appellerons le problème de la double promenade.
On considère deux fonctions continues f et g de [O, 1] dans JR, dont les graphes seront notés
'#f et '#9 . Nous imaginerons que ces graphes sont des chemins dans le plan, joignant les points
A à A' et B à B' respectivement. Sur ces chemins ont lieu deux «promenades».
o Promenade 1 : la dame et le chien. Dans la première, une dame D promène son chien C,
avec une laisse de longueur 2f. Elle se déplace sur le chemin '#f, son chien se déplace sur le
chemin '#9 , tous deux partent de A et de B, et arrivent aux points A' et B'. L'expérience
commence à l'instant O et se termine à l'instant T. L'abscisse du point D est une fonction
continue et strictement croissante du temps, et celle de C est continue.
o Promenade 2 : les mexicains. Dans la seconde, deux mexicains M et N, portant des chapeaux
de rayon C, se promènent sur les deux chemins. A l'instant de départ t 0 , M est en A et N est
en B', à l'instant final t 1 M est en A' et N est en B. Au cours de cette expérience, l'abscisse
de M est une fonction continue et strictement croissante du temps, et celle de N est continue.
On demande si les chapeaux des deux mexicains sont obligés de se toucher durant la
seconde promenade. Bien entendu, on a assimilé chaque participant à un point se déplaçant
sur son chemin, et les chapeaux sont des disques centrés sur les points M et N.
A'
0 ....__________.
La réponse est oui, mais elle n'a rien d'évident. Pour le démontrer, nous allons représenter
ces deux promenades d'une autre manière. On notera Llt l'intervalle de temps durant lequel
se déroule la promenade i, pour i E {1, 2}. Pour i E {1, 2}, nous allons représenter dans le
carré [O, 1] l'image de la fonction <Dt qui à un instant t E Llt associe le couple (x[(t), xf(t))
formé par l'abscisse x[(t) du point se déplaçant sur le graphe '#f et l'abscisse xf(t) du point
se déplaçant sur le graphe '#9 .
Le point crucial est que dans les deux promenades, les ensembles images
sont des graphes. En effet, pour la promenade 1 par exemple, on a supposé que la fonction
x{ est continue et strictement croissante. Donc c'est une bijection de L'.1 1 sur [O, 1]. Notons
E.1 : [O, 1] ---+ L'.11 sa bijection réciproque. Alors si une abscisse x E [O, 1] est donnée, on sait que
l'abscisse x{ de la dame est égale à x à l'instant E, 1 (x), par définition. Il lui correspond donc
une unique coordonnée xr ( t, 1(X)) pour le chien, que J' on porte en ordonnée. On reconnaît
567
bien là la définition d'un graphe de fonction. En d'autres termes, <D, ('11) est le graphe de la
fonction cp 1 : [0, 1] ----t [0, 1] définie par
De la même manière, <1> 2 (.1 1 ) est le graphe de la fonction <pz : [0, 1] ----t [0, 1] définie par
cp 2(x) = Xi(E, 2(x)), où E,2 = (x;)~ 1. Un résultat élémentaire montre que la composée de
fonctions continues est continue, il en résulte que cp 1 et <pz sont continues. Il suffit maintenant
de remarquer que, compte tenu de la forme des deux promenades que nous avons décrite
En effet, par exemple pour la promenade 1, à l'instant 0, x{ = 0, ce qui montre que E,,(0) = 0,
et Xi(0) = 0 = Xi(E, 1 (0)) = cp 1 (0). On raisonne de même en utilisant les conditions initiales
et finales des deux promenades.
Il nous suffit maintenant d'utiliser encore le théorème des valeurs intermédiaires, appliqué
cette fois à la fonction cp = cp 1 - cp 2 . Cette fonction est définie dans [0, ll, un résultat facile
montre qu'elle est continue, et elle vérifie cp(0) = -1 et cp(0) = 1. Le théorème des valeurs
intermédiaires montre donc qu'il existe un élément a E [0, 1] tel que cp(a) = 0, c'est-à-dire
cp 1 (a) = cpz(a).
Posons t 1 = E, 1(a) et t 2 = E.2(a). Aux instants t 1 et t2 respectivement, pour la première
promenade la dame D est à l'abscisse a et le mexicain M est aussi à l'abscisse a, il sont donc
au même endroit sur leur chemin. Et le chien est à l'abscisse cp 1 (a), alors que le mexicain N
est à l'abscisse cp 2 (a). Ces deux abscisses sont égales, donc N est au même endroit que C.
Mais comme la dame promène le chien avec une laisse de longueur 2C, la distance entre D et
C est plus petite que 2C, et comme le rayon des deux chapeaux est C, ils sont obligés de se
toucher, puisqu'ils sont centrés en M = D et N = C. Ceci prouve notre assertion.
o Dérivation et intégration. La notion de limite étrant convenablement fondée, il est
possible de former une nouvelle notion, celle de nombre dérivé d'une fonction en un point.
Pour une fonction f de lR dans JR, et un point a E JR, on définit le taux d'acroissement 'Ta de
f au point a par
'Ta(t) = f(t) - f(a)
t-a
pour t E lR \ {a}. Ce taux d'accroissement est la pente de la corde du graphe de f tracée entre les
points ( a, f (a)) et (t, f (t)). Le nombre dérivé f' (a) de f au point a est par définition la limite
du taux 'Ta au point a, lorsqu'elle existe. Ce nombre dérivé représente donc la pente limite
des cordes précédentes, lorsque le point t se rapproche de a. Les interprétations concrètes de
568
ce nombre dérivé sont multiples. Si par exemple test le temps et f(t) la position d'un mobile
sur une droite, repérée par rapport à un point fixe 0, 'Ta(t) s'interprète comme la vitesse
moyenne du mobile entre les instants a et t, et f'(a) comme la vitesse instantanée à l'instant
a. Du point de vue de la théorie des fonctions, cette définition permet de donner un sens
précis à ce que l'on appelle la tangente au graphe de f au point a, et par là même de poser
convenablement et de résoudre un grand nombre de problèmes dans lesquels cette définition
intervient. On pourra se reporter à l'introduction du chapitre 31, où l'on décrit la mise en
équation du problème de la tractrice, courbe suivie par un mobile tiré de manière tendue par
une corde reliée à un point mobile sur un axe; ou encore au chapitre 28 où l'on montre que la
courbe formée par un fil pesant suspendu par ses deux extrémités à la même hauteur est une
chaînette. L'important est de noter que dans ces deux problèmes la mise en équation n'est
possible que grâce à une interprétation correcte de la notion de tangence.
On dit qu'une fonction est dérivable en un point lorsque la limite précédente existe. On
montre facilement qu'une fonction dérivable en un point est continue en ce point, mais la
réciproque est fausse, comme le montre l'exemple de la fonction x H lxl au point O. Une
fonction dérivable en tout point d'un intervalle ouvert est dite dérivable sur cet intervalle. On
introduit ainsi une nouvelle classe de fonctions, plus régulières que les fonctions continues,
pour lesquelles de nombreuses propriétés peuvent être étudiées.
Dans ce but, l'idée centrale est que pour une fonction dérivable sur un intervalle, on peut
passer de la propriété purement locale de dérivée en un point à des propriétés globales qui
mettent en jeu les valeurs de la fonction en des points éloignés. L'outil central dans cette
direction est le théorème des accroissements finis, qui relie le taux d'accroissement de la
fonction entre deux points a et b aux valeurs de la dérivée aux points compris entre a et b.
Dans le cas des fonctions à valeurs réelles, il est possible de montrer que ce taux d'accroissement
doit être atteint par la dérivée entre a et b, en d'autres termes qu'il existe t E [a, b] tel que
f'(t) = 'Tuf(b). De ceci on déduit de nombreux renseignements si l'on connaît la dérivée en
tout point. Le plus évident est que si cette dérivée est partout nulle, la fonction ne peut pas
varier, puisqu'alors son taux d'accroissement entre deux points doit être nul. De même, si la
dérivée est partout positive, la fonction doit être croissante, etc. Ces idées sont couramment
utilisées dans les classes secondaires, mais elles ne peuvent être correctement établies qu'à
partir du théorème des accroissements finis.
Lorsque l'on connaît la vitesse moyenne d'un mobile entre deux instants, il est immédiat de
retrouver la distance parcourue entre ces deux instants, en multipliant cette vitesse moyenne
par l'écart temporel. La question naturelle est alors de savoir comment retrouver la distance
parcourue par le mobile si l'on connaît à tout instant sa vitesse instantanée. De manière plus
précise, supposons que le mobile soit situé au point O sur la droite, à l'instant t = 0, et que
l'on connaisse sa vitesse v(t) à tout instant t. On veut alors trouver la fonction « distance à
0 », f, nulle au début de l'expérience, telle que la dérivée f'(t) soit égale à v(t) à tout instant
t. Une telle fonction f s'appelle une primitive de v. Là encore, un procédé de passage à la
limite est clairement nécessaire. La première idée est de découper l'intervalle temporel [O, t] au
moyen d'une subdivision donnée O = to < t1 < · · · < tn = t, dont le pas~= max(ti+ 1 - td
est très petit par rapport aux variations de la vitesse, de reconstituer la distance parcourue
en additionnant les distances parcourues sur chacun des intervalles de la subdivision, ce que
l'on fait au moyen du taux d'accroissement entre les intervalles de la subdivion, ce taux
d'accroissement étant supposé bien approché par la vitesse instantanée en un point de la
subdivision. La mise en forme de cette idée est simplement un passage à la limite lorsque le
pas de la subdivision tend vers O.
En disant ceci, nous employons les idées couramment utilisées au XIXe siècle, mais nous
n'avons aucune garantie que le procédé que nous venons de décrire reconstitue effectivement
569
la fonction f souhaitée. Il est clair qu'une condition de régularité doit être imposée à la vitesse
v pour que ces intuitions soient légitimes. On peut montrer que c'est en particulier le cas
lorsque la fonction v est continue. En d'autres termes, toute fonction continue possède une
primitive.
Ces idées sont intimement reliées à un autre problème de grande importance, celui du calcul
des aires. Il est facile de montrer pourquoi, au moins de manière intuitive. Considérons une
fonction v de lR dans JR, que nous supposerons positive pour simplifier. Pour t 2': 0, notons
f(t) l'aire de la région R(t) du plan limitée par l'axe des abscisses, l'axe des ordonnées, le
graphe de v et la droite verticale d'abscisse t. Admettons qu'il existe une fonction « aire ».vl,
définie sur l'ensemble des parties de JR 2 et à valeurs positives, telle que l'aire d'un rectangle
[a, b] x [c, d] soit égale à ( d- c)(b - a) et telle que si une région A du plan est contenue dans
une région B du plan, l'aire du complémentaire .vl(B \ A) = .v/(B) - .vl(A). On en déduit
en particulier que .vl(A) :::; .v/(B) si A C B. Tout ceci n'est pas entièrement justifié, mais
on peut considérer que ces hypothèses sont légitimes dans le cas des parties que nous allons
considérer.
Fixons a 2". O. Alors par hypothèse
La région R( a+ t) \ R(a) est contenue dans le rectangle [a, a+ t] x [O, sup[a,a+tl v], et contient
le rectangle [a, a+ t] x [O, inf[a,a+tl v], son aire vérifie donc
Si l'on suppose que v est continue, et si t tend vers 0, alors inf[a,a+tJV tend vers v(a) et
sup[a,a+tl tend vers v(a), ce qui montre que
0
a a+t
Nous venons donc de vérifier que la dérivée de f au point a est v( a), ce qui montre que f
est bien une primitive de v. Le chapitre 27 établira ces raisonnements intuitifs sur des bases
solides, essentiellement en fondant la notion d'aire pour une classe de parties du plan bien
construite.
◊ Les fonctions élémentaires. Les notions de continuité, dérivation et intégration que nous
venons d'évoquer permettent à leur tour de construire des fonctions à partir des fonctions
570
rationnelles. Les fonctions dites élémentaires, exponentielle, logarithme, cosinus, sinus, tan-
gente, sinus hyperbolique, cosinus hyperbolique, tangente hyperbolique, peuvent toutes être
construites et parfaitement définies par ce moyen. L'étude de ces fonctions sera donnée en
détail au chapitre 28. Nous allons simplement ici préciser la portée de ces constructions.
Le fonction logarithme ln est définie sur lR';_ comme la primitive de la fonction continue
x H 1/x qui s'annule au point 1. Cette fonction est donc dérivable, de dérivée strictement
positive, il en résulte qu'elle est strictement croissante et continue, et possède donc une ré-
ciproque qui est aussi continue, que l'on note exp. C'est en général ainsi que l'on résume la
construction de ces fonctions. Mais il faut souligner l'extraordinaire raccourci que représentent
ces conventions et notations. Par exemple, en utilisant la notion de somme de Riemann, que
nous verrons au chapitre 27, une écriture moins condensée pour ln x serait
n-1 x-1
ln x lim .L,
= n-->oo n+ k{ x- 1) .
k=Û
expx = lim (1 +
n------,oo
~)n
n
On en déduit donc l'égalité
1 n-1 X- 1 m
X= lim (1
m-->oo
+- lim ' -
m n-->oo L n - --)
+ k( X - 1)
.
k=Û
pour tout réel x. Bien entendu, les fonctions élémentaires permettent d'éviter ce genre de
... lourdeurs. Mais il faut toujours garder présent à l'esprit le fait que les quantités que
l'on manipule en analyse, des nombres réels aux fonctions, des dérivées aux intégrales, sont
toujours définies au moyen de l'outil essentiel de limite.
Chapitre 21
LA DROITE RÉELLE
'ENSEMBLE des nombres réels R sur lequel est fondé toute l'analyse est à la fois proche de
Par conséquent, ces nombres irrationnels, dont le développement décimal est infini et très
complexe, échappent à notre intuition. Pourtant, on ne peut s'en dispenser pour faire des
mathématiques, et ce d'autant plus que la presque totalité de l'ensemble des réels est formée
par les irrationnels (dans un sens qui sera précisé dans la suite du cours).
Au début du xe siècle, un même mot, celui de adad (nombre), apparaît dans les mathéma-
tiques arabes, aussi bien dans la désignation des nombres rationnels ( al-addad al-muntiqa)
que dans celle des nombres irrationnels ( al-addad al-summa), montrant ainsi que les algéb-
ristes arabes voient une unité dans ces nombres. Les mathématiciens arabes Abu Kamil,
Al-Samaw'al, Al-Karagi, élargissent alors le calcul aux nombres irrationnels et tendent à s'af-
franchir de la vision géométrique des nombres (longueurs, aires, volumes) qui est celle des
Grecs, pour aller vers une vision plus arithmétique : on passe des grandeurs incommensu-
rables aux nombres irrationnels.
Cependant, il fallut attendre le XIXe siècle pour qu'on dispose de constructions formelles
et rigoureuses de ces nombres, abandonnant tout recours à la géométrie. Comme nous le
verrons dans les chapitres suivants concernant les fonctions, une réforme de l'analyse tendant
vers une plus grande rigueur s'amorce au XIXe siècle, sous l'impulsion de Cauchy, Bolzano et
Weierstrass. Toujours est-il qu'au milieu du XIXe siècle, aucune théorie vraiment satisfaisante
des nombres n'a encore été proposée, aucun fondement logique de «l'arithmétique» n'est
disponible.
C'est en particulier pour des raisons pédagogiques (pour construire son cours de calcul
différentiel à l'université de Berlin sur des bases rigoureuses) que Weierstrass décide de combler
cette lacune. En 1863, il propose une construction de la droite réelle. En 1872, deux autres
constructions du même type sont publiées, une première due à Cantor et Heine, et une seconde
due à Dedekind (Stetigkeit und irrationale Zahlen), que nous développerons en complément
de ce chapitre.
Concernant la première d'entre elles, Méray a, dès 1869, fait paraître une construction des
réels qui en est assez proche. Pour la seconde, Dedekind a en fait conçu cette théorie dès 1858
1
Et même, dans la vie de tous les jours, uniquement des nombres décimaux.
L.:. et, là encore, c'est par une réflexion trouvant son origine dans des questions d'enseignement
qu'il y est conduit 2 . La préface de Stetigkeit und irrationale Zahlen, dont suit ici un extrait,
en témoigne.
Ainsi de plusieurs manières équivalentes, le corps des nombres réels était construit rigou-
reusement à partir de celui des rationnels, eux-mêmes construits à partir des entiers. C'est
donc avec l'axiomatisation des entiers naturels par Peano en 1889 que l'édification de cette
«tour» de nombres, partant de N et allant à IR, s'appuyait enfin sur des bases logiques, ri-
goureuses, purement arithmétiques et indépendantes de tout recours à des « évidences » géo-
métriques.
De gauche à droite, Karl Wilhelm Weierstrass (1815-1897), Georg Ferdinand Ludwig Philipp
Cantor (1845-1918) et Giuseppe Peano (1858-1932)
2
Notons à ce propos que c'est aussi de la volonté d'écrire un ouvrage didactique, qui rompe avec les livres
faisant autorité en analyse au début du xx• siècle et soit fondé sur une parfaite rigueur, qu'est né le groupe
Nicolas Bourbaki.
573
Définition 21.1. Six E (Q, on définit la valeur absolue de x, notée lxl, par lxl = max(x, -x)
(l'ordre étant total, les éléments x et -x sont toujours comparables, et max(x, -x) est par
définition le plus grand des deux).
On a alors la proposition suivante, dont l'utilisation est permanente.
l}O:S lxl. =
2) lxyl !xlh,I.
S:}tx:+ 1:11 :5 !xi + lyl. 4} llxl -'- IY!l:5 lx - y!.
Une dernière propriété importante concernant le corps des rationnels est qu'il possède la
propriété d'Archimède (on dit aussi qu'il est archimédien), c'est-à-dire que pour tous rationnels
3
Par exemple i et ½représentent le même nombre rationnel.
574
a> 0 et x 2:'. 0, il existe un entier naturel n tel que x :S na. Pour le voir, écrivons x = p/q
et a= u/v, où p 2:'. 0,q > 0,u > 0,v > 0 sont des entiers. Alors x/a = (vp)/(uq), donc
t vp - x/a = (uq - 1)x/a 2:'. 0, ce qui montre que l'entier n = vp est supérieur à x/a, donc
an 2:'. x (par compatibilité).
Ce caractère archimédien de l'ensemble des rationnels a pour conséquence que l'ordre sur
IQl vérifie la propriété suivante : entre deux rationnels x et y vérifiant x < y, il existe toujours
un rationnel différent de x et de y. En effet, il existe un entier n strictement supérieur au
rationnel positif 1/(-y - x), et donc x < x + 1/n < y.
En effet, par l'absurde, si -/2 était rationnel, il s'écrirait sous la forme a/b avec a et b
entiers naturels non nuls et donc on aurait a 1 = 2b 1 ; l'entier n = a1 = 2b 2 aurait donc, selon
qu'on le voit comme a 1 ou comme 2b 1 , un nombre pair de 2 ou un nombre impair de 2 dans
sa décomposition en facteurs premiers, contredisant ainsi l'unicité de cette décomposition.
Il est important de s'arrêter un instant sur la démonstration que nous venons de donner.
Il faut en effet bien voir que le terme -/2 n'y est pas défini. Plaçons-nous dans la peau d'un
membre de l'École pythagoricienne essayant de comprendre l'étrange propriété de la diagonale
d'un carré que nous venons d'évoquer. Considérons un carré dont le côté a pour longueur
l'entier l, ce qui veut dire qu'il est l fois plus long qu'un segment unité. On se demande si la
diagonale de ce carré a elle aussi pour longueur un multiple D de celle du segment unité, soit
2
donc D EN*. Mais ... Pythagore dans son célèbre théorème montre que l + l2 = D , soit
2
2 2 , soit encore 2 = (D/l)2. Ceci entraîne donc que le nombre rationnel D/l a
donc 2l = D
pour carré 2. Or le cœur de la démonstration précédente est précisément qu'il n'existe aucun
rationnel dont le carré est 2 : c'est ce qui troublait les pythagoriciens.
Pour comprendre notre formulation moderne du problème, admettons maintenant l'exis-
tence d'un corps ordonné R de« nombres», contenant Q comme sous-corps, et dont la relation
d'ordre prolonge celle de Q (au sens où elle coïncide avec celle de Q sur les couples de ra-
tionnels). Supposons de plus que pour tout rationnel positif r, il soit possible de trouver un
unique élément s > 0 de R tel que s 2 = r, que l'on note s = Jr. Dans ce nouvel ensemble
R, l'équation 2 = (D/l) 2 est équivalente à D/l = vl, et ce que nous venons de montrer
s'écrit en fait v1 E R \ Q. Bien entendu, un exemple d'un tel corps R est introduit dans les
classes secondaires, c'est le corps des réels, et son utilisation nous paraît maintenant intuitive
et naturelle. Le raisonnement précédent portant sur v1 nous est donc facilement compréhen-
sible : nous interprétons maintenant la longueur de la diagonale du carré de côté l comme un
nombre, D = vll, et comme v1 n'est pas rationnel, let D ne peuvent être commensurables.
Mais une telle construction n'était pas à la portée des pythagoriciens, et on mesure à quel
point la définition claire des quantités qu'ils considéraient pouvait poser des problèmes.
Bien que le corps des réels soit d'une utilisation fréquente, sa construction n'est pas simple.
Nous allons donner dans ce chapitre une idée intuitive de sa nature. Nous verrons plus loin,
en complément au chapitre 22, une construction, due à Cauchy. Mais avant d'introduire les
notions nécessaires à une véritable formalisation des notions, et pour permettre au lecteur de
former son intuition des divers problèmes, nous allons donner quelques exemples supplémen-
taires de même nature que celui que nous venons de considérer.
Les nombres réels et les symboles que nous utilisons dans ces exemples ont le sens usuel
introduit dans les classes secondaires, rappelé dans la première partie de ce livre.
On peut utiliser l'idée précédente, basée sur l'unicité de la décomposition en facteurs
premiers, pour prouver l'irrationnalité d'autres nombres.
EXEMPLE 21.3.
► Nous allons d'abord vérifier que pour tout entier premier, fo est irrationnel. Raisonnons
par l'absurde. Si fo était rationnel, donc de la forme u/b, a et b entiers, on aurait pb = u ,
2 2
d'où une puissance de p impaire dans le membre de gauche et paire dans celui de droite,
contredisant ainsi l'unicité de la décomposition en facteurs premiers.
► Plus généralement, montrons que sin E N, vn est rationnel si et seulement si n est un
carré parfait (de la forme m ,2
où m EN). En effet, sin est un carré parfait, vn est un entier
donc c'est un rationnel. Inversement, par l'absurde, sin n'est pas un carré parfait, alors l'un
au moins de ses diviseurs premiers, que nous noterons p, apparaît avec une puissance impaire
dans la décomposition en facteurs premiers de n. Si donc vn est rationnel, il s'écrit u/b
avec a et b entiers d'où nb 2 = u 2 , ce qui contredit à nouveau l'unicité de la décomposition
en facteurs premiers, le nombre p étant nécessairement affecté d'une puissance impaire dans
le membre de gauche et d'une puissance paire dans celui de droite.
► Montrons enfin que les nombres v1 + v'3 et v1 + v'3 + v'6 sont irrationnels. En effet, si
T = v1 + v'3 était un rationnel, on aurait en élevant au carré 5 + 2 v'6 = r 2 et donc v'6 serait
576
rationnel, ce qui n'est pas, compte tenu de ce qui précède et du fait que 6 n'est pas un carré
parfait. Posons s = v1. + J3 + v6. Si s était un rationnel, on aurait v1. + J3 = s - v6,
d'où en élevant au carré, 5 + 2v6 = s 2 + 6- 2sv6, ou encore 2(s + l)v6 = s 2 + l. Mais
alors, nécessairement s + 1 = 0 sans quoi v6 serait rationnel. Or s > 0, donc on ne peut
avoir s + 1 = O.
Voici maintenant un autre exemple utilisant la fonction logarithme.
EXEMPLE 21.4.
► Montrons que log 10 2 est irrationnel. En effet, s'il existait deux entiers non nuls a et b tels
que ln 2/ ln 10 = u/b, on aurait b ln 2 = a In 10 c'est-à-dire 2b = 2°5°, ce qui contredirait
l'unicité de la décomposition en facteurs premiers. Plus généralement, on voit facilement que
pour n E N*, log 10 n est soit entier, soit irrationnel.
4
Nous ne nous intéressons qu'aux nombres positifs pour l'instant.
577
On vérifie facilement que si la partie A possède un plus grand élément, alors il est unique.
En effet, supposons que µ et µ' soient deux plus grands éléments de A. Alors par définition
même µ::::; µ' et µ' ::::; µ. Il en résulte bien µ = µ', puisque ::::; est une relation d'ordre. On
peut donc parler sans ambiguïté du plus grand élément de A. De même, la partie A possède
au plus un plus petit élément.
Définition 21.7. Soit E un ensemble muni d'une relation d'ordre total notée::::;, et soit A
une partie non vide de E. Un élément µ* de E sera appelé une borne supérieure de A si µ*
est un majorant de A et si c'est le plus petit élément de l'ensemble des majorants de A. Un
élément>'* de E sera appelé une borne inférieure de A si .,. est un minorant de A et si c'est
le plus grand élément de l'ensemble des majorants de A.
On vérifie facilement que si A possède une borne supérieure, alors elle est unique. Même
propriété pour la borne inférieure. On parle donc sans ambiguïté de la borne supérieure ou de
la borne inférieure d'une partie, lorsqu'elle existe.
La définition d'une borne supérieure ou d'une borne inférieure peut se réécrire de la manière
suivante, plus formalisée, qui est aussi un moyen pratique de les reconnaître.
EXEMPLE 21.8. Nous avons déjà remarqué que la partie (Q)~ C (Q) n'a pas de plus petit
1 élément. Mais elle possède une borne inférieure, qui est O.
Notons que pour qu'une partie A admette une borne supérieure (resp. inférieure), il est
nécessaire, par définition même, qu'elle soit non vide et majorée (resp. minorée).
La proposition suivante donne un exemple d'une partie non vide et majorée de (Q), sans
borne supérieure. Cet exemple est à la base de la construction du corps des réels par la
méthode des coupures de Dedekind.
578
A = {x E Q, x2 i 2},
Prppositiôn'.21:11. l,e •corps dés réêls est archirn~îên, ·C 'est.:.iJ,-âfre que pqui'J1Jfiî~~tll;;êt
tout b E R';., on peut trouver un entier n Ê N tel que nb > a. · ·· · · · ·
PREUVE. Supposons que pour tout n E N, nb :S: a. Alors la partie N = {nb In E N} est
non vide, et majorée par a. Elle possède donc une borne supérieure, que nous noterons ex. Par
définition, puisque b > 0, il existe un élément x de N qui vérifie x 2: ex - b. Par définition de
la partie N, il existe n E N tel que x = nb. On obtient donc nb 2: ex - b, et donc
où les égalités et inégalités font intervenir les diverses propriétés de R que nous avons rap-
pelées. Mais (n + 2)b est un élément de N, par définition, et l'inégalité précédente contre-
dit le fait que ex est un majorant de N. L'hypothèse initiale est donc fausse, ce qui prouve
notre proposition. ■
On dit aussi que le corps des réels possède la propriété d'Archimède. Si on se donne sur la
droite idéalisée une unité de mesure, cette propriété d'Archimède traduit simplement le fait
qu'on peut dépasser toute longueur en mettant bout à bout, un certain nombre de fois, des
segments de longueur égale à l'unité de mesure. En utilisant cette propriété, la proposition
suivante prouve qu'on peut encadrer toute longueur à l'aide de cette unité.
Proposition 21.12; Soit a> O. Six ER, il existe un ùnique k E Z tel que
On peut imaginer sur la droite réelle l'ensemble aZ = {na I n E Z} comme une «échelle» in-
finie d'unité a. Ce qui précède montre que tout réel est contenu entre deux échelons consécutifs
de cet ensemble. Si l'on fixe a= 1 et si on applique à un réel x la proposition 21.12, on obtient
un unique entier p vérifiant p :S: x < p + 1. L'entier p est le plus grand entier inférieur ou égal
à x, il sera noté [x].
Définition 21.13. Soit x un réel. Il existe un entier [x], appelé la partie entière de x, qui
est caractérisé par les propriétés
EXEMPLE 21.14.
► Comme 7 est strictement entre 4 et 9, alors v7 est strictement compris entre 2 et 3. On
déduit alors que [vl] = 2.
Rappelons maintenant que la valeur absolue d'un réel, comme celle d'un rationnel, se
définit par
't/x E IR, lxl = max(x,-x).
Comme dans le cas des rationnels, on a le résultat suivant.
Les inégalités 3) et 4) forment les deux parties de ce qu'il est convenu d'appeler l'inégalité
triangulaire.
À titre de dernier exemple, nous allons montrer une inégalité fondamentale entre nombres
réels.
soit encore (X1Y2 - X2Y1 )2 qui est bien un réel positif. On peut alors chercher à généraliser
cette approche pour tout n. On vérifie alors (voir le chapitre 6) que
cf. cf.
i=l
xf)
i=l
yf)-(f. XtYtf =
i=l
L_
1::;i<j::;n 1::;i<j::;n
2
(xfiJf+xf1d-2xtXjYtYil = L_ (XtYj-Xjyt) ?: 0
- SiL.~=l xf = 0, tous les termes Xi sont nuls, et l'inégalité que l'on veut montrer est triviale.
Si L.:i xf > 0, <D((X) est un trinôme du second degré en (X. Comme il est positif, son
discriminant doit donc être négatif ou nul, ce qui s'écrit précisément
.....
C'I
..d
u
et prouve notre inégalité. ■
Un intervalle de lR est une partie de l'une des formes précédentes. On dit que ]a, b [ est un
intervalle ouvert, que [a, b] est un intervalle fermé, et que [a, b[ et ]a, b] sont des intervalles
semi-ouverts. On dit que] - oo, a[ et ]a, +oo[ sont des intervalles ouverts, et que] - oo, a]
et [a, +oo[ sont des intervalles fermés.
Notons en particulier que 0 = ]a, a[ est un intervalle, et que les singletons {a} = [a, a]
sont des intervalles.
PREUVE. Si I est un intervalle, l'assertion est claire par transitivité de la relation d'ordre.
Réciproquement, soit I une partie vérifiant la condition de la proposition. On note d'abord
que si I est vide, I est un intervalle, et c'est terminé.
Supposons maintenant la partie I non vide et bornée, et notons a = inf I et b = sup I.
Alors ]a, b[ C I. En effet, si u E ]a, b[, par définition des bornes inférieure et supérieure, il
existe x E I tel que a S x < u et il existe y E I tel que u < y S b. Il en résulte que u E [x, y],
donc u E I puisque [x, y] C I.
Par ailleurs, si x > a alors x (/: I, puisque a est un majorant de I. De même, si x < b,
alors x (/: I. Il en résulte que I C [a, b].
Comme ] a, b [ C I C [ a, b], on a donc les possibilités suivantes : I =] a, b [, I = [a, b [,
I = ]a, b] ou I = [a, bl, donc I est un intervalle.
584
Supposons maintenant I non vide, minorée et non majorée. Alors si a = inf I, on voit que
pour tout u > a, il existe x E I tel que a :S: x < u, par définition de la borne inférieure, et il
existe y E I tel que u < y puisque I est non majoré. On en déduit que u E [x, y] C I, donc
u E I. Donc I = [a, +oo[ ou I = ]a, +oo[.
Si I est non vide, majorée et non minorée, alors on montre de la même manière que I est
de la forme] - oo, b] ou] - oo, b[. Enfin, on montre que si I est non vide, non minorée et non
majorée, nécessairement I = lR. ■
Corollaire 21.20.
1) Sf Lest 1in
intt!~l~. non 'Ili.de,
1-oô,siipl[ôùl;;:.:~oi:liSÛplJ.· .. .
m,a,joré et non tni1ll>ré de R" alors I est. de la forme
. . . . .
2) Sq. est ufiint~le no,n ¼Jidef mîtk>ré 'èt n~~. tfwj~ di/fi./ -~,iits'f ~t de la forme
Jinfl,+®[pitr fwf t:~f. · . ..
3) Si l'ést• un inler11aUë n~·fJide, mi,noré et majfké, ·îl•'estâe Îfl7orint3/]infl;supl{,
[fufl; supl], HmI, siip I} ôtl, lînft, SÛp If. ,·· .
Il est toujours possible d'échanger des intervalles bornés de même nature par une applica-
tion affine très simple.
Terminons cette partie par une représentation très utile des intervalles de lR.
Il existe bien entendu des représentations analogues pour les intervalles semi-ouverts bornés
ou ouverts bornés. Terminons en signalant qu'un intervalle à la fois fermé et borné, c'est-à-dire
de la forme [a, bl, avec ( a, b) E ~ 2 , a :S: b, est encore appelé un segment.
Peut-on transformer l'intervalle [O, 1[ en l'inter- Peut-on transformer l'intervalle [O, 1 [ en l'inter-
valle ]O, 1] par une application affine? valle [O, +oo[ par une application affine?
Notons que les inclusions IntA CA et AC AdhA peuvent être strictes. Par exemple, on
voit facilement que l'intérieur de l'intervalle [O, lJ est l'intervalle JO, 1 [, alors que l'adhérence
de l'intervalle JO, 1 [ est l'intervalle [0, lJ.
PREUVE. Montrons la première égalité. Soit a E A. Alors tout intervalle ouvert contenant
a rencontre A, donc aucun tel intervalle n'est contenu dans AC, donc a (/:. Int AC, ce qui
montre que a E (IntAc)c. Donc AC (IntAc)c. Réciproquement, soit a E (IntAc)c. Alors
a(/:. Int AC, ce qui signifie qu'aucun intervalle ouvert contenant a n'est contenu dans Ac_ Donc
tout intervalle ouvert contenant a rencontre A, ce qui montre que a E A. Donc (Int A cl c C A,
et on a montré la première égalité. La seconde se montre par passage au complémentaire. ■
Définition 21.25. Soit A une partie de R On dit que A est ouverte (ou est un ouvert)
lorsque pour tout x E A, il existe un intervalle ouvert I de lR tel que x E I et I C A. On dit
que A est fermée ( ou est un fermé) lorsque son complémentaire Ac est ouvert.
L'exemple suivant fait le point sur la terminologie déjà utilisée pour les intervalles, qui
pouvait paraître étonnante dans le cas des intervalles non bornés.
EXEMPLE 21.26.
► Soient a et b dans JR, a :S b. Alors l'intervalle ouvert Ja, b[ est un ouvert de JR, et
l'intervalle fermé [a, bJ est un fermé de R
► Soit a E R Alors les intervalles [a, +oo[ et J -oo, aJ sont des fermés de JR, et les intervalles
Ja, +oo[ et J - oo, a[ sont des ouverts de R
► Notons aussi que 0 et lR sont à la fois ouverts et fermés.
Proposition· 21/J/l.
< ' - -- _- --
Définition 21.28. Soit a E lR. Une partie de lR est un voisinage de a si elle contient un
intervalle ouvert contenant a.
Par exemple, l'intervalle (0, 1[ est un voisinage de tout point de JO, 1[, mais ce n'est pas un
voisinage de O.
PREUVE. En effet, supposons que A est un voisinage de chacun de ses points. Soit, pour
tout x E A, un intervalle ouvert lx tel que X E lx et lx C A. Alors
ce qui montre que A est la réunion d'une famille d'intervalle ouverts, qui sont ouverts dans
JR, donc c'est un ouvert par la proposition 21.27. ■
Définition 21.30. Une partie A de lR est dite dense dans lR (ou simplement dense) lorsque
tout intervalle ouvert non vide de lR contient un élément de A. De manière équivalente, la
partie A est dense si et seulement si A = lR.
587
Cette définition est bien compatible avec le commentaire précédent. En effet, nous verrons
que la distance la plus naturelle entre éléments de lR est simplement la valeur absolue de
leur différence, soit d(x,-y) = lx - -yl. Dans ces conditions, supposons la partie A dense
dans lR suivant notre définition. Alors, si x est un réel donné, et si E: > 0 est donné, on
considère l'intervalle I = ]x - E:, x + d. Il existe un point -y de A contenu dans I, on a alors
d(x, -y)= lx--yl < r, ce qui montre que A est dense suivant notre approche intuitive initiale.
Montrons maintenant une proposition fondamentale. ......
N
,.d
Proposition :U.3l. L'ensem§le Q,des mtionrrels est dense dans R.
u
PREUVE. Soit I = ]a, b[ un intervalle ouvert non vide. Comme lR est archimédien, il existe
n EN tel que n > 1/(b - a), soit encore 1/n < b - a. Alors si m = [an], on obtient
m m 1
-<a<-+-
n - n n
C'est la densité de (Q dans lR qui sera exploitée de multiples manières dans le chapitre sur
l'approximation des réels. Nous allons aussi voir un autre exemple de parties denses dans la
partie suivante.
PREUVE. Soit I = ]a, b[ un intervalle ouvert non vide. Comme précédemment, il existe un
entier n tel que n > 1/(b - al, soit encore 1/n < b - a. Alors si m = [an]/v12, on obtient
v12m v12m 1
--<a<--+-
n - n n
EXEMPLE 21.33.
► Nous avons vu que (Q est dense dans JR, c'est-à-dire que tout intervalle ouvert non vide
de lR contient un rationnel. Ceci montre que ij = JR, et là encore on voit que l'inégalité est
stricte. On voit de même que lR \ (Q = R
► On voit aussi que Int (Q = 0. En effet, comme tout intervalle ouvert de lR contient un
irrationnel, par le point précédent, on voit que aucun point de (Q ne peut être contenu dans
un intervalle ouvert contenu dans (Q. De même, on montre que lnt (JR \ (Q) = 0. On peut
aussi utiliser la proposition 21.24 et voir que
EXEMPLE 21.35.
► Soient u, v deux réels strictement positifs. L'ensemble
G ={nu+mv (n,m) E Z2 }
1
est clairement un sous-groupe de (:IR,+), on vérifie d'ailleurs que c'est le sous-groupe engendré
par la partie {u, v}, nous le noterons aussi< u, v >. D'après ce que nous venons de montrer, il
est donc soit dense, soit monogène. Précisément, il est monogène (resp. dense) si et seulement
si u et v sont commensurables (resp. incommensurables), c'est-à-dire si leur rapport est
rationnel (resp. irrationnel). En effet supposons par exemple u et v commensurables. Il
589
existe alors un rationnel p / q > 0 (avec p et q premiers entre eux) tel que v = up / q. Par
suite
G = {nu+ mv 1 (n, m) E ::t:2} = {nu+ mup/q 1 (n, m) E Z::2}
donc
G ={(qn+pm)u/q 1 (n,m) E Z 2 }.
Le théorème de Bézout nous montre que {qn + pm (n, m) E Z 2} = Z, puisque pet q sont
1
EXEMPLE 21.36. Un réel est dit dyadique lorsqu'il est de la forme n/2m pour n E Z et
m EN. On note çg l'ensemble des réels dyadiques. Montrons que çg est dense dans R
► L'ensemble çg est un sous-groupe de R En effet O E çg, et si d = n/2m et d' = n' ;2m'
sont deux réels dyadiques, avec par exemple m' :::: m
iR = lR U {-oo, +oo}.
On définit sur ÏR une relation d'ordre, que nous noterons encore :S:, qui coïncide avec la relation
d'ordre usuelle sur JR, et qui se prolonge de la manière suivante
Vx E JR, -oo < x < +oo ; -oo :S: -oo, +oo :S: +oo.
Ainsi, :S: est une relation d'ordre total sur ÏR, et l'ensemble ÏR possède un plus grand élément
+oo et un plus petit élément -oo. On voit que si l'on adopte les notations d'intervalles valables
sur tout ensemble totalement ordonné, il y a exactement quatre type d'intervalles dans ÏR
2
où ( ex, 13) E ÏR avec ex ::::; 13. Notons aussi qu'un intervalle de la forme] a, +oo[ dans ÏR coïncide
avec la partie de lR que l'on note de la même manière. Il en va de même pour tous les types
d'intervalles non bornés de R
Il est aussi possible de faire des conventions permettant dans une certaine mesure de
prolonger les lois + et • de lR à la droite numérique achevée. On pose
Notons que les lois ainsi prolongées ne sont pas partout définies, on ne peut pas par exemple
écrire (-oo) + (+oo) ou (+oo) · O.
1) Sur le groupe (JR 2 , +), on définit une loi x (encore notée ·) par
lzl = o# z= o, lzz'I = lzllz'I, lzl = lzl, llzl - lz'II ::::; lz- z'I ::::; lzl + lz'I.
La dernière propriété s'appelle l'inégalité triangulaire.
591
III. EXERCICES
L'ensemble 21.5.
Soient A et B des parties non vides de IR+. On 1. Montrer que G est un sous-groupe de IR. On
définit l'appelle le groupe des périodes de f.
AB= {ab, a E A, b E B}. 2. Donner des exemples de fonctions où G est
monogène puis des exemples où G est dense.
Montrer que si A et B sont majorées, alors AB
l'est aussi et que
21.7.
sup(AB) = supAsup B.
Soient a 1, • • • , Un des nombres réels stricte-
Est-ce encore vrai si A et B contiennent des réels
ment positifs. Donner une condition nécessaire
négatifs? et suffisante pour que le sous-groupe de (IR, +)
engendré par ces nombres, c'est-à-dire
21.4.
Le réel
soit dense dans R
Chapitre 22
LES SUITES RÉELLES OU COMPLEXES
E chapitre consacré à l'étude des suites sera l'un des plus longs et fondamentaux de
Archimède développe une méthode dite centes de périmètres, obtenues, pour l'une,
d'exhaustion, qui consiste, pour calculer une par des polygones réguliers inscrits et, pour
telle aire, à encadrer la surface entre deux l'autre, par des polygones réguliers circons-
autres dont la différence des aires est aussi crits, dont il fait croître le nombre de côtés.
petite que l'on veut. Dans son De la quadra- Il obtient ainsi l'encadrement suivant :
ture de la parabole, il établit par exemple la
proposition suivante :
« un segment quelconque compris par une
droite et une parabole est égal à quatre fois
le tiers d'un triangle qui a la même base et
la même hauteur que le segment. »
Pour ce faire il est amené à travailler avec
une suite géométrique de raison 1/4, dont il
doit sommer les termes, en évitant toutefois
la somme infinie et en se contentant de ma-
nipuler la suite des sommes finies.
Un autre exemple dû à Archimède est
son calcul approché de 7t par la méthode dite
des isopérimètres, consistant à approcher le
périmètre d'un cercle par deux suites adja- Archimêde (287-212) avant J.-C.
1
Par exemple, l'aire d'un disque.
594
Un autre exemple célèbre et significatif nous est donné au début de notre ère par Héron
d'Alexandrie pour le calcul approché des racines carrées 2 • Cet algorithme se trouve dans son
manuscrit intitulé Les Métriques, rédigé en grec et retrouvé à Constantinople au début du
xxe siècle. Il fait état des connaissances des mathématiques grecques de l'époque et il y figure
en particulier la fameuse formule dite de Héron, donnant l'aire S d'un triangle en fonction de
ses côtés a, b, c, à savoir S = Jp(p - a}(p - b}(p - c) (où p désigne le demi-périmètre du
triangle). Prenant par exemple un triangle de côtés a = 7, b = 8 et c = 9, Héron obtient
pour aire v1720. Pour calculer une valeur approchée de cette grandeur, avec une précision
arbitraire, il propose la méthode suivante :
« Puisque 720 n'a pas de côté rationnef3, nous extrairons le côté avec une très petite diffé-
rence comme il suit. Comme le premier nombre carré4 plus grand que 720 est 729 qui a pour
côté 27, divise 720 par 27; cela fait 26 et 2/3; ajoute 27 : cela fait:' 53i; prends-en la moitié :
cela fait 26K Ainsi donc le côté de 720 sera très proche de 26K En fait, 26~ multiplié
par lui-même donne 720SG, de sorte que la différence est 1/36. Si nous voulons rendre cette
différence inférieure encore à 1/36, nous mettrons 720SG trouvé auparavant, à la place de 729
et, en procédant de la même façon, nous trouverons que la différence est beaucoup plus petite
que 1/36. »
Ce faisant, Héron écrit 26 2 < 720 < 27 2 puis encadre v1'fi6 entre 720/27 = 26 + 2/3 et
27 dont il prend la moyenne, puis recommence. En traduction moderne, il propose la suite
itérative
Un +Un) , Uo =27,
lln+l = l1 (720
dont nous montrerons un peu plus tard qu'elle a effectivement pour limite le réel v1'ff6.
Une autre suite célèbre dans l'histoire est manière générale (en supposant l'absence de
celle de Fibonacci, prototype d'un système mortalité), Un+2 = Un+1 +Un. Le comporte-
dynamique discret et modélisant la repro- ment de cette suite (dite suite de Fibonacci)
duction des lapins! À l'instant initial n = 0 lorsque n devient grand est alors gouverné
nous avons un couple de lapins nouveau- par le mythique nombre d'or cl> = 1+j5.
nés qui ne pourra se reproduire qu'à par-
tir de l'âge de deux mois (n = 2, l'unité de
temps est le mois) pour donner alors chaque
mois un autre couple de lapins, chacun de
ces couples de lapins se reproduisant selon
le même schéma. Si on note Un le nombre
de couples de lapins à l'instant n, on a alors
uo = 1, u, = 1, u 2 = 1 + 1 = 2 et de Léonard de Pise, dit Fibonacci ( vers
1170-1250)
Avertissement. Dans ce chapitre, pour donner des exemples explicites, nous ad-
mettrons les propriétés usuelles des fonctions élémentaires. Ces propriétés seront
démontrées au chapitre 28.
2
Nous l'étudierons en détail dans le chapitre consacré aux fonctions dérivables.
3
Ne pas oublier la vision géométrique des nombres (des grandeurs) qu'ont les Grecs; 720 est vu ici comme un
carré au sens géométrique du terme et extraire la racine carrée de ce nombre, c'est donc trouver le côté d'un
carré d'aire 720.
4
Il faut entendre par là carré parfait, c'est-à-dire le carré d'un nombre entier.
5
Il ne s'agit pas ici, et dans la suite, d'un produit mais d'une somme; lire 53j comme cinquante trois deux
tiers, c'est-à-dire 53 + 2/3.
595
La suite est dite réelle si elle est à valeurs dans lK = JR, complexe si elle est à valeurs ~
Cl)
dans lK = C (noter que ces deux définitions ne s'opposent pas : une suite réelle est aussi une ...
,Cl)
[fJ
suite complexe). On note (UnlnEI la suite qui, à l'entier n, fait correspondre le nombre u,,_. Le 1l
nombre u,,_ est appelé le terme d'indice n de la suite (UnlnEI· Par souci de simplification et -~
par commodité, on ne considérera ici, sauf indication contraire, que des suites à valeurs dans j
[fJ
lK définies sur N tout entier. On laisse au lecteur le soin de vérifier que les résultats que nous
C'Ï
allons énoncer restent valables dans le cas d'autres ensembles d'indices, comme par exemple <N
N*.
.d
u
EXEMPLE 22.2. Voici différents exemples de suites, définies de diverses manières sur divers
ensembles d'indices.
1) La suite de terme général ✓n - 4 définie à partir de n 2: 4.
2) La suite (unlnEN de terme général Un= n 2 sin est pair et u,,_ = ~ sin est impair.
cosn+i .
3) La suite complexe de terme général . . définie sur N tout entier.
1 +ismn
4) La suite (wnlnEN dont le terme général est donné sous forme récurrente par Wo = 1 et
1 +wn
Wn+l = - - - 2 .
n+wn
Définition 22.4. Une suite (UnlnEN de lK est dite bornée si l'ensemble de ses valeurs est
borné, c'est-à-dire s'il existe un réel M > 0 tel que \ln EN, lunl :S M. On dit aussi dans ce
cas que la suite (UnlnEN est bornée par M.
Le lecteur pourra aisément vérifier qu'une suite réelle est bornée si et seulement si elle est
minorée et majorée.
596
EXEMPLE 22.5. Soit (unlnEN la suite réelle définie par Un= ✓n4 + 1-n2 . Elle est minorée
1 par O et majorée par 1 car O :::'.Un:::'. ✓n + 2n + 1 - n = 1.
4 2 2
EXEMPLE 22.6. Soit (UnlnEN la suite complexe définie par Un= vnl n:i.
+1.n
Nous avons
vn+T
lunl = ✓f+nl. Comme, pour tout n EN, vn+T : :'. ✓ 1 + n 2 , on peut alors conclure que
1 +n 2
la suite (unlnEN est bornée par 1.
Dans cette partie, nous donnons la définition formelle de la notion de limite de suite. La
convergence d'une suite (UnlnEN vers une limite C signifie, d'une manière intuitive, que le
terme Un est aussi près que l'on veut de C à condition de choisir n assez grand.
Définition 22.7. Soit (UnlnEN une suite de K On dit que (UnlnEN converge vers CE li{ (ou
que (unlnEN tend vers C) quand n tend vers l'infini si
Une suite (Un)nEN est dite convergente s'il existe un élément C E li{ tel que (UnlnEN converge
vers C. Une suite qui n'est pas convergente est dite divergente.
Le lemme suivant montre que si une suite (UnlnEN est convergente, elle converge vers un
unique élément de K
PREUVE. Soit E > 0 un nombre réel strictement positif. Par définition, il existe N E N et
N'EN tels que IUn - Cl< c/2 pour tout n 2'. Net IUn, - C'I < c/2 pour tout n' 2'. N'. Soit
n un entier plus grand que max{N, N'). L'inégalité triangulaire montre que
Ainsi IC - C'I < E, et cela pour tout E > 0, ce qui entraîne que C- C' = O. ■
lim Un= C.
n--l-too
597
EXEMPLE 22.9. Montrons que si p E N*, la suite de terme général Un= 1/nP converge
vers O.
► Remarquons d'abord que pour n E N*, nP 2: n, et donc 0 ~ Un ~ 1/n. Soit f > 0 fixé.
Alors comme IR est archimédien, il existe N E N tel que N > 1/ f. Donc pour n 2: N
EXEMPLE 22.10. La suite (unlnEN définie par Un= (-l)n est divergente.
► En effet, supposons qu'une telle suite soit convergente et de limite C. Appliquons la dé-
finition de la convergence avec f = 1 : il existe un entier N tel que lun - Cl < 1 pour tout
n 2: N. Or, pour n = 2N, cette inégalité donne Il - Cl< 1. De même, pour n = 2N + 1, on
obtient 1-1 -Cl< 1. Ainsi, on a 2 = Il - (-1)1 = 1(1 -Cl - (-1 -C)I ~Il-Cl+ 1-1 -Cl< 2,
ce qui est absurde. Nous avons donc démontré que la limite C n'existe pas. La suite (unlnEN
est bien divergente.
EXEMPLE 22.11. Soit (UnlnEN une suite convergente de limite C. Montrons que la suite
(lunllnEN est convergente de limite ICI.
► Pour f > 0, il existe un entier N tel que si n 2: N, alors lun - Cl < f. Or, l'inégalité
triangulaire montre que llunl - ICII ~ IUn - Cl. On en déduit que lltinl - ICII < f pour tout
n 2: N, ce qui démontre notre assertion.
Une conséquence immédiate mais importante de la convergence d'une suite est donnée par
la proposition suivante.
Prop~niôn2i~~t:'f'ri1tt~"'s'iiaii è,iff/µ:j~ft.Jè~~?',: ....
PREUVE. Soit (UnlnEN une suite convergente de limite C. Appliquons la définition de la
convergence avec f = 1 : on peut trouver un entier N tel que IUn - Cl < 1 pour tout
n 2: N. L'inégalité triangulaire montre alors que ltinl < 1 + ICI pour n 2: N. On en dé-
duit que ltinl est majorée par max(luol, lu, 1, ... , luN-1 I, 1 + ICI) pour tout n EN, ce qui prouve
notre assertion. ■
1
EXEMPLE 22.13. Montrons que la suite (unlnEN* définie par Un= nn converge vers 1.
► On remarque d'abord que la suite est minorée par 1. Soit E > 0 un nombre réel strictement
positif. Montrons que n¼ < 1 + E pour n assez grand, ce qui équivaut à n < (1 + E)n. La
formule du binôme de Newton montre que (1 + E)n = 1 + nE + n(n - 1)é: 2 /2 +•••+En.
Comme tous les termes du second membre sont positifs, pour avoir n < (1 + E)n, il suffit que
n soit strictement inférieur à n(n - 1 )é: 2 /2. Ceci a lieu sin est strictement plus grand que
1 + 2/E: 2 . Ainsi, choisissons N strictement plus grand que 1 + 2/E: 2 . Alors pour tout n ~ N,
on a 1 :Sn¼ < 1 + E, ce qui prouve notre assertion.
Notons que l'exemple précédent repose sur le caractère archimédien de la droite réelle.
Nous utiliserons à l'avenir ce type de propriété sans le rappeler systématiquement. On a aussi
utilisé les propriétés de la fonction iy, que nous verrons en détail au chapitre 25.
L'espace des suites de 1K est muni naturellement d'une structure d'anneau, et même d'algèbre.
Lorsqu'une notion d'analyse vient se greffer sur une structure algébrique, il est tout naturel
d'en étudier la compatibilité avec les lois de composition de la structure. Dans cette partie,
nous allons donc étudier comment la notion de limite se comporte en regard des opérations
algébriques sur les suites et nous obtiendrons ainsi des règles générales de calcul sur les limites
de suites.
P,;op~jj;ton,,i2.)S-D· $i.!~lliEN•etJ-~1n:lnéN.•.~.~~e.\
S'ltÎte ~tiergertte~-Îii.li.miti éstiii
~ietJr,J~~.·~•.·'n~,
somme des$~@f{il;,,Jfiê?< ètlvn.)~)\\jifiit·en~~
lim (u,.+vnl = lim
n-i+oo · · · · · n-i+oo
fun Vn.
Un+ n-+foo
PREUVE. Soit E > 0 un nombre réel strictement positif. Appliquons la définition de la
convergence des deux suites avec E/2: il existe deux entiers N et N' tels que !Un - fi< 1 si
n ~ N et lvn - f'I < 1 sin~ N'. En utilisant l'inégalité triangulaire, on obtient
é: é:
IUn +vn - (f + e'll = l(Un -fl + (Un -e'll :s: IUn - fi+ lvn -e'I <
2+ 2 = E
pour tout n ~ max(N, N '). On a donc trouvé un entier N" = max(N, N ') qui vérifie IUn +vn -
(f + e') 1 < é: pour tout n ~ N ". Comme le nombre réel é: > 0 était arbitraire, la proposition
~M~~- ■
599
EXEMPLE 22.16. Il est équivalent de dire qu'une suite (unlnEN converge vers f et que la
suite de terme général Un - f converge vers O. C'est immédiat à partir de la définition, et rJJ
on le vérifie aussi en remarquant que (unlnEN est la somme de (Un - flnEN et de la suite
constante de valeur t
i
<:)
g
Test 22.5. Test 22.6. rJJ
Donner l'exemple de deux suites divergentes Soient (unln20 une suite convergente et ~•V
~
dont la somme est une suite convergente. (vnln20 une suite divergente. La somme de rJJ
~
III.2. Le produit de deux suites c--i
a
N
Définition 22.17. Le produit de deux suites (UnlnEN et (vnlnEN est la suite dont le terme
d'indice n est UnVn. On la note (Un)nEN · (vnlnEN, soit (UnlnEN · (vnlnEN = (UnVnlnEN·
- - , - - ,-
1) ~'11, iupposê; #e l11 stiitë {n;,.:..)JtEN ~ bôrnée et que la suité Vn est oonverpente êt de limite
nulle.. Alors le f)r(iàiJ,it {ù,i}~N , (v,;:};ne111 est une sùite c-0nvergente de limite nulle.
2) Or.su11pa~~.quëles,$Uik,d~lnElll .edvnlnEN sont deux suites convergente, de limites€
ètt' ~t#îepient; Alor;s leJ>roduit [Une)new · {vnlneN est une suite convergente de limite le
proif,ùit#l1 , !Ûnt encore . . . .
lim. {lln:W,}:,;:;. lim Un· lim Vn'.
n-t+oo · n-+too 11.-:,>+oo
PREUVE.
1) Supposons d'abord que la suite {vnlnEN converge vers zéro, c'est-à-dire que f' = 0, et que
la suite (UnlnEN est bornée. Montrons que le produit (UnlnEN · (vnlnEN converge vers zéro. Par
hypothèse, il existe un réel M > 0 tel que !Uni :S M pour tout n EN. Soit E > O. Appliquons
la définition de la convergence à la suite (vnlnEN avec c/M: il existe N EN tel que lvnl < c/M
pour tout n ~ N. Il en résulte que !UnVn - OI = !Unvnl :S Mlvnl < c, ce qui montre bien que
(UnlnEN · (vnlnEN converge vers zéro et prouve le premier point.
2) Supposons maintenant que les suites (UnlnEN et (vnlnEN sont convergentes et de limites
f E OC et f' E OC quelconques. Écrivons UnVn - U' = Un(Vn - f') + f'(Un - e). D'après
la proposition 25.57, la suite {UnlnEN est bornée car elle est convergente. Comme les suites
(vn -e'lnEN et (Un -flnEN convergent vers 0, le cas précédent montre que les suites de termes
généraux Un(Vn -e') et f'(Un -f) convergent et sont de limite nulle. La suite de terme général
UnVn - ff' est la somme de deux suites convergentes de limite nulle, donc elle converge et sa
limite est nulle, d'après la proposition 22.15. On a bien montré que la suite produit converge
vers U'.
■
EXEMPLE 22.19.
► La suite (';~:~)nEN est convergente et de limite nulle (la fonction cos est bornée par 1).
► La suite ( f!~ ( :¾))
1+ nEN est convergente de limite 1. Posons Un = ~:~ = 1 + n: 1 et
Vn = 1 + :¾-
La suite de terme géneral Un converge vers 1, en effet limn-->oo n:, = 0, comme
600
Définition 22.20. Le produit d'une suite (UnlnEN par un élément À de![( est la suite dont
le terme d'indice n est ÀUn. On la note À(unlnEN, soit À(UnlnEN = (ÀUn)nEN·
La suite À(unlnEN est donc le produit de la suite (UnlnEN par la suite constante de valeur
À. On déduit alors de la proposition précédente le résultat suivant.
Proposition 22.21. Soienn.. E K et (Un.}n€N ûne- sVJ.itè êonvér{Jêrite èt ili f:imite"e, AliJ~s
0
Définition 22.22. Soient (UnlnEN et (vnlnEN deux suites de K On suppose que tous les
termes Vn sont non nuls. Le quotient de (UnlnEN par (vnlnEN est la suite dont le terme
d'indice n est Un/Vn. On la note (Un)nEN/(vnlnEN, soit (Un)nEN/(vnlnEN = (un/vnlnEN·
PREUVE. Montrons d'abord que la suite (1 /vnlnEN est bornée. Comme f' est non nulle,
appliquons la définition de la convergence de la suite (vnlnEN avec E = Wl/2 : il existe N E N
tel que lvn - e'I < 1€'1/2 pour tout n 2 N. Or, l'inégalité triangulaire montre que WI - lvnl :::;
lvn - f'I. Il en résulte que lvnl 2 Wl/2 pour tout n 2 N. Posons
Alors R est strictement positif et minore la suite ( lvnl lnEN. On a donc ( 1/lvnl lnEN :::; 1/R pour
tout entier n.
601
. . n 2 -3n+2
EXEMPLE 22.24. Montrons à l'aide de la formule du quotient que hm = 1.
n-.+oo n 2 + n + 1
► On ne peut appliquer directement la proposition 22.23 au quotient des suites définies par
Un = n 2 - 3n + 2 et Vn = n 2 + n + 1 puisque ces deux suites ne sont ni convergentes, ni
même bornées. En revanche, on peut factoriser et simplifier le numérateur et le dénominateur
de la fraction Un/Vn par n 2 .
1-3/n+2/n2
1 + 1/n + 1/n2"
Le dénominateur de cette fraction ne s'annule jamais, et les suites définies par 1-3/n+2/n2
et 1 + 1/n + 1/n 2 convergent toutes deux vers 1. Le résultat découle donc maintenant
immédiatement de la proposition 22.23.
Il en résulte que lxn - xi < E pour tout n :2: N, ce qui montre que la suite (xnlnEN converge
bien vers x. L'assertion analogue concernant la suite (-YnlnEN se prouve de la même manière.
o Inversement, on suppose que les suites (xnlnEN et (-YnlnEN sont convergentes. Comme la
suite (unlnEN est la somme de la suite (xnlnEN et de la suite (i-YnlnEN, les propositions 22.15
et 22.21 montrent que (UnlnEN est convergente et que sa limite vérifie les deux relations de la
proposition. ■
PREUVE. Soient e la limite de (unlnEN et e' la limite de (vnlnEN· Soit E > 0 un nombre
réel strictement positif. Écrivons la définition des limites de (UnlnEN et (vnlnEN avec E.
603
Il existe N EN et N'EN tels que f-t: <Un< f+t: pour tout n ~Net f'-t: < Vn < f'+t:
pour tout n 2:: N'. Posons N" = max(N, N'). Alors (/J
pour tout n 2:: N". Il en résulte que f- f' < 2t:, et cela pour t: > 0 quelconque. On en déduit
que f - f' :S 0, ce qui démontre la proposition. ■
ig
(/J
(/J
pour garantir la convergence, comme l'illustre la proposition 22.27 connue sous le nom de
théorème des gendarmes : il faut deux «gendarmes» (vnlnEN et (wnlnEN pour encadrer le 1(/J
«galopin» (unlnEN et l'empêcher de s'enfuir. j
Proposition 22~27. Soient. (Un}nel'h {vn)neN et (wnlneN trois suites réelles. On suppose
que pour t()ut n € N, on a l. 1encadrement
Vn :5 Un :5 Wn•
On sup~osè en outre que tês siiilfJS{'\>n}iiê:111 et (wnlneN œn11èrgênt 'OerS une mtme limite
t E .R. Alors la suite (UnJnEN ê$t tga'li:trleft.t convergente et de mtme limite t.
PREUVE. La démonstration est analogue à la preuve de la proposition 22.26. Soit t: > 0
un nombre réel strictement positif. Par définition de f, il existe N E N et N' E N tels que
e- E < Vn < e+ E pour tout n ~ N et e- E < Wn < e+ E pour tout n ::::: N'. Posons
N" = max(N, N'). Alors, pour tout n ~ N", on a les encadrements
f- E < Vn :S Un, :S Wn < f + f..
On en déduit aisément que IUn - fi < t: pour tout n 2:: N 11 • Comme le nombre t: > 0
était arbitraire, on reconnaît la définition de la convergence de Un vers f, ce qui prouve la
proposition. ■
La minoration est évidente car n!Un, = 1 + 2! + • • • + n! est une somme de termes positifs. La
majoration vient de ce que l'on peut majorer les n - 2 premiers termes de la somme n!un
par (n - 2)!. On a donc
n!un - n! :S (n-2)((n- 2)!) + (n -1)! :S (n-1 )((n- 2)!) + (n-1 )! = 2((n- l )!).
Nous avons donc, pour tout n 2:: 1, l'encadrement suivant :
2((n-l)!)+n!_ 2
1 :S Un :S I - 1 + -.
n. n
Comme la suite de terme général 1 + 2/n converge vers 1, qui est aussi la limite de la suite
constante égale à 1, le théorème des gendarmes montre que la suite (UnlnEN est convergente
et de limite égale à 1 .
604
Il y a donc en général tout à gagner, quand on a le choix, à employer des inégalités larges
en analyse, plutôt que des inégalités strictes 6 .
Thêorême 22.3(k 'lbiite smtç réêlle craj,ssante et )naj<Ytit:, est convergente, de limite la
borne S1J,1)ffl-ev.re de t'ensembli Je ses valeurs. Toute suite réèlle1 dé~afl.te .et mi1Ul'rée €$t.
èonuergênte, .de limite la borne inférieure de l'ensemble de ses valeurs.
PREUVE. Soit une suite réelle (UnlnEN croissante et majorée. On note i la borne supérieure
de l'ensemble de ses valeurs, qui existe bien puisque cet ensemble est non vide et majoré.
Soit f. > 0 un nombre réel strictement positif. Par définition de i, il existe n 0 E N tel que
i - f. < lino ~ i. De plus, la croissance de la suite montre que lino ~ Un pour tout n 2 n 0.
6
Ceci est d'autant plus légitime que l'erreur commise en remplaçant une inégalité stricte par une inégalité large
est, en général, plus petite que celle commise en substituant une inégalité stricte à une inégalité large. Par
exemple, soit x un nombre réel. Supposons que la seule propriété de x que l'on sache montrer est que x < O.
Alors, remplacer l'inégalité x < 0 par x :S 0, revient à rajouter la possibilité que x = O. Supposons au contraire
que la seule propriété que l'on sache montrer sur x est que x :S O. Alors, remplacer cette inégalité par une
condition de la forme x < c impose de choisir c > 0, ce qui revient à rajouter la possibilité que x E]O, c[ et ce
dernier intervalle est infiniment plus gros que le singleton {O}.
605
PREUVE. Montrons la première propriété. Siµ= supA, c'est un majorant de A par défini-
tion, et pour tout n E N*, il existe un élément Un E A tel que µ - 1/n < Un S a. On voit
facilement que la suite ( unlnEN* ainsi obtenue converge vers a.
Réciproquement, si µ est un majorant et si (anlnEN est une suite d'éléments de A qui
converge vers a, pour tout é: > 0, il existe n E N tel que µ - é: < Un S µ, ce qui montre que
µ- é: n'est pas un majorant de A. Il en résulte donc que µ est le plus petit des majorants de
A. Doncµ= supA. ■
On vérifie de plus que dans le point 1), la suite peut être choisie croissante, et que dans
le point 2), la suite peut être choisie décroissante.
606
On peut maintenant déduire du théorème 22.30 une conséquence très importante dans la
pratique : le principe de Cantor des intervalles emboîtés. Il relie le comportement des suites
monotones, qui est de nature analytique, à celui des suites d'intervalles de IR, qui est de nature
géométrique.
Théorème 2~.84. .· 'PtJiaf tout:ti . E N,· sôit In = fctn, ttJ i;n ·intêroâitè nhn. Wde de a.. ··Or,;
suppose satis/aitis lès êoiul.itiom' S'IJ,1,f!tlntés : · · · ·· ·
1) In+l ~t inclus dans I~i
2) In èst un intervalle Jermé et borné.
Alors les suites {On)n€N eflbn)neN coru1ergent, lin.in....,,.,. «n S litnn➔oo bn, et
PREUVE. La première hypothèse du théorème montre que la suite ( Un)nEN est croissante,
(bn}nEN est décroissante et, pour tout n E N et tout p E N, on a Un ::::; bp. D'après le
théorème 22.30, la suite (unlnEN, croissante et majorée par bp, pour p E N fixé, converge
vers une limite que l'on note u et qui satisfait l'inégalité u ::::; bp pour tout p E N. De la
même manière, la suite (bn}nEN, décroissante et minorée par toute valeur de la suite (un)nEN,
converge vers une limite que l'on note b et qui vérifie l'inégalité Un::::; b pour tout n EN.
On a l'encadrement Un ::::; u ::::; b ::::; bn pour tout n E N, ce qui montre l'inclusion de
l'intervalle [u, b] dans l'intersection de tous les In. Inversement, six E In pour tout n EN, alors
Un::::; x::::; bn. Il en résulte en passant à la limite que u::::; x::::; b d'après la proposition 22.26.
Ainsi x E [u, bl, ce qui montre que l'intersection de tous les In est incluse dans [u, b].
Par double inclusion, on a montré que nnEN In= [u, b] et cette intersection est donc un
intervalle non vide, fermé et borné. ■
Définition 22.35. Deux suites réelles (UnlnEN et (vnlnEN sont dites adjacentes si elles vé-
rifient les conditions suivantes :
1) (unlnEN est croissante;
2) (vnlnEN est décroissante;
3) la suite (Un -vnlnEN converge vers O.
Comme on peut le pressentir, deux suites adjacentes convergent et elles ont la même limite.
Théotème 22.36. Soit(11n).IËN et{vn.)n.eN deux suites adjacentes. Alors
me~;
1} elles sont êo'live1rJènièi et 'ortt limite,
2} leuf'lirnîte ~~ ft1i'l'ifie Un :5 t :5 Vn. pour tout n E .N.
PREUVE. Posons Wn = Vn -Un,. On remarque que Wn+l -Wn = (Vn+l -Un.+1) - (vn -un) =
(vn+l -vn) + (Un - Un.+1) :s; O. Ainsi la suite (wnlnEN est décroissante et converge vers zéro.
Il en résulte en particulier que Wp :s; Wn pour tout p 2 n. En prenant la limite quand p tend
vers l'infini, d'après la proposition 22.26, on a O :s; Wn, ce qui montre que Vn 2 Un- Ainsi,
les hypothèses du théorème montrent que la famille des intervalles définis par In = [Un, v,J
satisfait les conditions du théorème 22.34. Il s'ensuit que la suite (Un)nEN est convergente de
limite f, que la suite (vn)nEN est convergente de limite f' et que Un :s; f :s; f' :s; Vn pour
tout n E N. Mais f - f' = limn-Hoo(Un - Vn) = 0, ce qui montre que f = f' et conclut la
démonstration du théorème. ■
On peut noter qu'il n'est pas nécessaire de supposer que Un :s; Vn dans le théorème 22.36 :
cela résulte des hypothèses.
EXEMPLE 22.37. Définition du nombre e.
► Considérons la suite (UnlnEI\I* définie par Un= 1 +fi+ fi+···+ ,b pour tout n 2 1 et
posons Vn =Un+ ,b pour n 2 1. Vérifions que ces deux suites sont adjacentes. Nous avons
Un+i -Un= 1/(n+ 1)! > 0, donc la suite (unlnEN est croissante. De plus, on a
Ainsi, la suite (vnlnEI\I* est décroissante (et strictement décroissante à partir du rang n = 2).
Enfin, 0 :s; Vn -Un, = 1/n! :s; 1/n donc la suite (Un -vnlnEN* converge vers zéro, ce qui prouve
que les deux suites sont bien adjacentes. On note traditionnellement e leur limite commune,
on dit que ce nombre e est la base des logarithmes népériens. C'est le premier exemple que
nous rencontrons d'un objet défini comme limite d'une suite. On vérifie immédiatement que
2 < e < 3 en considérant les premiers termes des suites adjacentes précédentes.
EXEMPLE 22.38. Irrationnalité du nombre e.
► !
Supposons que e soit un nombre rationnel et écrivons e = où p et q sont deux entiers
naturels non nuls (avec q 2 2 puisque e n'est pas entier). En utilisant la deuxième propriété
du théorème 22.36 pour n = q + 1, on obtient, avec les notations de l'exemple 22.37, les
inégalités suivantes
1 1 1 p 1
] + -1! + -2! + · · · + -q ! = Uq < Uq+1 < - Vq+1 < Vq = 1 + -1! + -2! + · · · + -q ! + -
- e = -q < q !.
En multipliant par q! on obtient q!uq < p(q-1)! < q!uq+ 1. Or q!uq = q!+-y/+fi+· · ·+*1,
p(q - 1)! et q!uq + 1 sont trois nombres entiers. Mais il n'existe pas d'entier strictement
compris entre deux entiers consécutifs. Nous aboutissons ainsi à une contradiction, ce qui
prouve que e E JR\(Ql.
608
V. CRITÈRE DE CAUCHY
c;
_;m Jusqu'ici, pour montrer qu'une suite converge, il nous fallait deviner un candidat qui joue le
C:
< rôle de sa limite, puis montrer que les termes de la suite sont arbitrairement proches de ce
~ nombre candidat à partir d'un certain rang. Par exemple, pour montrer le théorème 22.30
u pour les suites croissantes, nous avons dû deviner que la limite a priori que la limite était la
t
cf borne supérieure des valeurs de la suite.
Pour construire des quantités définies a nous étudions dans cette partie.
priori comme limite d'une suite, il est pri-
mordial d'être capable de décider si une
suite converge, à partir des termes de la
suite, et sans nécessairement connaître la va-
leur de la limite. C'est ici qu'intervient la no-
tion de suite dont les termes sont arbitrai-
rement proches à partir d'un certain rang,
notion qui fut introduite par Cauchy et que Augustin-Louis Cauchy (1789-1857)
Définition 22.39. Une suite (UnlnEN de OC est une suite de Cauchy si elle possède la
propriété suivante :
Ve E JE.~, :3N EN tel que si p 2'. N et q 2'. N, alors lu,, - uql < E.
L'intérêt de cette notion vient de sa relation avec la notion de convergence, dont la proposition
suivante donne le premier élément.
Proposition 22~40. 'fqqte suite de K. qùi est convergente est une suîte;dêCàuchtJ;
La preuve précédente semble être due à Jacob Bernoulli, vers 1690, donc bien avant les
idées de Cauchy. Nous allons maintenant nous employer à démontrer la réciproque de la
proposition 22.40. Nous aurons besoin du lemme suivant.
PREUVE. Soit (UnlnEN une suite de Cauchy. Par définition, pour ë = 1, il existe N E N
tel que luN - Uql < 1 pour tout q 2 N. On en déduit que lunl - luNI ::::; luN - Uni < 1, r/J
soit encore que IUnl < 1 + luNI pour tout n 2 N. Ainsi, la suite (IUnllnEN est bornée par
max(luol, lu1I, ... , luN-11, luNI + 1).
PREUVE. Soit (UnlnEN une suite réelle de Cauchy. Pour n EN, notons En= {uk I k 2 n}.
~...
,Cl)
r/J
L'ensemble En est non vide et en vertu du lemme 22.42, il est borné. Il existe donc Un =
infEn et bn = sup En. Nous allons vérifier que les suites (unlnEN et (bnlnEN sont adjacentes. j
L'inclusion de En+l dans En, ce qui montre que la suite (unlnEN est croissante et que (bnlnEN r/J
j
est décroissante. Soit ë > O. Comme (UnlnEN est une suite de Cauchy, il existe N E N telle
c-i
que l11p - Uql < ë pour tout p 2 N et pour tout q 2 N. D'autre part, soit n 2 N. Il résulte C'I
ce qui montre que la suite (bn - unlnEN converge vers zéro. Les suites ( UnlnEN et (bnlnEN
sont donc bien adjacentes.
D'après le théorème 22.36, les suites (unlnEN et (bnlnEN convergent vers une même limite,
que nous noterons t Comme Un ::::; Un ::::; bn pour tout n E N, le théorème des gendarmes
montre que la suite (UnlnEN est convergente de même limite t, ce qui conclut la démonstration
du théorème. ■
PREUVE. Soit (Un)nEN une suite complexe de Cauchy. Les inégalités IJm(Up) - Jm(uq)I ::::;
l11p - Uql et l 9îe(11p) - 9îe(uq)I ::::; l11p - uql, montrent que la partie réelle et imaginaire de
la suite (UnlnEN sont des suites réelles de Cauchy. D'après le théorème 22.43 ci-dessus, elles
sont convergentes. En vertu de la proposition 22.25, la suite (UnlnEN est convergente, ce qui
démontre le théorème. ■
La condition donnée dans la définition 22.39 fournit ainsi une condition nécessaire et
suffisante pour qu'une suite converge, qui se formule à partir des termes de la suite, sans
référence à une expression possible de la limite. Ce résultat est assez important pour justifier
l'introduction d'un nouveau qualificatif.
Définition 22.45. Les corps IR et C sont dits complets, ce qui veut dire que toute suite de
Cauchy de IR ou C est convergente.
Comme la fonction cosinus est bornée par 1, l'inégalité triangulaire montre que
Comme 0 < k < 1, l'exemple 22.31 montre qu'il existe N E N tel que kP+l < (1 - k)E pour
tout p 2: N. Donc IUp - Uql < E si q 2: p 2: N. Ainsi, la suite (u1JnEN est de Cauchy. Elle
est donc convergente.
Les suites considérées dans cette partie sont toutes supposées réelles. Parmi les suites réelles
divergentes, certaines ont un comportement à l'infini plus régulier que d'autres. Par exemple, la
suite de terme général n 2 a tous ses termes aussi grands que l'on veut à partir d'un certain rang.
Au contraire, la suite de terme général Vn = nsin (2rrn/3) a des termes positifs arbitrairement
grands pour n de la forme n = 1 +3k, avec k EN, mais elle a aussi une infinité de termes nuls
puisque v 3 k = 0 pour tout k E N. Dans cette partie, nous allons étudier les suites divergentes
dont le terme général tend vers l'infini.
2) On dit que (Un)nEN tend vers -oo quand n tend vers l'infini, lorsque
On note alors lim Un= +oo dans le cas 1) et lim Un= -oo dans le cas 2).
n~+oo n~+oo
EXEMPLE 22.48. La suite de terme général vn tend vers +oo. En effet, pour A > 0, il
1 suffit de choisir N > A 2 .
D'après la définition, une suite qui tend vers +oo n'est pas majorée. De même, une suite
qui tend vers -oo n'est pas minorée. En général, la réciproque n'est pas vraie comme le montre
l'exemple suivant.
611
EXEMPLE 22.50. Soit (unlnEN la suite définie par U2n =net Uzn+l = 1. Cette suite n'est
1 pas majorée mais elle ne tend pas vers +oo. r/J
j
Test 22.21. Test 22.24.
~
0
(.)
Les propriétés suivantes sont-elles équivalentes? Une suite réelle de limite +oo est-elle croissante §
r/J
1) (unln::::o tend vers +oo ou tend vers -oo. à partir d'un certain rang? CL)
.. - -
lim Un z+oo
1). Si n,-.+oo ..
etsi (vn)neN est minorée, alors la suite (Un +vn.Jn.l':N tend vers +oo.
2) Si fun 1.1n,
n..... +oo
=~oo et si (v-n)nE'N est maJorée; alors la suite (u.,,, + vnJrieN tend vers :-oo.
PREUVE. Soit (UnlnEN et (vnlnEN deux suites réelles telles que (UnlnEN tende vers +oo et
que (vnlnEN soit minorée. Soit A un réel strictement positif et soit m un minorant de (vnlnEN·
Écrivons la définition de la limite de (UnlnEN avec le réel A+ 1ml : il existe N E N tel que
Un> A+ 1ml pour tout n :::=: N. Nous avons alors
car m minore Vn, ce qui démontre que lim (un +vn) = +oo. Le cas de la limite -oo se traite
n-++oo
de manière analogue. ■
Test 22.27. alors leur somme tend aussi vers +oo et que si
Montrer que si deux suites tendent vers +oo, deux suites tendent vers -oo, alors leur somme
tend aussi vers -oo.
612
EXEMPLE 22.53. Pour p EN*, la suite (nP)nEN tend vers +oo. On le vérifie directement
puisque nP 2: n, mais on peut aussi appliquer la proposition précédente au produit de p
suites de terme général Un= n (noter qu'une suite tendant vers +oo est minorée par un réel
strictement positif à partir d'un certain rang).
Comme tous les termes de cette somme sont positifs, on en déduit l'inégalité
613
soit encore an/(n(n-1)) 2 h 2 /2. Ainsi, la suite (an/(n(n-l)llnEN est minorée, pour
n 2 2, par le nombre h 2 /2 > O. Or, la suite (n - 1lnEN tend vers +oo. On en déduit que
Mais b > 1 car q :::,: 1 et a> 1. La suite de terme nPan a donc pour limite +oo car c'est le
bn ~
produit fini (q fois) de la suite - qui tend vers +oo. N
n .ci
ü
La fin de cette preuve repose sur les propriétés de la fonction {/, que nous verrons au
chapitre 25.
PREUVE. On suppose que la suite (UnlnEN tend vers +oo. Soit E > O. Pour A = 1/ E, il existe
NE N tel que Un> 1/E pour tout n 2 N. Nous avons alors pour tout n 2 N l'encadrement
0 < l/11-n < E, ce qui montre que la suite (1/unlnEN converge vers zéro. Dans le cas où la
suite (UnlnEN tend vers -oo, on se ramène au cas précédent en considérant la suite de terme
général -l/11-n. ■
614
EXEMPLE 22.57. On peut faire des variations sur les résultats précédents. Par exemple, la
3
1 suite de terme général Un= 1/[(-l)n (2 + cosn)n 4] converge vers O.
Définition 22.59. Soit une suite réelle (Un)n:,, 0. On dit que lim(11n) est la limite inférieure
de (Un)n2:o et que lim(Un) est la limite supérieure de (11nln20- Ces deux limites sont éléments rn
de R. ~
o.
L'intérêt du critère de convergence donné par le théorème ci-dessous vient du fait que les a
0
limites inférieure et supérieure, en tant que limite de suites monotones, sont plus faciles à CJ
::,
étudier que la convergence de la suite d'origine. 0
rJJ
~
4)
Théorème 22.60. Soit (unln>o une suite réelle. La suite (Un)n>o est convergente si et ...
,d)
=
seulement si lim(11n) lim(11nf ER. Dans ce cas, la suite (Un)n.e; converge vers la valeur rJJ
B
commune des limites inférieure et supérieure.
~
rJJ
PREUVE. Montrons que la condition est nécessaire. Supposons que (Un)nEN converge vers ~
CE Il et soit t: > O. Il existe N 2: 0 tel que C- E <Un< C+ t: pour tout n 2: N. On en déduit N
N
que ..d
u
C- E:::; UN:::; lim(un):::; lim(un):::; u~:::; f + L
Comme cela vaut pour E > 0 quelconque, il s'ensuit que f :::; lim(un) :::; lim(un) :::; C, ce qui
montre l'égalité des limites inférieure et supérieure, et de la limite.
Inversement, supposons que les limites inférieure et supérieure sont égales dans Il et soit
E > O. Alors, en écrivant la définition de lim(Un) et lim(Un) et en posant f = lim(un)
lim( 11n), nous obtenons les deux propriétés suivantes
o limite inférieure : :3p EN tel que u; 2: f - t:, donc Un 2: C- t: pour tout n 2: p;
o limite supérieure : :3q EN tel que u! :::; C+ t:, donc Un:::; C+ t: pour tout n 2: q.
On en déduit que C- t: :::; Un :::; C+ t: pour tout n 2: max(p, q). ce qui démontre que la
suite (UnlnEN est convergente, de limite C. ■
EXEMPLE 22.61. Soit (unlnEN la suite définie par U2n = (-l)n et U2n+l = n~l.
► Déterminons les suites (u~ln2:o et (u~ln2:o• On peut remarquer que tous les termes de la
suite (unln2:o sont compris entre -1 et 1. Nous avons, pour n EN, U2(2n+ll = -1 et U4n = 1,
on déduit alors que u~ = -1 et que u~ = 1. Nous avons donc lim(un) = -1 et lim(un) = 1.
Ces deux nombres étant distincts, la suite (unlnEN ne converge pas.
Commençons par une définition qui formalise l'idée qu'à partir d'une suite de valeurs de 1K
on obtient encore une suite en ne retenant qu'une partie des termes de la suite d'origine.
Définition 22.62. Soit (Un)nEN une suite de 1K. Une sous-suite, ou suite extraite, de
(unlnEN est une suite de la forme (vk)kEN, avec vk = U<j>(k) et cp : N ----, N une applica-
tion strictement croissante.
616
Définition 22.63. Soit (unlnEN une suite de 1K. On dit qu'un nombre t E OC est une valeur
d'adhérence de (UnlnEN s'il est limite d'une suite extraite de (UnlnEN·
EXEMPLE 22.64.
► La suite (Un+1 lnEN est une sous-suite de la suite (unlnEN : on a oublié le terme d'indice
nul et sélectionné tous les autres. La fonction cp : N ---, N correspondante est définie par
cp(n) = n + 1.
► La suite (u2nlnEN est une sous-suite de (unlnEPJ dont on a retenu les termes d'indices pairs
et dont on a oublié ceux d'indices impairs. La fonction cp : N ---l N correspondante est définie
par cp(n) = 2n. De même, la suite (u2n+1lnEN est une sous-suite de (unlnEN• avec cp: N---, N
définie par cp(n) = 2n + 1. Si par exemple Un= (-1)n, les suites (u2nlnEN et (U2n+ilnEN
sont les suites constantes de valeurs 1 et -1 respectivement.
► La suite (U(n+ll'lnEN est une sous-suite de (UnlnEN dont le nombre de termes oubliés entre
deux termes consécutifs retenus tend vers +oo.
On peut noter que dans tous les exemples que nous avons cités, on a cp(n) 2 n. En fait,
c'est toujours le cas comme le montre le lemme suivant.
Lemme 22.65, Si q>: N -t N est une application strictement croissante, alors q:,(n) 2: n
pour tout n EN.
PREUVE. On démontre par récurrence sur n l'inégalité (Hnl : cp(n) 2 n. Par hypothèse,
cp(O) E N donc cp(O) 2 0, ce qui montre (H 0 ). Soit n E N quelconque. On suppose que
pour cet entier n, l'inégalité (Hnl est vérifiée. Alors la croissance stricte de cp montre que
cp(n+ 1) > cp(n) 2 n, ce qui entraîne que cp(n+ 1) 2 n+ 1, où on reconnaît (Hn+il- On a
donc établi, par récurrence, l'inégalité (Hnl pour tout n E N. ■
Nous laissons le soin au lecteur de vérifier qu'une sous-suite d'une sous-suite est encore
une sous-suite (ce qui peut rendre bien des services). Nous allons maintenant étudier le lien
entre la notion de valeur d'adhérence et celle de convergence.
Proposition 22.66. Soit (Un)n.EN une suite convergente de limite e. Alors toute sous-suite
de (Un)nEN est convergente, de même limite e.
La proposition suivante donne une caractérisation des valeurs d'adhérence d'une suite.
Proposition 22.67. Le nombre t E ][( est une valeur d'adhérence de la suite (un)n.EN si et
seulement si
Ve E IR~, 'vN EN, 3n EN, n 2 N tel que !Un - t! < ê..
PREUVE. Montrons que la condition est nécessaire. Soit (unlnEN une suite de OC et soit
(U4>(kJlkEN une sous-suite, de limite t. Soient t: > 0 et N EN. Par définition de f, il existe un
617
entier N' tel que lu<l>(kJ - fi < E pour tout k 2 N '. Il suffit de choisir n = cp (max( N, N ')).
Comme cp est une application strictement croissante, on aura n 2 cp(N) 2 N et lun - fi< E. r/l
Inversement, on suppose que la condition de la proposition est satisfaite pour tout E > 0
et pour tout N 2 O. Pour E = 1 et N = 0, il existe un entier n 0 2 0 tel que luno - fi < 1.
On pose cp(0) = n 0 • Soit p 2 0 un entier quelconque. Supposons np = cp(p) construit tel que
l8
IUnp - €1 < 1/2P, alors la condition de la proposition appliquée à E = 1/2P+l et à N = np + 1 ;:l
0
montre qu'il existe np+ 1 2 np + 1 telle que IU-n,,+ 1 - fi < 1/2P+ 1. On pose cp (p + 1 ) = np+ 1 et r/l
J:l
on constate que cp(p + 1) > cp(p). On obtient ainsi par récurrence sur p EN une application aJ
•Il)
1-,
cp : N ---1 N strictement croissante telle que la sous-suite (Uq,[nJlnEN converge vers C, ce qui r/l
prouve que C est une valeur d'adhérence de la suite (UnlnEN et qui montre l'équivalence
annoncée. ■ ir/l
~
De manière équivalente, on voit que f E 1K est une valeur d'adhérence de la suite (unlnEN si
et seulement si pour tout E > 0, il existe une infinité d'indices n EN tels que f-E <Un< f+E.
Dans la preuve précédente, notons qu'on aurait pu choisir n'importe quelle quite (Ep)pEN
tendant vers 0, à la place de la suite (1/2P)pEN·
La proposition suivante établit le lien entre les valeurs d'adhérence d'une suite réelle bornée
et ses limites supérieure et inférieure.
Proposition 22.68. Toute suite (Un)nEN réelle bornée vérifie les deux conditions suivantes:
1) la limite inférieure de la suite (Un)nEN est la plus petite
t
de ses valeurs d'adhérence;
2) la limite supérieure de la suite (un)nEN est la plus grande de ses valeurs d'adhérence.
PREUVE. Montrons par exemple que la limite inférieure est une valeur d'adhérence de la
suite (unlnEN, le cas de la limite supérieure étant parfaitement analogue. Soient E > 0 un
nombre réel strictement positif et N un entier naturel. On pose f = lim(unl- Comme e est
la limite de la suite (u;;-)nEN, on peut trouver un entier N' tel que C- f. < u;;- < C+ E pour
tout n 2 N'. Posons m = max(N, N'). Nous avons donc C- E < u;:;:,_ < C+ f.. Par définition,
le réel u;:;:,_ est la borne inférieure de l'ensemble des uk pour k 2 m. Il existe donc un entier
p 2 m tel que u;:;:,_ s Up < l + E. Pour résumer, l'entier p vérifie les deux conditions p 2 N
et IUp - Cl < E, ce qui montre que C = lim(unl est bien une valeur d'adhérence de la suite
(unlnEN, par la proposition 22.67.
Soit maintenant une valeur d'adhérence Cde (UnlnEN· Il existe donc une sous-suite (uq,(k)lkEN
qui converge vers t Pour tout k EN, l'inégalité cp(k) 2 k entraîne que uk S U4>(kJ sut En
passant à la limite, on obtient lim(un) SC S lim(Un). ■
La proposition précédente montre en particulier que toute suite réelle bornée admet au
moins une valeur d'adhérence. Cette propriété est connue sous le nom de théorème de Bolzano-
Weierstrass.
Théorème 22.69. Toute suite bornée de 1K. admet au moins une valeur d'adhérence.
618
PREUVE. Si OC = JR, alors la suite admet au moins pour valeurs d'adhérence ses limites
supérieure et inférieure. Supposons que OC= C. On note (xnlnEN et (YnlnEN les parties réelle
et imaginaire d'une suite (UnlnEN complexe et bornée. Les inégalités lxnl S IUnl et IYnl S IUnl
montrent que (xnlnEN et (YnlnEN sont deux suites réelles bornées. Il existe une sous-suite
(Xcp(nJlnEN convergente. Or, la sous-suite (1J<1>(nJlnEN est bornée. En appliquant une seconde
fois le cas des suites réelles à la suite (1J4>(nJlnEN, on obtient qu'il existe une application
t)> : N --+ N strictement croissante telle que (1J4>(tJ,(nlJlnEN soit une suite convergente. Comme
la suite (Xcp(tJ,(nlJlnEN est également convergente d'après la proposition 22.66, il en résulte que
la suite (U4>[tJ,(nlJlnEN est convergente, ce qui démontre la proposition dans le cas des suites
complexes bornées. ■
Pour terminer, nous allons donner une caractérisation séquentielle très utile des éléments
adhérents à une partie de lR (voir le chapitre 21, partie 11.5).
Proposition 22. 70. Soit A une partie de R Un élément a est adhérent à A si et seulement
si il existe une suite ( a 11JnEN d'éléments de A qui converge vers a.
PREUVE. Soit a E AdhA. Alors tout intervalle de la forme ]a-1/n, a+ 1/n[, pour n EN*,
doit rencontrer A, ce qui signifie qu'il existe un élément CXn E] a - 1/n, a+ 1/n[ n A. La suite
(anlnEN* ainsi obtenue est donc une suite d'éléments de A, et elle converge vers a puisque
1<Xn - al < 1/n. On obtient aisément une suite indexée par N, vérifiant les mêmes propriétés,
en considérant Un= <Xn+l pour n EN.
Réciproquement, soit a E lR tel qu'il existe une suite ( anlnEN d'éléments de A qui converge
vers a. Soit E > O. Alors l'intervalle ]a - t:, a+ d contient un point am, et même une infinité,
par définition de la convergence. Donc am E]a - t:, a+ dnA. Si I est un intervalle ouvert
contenant a, il est clair que I contient un intervalle de la forme ]a - t:, a+ d avec t: > O. On
aura donc aussi A n I -1- 0, ce qui termine la preuve. ■
En retour, la notion d'adhérence d'une partie permet de donner une définition ensembliste
des valheurs d'adhérence d'une suite réelle, dont nous laissons la preuve au lecteur.
IX. EXERCICES
<Il
par, 22.6.
g
an-bn <Il
u =--- 11)
n an+bn· ~
Montrer que si les suites (u2nlnEN, (u2n+1lnEN •11)
1--
Etudier la convergence de (unlnê'.O· et (u3nlnEN sont convergentes, alors la suite rll
22.2.
(unlnEN est convergente.
i<Il
22.7. ~
Soit (unlnEN la suite réelle définie, pour tout
C'I
n EN, par C'I
Soient (un)n2'.0 et (vnln2'.0 deux suites bornées. ..d
ü
uo = 1 et Un+l = ✓ 1 +un. 1. Comparer lim(un+vn) et lim(un)+lim(vnl-
2. Montrer que si (vnln>o est convergente,
1. Montrer que pour tous n, m E N
alors lim(un +vnl = lim(u~) + lim Vn.
n------t+oo
lun-Uml 3. On suppose dans cette question que les deux
IUn+l -Um+ll S Z •
suites sont à termes positifs.
2. La suite (UnlnEN est-elle convergente? a. Comparer lim(unvn) et lim(Un)lim(vnl-
b. Montrer que si (vn)n2'.0 est convergente,
22.3. alors lim(UnVn) = lim(Un) lim Vn.
n------t+oo
22.15.
22.11.
1. Montrer que pour tout n E N, il existe
Soient k un réel positif et (Un)n?,:o une suite à
un unique réel Un dans l'intervalle ] - n/2 +
valeurs dans K tels que pour tout n E N
nn, n/2 + nn[ tel que tan Un = Un-
1Un+2 -1.1.n+1I S klun+l -1.1.nl. 2. Montrer que limn---->+oo Un = +oo.
l. Montrer que si k E [O, 1[, alors la suite 3. Que peut-on dire de la suite de terme général
(Un)n?,:1 est convergente. Un/n?
2. Etudier la convergence de la suite (un)n?::1
dans le cas où k 2:: 1.
22.16.
22.12.
Le terme uo étant donné dans un sous-ensemble
de lR convenable, que l'on déterminera, étudier
Soit (Un)n?,:o une suite à valeurs dans lRi. Pour la convergence des suites homographiques suc-
n EN, on pose Vn = Un+1/un et Wn = (un) l/n. cessivement associées aux homographies
On suppose (vnlneN convergente de limite l.
Montrer que (Wn) nEN est convergente de limite f()=4x+2 ()=7x-12
l. X X+5 ' g X 3x - 5 .
22.13.
(a) Dans le jeu des tours de Hanoï, des anneaux, de tailles décroissantes, sont enfilés sur un
axe (voir la figure 22.1). On dispose de deux autres axes libres. La règle du jeu impose que
l'on ne puisse sortir qu'un seul anneau à la fois du haut d'une tour pour l'enfiler sur un autre
axe, à condition qu'il repose sur un anneau plus grand. Elle interdit d'autre part de poser
l'anneau ailleurs que sur un axe. Est-il possible de déplacer tous les anneaux d'un axe sur un
autre et si oui, quel est le nombre minimum d'opérations nécessaires?
(b) Une personne contracte un emprunt de 100 000 euros sur 10 ans auprès d'un établissement
bancaire à un taux nominal annuel de 4%. A combien s'élèvent ses annuités mensuelles? Au
bout de deux ans, elle hésite entre rembourser par anticipation 50 000 euros en maintenant
le montant de ses annuités, et investir cette somme sur un placement sûr à un taux nominal
également de 4% pendant les 8 années restantes. Que lui conseillez-vous?
Ces deux problèmes ont l'air très différent. Et pourtant, leur résolution mathématique
conduit à des calculs similaires! Nous allons voir en effet que dans les deux cas, et contraire-
ment à ce que voudrait vous faire croire votre conseiller bancaire, il suffit de savoir calculer
les termes d'une suite arithmético-géométriq ue. Ceci montre bien le caractère universel des
méthodes que nous introduisons.
Proposition 22.73. Soient (a, b} E C 2 tel que a =/:- 1 et (Un)T\EN une suite de C qui 'Uérifie
la relation Un+1 = UUn + b pour tout n EN. Alors
'v'nEN, U n = b
--+a
1-a
n( b ) .
Uo---
1-a
b
PREUVE. On a montré que Un= C+ an(u0 - C) avec C= aC + b, soit encore C= - - - . ■
1 -a
a) (N, N - 1, ... , 1) 0 0·
b) (N,N-1, ... ,2) (1) 0·'
c) (N,N-1, ... ,3) (1) (2);'
d) (N, N - 1, ... , 3) 0 (2, 1) ;
e) (N,N-1, ... ,4) (3) (2, 1).
a) ---+ b) Le premier coup n'est pas très intelligent. Il s'agit de déplacer l'anneau 1 dans l'une
des deux autres tours. Comme le rôle des deux dernières tours est symétrique au début du
jeu, on a choisi de placer 1 sur la deuxième tour.
b )---+ c) Le deuxième coup est forcé. Il est en effet interdit de ramener 2 au dessus de 1. Il
serait possible, mais stupide, de ramener 1 à sa position de départ. Placer 1 sur la troisième
tour donnerait une position équivalente.
c)---+ d) Ramener 2 au dessus de 3 au troisième coup serait idiot. Il est interdit de bouger 3.
Mais 1 a deux options. Si on ne veut pas poser 1 au dessus de 2, alors 1 va indéfiniment aller
et venir entre la première et la deuxième tour.
d)--t e) Ne pas toucher à 3 obligerait 1 à faire indéfiniment des va-et-vient entre la première
et la troisième tour, à moins de revenir dans la position c). L'anneau 3 ne peut aller sur la
troisième tour. On obtient donc bien la position e) en quatre coups.
Remarquons que l'on a déplacé la pile (2, 1) du premier axe au troisième axe en 3 coups
(à l'étape d)), ce qui résoud le problème pour N = 2. Pour N ? 3, le jeu étant maintenant
dans la position e), nous arrivons au point clef du raisonnement. Imaginons par la pensée que
l'on enfonce les deux premières tours dans le socle du jeu. On obtient la nouvelle position
0 0 (2, 1).
Mais on sait maintenant déplacer une tour (2, 1 ). On obtient donc en 3 coups
0 (2, 1) 0.
En fait, les anneaux ne s'enfoncent pas dans le socle. Ce n'était pas prévu par le fabricant.
Par une même opération magique de la pensée, ils refont donc surface et on observe que les 3
mouvements précédents des anneaux 1 et 2 restent légaux. On a donc en réalité la position
(N,N-1, ... ,4) (3,2, 1) 0.
Proposition 22.74. Le nombre de coup$ minimum pour déplacer une pile de N anneaux
dans le jeu de Hanoi est 2N -1.
Par hypothèse de récurrence, il est possible de déplacer la pile (N, ... , 1) sur le troisième
axe en UN coups. On obtient
(N + 1) 0 (N, ... , 1) (22.1)
On utilise une seconde fois l'hypothèse de récurrence pour déplacer la pile (N, ... , 1) du
troisième axe sur le deuxième en UN coups. Et c'est gagné. On en déduit que UN+l existe et
que UN+l ~ UN+ 1 + UN = 2uN + 1.
o Inversement, soit un enchaînement de coups qui déplace la première tour sur le deuxième
axe. On considère la première position pour laquelle il est possible de déplacer l'anneau N + 1.
Cette position doit comporter nécessairement un axe libre, par exemple le deuxième, puisque
qu'on ne peut déposer N + 1 sur aucun autre anneau. Elle est donc de la forme (22.1) et elle
se présente après au moins UN coups car seuls les anneaux 1, ... , N ont été déplacés.
De même, considérons la position du jeu juste après avoir touché pour la dernière fois
l'anneau N + 1. Elle est de la forme (22.2), quitte à échanger les axes extrêmes, et il reste au
moins UN coups pour déplacer la pile (N, N - 1, ... , 1 ). Comme on a déplacé au moins une fois
l'anneau N + 1, nous comptabilisons déjà 2uN + 1 coups, ce qui montre que UN+l ? 2uN + 1.
Ainsi, le nombre UN existe pour tout N ? O. On obtient une suite (unlnEN qui vérifie
les conditions Uo = 0 et Un+l = 2un + 1 pour tout n E N. L'équation f = 2f + 1 donne
l = -1. D'après la proposition 22. 73, Un -1 + zn( 0 - (-1)) = zn - 1, ce qui prouve
notre assertion.
■
Remarque. Pour N = 9, si on considère qu'il faut en moyenne une seconde pour déplacer
un anneau, il faut environ 8 minutes et 30 secondes pour terminer le jeu. Pour N = 15, il faut
environ 9 heures 6 minutes et 7 secondes pour gagner, ce qui est déjà une performance, certes
complètement idiote. Pour N = 30, si on ne se trompe jamais, en travaillant à raison de 12
heures par jours, 7 jours sur 7, 365 jours sur 365, il faut un peu plus de 68 années, avec un
jour de repos gracieusement offert chaque année bissextile ... Pour N = 64, il faut, dans les
mêmes conditions, "un peu" plus de 11 milliards de siècles soit près de 100 fois l'âge connu de
l'univers. Seriez-vous surpris d'apprendre que ce jeu a été inventé7 par un mathématicien?
Revenons maintenant au problème des intérêts dus au banquier. Soit N E N le nombre total
des échéances mensuelles d'un emprunt. Pour O :S: n :S: N, soit Un le restant dû. Le nombre
Uo est donc le capital emprunté, et pour n = N la dette est épongée : UN = O. On note 't
le taux nominal annuel. Généralement, les banques prennent pour règle 8 que le taux mensuel
vaut 't 1 = 't/12. L'intérêt dû à la banque au mois n + 1 s'élève donc à In+l = 't 1Un. Soit b la
mensualité payée chaque mois. Le restant dû au mois n + 1 est donc
1
Un+l =Un+ 't Un - b,
soit encore 't
Un+i = UUn - b, avec u = 1 +
12 .
Au nième mois, la quantité In revient en intérêts à l'organisme prêteur, seule la somme
An = b - In = Un-1 - Un rembourse le capital emprunté. On l'appelle l'amortissement.
L'emprunt est donc entièrement décrit par la donnée de la famille (Un, In, Anlo,;;;n,;;;N- On
l'appelle l'échéancier.
Proposition 22.15. Soit (Un)ne111 une suite réelle et soit (a, b} E R2 tel que a > 1. On
suppose que Un+1 = aUn - b pour tout-n EN et qu'il existe N ~ 0 tel que UN= O. Alors
: a-1
'v'nEN, Un=~+an(Uo--b-) et . b =:uo 1-a-N
a-1 a-1
UN= 0 # ~1
u-
+ UN (uo - ~1) = 0 #
u-
b= Uo lu- l-N .
- u ■
On obtient les résultats suivants, avec des calculs très simples laissés à la charge du lecteur.
7
Par le français Édouard Lucas (1842-1891) connu aussi pour ses travaux en théorie des nombres.
8 12
C'est tout à leur avantage puisque ( 1 + TI) > 1 + -r pour -r > O.
Règle 22.76.
Soit C le capital emprunté, N le nombre d'échéances, b la mensualité et 'T le taux annuel.
On pose a= 1 + -r/12. On a alors les propriétés suivantes :
. -rC/12
1) pour (C, N,-r) donné, la mensualité est b = _ _,.;
1 0
2) la nième échéance donne b =In+ An avec
an- 1
(restant d{J.j et C - Un = Ca N _ (capital amorti),
1
-rC an-1
et An=u aN-1 (amortissement}.
3) pour (C, b,-r) donné, le nombre d'échéances est bien défini si et seulement si -rC < 12b.
C'est le plus petit entier N tel que a-N:::; 1 - ~;
. . b(l -a-N)
4) pour (b, N, 'T) donné, la capacité d'emprunt est Uo = -r/l2 .
1 4 1
C = 100000; N = 12 · 10 = 120.
T = 12 · 100 = 300 ;
D'après la règle 22.76.1), les mensualités sont de b '.: : '. 1012,45 euros et. au bout de 2 ans,
le restant dû est u 24 '.::::'. 83 060 euros. Si l'emprunteur rembourse par anticipation 50 000
euros, alors C' = 33060 euros restent dus. La règle 22.76.3) montre qu·en gardant les mêmes
mensualités, il ne reste plus que 35 échéances. L ·emprunt aura donc été remboursé en 5
ans. Sur les 5 autres années, on peut investir la somme b chaque mois sur un placement,
par exemple à 4%. Cela signifie que l'on capitalise chaque mois une somme Vn telle que
Vn+l = a'vn + b avec v 0 = 0 et, cette fois-ci . a'= (1 + T)
9 1112
. L'expression des termes Vn
est donnée par la proposition 22.73. Cinq ans plus tard. on dispose donc de
a'60 - 1
V Go = b ~ 67 003 euros.
a'- 1
Si, en revanche, on place C"=50 000 euros à -!o/c. l'évolution du capital est donnée par une
suite géométrique (v~lncN de raison a' et telle que Vo = C", soit au bout de 8 ans
La différence n'est donc pas très sensible et il faudra prendre en compte d'autres aspects
de la question (comme la facilité de mise en œuvre, la disponibilité de l'épargne, le coût de
l'assurance, l'évolution des taux d'intérêts, le facteur humain ... ) pour prendre une décision.
12
9
Car 1 + -r < (1 + TI) pour -r > O. Un banquier ne se trompe pas non plus dans ce sens-là.
COMPLÉMENT 2. LES SUITES HOMOGRAPHIQUES
Une fonction homographique est une fonction rationnelle, définie comme le quotient de deux
fonctions polynomiales à coefficients complexes, et injective sur son domaine de définition. On
peut montrer qu'une fraction rationnelle est injective si et seulement si elle est de la forme
EXEMPLE 22. 78. Cas où c = b = O. La suite définie par Un+i = ~Un est une suite géo-
métrique de raison a/ d.
On montre facilement par récurrence que Un= Uo ( ~) n_
► Si Uo = 0, (unlnEN est constante de valeur nulle.
► Si u 0 -/- 0 et la/ dl < 1, alors la suite converge vers zéro.
► Si u 0 -/- 0 et Ia/ dl > 1, alors lunl tend vers +oo.
► Si u 0 -/- 0 et Ia/ dl = 1, nous laissons le soin au lecteur de vérifier que
◊ soit a/ d est une racine qème de l'unité et la suite (UnlnEN est périodique de plus
petite période q,
◊ soit ( a/ d) q -/- 1 pour tout q E N et tout point du cercle de centre zéro et de rayon
luol est valeur d'adhérence de (unlnEN·
az+b wd'-b
w::; - - d E C \ {a/c} # z = - - - E C \ {-d/c} (22.4)
cz+ · -cw+a
PREUVE. o Montrons d'abord que f prend bien ses valeurs dans C\ {a/e}. Supposons en effet
qu'il existez E C \ {-d/e} tel que f(z) = a/e. Alors
az+ b a a ad ad
- - = - # az + b = -( ez + d) = az + - # b = - # ad - be = 0,
ez+ d e e e e
ce qui est contraire aux hypothèses. Ainsi, f réalise bien une application de C \ {-d/c} dans
C \ {a/c}.
o Montrons maintenant que si w E C \ {a/c}, alors il existe un unique antécédent z dans
C\ {-d/c} tel que f(z) = w. Notons qu'évidemment -c -1- 0 et da- (-b )(-c) =ad-be -1- O.
Le point précédent, appliqué à la fonction définie par g(w) = ( a'w+ b')/(c'z+d) avec a'= d,
b' = -b, c' =-cet d' = a, montre donc que (wd - b )/(-cw + a) -1- -d/c. On a donc
az+ b wd-b
w = - - #w(cz+ d) = az+ b # z(a-cw) =wd- b # z= - - - ,
cz+ d -cw+ a
ce qui démontre l'existence d'un unique antécédent par f donné par la condition (22.4). ■
Deux cas se présentent sur C pour cette équation, selon que le discriminant ~ = ( d- a )2 +4bc
s'annule ou non. Nous allons les étudier en détail.
10
C'est-à-dire des solutions de l'équation f(x) = x.
11
On ne se préoccupe pas ici de savoir pour quelles valeurs de u 0 les itérées Un = fn ( Uo) sont toutes bien
définies, c'est-à-dire que Un # -d/c. Nous renvoyons cette discussion à la partie 2.2.
Alors pour z i= a, on a f(z) i= f(a) = a puisque f est injective, et
1 1 = (ea+d)(ez+d) = ea+d(ez+d) (z)
go f(z) = f(z) _ a f(z)-f(a) (ad-be)(z-a) ad-be g ·
Mais z =a+ /zr Aussi (ez + d)g(z) = (ea + d)g(z) + e. On a donc
9
2
f(z) = (ea + d} (z) + e(ea + d}.
0
g ad - be g ad - be
2
Enfin, ea + d = aid et ad - be= (a~dl • La formule ci-dessus se simplifie et on obtient
2e
go f(z) = g(z) + --d.
a+
Pour résumer, on a donc montré le résultat suivant.
f(z) = az+ b
ez+d
admet un unique point fixe <X= 01:/ E C \ {-d/e} qui est racine double de l'équation (22.5).
De plus, si an pose g{z} = 1/(z - a), alors, pour tout z i= a, an a
2e
go f(z} = g(z) + ___.;___d'
a+ (22.6)
z- a l3g(z) - a
g(z) = --a. # z = ( ) .
z- JJ g z - 1
f(z} = az+ b
ez+d
admet exactement deux points fixes a et f3 dans C \ {-d/e} qui sont racines simples de
l'équation (22.5). De plus, si an pose g(z) = {z-oc)/(z- f3), alors, pour tout z i a., on a
go f(z}
ef3 + d
= --d"g(z}. (22.7)
ecx+
2.2. Domaines de définition des suites homographiques
Dans cette partie, nous étudions la question du choix de la condition initiale pour qu'une
suite homographique soit bien définie. Il faut non seulement que Uo soit dans le domaine de
définition de la fonction homographique associée à la suite, mais aussi que toutes les itérées le
soient aussi. Nous allons voir que notre travail préliminaire sur les fonctions homographiques
va nous être d'un grand secours.
PREUVE. Posons ex = (a - d)/(2c) et g(z) = 1/(z - ex). La suite (fn(uollnEN est bien
définie si et seulement si fn(u 0 ) i= -d/c, soit encore, puisque g est injective, si g(fn(uo)) i=
g(-d/c) = -2c/(a+ d). Mais il est facile de montrer par récurrence sur n 2 1 à partir de la
relation (22.6) de la proposition 22.82 que
2cn
g (fn(uo)) = g(uo) + a+ d.
On doit donc éviter la condition g(u0 ) +2nc/(a+ d) = -2c/( a+ d), ce qui donne exactement
l'ensemble S annoncé. ■
cj3+d f(z)=az.+b_
r=--- et
ccx+d · cz+d
Alors la relation Un+t = f(Un) définit bien une suite sur N si et seulement si Uo E <C \ S,
avec
S= {
cxrn+
rn+l -
1
-j31 }
1 n EN .
PREUVE. Posons g(z) = (z-cx)/(z-j3 ). La suite (fn(UollnEN est bien définie si et seulement si
fn(u 0 ) i= -d/c, soit encore, puisque g est injective, si g(fn(Uo)) i= g(-d/c) = 1/r. Mais il est
facile de montrer par récurrence sur n 2 1 à partir de la relation (22. 7) de la proposition 22.83
que
On doit donc éviter la condition g(uo) 1/rn+l, ce qui donne exactement l'ensemble S
annoncé. ■
PREUVE. Supposons que u 0 = (X. Alors f(uo) = f((X) = (X et il est immédiat que la suite
(UnlnEN est constante. Inversement, supposons qu'il existe n 2: 1 tel que Un = (X. alors
Un-l = f- 1 ((X) = (X et, de proche en proche, on en déduit que (X= (f- 1 Jn(un) = Uo, ce qui
montre que la suite (UnlnEN est constante de valeur (X. On a donc montré que (UnlnEN prend
la valeur (X si et seulement si elle est constante.
Supposons maintenant que (UnlnEN ne prend jamais la valeur (X. On peut donc considérer
la suite définie par Vn = 1/(un - (X). Alors, la proposition 22.82 montre, avec les mêmes
notations, que Vn = g (Un) et que
le
Vn+l =Vn +--d.
a+
On reconnaît une suite arithmétique de raison 2c/(a+ d). Il en résulte que Vn = v 0 +2nc/( a+
d). Ainsi (a+ d)(u.o- (X)
Un= (X+ 1/vn = (X+ - - - - - - - - , - - - - - -
a+ d + 2nc(uo - (Xl
et la suite (UnlnEN converge bien vers (X.
■
Théorème 22.87. Soient a, b,e, d dans C tels que e #- 0 et ad-be f: O. Soitf la fonction
homographique définie par f :C \ {,-.d/e}---¾ C\ {a/t}, ZH {oz+ b)/(cz+d). Soit u.o E C.
On suppose que la relation Un+1 = f(Un) définit une suite sur N. On suppose que
Un- (X
Vn= ---P..
u.n-1--'
Or, l'équation (22.7) s'écrit Vn+l = g(f(u.n)) = rg(Un) = rvn. On reconnaît la définition d'une
suite géométrique de raison r. Ainsi Vn = rnv 0 et
ex - j3vorn
Un= .
1 -vorn
o Si lrl < 1, la suite (unlnEN converge bien vers ex car vorn converge alors vers zéro.
· 11 1 , ·
o S1 r > , on ecnt Un = ( /
(cx/vo)r-n_
) j3 et 1·1 est a1ors 1mm
· édi" t
a que Un converge vers 1P. car
J
1 Vo r-n _ 1
( 1/v 0 )r-n converge vers zéro.
o Si r est une racine qième de l'unité, alors la suite de terme général rn est périodique et de
plus petite période (strictement positive) q. La périodicité de la suite (Un)nEN en résulte.
o Enfin, si lrl = 1 et sir n'est pas une racine de l'unité, nous ne donnons qu'une esquisse de
la démonstration et laissons au lecteur le soin de vérifier les détails. On peut montrer à partir
de l'étude des sous-groupes de IR que le groupe multiplicatif {rn I n E Z} est dense dans le
cercle 1U = {z I lzl = 1} et que cela entraîne que l'ensemble de ses valeurs d'adhérence est le
cercle unité 1U tout entier. L'ensemble des valeurs d'adhérence de (Un)nEN est alors exactement
l'image de 1U\ {1 /vo} par l'application z H ( ex- j3v 0 z)/( 1-v0 z). On obtient un cercle si v 0 (/.1U
et une droite si v 0 E 1U. ■
Remarque. On peut préciser le cas des suites homographiques réelles. On suppose que
a, b, c, d E IR et Uo E IR, que ad- be i- 0 et que ci- O. Le cas ll i- 0 comporte deux sous-cas
selon le signe de ll.
o Le cas ll > 0 est identique au cas complexe.
o Dans le cas ll < 0, la fonction f n'a pas de point fixe réel et donc la suite ne peut pas
converger. Ceci est cohérent avec notre discussion dans (C puisque dans ce cas ex et j3 sont
conjugués, et donc lrl = 1.
3
EXEMPLE 22.88. Étudions la suite homographique définie par Un+i = un -/, u 0 ER
Un+
► L'équation aux points fixes s'écrit ici x - 2x + 1 = O. dont la seule racine est 1. On pose
2
Nous proposons ci-dessous, sous forme d'un problème, une autre construction de lR que
celle vue en complément dans le chapitre précédent. Elle s'appuie sur la notion de suite de
Cauchy et elle est due à Cantor et Méray.
Dans cette construction, nous allons nous laisser guider par le fait que nous savons a
posteriori que les réels seront « approchables » par des rationnels en ce sens qu'ils seront
des limites de suites rationnelles. Nous avons donc envie de définir ce corps des réels comme
l'ensemble de toutes les limites possibles de suites rationnelles. Nous ne pouvons pas faire cela
directement ainsi car précisément nous ne pouvons pas définir ce qu'est une suite rationnelle,
qui convergerait vers une limite non rationnelle, avant d'avoir défini les réels. Pour éviter ce
cercle vicieux, nous allons introduire une nouvelle notion, celle de suite rationnelle de Cauchy,
qui est une cas particulier de suite d'éléments de Q.
Nous définissons pour cela une suite rationnelle de Cauchy comme étant une suite (unlnEN
de rationnels vérifiant
3.1. Vérifier que cette relation est une relation d'équivalence sur C. On note C = C/R et
C -, C la surjection canonique.
7t :
3.2. Vérifier que C = C/R hérite d'une structure naturelle d'anneau commutatif pour
laquelle 7t est un morphisme d'anneaux.
4. On veut montrer que C est un corps, c'est-à-dire que tout élément non nul est inversible.
Soit donc il = 7t( u) un élément non nul de C.
4.1. Montrer que si une suite de Cauchy ne tend pas vers zéro, seul un nombre fini de ses
termes peuvent être nuls.
4.2. En déduire que u n'a qu'un nombre fini de termes nuls.
Posons alors M = max lukl + 1 et considérons la suite m dont les n 0 premiers termes sont
k:C:no
égaux à M et les autres sont nuls.
4.3. Vérifier que il= n(u) = n(u + m) et que la suite de Cauchy v = u + m = (vnlnEN a
tous ses termes non nuls.
4.4. En déduire que la suite v' = (1/vnlnEN est bien définie et que v'
= n(v') est un inverse
de il.
5. Donner une injection de Q dans C. Désormais nous identifierons Q et i(Q) et parlerons
abusivement de rationnels appartenant à C.
6. On définit dans cette question une relation d'ordre sur C.
6.1. Montrer que si une suite u de C a tous ses termes strictement positifs à partir d'un
certain rang, il en sera de même pour toute autre suite équivalente à u. On note alors P la
partie de C constituée des suites ù de C qui admettent un représentant (et donc tous leurs
représentants) avec des termes strictement positifs à partir d'un certain rang.
6.2. Vérifier que la relation définie sur C par
ù :S: v # v- ù E P U {O}
C notion de représentation des réels dans une base donnée. Dans la pratique courante,
pour représenter les réels, on utilise la base dix et le développement décimal bien
connu; on sait alors poser des additions, des divisions, etc. l\Iais d"autres bases ont été utilisées
dans l'histoire (16 et 60) et certaines le sont encore, par exemple la base 2 en informatique .
La numération décimale de position avec « chiffres arabes » a été inventée en Inde dans
les premiers siècles de notre ère, puis transmise à l'Europe par les Arabes au xe siècle. Au
XIIe siècle, les mathématicie ns arabes utilisent les fractions décimales mais c'est Simon Stevin
qui les introduit en Europe et qui développe le calcul décimal. Notons qu'il s'oppose à Stifel
(1487-1567), ce dernier ne reconnaissan t pas aux irrationnels le statut de nombre à part
entière ; Stevin s'oppose même à la terminologie d'irrationnels trop péjorative à l'égard de ces
nombres.
Dans La Disme en 1585, il donne les définitions ci-dessous.
Définition I: La disme est une espece d 'Arithmetique, inventée par la disiesme progression,
consistente es characteres des ciffres, par lesquels se descript quelque nombre, et par laquelle
l'on depesche par nombres entiers sans rompuz, tous comptes se rencontrans aux affaires des
hommes.[. .. ]
Définition III: Et chasque dixiesme partie de l'unité de commenceme nt nous la nommons
Prime, son signe est 1; et chasque dixiesme partie de l'unité de prime nous la nommons
Seconde, son signe est 2. Et ainsi des autres chasque dixiesme partie, de l'unité de son signe
precedent, tousiours en l'ordre un avantage.
Le principe du développement décimal est donc ainsi précisé. Un autre type de représenta-
tion des réels, dont il sera beaucoup question dans ce chapitre, est celui fourni par les fractions
continuées (ou continues). Pour donner une idée de ce dont il s'agit, revenons au problème des
grandeurs commensurab les : étant donnés deux segments a 1 < a 0 , admettent-ils une commune
mesure, c'est-à-dire existe-t-il e tel que a0 = me et a 1 = ne pour certains entiers m et n,
auquel cas le rapport ao/a1 sera rationnel? Euclide a décrit dans ses Éléments une technique
(connue sous le nom d'algorithme d'Euclide lorsqu'elle est appliquée aux entiers) pour trouver,
lorsqu'elle existe, une telle commune mesure, mais en fait cette technique artisanale était
connue bien avant lui. Elle consiste à ôter du plus grand segment a 0 le petit segment a
1
autant de fois que possible, soit n 1 fois; ce qui reste est alors par nature strictement inférieur
à a 1. On a ainsi a 0 = n 1 a 1 + U2 avec U2 < a 1 . On recommence alors le procédé avec les
segments U1 et U2 et ainsi de suite. L'écriture du procédé donne, avec des notations évidentes
1 1
ao/a1 =n1 + a2/a1 =n1 +-- =n1 + / =n1 +
1
U1 U2 n2 + U3 U2 n2 + a,/a,
1
Si les segments initiaux sont commensurables, alors le procédé s'arrête au bout d'un nombre
fini d'étapes (c'est toujours le cas pour a 0 et a 1 entiers). Avant la découverte par les pytha-
goriciens des grandeurs incommensurables, on croyait que cet algorithme prenait toujours fin
636
au bout d'un certain nombre d'itérations. Or justement, il semblerait 1 que c'est en étudiant
le symbole de l'ordre des pythagoriciens, à savoir le pentagramme (étoile à cinq branches),
qu'Hipparque découvrit que deux des segments apparaissant dans cette figure étaient incom-
mensurables, il s'agissait de la diagonale du pentagone régulier circonscrit à l'étoile et le côté
de ce pentagone. Pour ce faire, Hipparque appliqua la méthode précédemment décrite et se
rendit compte qu'elle bouclait indéfiniment! Il obtint en fait la fraction continuée (c'est-à-dire
qui continue ainsi indéfiniment) dont tous les termes sont égaux à 1, que l'on peut encore
écrire
1+ 1
1+ 1+ 1
l+nc::-:
Cet objet étrange n'est autre que le développement en fractions continuées du nombre d'or
cl>= (1 + v'S)/2 dont nous avons parlé dans l'introduction du chapitre précédent, à propos de
la suite de Fibonacci.
La première initiation à l'idée de nombre se fait dans la petite enfance, lorsque l'on apprend
à compter. On mémorise alors une suite bien ordonnée de sons : un, deux, trois, quatre, cinq,
six, sept, etc. que l'on relie à l'énumération d'objets. Puis on apprend à noter ces sons, au
moyen de symboles que l'on apprend à reconnaître et à écrire: 1,2,3,4,5,6,7, etc. Peu de temps
après, on affronte des symboles susceptibles de désigner des quantités plus grandes : 45, 67,
89, 124, etc. On observe que seuls apparaissent dans ces nouveaux symboles, que l'on appelle
nombres, les 10 premiers chiffres que l'on a rencontrés.
Bien plus tard, on montre, comme nous l'avons esquissé, l'existence d'un ensemble N de
nombres entiers naturels, contenant 0, 1, muni d'une addition, d'une multiplication, et d'une
relation d'ordre, et on montre qu'il est possible de désigner chaque élément de N par une suite
de symboles, dès lors qu'un entier b ~ 1 + 1 a été fixé. Il est seulement nécessaire pour cela de
disposer de symboles pour désigner les entiers compris entre O et b - 1. Comme nous l'avons
vu, on peut en effet toujours écrire un entier naturel sous la forme
n = <Xmbm + <Xm-1 bm-l + · · · + <X1 b + <Xo,
où les <Xj sont des entiers compris entre O et b - 1. Si on connait des symboles pour chacun de
ces entiers, il est donc possible d'avoir une écriture explicite pour le nombre n. On condense
cette écriture en <Xm<Xm-1 · · · <X1<Xob (dans laquelle les <Xj sont désignés par leur symbole), ou
encore plus simplement en <Xm<Xm-1 · · · cx 1 CXo s'il n'y a pas d'ambiguïté possible, ce que nous
supposerons ici. Nous allons dans la suite examiner dans quelle mesure le procédé que nous
venons de rappeler s'étend à la représentation de tous les réels.
Dans toute cette partie on fixe un entier b supérieur ou égal à 2.
1
C'est dans ce cas une version alternative à celle proposant la découverte des grandeurs incommensurables par
la diagonale d'un carré de côté 1 (cf. chapitre sur la droite réelle).
..:.,_
intuitive de nombre est certainement liée à l'existence d'une représentation de la forme pré-
cédente. Mais nous avons introduit les rationnels, que nous concevons encore comme des r/J '
al
nombres, pour lesquels cette représentation n'est pas valable puisque par exemple 1/3 ne •<Il
1-<
possède pas de développement décimal fini. Cependant on peut écrire, dans un sens intuitif, r/J
<Il
1/3 = 0, 3333333333333 .... Notre but est de montrer qu'il en est de même pour tous les réels.
1
Nous avons rappelé qu'il est possible de représenter tout entier naturel dans la base b. Au
moyen d'opérations élémentaires, on conçoit qu'il reste seulement à représenter des réels de
[O, 1 [, c'est ce problème que nous allons étudier maintenant. La différence majeure avec le cas
des entiers est que nous allons être amenés à manipuler des « sommes infinies », alors que les §<
entiers ne demandaient que des additions en nombre fini. La notion de suite va donc être une ...,
<Il
nouvelle fois mise à l'honneur. On notera 9 l'ensemble des suites indexées par N* à éléments
dans {O, ... , b -1}. Introduisons aussi les ensembles s
<f? = {(PnlnEN* E 9 1 :3no tel que Pn = b - 1, Vn?: no}, fYJ = 9 \ <f?.
ir/J
•<Il
Le principe du développement des réels en base b est donné par la proposition suivante. 1
M
Proposition 23.1. Soit x E [0, 1[. n existe une unique suite (Pnlne~• de fYJ qui vérifie C'I
..d
ü
lim ( Pl
x= n-Hoo
P2 . Pn)
-+-+···+- .
b b2 bn
PREUVE. Soit x un réel de l'intervalle (0, 1 [. Comme xb est dans (0, b[, sa partie entière
vérifie O:::; [xb] :Sb - 1. On pose
P1 = [xb].
Nous avons alors p 1 :::; xb < p 1 + 1 par définition de la partie entière et, en divisant par b, on
voit que le réel
Pl
X1 =X-b
appartient à l'intervalle (0, 1/b[. L'entier [x 1b 2] est donc à son tour compris entre O et b - 1.
On pose
Le réel
P2 Pl P2
X2 = X1 - - 2 = X- - - - 2
b b b
2
appartient donc à l'intervalle (0, 1/b [. Après n étapes analogues, nous obtenons des entiers
P1, pz, ... , Pn compris entre O et b - 1 et tels que le réel
Pl Pz Pn
Xn = X - b - b2 - ... - bn
appartienne à l'intervalle [O, 1/bn[. Pour le réel x, la suite (Pnln>1 est bien définie par ré-
currence: pour obtenir Pn+l, il suffit en effet d'appliquer le mêm; procédé à bn+lxn, ce qui
entraîne que Pn+l = [bn+lx,J.
Maintenant, puisque 1/bn tend vers O (car b?: 2) et comme
le théorème des gendarmes montre que la suite (xnlnEN* converge vers O. Il en résulte que la
suite de terme général
Pl Pz Pn
-b+ -b2+···+- bn= x - xn
638
P1 1
0<x--
-
< - - -1
b - b bm.
Les inégalités O :::'.: xb -pi :::'.: 1 - b 1-m < 1 entraînent que p 1 = [xb]. En fait, nous venons de
prouver que P1 est le premier terme de la suite que nous avons obtenue dans ce qui précède. Par
récurrence, on vérifie facilement que Pn correspond au terme d'ordre n de la suite précédente,
ce qui prouve l'unicité. ■
Nous introduisons maintenant une notation qui prolonge celle que nous utilisons couram-
ment pour les décimaux.
Définition 23.2. Soit x E [0, 1 [ et soit (PnlnEN* l'unique suite vérifiant les propriétés de la
proposition précédente. Posons Po= 0 et considérons la suite (PnlnEN ainsi obtenue. On dit
que (PnlnEN est le développement de X en base b. On note alors
X = 0, P1P2P3 • • • PnPn+l · · ·
et on dit encore que cette écriture est le développement de x en base b.
On prendra garde au fait que l'écriture x = 0, P1P2P3 ... PnPn+l ... n'est qu'une notation
pour la propriété
r (Pl P2 Pn)
X = n_l;1J1oo b + b2 + · · · + bn ·
On peut maintenant très facilement passer au cas d'un réel quelconque. Pour x E JR, l'idée
évidente est simplement d'écrire x = [x] +{x} et de juxtaposer le développement de {x} E [0, 1 [
à celui de l'entier relatif [x]. Ceci conduit à la convention suivante.
639
Définition 23.3. Soit x un réel, soit 0, P1PiP3 ... PnPn+l ... le développement de {x} en
base b et soit [x] = qm ... q 0 b le développement de la partie entière de x. L'écriture x =
qm ... qo, P1P2P3 ... PnPn+l ... s'appelle le développement de x en base b .
Là encore, ce n'est qu'une notation. La notation que nous venons d'introduite pour les
développements prolonge bien celle que nous utilisons habituellement. Si x est un réel décimal
(c'est-à-dire de la forme m/lOn), par exemple x = 6785456785876/10 13 , on écrit usuellement
x = 0, 6785456785876, ce qui est exactement le développement de x en base 10, dans lequel
on omet les termes nuls. Le développement en base 10 est appelé le développement décimal.
Faisons maintenant une remarque importante.
Soit (Pnlnè'.l une suite d'entiers entre O et b - 1, qui est constante de valeur b - 1 à partir
d'un certain rang. Notons n le plus petit entier tel que pour tout m ~ n, Pm= b - 1. Le réel
. (P1
X= m~~oo b
P2 Pn-1 b- 1
+ b 2 + · · · + bn-l + ~ + · .. + bm
b- 1)
a pour développement 0, P1P2P3 ... p~_ 1p~P~+l ... où P~-l = Pn-1 + 1 et Pm= 0 pour tout
m ~ n. A un tel réel sont associées deux suites dont les termes sont des entiers compris entre
0 et b - 1 et qui sont constantes à partir d'un certain rang, la première de valeur b - 1 et la
seconde de valeur O. Nous dirons que la première suite définit un développement impropre de
x en base b, et la seconde est le développement de base b que nous avons défini.
Soit (Pnln21 la suite d'entiers définie par Peut-on comparer (pour la relation d'ordre
P3k+i = i où k E N et i = 0, 1,2. Détermi- usuelle) deux réels lorsqu'on connaît leurs dé-
ner le réel a= 0, P1P2P3 ... Pn ... en base 3. veloppements en base b ?
Définition 23.4. Une suite (PnlnEN est dite périodique s'il existe k EN tel que Pn+k = Pn,
Cl) pour tout n E N, et k est alors une période de la suite. Elle est dite périodique à partir d'un
rn
.Q
ro
certain rang s'il existe k EN et no EN tels que Pn+k = Pn pour n ~ no, e t ~ k est
~ encore appelé période de la suite.
;:; Le théorème que nous énonçons maintenant montre bien la simplicité du développement
Cl)
des rationnels.
~ Théorème 23.5. Un nombre réel de [O, 1[ est un rationnel si et seulement si son dévelop-
pement dans la base b est périodique à partir d'un certain rang.
PREUVE. Soit p/q un rationnel avec p et q premiers entre eux et vérifiant O :S: p < q.
La division euclidienne de bp par q nous donne deux entiers positifs a1 et r1 vérifiant bp =
a 1q +r 1 et O :S: r1 < q. Cette dernière inégalité entraîne que a 1 = [bp / q], donc a 1 est le premier
terme du développement en base b de p/q. En effectuant la division euclidienne de br 1 par q,
nous obtenons deux entiers positifs a 2 et r2 vérifiant br1 = Uzq +r 2 et O :S: r2 < q. L'entier a 2
est dans ce cas le deuxième terme du développement de p/q en base b. En continuant ainsi,
nous avons, d'une part, le développement en base b de p/q donné par la suite des quotients
(unln:::: 1 et, d'autre part, la suite des restes (rnln::,:1 constituée d'entiers compris entre O et
q -1. S'il existe un rang m tel que Tm= 0, alors par construction la suite des restes (rnln::,:l
est constante et égale à O à partir du rang m. Dans ce cas, le développement en base b est
périodique à partir du rang m, et de période 1.
Si maintenant tous les r n sont non nuls, ils sont tous compris entre 1 et q - 1. Comme
il n'y a qu'un nombre fini d'entiers entre 1 et q - 1, il existe deux indices k et h vérifiant
k < h et rk = rh. Par construction, nous avons ak+i = ah+i pour 1 :S: i :S: h - k. En fait la
suite ( Un)n::,:1 est périodique à partir du rang k et sa période ne peut dépasser q - 1. Nous
avons ainsi montré que le développement en base b d'un rationnel p/q, avec O::; p < q, est
périodique à partir d'un certain rang, avec une période inférieure à q - 1, et que ce rang est
inférieur à q - 1.
Réciproquement, soit x un réel de [O, 1 [ dont le développement est périodique à partir d'un
certain rang et dont m est la période, c'est-à-dire
Nous avons
et
Le nombre
bn+mx- bnx = q1qzq3 • • • qnP1P2 •••Pm - q1qzq3 · · · qn
est un entier, donc x est rationnel. ■
Remarque. Il est important de noter que la propriété de périodicité précédente est valable
pour toute base b ~ 2.
EXEMPLE 23.6. Le réel 0,01001000100001000001 ... écrit dans la base b, avec b ~ 2, est
1 un nombre irrationnel.
On peut parfois encore préciser la forme du développement d'un rationnel.
)
641
EXEMPLE 23. 7. Soient b :;:, 2 et q 2' 1 deux entiers premiers entre eux.
1) Le développement en base b de 1/ q est périodique à partir du rang 1.
2) Si la période est q - 1, alors pour tout entier 1 ~ p ~ q - 1. le développement en base
b de p / q se déduit de celui de 1/ q par une permutation cyclique des termes.
► Soit q 2' 2 un entier. Nous savons maintenant que
où m est la période de son développement dans une base b. L'écriture précédente est équiva-
lente à bn+m_ bn = (q,qzq3 ... qnP1P2 ... Pm - q,qzq3 ... qn)q. :'\ous avons donc un entier
naturel k vérifiant (bm - 1 )bn = kq. Si nous imposons à q et b d"ètre premiers entre eux,
nous avons l'entier bm- 1 divisible par q. '.'\otons m' 2' 1 le plus petit entier tel que bm' -1
soit divisible par q. Notons (anln21 (resp. (Tnln21) la suite des quotients (resp. des restes)
obtenus lors de la division euclidienne de 1 par q: ces deux suites Yérifient pour tout n EN,
Il est facile de vérifier par récurrence que, pour tout f E N. il existe un entier naturel k, tel
que be= keq +Te; en particulier bm' = km,q + Tm'· La condition imposée sur m'entraîne
que Tm' = 1. Comme T1 = 1, l'entier m' est supérieur ou égal à m, donc m = m'. :'\ous
venons de montrer que le développement en base b de 1/ q est périodique à partir du rang 1.
Nous noterons dans la suite T( q) cette période. Supposons que pour un entier q 2' 3, on
ait T( q) = q - 1 ; la suite des restes (T nln2 1 associée à 1/ q prend alors toutes les valeurs
entières entre 1 et q - 1. Pour un entier 1 ~ p ~ q - 1, il existe un entier 1 ~ k ~ q - 1
tel que Tk = p. Par construction, la suite des restes (T~)n2 1 associée à p/q vérifie T~ = Tn+k·
Nous avons la même relation pour la suite des quotients. En résumé, le développement en
base b de p / q s'obtient à partir de celui de 1/ q par une permutation cyclique des termes.
0, 12345678910111213141516 ...
642
connu sous le nom de nombre de Champernowne . Par construction, ce nombre est un nombre-
univers. Un nombre-univers ne peut avoir un développement décimal périodique, donc il est
irrationnel.
Soient x un réel de l'intervalle [0, 1 [ et k un entier compris entre 0 et 9. Pour un entier
n 2'. 1, on note kn(x) le nombre de fois où le chiffre k apparaît dans les n premières décimales
de x.
Définition 23.8. Le réel x est dit équiréparti si pour tout entier O ::; k ::; 9, la limite de
kn( x) /n, quand n tend vers l'infini, est égale à 1/10.
Soit i(k) le nombre de fois où le chiffre k apparaît dans a1a2 ... °'r• Alors x est équiréparti
si et seulement si i(k) = -r/10 pour tout entier 0 $ k ::; 9. En particulier la période d'un
nombre rationnel équiréparti est un multiple de 10.
Pour un entier n assez grand, on a kn(x) = [n/-r]i(k) + €n où €n est un entier compris entre
0 et 't + m. Nous avons
lim kn(x) = lim [n/-r]i(k)
n-->+oo n n-->+oo n
i(k)
ce qui entraîne que lim ■
n---++oo n 't
Il. EXERCICES
23.1. 23.6.
23.3. 23.7.
23.9.
23.4.
Soit (xnln21 la suite définie par Xn = 1. si n
Soit n 2 2 un entier naturel.
est un carré et Xn = 0 sinon. l\lontrer que le
1. Résoudre l'équation : [nx] = n[x]. nombre 0, x1x2 · · · Xn · · · est irrationnel.
2. Déterminer les x > 0 vérifiant [x] = [xn]_
23.10.
23.5.
Montrer que dans les deux cas ci-après, le
Soient 0 un irrationnel et f l'application définie nombre 0, x1x2 · · ·Xn ···est un nombre-univers.
sur N par f(n) = ne - [n0].
1. (xnln21 est la suite des entiers pairs non nuls
1. Montrer que f est à valeurs dans [0, 1[. en base 10.
2. Montrer que f est injective. 2. (xnln21 est la suite des nombres non-
3. L'application f est-elle surjective? premiers en base 10.
COMPLÉMENT 1. FRACTIONS CONTINUÉES
La notion de fraction continuée a été utilisée de manière fondamentale dans les travaux d'Euler,
par exemple pour prouver en 1737 que e est irrationnel. En 1761, J.H. Lambert utilisa la même
méthode pour prouver l'irrationnalité du nombre n. Lagrange, pour résoudre une équation de
Pell, s'intéressa aux fractions continuées et en développa la théorie. Enfin, dans l'élaboration
de la notion même de nombre réel, les fractions continuées ont joué un rôle majeur.
L'idée initiale est assez voisine de celle que nous avons décrite dans la partie I de ce
chapitre, il s'agit de trouver des suites de rationnels qui convergent vers un réel arbitraire, ces
suites devant être construites de manière algorithmique. Pour établir ce que nous avons appelé
le développement en base b d'un réel x de [O, 1[, on commence par former une subdivision de
[0, 1] de la forme [0, 1/b, 2/b, ... , (b - 1 )/b, 1] et on repère l'unique entier k 1 E {0, b - 1} tel
que x E [ki/b, (k 1 + 1 )/b[.
On procède alors à ce qu'on appelle une renormalisation de cette figure. Il reste en général
un écart entre les barreaux de l'échelle et le réel à représenter. On se place donc dans l'échelon
[ki/b, (k1 + 1)/b[, que l'on va considérer de nouveau comme l'intervalle [O, 1 [ initial. Pour
cela, on fait une translation de -ki/b et on multiplie toutes les quantités par le facteur b.
L'échelon se transforme donc en b x [ki/b - ki/b, (k 1 + 1}/b - ki/b [ = [O, 1 [, et le réel x
devient x1 = b x (x- ki/b}.
Cette renormalisation améliore évidemment la précision de la représentation, puisque nous
avons multiplié par un facteur b. On obtient après la première étape
on a donc un rationnel k1 /b dont l'écart avec x est majoré par 1/b. On répète l'opération
pour X1, ce qui conduit à un nouvel entier k 2 E {0, ... , b} tel que x 1 E [k2/b, (k2 + 1 )/b[, soit
avec x1 - k2/b < 1/b, et maintenant l'écart entre x et ki/b 1 + k 2/b 2 est majoré par 1/b 2. On
poursuit alors la renormalisation en multipliant cette fois par un facteur b 2 le reste (xi -~z/bl,
et ainsi de suite. On obtient ainsi ce que nous avons appelé le développement de x dans la
base b.
Par exemple, dans le cas où b = 4, appliquons cette méthode pour x = 2/3. On a k 1 = 2, le
nouveau réel x1 est donc 4 x (2/3-2/4) = 2/3 (ce n'est pas un hasard, nous avons prémédité
notre choix de x).
Le développement de 2/3 en base 4 s'écrit donc 2/3 = 0, 22222222 ....
À la deuxième étape
et ensuite
2 2 2 2
-=-+-+-+···
3 4 4 2 43
0 1/4 2/4 X 3/4
1 ''
1 ''
1 ''
1 ''
1 ''
x,' 3/4 ' ',,.,. 1
1/4 2/4
Bien que cette méthode paraisse très naturelle, ce n'est pas la seule possible. Il faut en
particulier bien voir que la renormalisation que nous avons décrite (essentiellement la mul-
tiplication par le facteur b) est très arbitraire. Tout ce que l'on cherche est à produire une
situation analogue à la situation de départ. Nous allons dans ce complément en présenter une
autre, que nous appellerons algorithme de Gauss (ce qui ne veut pas dire que Gauss en est le
seul inventeur).
L'idée va être maintenant de considérer la totalité de la droite réelle lll, et de n'utiliser
que la subdivision donnée par l'ensemble Z des entiers naturels. Si on choisit x E lll, il existe
ainsi un unique entier [x] tel que [x] :S: x < [x] + 1, que nous avons appelé la partie entière de
x. Nous allons ici le noter plutôt E[xl, pour éviter des ambiguïtés dans la suite. La première
étape de notre procédé d'approximation s'écrit simplement
x = E[x] +{x}
où {x} E (0, 1[ est la partie décimale de x.
0 2 X 3 4
;; ______ __.. ..........
;;;
;;; ;;
;; ;;;
;;
{x}
oI I 1
1
--
-- ---
-- --
-- --
2 3 x, 4
À nouveau, {1 /{x}} E [O, 1 [. Si {1 /{x}} = 0, c'est terminé, sinon, on considère son inverse, et
on réitère le procédé.
On peut déjà imaginer la forme du résultat. Supposons que l'algorithme que nous venons
de décrire se poursuive indéfiniment. Alors il conduira à une représentation de x sous la forme
d'une fraction indéfiniment continuée
x =no+ - - - - - - - ~ - - - - -
n2+--------
où les np sont des entiers naturels. Nous allons en préciser le sens dans ce complément.
qui est donc une expression de x sous forme d'une fraction du même type que celui que nous
avons décrit en introduction.
Revenons maintenant sur l'idée de l'algorithme de Gauss. Pour x E lR donné, on pose
d'abord x 0 = x Si x 0 E Z, on arrête l'algorithme. Si x 0 E lR \ Z, on pose
et ainsi de suite. L'algorithme s'arrête au premier xk ainsi construit qui est dans N, et continue
indéfiniment sinon. Notons que dès la première étape l'algorithme ne met en jeu que des réels
de [1, oo[.
C'est l'algorithme d'Euclide qui va nous montrer que si x E (Q, l'algorithme de Gauss
s'arrête. En effet, d'après les inégalités des divisions euclidiennes, on voit que E[x 0] = a0 ,
donc que {xo} = bi/bo, donc que
bo
X1 = b,"
Comme b2 > 0, X1 ,f. N, et l'algorithme continue, montrant de la même manière que
b1
X2=-
b2
et ceci jusqu'au rang n - 1, avec
bk-1
Xk=~, 1 :S:k:S:n-1.
avec p 2:: 1, ap 2:: 2 et ak 2:: 1 pour tout k 2:: 1 est appelée développement du nombre x en
fractions continuées.
Par ailleurs, nous avons aussi montré que l'algorithme de Gauss des irrationnels se poursuit
indéfiniment.
Proposition 23.15. Soitx..E R\ Q, Alors la suite de Gauss de x, dont le terme généml
vérifie là relation de récurrence . . . . . . . . .
Proposition 23.16~ Les suites(pt<}~o- e.t (q1,Jiqo vf:rifoent lès proprüttés suivantes :
1) la suite (qk}kÇ::2 est strictement croi9sa~te et à flale~rsd~~ N*;
2) pour toutkEN, P.kQk+l -'--l'k+t<lk = (-t)k;
3) pour tout k EN*, pJqk = [no, rt1, n.2, ... , n:k-1J.
PREUVE. Montrons par récurrence la première propriété de la proposition. Pour tout entier
k 2 2, on note Pk la propriété: qk EN*, qk+l EN* et qk+l > qk. Nous avons qz = q,n, +qo =
n, et comme n1 EN*, on déduit que qz EN*. La relation q3 = q2n2 + q, = q2n2 + 1 et la
condition n 2 E N* prouvent que q 3 > q 2 . La propriété P2 est vraie.
Supposons maintenant que Pk est vraie. L'inégalité qk+l > qk montre que qk+l est bien un
entier non nul. De l'identité qk+2 = qk+lnk+l + qk, on déduit que qk+l EN et qk+2 - qk+ 1 =
qk+l (nk+l - 1} + qk. Cette dernière égalité, le fait que nk+l - 1 2 0, et l'hypothèse qk EN*
prouvent que qk+2 - qk+l > 0, c'est-à-dire qk+2 > qk+l, donc aussi qk+2 EN*. Nous avons
donc montré que Pk+l est vraie.
Pour prouver la seconde propriété de la proposition, posons dk = pkqk+l - Pk+l qk pour
tout k 2 1. Nous avons dk = Pk(qknk+ qk_,)-(pknk+Pk-1} qk = Pkqk-1-Pk-lqk = -dk-1·
Ceci implique que dk = (-1 )kd0. Comme d 0 = 1, alors dk = (-1 )k. Quant à la dernière
propriété de la proposition, elle résultera immédiatement du lemme qui suit. ■
Letnme 23.17. Soit (a11J~1<:,:;n. ur,,e 811,ite finie de. rée.ls véri,ft;ant a"-> 0 pourk > 1. Soient
(pk.){½;k$n.+l et {Q1<.)QSk$n+1 les suites finies définies par
PREUVE. Elle se fait par récurrence sur n. On la laisse au lecteur à titre d'exercice. ■
Remarque.
1) La propriété 2) de la proposition précédente et l'identité de Bézout montrent que, pour
tout k, Pk et qk sont premiers entre eux, ainsi que Pk et Pk+l, qk et qk+l· En fait, le rationnel
[no, n,, ... , nJ est donné sous sa forme irréductible Pk/ qk.
2) Certains auteurs utilisent une autre indexation des réduites, c'est alors la suite des termes
de rang pair qui est croissante et celle des termes de rang impair qui est décroissante.
Définition 23.18. Soit (nk)JQo une suite d'entiers vérifiant nk 2: 1 pour tout k 2: 1. On
dit que le rationnel Pkl qk est la réduite d'ordre k associée à la suite (nk)JQO·
2. La convergence de la suite des réduites. Nous allons maintenant montrer que les
sous-suites de rangs pair et impair d'une suite de réduites sont adjacentes, ce qui montrera la
convergence de la suite initiale.
~ro~ftiô,n ,3.l,t). ~Giï'{'tt~lkâô '.'U~ $~itt d'entiers tels que nk ~ t pour toot 1ç 2 1, et
s<>it(,p.Jqk)k?!t la suitr:. de sis réâ${tes; jllors,:
l:) pour toot k2:: 1, 'Plk-titJZk--'1 < ~21Jq2k i
i.} ~ suites {P2kltl2k}1e1 et {'P2k-i/q:zic..:..t}JQ1 sont respectivement décroissante et crois-
sante;
3) les MU$ suites {'P21../Q21c)JQ1 et l'P2k..:..1/421c-1)1Q1 sont adjacentes.
on obtient
Pk Pk+l (-l]k
----
qk qk+l qkqk+l
Pour k >
-
1, on posq}k = Pk/ qk. La suite (Ykh>1-
vérifie pour tout k >
-
1, Yk-Yk+l = --1=!1".__
QkQk+l
Soit h E N*. Si on applique l'identité précédente à k = 2h - 1, on obtient que
-1
Yzh-1 -Yzh = - - - - < 0,
qzh-lq2h
d'où l'on déduit que, pour tout h 2: 1, YZh-1 < Yzh-
Montrons que la suite (pzk/ q 2k)JQ 1 est décroissante. En sommant les deux identités
(-l]k (-l)k+l
Yk - Yk+l = - - - et Yk+l - Yk+Z = ----,
qkqk+l qk+lqk+2
Notation. Soient (nk)JQo une suite d'entiers tels que nk 2: 1 pour tout k 2: 1. La limite de
la suite des réduites associées à (nk)JQo est notée [n0, n 1, n 2, ... ] , soit donc
Tliéorênte 23.20. Soient (nk)JQ:o une suite d'entiers tels que nk ~ 1 pour tqut k ~ 1.
Alors la suite {pJqk)k>t des réduites de (nk)k>o est convergente et sa limite x vérifie pour
tout k ~ 1 l'inégalité - -
lx- Pkl < 2...
qk qf
PREUVE. La suite (pk/ qk}JQ: 1 est convergente car ses deux sous-suites extraites, (P2k/ qzk}JQ:1
et (P2k-ifq2k-J)JQ:i sont convergentes et ont la même limite. Notons x cette limite. Comme
les deux suites sont adjacentes, P2k-if q2k-l < x < P2k/q2k-
Soit h E N* impair. Nous avons alors
Ph+lqh - qh+lPh 1 1
Ph+ifqh+l - P i J % = - - - - - - = - - - :::; 2·
qh+lqh qh+lqh qh
Si h est pair, avec les mêmes inégalités, on peut prouver que -1 / q~ < x - Phi qh < 0, d'où
le résultat. ■
X
PkXk +Pk-1
= ------'--
qkXk + qk-1
Théorème 23.21. Pour tout nombre irrationnel 'X 1 û e:tîstë: une unique suite (n0k:>o d'en-
tiers vérifiant nt.: ~ 1 pour tout k ~ 1 et telle que - - -
PREUVE. Commençons par montrer l'existence d'une telle suite. Pour cela, il suffit de
prouver que la suite (nk}JQ:o, des quotients de x, vérifie x = [n0, n 1, ...]. Cela signifie que
x = lim [no, n1, ... , nk-1], ce qui revient encore à montrer que la suite (pk/ qdk>i des ré-
k-+too -
duites de (nk}JQ:o converge vers x. Calculons donc x - Pk/ qk. On a,
1
[mo,m,,mz, ... ,mJ =mo+ [ J
m 1 ,m2, ... ,m
implique que 1/[m 1 , m 2, ... , mJ converge vers x - no; par suite [m,, m2, ... , mJ converge
vers x 1 = 1/(x - n 0 ). Le même argument prouve que m, = E[x,J = n,.' Ainsi par récurrence
on peut voir que les deux suites coïncident. ■
Concluons maintenant cette étude par quelques observations que nous retrouverons dans
le cadre des cours de L2 et L3.
Remarque.
1) On peut vérifier par récurrence que pour un irrationnel x, et pour tout k E N, on a
Xk = [nk, nk+l, ... ].
2) Si (pk/qk)JQ 1 est la suite des réduites des quotients de x, alors pour tout k 2: 1,
3) Il est possible de montrer, en utilisant cette dernière propriété, qu'une réduite Pk/ qk
des quotients d'un irrationnel x réalise la meilleure approximation possible de x pour un
dénominateur inférieur à lqkl- Plus précisément, on laisse à titre d'exercice la preuve du fait
que si pet q sont des entiers vérifiant lql < lqkl, alors lx-pk/ qkl < lx-p/ql. Cette remarque
montre bien tout l'intérêt du procédé pour l'approximation des réels.
1 1
Xk+l = - - - = ~ l et cp-1 = ~•
Xk - nk 4' - 4'
entraînent alors que xk+l = cp, d'où l'on déduit que nk+l = 1. La propriété est donc vraie à
l'ordre k + 1. On peut en conclure que
cp
+ v15
1
= -2- = [1, 1, 1, ... , 1, 1, 1, ... ].
EXEMPLE 23.23. Soit n un entier naturel non nul. Montrons que
EXEMPLE 23.25. En utilisant l'algorithme de Gauss, nous allons déterminer les 6 premières
réduites du développement en fractions continuées de ::r
► Il suffit de construire la suite de Gauss à partir d'une approximation de ::~- On obtient
1 = 1+ 1 _ 1 + 3x + 1
X = 1+ l 2+ x - 7X + 2.
2+ 3+~ 3x+l
1 v'n2+2+n
X1=-----
✓n2+2-n 2
2
x2 = v'n2+2 =Jn 2 +2+n.
n 2 +2+n-2n
Donc le nombre x 3 coïncide avec x 1 . Nous avons ainsi montré l'égalité annoncée.
Notre gamme musicale classique, formée des notes DO, RÉ, MI, FA, SOL, LA, SI, DO, et de leurs
altérations (dièses et bémols), est souvent qualifiée de gamme pythagoricienne. Son origine est
très ancienne et il n'est pas très facile de remonter aux idées qui ont conduit à sa construction.
Il est cependant clair qu'elle a une origine empirique, provenant par exemple de la nécessité
de concevoir et d'accorder des instruments de musiques à cordes ou à vent.
Dans ce complément, nous montrons comment quelques considérations physiques et ma-
thématiques simples sur la structure des sons musicaux permettent de reconstruire notre
gamme de manière très naturelle. Nous y verrons intervenir de manière cruciale les propriétés
du développement des réels en fractions continuées, ainsi que celles des sous-groupes de R
Nous nous sommes inspirés de la discussion de Y. Hellegouarch parue dans la Gazette des
Mathématiciens, n° 81, juillet 1999.
2. La structure d'un son musical : d'où vient le timbre? Si nous observons le mou-
vement d'une corde de guitare, nous nous apercevons que son mode de vibration est très
complexe, et ne peut être décrit par une simple sinusoïde. On peut donc s'attendre à ce que
la vibration transmise à l'air ambiant (par l'intermédiaire de la vibration très complexe de la
table d'harmonie) soit nettement plus riche qu'un son pur et donc beaucoup plus difficile à
décrire.
Il existe cependant une remarquable méthode pour analyser ces sons, ainsi que la presque
totalité des phénomènes vibratoires, c'est l'analyse de Fourier. Joseph Fourier (1768-1830)
était un physicien et mathématicien de génie qui inventait des méthodes mathématiques ra-
dicalement nouvelles pour analyser les problèmes physiques qui se posaient à lui. Son œuvre
majeure porte sur l'analyse des fonctions périodiques générales et consiste à les décompo-
ser en une superposition de nombreuses fonctions périodiques, de fréquences toutes multiples
d'une fréquence fondamentale, et d'amplitudes de plus en plus petites à mesure que la fré-
quence grandit. On appelle harmoniques ces fonctions de fréquences multiples de la fréquence
fondamentale.
Donnons un exemple. Soit w E JR~ une fréquence donnée. Un polynôme trigonométrique
2
Notons comme toujours que le passage d'un modèle mathématique à un modèle physique exige une convention
d'unité : l'unité physique de fréquence est le Hertz, correspondant à une oscillation par seconde. Dans la suite,
nous supposerons implicitement que les fréquences sont exprimées en Hz.
de fréquence w est par définition une fonction de lR dans lR définie pour t E lR par
n=N
f(t) = L. Ancos(2mtwt) + Bnsin(2mtwt),
n=O
où les amplitudes An et Bn sont des réels. L'entier N est le degré du polynôme. En suivant les
méthodes introduites par Fourier, on peut montrer que toute fonction continue de fréquence
w peut être uniformément approchée avec une précision arbitraire par un polynôme trigono-
métrique bien choisi (dont le degré croît en général avec la précision souhaitée), c'est-à..-dire
que si f est une fonction continue périodique, et si t: > 0 est donné, il existe un polynôme
trigonométrique P tel que lf(t) - P(t)I < t: pour tout réel t.
Comme notre oreille n'a qu'une sensibilité limitée, un son musical quelconque, de fréquen-
ce donnée, peut donc être convenablement décrit par un polynôme trigonométrique. Un tel
polynôme est caractérisé par la fréquence et les coefficients (An, Bnl, 0::; n::; N, qui décrivent
les amplitudes des harmoniques. Le timbre du son considéré provient en fait de la répartition
de ces amplitudes.
Nous n'aurons pas besoin d'approfondir davantage cette question et retiendrons seulement
qu'un son musical de fréquence donnée w n'est jamais composé par un seul son purement
sinusoïdal, mais contient aussi un grand nombre d'harmoniques, dont les fréquences sont des
multiples entiers de w (et dont l'amplitude est en général beaucoup plus faible que celle du
son sinusoïdal de fréquence w).
3. La perception des sons et la notion de note. Une premiêre constation est facile à
établir : deux sons musicaux de fréquences w et w' suffisamment différentes, émis l'un aprês
l'autre, sont distingués par l'oreille quels qu'en soient les timbres. De plus, le son à la fréquence
la plus élevée est spontanément décrit comme plus aigu que l'autre.
Par ailleurs, lorsque deux sons purs de fréquences w et 2w sont émis en même temps,
on constate qu'une grande majorité d'auditeurs n'entend qu'un seul et même son. Seuls des
musiciens expérimentés arrivent à entendre ce son comme son composé. De la même maniêre,
une oreille non éduquée différencie assez difficilement deux sons musicaux de fréquences w et
2w. On dit que ces deux sons sont séparés d'une octave.
Maintenant, si ces deux derniers sons musicaux sont émis successivement, l'oreille a encore
tendance à les « identifier », le son de fréquence 2w étant cependant perçu comme plus aigu
que l'autre. Pour tenir compte de ce paradoxe, on dit que ces deux sons représentent une
même « note », jouée à des hauteurs différentes. j
En itérant la remarque précédente, on voit qu'une même «note» possêde une infinité de
variantes différentes, dont les fréquences appartiennent à un ensemble de la forme
pour un réel w donné. En effet, nous avons vu que le son à l'octave du son de fréquence w a
pour fréquence 2w et représente la même « note ». Il en est donc de même pour les sons de
fréquence 2w et 4w, puis pour tous les sons de fréquence znw avec n EN. Mais il faut aussi
considérer que les sons de fréquence w /2 et w représentent la même « note », de même que
tous les sons de fréquences znw avec n E Z, n::; O. Nous obtenons ainsi l'ensemble N(w).
Dans la suite, nous appellerons donc note tout sous-ensemble N de IR~ de la forme {2nw 1
n E Z} où w E IR~. Un tel réel w sera appelé référence de la note N. Remarquons que les
réels positifs w et w' sont des références de la même note si et seulement s'il existe un entier
relatif m tel que w' = zmw. Les éléments de l'ensemble N seront appelés les représentants
de la noteN.
4. Les familles musicales naturelles. Imaginons maintenant qu'une corde de violon, jouée
à vide, donne un son musical de fréquence w. Nous avons vu que ce son est en réalité une
superposition d'harmoniques de fréquences nw, pour n E {O, ... , N} avec N assez grand.
Dans ces harmoniques, ceux de fréquences 2w, 4w, 8w, ... représentent tous la même note,
de même que le son musical initial.
En revanche, l'harmonique de fréquence 3w représente une nouvelle note, et tous les har-
moniques de la forme 3w, 6w, 12w, 24w, ... la représentent aussi. Et on peut ainsi continuer.
Si on veut maintenant concevoir un instrument de musique comportant plusieurs cordes,
dont la plus grave émet un son de fréquence w, on constate empiriquement que pour éviter des
phénomènes de dissonance, les autres cordes à vide devront être accordées sur les fréquences
qui apparaissent dans la série de notes que nous venons de décrire.
Prenons l'exemple du violon, dont les fréquences des cordes à vide sont données dans le
tableau suivant (elles sont arrondies à l'entier le plus proche).
Note SOL RÉ LA MI
Fréquence 196 293 440 660
On constate que le rapport entre deux fréquences consécutives est toujours très voisin de
3/2. Ce rapport de fréquences est appelé rapport de quinte. Si w est la fréquence de la corde
la plus grave du violon, la corde suivante est accordée à la fréquence !w
et on voit que cette
fréquence représente la note N(3w ). La note suivante est accordée à la fréquence 32 2-2 w,
3 3
elle représente la note N(9w), et la suivante à la fréquence 3 2- w, qui représente N(27w).
Entre chacune de ces cordes il y a donc un rapport de quinte.
Une mélodie sera pour nous une suite finie de sons musicaux joués successivement (nous
ne tiendrons pas compte de leur durée, c'est-à-dire du rythme). Nous supposerons dorénavant
qu'une fréquence conventionnelle w a été fixée, par exemple w = 440. On peut donc décrire
toute autre fréquence au moyen de son rapport avec w. Nous travaillerons donc maintenant
avec les rapports de fréquences plutôt qu'avec les fréquences elles-mêmes.
La question est donc : de quels rapports de fréquences dispose-t-on pour écrire des mélo-
dies? Notre postulat est que ce rapports devront appartenir à l'ensemble
que nous appellerons famille musicale naturelle. On voit facilement que <;§ =< 2, 3 > est
un sous-groupe de (Q~, ·). Son étude va nous permettre de retrouver de manière « cano-
nique» notre gamme usuelle (et d'autres aussi, qui ont déjà été utilisées).
5. La notion de gamme. Nous disposons donc maintenant d'une liste de rapports de fré-
quences que nous pouvons utiliser pour écrire des mélodies. Le problème est que cette liste
est beaucoup trop riche ! En effet, on peut montrer que <;§ est dense dans IR~, au sens où tout
intervalle ouvert non vide contenu dans IR~ contient au moins un point de <;§. Nous allons
donner l'idée de cette démonstration. Introduisons le réel
ln3
ix ~ 1, 584962500721156,
ix = ln2'
que nous retrouverons souvent dans la suite. On admettra que ix est irrationnel (la preuve
n'est d'ailleurs pas difficile). Notons l l'application de IR~ dans IR définie par l(x) = ln x et
par E son inverse, de IR dans IR~, défini par E(x) = ex. Ces deux fonctions sont continues, et
lest un homomorphisme du groupe multiplicatif (IR~,.) sur le groupe additif (IR,+). Comme
<§est un sous-groupe de (Q:, x), c'est aussi un sous-goupe de (JR:, x) et donc l(<§) est un
sous groupe de (JR, +) de la forme
l(<§) ={p ln2+ q ln3 I (p,q) E Z:,2}.
On sait donc que l(<§) est soit dense, soit de la forme bZ, avec b E JR:. Mais l(<§) ne peut
pas être de cette dernière forme. En effet, comme ex E lR \ Q, on peut trouver une suite de
rationnels (Pn/ qn)nEN qui converge vers ex et vérifie Pn/ qn-# ex pour tout n EN. Alors il est
clair que la suite (Pn ln 2 - qn ln 3 lnEN tend vers O. On en déduit facilement (là encore, c'est
un bon exercice) que pour tout réel b > 0, l(<§) contient un élément strictement positif et
strictement inférieur à b, ce qui montre quel(<§) -# bZ. En conséquence l(<§) est dense dans
JR, et on peut montrer que la continuité de la fonction E entraîne que<§= E(l(':ff)) est dense
dans JR:, ce que nous avions annoncé.
Nous allons donc devoir sélectionner certains rapports de fréquences privilégiés, leur en-
semble<§ étant beaucoup trop gros pour être intéressant dans la pratique. Nous nous limiterons
à des rapports contenus dans l'intervalle [1, 2], c'est-à-dire entre deux octaves. Une gamme
naturelle sera une partie de [1, 2] n <§ utilisable pour écrire des mélodies. Ce n'est évidemment
pas une définition mathématique et nous allons dans la suite préciser comment construire
de telles gammes. L'idée essentielle sera la suivante : il va être possible de définir un sous-
groupe G de <§ tel que le groupe quotient <§ /G soit isomorphe à Z. On pourra donc écrire
<§ /G = {cm I m E Z} où chaque Cm est une classe d'équivalence d'éléments de<§. Nous allons
ensuite donner un procédé naturel pour choisir dans chaque classe Cm un unique représentant
Pm E <§. Nous obtiendrons donc un ensemble fi!= {Pm I m E Z} de rapports de fréquences et
l'intersection [1, 2] n fi! nous donnera la gamme cherchée.
Nous allons en fait définir une suite ( GnlnEN· de tels sous-groupes et nous obtiendrons donc
ainsi une suite de gammes possibles, de plus en plus riches lorsque n croît. Nous constaterons,
ce qui est très remarquable, que ce procédé en apparence très abstrait reconstruit en fait notre
gamme usuelle, ainsi que d'autres utilisées en musique tonale, ou d'autres encore plus riches
que notre gamme usuelle. Les résultats qui suivent sont dus au mathématicien Y. Hellegouarch.
Cette valeur est donc une indication de la «complexité» du nombre r, en ce sens qu'une
fraction comme 3/2 peut être considérée comme simple, alors que 5674/6789, 7896/5 et 3/8977
peuvent être considérées comme compliquées.
2. Les commas. C'est la notion de valeur d'un rapport qui va nous permettre de définir
convenablement les seuils minimaux de différenciation que nous cherchions, c'est-à-dire les
commas des musiciens. Commençons par fixer une famille musicale 'i§. Nous dirons qu'un
élément y de <;§ est un comma pour <;§ si y est différent de 1 et vérifie la propriété
Il est possible de traduire cette condition en termes multiplicatifs . Par exemple, si y > 1,
l ln ri < l ln YI si et seulement si r E ]1 /y, y[, et si y < 1, l ln ri < l ln YI si et seulement si
r E]y, 1/y[.
Ceci donne l'interprétati on naturelle de la condition (*). Un élément r de la famille <;§
ne peut être plus proche de 1 que y qu'à condition d'avoir une valeur plus grande que y.
Un comma est donc une meilleure approximation possible de 1 dans un ensemble de rapports
de valeurs données. Une famille musicale possède donc en général plusieurs commas, qui
dépendent de cette valeur.
3. La suite des commas pour la famille musicale <;§ =< 2, 3 >. Dans ce paragaphe
nous allons montrer comment le développeme nt en fractions continuées du réel ex permet de
déterminer les commas pour la famille<;§=< 2, 3 >. C'est l'objet du théorème suivant, pour
lequel nous aurons à utiliser quelques propriétés des fractions continuées que nous rappelons
au préalable.
Pour respecter la convention adoptée par Hellegouarch, nous décalerons ici l'indexation
des réduites d'une unité. Nous noterons donc (pkhEN et ( qk)kEN les suites définies à partir de
la suite (nk) des quotients de ex par
Numérateurs Po = 1 P1 = 2 pz = 3 p3 = 8 p4 = 19 Ps = 65
Dénominateu rs qO = 1
On en déduit donc en particulier que IP + qexl < 3/4 et donc les termes p et q sont nécessai-
rement de signes opposés. On en déduit que
Comme -v(yn) = max(2Pn,3qn ), pour montrer que -v(r) > -v(yn) il suffit de montrer que
IPI > Pn et lql > qn.
Comme Pn/qn est une réduite de ex, on déduit de l'inégalité(**) que lql > qn. De plus
-lpl + lqlex < IPn - qnexl donc
Par ailleurs
Pn :s: qnex + 3/4 :s: (lql - l)ex + 3/4 = lqlex - ex+ 3/4 :s: lqlex - 3/4
ce qui montre que lpl > Pn· On en déduit donc que -v(r) > -v(yn), ce qui montre que Yn est
un comma pour la famille t;ff. ■
22 32 312 265
Commas de t;ff Yo =~ Y1= 5 Y2=3 Y4 = :.i9 Y2=4T
On peut montrer que r est en fait l'ensemble de tous les commas > 1 de t;.1.
2.3. La construction des gammes
Nous sommes maintenant en mesure de donner une définition naturelle pour les gammes
musicales extraites de la famille t§.
1. Définition abstraite d'une gamme naturelle. La famille musicale t§ représente, comme
nous l'avons dit, l'ensemble de tous les rapports de fréquences que nous avons décidé de consi-
dérer. L'idée est d'interpréter les commas de t§ comme les seuils minimaux de différenciation
des rapports par l'oreille humaine. Bien entendu, lorsque n--, oo, Yn--, 1 et le seuil corres-
pondant devient très vite trop petit pour être réaliste. En revanche, lorsque n = 0, y 0 = 3/2.
C'est le rapport de quinte qui est immédiatement discernable par toute oreille, même non
éduquée. On s'attend donc à observer des effets intéressants pour n de l'ordre de 3 ou 4.
Fixons n E N*. Convenons donc d'identifier deux éléments r et r' de t§ lorsque r /r' est un
multiple du comma Yn· Ceci revient à considérer le quotient de la famille t§ par le sous-groupe
multiplicatif engendré par Yn, que nous noterons Gn· Le théorème suivant donne les propriétés
du groupe quotient 22n = t§ /Gn- Nous noterons TT la surjection canonique de t§ sur 22n, donc
par définition Ker TT = Gn.
Théôr,tt1e 23~00. Le groupe gùotient Sn= <§/Gn est engendré pàr lù:êl1t$_el)~ ,;,,,ft(yn:C.1f
et est isomorphe à (Z, +). · · · ·
PREUVE. Nous allons utiliser l'isomorphisme 1J' de (li,+) sur (t§, x) défini par
(le fait que 1J' est un isomorphisme se vérifie facilement par unicité de la décomposition en
facteurs premiers). Posons
Un= (Pn, ëïn}.
On a donc y n = 1J'( Un)- Soit Hn le sous-groupe de Z 2 engendré par Un, on a donc par définition
Hn = {fun If E Z}. Comme 1J' est un isomorphisme, on vérifie facilement que Gn = 1J'(Hnl-
On pose Qn = Z:2/Hn. Notons n la projection canonique de Z 2 sur Qn. Par définition,
Ker 7t = Hn.
Considérons maintenant le morphisme composé TT o 1J' : Z 2 --, 22n- Comme 1J' est un
isomorphisme, il est facile de voir que le noyau de l'homomorphisme composé TT o 1J' est
exactement Hn, en effet
TT o 1J' = lj., o n.
De plus, comme 1J' est surjectif, il en est de même pour TT o 1J' et donc aussi pour lj.,. Il en
résulte que lj., est un isomorphisme de Qn sur 22n, ce qui va nous permettre de montrer plus
facilement les propriétés cherchées, en raisonnant d'abord sur Qn et en « transportant ensuite
les résultats au moyen de lj., ».
Nous allons d'abord montrer que Qn est engendré par un élément. Pour cela, remarquons
que les propriétés des fractions continuées entraînent l'égalité IPnëïn-l - Pn-l ëïnl = 1. Notons
maintenant
L'égalité précédente montre que le couple B = (Un-l, Un) constitue une base de JR2 et montre
aussi que la matrice de passage
p = (~n-1 ~n)
qn-1 qn
est de déterminant ± 1, donc P est inversible et p- 1 est à coefficients entiers.
Soit maintenant un élément w quelconque de Qn- Fixons v E 1c1 (w). Comme v E 'li},
ce qui précède montre que les composantes de v dans la base B sont entières, soit donc
v = KUn-1 +Cun avec (K,C) E Ji. Il en résulte que w = n(v) = rr(KUn-1) = K7I(Un_,). Posons
ûl = rr(Un-1 ). Tout élément de Qn est de la forme Kûl avec K E Z, ce qui montre que ûl
engendre Qn et prouve notre assertion : Qn est monogène.
Nous allons maintenant vérifier que Qn est isomorphe à Z. Pour cela, notons <D l'applica-
tion de Z dans Qn définie par <l>(K) = Kûl pour K E Z. Cette application est clairement un
homomorphisme de (Z, +) dans ( Qn, +), surjectif d'après ce qui précède. Montrons qu'il est
injectif en cherchant son noyau. Supposons que KE Z vérifie <p(K) = Kûl = 0, c'est-à-dire
K7I(Un_,) = 7I(KUn_,) = 0,
ou, de manière équivalente
Kl.Ln-1 E Ker 7I = Hn
ce qui équivaut à l'existence de C E Z tel que KUn-l = Cl.Ln. Mais comme Best une base,
ceci entraîne que K et m sont nuls. Ceci montre donc que Ker <D = {O} et que <D est injective.
Comme <D est surjective, nous avons montré que Qn est isomorphe à Z.
Comme 11-' est un isomorphisme, il en résulte que .I2n est isomorphe à Z, et comme l'image
d'un générateur par un isomorphisme est encore un générateur, on voit que .f2n est engendré
par 11-'(ûl) = TT(Yn-il- Ceci termine la preuve. ■
2. Les gammes naturelles successives. Le groupe quotient .I2n a donc une description très
simple
.I2n = {g: 1 m E Z}
et nous avons fait un grand pas en avant. En identifiant les éléments de la famille '§ suivant le
sous-groupe Gn, nous avons considérablement limité les possibilités de choix pour constituer
une gamme. En particulier, un élément c de .I2n est complètement caractérisé par l'entier m
tel que c = g:. Nous appellerons degré de c cet entier m.
Rappelons qu'une gamme sera pour nous un ensemble d'éléments de'§ contenu dans [1, 2]
et possédant des propriétés spécifiques qui permettent de la caractériser de manière unique.
Ces propriétés seront issues de notre étude précédente du groupe quotient .I2n.
Commençons par examiner les classes des bornes de l'intervalle [1, 2]. La classe TT (1 ) est
bien comprise, c'est la classe de l'élément neutre, c'est donc l'élément neutre g~. Son degré
est donc O. Il est maintenant intéressant de connaître le degré de la classe TT(2) E .I2n.
Les deux extrêmes de l'octave, les éléments 1 et 2, ont donc des classes de degrés O et qn.
Il est donc naturel pour constituer une gamme de considérer l'ensemble des éléments de I2n
dont les degrés sont compris entre O et qn
Il nous reste maintenant seulement à passer de cette construction « abstraite », portant sur
des classes d'équivalence, à une construction explicite portant sur des éléments de'#. Si nous
arrivons à extraire de chaque classe d'équivalence un représentant privilégié, nous aurons
terminé. Or il se trouve qu'une classe d'équivalence c E I2n contient un unique élément > 1
de plus petite valeur. C'est évidemment celui-ci que nous allons choisir comme représentant
pour sa classe. Vérifions d'abord cette assertion.
Fixons une classe c E I2n. L'existence d'un élément > 1 de valeur minimale dans c est
évidente. Montrons l'unicité. Supposons que c contient deux éléments r = 2P 3q et r' = 2P' 3q'
distincts > 1 et de même valeur minimale. Supposons que p et q, et p' et q', soient de même
signe. Alors -v(r) = r = -v(r') = r', ce qui est impossible. Donc par exemple p et q sont de
signes distincts avec (l'autre cas se traitant de la même manière) 2P > 3q, donc -v(r) = 2P
L'égalité des valeurs entraîne facilement que p' et q' sont aussi de signes distincts. On en
déduit que p = p' et donc r' = 2P /3q' avec 3q' < 2P (puisque r' > 1). Mais comme r = r'ym
pour m E Z, ceci est impossible, ce qui termine la preuve de notre assertion.
Notre étude est donc terminée. pour construire une gamme, l'entier n étant donné, nous
allons former le groupe I2n et considérer ses éléments de degrés compris entre O et qn. Nous
obtendrons ainsi qn+l éléments dans I2n, qui sont des classes d'équivalence dans'#. De chacune
de ces classes, nous allons extraire un élément privilégié, celui qui est > 1 et dont la valeur
est la plus petite. C'est donc un élément de'# (donc un rationnel de la forme 2f3K), que nous
prendrons comme élément de notre gamme. On vérifie sans peine que ces éléments privilégiés
sont dans [1 , 2].
Pour c E I2n, nous noterons Pn(c) l'unique élément > 1 de c de valeur- minimale. Nous
pouvons maintenant conclure en donnant notre définition de la gamme naturelle de '# associée
au comma 'Yn·
Définition 23.32. Soit n EN*. La gamme naturelle de'# associée au comma 'Yn est l'en-
semble
Et il s'agit enfin de vérifier que nous avons reconstruit les gammes connues ! Il n'est pas
difficile de déterminer explicitement les valeurs de p(gk) pour les petites valeurs de n et k,
par un calcul direct. Nous laissons au lecteur le soin de vérifier les résultats suivants :
• pour n =1
'51 ={ 1,2}.
c'est simplement l'octave;
• pour n =2
c'est le rapport de quinte;
• pour n =3
2 2 2
3 2 3 2 }
IB2= { 1,23'3'2'3'2 .
c'est la gamme dite pentatonique;
• pour n =4
2 5 4 2 7
2 3 2 3 2 3 6 3 2 33 2 35 }
8 4
IB2= { 1,3s'23'33'26'3'29'2'34'24'32'27'2 .
c'est la gamme dodécaphonique usuelle avec une très bonne approximation ! Pour permettre
au lecteur de s'en convaincre, nous donnons ci-dessous le tableau des fréquences (en Hz) des
notes de notre gamme classique (dite tempérée) arrondies à l'entier le plus proche.
Rien n'interdit de continuer ... On trouve effectivement alors d'autres gammes, qui ont aussi
été utilisées, celles de Janko et Mercator. Nous ne prétendons pas que la contruction que nous
venons de décrire explique la genèse de toutes ces gammes, mais elle décrit leur structure d'une
manière parfaitement unifiée et cohérente, en montrant les relations qu'elle entretiennent avec
la décomposition en fractions continuées de ln 3/ ln 2.
Chapitre 24
LA NOTION GÉNÉRALE DE FONCTION
EN ANALYSE
'IDÉE de fonction que nous connaissons aujourd'hui est une notion moderne, fondée
L sur la théorie des ensembles, qui s'élabore seulement au début du XXe siècle. Dans ce
chapitre d'introduction à l'analyse, nous allons bien sûr rappeler cette notion, mais
nous allons aussi essayer de montrer ce que pouvait être une fonction avant la création de la
théorie des ensembles. En particulier, le titre du présent chapitre reprend celui du premier
chapitre de l'ouvrage Intrnductio in analysin infinitorum que publia Euler en 1748, à savoir De
Functionibus in genere: « Des fonctions en général». Nous citerons en complément quelques
extraits des écrits de cet illustre mathématicien sur les fonctions, que nous commenterons
ensuite dans les chapitres suivants.
Avant la fin du XIXe siècle, il n'existe pas encore de définition précise de ce qu'est une
fonction, mais cela n'empêche pas les mathématiciens de savoir ce qu'ils entendent par là et
de les étudier. Le besoin impérieux de disposer de définitions formelles pour les ensembles et les
fonctions ne se fera sentir que dans la deuxième moitié du XIXe siècle, lorsque commenceront à
apparaître des problèmes complexes qui nécessiteront de poser des bases solides sur lesquelles
asseoir la quantité déjà impressionnante de résultats mathématiques accumulée dans les siècles
passés.
Toutes ces définitions, qu'un étudiant est censé connaître de nos jours, sont donc le fruit
d'un très long processus de réflexion et de maturation, bien qu'elles paraissent maintenant
parfois parfaitement immédiates 1 . Un cours de mathématiques est en général une suite de
réponses et de solutions. Mais pour qu'il y ait une réponse, il faut en principe qu'il y ait eu
une question au préalable. Donner arbitrairement une réponse à une question non formulée
n'est en général pas très utile. Nous essayerons donc, dans cette partie dédiée aux fonctions,
de combiner la rigueur telle qu'on la pratique de nos jours avec une mise en perspective
historique et des raisonnements heuristiques qui auront pour but de montrer que, comme
toutes les disciplines, les mathématiques ne se sont pas faites en un jour.
Ce chapitre ne présentera pas de théorème. C'est essentiellement un exposé de diverses
notions, agrémenté de nombreux exemples, et comportant quelques définitions générales qui
nous seront utiles dans les chapitres ultérieurs. Ces notions seront plus longuement développées
dans les chapitres suivants, lorsque nous disposerons des outils adéquats.
De notre point de vue moderne, fondé sur la théorie des ensembles, une fonction (ou applica-
tion2) est la donnée de deux ensembles E et F, qualifiés respectivement d'ensembles de départ
et d'arrivée et dotés d'une certaine façon de faire correspondre aux éléments du premier des
1
Il en va de même pour la plupart des notions mathématiques dont un enseignement à rebours de l'histoire
laisse penser qu'elles sont formidablement dogmatiques.
2
Nous emploierons indistinctement les deux termes.
668
éléments du second. Nous rappelons dans ce qui suit quelques éléments sur les fonctions,
comme elles apparaissent en analyse.
E x F = {(x, y) 1 x E E, y E F}.
Définition 24.1. Une fonction (ou application} f d'un ensemble E vers un ensemble F est
la donnée d'une partie (h de E x F telle que, pour tout x E E, il existe un unique y E F
vérifiant (x, y) E 9t- La partie
9t = {(x, f(x)) 1 x E E}
On voit donc qu'une fonction est définie au moyen de trois objets: un ensemble de départ,
un ensemble d'arrivée, et une correspondance. Pour le rappeler, on emploie souvent la notation
f : E -1 F pour désigner une fonction de E dans F.
On voit aussi qu'on peut représenter une fonction f: E -1 F de deux manières équivalentes:
soit par la donnée de son graphe (vu comme une partie de Ex F soumise à certaines conditions),
soit par la donnée de l'image de tout point x de l'ensemble de départ E. Pour mettre en relief
la notion de correspondance, ou aussi la définition explicite de cette correspondance, on peut
utiliser la notation
f: E -1 F, x H f(x).
En pratique, il arrive souvent que des fonctions soient définies par des formules explicites.
C'est par exemple le cas de x H 1/x. Pour cette fonction, x varie dans R., mais le réel O n'a
pas d'image. Il faut dans ce cas préciser quel ensemble de départ il est légitime de considérer.
On choisit en général le plus gros ensemble de départ possible, que l'on appelle domaine de
définition de la fonction. Le domaine de définition de x H 1/x est R.*.
Pour des fonctions numériques d'une variable réelle, c'est-à-dire des fonctions dont l'en-
semble de départ et l'ensemble d'arrivée sont des parties de R., on donne le plus souvent la
fonction sous la deuxième forme et on la représente ensuite en dessinant son graphe, qui est
une partie de R.2 . Mais nous allons aussi avoir à nous intéresser à des fonctions plus générales,
par exemple définies sur un ensemble produit R.n, ou sur C, ou encore à valeurs dans un
ensemble produit R.n, ou dans C. La représentation la plus agréable et intuitive des fonctions
varie alors suivant les cas.
Nous allons en voir des exemples. Commençons par un exemple «abstrait» qu'il ne s'agit
pas de représenter sinon par des diagrammes de Venn, comme on l'a vu au chapitre 7.
669
Çf = {(1, a), (2, a), (3, a), (4, b), (5, b)},
détermine bien une fonction (ou application) de E vers f. On peut aussi écrire f: E ---, f,
avec
f(l) = f(2) = f(3) = a, f(4) = f(5) = b.
En revanche la partie Ji de E x f définie par
XH f(x).
En d'autres termes, la fonction f1A est la fonction qui à tout point x de A associe la valeur
de f en ce point. Elle diffère de f par le fait que son ensemble de départ est A et non E. En
termes de graphes, on voit facilement que Çf1A = {(x, f(x)) x E A}= Çf n (A x f).
1
go f(x) = g(f(x))
pour tout élément x de E.
L:. Soit E un ensemble. Si A est une partie de E, l'injection canonique iA de A dans E est
l'application définie par iA(x) = x pour tout x de A. On vérifie facilement que si f est une
application de E dans F, la restriction f1A de f à A vérifie f1A = f o iA.
671
Il est traditionnel de représenter les fonctions de lR dans lR par leur graphe, la raison
principale est que ce graphe est alors une partie de JR 2 (on dit aussi que c'est une courbe).
Imaginons maintenant que l'on ait à représenter une fonction de lR 2 dans R Son graphe est
donc une partie de JR 2 x lR = JR 3 (on dit aussi que c'est une surface), il est donc moins facile et
moins précis de le dessiner. Et si maintenant il s'agit de représenter une fonction de JR 2 dans
JR 2 le recours au graphe devient impossible, puisque c'est dans ce cas une partie de lR4 . Il faut
donc trouver d'autres moyens de représenter ces fonctions.
Pensons à la manière de dessiner les reliefs d'une montagne sur des cartes géographiques,
ou encore les relevés de pression sur une carte météorologique. Dans les deux cas, en assimilant
la région concernée à une partie P de JR 2 , il s'agit de représenter une fonction de P dans lR :
la fonction altitude ou la fonction pression. On n'utilise jamais pour cela la représentation
du graphe des fonctions, on préfère dessiner sur la région concernée des lignes régulièrement
espacées correspondant aux points d'égale altitude (une ligne tous les 50 mètres par exemple),
ou les points d'égale pression (une ligne tous les 10 hectopascals par exemple). Ces lignes sont
ce que l'on appelle des lignes de niveau pour les fonctions considérées. Nous allons maintenant
en donner la définition générale.
Définition 24. 7. Soient E et F deux ensembles. Soient f: E -, F une Jonction, A une partie
de E et B une partie de F. L'image réciproque de B par f est définie comme le sous-ensemble
de E constitué par les antécédents des éléments de B ; on note cette partie
L'image directe de A par f est définie comme le sous-ensemble de F constitué des images par
f de tous les éléments de A ; on note cette partie
L'image réciproque d'un singleton {y} s'appelle la fibre au-dessus du point y, c'est donc
l'ensemble des antécédents du point y.
672
EXEMPLE 24.8. Soit f: lR ----, JR, x H x 2 ; f n'est pas bijective. On a alors par exemple
Définition 24.9. Pour une fonction à valeurs réelles f : E ----, lR et pour c E JR, la fibre
f- 1 ({c}) s'appelle aussi le niveau de hauteurc.
Il.)
f/l
~
§
1
..8
Il.)
i:,
Il.)
]
•Il.)
i::
,Il.)
'QI)
1
j
Si l'on considère maintenant une fonction f définie sur une partie D de lR et à valeurs dans
JR 2 ou dans JR 3 , il est naturel d'en considérer plutôt l'image, c'est-à-dire l'ensemble f(D). Cet
ensemble est en effet une partie de lR 2 ou JR3, et il est possible de le représenter graphiquement.
EXEMPLE 24.12. Voici les images des fonction f et g de lR dans R 2 définies par
f(JR)
Nous connaissons déjà, depuis les premiers chapitres de base du présent ouvrage, les propriétés
ensemblistes qu'une fonction est susceptible de posséder, à savoir être injective, surjective,
bijective. Dans les chapitres qui suivent nous allons définir toute une série de propriétés de
674
«régularité» : continuité, dérivablité, intégrabilité, etc. L'étude de ces propriétés est l'objet
même de l'étude analytique des fonctions. Dans cette partie, à titre d'exemple, nous allons
énumérer quelques propriétés des fonctions que l'on rencontre en analyse, pour permettre au
lecteur de bien discerner le domaine de l'analyse de celui de l'algèbre. Ces fonctions sont en
général définies sur une partie de Rn (ou en) et à valeurs dans Rm (ou cm), mais nous nous
limiterons ici aux fonctions de R dans R Ces propriétés reposent alors de manière essentielle
sur la relation d'ordre de R Certaines des définitions que nous allons donner ont déjà été vues
dans le cadre des suites.
Définition 24.13. Soit E une partie de R
1) Une fonction f: E CR-, R est dite croissante si pour tout (x, y) E E1 , six,::;; y, alors
f (x) ,::;; f (y). Elle est dite strictement croissante si pour tout (x, y) E E1 , si x < y, alors
f(x) < f(y).
2) Une fonction f: E CR-, Rest dite décroissante si pour tout (x, y) E E2, six,::;; y, alors
f(x) ~ f(y). Elle est dite strictement croissante si pour tout (x, y) E E1 , six < y, alors
f(x) > f(y).
3) Une fonction f : E C R -, R est dite monotone si elle est croissante ou décroissante, et
strictement monotone si elle est strictement croissante ou strictement décroissante.
Les règles de calcul sur les inégalités entraînent facilement la proposition suivante, dont
nous laissons la preuve au lecteur.
Proposition 24~1s. Soient E Ùne partie non 1ritTe de R~ fe:t g deûffonctions définies de
E dansR.
1) Si f et g sont croissa~tes (resp. décroissantes), alors leur somme f+ g est.croissante
(resp~ décroissante);~
2) Si f et g ':sont à ~eui:s 0
6;~
R+ et toutes les deui croissantes (resp/ déetoissantes)1 alors
le produitfg êst crQfuant (resp. décroissante).
Si f : E --+ lR est majorée, on peut alors définir sa borne supérieure supE f de la manière
suivante ·
supEf = sup{f(x) x E E}. 1
La borne supérieure de l'ensemble {f(x) x E E} est en effet bien définie puisque cet ensemble
1
est une partie de JR, non vide (E est non vide) et majorée (f est majorée). De même, on définit
la borne inférieure de f lorsque f est minorée de la manière suivante
EXEMPLE 24.18. La fonction f : lR --+ JR, x H x 2 est minorée, avec infm;. f = 0, et non
majorée. La fonction g : IR --+ IR, x H sin x est bornée, avec infm;. g = -1 et supIR g = 1, et la
fonction h: IR --+ IR, x H x n'est ni majorée, ni minorée.
Proposition 24.19. .Soient E une partie non vide de R, f et g deux fonctions .définies de E
dans R. Nous avons les propriétés suivantes :
1) sif et g sont màjortes (resp; min11fflès}1 alœrs leur somme f + g est majorée (resp.
m'i,norée} ; .. .. ·
2) si f et g sont à valeurs dans R+ et toutes les deux majorées, alors le'JJ,r produit fg est
majoré;
3) si f et g sont bornées, alors f + g et fg sont bornées.
La relation d'ordre de IR entraîne l'existence de la valeur absolue. À son tour, cette va-
leur absolue permet de définir la notion de fonction lipschitzienne, que nous donnons à titre
d'exemple.
Définition 24.20. Soit I un intervalle de IR Une fonction f : I --+ lR est dite lipschitzienne
s'il existe un réel positif k tel que, pour tous x et y éléments de I, on ait l'inégalité
lf(x)-f(y)I ~ klx-yl.
2 3 4 5
Il est possible de définir d'autres indications de régularité, plus souples que le caractère
lipschitzien.
Définition 24.23. Soit I un intervalle de JR, soit ex > O. Une fonction f : I -, lR est dite
cx-holdérienne s'il existe un réel positif C tel que, pour tous x et y éléments de I, on ait
En conséquence, une fonction 1-holdérienne est lipschitzienne. Mais il existe des fonc-
tions holdériennes qui ne sont pas lipshitziennes, dès que ex < 1. La fonction x H y'x est
1/2-holdérienne sur ~+, mais elle n'est pas lipschitzienne, comme on aura pu le remarquer
grâce au test précédent. Pour une fonction cx-holdérienne f, le graphe est contenu dans les
régions de la forme
S(x,f(x)),C,cx = {(u, v) E ~
2
1lv- f(x)I ~ Clu- xi''}, XE~,
qui sont plus «grosses» que des secteurs angulaires. au voisinage du point (x, f(x)).
Terminons ce paragraphe par une dernière notion, basée sur la structure d'espace affine
de la droite réelle R
Définition 24.24. Soit I un intervalle ouvert non vide de R Une fonction f : I ---1 ~ est
dite convexe si, pour tout (x, y) E 12 et tout t E [O, 1]
Géométriquement, si f est convexe, la portion de son graphe comprise entre deux points
quelconques A et B est située au-dessus du segment [A, B] (voir le chapitre 29).
Dès l'Antiquité, des correspondances entre essence même, comportent des listes finies
deux listes de quantités, les secondes dé- et sont utilisées uniquement à des fins pra-
pendant des premières, apparaissent sous la tiques; on ne trouve pas dans tout cela l'idée
forme de tables, par exemple chez les Ba- d'une grandeur variable continue, à laquelle
byloniens, avec des tables sexagésimales de on assignerait une autre grandeur variable
carrés et racines carrées, de cubes et racines qui en dépendrait.
cubiques etc., utilisées essentiellement en as-
tronomie. Un peu plus tard, on les retrouve
chez les Grecs, avec les Pythagoriciens qui
étudient le lien entre les longueurs de cordes
pincées et les sons qu'elles émettent et qui
fondent ainsi les bases des gammes musi-
cales. Encore plus tard, au début de notre
ère, Ptolémée dresse, toujours pour des be-
soins de calculs astronomiques, des tables
trigonométriques. Toutefois, ces tables, par
Claude Ptolémée (vers 90-168)
Au XIVe siècle, les écoles de philosophie naturelle de Paris et d'Oxford font un pas de plus
vers la notion actuelle de fonction ; en particulier, Nicole Oresme, chez qui de surcroît va
apparaître leur représentation graphique. Dans son ouvrage Sur la configuration des qualités,
il écrit (vers 1350) :
Nicole Oresme distingue alors les qualités de la fonction selon la forme que possède sa
représentation graphique ; il parle en particulier de « qualité uniformément difforme terminée
à un degré nul» (entendre fonction linéaire) lorsqu'on a affaire à un triangle rectangle, de
« qualité uniforme ou d'intensité égale en toutes ses parties » (entendre fonction constante)
pour un rectangle et de « qualité uniformément difforme terminée de part et d'autre à un
certain degré » (entendre fonction affine) pour un trapèze. Et il ajoute
« Si la ligne d'intensité ou ligne de sommet est une courbe ou est composée de plusieurs
lignes, alors la qualité imaginable à partir d'une telle figure est dijformément difforme. »
Le traité d'Oresme comporte bien des aspects novateurs au-delà de la zoologie des qualités
précédemm~mt mentionnées mais qui seraient trop longs à rapporter ici.
D C
A B A B A
Mais ce n'est vraiment qu'à partir du XVIIe siècle que nous allons \Taiment trouver la
notion de fonction telle que nous l'envisageons encore aujourd'hui.
L'étude de la chute des corps par Galilée, les lois régissant le mouvement des planètes
données par Kepler sont des exemples fondamentaux de mise en correspondance de quantités
spatiales en fonction du temps et si l'on note souvent t H f(t) une fonction de nos jours,
cela est dû à cette vision cinématique première des fonctions dans laquelle la variable est le
temps 3 .
En dehors des lignes trigonométriques manipulées depuis déjà bien longtemps, la première
fonction non algébrique (on dit alors qu'elle est transcendante) qui apparaît vers 1615, est le
logarithme de Neper dont nous parlerons longuement dans un chapitre ultérieur.
En 1637, Descartes publie sa Géométrie dans laquelle il introduit la notion de coordonnées
et d'équations algébriques P(x, y) = 0 qui relie ces coordonnées et qui définit des courbes.
Il y écrit :
« Prenant successivement infinies diverses grandeurs pour la ligne y, on en trouvera aussi
pour la ligne x, et ainsi on aura une infinité de points tels que celui qui est marqué C, par le
moyen desquels on décrit la ligne courbe demandée »
3
Dans le chapitre sur la dérivation des fonctions, nous verrons comment cette interprétation en termes de
mouvement est importante pour comprendre la notion de dérivée comme vitesse instantanée.
Ces lignes expriment clairement l'idée de dépendance fonctionnelle entre quantités va-
riables.
Puis vint Euler au XVIIIe siècle qui développa de manière considérable l'analyse, c'est à
dire l'étude des fonctions. Dans le paragraphe qui suit, nous allons examiner avec quelques
détails, sa vision des fonctions en général.
La vision qu'ont les mathématiciens de la notion de fonction ne s'est évidemment pas figée
au XVIIIe siècle; elle est devenue de plus en plus générale au fur et à mesure que de nouveaux
problèmes émergeaient. Nous en donnerons quelques idées dans les chapitres ultérieurs. Nous y
verrons comment de fonctions très régulières, comme les fonctions polynomiales par exemple,
on est progressivement passé à des fonctions simplement dérivables puis seulement continues,
notion qui ne s'est clairement dégagée qu'au xrxesiècle (chapitres 25 et 26). Au chapitre 27,
nous verrons aussi comment Riemann a voulu encore élargir cette famille de fonctions pour
construire la notion d'intégrale. Au chapitre 28, nous montrerons enfin plusieurs procédés
explicites pour définir des fonctions et étudier leurs propriétés.
« 1. Une quantité constante est une quantité déterminée, qui conserve toujours la même valeur.
Tels sont les nombres de toute espèce, qui conservent constamment la valeur qu'ils ont une
fois obtenue. Lorsqu'il s'agit de représenter ces sortes de quantités par des caractères, on se
sert des premières lettres de l'alphabet, a, b, c etc. À la vérité, dans J'analyse ordinaire qui n'a
pour objet que des quantités déterminées, on désigne ordinairement celles qui sont connues
par les premières lettres de l'alphabet, et celles qui ne le sont pas, par les dernières; mais
c'est une distinction à laquelle on a moins d'égard dans la haute géométrie; on y envisage les
quantités sous un autre aspect particulier, les unes étant considérées comme constantes et les
autres comme variables.
2. Une quantité variable est une quantité indéterminée, ou, si l'on veut, une quantité universelle,
qui comprend toutes les valeurs déterminées.
Une valeur déterminée quelconque pouvant être exprimée en nombre, il s'ensuit qu'une
quantité variable comprend tous les nombres de quelque nature qu'ils soient. Il en est de la
quantité variable, comme du genre et de l'espèce à l'égard des individus; on peut la concevoir
comme embrassant toutes les quantités déterminées. Au reste, on a coutume de représenter
les quantités variables par les dernières lettres de l'alphabet z, y, x etc.
[. .. ]
4. Une fonction de quantité variable est une expression analytique4composée de quelque manière
que ce soit, de cette même quantité et de nombres, ou de quantités constantes.
Ainsi toute expression analytique, qui outre la variable z contiendra des quantités cons-
tantes, est une fonction de z. Par exemple, a+ 3z: az - 4zz: az + b ✓ aa - zz; cz; etc., sont
des fonctions de z.
5. Une fonction de variable est donc aussi une quantité variable.
En effet, comme on peut mettre à la place de la variable toutes les valeurs déterminées", la
fonction recevra elle-même une infinité de valeurs, et il est impossible d'en concevoir aucune,
dont elle ne soit susceptible, puisque la variable comprend même les valeurs imaginaires6.
Par exemple, quoique cette fonction ✓9 - zz ne puisse donner un nombre plus grand que 3,
tant qu'on mettra des nombres réels à la place de z; cependant, en introduisant pour z des
nombres imaginaires, tels que S ✓=î, il n'est pas possible d'assigner une valeur déterminée,
qui ne puisse être déduite de la formule ✓9 - zz. Au reste, il n'est pas rare de rencontrer des
expressions qui ne sont que des fonctions apparentes; car, quelque valeur qu'on donne à la
variable, elles conservent toujours la même valeur, comme z0 , F, a~=~·
Ces expressions sous
la forme apparente de fonctions de variables, sont réellement des quantités constantes7 .
6. La principale différence des fonctions consiste dans la combinaison de la variable et des quan-
tités constantes qui les forment.
Elle dépend donc des opérations par lesquelles les quantités peuvent être composées et
combinées entre elles. Ces opérations sont l'addition et la soustraction; la multiplication et la
division; l'élévation aux puissances et l'extraction des racines; à quoi il faut ajouter encore la
résolution des équations. Outre ces opérations, qu'on appelle algébriques, il y en a plusieurs
autres qu'on nomme transcendantes : comme les exponentielles, les logarithmes, et d'autres
sans nombre, que le calcul intégral fait connaître.
Distinguons cependant certaines espèces de fonctions; à savoir, les multiples 2z; 3z; ~z;
az, etc. et les puissances de z; comme z2 ; z3 ; z 112 ; z- 1 ; etc. quantités formées par une seule
opération, et qui, comme celles qui résultent de la combinaison de plusieurs, ne laissent pas
de porter de même le nom de fonctions.
4
Ce terme n'est pas précisé par Euler. Il faut entendre par là toute combinaison d'opérations algébriques
(sommes, multiplication, division) ou transcendantes (application de fonctions telles que l'exponentielle, le
logarithme ou les fonctions trigonométriques), certaines de ces opérations pouvant éventuellement être répétées
une infinité de fois. Ces divers types d'opérations sont détaillés un peu plus loin par Euler.
5
Euler ne s'embarrasse pas des problèmes d'ensemble de définition!
6 Comme nous le verrons dans le chapitre sur les fonctions élémentaires, le fait de considérer aussi les valeurs
complexes de la variable, ce que fait systématiquement Euler, est une idée extrêmement féconde même si elle
peut conduire à certaines difficultés que nous allons voir avec les fonctions multiformes.
7
Euler distingue fonctions et constantes, ce que nous ne faisons plus de nos jours; des fonctions peuvent être
constantes.
7. Les fonctions se divisent en algébriques et transcendantes; les premières sont formées par
des opérations algébriques seulement, et les dernières supposent pour leur formation des opérations
transcendantes.
[. .. ]
8. Les fonctions algébriques se subdivisent en rationnelles et en irrationnelles. Dans les dernières
la variable est affectée de radicaux, et dans les premières elle n'en est point affectée.
[. ..]
9. Les fonctions rationnelles enfin, se divisent en entières et en fractionnaires.
{. .. }
1O. Il faut ensuite remarquer principalement la division des fonctions en uniformes et en multi-
formes.
La fonction uniforme est celle qui n'obtient qu'une seule valeur déterminée, quelque valeur
déterminée qu'on donne à la variable z. La fonction multiforme est celle qui, pour chaque
valeur déterminée qu'on met à la place de la variable, donne plusieurs valeurs déterminées.
Toutes les fonctions rationnelles, soit entières, soit fractionnaires, sont des fonctions uniformes,
parce que ces sortes d'expressions, quel que soit le nombre qu'on substitue à la variable,
n'obtiennent qu'une seule valeur; mais les fonctions irrationnelles sont toutes multiformes, à
cause de l'ambiguïté des signes radicaux, et de la double valeur qu'ils indiquent. Il y aussi
parmi les fonctions transcendantes des fonctions uniformes et multiformes, on peut même
admettre des fonctions infinitiformes; tel serait l'arc de cercle qui répondrait au sinus z, car
il y a une infinité d'arcs circulaires qui ont tous le même sinus.
Nous indiquons dans cette partie quelques-unes des méthodes les plus utilisées pour définir
des fonctions dans la pratique.
EXEMPLE 24.26. Les fonctions f, g et h respectivement définies sur JR, JR* et (C par
1
f(x) = vY+J, g(x) = -,
X
h(z) =z4 +3z 2 -z+5,
sont des fonctions explicites de la variable x ou z exprimées à l'aide d'une seule formule.
G . lR 4
lR { 1/x si x # 0
. ' X H O si X = 0
Cette fonction n'est pas vraiment définie par deux formules mais par une formule et une
valeur ponctuelle.
Anticipant un peu sur les chapitres ultérieurs8 , on voit que, malgré la présence de ces
deux formules, la fonction f est continue en O (sur JR* c'est clair puisque f est donnée par
deux « formules de fonctions continues ») : il y a raccord des deux expressions avec une
valeur commune en O égale à 1. Pour Euler, une telle fonction définie par deux expressions
«analytiques» était considérée comme une fonction discontinue9 . On voit aussi que la fonction
f n'est pas dérivable en 0, comme le lecteur peut le vérifier.
0 si XE ]R_
f: JR-+ JR, X H { e -l/x2 Sl. Til)*
XE J&+
Le lecteur pourra, à titre d'exercice classique (voir le chapitre 29) montrer que la fonction
ainsi définie est indéfiniment dérivable sur R
Cette manière de définir une fonction par plusieurs formules est souvent utilisée pour
produire des exemples ou des contre-exemples.
EXEMPLE 24.30. Donnons un exemple de fonction définie sur lR qui, en tout point de R
n'admet ni limite à gauche, ni limite à droite. Si nous cherchons dans nos formules toutes
faites, nous aurons du mal à produire un tel exemple en combinant les fonctions élémentaires
par des sommes, produits ou composées. Voici pourtant une idée très simple, basée sur la
densité de Q et de lR \ Q dans lR : la fonction
f . lR 4
lR { 0 si x E lR \ Q
. ' X H 1 si X E Q.
8
Le lecteur a en fait déjà rencontré les notions évoquées ici dans la partie Bases du présent ouvrage.
9
Il ne s'agissait pas d'une erreur d'Euler mais simplement d'un autre point de vue, d'une autre définition, la
continuité au sens où nous l'entendons n'ayant été définie que beaucoup plus tard, dans la seconde moitié du
XIXe siècle.
On laisse au lecteur le soin de vérifier que la fonction f n'admet ni limite à gauche, ni
limite à droite, en un point quelconque de R
EXEMPLE 24.32. Soient f : lR'. --+ lR'. définie par f(t) = i1t
2 et g : lR'.+ --+ lR'. donnée par
g(x) = )t1 1 . On peut définir go f car f(JR'.) C lR'.+. Nous avons pour t E lR'.
1 2+t2
(g O f)(t) = g(f(t)) = ~ +
f(t) + 1
Les fonctions f et g de l'exemple précédent sont elles mêmes composées de fonctions. Par
exemple f est la composée de u H 1/u et x H 1+x2 . La composition de fonctions est un moyen
important pour fabriquer d'autres familles de fonctions à partir des fonctions élémentaires.
10
1a dénomination « fonction entière» recouvre de nos jours un sens plus large.
avec n E N, a 0 , a 1 , ••• , Œn E R
Elles son
« tout es les propriétés souhaitables>>, t définies sur lR tou t entier. Ces fonctions possèdent
ce sont les fonctions les plus régu
extension à une variable complex lières possibles. Leu r
e z ne pose auc un pro blèm e; elles
tou t entier, à valeurs dan s C. son t alors définies sur C
On définit de man ière plus gén
érale les fonctions polynomiales
exemple à plusieurs variables. Par
P(x, y)= x\ / + 5x3y + x 2 -4
est une telle fonction, qui peu t
être définie sur lR ou C.
Fon ctio ns rati onn elle s. Les fonc
tions rationnelles son t celles qui
tien t de deu x fonctions polynom s'ob tien nen t comme quo-
iales, de même que les nombres
quo tien ts de deux entiers. Là enc rati onn els s'ob tien nen t comme
ore, leur extension à une variable
problème. Par mi elles, figurent complexe ne pose pas de
évidemment les polynômes. En
finies sur lR (ou q tou t entier, général, elles ne son t pas dé-
mais sur cet ensemble priv é d'un
sont les racines du dén omi nate ur nom bre fini de points, qui
et son t appelés les pôles de la fonc
tion rationnelle.
EXE MP LE 24. 33.
► La fonction
g:C----,IC, 1
ZH -1- -2•
est rationnelle et a deu x pôles,
+z
t et -i, donc elle est définie sur C \ {-t
► La fonction , t}.
x4 -3x 2 + x + 8
f: lR --t lR, x H (x - 3)(x2 - 3x + 2)'
est rationnelle et a troi s pôles,
1, 2 et 3, donc elle est définie
sur lR \ {l, 2, 3}.
Ces fonctions rationnelles peuven
t s'écrire sous la forme d'un e som
tionnelles plus simples appelée me de fonctions ra-
décomposition en éléments simples
calculer leurs dérivées et primitive , ce qui est très util e pou r
s.
EXE MP LE 24. 34. La fonc
tion rati onn elle
f : lR 1
--t JR, x H _ x2 ,
1
s'éc rit
1 x = (, X + 1~ 2~ ~ ~X) '
ce qui perm et de calculer aisémen
t sa dérivée n-iè me :
(n) n! ( l (-l) n )
f (x) = 2 (l -x)n +T + (1 +x) n+l '
ainsi que ses primitives
J1 -
dxx2 = :z1ln (l1 -+ x) + C, x XE ) -1, 1[,
où C est une con stan te réelle arbi
trai re.
2.3. Fonctions implicites
Nous avons jusqu'à maintenant rencontré des fonctions définies de manière explicite, soit au
moyen dè formules, soit par composition à partir de fonctions élémentaires. Mais il y a un
autre moyen très important, dit implicite de définir des fonctions.
Pour le montrer, considérons d'abord une fonction f, de R dans R par exemple, et l'équation
f(x) = 0 qu'elle définit. On s'attend à trouver en général un nombre fini de racines isolées
dans R, c'est-à-dire intuitivement « éloignées les unes des autres ». L'ensemble de ces racines
peut être considéré comme défini par la donné de la fonction f. Dans le cas le plus favorable,
celui où f n'admet qu'une racine ex, ce réel ex peut donc être pensé comme implicitement défini
par f.
On considère maintenant une fonction F de R 2 dans R et, pour y E R, on définit une
fonction fy de R dans R par fy(x) = F(x, y). On suppose que l'équation fy(x) = 0 a une seule
solution, pour tout y de R, et on note cette solution Xy. Nous avons ainsi défini une nouvelle
fonction X de R dans R, par X : y H Xy, Cette fonction est dite définie implicitement par
l'équation F(x, y)= 0, elle est caractérisée par l'égalité F(X(y), y) = 0 pour tout y de R Nous
allons donner dans ce qui suit quelques variations autour de cette situation.
X : Z -----, R, n H Xn.
On peut donc ainsi définir une fonction sur Z, dont les valeurs sont les solutions d'une
même équation dans différents intervalles indexés par Z. On s'intéresse dans la suite au cas
plus important où les fonctions implicites obtenues sont définies sur un intervalle de R
Nous savons que celle-ci est un cercle de centre (0, 0) et de rayon .,je.
Pour chaque x donné dans ] - .,je, .,je[, l'équation d'inconnue y, x 2 + y 2 = c. a deux
solutions, ✓c - x 2 et - ✓c - x 2 . La courbe C n'est donc pas, bien entendu, le graphe d"une
fonction x H f(x). En revanche, pour tout point Mo= (xo, 1Jol E C avec 1Jo # 0, il existe un
«morceau» de C contenant M 0 , qui est le graphe d'une fonction x H f(x). Cette fonction f
est une fonction implicite définie par la fonction f.
Précisément sur cet exemple, si 1Jo > 0 (resp. 1Jo < 0), on peut prendre
Dans le cas où Mo # (-.,je, 0) et Mo # (VC, 0), ces graphes contiennent M 0 , sans que
celui-ci soit à une de leur« extrémité». Si en revanche, Mo= (-.,/c,0) ou M 0 = (.,/c,0),
on ne peut plus avoir cette propriété. Nous reverrons cet exemple classique au chapitre 30.
La notion de fonction implicite nous permet maintenant d'introduire deux classes de fonc-
tions, fondamentales dans l'histoire de la notion.
Les fonctions algébriques. Une fonction f: E C IR.--+ IR. est dite algébrique s'il existe une
fonction polynomiale non identiquement nulle, à deux variables
qui vérifie bien pour tout x E IR., P(x, f(x)) = 0, avec P(x, y) = x 2 + 1 -y 2 .
Les fonctions transcendantes. Les fonctions transcendantes sont celles qui ne sont pas
algébriques ; parmi elles on trouve les fonctions usuelles classiques, par exemple
où les fonctions Un, ... , a 1 , a 0 sont polynomiales en x. Ainsi, pour tout x E IR, on aurait
(24.l)
Faisant tendre x vers -oo dans cette égalité, on voit, comme l'exponentielle l'emporte sur
les polynômes, que la fonction polynomiale x H a 0 {x) devrait tendre vers O en -oo, ce
qui n'est possible que si elle est identiquement nulle. Divisant alors la relation (24.1) par
ex i- 0 et refaisant tendre x vers -oo, on obtient cette fois que la fonction x H ai(x)
doit être identiquement nulle et ainsi de suite. Tous les coefficients x H adx) sont donc
identiquement nuls, entraînant avec eux la nullité de P, d'où une contradiction.
Nous n'irons pas plus loin dans cette direction, les preuves nécessitant des techniques qui
ne seront vraiment mises en place que dans la suite du cours.
Chapitre 25
LES FONCTIONS CONTINUES
A notion de limite d'une fonction en un point trouve son origine dans le calcul différentiel.
L Ce dernier, comme nous le verrons dans le chapitre suivant, a été inventé par Leibniz et
Newton, et a permis de résoudre deux grands problèmes qui occupé les mathématiciens
du XVIIe siècle, à savoir le problème de la détermination des tangentes puis, grâce au calcul
intégral qui lui est intimement lié, celui du calcul des aires.
Déterminer la tangente au graphe d'une fonction f, en un point a, revient à trouver le
nombre vers lequel tend la quantité 't(x) = f(~=~al quand x s'approche de a. Cette fonction
't n'est évidemment pas définie en a car son évaluation en ce point donne lieu à une division
par O. Il semble cependant possible de lui donner un sens puisque le numérateur est aussi égal
à O en a; il s'agit de comprendre vers quelle valeur tend 't lorsque x se rapproche indéfiniment
de a, où encore lorsque x - a est infiniment petit. Mais la formalisation de cette notion a
nécessité plusieurs siècles.
Au sens moderne et actuel, une fonction continue sur un intervalle est une fonction dont le
graphe n'est pas «déchiré» en plusieurs morceaux; alors que pour Euler, c'était l'expression
690
de définition qui ne devait pas être constituée de plusieurs morceaux distincts. Les mathéma-
ticiens considéraient implicitement que toutes les fonctions « définies par une seule formule »
qu'ils étudiaient étaient «continues», ou à tout le moins ils ne se posaient pas complètement
la question de la continuité au sens où nous la connaissons aujourd'hui.
C'est à Cauchy, Bolzano et Weierstrass que l'on doit la rigueur des définitions et des preuves
en ce domaine, permettant ainsi d'asseoir l'analyse sur des bases solides et cohérentes. Voici
comment Cauchy présente la continuité des fonctions dans son Analyse algébrique de 1821.
L'un des théorèmes remarquables sur les fonctions continues est celui des valeurs intermé-
diaires. Stevin l'utilisa, sans le prouver, pour approcher les racines d'un polynôme. La preuve
complète et rigoureuse de ce résultat revient à Bolzano, qui rejetait les démonstrations fondées
691
sur la «géométrie» et la «mécanique», parce qu'il les jugeait insuffisantes (de même que
celles qui montraient ainsi la possibilité de décomposer tout polynôme à coefficients réels en rJJ
(l)
produit de termes du premier ou du second degré à coefficients réels).
C'est finalement à Weierstrass que l'on doit la définition formelle des notions de limite et
de continuité, en termes de E et de TI, que nous utilisons aujourd'hui. Signalons pour conclure
cette introduction que la définition et la manipulation des quantités infiniment petites est
i(.)
rJJ
l'objet de l'analyse non standard qui s'est développée dans la deuxième moitié du xxe siècle,
mais que nous n'étudierons pas dans ce cours. 1
sa
rJJ
Avertissement . Dans ce chapitre, pour donner des exemples explicites, nous ad- j
mettrons les propriétés des fonction élémentaires, rappelées dans la partie Bases. l!'Î
IN
Ces propriétés seront démontrées au chapitre 28. On présentera par ailleurs une
..d
construction complète des fonctions puissances d'exposant rationnel dans la partie ü
111.3 de ce chapitre.
Dans tout ce chapitre 1K désigne lR ou C. Sauf mention contraire, les fonctions considérées
dans cette partie seront à valeurs dans K
Par exemple, l'ensemble V= ]-1, O[U]O, 1[U]2, +oo[ est un voisinage de 3, et un voisinage
épointé de O. Ce n'est pas un voisinage épointé de 1, 2 ou 3.
Définition 25.2. Soient a un point de lR et f une fonction définie sur un voisinage épointé
V de a et à valeurs dans OC. Nous dirons que f admet une limite l au point a si, pour tout
E E JR~, il existe TI E JR~ tel que si t est dans V, et vérifie O < it - ai < TI, alors If (t) - li < L
Cette définition, une fois le nombre l fixé, comporte une donnée E E JR~ et une inconnue
TI E JR~. Il est important de remarquer que, si un nombre TI > 0 est solution de ce problème,
tout nombre ri' compris entre O et TI est lui aussi une solution. Il ne s'agit pas de déterminer
tous les nombres TI possibles, mais seulement de prouver l'existence de l'un d'entre eux.
On notera que l'inégalité O < lt - al insiste que le fait que t i= a.
692
On peut remarquer aussi que la fonction f peut être ou non définie au point a (en effet, on
exige dans la définition que f soit définie sur un voisinage épointé de a, c'est-à-dire que son
ensemble de définition doit contenir un tel voisinage, mais cet ensemble de définition peut être
plus gros, et en particulier peut contenir aussi le point a). On note d'ailleurs que le fait que
f soit définie au point a, et la valeur éventuelle de f au point a, n'interviennent aucunement
dans la définition.
Le lemme suivant montre l'unicité de la limite l.
Lemme 25.3. s~i(J;) un point de JR et f unéfonèticnâé/tnie sur ùnv&isinage éJ)OîntlV
dea;·Si f fJÂmet.'ilêtlimv.eeJ et:t1•·etn1-, e.l(Jf's l= F, . .
PREUVE. Soit I un intervalle ouvert inclus dans V et contenant a. Pour E E JR~ fixé, il
existe T] E JR~ (resp. TJ 1 E JR~) tels que si t et t' sont dans I et vérifient O < lt - al < T] et
O < lt' - al< TJ', alors lf(t) - li< E et lf(t') - li< E.
Soit t" E I tel que O < lt"-al < min(TJ, TJ 1 ). En utilisant l'identité l-l' = l-f(t")+f(t")-l'
et l'inégalité triangulaire, nous obtenons
Donc, pour tout E E JR~, Il- l'i< E, ce qui entraîne quel- l' = 0, donc l = l'. ■
EXEMPLE 25.4.
► Soit f 1 la fonction constante de lR dans C, de valeur IX. Alors pour tout a E JR,
limx->a f1 (x) = IX.
► Soit f 2 la fonction de JR* dans lR définie par f 2 (x) = 1 six< 0 et f 2 (x) = 1/2 six> O.
Alors f 2 n'a pas de limite au point O.
► Soit f 3 la fonction de JR* dans lR définie par f3(x) = -x si x < 0 et f 3(x) = x si x > O.
Alors limx-,o f3(X) = O.
► Soit f 4 la fonction de lR dans lR définie par f 4(0) = 8, f 4(x) = -x six< 0 et f 4(x) = x si
X> O. Alors limx-,of4(X) = O.
On peut être étonné du fait que la valeur éventuelle de f au point a n'intervienne pas. Il
s'agit là simplement d'une convention, nous verrons comment résoudre cette difficulté dans la
partie 1.6. Comme nous l'avons dit, nous abordons ici graduellement la difficulté de la notion
de limite.
Il est important de noter qu'il existe plusieurs formulations équivalentes de la définition
de la limite. A titre d'exercice, on laisse au lecteur le soin de se persuader de la validité de la
remarque suivante.
693
~
Dans la définition de la limite, il est toujours possible de choisir arbitrairement le type
d'inégalités utilisé. Par exemple, avec les notations de la définition, fa pour limite l au 0
point a si et seulement si pour tout E > 0, il existe T] > 0 tel que pour tout x E V
(.)
[/J
Une autre formulation de la notion de limite d'une fonction, qui ne fait intervenir que la
notion de convergence des suites, est donnée par la proposition suivante.
Pi~ptisitfc,n 25.6. •. Soient a un point de R .et f ittf;ê Jonct11on 4î/f,nie .sur tt.n. tJOÎSinàge épointé
Y.de a. Iio,Jd@ction f admet uneJimite l au point à si et seûij}tnetit. si p<mi-wute suite {t~} n)>Q
ile. V\{âl,c eoit'lierg1;nte de limite o.; la sit.ite {f(tn:}}:tQo•·est Cônverf,entè: de limitet -
PREUVE. Si lim f(t) =let si E E lR"i- est fixé, il existe TJ > 0 tel que si test dans V et vérifie
t.-,u
0 < lt- al< TJ, alors lf(t) - li< E.
Soit (tnln20 une suite de V\ {a} convergente de limite a. D'après la définition de la limite
d'une suite appliquée à TJ, il existe N EN tel que sin> N, alors 0 < ltn - al < TJ. On peut
694
donc déduire que lf(tnl - li< E pour tout n ~ N. Ceci prouve quel est la limite de la suite
(f(tn))n;:,:o-
Nous allons montrer la réciproque par l'absurde. On suppose donc quel n'est pas la limite
de f en a, c'est-à-dire qu'il existe Eo E lR't- tel que, pour tout TJ > 0, il existe t E V vérifiant
0 < lt - al < TJ et If (t) - li 2 Eo. En donnant successivement à TJ les valeurs 1/ (n + 1), quand
n décrit N, on obtient l'existence d'une suite (tnln>o vérifiant pour tout n EN les inégalités
0 < ltn - al< n:l et lf(tn) - li 2 Eo- -
Le théorème des gendarmes montre que (tnlnEN tend vers a, alors que la deuxième inégalité
montre que la suite (f(tnllnEN ne tend pas vers l. ■
Remarque. En utilisant l'unicité de la limite, cette proposition peut servir à prouver qu'une
fonction f n'a pas de limite en un point a. Il suffit pour cela d'exhiber deux suites (tn)n;:,:o et
(t~)n;:,:o de limite a, dont les suites (f(tnlln2:o et (f(t~)ln20 ne convergent pas vers un même
nombre.
Soit fla fonction définie sur R par f(t) = 1 si Soit fla fonction définie sur R par f(t) = t si
t E Q et f(t) = 0 sinon. Étudier l'existence de t E Q et f(t) = 0 sinon. Etudier l'existence de
la limite de f en tout point de R la limite de f en tout point de R.
um
t-la
!f(tll =llün f{t)I:
t-Hl
PREUVE. Soit (tnln2:o une suite de V\{ a} convergente de limite a; d'après la proposition 25.6,
la suite (f(tn)ln20 converge vers l. On peut donc conclure que la suite (lf(tn)l)n;:,:o converge
vers Ill, ce qui montre l'assertion, encore par la proposition 25.6. ■
695
Prophsition 25.9, Soit .a un PfJint de B.. Soient f et g de'/1,X for,i;twns définits sur un
voisinage épointé V de a, à valeurs dtJns K. [/J
Cl.)
1
t,-t~ .• ........ . ..::i . ; 'l""+Q t-tQ
EXEMPLE 25.11. Soit h la fonction définie sur JR* par h(t} = tsin(l/t}. Posons f(t} =
sin( 1/t} et g (t} = t. Les fonctions f et g vérifient au voisinage de O les hypothèses de la
proposition 25.10 ci-dessus. On peut donc affirmer que lim h(t} = O.
t....+O
Proposition 25.12. Soit f ·unéJonction à valeurs dans K* ayant 'lf,né limite l .non nulle en
un point _a! _Alortlafonc#on 1/f a pour limite 1/t en a, soit
l
lim-·-.. • ::;: _,___..,..
l
t'"4a:f{t} lîmf{t} ·
t-4a
PREUVE. Soit (tnlnEN une suite de V\ {a} de limite a où V est un voisinage de a. La suite
(f(tnllnEN a tous ses termes non nuls et comme elle converge vers l, qui est non nulle, alors
la suite (1 /f( tnl lnEN est convergente de limite 1/l. ■
PREUVE. Soit (tnlnEN une suite de V\ {a} de limite a. La suite (f(tnllnEN a tous ses termes
positifs et elle est convergente de limite lim f(t). On peut alors conclure que lim f(t) ~ 0 par
t--+a t--+a
les résultats de passage à la limite sur les suites. ■
En appliquant la proposition 25.6 et le théorème des gendarmes aux deux suites (f(tnllnEN
et (h(tnllnEN où (tnlnEN est une suite quelconque de V\ {a} de limite a, on peut déduire
facilement la proposition qui suit.
EXEMPLE 2 5 .1 7. Pour t E R on note E (t) la partie entière de t. On peut Yérifier que pour
tout n E Z, lim E(t) =net lim E(t) = n-1.
1 t-----+n+ t-----+n-
On voit facilement que les résultats énoncés précédemment demeurent valables lorsque lim
t-,a
est remplacée par lim ou lim .
t----ta+ t-----+a-
limf{tl
t➔ a
= lîtn f(t)·=. linrf(t);
t➔ a+ · ·t➔ a~
PREUVE. Il résulte directement de la définition de la limite que si lim f(t) = l, alors lest la
t-->a
limite de f à gauche et à droite en a.
Pour prouver la réciproque, supposons que ces deux limites existent et qu'elles sont égales
à un certain l. Si E E JR~, il existe T] E JR~ et T] 1 >E JR~ tels que si t est dans V et vérifie
0 < a - t < T] et 0 < t - a< T] 1 , alors lf(t) - li < E. En posant T] 11 = min(TJ', TJL on peut
affirmer que si test dans V et vérifie 0 < lt - al < T] 11 , alors lf(t) - li < E. ■
EXEMPLE 25.19. Soit fla fonction définie sur JR* par f(t) = tE(l/t). Par définition de la
partie entière, nous avons E(l/t) ,( 1/t < E(l/t) + 1. En supposant t > 0 et en multipliant
ces inégalités part, on obtient 0 ,( 1-tE(l/t) < t. Ceci entraîne que lim (1-f(t)) = O. On
t-->O+
déduit alors lim f(t) = 1. On peut prouver de la même manière que lim f(t) = 1. Grâce à
H~ H~
la proposition 25.18, on peut conclure que la fonction f admet 1 comme limite au point O.
Th~ti;?5~2 0..· ·. Sôit ·f· une fonction 1li valeurs réelles, déjime sur 11Jn:.1int:eroolle ouf.Jert li
Si f est monotone sur I, alors elle admet une limite à ilroite et une limite à gauche en tout
PQint'ne'I.
PREUVE. Supposons par exemple que f est croissante et fixons un point t 0 dans I. Soit J
l'ensemble des f(t) pour tous les t de I tels que t < t 0 . L'ensemble J, qui est non vide, est
majoré par f(t 0 ), donc il possède une borne supérieure l qui vérifie l ,(; f(to). On déduit
directement de la définition de la borne supérieure que l est la limite à gauche de f au point
t 0 . La limite à droite s'obtient en utilisant l'ensemble des f(t) pour tous lest de I tels que
t>~- ■
Nous dirons qu'une partie de li est un voisinage de +oo (respectivement -oo), si elle contient
un intervalle ouvert de la forme ]a, +oo[ (resp. ] - oo, a[).
Définition 25.21. Soit f une Jonction définie sur un voisinage V de +oo à valeurs dans K
Nous dirons que f a pour limite un élément l de OC en +oo si, pour tout E E li~, il existe
B Eli+ tel que, si t EV et t > B, alors lf(t) - li < E. On note dans ce cas lim f(t) = l.
t-.+oo
Définition 25.22. Soit f une fonction définie sur un voisinage V de -oo à valeurs dans K
Nous dirons que f a pour limite un élément l de OC en -oo si, pour tout E E li~, il existe
B Eli+ tel que, si t EV et t < -B, alors lf(t) - li < E. On note dans ce cas lim f(t) = l.
t---t-oo
699
Il est facile de voir que les résultats prouvés dans les parties précédentes restent valables
en remplaçant dans les énoncés le point a par ±oo. rJl
V
Pour les exemples suivants, nous admettons les propriétés usuelles des fonctions puissances
d'exposant rationnel, qui seront montrées en partie 111.3 de ce chapitre.
§
~
rJl
EXEMPLE 25.23. Soit r E (Q)'_. Alors lim tr = O. §
t-----1+00 p
1
► En effet, si E E JR~, il suffit de prendre B ;?: E l/r_
~
..s
rJl
~
EXEMPLE 25.24. Montrons que lim v1t+Î -vt = O. U"Î
t--->+oo N
► Fixons t > 0 et multiplions v't+l - vt par son expression conjuguée. Nous obtenons ..d
u
(v1t+Î - vt)( v1t+Î + v't) = (✓t + 1J2- (v't)2 = 1,
1
d'où l'identité v't+l - vt = v't+l vt qui conduit à la majoration.
t+l+ t
1
Maintenant, puisque lim h = 0, on a la conclusion.
t--->+oo yt
EXEMPLE 25.25. Soit f une fonction définie sur ]A, +oo[ avec A> O. Pour t E]O, 1/A[, on
pose g(t) = f(l/t). Nous avons lim f(t) = l si et seulement si lim g(t) = l.
1 t--->+oo t--->O+
Définition 25.26. Soient a un point de lR et f une fonction à valeurs réelles définie sur un
voisinage épointé V de a.
1) Nous dirons que f a pour limite +oo au point a, ou tend vers +oo quand t tend vers a
si, pour tout A > 0, il existe T] > 0 tel que si t est dans V et vérifie O < lt - al < TJ, alors
f(t) > A. On note dans ce cas lim f(t) = +oo.
t--->u
2) Nous dirons que f a pour limite -oo au point a ou tend vers -oo quand t tend vers a
si, pour tout A > 0, il existe T] > 0 tel que si t est dans V et vérifie O < lt - al < TJ, alors
f(t) < -A. On note dans ce cas lim f(t) = -oo.
t--->u
700
EXEMPLE 25.27. Remarquons que suivant notre définition, une fonction peut être définie
en un point, et même en tout point de la droite réelle, tout en ayant une limite infinie en ce
point.
► C'est le cas par exemple de la fonction f définie sur lR par f(0) = 1 et f(t) = 1/t2 pour
tout t E JR*. Pour prouver que limHo f( t) = +oo avec les notations de la définition, il suffit,
étant donné A> 0, de prendre T] ~ 1/#.
lim f(t)
t-ta
= t-ta
lim g(t) = +oo (resp. lim f(t) = lim g(t) = -oo),
t-ta t-ta
lim(f(t) + g(t))
t---)U
= +oo (resp. lim(f(t)
t---)Q
+ g(t)) = -oo.
Il en va de même par exemple si limHa f(t) = +oo et si g est minorée, comme pour le cas des
suites. Dans les autres situations nous sommes en présence, comme dans le cas des suites, de
la forme indéterminée oo - oo. Nous de redonnerons pas ici toutes les propositions relatives
aux formes indéterminées, qui sont calquées sur celles que nous avons énoncées pour les suites,
et nous limiterons à quelques résultats.
f•
Proposititm • 25.~6. Soient n.uh '[IÔint de R, et,g deu:c J<11Jètwns à valeurs réelles définies
V
sur un voisînagè ~inte âe à/ On suppose qu<i ta fonctÙ'J1t g est'mino.rée S'!SrV ]Jar un 'réel
strictement positif. Dans 'ce cas, si mn f(t) =+oo, alors fun fg{t) = +oo. · · ·
t-Hl t➔ Q
PREUVE. Soit m > 0 un réel tel que g(t) ~ m pour tout t EV\ {a}. Fixons un réel A> 0 et
appliquons la définition de lim f(t) = +oo au réel A/m. Il existe dans ce cas un réel T] > 0 tel
t---)U
que si t EV vérifie 0 < lt- al < TJ, alors f(t) > A/m. En multipliant par g(t) cette inégalité,
on obtient que f(t)g(t) > g(t)A/m ~ A. Nous avons ainsi montré que lim fg(t) = +oo. ■
t---)Q
En remarquant qu'une fonction ayant en un point a une limite l E JR~ U { +oo} est minorée
dans un voisinage épointé de ce point par un réel strictement positif, on montre facilement
le corollaire ci-dessous, en tenant compte des conventions classiques, l x +oo = +oo si l E
JR~ U {+oo} et lx +oo = -oo sil E lR:'._ U {-oo}.
EXEMPLE 25.30. Soient a un point de lR et f une fonction à valeurs réelles définie sur un
voisinage épointé V de a. Montrons que les deux propriétés suivantes sont équivalentes :
1) lim f(t) = +oo:
t-,a
► Si lim f(t) = +oo, fixons E E lR"t et appliquons la définition à A= 1/E. Il existe dans ce
t-->a
cas TJ > 0 tel que si t EV et vérifie O < it- ai< TJ. alors f(t) > 1/c. On peut conclure que
1/f(t) < E pour tout t E Vn ]a -TJ, a+ T][. Ce qui se traduit par lim 1/f(t) = O. De plus
t-->a
V n] a - TJ, a + TJ [ est un voisinage épointé de a sur lequel f est > 0.
Pour la réciproque, étant donné A> 0, il suffit d"appliquer la définition de lim 1/f(t) = 0 t-;a
à E = 1/ A et tenir compte du fait que f prend des rnleurs strictement positives au voisinage
du point a.
Test 25.18. in
Test 25.17. (N
,.d
Soient f, g deux fonctions de JE. dans JE.+ et a Soient f et g deux fonctions de JE. dans JE. telles ü
un point de JE. tels que lim f(t)g(t) = +oo. que lim f(t)g(t) = O. Peut-on affirmer que
t-;a t--++oo
Peut-on affirmer que lim f(t) = +oo ou lim f(t) =Oou lim g(t) =0?
t-->a t-->+= t-;+=
lim g(t) = +oo?
t-->a
On peut maintenant envisager le cas où la fonction (toujours à valeurs réelles) est simplement
définie sur un voisinage à droite où à gauche de a.
Nous laissons au lecteur le soin de vérifier que les résultats précédents demeurent valables
en remplaçant la limite par la limite à gauche ou à droite.
Examinons rapidement le cas des fonctions à valeurs réelles définies sur des voisinages de
l'infini.
Définition 25.32.
1) Soit f une fonction définie sur ]a, +oo[ à valeurs réelles. Nous dirons que f a pour limite
+oo en +oo si, pour tout A> 0, il existe B > a tel que si t > B, alors f(t) > A. On note
dans ce cas lim f(t) = +oo.
t-->+oo
2) Soit f une fonction définie sur] - oo, a[ à valeurs réelles. Nous dirons que f a pour limite
+oo en -oo si, pour tout A> 0, il existe B < a tel que, si t < B, alors f(t) > A On note
dans ce cas lim f(t) = +oo.
t--+-oo
702
EXEMPLE 25.33. En admettant les propriétés des fonctions puissances d'exposant ration-
nel, nous avons lim tT = +oo pour tout r E Q"t-- En effet, si A > 0, il suffit de choisir
t-i+-oo
EXEMPLE 25.34. Soit Pla fonction polynôme P(t) = Untn+ Un_,tn-l + · · · + u,t + uo, où
- .
n EN* et Un non nul. Ecnvons ( ) = tn ( Un+ -
Pt - + · · · + -U1-1 + -Uo) . s·1 f est la fonction
Un--1 .
t tn- tn
définie sur JR* par
Un--1 U1 Uo
f(t) = u n + - + · · · + - + -
t tn--1 tn'
alors lim f(t) =Un-On peut donc conclure que lim P(t) = +oo, si Un> 0, et lim P(t) =
t------'i+oo t-----;+oo t--++oo
-oo, si Un < O.
où n et m sont dans N* et Un et bm deux réels non nuls de même signe. Montrons que
lim P(t)/Q(t) = +oo sin> m, lim P(t)/Q(t) = Un/bn sin= met lim P(t)/Q(t) = 0
t----1+00 t-----++oo t-----t+oo
dans le cas où n < m.
En mettant tn et tm en facteur dans Pet Q, on obtient que P(t)/Q(t) = tn-mf(t)/g(t),
où
f(t) = Un + -
Un--1
t - + . . . + tn--1
u, + tn
Uo et
Définition 25.36. Soit A une partie de R Un point u est dit adhérent à A lorsqu'il existe
une suite d'éléments de A qui converge vers u. L'adhérence de A est l'ensemble des éléments
adhérents à A. On la note A ou AdhA.
Revenons aux limites. Lorsqu'une fonction est définie sur une partie, il est possible de
définir sa limite en tout point adhérent à la partie.
703
Définition 25.37. Soit A une partie de JR., et f une fonction de A dans lK. Soit a E A.
On dit que f a pour limite C lorsque x tend vers a, suivant la partie A, si pour tout E E JR.~,
il existe TJ E JR.~ tel que pour tout x E A vérifiant lx - al < TJ, alors lf(x) - Cl < E. On note
alors
lim f(x) = €.
x4a,xEA
La définition que nous venons de donner est donc formellement la même que la définition
initiale, seule la contrainte sur la nature de l'ensemble de définition de f a changé. On demande
seulement maintenant que le point a soit adhérent à l'ensemble de définition de f. Ceci se
comprend bien : pour pouvoir parler de limite d'une fonction en un point, il faut que ce point
tri
puisse être approché arbitrairement près par des points en lesquels la fonction est définie. ~
..d
C'est exactement ce que l'on demande en imposant l'existence d'une suite de points de A qui u
converge vers a. Il est en fait inutile que f soit définie sur tout un voisinage épointé de a.
La deuxième amélioration est que nous parlons maintenant de limite suivant une partie.
C'est ce qui permet de lever l'ambiguïté sur l'influence du comportement de f au point a.
Pour le voir, prenons un exemple. Supposons que la fonction f soit définie sur ] - 1, 1 [, et que
le problème de la limite se pose en O. On peut alors considérer la partie A =] - 1, 1 [ ou la
partie A*=] -1, 1[\{0}. La limite de f suivant la partie A* sera exactement celle que nous
avons définie jusqu'à maintenant, et sera indépendante de la valeur de f au point a, alors que
la limite de f suivant la partie A dépendra de la valeur de f au point a, et ne pourra qu'être
égale à cette valeur, en cas d'existence. Donnons des exemples plus précis.
EXEMPLE 25.38.
► Soit f: lR----, lR. définie par f(x) = 0 six< 0, f(0) = 3 et f(x) = 0 six> O. Alors la limite
de f suivant lR n'existe pas. En effet, si elle existait, elle serait égale à 3, puisque pour tout
réel TJ > 0, Xo = 0 vérifie lxo - 0I < TJ et f(xo) = 3. Si f a pour limite C en 0, on doit donc
avoir If( x 0 ) - Cl < E pour tout E > 0, donc C = 3. Mais si E = 1 par exemple, il est impossible
de trouver un réel TJ > 0 tel que lf(x) - 31 < 1 pour tout x tel que lxl < E, ce qui montre
que la limite ne peut être égale à 3. La fonction f n'a pas de limite suivant lR au point O. En
revanche, il est clair que
lim f(x) = O.
x---------,0,xEIR*
► Soit f: lR----, lR définie par f(x) = x six< 0, f(0) = 0 et f(x) = -x six> O. Alors il est
clair que
lim f(x) = lim f(x) = O.
x------tO,xEIR* x-tO,xEIR
Mais si f(0) = 8, la limite de f suivant lR. n'existe pas, alors que la limite suivant JR.* est O.
En résumé, lorsque f est définie sur un voisinage épointé V du point a, la notion initiale de
limite que nous avons définie coïncide exactement avec la limite au point a suivant la partie
V, mais ce n'est plus le cas si V contient le point a.
Signalons maintenant une autre forme de la définition, clairement équivalente à la définition
25.37, qui est aussi très utile en pratique et que nous retrouverons dans la partie IV.
EXEMPLE 25.40.
► Soit f une fonction de N dans R Alors pour tout n EN, limx--ln,xENf(x) = f(n).
► Soit A= {1/n In EN*}. Alors O E A. Soit f: A-----+ lR définie par f(l/n) = (10 + 3n)/n.
Alors limx--lO,xEA f(x) = 3.
Considérer le cas où la partie A est égale à N n'est en fait pas sans intérêt. En effet, il
nous reste maintenant à formaliser dans notre cadre général le problème des limites aux points
±oo. Il faut pour cela étendre la définition de l'adhérence d'une partie.
Définition 25.41. Nous dirons que +oo est adhérent dans ÏR à une partie A de lR lorsqu'elle
n'est pas majorée, et que -oo est adhérent à A dans ÏR lorsque A n'est pas minorée.
On voit bien que cette définition est compatible avec la caractérisatio n séquentielle des
points adhérents donnée au chapitre 22, puisque +oo est adhérent à A si et seulement si il
existe une suite de points de A qui tend vers +oo (propriété analogue pour -oo).
Définition 25.42. Soit A une partie non majorée de lR, et f une fonction de A dans JK. On
dit que f a pour limite e lorsque x tend vers +oo, suivant la partie A, si pour tout E E lR"t-, il
existe ME lR"t- tel que pour tout x E A vérifiant x > M, alors lf(x) - fi < E. On note alors
lim
x--++oo,x.EA
f(x) = e.
On a une définition analogue pour les limites en -oo.
Avec cette définition, on voit facilement que une suite (UnlnEN converge vers e au sens
habituel si et seulement si elle a pour limite eau point +oo, suivant la partie N.
On vérifie par ailleurs facilement que toutes les propriétés élémentaires des limites que nous
avons montrées au paragraphe I.1 de ce chapitre se transposent au cas des limites suivant une
partie. Nous laissons au lecteur le soin de le prouver. On peut aussi énoncer sans difficulté les
définitions relatives au cas des limites ±oo aux points ±oo.
Terminons cette partie par un résultat fondamental, que nous pouvons maintenant énoncer
dans sa pleine généralité.
PREUVE. Soit E > 0 fixé. Alors il existe TJ > 0 tel que si 1J E B vérifie Ill-b < TJ, 1g (1J )-€1 < E.
1
Mais il existe a> 0 tel que six E A vérifie lx - al < a, lf(x) - bl < TJ. Il en résulte, puisque
f(x) E B par hypothèse, que lg(f(x))-€1 < E, ce qui montre la propriété. ■
705
On vérifie sans difficulté que le théorème précédent s'étend au cas où A et B sont considé-
rées comme des parties de 'i, et a= ±oo et b = ±oo.
Avertissement. Dans la suite, sauf mention contraire, nous utiliserons la notion
de limite que nous venons de définir. Si le contexte est clair, il arrive que l'on
omette de préciser que la limite est prise suivant la partie A considérée.
Nous en venons maintenant à la formalisation de la notion de continuité, qui comme nous tr.i
C'I
l'avons montré en introduction ne s'est que graduellement précisée au cours des âges. .d
ü
La propriété de continuité décrit en partie le lien entre la limite d'une fonction en un point
et sa valeur en ce même point (ce qui suppose qu'elle est définie en ce point). Une fonction f
est continue en un point u si elle prend des valeurs proches de f(u) dans un voisinage de a.
Intuitivement, une fonction est continue si le tracé de son graphe ne présente aucun saut.
Définition 25.44. Soit f une fonction définie sur une partie A de IR, à valeurs dans OC, et
un élément a de A. On dit que f est continue au point a si sa limite en a suivant A est égale
à f(a). En d'autres termes, f est continue au point a si et seulement si pour tout t: > 0, il
existe TJ > 0 tel que pour tout x E A vérifiant lx - al< TJ, alors lf(x) - f(u)I < f.
EXEMPLE 25.45.
► Toute fonction constante est continue.
► La fonction f: lR----, lR définie par f(x) = x est continue en tout point de R
► La fonction f: lR----, lR définie par f(x) = 0 six :s; 0 et f(x) = x six;?: 0 est continue au
point O.
► La fonction f: lR----, lR définie par f(x) = 0 six S O et f(x) = 1 six> 0 n'est pas continue
au point O.
► La fonction f : lR ----, lR définie par f(x) = 0 si x E lR \ Q et f(x) = 1 si x E Q n'est
continue en aucun point de R En effet, si x 0 E Q, et si TJ > 0 est donné, on sait qu'il existe
un irrationnel x tel que lx - xol < TJ, donc lf(x) - f(xo)I > 1/2, ceci montre que f ne peut
être continue en Xo. De même, si Xo E lR \ IQl et si TJ > 0 est donné, on sait qu'il existe un
rationnel x tel que lx - x 0 < TJ, donc lf(x) - f(xo)I > 1/2, et ceci montre que f ne peut être
1
continue en x 0 .
► La fonction x H lxl est continue en tout point x 0 E R
Avec les mêmes notations, on peut donc écrire lim f(tn) = f( lim tn), dès que f est
n---,+oo n---,+oo
continue.
706
~ Définition 25.47. Soit f une fonction définie sur une partie A de JR, à valeurs dans JK., et
un élément a de A. On dit que f est continue à gauche au point a si sa limite en a suivant
la partie An]-oo, a] est égale à f(a). De même, on dit que f est continue à droite au point
a si sa limite en a suivant la partie A n [a, +oo [ est égale à f (a).
Notons que si a est le plus petit élément de A, alors f est toujours continue à gauche en a,
et de même f est toujours continue à droite en a si a est le plus grand élément de A. On voit
aussi qu'une fonction est continue en un point si et seulement si elle est continue à gauche et
à droite en ce point.
EXEMPLE 25.48. Pour t E lR, on note E(t) la partie entière de t. Nous savons que
-~ -0 ~~ ~~
lim E(t) = n - 1 et lim E(t) = n sin E Z et lim E(t) = lim E(t) = v = E(v) si
v E lR \ Z. On déduit alors que E est continue en tout point de lR \ Z, continue à droite en
tout n E Z et discontinue à gauche en tout point de Z.
Soit f une fonction définie sur un voisinage épointé V d'un point a. On suppose que f
possède une limite l au point a. On définit une nouvelle fonction f sur V par t(t) = f(t) si
t E V\ {a} et t( a) = l. La fonction f est continue au point a. Par définition f s'appelle le
prolongement par continuité de f au point a. Le prolongement par continuité à droite ou à
gauche se définit de la même manière.
EXEMPLE 25.49. Pour t E JR*, on pose f(t) = tsin(l/t). Nous avons déjà montré que
lim f( t) = O. La fonction f se prolonge alors par continuité au point O.
1 t---;0
enà.
La propriété fondamentale suivante est immédiate à partir de la proposition 25.43.
Proposition 25.51. Soi.·ent A et B des· parties de R., f une Jonctiori de A dans lR, avec
. . .
f(AJ ç B, et g une fonction de B dans K. Alors si.f est continue en!J: ti;.A et si g est
continue en f(a),. alors Q Of est continue en a.
707
-~
II.2. Continuité globale •
[/J
(L)
Étudions maintenant les problèmes de continuité sur des sous-ensembles de lR. ;:l
.s.....,
Définition 25.52. Soit f une fonction définie sur une partie A de JR, à valeurs dans 1K. On i::
0
dit que f est continue sur A si f est continue en tout point de A. "i::
[/J
0
:p
EXEMPLE 25.53. "i::
..8
► Les fonctions constantes sont continues sur R [/J
~
► La fonction x H x est continue sur R
LCi
► La fonction f : x H x 2 est continue sur R On peut le rnir en utilisant le point préédent et "1
la proposition 25.50, mais nous allons le montrer directement. Fixons x 0 dans lR et montrons ..d
u
que f est continue en x 0 . Soit f > 0 fixé. Posons T] = min( 1, e/(2lxol + 1) ). Alors si lx-x 0 1 < 11,
Un bon exercice consiste à montrer par des méthodes directes la continuité dans lR de
la fonction x H x\ où r est un rationnel positif donné. Nous verrons au chapitre 28 que la
fonction x H x"' est continue dans lR lorsque ex E JR+ et dans JR* lorsque ex E JR:_.
La proposition 25.50 a bien sûr sa conséquence globale.
Prop913fü<>t1 ;z,~if
0
891,t!:tJJ f ~t g ties/C1iiitww,)1éfiinjes ,.- pne•:f!IJ,rtie A ~le R"
dqns lK, SQÏrns.e JK,~~«•i Ai i . . . ~ • • • . •
à valeurs
•
F"füpôsitiôn ':25.55i , Soient A et B des P«rti~s tle' lltj f 1une fonction dé A dans R, avee
f{Aj C B, et :g ürte:fm,,t:tiion .1.ùt'B dans K., A1ors sif eet continue sur A et si11 ·f;St C(mtinue
:sttr B~ alvrs g o f Mt oontinué sur A. .
La proposition 25.8 montre que la continuité de f entraîne celle de lfl.
EXEMPLE 25.56. Soient f et g deux fonctions réelles définies et continues sur R Pour
t E JR, on note, h(t) = max(f(t), g(t)). À l'aide de l'identité
la fonction h peut s'ecrire h( t) = f(tJ+g(tJif(tJ-g(tll, elle est donc continue. Une récurrence
prouve que le résultat reste valable pour une famille finie de fonctions, c'est-à-dire que la
fonction h( t) = max( f 1 ( t), f2( t), ... , f n( t)) est continue si f 1 , f 2, ... , f n le sont.
1
708
Le résultat de l'exemple 25.56 n'est plus vrai pour une famille infinie de fonctions continues,
en remplaçant le max par le sup. Prenons par exemple fn( t) = -tn si t E [O, 1], fn(t) = 0 si
t < 0 et fn(t) = -1 si t > 1. La fonction h(t) = supnEN.(fn(t)) est donnée par h(t) = 0 si
t < 1 et h( t) = - 1 si t 2'. 1. Elle est bien discontinue au point 1.
Nous allons considérer maintenant les propriétés des fonctions continues sur des segments,
c'est-à-dire des intervalles fermés et bornés.
Théorêm~ 25:57. '.l'ott,t~ fo11;1ili1l 9-.'l!al,e~~. 'tf~l!es <lêJinîtr~f; rifmtfr,iu{ it11-r: ttn s ~ t ë:it
barn~: · · ·
PREUVE. Soit f : [a, b] ---, JR, avec ( a, b) E JR 2 et a < b. On suppose la fonction f non
majorée. Dans ce cas, pour tout réel M, il existe t dans [a, b] vérifiant f(t) ? M. En prenant
M = n pour n dans N, on a un réel tn E [a, b] tel que f(tn) ? n. Comme la suite (tnlnEN
ainsi obtenue est bornée, on peut en extraire une suite convergente (tn, lkEN de limite ex. Nous
avons donc f(tnkl ? nk pour tout k EN. La continuité de f entraîne que la suite (f(tnklkEN
converge vers f(ex); or on constate, à cause de l'inégalité précédente, qu'elle tend vers +oo.
On aboutit ainsi à une contradiction. Pour établir que f est minorée, il suffit d'appliquer ce
qui précéde à -f. ■
Soit f une fonction à valeurs réelles définie sur une partie A non vide de R Rappelons que
les bornes de f sur A sont suptEA f(t) = supf(A) et inftEA f(t) = inff(A).
PREUVE. D'après le théorème précédent, la fonction f est bornée sur [a, b]. Notons ex sa
borne inférieure sur cet intervalle et supposons qu'elle n'est pas atteinte par f. Considérons
alors la fonction
1
g : [a, b] ---, JR, g(t) = f(t) - ex'
709
qui est bien définie et continue sur [a, b], par composition de t H f(t) - ex (continue et à
valeurs dans IR*) et de t H 1/t (continue sur IR*).
Soit M > 0 donné. Par définition de la borne inférieure, nous savons qu'il existe t dans
[a, b] tel que ex ( f(t) < ex+ 1/M, et donc g(t) > M. Comme M est arbitraire, ceci montre
que g n'est pas majorée; or ceci contredit le théorème 25.57 appliqué à g. ■
EXEMPLE 25.59. Soit f une fonction continue de [a, b] dans [a, b] telle que pour tout x
et 1J distincts lf(x) - f(y)I < lx -yl. Montrons qu'il existe un unique Xo dans [a, b] tel que
f(x 0 ) = Xo.
► Pour x E [a, bl, on note g(x) = lf(x)-xl. La fonction g étant continue (par composition),
elle atteint son minimum en un point Xo de [a, b]. Si f(x 0 ) est distinct de x 0 , alors
segments emboîtés de longueur b2-;:;0 avec la condition f(un)f(bnl :( O. Comme b;a tend vers
0 quand n tend vers l'infini, il existe alors un point c E [a, b) qui est la limite des deux suites
(unln>1 et (bn)n>1- En passant à la limite dans l'inégalité f(un)f(bn) :( 0 et en utilisant la
contin~.üté de f, o; obtient f(c) 2 :S 0; ce qui entraîne que f(c) = O. ■
L'exemple précédent repose bien entendu sur un modèle pour l'alpiniste, qu'on laisse au
lecteur le soin de préciser.
EXEMPLE 25.62. Il est même possible que l'équation f(t) = 0 possède une infinité de
solutions sans que f soit la fonction nulle. Prenons par exemple la fonction continue f définie
sur [-1, 1] par f(t) = t 2 sin(l/t) si t E [-1, 1) \ {0} et f(0) = 0 (la continuité se montre
en admettant celle de la fonction sin). Tous les 1/nn, pour n E Z*, sont des solutions de
f( t) = 0 sur l'intervalle [-1, 1].
Voici une autre forme du théorème des valeurs intermédiaires, fondamentale elle aussi.
711
Remarque. La preuve du théorème des gnifie que ex est dans l'intervalle [3/4, 25/32]
valeurs intermédiaires consiste à partager, à c'est-à-dire qu'on connaît ex avec une erreur rfJ
<I)
chaque étape, un segment en deux segments de 0,031.
égaux et ensuite à choisir l'un des deux sui- §
vant les signes des bornes. Cette méthode §
u
est désignée sous le nom de dichotomie. Elle rfJ
•Théorèmê 25.6ft !'fhool'ê111e ' • ' VâleÙi-s ÙdÊ!m~ 1}1. Soientl im intervalle
et f une fooo#on 6, vàlèU!/'$ réellesiléfi,fiîe ;ifiir J. SH èstd:J1i,tir1iae, I.ÛM's ffl) est tin intervalle.
PREUVE. Soient -y ::::; -y' deux éléments de f(I). Il existe t et t' dans I tels que -y = f(t)
et -y' = f(t'). Si z E [-y, -y'], d'après le corollaire 25.64 ci-dessus, il existe t" E [t, t'] tel que
f(t") = z. Le réel z se trouve alors dans f(I). Nous venons de prouver que [-y, -y'] C f(I). En
résumé, nous avons montré que si -y ::::; -y' sont deux éléments de f(I), l'intervalle [-y, -y'] est
alors contenu dans f(I). Cette dernière propriété est une caractérisation des intervalles de JR,
comme nous l'avons vu au chapitre 21. ■
Soit f une fonction à valeurs réelles définie et continue sur un intervalle I. Nous savons
maintenant grâce au théorème des valeurs intermédiaire que f(I) est un intervalle. Si I est
fermé et borné, c'est-à-dire de la forme [a, bl, alors le theorème de Heine sur les extrema
montre que f(I) est aussi fermé et borné. Ceci donne lieu à un autre théorème très utile en
pratique.
' l ' ~ e ~$.G(i~ {!l'hêorJlme des valeurs intermédiaires III). Soient l = [a. bJ un
interual.le fermé b<.>mé1 .et soit. f. une fonction· à '/JtÛeursréelles défime sur L Si f ·est continue,
al,ors f·.est 'fJornée sur.I, ·eile attéint ses .bornes ainsi .que toute·valeur comprise entre ses
bornes. En d'autres termes, f(I) = [à,, 131, r.wec infteI f{t) = <X $13 = suptEI f(t).
Nous allons maintenant donner un exemple d'utilisation du théorème des valeurs intermé-
diaires. Soit f une fonction de [O, 1] dans lR. On dira ici qu'un réel c > 0 est une corde de
f s'il existe t E [0, 1 - c] tel que f(t + c) = f(t). Sic est une corde de la fonction f et si t
est le point donné par la définition, alors le segment horizontal joignant les points (t, f (t)) et
(t + c, f(t + c)) a ses deux extrémités sur le graphe et sa longueur este (voir figure suivante).
't'lîêorême 35.67~ Soient n un entier naturel non nul et f .: [0,.1} -t R une fonction
continue vérifianH(O} = f(l). Alors 1/il ê.St une corde de f.
712
0 t t+ C
PREUVE. Pour t E [0, 1 -1/n], posons g(t) = f(t + 1/n) - f(t). Comme la somme
il existe deux entiers p et q entre 0 et n - 1 tels que g (p /n) ::;: 0 ~ (q/n). Le théorème des
valeurs intermédiaires appliqué à g entre p/n et q/n montre l'existence de t E [0, 1 - 1/n]
qui vérifie g (t) = 0, c'est-à-dire f (t + 1/n) = f (t). ■
Disons maintenant qu'un réel c > 0 est une corde universelle sic est une corde pour toute
fonction f de [0, 1] dans JR., continue sur [0, 1] et vérifiant f(0) = f(l ). D'après le théorème
25.67, les inverses des entiers naturels non nuls sont donc des cordes universelles. Voici une
application imagée de ce résultat.
La question est maintenant de savoir s'il existe d'autres cordes universelles que les inverses
des entiers positifs. Soit c un réel strictement positif qui n'est pas l'inverse d'un entier naturel
non nul. On considère la fonction f définie sur [0, 1] par
2
f(t) = t _ sin nt/c.
sin 2 n/c
En admettant que la fonction sin est continue sur JR., on montre facilement que la fonction f
est continue, et elle vérifie f(0) = f(l). Mais l'équation f(t + c) = f(t) n'a aucune solution
dans [0, 1 - cl, comme on le vérifie immédiatement. Le nombre c ne peut donc être une corde
universelle.
Si on reprend l'exemple du cycliste ci-dessus, on peut affirmer qu'il n'existe pas forcément
d'intervalle de temps de trois quarts d'heure durant lequel il aura fait exactement 15 kilo-
mètres. Il suffit que le cycliste (certes tourmenté) effectue un parcours décrit par la fonction
713
D définie par
2
D(t) = 19t+ sin 4nt/3
sin 2 4n/3
comme on peut le vérifier.
flt~~ition 2fi.6~. Soit t : I. --t R une f ~ . 4 ualeurs ri.elle$ définie et continue sur
'1/Jl/, intervalle l. Là Jonction f est stric~m.ent monotone si et. ~ e n t si elle est injective.
PREUVE. Il est évident que toute fonction strictement monotone est injective. Pour prouver
la réciproque, supposons que f n'est pas strictement monotone, c'est-à-dire qu'on peut trouver
trois points x, y et z de I tels que x <y< z et f(y) ne soit pas entre f(x) et f(z). Dans le cas
où f(y) < f(x) < f(z), d'après le théorème des valeurs intermédiaires, il existe x' dans ]y,z[
tel que f(x) = f(x'). Comme x < y < x', x =/. x' et comme f(x) = f(x'), f n'est pas injective.
Les autres cas conduisent également à la non-injectivité de f. ■
Soit f est une fonction à valeurs réelles définie et continue sur un intervalle I. Si f est
injective, on peut définir sa fonction réciproque f- 1 sur l'intervalle f(I).
montre que lim f- 1 (s)) = f- 1 (y), et notre assertion en découle. Si maintenant y est une
s--+y+
borne de f(I), le même raisonnement vaut pour la continuité à droite où à gauche, suivant les
cas. ■
714
PREUVE. La fonction Pn est le produit den facteurs égaux à P 1 . Nous avons montré que
P 1 est continue, donc Pn est continue en vertu de la proposition 25.54, par une récurrence
imédiate. Les propriétés de parité proviennent de la règle des signes dans R La fonction P 1
est positive et strictement croissante sur R+, on en déduit aussi par une récurrence facile que
Pn est strictement croissante sur fi'.+. Compte tenu des propriétés de parité, il suffit d'étudier
la limite de Pn en +oo. Mais pour x ~ 1, Pn(x) ~ P 1 (x) = x, et on voit immédiatement que
limx-->+oo P,(x) = +oo. Il en résulte aussi facilement que limx-->+oo Pn(X) = +oo. La dernière
propriété est claire. ■
Compte tenu de la proposition 25.69, et du fait que Pn( 0) = 0 pour tout n E N*, on en
déduit le corollaire suivant.
Corollaire 25. 72. Pour n E N*, la fonction Pn est une bijectio~ dé R+ sur R+.
La propriété de surjectivité nous intéresse ici au premier chef. En effet, ce corollaire nous
montre que pour tout réel positif b il existe un réel positif a tel que un = b. En d'autres
715
ao = 1.
La dernière question à examiner est celle de la continuité des applications que nous venons
de construire. Elle ne pose pas de problème dans le cas des exposants entiers, il s'agit donc
de la vérifier lorsque l'exposant est rationnel non entier. Pour les exposants de la forme 1/n,
n E N*, la continuité de P1;n résulte de la définition et du théorème 25.70. Maintenant, si
r = n/m E (Ql, comme P,. = Pn o P 1;m, on en déduit par le théorème de composition la
continuité de P,. sur lR';_. On peut donc énoncer le théorème suivant.
Proposition 25.75. PÔur r E Q, l'appliœtien t>,.: R';. -+ R';. définie par P..-(xJ = xr est
continue. Pour (x\ Y},E {R';.)2 et (r, s) E (f, on a les propriétés
Si,- > ô, Îimx-+I·<><> P,.(x} = +oo ét la fonction P,. se prol.onge par oontinuité en O par P( 0) = 0.
SiT <0; limx.....,+oo Pr(X) =0 et limx. . . o+ P..-(x} =+oo.
716
PREUVE. La continuité a été montrée. Les autres propriétés sont élémentaires, on en laisse
la vérification au lecteur. ■
EXEMPLE 25.79. Montrons que la fonction f: R ---, R définie par f(t) = t 2 n'est pas
uniformément continue sur R
► Posons Xn = vnTI et Yn = y'rl. On voit facilement que lim (Xn - Ynl = 0 alors
n---t+oo
que lim f(xnl - f(yn) = n + 1 - n = 1 n'est pas nulle. On peut affirmer à l'aide de la
n----++oo
proposition 25.78 ci-dessus que la fonction f n'est pas uniformément continue. On invite le
lecteur à donner une autre preuve, directe, de ce résultat.
717
~ f i î i j i5:8tk{~~de\ft~'1~ ctè
continuité· unifôrmi).
:Scitfj'nefonétio'I!, àyol(hûr:s40/l,fJ K.{lêftniêet continue sur lè segnîtntïa;bJ. Aliirs f est rJl
Cl)
iriîfonnê11ient œnfinue:iur f4;2bt . .. .. ;:l
:§
i::
0
PREUVE. Nous allons montrer le théorème par l'absurde. Supposons que f ne soit pas uni- (.)
rJl
formément continue sur [a, b]. Il existe alors t:o Elit;. tel que pour tout T] > 0, il existe x et 1J
dans [a, b] tels que lx - YI < T] et lf(x) - f(y)I 2 t:o. En prenant T] = n~l pour n E N, on a ~
~
l'existence de Xn et 1Jn vérifiant lxn -Ynl < n~l et lf(xn) - f(yn)I 2 Eo. ..s
rJl
La suite (xnln2o étant bornée, on peut en extraire une suite convergente (xnk)JQo, de j
limite t Comme la limite de Xnk - 1Jnk est égale à zéro quand k tend vers l'infini, la suite in
"1
(Ynk )JQo converge aussi vers t Mais par continuité de f, nous savons que les suites (f(xnk )lkEN ..d
et (f(y~)lkEN tendent vers f(C). Ceci contredit l'inégalité lf(xnl - f(yn)I 2 t:o à partir d'un ü
certain rang. ■
Nous introduisons dans cette partie des définitions et une terminologie qui vont s'avérer être
d'une utilisation permanente dans tout le cours d'analyse. Il est très important de les ap-
prendre et de les manipuler suffisamment pour qu'elles deviennent intuitives.
Définition 25.81. Soient f et g deux fonctions de §. On dit que dit que f est dominée
par g au point a lorsqu'il existe un élément I E Y(a) et un réel ex> 0 tels que
Vx E In A, lf(x)I ~ cxlg(x)I.
On note alors f ~a g, ou g ~a f.
EXEMPLE 25.82.
► La fonction nulle est dominée par toute fonction de §.
► Si f E § est dominée par la fonction nulle au point a, il existe un intervalle I E Y (a) tel
que f est nulle sur I.
► Plus généralement, si f, g sont dans§ et vérifient f ~a (g), il existe I E Y(a) tel que si
x E In A et g(x) = 0, alors f(x) = O.
► Soit A = lR et a = O. Alors si f(x) = x 2 et g(x) = x, f ~o g. En effet, lx 2 1 :::; lxl si
x E] - 1, 1[.
► Soit A= lR"t- et a= O. Alors si f(x) = 1/x et g(x) = 1/x 2 , f ~o g. En effet, 1/x ~ 1/x2 si
x E]-1, l[nlR"t-.
► Soit A = lR et a = O. Alors si f et g sont définies par f(x) = 0 si x ~ 0 et f(x) = x si
x 2: 0, et g (x) = 0 si x ) 0 et g (x) = x si x S: 0, alors f ~ a g et f 'if, a g.
Autres formulations
1) Conformément à ce que nous avons déjà remarqué pour les limites et la continuité,
on peut donner des formulations équivalentes de la définition 25.81 en utilisant la forme
explicite des intervalles. Par exemple, f ~a g si et seulement si il existe ex > 0, T] > 0,
et E > 0 tels que six E A vérifie lx - al < T], alors lf(x)I :::; cxlg(x)I.
2) Il est aussi toujours possible de choisir arbitrairement des inégalités strictes ou des
inégalités larges, sauf pour la dernière d'entre-elles. Par exemple, f =;(a g si et seulement
si il existe ex> 0, T] :::; 0 et E ) 0 tels que six E A vérifie lx-al ~ ex, alors lf(x)I :::; cxlg(x)I.
PREUVE. Montrons 1). Il existe des intervalles I et J de "f/ (a) tels que
ce qui montre que f + g = Üa{h). Le point 2) est une simple vérification. ..d
■ ü
Sommes de 0
On prendra garde au fait que si f = O(h) et g = O(k), alors il est faux d'en déduire
que O(f + g) = O{h + k). En effet, si par exemple A = lR. et a = 0, on peut choisir
f(x) = g(x) = x et h{x) = 1 et k{x) = -1. On a bien f = O{h) et g = O{k), mais
(f + g)(x) = lx et {h+ k)(x) = 0, et il est bien sûr faux de dire que f + g = O(h+ k).
Voici maintenant une proposition sur les produits, qui est une simple vérification.
La notation de Landau est un peu ambigüe, mais très utile. On lui adjoint en général un
autre abus de notation, qui la rend encore plus pratique.
Notation. On désigne en général une fonction par son expression explicite, écrivant ainsi
x 2 au lieu de x H x 2 . De plus les domaines de définition sont souvent sous-entendus. Par
exemple, on écrit simplement x 2 = 0 0 {x) ou 1/x = 0 0 (1/x 2 ).
EXEMPLE 25.87. En utilisant la définition des puissances fractionnaires vue dans la partie
111.3, on peut écrire, pour tous r et s rationnels, xr = 0 0 (x•) si r :;:;, s 2: 0 et xr =
O 0 (x 5 ) si s ~ r :S O.
Terminons cette partie par une remarque sur les limites, de démonstration immédiate par
encadrement.
Là encore, il existe d'autres formulations explicites de cette définition, sur le même modèle
que pour la relation de domination.
EXEMPLE 25.90.
► La fonction nulle est négligeable devant toute fonction.
► Une fonction de § négligeable devant la fonction nulle est nulle sur l'intersection In A,
pour un intervalle I E Y (a).
► Soit A= lR et a= 0, et soit (r,s) E «:;)!2. Si f{x) = xr et 9(x) = xS, avec 0 ~ s < r, alors
f = 0 0 (9). On écrit aussi, par abus de notation, xr = o 0 (x 5 ).
► Soit A= JR~ et a= 0, et soit (r, s) E «:)!2. Si f(x) = xr et 9(x) = xS, avec s < r ~ 0, alors
f ~o 9, ce qu'on écrit aussi xr = o 0 (x 5 ).
► Soit f E §. Dire que f = Oa(l) équivaut à dire que limx-,a f(x) = O.
PREUVE. Soient f, 9 eth des fonctions de§ telles que f = Oa(9) et 9 = Oa(h). Soit E >0
fixé. Alors il existe I et J dans Y (a) tels que
Il en résulte donc que 't/x E (In J) n A, lf(x)I ~ E lh(x)I. On a donc montré que f = 0 {h). 0 ■
Pri>pŒ1Îtron 25.1.n.;; S~t>f,g/h.;lG dàns §, et soit ;\ E IC; 0ft. ri. ies propriété$ SY,i,11antes.:
1.) .rif ::::00 (gl, alorsf::;, O~{:g);
+
2) si f= Où{h.} et g =()a,(h.), alors f g = Oa,(h};
3) si f= Où{liJ; alors M=dù{h.);
4) sif = ô~(g) dg= 0 0 fh), t1lôrs f = Oa(h);
5) si f = 0 0 (9) et. g =0 0 (h.), alors f = Oa(h);
6) si f = 0 0 (h.) et g = Oti(k), alors fg = o.. (hk).
PREUVE. Nous allons par exemple montrer la propriété 5). Soit t: > 0 fixé. Comme f = 0 0 (9),
il existe un intervalle I E Y(u) et un réel <X> 0 tels que Vx E In A, lf(x)I :S <Xlg(x)I. Comme
g = 0 0 (h), il existe un intervalle JE Y(u) tel que
E
Vx E In A, lg(x)I ~ -lh(x)I
(X
et donc Vx E (I n J) n A, lf(x)I ~ t: lh(x)I, ce qui montre que f = oa(h). Les autres preuves
sont du même type et laissées en exercice. ■
Ces propriétés sont d'utilisation constante, et font l'intérêt de la notation de Landau. Nous
les retrouverons par exemple au chapitre 29 sur les développements limités. Il est conseillé de
donner toutes les démonstrations, à titre d'exercice.
Il existe plusieurs manières équivalentes de traduire la relation de prépondérance. Nous en
donnons une pour terminer, qui est souvent utile dans la pratique.
PREUVE. La condition est suffisante. En effet, s'il existe une fonction T] vérifiant les conditions
énoncées, et si t: > 0 est fixé, il existe un intervalle J contenu dans I et contenant a tel que
ITJ(x)I < t: pour x E J n A. Il en résulte que lf(x)I < t:lg(x)I pour tout x E J n A, ce qui prouve
que f = Oa(g).
Réciproquement, si f = 0 0 (9), on note d'abord qu'il existe un intervalle I E Y(a) tel que
lf(x)I :S lg(x)I pour x E In A. En particulier, six E InA et g(x) = 0, alors f(x) = O. On peut
donc définir une fonction Tl: In A-) JI{ par TJ(X) = (f(x))/(g(x)) si g(x) f:. 0, et TJ(x) = 0 si
g(x) = O. Cette fonction vérifie clairement f(x) = TJ(x)g(x) six E In A.
Soit maintenant t: > 0 fixé. Alors par définition il existe un intervalle J E Y(u) tel que
lf(x)I :S t:lg(x)I pour x E J n A, ce qui entraîne que ITJ(x)I :S t: six E (In J) n A. Ceci montre
que limx-->a TJ(X) = 0, et termine la preuve. ■
Définition 25.94. Soient f et g deux fonctions de §. On dit que dit que f est équivalente
à g au point a (ou au voisinage de a) lorsque f- g = 0 0 (9). On note alors f ~a g.
EXEMPLE 25.95.
► Soit A= lR et a= O. Si f(x) = x4 et g(x) = x 6 +x4, alors f ~0 g. En effet, f(x)-g(x) = -x6
6 4
et -x = o 0 (x ) = o 0 (x 6 + x 4 ).
► Soit A= JR~ et a= O. Si f(x) = 1/x3 et g(x) = x 5 + 3x3 + 1/x + 1/x3 , alors f ~0 g. En
effet, f(x) - g(x) = -(x5 + 3x3 + 1/x) et -(x5 + 3x 3 + 1/x) = o 0 (1 /x 3 ).
► Soit A= lR et a= O. Si f(x) = 2x 4 et g(x) = x4, alors f fo g. En effet, f(x) - g(x) = x 4
et x 4 n'est pas négligeable devant x 4 en O.
Signalons une première difficulté, qui est une source d'erreurs très courante.
.\ttcnti<ln Équivalence à 0
Si une fonction f de§ est équivalente à 0, il existe un intervalle I E 'P'(a) tel que f soit
identiquement nulle sur I n A. En toute autre circonstance, il est faux de dire qu'une
fonction est équivalente à O au voisinage de a.
PREUVE.
PropO;Sition ~5.97\ .Soiem f ,et, g des. Jonctions de § telleiHJue f ~a g:. Si g,admet une
limite t aupQinf a, alor:s f admet Q/USSi.la limite t au point a. [fJ
Il)
;:l
PREUVE. Soit e > 0 fixé. Comme g admet une limite au point a, g est bornée au voisinage
de a. On peut donc trouver I E 'P'(a) et m E IR~ tel que lg(x)I ,:;; m pour x E In A. Alors t(.)
:Prt>position ~5~99,. Saiem.t,g,]¾ k des fonctions de§ telles quef,,.o. h. et g:"'co. k. Alqrs
fg~nh.k.
PREUVE. En effet, on voit (par intersection) qu'il existe un intervalle I E 'P'(a) et des
fonctions E, et ri de I n A dans JK, de limite nulle en a, telles que pour tout x E I n A,
f(x) = (1 + E,(x))h(x) et g(x) = (1 +ri(x))k(x). Donc
Cor<1llaÛ'è 25400. ;· s~~n~t( et g tle~Jwi~ di§;· :dn SU'/)pQlJf!} qtt'il ~tel e: '7'(a}
tef:tpte g né s'Mntdé:pds sttr lflA;· A~s / .
724
Côro1~25.J;QîS•:$~iirit]'·ehtiletJifô1ù;tîi>iis';âê'~;;~~t1:ntê8'1iIÙJX)î;dt'o.. ··.A.tor1(ü
eœiste,un inte1ivJill.èl E 't:(<i) tt:L <W,e sî ,c,EJOA.,A{x;) ..;,-0# g{x}~;O, etsif(.:x) ~ O,f{x}
et.g(xJsont'tlë1Mnie sig-ue,
On en déduit enfin une autre conséquence, par application du corollaire précédent.
Nous avons donc vu que le produit et le quotient laissent stable la relation d'équivalence.
Une difficulté classique est qu'il n'en va pas de même pour la somme.
EXEMPLE 25.103.
► Avec l'abus de notation usuel,
1 1 rJJ
--- = Ü+oo (~), - - = O+oo ( 1). Q.l
1 +x
(
► ✓x4 + x + 1- ✓x4 - x+
1 +x
1) ~+00 1/x
x
§
§
(.)
~
Proposition 25.104. Soit A une po,rtie non majorée de IR.. On suppose que·0 1/..A, et on 0
:;::l
nt)te B z {l/x<! x' E A}, alors O E lL Soient f et g deux fonctions de A dans C. On a les ~
~
tfijuiv(lien~ S'fl,i!Jantes rJJ
j
t(x) =o+oo (g(x)) suivant A# f(l/x) = Oo(g(l/x}) suivant& ir.i
<N
f{x} = o+oo{g(x)) suivant A# f(l/x) = oo(g(l/x)) suivant B ..d
f(xJ ~-too (g(x)) suivant A # f(l/x) ~o (g(l/x)) suivant B ü
Lorsqu'on considère la partie A = N, les fonctions définies sur A sont les suites, et on
obtient ainsi les notions de suites dominantes. prépondérantes, ou équivalentes. Toutes les
propriétés démontrées dans les parties précédentes demeurent valables dans ces conditions
pour les suites.
V. EXERCICES
25.1. point xo. Comparer les deux propriétés sui-
vantes
Soit f : lR ---t C T-périodique avec T > O. Que
peut-on dire de f si lim f( t) existe?
t->+oo 1. lim(f(xo+h)-f(xo))=0
h->0
25.2.
2. lim (f(xo + h) - f(xo - h)) = 0
h->0
Soit f une fonction définie sur [0, +oo[ à valeurs
dans JK. On suppose que f est bornée et que
lim (f(t + 1) - f(t)) est finie. Montrer que
t->+oo
lim f(t)/t = lim (f(t + 1)-f(t)) 25.6.
t->+oo t->+oo
E calcul différentiel et intégral, dont seul l'aspect différentiel nous concerne dans ce cha-
L pitre, est né des travaux indépendants de Gottfried Wilhelm Leibniz et Isaac Newton
au XVIIe siècle. La revendication de la paternité de cette nouvelle théorie fut l'objet de
vives polémiques entre les deux hommes et cette controverse affecta beaucoup Leibniz sur la
fin de sa vie.
Entre 1664 et 1671, Newton travaille sur son ouvrage Methodus fluxionum et serierum
infiniturum qui ne sera publié qu'après sa mort en 17361 . Il y introduit notamment ce qu'il
appelle le calcul des fluxions :
Ainsi pour Newton les quantités fluentes x, y sont des fonctions soumises à des variations,
à des changements, et les fluxions x, ... ,y de ces fluentes mesurent leurs variations.
Il s'intéresse un peu plus loin dans l'ouvrage au problème inverse de la détermination des
fluentes x, y, etc. à partir de la connaissance des fluxions x, y, etc. C'est le problème réciproque
du calcul différentiel, à savoir le calcul intégral que nous avons mentionné ci-dessus et que
nous aborderons dans le chapitre suivant.
Leibniz publie pour là première fois ses travaux sur le calcul différentiel en 1684, dans les
Acta eruditorum sous le titre de Nova methodus pro maximis et minimis, itemque tangentibus,
qua nec irrationales quantitates moratur que l'on peut traduire par une nouvelle méthode pour
les maxima et les minima, aussi bien pour les tangentes, laquelle peut aussi être appliquée aux
quantités irrationnelles. Cependant, de nombreuses notes manuscrites produites sur les dix
années antérieures contiennent déjà ses idées sur la question.
Le point de départ de Leibniz sur ce sujet est plutôt celui des séries de nombres, pour
lesquelles il calcule les différences des termes successifs qu'il va sommer. Cette idée présente
dans son De arte combinatoria de 1666 repose sur sa vision philosophique du monde qui
1
C'est dans son fameux ouvrage Philosophiae naturalis principia mathematica que Newton publiera en 1687 sa
théorie du calcul différentiel et intégral.
728
consiste à vouloir relier le tout et la partie2. Par exemple la série de nombres 1, 5, 9, 15, 22, 30
donne lieu aux différences de termes successifs 4, 4, 6, 7, 8 dont la somme 4 +4 + 6 + 7 + 8 = 29
est évidemment la différence entre le dernier et le premier terme de la série initiale, à savoir
30 - 1. À partir de cette idée qu'il étendit aux séries infinies de nombres, puis au « cas d'une
variable continue», il obtint son calcul différentiel et intégral.
C'est Leibniz qui introduisit en particulier les notations dx, dy et ~~, très intuitives et
très utilisées par les physiciens.
Après ce bref aperçu historique, voici en termes plus usuels une idée de ce que peut être la
notion centrale du calcul différentiel, à savoir celle de dérivée. Si un automobiliste se rend de
Marseille à Paris en huit heures, sachant que la distance est d'environ 800 kilomètres, il peut
dire que sa vitesse aura été de 100 km/h. Cette vitesse correspond au rapport distance/durée.
Mais évidemment, cette vitesse n'a peut-être pas été constante tout le long du trajet. Donc,
pour être plus précis, ces 100 km/h ne représentent en fait qu'une moyenne, c'est sa vitesse
moyenne entre Marseille et Paris. Si maintenant il fait un relevé régulier de ses positions en
fonction du temps, il peut par exemple se rendre compte qu'entre Avignon et Valence, sa
vitesse moyenne était de 120 km/h, alors qu'entre Lyon et Mâcon elle a été de 90 km/h. S'il
veut savoir quelle était sa vitesse à 9 heures du matin tandis qu'il passait à Avignon, sachant
qu'il a parcouru entre 9 heures et 9 heures et 1 minute la distance de 1, 5 km, il en déduira
que sa vitesse moyenne sur cet intervalle de temps était de 90 km/h. Est-ce que cela lui donne
sa vitesse à 9 heures exactement? Non, bien entendu car en une minute il a pu grandement
faire varier sa vitesse. Mais s'il sait qu'il a parcouru 30 mètres, entre 9 heures et 9 heures et
1 seconde, il pourra dire, avec une assez grande précision, que sa vitesse à 9 heures était de
108 km/h, même si en réalité ce nombre n'indique que sa vitesse moyenne entre 9 heures et
9 heures et 1 seconde. La question est de définir sa vitesse à l'instant précis où sa montre
indiquait 9 heures. Pour désigner ce nombre idéal, on parle de vitesse instantanée. Comme on
l'aura compris, cette vitesse instantanée se définit comme une limite de vitesse moyenne sur
un intervalle de temps de plus en plus court. Précisément, si d: t H d(t) désigne la distance
parcourue à l'instant t depuis le départ, cette vitesse à 9 heures va se définir comme
2
Qu'il expose dans sa fameuse Monadologie (1714).
729
EXEMPLE 26.2. Un intervalle ouvert est ouvert au sens de cette définition. Une réunion
d'ouverts est clairement ouverte donc en particulier une réunion dïnten-alles ouwrts est un
1 ouvert.
En fait, tout ouvert de lR est la réunion disjointe d'intervalles ouverts (InlnEN mais nous ne
le montrerons pas ici. Cependant le lecteur peut systématiquement imaginer un ouvert comme
une telle réunion d'intervalles ouverts. Pour simplifier les énoncés, il peut aussi simplement
remplacer l'hypothèse U ouvert par l'hypothèse U intervalle ouvert, un peu moins générale,
mais cependant utile pour l'intuition.
Définition 26.3. Soit U un ouvert non vide de lR et soit f : U --, lR une fonction numérique
à valeurs réelles définie sur U. Si a EU, soit Ta la fonction
hH f(a+h)-f(a)_
h
La fonction Ta est définie dès que h =/= 0 et a+ h E U. Puisque U est ouvert et contient
a, son domaine de définition est donc un voisinage épointé de O. On dit que Ta est le taux
d'accroissement de f d'origine a.
Définition 26.4. Soit U un ouvert non vide de lR et soit f : U --, lR une fonction numérique
à valeurs réelles définie sur U. On dira que la fonction f est dérivable au point a E U si son
taux d'accroissement d'origine a possède une limite quand h tend vers O. Dans ce cas, cette
limite sera appelée la dérivée de f au point a, ou le nombre dérivé de f au point a, et sera
notée f'(a).
>" 0
Notons que la fonction f: peut se prolonger par O en 0, on peut donc aussi énoncer la
proposition précédente en disant que la fonction f: est définie au voisinage de 0, nulle en 0, et
continue en O.
La définition équivalente de la dérivabilité donnée par (26.1) est très commode. Nous
allons, pour en donner une autre version, utiliser à nouveau la notation de Landau que nous
avons introduite au chapitre 25.
Notation. Avec la définition précédente et la notation associée, (26.1) s'écrit de manière
équivalente
f(a + h) = f(a) + f'(a)h+ o 0 (h) ou f(x) = f(a) + f'(a)(x - a)+ o 0 (x- a).
En effet, par définition même, hf:(h) = o(h)
Ainsi, intuitivement, si f est continue au point a, on peut dire que, pour x proche de a, f(x)
est « à peu près égal à f( a) ». Si maintenant f est dérivable au point a, cette approximation est
améliorée en ce sens que, pour x proche de a, f(x) est « à peu près égal à f(a) +f'( a)(x- a) ».
Mais il faut se garder de donner un sens trop précis à cette intuition. On ne peut pas calculer
explicitement la différence entre f(x) et f(a) + f'(a)(x - a) si on sait seulement que cette
différence est négligeable devant x - a. Nous retrouverons plus en détail ce problème dans la
suite.
Définition 26.7. Soit U un ouvert non vide de lR et soit f: U--, lR une fonction numérique
à valeurs réelles définie sur U. On dira que la fonction f est dérivable sur U si f est dérivable
en tout point a E U. Dans ce cas, la fonction
Notation. Comme nous l'avons vu, la dérivée d'une fonction dérivable f se note le plus sou-
vent f'. Une autre notation, plutôt utilisée dans un contexte de cinématique ou de mécanique
consiste à écrire f au lieu de f'; c'est la notation des fluxions de Newton que nous avons vue
en introduction. L'usage veut qu'on l'emploie lorsque la variable représente le temps physique.
Une autre notation, comme nous l'avons aussi déjà dit dans l'introduction, est due à Leibniz
et consiste à écrire
f'(a) =::(a).
Elle est plutôt utilisée en physique. Nous verrons un peu plus tard que cette dernière notation
est très pratique et très pertinente, mais qu'elle doit être manipulée avec précaution.
EXEMPLE 26.8.
► Toute fonction constante est dérivable sur IR. et sa dériYée est la fonction nulle puisque
pour une telle fonction le taux d'accroissement est nul en tout point.
► Pour tout n E N*, la fonction f n : IR - l R x H xn est dérivable sur IR et sa dérivée est
donnée par f~(x) = nxn-l _En effet. d"après la formule du binôme de Newton,
1 1
EXEMPLE 26.9. La fonction f: x H - est dérivable sur IR* et pour x E JR*, f'(x) = - 2 .
X X
► En effet,
1 ( 1 1) 1 4 1
'rx(h)=h x+h-x =-x(x+h) 1t-->O-x2 ·
1
EXEMPLE 26 .10. La fonction f définie sur lR par f (x) = x2 sin - si x -/- 0 et f (0) = 0 est
X
dérivable en 0, et sa dérivée est nulle.
► En effet le taux d'acroissement -r0 a clairement une limite nulle en O.
Les deux questions test suivantes reposent sur les acquis rappelés dans les bases. En par-
ticulier, elles ne peuvent être considérées comme des preuves définitives de la dérivabilité des
fonctions sin et cos. Nous y reviendrons évidemment (voir le chapitre 28).
Si on représente une fonction f par son graphe, la propriété d'être dérivable en un point a
se traduit géométriquement par le fait que le graphe possède une tangente au point (a, f(a)).
Précisément, -r 0 (h) n'est autre que la pente de la droite sécante Da,lt passant par les points
( a, f( a)) et ( a+h, f(a+h)), autrement dit Da,lt passe par ( a, f( a)) et est dirigée par le vecteur
( 1, -r 0 (h)). Dire que -r 0 (h) - l f'( a) signifie que lorsque h tend vers 0, les droites sécantes D a,lt
tendent vers une position limite, à savoir la droite passant par ( a, f (a)) et dirigée par le
vecteur (1, f'(a)).
732
Sécante
Définition 26.12. Une fonction f définie sur un ouvert non vide U est dite continûment
dérivable, ou encore de classe C 1 , si elle est dérivable sur U et si sa fonction dérivée f' est
continue sur U.
733
EXEMPLE 26.14. Considérons la fonction f définie sur l'inten-alle fermé [0, +oo[ par
Cette fonction est dérivable à droite en 0 puisque hln h --l 0 lorsque h --l o+.
Si f admet une dérivée à droite (resp. à gauche) au point a, le graphe de f admet au point
(a, f(a)) une demi-droite tangente; on appelle cette demi-droite une demi-tangente. On peut
encore généraliser de la manière suivante : si 't 0 (h) tend vers +oo ou -oo lorsque h --l o+, le
graphe admettra au point (a, f (a)) une tangente verticale.
EXEMPLE 26.15.
► La fonction f : lR --l JR, x H lxl est dérivable en tout point a =/- 0 mais en a = 0, elle est
seulement dérivable à droite et à gauche, sans être dérivable puisque f~(0) = 1 et f~(0) = -1.
► La fonction f: JR+ --l JR, x H y'x est dérivable en tout point x > 0 avec f'(x) = 1/2y'x.
Lorsque h --l o+, 'to(h) --l +oo et le graphe admet une tangente verticale en O.
Définition 26.16. Si A est une partie de lR, un point a E A est appelé un point intérieur à
A s'il exister E lR';_ tel que ]a - r, a+ r[ CA. En d'autres termes, un point a est intérieur
à A si et seulement si A est un voisinage de a.
Nous voulons maintenant définir la notion de dérivée pour des fonctions définies sur des
ensembles ayant des "points frontières", comme par exemple les intervalles fermés bornés [a, b).
Nous introduisons pour cela la définition suivante.
734
Définition 26.17. Soit A une partie de 1R; notons I l'ensemble de ses points intérieurs et
Supposons que A = I U Id U I 9 . Une fonction numérique f définie sur A sera dite dérivable
sur A si elle est dérivable en tout point de I, dérivable à droite en tout point de Id et
dérivable à gauche en tout point de I 9 .
EXEMPLE 26.18. Dire que f : [a, b] -----, :IR est une fonction dérivable signifie qu'elle est
1 dérivable sur ]a, b[, dérivable à droite en a et dérivable à gauche en b.
Ici encore, la plupart du temps, les fonctions que nous aurons à considérer seront définies
sur des intervalles. La définition précédente n'est donnée que pour montrer comment formaliser
le contexte nécessaire à l'utilisation de certaines notions.
Commençons par un petit préliminaire à propos de la notation o(h) utilisée dans l'une des
définitions équivalentes de la dérivabilité. Rappelons qu'elle désigne une quantité qui est de
la forme ht:(h) avec limh---,O E(h) = O. Compte tenu des opérations sur les limites, il est alors
clair que la somme de deux telles quantités est encore de cette forme et que le produit d'une
telle quantité par une fonction bornée est encore de ce type comme cela a été montré dans le
chapitre précédent. Ceci étant, les preuves des principaux résultats concernant les opérations
sur les fonctions dérivables sont assez simples à écrire. Le lecteur qui ne se sentirait pas
encore très à l'aise avec la notation de Landau est invité à expliciter les termes o(h) dans les
démonstrations qui suivent afin d'être convaincu de leur bien fondé.
PREUVE. Cela est immédiat si on somme les deux relations donnant la dérivabilité de f et g
au point a à savoir :
PREUVE. Cette fois-ci on multiplie les deux égalités de (26.2). On obtient dans ce cas que le
produit f(a + h)g(a + h) est la somme de neuf termes, soit
où
= (f(a) + g(a))o(h) + (f'(a) + g'(a))ho(h) + f'(a)g'(a)h2 + o(h)o(h).
R(h)
Comme h 2 = o(h) et o(h)o(h) = o(h), les théorèmes classiques montrent que R(h) = o(h),
le résultat annoncé en découle. ■
PREUVE. Notons b = f( a). Puisque f est dérivable en a, donc continue en a, on sait que
pour h suffisamment petit, f (a+ h) sera suffisamment proche de b = f (a) pour que la quantité
g (f (a+ h)) soit bien définie (V est ouvert). Écrivant la dérivabilité de f au point a on obtient
que
g(f(a+ h)) = g(f(a) +f'(a)h+o(h)) = g(f(a) +f'(a)h+ ht: 1(h)).
Nous préférons ici expliciter le terme o(h) sous la forme ht:1 (h) car la situation est un peu
plus délicate que dans les deux résultats précédents. Si on pose k = f'(a)h + ht: 1(h), on a
k ---1 0 quand h ---1 O. Écrivant maintenant la dérivabilité de g au point b = f(a), on obtient
Lorsque nous avons présenté les différentes notations utilisées pour désigner la dérivée d'une
fonction f, nous avons mentionné que la notation !!,
due à Leibniz, était particulièrement
commode et pertinente. C'est lorsqu'il s'agit de dérivée des fonctions composées qu'elle se
révèle particulièrement efficace. Illustrons cela par un exemple. Nous voulons calculer la dérivée
de la fonction définie par f(x) = sin2x. On« sait» que la dérivée du sinus est le cosinus, donc
df , , df
- () = cos2x d ou - = 2cos2x,
d 2x dx
en écrivant de manière formelle que d(2x) = 2dx ou encore que d(2x)/dx = 2. Plus générale-
ment si u est une fonction de x, la dérivée de la fonction composée x H g(x) = (f(u(x)) sera
donnée par
dg df du
dx dudx·
736
PREUVE. Cela résulte immédiatement de la proposition sur la dérivée d'une composée ap-
pliquée aux fonctions f : x H 1/x et g. ■
PREUVE. On voit d'abord par continuité que g(x) =/= 0 pour x dans un voisinage convenable
de a. En écrivant
Le lecteur a déjà vu au lycée les dérivées de nombreuses fonctions usuelles dont nous
avons redonné ici quelques exemples, et les revoirdans la partie Bases du présent ouvrage.
Au chapitre 28, consacré aux fonctions élémentaires, nous détaillerons l'étude des fonctions
usuelles, et prouverons leur dérivabilité. Mais en anticipant un peu, il est utile de se familiariser
avec le tableau récapitulatif suivant.
fonction dérivée
constante 0
xn, x E :IR, n E Z* nxn-1
sin x, x E lR cosx
cosx, XE lR -sinx
tan X, x E :IR, x =/= n/2 + kn, k E Z 1 + tan2 x
expx, x E lR expx
ln x, x E JO, +oo[ l
X
x 0 , a E :IR, x E JO, +oo[ axa-1
On dit qu'une fonction définie sur un ouvert U est de classe Ck, avec k E N*, si elle est k
fois dérivable et si sa dérivée d'ordre k est continue sur U.
=p~=tz,~:~{t,t~t~,âûg~ê-~-J¼:l;! Sur la
PREUVE. Supposons par exemple qu'au point c E U, f possède un minimum local (le
cas d'un maximum est analogue). Il existe dans ce cas un réel strictement positif r tel que
]c- r, c + r[ CU et tel que pour tout x E ]c - r, c + r[, on ait f(x) ~ f(c). Or f est dérivable
au point c donc f(x) = f(c) + f'(c)(x - c) + (x - c)E(x) avec E(x) --t O quand x --t c. Il en
résulte que pour tout x E]c -r, c + r[, f'(c)(x- c) + (x- c)E(x) ~ 0 et donc que
VxE]c,c+r[, f'(c)+dx)~O et VxE]c-r,c[, f'(c)+E(x)~O.
En faisant tendre x vers c, successivement par valeurs supérieures, puis par valeurs inférieures,
il en résulte que f'(c) ~ 0 et f'(c) ~ 0, donc que f'(c) = O. ■
PREUVE. Cela résulte immédiatement du fait que si une fonction est croissante (resp. dé-
croissante) son taux d'accroissement en un point quelconque est positif ou nul (resp. négatif
ou nul) et du passage à la limite dans les inégalités. ■
Là encore la réciproque est fausse comme le montre l'exemple de la fonction f(x) = tan x
définie et dérivable sur Il \ g+ kn: k E Z} dont la dérivée est f' (x) = 1 + tan2 x ? 0 et qui
1
Nous venons de voir un exemple de fonction dérivable, de dérivée positive, et qui pourtant n'est
pas croissante sur son domaine de définition. Ceci est dû au fait que ce domaine n'est pas un
intervalle. Sur un intervalle, en revanche, il est possible de traduire l'information locale donnée
par la dérivée en termes globaux, comme par exemple le sens de variation de la fonction. C'est
une des conséquences du théorème des accroissements finis que nous allons voir maintenant,
et qui est l'outil majeur dans ce passage du local au global.
IL 1. Le théorème de Rolle
Le théorème de Rolle est un cas particulier du du théorème fondamental des accroissements
finis, qu'il permet aussi de démontrer. Nous le voyons donc comme un lemme préliminaire,
intéressant à connaître pour lui-même.
PREUVE. Puisque f est continue sur le segment [a, b), on sait, d'après les propriétés des
fonctions continues vues au chapitre précédent, que f est bornée sur [a, b] et y atteint ses
bornes. Donc il existe ci, Cz E [a, b] tels que
Si f est constante le théorème énoncé est trivial puisque f' est identiquement nulle sur] a, b [. Si
maintenant f n'est pas constante, on am< Met donc, puisque f(u) = f(b), nécessairement
l'un au moins des deux nombres ci, i E {1, 2}, appartient à l'intervalle ouvert ]a, b[. Soit c ce
nombre; on sait alors par la proposition 26.24 que f'(c) = O. ■
On notera que le fait que U soit un intervalle ouvert est crucial dans la preuve précédente.
739
a. f(a) ,6 f(b).
f(a) = f(b)
b. f n·est pas continue en un point de [a, b].
FIGURE 26.4. Tangente horizontale c. f n·est pas dérivable en un point de ]a, b[.
. ..
2) lnéqâ,litt tl.e~ âeçro46emen,tp finÙ! :•.sï en Qutre il existe des réels Tt\ et M.tels. fJUt!,~ Pf)Uf
touh~J.1,t,f) iin ait~•~ f'(~} ~ M,·/.ÛO!f's . .. . ' .
On a. donc la majoration
PREUVE. La preuve de l'inégalité des accroissements finis est immédiate à partir de l'égalité
des accroissements finis. Nous avons donc seulement à montrer cette égalité. Pour cela nous
allons nous ramener au théorème de Rolle par l'introduction d'une fonction auxiliaire bien
choisie. Posons à cet effet, pour t E [a, b],
Quelle que soit la valeur de la constante k, cette fonction cl> est continue sur [a, b] et dérivable
sur ] a, b [, par les résultats généraux sur les opérations sur les fonctions continues et dérivables,
et vérifie cp( a) = O. Maintenant, on peut choisir k de sorte que cp(b) = 0, à savoir k = f(a~=:(bl.
740
Nous sommes donc dans les conditions d'application du théorème de Rolle et par conséquent,
il existe c E]a, b[ vérifiant cp'(c) = 0, c'est-à-dire f'(c) + k = 0, ou encore
PREUVE. Comme dans la proposition précédente, l'égalité des accroissements finis s'ap-
plique sur tout intervalle [a, bl, a < b étant deux points quelconques de I, et donc le
taux d'accroissement de f entre a et b, c'est-à-dire f(b~=~al, est du signe de f'. Le résultat
en découle. ■
Grâce à ce résultat, on a un outil pour étudier les variations d'une fonction dérivable,
c'est-à-dire pour déterminer sur quelle partie de son ensemble de définition elle est croissante
et sur quelle partie elle est décroissante.
EXEMPLE 26.30. La fonction f: x H x 2 , définie et dérivable sur JR., a pour dérivée f'(x) =
2x, qui est négative sur] - oo, 0] et positive sur (0, +oo[. Donc la fonction f est décroissante
sur ] - oo, 0] et croissante sur (0, +oo[.
PREUVE. En effet, d'après la proposition précédente, sous l'hypothèse faite, f est strictement
monotone donc injective. Comme f est dérivable, elle est continue et donc (voir le chapitre 25
partie III.2) f(I) est un intervalle et f est bijective de I sur l'intervalle f(I), et sa réciproque
est continue.
Maintenant, si b = f(a) E f(I), alors pour tout 1J = f(x) E f(I), on a
Définition 26.32. Soit f : I -+ f(I) une application bijective d'un intervalle de lR sur son
image. On dit que f est un difféomorphisme si f est dérivable ainsi que sa bijection réciproque.
On dit que f est un C 1 -difféomorphisme si f et f- 1 sont de classe C 1 .
D'après le résultat précédent, une fonction dérivable sur un intervalle I de JR, dont la
dérivée ne s'annule pas et garde un signe constant, est un difféomorphisme de I sur f(I).
Proposition 26.33• . SQ!l,1, f une jonction réelle définie et conti'f:liue sùr le segment [n,b],
a < b, et dérivable sur}a,b]. Si f 1(t) a une limite réelle 1' quand t ➔ a.+, .ala.r;, f. es.t
dérivable à droite au point a et f'(n) = F. · · ·
PREUVE. Considérons la fonction auxiliaire cjJ(t) = f(t) - l't, t E [a, b]. Fixons E E JR~;
comme f'(t) -+ l' quand t-+ a+, il existe a E JR~ tel que, pour tout t E]a, a+ a[, on ait
lf'(t) - l'i :::;; E. En particulier, la fonction f' est bornée sur l'intervalle ]u, a+ a[ et il en
est de même pour la fonction cjJ'. Si donc x E]u, a+ a], on peut appliquer l'inégalité des
accroissements finis à la fonction cjJ sur l'intervalle [u, x] et on obtient
lcjJ(x) - cjJ(u)I :::;; (x - a) sup W(t)I = (x - u) sup Jf'(t) - l'i :::;; (x - a)E,
tE ]x,a[ tE ]a,x[
4
On fera tendre y vers b seulement à gauche ou à droite si éventuellement on se trouvons à une extrémité de
l'intervalle f(I).
743
Théorème 26.34; Soit f une fonction à valeurs réelles, définie et de classé C1 sur l'inter-
valle Ja., bh u <b. Si f'(t} a·wrte/li1!literéelle quand t-+ a.+, alors f se prolonge de manière
unique,en unefonetion de classe(Yffir [a., b]. · ·
PREUVE.
coN
..ci
◊ Nous allons d'abord montrer que fa une limite réelle quand t--, a+ en utilisant le critère ü
de Cauchy pour les fonctions, c'est-à-dire en montrant que
VE E JR'.;_, :lcx. E JR'.;_, V(x, y) E ]a, b]2, si lx - al ::;; ex. et IY - al ::;; ex. alors lf(x) - f(y li ::;; L
Nous laissons au lecteur le soin de justifier que ce critère entraîne l'existence de la limite de
f en a. Fixons donc E. E JR~; puisque par hypothèse f'(t) tend vers un certain l' E lR quand
t--, a+, il exister E JR~ tel que, pour tout t E]a, a+ rl, on ait lf'(t) - l'i::;; 1 et donc, en
vertu de l'inégalité triangulaire, lf'(t)I ::;; 1 + ll'I. Par l'inégalité des accroissements finis, on
déduit donc que pour tout (x, y) E] a, a + rJ2, on a
Posant alors ex= min(r, e/(ll'I + 1)), on voit que V(x, y) E]a, a+ cx.]2, lf(x) - f(y)I::;; e, d'où
le résultat.
◊ Puisque fa une limite, notée l, lorsque t--, a+, en définissant la fonction f par
EXEMPLE 26.35. La fonction définie sur JR* par f(x) = x 3 sin ~ est de classe C 1 sur JR* par
les théorèmes généraux et sa dérivée pour x # 0 est donnée par
qui tend clairement vers O lorsque x tend vers O. Il en résulte que f se prolonge de manière
unique en une fonction C 1 sur lR et que la dérivée en Ode ce prolongement est O. le prolon-
gement s'obtient bien sûr en posant f(O) = 0, et on peut vérifier directement la propriété
énoncée.
Remarque. Le théorème des accroissements finis est aussi un outil pour montrer des inéga-
lités simples 5 • Nous en verrons des exemples en exercices. Rappelons enfin que le calcul des
dérivées et les résultats obtenus dans ce paragraphe, joints au calcul des limites, permettent
d'étudier des fonctions et de tracer leur graphe, c'est un type d'exercice classique que le lecteur
a déjà largement rencontré en terminale et qui a été revu dans la première partie du présent
ouvrage.
Nous allons reprendre rapidement les deux sections précédentes pour les fonctions f définies
sur un intervalle I de JR, à valeurs complexes. Nous allons souligner ce qui demeure valable
des résultats précédents, et ce qui ne l'est plus.
111.1. Dérivabilité
Concernant la dérivabilité, la définition demeure vraie. En effet, pour f : I --+ C, on peut
définir son taux d'accroissement comme pour une fonction à valeurs réelles et on dira donc
qu'elle est dérivable en un point a E I si ce taux d'accroissement T 0 (h) a une limite dans
C quand h --+ 0 (avec éventuellement h restreint à être strictement positif, ou strictement
négatif, si a est une borne de l'intervalle I). Si on pose f, (t) = ~ef(t) et f 2(t) = Jm f(t),
alors f (t) = f 1(t) + if 2 ( t), il résulte alors immédiatement des propriétés des limites que
Pour de telles fonctions à valeurs complexes, on ne s'intéresse plus en général à leur graphe
mais plutôt à la représentation de l'ensemble
C = {f,(t) +if2(t) t E I}
1
qui est ce que l'on appelle une courbe paramétrée, ou un arc paramétré, et sera étudié au
chapitre 30. Nous y verrons en particulier le lien entre la dérivée de f et les tangentes à
l'ensemble C.
Tous les résultats concernant les opérations sur les fonctions dérivables restent bien évi-
demment vrais dans le cadre des fonctions à valeurs complexes.
5
Diverses méthodes sont utilisées en analyse pour l'obtention d'inégalités. Nous en rencontrerons plusieurs au
long de cet ouvrage : inégalité des accroissement finis, étude d'une fonction auxiliaire, formules de Taylor,
convexité, etc.
745
f:JR----,C, tHcost+isint.
Cette fonction est dérivable sur JR, vérifie f(0) = f(27t) et pourtant sa dérivée ne s'annule
jamais.
Par la même occasion, l'égalité des accroissement finis est aussi mise en défaut, et ce par
cci
le même contre-exemple. En revanche l'inégalité des accroissement finis est encore vraie sous C'I
PREUVE. L'égalité des accroissements finis n'étant pas vraie dans le cas complexe, on ne peut
évidemment pas en déduire directement, comme nous l'avons fait dans le cas réel, l'inégalité
des accroissements finis.
Notons f(t) = f 1(t) +if2(t) et introduisons la fonction auxiliaire à valeurs réelles définie
sur [a, b] par
<p: t H f1 (t)(f1 (b) - f1 (a)) + f2(t)(f2(b) - f2( a)).
Cette fonction est continue sur [a, b] et dérivable sur ]a, b[ par les théorèmes généraux. Sa
dérivée est donnée par
et par l'application de l'égalité des accroissements finis à cette fonction réelle, il existe c dans
]a, b[ tel que cp(b) - cp(a) = (b - a)cp'(c) qui s'écrit après simplication
c'est-à-dire
lf(b) - f(a)l 2 = (b - a)cp'(c).
Compte tenu de l'expression de cp', cela s'écrit encore
(26.5)
(26.6)
et que le lecteur vérifiera sans peine en développant les deux membres. Grâce à cette inégalité
(26.6), la relation (26.5) nous donne l'inégalité
Si lf(b )-f( a)I = 0, ce que l'on veut montrer est trivial donc on peut supposer lf(b )-f( a)I -1- 0
et simplifiant alors par cette quantité l'inégalité précédente, on obtient
sur la complétude de :IR, c'est-à-dire sur le fait que toute suite de Cauchy de réels converge
dans R
Rappelons que si f est une application d'un ensemble E dans lui même, un élément a de
E est un point fixe de f lorsque f(a) = a. Commençons par une simple remarque, qui sera à
la base de beaucoup de nos raisonnements.
LetUUl~ 26.37. SoiU. UMPJ&~ie qe"J f,tf une fonction continue de I dans L. One conseillère
la:suite {~}tW;:N tléfirti,e z,ar *wrrence par Uo E I et Un+1 = f(1.tn). Alors si cette .suite
a~oc
corw.veri,e, f=Jim11.'--too Un~ 1 · •. · · · ··
l = f(t).
En d~autres t~es limn.➔i:i:i•l..ttt est un piiint Ji,xe. de f.
PREUVE. Si la suite (UnlnEN converge vers f, la sous-suite (Un+1 lnEN converge aussi vers f.
Cette suite a pour terme général f(u.nl, donc elle converge vers f(f), par continuité de f. Il en
résulte que f( €) = € par unicité de la limite. ■
est ainsi non vide et minoré donc admet une borne inférieure que nous noterons ;:\(f). Il est
clair que À( f) est un rapport de Lipschitz de f.
EXEMPLE 26.39. Si f : l ---t C est dérivable et possède une dérivée bornée sur l alors
d'après l'inégalité des accroissements finis, f sera lipschitzienne avec À(f) ~ suptETlf'(t)I. En
particulier, si f est de classe C 1 sur un segment l = [a, b], cette condition sera satisfaite.
Définition 26.40. Une application f est dite contractante si elle est lipschitzienne avec un
rapport de Lipschitz À( f) < 1.
Prop~~tit:>n Ï(l:41~ Sif : l -4.~ est lî~7hliîètlntf alôrif est umformément continue et a
fQrtiori continue, ·· ·
PREUVE. Si f est constante, f est trivialement uniformément continue. Sinon, le rapport de
Lipschitz À(f) est non nul. Soit f: E :IR~; si on pose <X= e/;:\(f), on a, pour tout (x, y) E 12 tel
que lx - y ~ <X,
1
PREUVE. Par récurrence sur n EN*. Sin= 1, c'est évident. Si fn-l est lipschitzienne avec
;\(fn- 1 ) ~ ;\(f)n- 1 , alors, pour tout (x, y) E 12 , on a
Définition 26.44. Soit (Àµ)pEN une suite de termes positifs; on dit que la série de terme
générol Àp converge si la suite (SnlneN de terme générol Sn = I:;=0 Àp converge dans lR.
Dans ce cas, sa limite S est notée
+oc
s = L Àp
p=O
et est appelée la somme de la série. La suite (SnlneN est appelée suite des sommes partielles
de la série.
Proposition 26.45.
1) Soit {À11 )peN une suite de termes positifs. La série de terme général A11 co,nverge sp~t
seulement si là àûite (Sn)n.eN ·est ma,jorée. .. .
2) Soient {Àp)PEJ!if et (µ,,)peN des suites de termes positifs vérifiant Àp i Jti,. Alors si ia série
de terme général µ,, converge, la série de terme général Àp converge et
3) Soit (Àp )peN une suite de termes positifs. Si la série de terme général Ap converge, op, a
alors limn.:.ioo Àp =O.
PREUVE.
1) En effet, les Àp étant positifs, la suite (SnlneN est croissante donc converge si et seulement
si elle est majorée.
749
2) On voit facilement que dans ce cas la suite (SnlnEN est majorée par la somme L~ ~,
donc la série correspondante converge. L'inégalité est immédiate par passage à la limite.
3) Avec les mêmes notations, Àp = Sp+l - SP est la différence des termes généraux de deux
suites qui convergent vers la même limite, donc Àp -) O. ■
Si la série de terme général Àp converge et a pour somme S, alors par définition, lorsque
n-) +oo, la suite dont le n-ième terme est Rn= S - Sn tend vers O. Ce terme Rn est appelé
reste d'ordre n de la série. On peut noter aussi
<Ô
N
..d
ü
EXEMPLE 26.46. On a déjà étudié les séries géométriques dont le terme général est de la
forme Àp = kP, k E [O, +oo[ et vu que ce type de série converge si et seulement si O ,( k < 1.
Puisque pour tout non a Sn= 1~k_";;', la somme de cette série et son reste d'ordre n sont
donnés par
Rappelons qu'un fermé de IR est une partie dont le complémentaire est ouvert, ou encore
une partie qui est égale à son adhérence. Si A est une partie fermée de IR, et si (unJnEN est
e
une suite d'éléments de A qui converge verse, alors nécessairement E A. En effet, si rf_ A,e
il existe un intervalle ouvert contenant e qui est contenu dans Ac_ Il existe donc ô > 0 tel
que Je - ô, e+ ô[ soit contenu dans Ac. Donc aucun élément Un ne peut être contenu dans
]€ - ô, e+ ô[ , ce qui contredit la définition de la convergence de (unlnEN verse. Donc e E A.
Signalons enfin qu'un intervalle fermé de IR est un intervalle de IR qui est fermé au sens
précédent. En particulier, les intervalles de la forme [u, +oo[ et] - oo, u] sont fermés.
Si f : I -1 IR est une application lipschitzienne laissant stable l'intervalle I, c'est-à-dire
vérifiant f(I) CI, on peut considérer la série de terme général Àp = À(fP). On l'appellera par
commodité (dénomination non universelle) la série de Lipschitz associée à f. Compte tenu de
la proposition 26.43, si f est contractante de rapport k, alors sa série de Lipschitz converge
et, en vertu de la proposition précédente, son reste d'ordre n est majoré par Rn= ~":~.
l)f,ôûr~iteN;•ô na
. . .
ff.>.{~f\.,fu~f~f
fa.;..u.pf.~
. \n=v J
et dans. le êai pàrffeitlit:r â'un1/cpJlli~tion·cont:rt1iit~nt(it1;:' iùppcnjtt
, , 'f<;tur~~I ( ·
0
··..
la-Upf ~. f;;.. k .
PREUVE.
et comme la série de Lipschitz associée à f converge, son terme général À(fP) tend vers 0,
donc est strictement inférieur à 1 à partir d'un certain rang Po, il en résulte que la - bl = 0,
c'est-à-dire a= b.
o Toute suite définie par (26. 7) a une limite.
Nous allons montrer que (UnlnEN est une suite de Cauchy. À cette fin, nous allons contrôler
chaque différence Un+l - Un et établir une chaîne reliant Up et Uq par des différences de tels
termes consécutifs. Précisément, pour tout n EN, on a clairement Un= fn(Uo) donc
(26.8)
Remarquons que si u 1 = Uo alors Uo est un point fixe de f, donc la suite est constante et en
particulier convergente. On peut donc supposer u 1 i- u 0 .
Donc si pet q sont des entiers, avec p < q, on a, grâce à l'inégalité triangulaire
(26.9)
Or, puisque la série de Lipschitz associée à f converge, pour tout e E IR~, il existe un entier
n 0 EN tel que
q-1
0 ~ L, À(fn) = Sq-1 - Sp-1 ~ e/lu1 - Uol
n=p
si q ?: p ?: no et par suite luq - Upl ~ e, donc la suite (UnlnEN est une suite de Cauchy.
Puisque IR est complet, elle converge dans R Mais l'intervalle I est supposé fermé et (UnlnEN
est une suite de points de I donc sa limite appartient à I.
751
◊ L'application f a un point fixe et toutes les suites définies par (26. 7) convergent vers la
même limite. C'est clair d'après le lemme 26.37, puisque f est continue, en vertu du premier
point de cette preuve.
◊ Vitesse de convergence.
Revenons à la majoration (26.9). En faisant tendre q vers +oo, on obtient
L. À(fn) ~ L. À(f)n = L. kn = 1 - k ë5
n=p n=p
d'où
■
L'outil essentiel pour vérifier que nous sommes bien dans les hypothèses du théorème
précédent va évidemment être le théorème des accroissements finis, qui nous permettra souvent
de montrer qu'une application est contractante.
f:I=[O,+oo[-)JR, xH ✓ 12+x.
L'intervalle I est fermé, stable par f et Un+l = f(un)- De plus, f est dérivable sur I et, pour
tout x ~ 0, on a
f'( ) 1
X = 2✓12+x'
donc d'après le lemme 26.48, f est contractante, de rapport k ~ )u =
2 4
1.Il résulte donc
du théorème du point fixe que la suite (UnlnEN converge vers l'unique point fixe de f, dont
il n'est pas difficile de calculer la valeur, à savoir 4, en résolvant l'équation
✓ 12 +X= X, X~ 0.
Introduisons la fonction
f : [0, 2[----, JR, X H ✓2 - X.
Cette fonction laisse stable l'intervalle [O, 2[, est dérivable, de dérivée donnée pour x E [O, 2[
par
-1
f'(x) = 2 ✓2=x·
2-x
Quand x est proche de 2, lf'(x)I est très grand et le théorème des accroissements finis inopé-
rant. Mais en fait on voit bien que l'action va se dérouler "loin" de 2. En effet, tous les termes
de la suite sont clairement majorés par v1 donc en fait on peut se placer sur le segment
I = [O, vll, qui est stable par f (f(I) C I). On a alors
1 1
sup-== = - - - - < 1.
xEI2 ✓2-x 2J2-vl
On est donc dans le cadre de l'application du théorème du point fixe, la suite (UnlnEN
converge vers l'unique point fixe de f, à savoir 1.
On se doute bien, à la vue des exemples précédents, que la valeur de la dérivée de f au
point fixe est déterminante pour le comportement et la vitesse de convergence de la suite.
Nous ne donnerons pas ici de résultats généraux à ce propos mais nous en verrons un exemple
explicite avec la méthode de Newton traitée plus loin.
Introduisons la fonction
doit vérifier f(l) = l, d'où l = 4. La com-ergence est qualifiée dans ce cas. pour des raisons
évidentes, de convergence en escalier.
Que se passe-t-il si on change de condition initiale? On sait d·après la méthode du point
fixe que cela ne change rien, mais on le vérifie directement ici. Si par exemple. on part de
u 0 = 5 cette fois-ci, on aura u 1 = Jl 2 + 5 < Uo = 5. donc la suite sera cette fois décroissante.
mais toujours convergente vers 4.
Remarquons tout d'abord que f est décroissante. Il en résulte que dans la suite des itérées
2 1
fn, les itérées paires f 2 P sont croissantes et les itérées impaires f v+ sont décroissantes. Par
conséquent les sous-suites (u 2p)pEN et (Uzp+l lvEN sont monotones; en outre elles sont de
sens de variation contraires car si par exemple u 0 ~ u2, alors puisque f est décroissante,
U1 ~ U3 donc (uzvlvEN est croissante et (u2v+1 )pEN décroissante. Si au contraire, u 0 ~ u 2, on
aura U1 ~ U3 donc (uzvlvEN sera décroissante et (u2p+1lvEN croissante. En tout cas les deux
sous-suites (u2p)pEN et (uzv+ilvEN sont convergentes puisque monotones et bornées (entre 0
et 2) ; la fonction f étant continue, f 2 aussi, elles convergent chacune vers un point fixe de
f 2 . Or, f 2 (x) = f o f(x) = J2 - J2 - x, donc
ce qui implique par élévation au carré que 2-J2-x = x , d'où 2-x = J2-x, impliquant
2 2
2 )2 = 2 - x. Cette dernière équation est du
à nouveau par une élévation au carré que (2 - x
quatrième degré, x 4 - 4x 2 + x + 2 = 0, mais, évidemment, la solution x = 1 qui est point
fixe de f l'est a fortiori de f 2 donc on peut facilement factoriser ce polynôme du quatrième
degré en (x - l)(x 3 + x 2 - 3x - 2) = O. Or si on pose cp(x) = x 3 + x - 3x - 2, on a
2
et cp'( ✓2) = 3 + 2)2, s'annule en un seul point x 0 E [O, ✓2]. Sur [O, x 0], cp est décroissante.
754
sur [x 0 , v'll, cp est croissante; or cp(O) = -2 et cp( v'l) = -v'l, donc cp reste strictement
négative sur l'intervalle I = [O, v'l] et donc en particulier elle ne s'annule pas. Il en résulte
que le seul point fixe de f 2 sur I est 1 et donc que les suites (u2p)pEN et (uzv+ilvEN convergent
toutes les deux vers 1, l'une en croissant et l'autre en décroissant (elles sont donc adjacentes).
La suite (unlnEN converge donc vers 1. Pour des raisons graphiques évidentes, la convergence
est dite en spirale.
Le lecteur aura pu constater que la méthode du point fixe est plus rapide. Les autres
méthodes ont l'avantage de bien montrer l'utilisation directe de la structure de la droite
réelle.
où a est un réel strictement positif donné. Nous avons déjà évoqué cette suite dans l'intro-
duction du chapitre sur les suites à propos du texte Les Métriques de Héron d'Alexandrie.
Commençons par utiliser le théorème du point fixe. Introduisons pour cela la fonction
X 0 va +oo
f' - 0 +
f 0 "-,, va /' +oo
755
Ainsi, en particulier l'intervalle fermé [fo, +oo[ est stable par f. De plus, f est contractante
sur cet intervalle puisque pour tout x E [va, +oo[, 0 :(; f'(x) :(; 1/2. Si c ;:::, VU, le théorème
du point fixe s'applique et montre que la suite (UnlnEN converge vers l'unique point fixe de la
fonction f sur [va, +oo[, à savoir fo. Si maintenant C :(; VU, on remarque que puisque f est
décroissante sur ]0, y'a], la condition Uo = C :(; VU implique que U1 = f(uo)) f(val = VU
et donc qu'à partir du terme u 1, tous les termes Un sont dans l'intervalle fermé [fo, +oo[ et
que, par conséquent, dans tous les cas la suite (UnlnEN a pour limite le nombre fo.
Utilisons maintenant la méthode basée sur l'étude du sens de variation des suites. Il
convient de remarquer qu'à partir de u,, tous les termes sont dans [va, +oo[, quelle que
soit la valeur initiale de u 0 . Sur cet intervalle, la fonction f est croissante donc la suite est
monotone à partir de u 1 . Introduisons alors la fonction cjJ définie sur [fo, +oo[ par
Cette fonction est décroissante. Puisque cjJ( fol = 0, elle est négative sur [fo, +oo[, impli-
quant ainsi que pour tout XE [va, +oo[, on a f(x) :(; X. Ainsi, en particulier U2 :(; U1 et donc
la suite (unlnEN est décroissante à partir de u 1. Comme la suite est minorée, elle converge
vers l'unique point fixe de f appartenant à (Un)nEN• à savoir fo.
F(c)
xo = c - F'(c).
Repartons alors de ce point Xo. Considérons la tangente au graphe de Fau point (x 0 , F(x 0 )),
et calculons l'intersection de cette tangente avec l'axe des abscisses, on obtient un point x 1,
756
et ainsi de suite. On obtient ainsi un procédé itératif qui définit une suite (un)nEN avec
F(Un)
Uo = c, Un+l = Un - F'(un)
EXEMPLE 26.53. Appliquons cette idée à l'équation x 2 = a, x, a> 0, visant ainsi à calculer
le nombre y'a. Dans ce cas, F(x) = x 2 - a et donc
f(x) x - -a = -1 ( X+ -a) .
= X- -
2
2x 2 X
Théotême 26;54. Supposons (flf,e f soit de classe C2 sur un segment. (oc, il vérifiant F( «) <
0, F(t3)>0etpourtou txE [oc,[3], f'{x)>O etF"(x) ~O.
1) Alors Fâdmet un zéro et un seul, notons-le a, dans le segment [oc, f3].
2) Pour tout c E [oc, [3], la suite définie par
F(Un)
'll() = C, Un+l = Un - f'(Un) .(26.10)
m1 = xE[oc,~]
min F'(x) et M2 = max F"(x).
xE[oc,~]
PREUVE.
1) Puisque F est continue et vérifie F(a) < 0 et F(f3) > 0, par le théorème des valeurs
intermédiaires, F a un zéro sur le segment [a, [3]. En outre, F' est strictement positive donc F
est strictement croissante, en particulier injective, et donc ce zéro est unique. Notons le a.
2) Considérons la fonction f définie sur [a, [3] par
F(x)
f(x) =X--(-)'
f' X
1
Puisque F' est strictement positive, f est bien définie sur [a, [3] et de classe C . En outre,
puisque F(a) < 0 et F(f3) > 0, on a f(a) > a et f([3) < [3, et, par conséquent, f laisse
stable le segment [a, [3]. Il en résulte que la suite définie par (26.10) est bien définie pour tout
entier naturel n. La remarque cruciale est que l'équation f(x) = x est équivalente à l'équation
F(x) = O. Les points fixes de f correspondent donc aux zéros de F.
La dérivée de f étant donnée par
f'( ) = F(x)F"(x)
X f'(x)2 ,
il en résulte que f est décroissante sur [a, a] et croissante sur [a, [3], et on voit que chacun de
ces deux sous-intervalles est stable par f. Si Uo = c E [a, [3], la suite (UnlnEN est monotone
et comme f(x) - x = -F(x)/F'(x) ~ 0 pour tout x E [a, [3], on a u1 ~ u 0 et donc la suite est
décroissante. Si maintenant au contraire u 0 = c E [a, al, puisque f est décroissante sur [a, al,
on a f(u 0 ) ~ f(a) = a donc u 1 appartient à [a, [3] et on est ainsi ramené au cas précédent dès
le terme u 1 . Il en résulte que la suite est décroissante à partir de n = 1 et donc convergente
puisque minorée. De plus, f est continue donc la limite de f doit être un point fixe de f, et
donc un zéro de F.
3) Pour ce point concernant la vitesse de convergence de la suite (unlnEN, nous avons besoin
d'un résultat (la formule de Taylor-Lagrange) qui ne sera développé que plus tard dans le
livre, au chapitre 29. Comme nous n'avons en fait besoin de cette formule qu'à l'ordre 2, nous
758
Ceci étant, puisque dans notre cas F(a) = 0, on déduit de cette formule que
f( ) _ _ F(x) _ (a-x)2F"(y)
x -X F'(x) - a+ 2 F'(x).
M2 2
0 ~ Un+l - a~ - -(un - a) .
2 m1
■
Prouvons maintenant la formule (26.11). On procède exactement comme pour l'égalité des
accroissements finis. Le réel x étant fixé dans )a, f3], considérons la fonction auxiliaire <j> définie
pour t E [a, x] par
(t x) 2
<j>(t) = F(t) - F(x) - (t-x)F'(x) - k
2
où k est choisi de telle sorte que <j>(a) = 0 (inutile d'expliciter k qui clairement existe et
est unique puisque x =f. a). On a donc <j>(a) = 0 par définition mais aussi <j>(x) = O. Par le
théorème de Rolle appliqué à <j> sur le segment [a,xl, il existe c 1 E)a,x) tel que <!>'(ci)= O.
Or
<j>'(t) = F'(t) - F'(x) - k(t- x),
donc on a aussi <!>'(x) = O. On peut donc appliquer le théorème de Rolle à la fonction<!>' sur
le segment [c 1 , x] (ne pas oublier que Fest deux fois dérivable donc <j> est dérivable) et on
obtient ainsi l'existence d'un réel y E]c 1 ,x[ tel que <!>"(y)= O. Or, <!>"(y)= F"(y) - k, d'où
k = <!>"(y). Reportant cette valeur dans la formule définissant la fonction <j> nous obtenons
l'égalité cherchée (26.11).
Remarque. Le dernier point du théorème précédent montre que la méthode de Newton
est efficace car la suite (UnlnEN convergera vers le point a plus vite que ce que l'on pouvait
espérer a priori. En effet, par le théorème général du point fixe on pouvait s'attendre à ce f
soit contractante sur un petit intervalle contenant a puisque f'(x) = F(x)F"(x)/F'(x) 2 et que
f'(a) = 0 (F(a) = 0) et donc à ce que l'on ait
Ici, le fait que If' (a) 1soit nul, et pas seulement plus petit que 1, nous a fait gagner en rapidité
car la majoration
M2
lun+l - al :(; - !Un - al 2
2m1
conduit à une majoration nettement plus performante de l'erreur. En effet, si on note K =
M2/lm1, on a KIUn - al :(; (KIUn-1 - al) 2, d'où en posant .Sn= KIUn - al, .Sn:(; .S~_ 1, qui
conduit immédiatement à .Sn:(; .Sf, c'est-à-dire
Si (Klu0 - al) < 1, la suite de terme général (KIUo - aj).zn converge bien sûr beaucoup plus
vite vers O qu'une simple suite géométrique kn, k < 1.
En pratique, on aura cependant intérêt à partir d'une condition initiale Uo = c proche de
a afin que le début du processus ne soit pas trop lent. Cela nécessite d'avoir au préalable assez
bien cerné le zéro a de la fonction F.
EXEMPLE 26.55. Reprenons, pour illustrer ce que nous venons de dire. l'exemple de la
méthode de Babylone. On a dans ce cas
au lieu de l'attendu
1
IUn+l -val:;;;; 21un -val
donné par le fait que dans cet algorithme la fonction f est contractante avec un rapport
inférieur à 1/2.
760
V. EXERCICES
26.1. 2. Plus généralement, montrer que si f est dé-
rivable à droite et à gauche au point a alors f
Soit f la fonction définie sur ll par admet une dérivée symétrique en a et expliciter
f~(u) en fonction de f~(u) et f~(u).
f{x) = x 2 sin ~ six=/= 0 et f(0) = O. 3. Etudier la réciproque en considérant la fonc-
X
tion f définie par
Montrer que f est dérivable mais n'est pas de
classe C 1 sur ll. f(x) = xsin ~six=/= 0 et f{0) = O.
X
26.2.
26.6.
Déterminer toutes les fonctions f : ll -+ R,
dérivables en 0 et vérifiant les équations fonc- En utilisant le théorème des accroissement finis,
tionnelles suivantes montrer les inégalités suivantes :
26.3.
26.7.
Soit [u, b] -, R, a < b, dérivable sur [u, b]
et telle que f( u) = O. Montrer que s'il existe Soit f une fonction définie sur un intervalle non
ex 2 0 tel que pour tout x E [u, b], on ait vide I, à valeurs réelles. Montrer que s'il existe
lf'(x)I :c; cxlf(x)I, alors f est identiquement nulle. ex > 1 et k 2 0 tels que pour tout (x, y) E I2 ,
on ait
lf{x) - f{11ll :c; klx -11l'X,
26.4. alors f est constante sur I.
26.17. 26.18.
Etudier la convergence de la suite (unlnEN dé- En utilisant la méthode de Newton, donner une
finie par la relation de récurrence valeur approchée à 1o-9 près de l'unique racine
strictement positive de l'équation
2
uo = C 2 0 et Vn EN, Un+l = -,--2.
+un x 6 -x-1 = O.
Chapitre 27
LES FONCTIONS INTÉGRABLES
OMMENT déterminer l'aire d'une figure plane? Cette question s'est posée, dès !'Anti-
C quité, aux mathématiciens grecs. La figure la plus simple est le rectangle dont l'aire
est le produit de la longueur par la largeur, puis le triangle rectangle, qui n'est que
la moitié d'un rectangle; l'aire d'un triangle quelconque se calcule alors en le partageant, à
l'aide d'une hauteur, en deux triangles rectangles. Nous arrivons ainsi, comme les Grecs, à
calculer l'aire d'un polygone quelconque; il suffit de le décomposer en triangles, puis de faire
la somme des aires de ces triangles.
Mais que faire si le contour de la figure est une courbe non rectiligne, par exemple un cercle?
C'est Archimède qui répond partiellement à la question, en donnant une approximation de
cette aire par le moyen d'un encadrement de celle-ci entre celles des polygones inscrits et
circonscrits au cercle. En appliquant la même méthode, il calcule aussi l'aire sous l'arc d'une
parabole, puis l'aire et le volume de la sphère.
de -1. 0
Dans sa preuve, il choisit astucieusement a
une famille de rectangles verticaux de plus
en plus fins (voir figure ci-contre), dont la
somme des aires approche la surface cher- FIGURE 27.1. Une famille de
rectangles
chée. Une question se pose alors aux mathé-
Expliquons d'abord en quoi consiste cette somme infinie. Divisons le segment [u, b] en
n parties [u,x,l,[x,,x:zl, ... ,[xn-1,bl et posons 1Jk = f(xk) pour k = 0,1, ... ,n- l. La
somme des surfaces des rectangles verticaux, de bases les [xk, Xk+iL et de hauteurs 1Jk, est
Sn= 1JoLho+· · ·+-Yk~xk+· · ·+1Jn-1~Xn-1 où ~Xk = Xk+1-Xk· On observe bien que sin est
de plus en plus grand, la somme Sn contient un nombre croissant de termes. Leibniz à l'aide
de sa théorie des infinitésimaux, décide que Sn est une quantité finie quand n devient infini
et la désigne par J-y dx. Pourquoi cette notation? Simplement parce que le symbole J est
la première lettre du mot latin summa qui veut dire somme; quant à l'expression intégrale,
du latin integer signifiant entier, elle a été proposée par son élève Jean Bernoulli, afin de
distinguer une somme ordinaire de la somme d'une infinité de termes.
764
~
Maintenant, faisons varier la borne b et calculons, comme le faisait Leibniz, la différence
Il)
Ill
de deux termes consécutifs de Sn, soit .1Sn = Sn - Sn-1 = f(xn).1xn. En divisant par .1xn,
~
t'CI
on obtient ~L>Xn
= f(Xnl- En prenant .1xn infiniment petit, en termes modernes tendant vers
~ 0, Leibniz conclut alors que l'intégration est l'opération inverse de la dérivation puisqu'en
dérivant l'intégrale, on retrouve la fonction. Ainsi, grâce au calcul infinitésimal, un lien est
:=:
établi entre la dérivée et l'intégrale. Malgré ses étonnants exploits, le calcul infinitésimal,
~
o..
inventé indépendamment par Newton et Leibniz, resta juqu'à la fin du XVIIIe siècle source
d'erreurs et de confusions.
Dès le début du XIXe siècle, Cauchy et Weierstrass débarrassent l'analyse des infinité-
simaux, et de leurs incohérences, en forgeant le concept de limite et en exigeant une parfaite
rigueur dans les démonstrations. Le problème qui se pose alors n'était plus comment calculer
une intégrale, mais déterminer quels types de fonctions on peut intégrer. Il est remarquable
qu'une grande classe de fonctions, introduite ici dans un contexte apparemment différent, les
fonctions continues, soient le principal exemple de fonctions « intégrables ». Mais les séries
de fonctions élémentaires et les séries de Fourier 1 vont faire apparaître, comme limite, des
fonctions peu régulières, en particulier non nécessairement continues.
Riemann travaille alors l'élaboration d'une théorie permettant d'intégrer d'autres fonc-
tions que les fonctions continues. Il propose à cette fin une définition de l'intégrale que nous
reproduisons ci-dessous.
« L'incertitude qui règne encore sur quelques la propriété, de quelque manière que les ô
points fondamentaux de la théorie des in- et les é: puissent être choisis, de s'approcher
tégrales définies nous oblige à placer ici indéfiniment d'une limite fixe A, quand les ô
quelque remarques sur la notion de l'inté- tendent tous vers zéro, cette limite s'appelle
grale définie, et sur la généralité dont elle la valeur de l'intégrale définie J! f(x)dx. Si
est susceptible. Et d'abord que doit-on en- la somme S ne tend vers aucune limite, la
tendre par J! f(x)dx? notation J!f(x)dx ne peut avoir aucune si-
Pour répondre à cette question, pre- gnification. »
nons entre a et b une série de valeurs
X1, Xz, · · · , Xn-1, rangées par ordre de gran-
deur, depuis a jusqu'à b, et désignons pour
abréger x1-a par ô1, x2-X1 par ô2, ... , b-
Xn-1 par Ôn; soient, en outre, ti des nombres
positifs plus petits que l'unité. Il est clair que
la valeur de la somme S = ô1f(a + é:161) +
· · · + Ônf(Xn-1 + é:nÔn) dépendra du choix
des intervalles ô et des fractions é:. Si elle a G. F. B. Riemann (1826-1866)
C'est en particulier avec Lebesgue que l'intégrale moderne trouva son cadre général et
prouva son efficacité en analyse, mais un exposé sur l'intégrale de Lebesgue dépasse largement
le cadre du présent ouvrage, et ne sera présenté que dans le cours de L3. Il ne sera donc question
dans ce chapitre que de l'intégrale au sens de Riemann. Toutes les fonctions considérées dans
la suite, sauf indication contraire, seront à valeurs réelles.
1
C'est Fourier qui nota J~ f(t)dt l'intégrale J f(t)dt avec ses deux bornes a et b.
765
y y
r7
1 1 r,
1 1 1 1
1 1 1 r,
1 1 1 1
X 1 11 1 X
0 a 0
b a : : b
L...J
Définition 27.1. Une subdivision du segment [a, b] est une suite finie (xdo,;;i,;;n de points
de [a, b] vérifiant a= Xo < X1 < · · · < Xn-1 < Xn = b.
Si (xdo,;;i,;;n et (yj)o,;;j,;;p sont deux subdivisions de [u, b], on note (xdo,;;i,;;n V (yj)o,;;j,;;p la
subdivision de [u, b] dont l'ensemble des points est la réunion de ceux de (xdo,;;i,;;n et (yj)o,;;j,;;p-
Définition 27.2. Une fonction cp définie sur [a, b] est en escalier s'il existe une subdivision
(xdo,;;i,;;n de [a, b] et n réels (cdo,;;i,;;n tels que cp soit constante sur chaque ]xi, XH1[, et de
valeur Ci.
Les fonctions constantes sont évidemment des fonctions en escalier.
EXEMPLE 27.3. Soit fla fonction définie sur [O, 1] par f = -1 sur JO, 1/2[, f 1 sur
1]1/2, 1[, f(O) = 0, f(l/2) = 2 et f(l) = -1/2. La fonction f est en escalier sur [O, 1].
766
EXEMPLE 27.4. Si t est un réel, on note [t] sa partie entière. La fonction E définie sur
1 [a, b] par E(t) = [t] est une fonction en escalier.
Soit cp une fonction en escalier sur [a, b]; une subdivision (xdo,;;i,;;n de [a, b] est dite
adaptée à cp si, pour tout O :::; k :::; n - 1, il existe un réel Ck tel que cp soit constante sur
]xk, Xk+l [, de valeur ck. Par définition, une fonction en escalier possède toujours une subdivision
adaptée.
Soient cp est une fonction en escalier sur [a, b] et X= (xdo,;;i,;;n une subdivision adaptée
à cp. Si Ck désigne la valeur de cp sur ]xk, Xk+l [, on pose
k=n-1
PREUVE. Si x est un point de l'intervalle ouvert ]a, b[, on note~ la subdivision constituée
des trois points a, x et b.
Calculons le nombre ly( cp) où ~ = X V~ avec X = (xi)O,;;i,;;n une subdivision de [a, b]
adaptée à cp et x un point quelconque de [a, b]. Nous avons deux possibilités pour le point
x : s'il est égal à l'un des xk, alors ~ = X et dans ce cas I;('( cp) = lx( cp); si en revanche, il
767
est différent de tous les Xk, il existe alors un unique ko tel que x E]xko, Xko+l [. La fonction cp
a la même valeur cko sur les deux intervalles ]xko, x[ et ]xko+l, x[. En tenant compte de cette
remarque nous avons
L'identité ci-dessus montre\ue l,1_>( cp) = lx( cp ). En résumé, nous avons montré que le nombre
l,1_>{ cp) n'est pas modifié si on ajoute un point quelconque à la subdivision X.
Si Y= {yi)O,s::i(p est une autre subdivision adaptée à cp. La subdivision ..YVY est obtenue en
adjoignant successivement à X les p-1 points de Y, c'est-à-dire que ..YVY= XV91 V.· .Vi)p-l ·
Nous pouvons donc conclure que ly (cp) = lx (cp). ■
PREUVE. Si X= (xdo,e;;i(n est une subdivision de [a, b] adaptée à cp, alors elle l'est également
pour la fonction en escalier Àcp. Notons ck la valeur de cp sur l'intervalle ]xk, Xk+i[ pour
k = 0, 1 · · · , n - 1. Le nombre Àck est la valeur de la fonction Àcp sur ]xk, xk+l [. Nous avons
donc
k=n-1
lx(Àcp) = L (xk+1-xk)Àck=Àlx(cp),
k=()
ce qui montre 1). Pour montrer la propriété 2) de la proposition, nous choisissons deux sub-
divisions X = (xdo,e;;i,;;n et Y = (yj)O,e;;i(P adaptées respectivement à cp, et 1j, et on note
Z = (zk)o,e;;k(q = X V Y. La subdivision Z est adaptée aux fonctions cp et lj,. Donc elle est
adaptée à la somme cp + 1j, qui sur chaque intervalle ]zk, Zk+l [ prend la valeur Ck + cL si ck
(resp. c() désigne la valeur de cp (resp. 1j,) sur ]zk, Zk+l [. Nous avons l'égalité suivante :
L'identité ci-dessus montre bien que lz ( cp + 1j,) = lz (cp) + lz (1j,), ce qui nous permet de
conclure que
Proposition 27Jt Sôient q> et1}1 deux fonétions en·êseàlîer définîes sur {n,b'J:Noma11ons
les propriétés suît1àntes : . .
1) si f: estpôsitîvésut {~,bl, .a'lorsf!<ett}dt ~o}·
2) · si ·<i> ~ '1>· sudà,bl, ·ak>~J!~(t)dtz J! lJ,(t}dt,
PREUVE. Si X(xdo,;;i,;;n est une subdivision adaptée à la fonction en escalier <p, alors le
nombre Ix(cp), qui est égal à f! cp(t)dt, est une somme de réels positifs, donc il est positif.
Soit maintenant 1j., une fonction en escalier sur [a, b] telle que cp )! lj.,. La différence cp-tj.,
est une fonction positive en escalier sur [a, b], donc, d'après la propriété 1), son intégrale est
positive. Par application de la proposition 27.7, on en déduit que f! cp(t)dt- f!tJ.>(t)dt 2 0,
ce qui entraîne la propriété 2) de la proposition. ■
; n:q>(t}dtj ~ r lcp{t)ldt•.
PREUVE. Nous savons que pour tout t E [a, bl, -lcp(t)I ~ cp(t) :::: lcp(t)I. En utilisant la
propriété 2) de la proposition ci-dessus, on obtient les inégalités
If cp(t)dtl ~ f lcp(t)ldt.
■
X X
b O a b
FIGURE 27 .4. Les graphes de f et qi. FIGURE 27.5. Les graphes de f et ljJ.
donc partis de considérations heuristiques sur les propriétés intuitives des aires (ici, que l'aire
limitée par le graphe d'une fonction de '1' doit être plus grande que l'aire limitée par le
graphe de f, avec la propriété analogue pour les fonctions de <D), nous avons ensuite utilisé les
propriétés de la droite réelle, et nous en déduisons une définition de la classe de fonctions qui
se comporteront bien vis-à-vis du calcul des aires. C'est donc ainsi qu'une simple idée donne
lieu à la construction de nouveaux objets mathématiques.
Revenons maintenant à la construction détaillée de l'intégrale, et commençons par remar-
quer que si f est une fonction en escalier sur [a, bl, alors J!
f( t)dt est le plus grand élément de
J! J!
I-, donc f(t)dt = i~(f). Il est également le plus petit élément de I+, donc f(t)dt = I~(f).
Nous constatons donc, dans le cas des fonctions en escalier, l'égalité des deux nombres i~(f)
et I~(f) et leur coïncidence avec l'intégrale de la fonction sur [a, b].
Dans les deux exemples suivants, nous allons calculer, pour des fonctions f données ex-
plicitement, les nombres i~(f) et I~(f). Nous verrons dans le premier exemple que i~(f) est
strictement plus petit que I~(f). Ce qui montre que notre méthode du calcul de l'aire ne s'ap-
plique pas à toutes les fonctions. Le graphe de la fonction f utilisée dans le second exemple
n'est que le côté d'un triangle rectangle dont on connaît évidemment l'aire. Nous établirons
que les nombres i~(f) et I~(f) sont égaux et qu'ils coïncident avec l'aire d'un tel triangle.
EXEMPLE 27.10. Soit x la fonction définie sur [O, 1] par x(t) = 0 si t est rationnel, et
x(t) = 1 si test irrationnel. La fonction x est évidemment bornée sur (0, 1]. Montrons que
ib(xl < Ib(x).
► Soit q:> une fonction en escalier telle que q:> ,:;; X sur (0, 1]. Si (xk)o,s:k(n est une subdivision
de (0, 1] telle que pour tout t E]xk, Xk+l [ cp(t) = Ck avec k = 0, 1, ... , n - 1. L'intervalle
]xk, Xk+l [ est ouvert non vide, donc il contient au moins un rationnel, ce qui entraîne que
ck,:;; O. Nous déduisons donc que f ~ cp(t)dt::::; O. En prenant la borne supérieure de tous les
f ~ cp(t)dt, on peut conclure que ib(f) ,:;; O.
En utilisant le fait qu'un intervalle ouvert non vide contient au moins un irrationnel, on
peut prouver comme ci-dessus que IJ(x) 2: 1. En résumé nous avons iJ(f) < IJ(x).
EXEMPLE 27.11. Soit fla fonction définie sur [O, 1) par f(t) = cxt où ex> O. Calculons
f~ cp(t)dt.
► Pour n E N* et k un entier entre O et n, on pose xk = k/n. Soit q:> la fonction en
escalier constante de valeur kcx/n sur chaque intervalle [xk,Xk+d avec cp(b) = (n- l)cx/n.
La fonction 1\> est également constante de valeur (k + 1)cx/n sur chaque intervalle )xk, Xk+ll
avec 1\>(a) = cx/n. Par construction, nous avons q:>,:;; f,:;; 1\> sur [O, 1].
► Calculons maintenant f~ cp(t)dt. Par définition, ce nombre est égal à
k=n-1 k=n-1
L (xk+l -xk)cxxk =; L k.
k=0 k=0
Comme (n-1 )n/2 est la somme des entiers entre Oet n-1, en simplifiant par n, on obtient
, cx(n-1)
o cp(t)dt = 2n .
J
De la même manière on peut montrer que
771
Les inégalités
Voici maintenant la définition formelle de la propriété d'intégrabilité, qui suit ce que nous
avons annoncé.
Définition 27.12. Une Jonction f bornée sur [a, b] est dite intégrable si i~( f) = I~( f); cette
valeur commune est alors appelée l'intégrale de f sur [a, b] et notée f!f(t)dt.
Évidemment, par définition, une fonction en escalier est intégrable; en revanche, la fonction
X du premier exemple ci-dessus ne l'est pas.
Notons que si f est une fonction bornée et intégrable sur [a, bl, et si cp et 1j., sont deux
fonctions en escalier vérifiant cp ~ f ~ 1j., sur [a, bl, alors, par définition de l'intégrale de f,
nous avons les inégalités
Dans ce paragraphe, comme nous l'avons fait pour les fonctions continues et dérivables, nous
nous intéressons aux propriétés algébriques de la notion d'intégrale, c'est-à-dire aux rapports
entre les propriétés d'espace vectoriel de l'espace des fonctions bornées sur [a, b] et la nouvelle
notion d'intégrale que nous venons de définir. Notons que nous ne parlons pas encore de la
structure d'algèbre naturelle de l'ensemble des fonctions, nous ne discuterons du produit de
deux fonctions, et de son rapport avec l'intégrale, que plus tard.
Pr.opositiÔtÎ ~1.13/ Soient A Ûn réel, f et g de.'11,$ fonctions bomée,s efint'éJ}mbles sur[a., b].
Alors les fonctions f + 9. et J.f sont intégTQ,bles- De plus
PREUVE. Soient f, g deux fonctions bornées et intégrables sur [a, b] et cp, lj.,, p et 8 quatre
fonctions en escalier vérifiant sur [a, b] cp ~ f ~ 1j., et p ~ g ~ 8. En sommant membre à
i
772
membre les inégalités précédentes, nous obtenons cp +p( f +g ( tl> + 0. Par définition des
nombres i~(f + g) et I~(f + g) nous avons
f cp(t)dt + f f(
p(t) = cp(t) + p(t))dt et f tl>(t)dt + f 0(t)dt = f (tl>(t) + 0(t))dt.
Les inégalités ci-dessus deviennent alors
Il en résulte, en fixant pet 0, et en prenant la borne supérieure (resp. inférieure) de tous les
nombres J! cp(t)dt (resp. J!tl>(t)dt), que l'on a les inégalités suivantes
Nous avons ainsi montré que i~(f + g) = I~(f + g) = J! f(t)dt + J! g(t)dt, ce qui établit
l'intégrabilité de f + g et l'identité
f:::;; g si pour tout x de E, f(x) :::;; g(x). La relation ainsi définie sur l'ensemble IF'(E,IR} est
manifestement une relation d'ordre, qui n'est évidemment pas total en général (à moins que E
soit un singleton). Compte tenu des rapports que nous avons établis entre l'intégrale et l'aire
limitée par une fonction et l'axe des abscisses, il est crucial d'établir de manière formelle les
relations entre l'intégrale et cette relation d'ordre, pour les fonctions bornées sur un intervalle.
Proposition 27 .14. Soient À un réel, f et g deux fonctions bornées et intégrables sur {a, b].
Nous avons alors les deux propriétés suivantes :
1) si f est positive sur [a, bt alors J! f{t)dt ~ 0;
2) si f~g sur{a,b], alorsf!t(t)dt ~ f!g{t)dt. t--:
<N
..d
PREUVE. Soit f une fonction positive intégrable sur [a, b]. La fonction nulle est en escalier u
f!
sur [a, b] et nous avons O:::;; f. Donc O,::;; i~(f} = f(t)dt.
Soient f et g deux fonctions intégrables sur [a, b] vérifiant f ,::;; g. En appliquant la propriété
1 à la fonction positive g - f et en tenant compte de l'égalité f!(g(t) - f(t})dt = g(t} -f!
f!f(t}dt, on obtient f!f(t}dt:::;; f! g(t)dt. ■
f
on obtient
~ M(b -
m(b - a},::;; f(t}dt a}.
•
Un critère commode et utile pour prouver l'intégrabilité d'une fonction est donné par la
proposition suivante qui a l'avantage de ne pas faire intervenir les nombres I~(f} et i~(f).
Prp~tîon 27.~6.
Une}onctionf définie. et bornée sur [a,p} e$t intégrable si et seulement sÎJJQU1'tout;r, > 0,
il ~té deux/onctions en e.scalier <() et \11; telles que rp ~ f :$ i,p sur tout {a, bJ et.J!(tl> -
cp)(t)dt < e.
PREUVE, Supposons f intégrable et fixons un réel f. dans IR~. Appliquons à f./2 la propriété
que i!(f} (resp. I~(f)) est une borne supérieure (resp. inférieure). Il existe alors deux fonctions
en escalier <p et 1'> telles que <p ,::;; f :s; 1J> sur [a, b] et
i~(f) - f./2 < rcp(t}dt,::;; i~(f}, I~(f) :s; f 1J>(t)dt < I~(f) + f./2.
En tenant compte de l'égalité i~(f) = I~(f), et en utilisant les inégalités ci-dessus, on peut
conclure que O :s; f!(w(t) - cp(t))dt < f..
114
Prouvons maintenant la réciproque. Pour f. E IR~, soient cp et 1j, les deux fonctions en
escalier données par la propriété de la proposition. Nous avons les inégalités
Comme le nombre positif I~(f) - i~(f) est indépendant de f., il ne peut être que nul. ■
Soit f est une fonction définie sur [a, b]. Pour t dans [a, b], on note f+(t) = max(0, f(t))
et L(t) = min(0, f(t)).
Pr~i~,îi~!,lf•JS<ift f~~tfrJiJêtio"n~Jê.~,i~@ilill~~r
f+' L aôrit é.fJol~l:in~1,l~$; . . . ..
{~.;hl ·.A~~;lèi;tJfJ.~tf~-
.. . . . . . . . . •.
0
PREUVE. Montrons que f+ est intégrable. Soient f. E IR~, cp et 11> deux fonctions en escalier
Comme les fonctions cp+ et 11>+ sont en escalier sur [a, bl, nous avons
Grâce à la proposition 27.16, on peut conclure que f+ est intégrable sur [a, b]. De la même
manière on peut prouver l'intégrabilité de f _. ■
PREUVE. La fonction lfl est la différence de deux fonctions intégrables; donc elle aussi
intégrable. Montrons maintenant l'inégalité. Nous savons que -lfl ~ f :::; lfl. En intégrant
membre à membre ces inégalités, on obtient
Comme nous l'avons annoncé, nous revenons maintenant au problème du produit de fonctions.
Il ne faut bien entendu pas s'attendre à ce que l'intégrale du produit soit le produit des
intégrales. Pour le voir, il suffit de considérer la fonction cp constante et égale à 2 sur [0, 2].
!
,v
~
Alors r/J
Soient cp ', 1j> ', p' et 8' les fonctions définies sur [a, b] par
cp'(t) = max(0, cp(t)), 1j>'(t) = min(M, 1j>(t)), p'(t) = max(0, p(t)), 8'(t) = min(N, 8(t)).
On peut vérifier facilement que ces fonctions sont en escalier sur [a, b] et qu'elles obéissent
aux inégalités 0,:::; cp' ,:::; f,:::; 1'>',:::; M, 0,:::; p',:::; g ,:::; 8',:::; N. En faisant le produit membre à
membre nous obtenons cp'p',:::; fg,:::; 1j>'8'. Les deux fonctions cp'p' et 1j>'8' sont en escalier, il
reste maintenant à majorer J!1'>'(t)8'(t) - cp'(t)p'(t)dt.
De l'identité, 1j>'8' - cp'p' = (1'>' - cp')8' + (8' - p')cp', on deduit que
Puisque, 1'>' - cp' ,:::; 1j>- cp et 8' - p' ,:::; 8- p, en passant à l'intégrale, on obtient l'encadrement
Les inégalités J! 1j>(t) - cp(t)dt < M:N et J! 8(t) - p(t)dt < M:N entraînent alors
b E E
PREUVE. Soient À un réel, et f et g deux fonctions bornées et intégrables sur [a, b]. Comme
la fonction f + Àg est intégrable, son carré (f + Àg) 2 l'est également.
Si P(À) désigne f!(f(t) +Àg(t))2dt, il est égal à
Si J! g(t)2dt = 0, Pest une fonction affine et ne peut donc garder un signe constant que si son
coefficient directeur, soit J!f(t)g(t)dt, est nul; dans ce cas l'inégalité cherchée est triviale,
0 ,( O. Si maintenant, J! g(t)2dt c/ 0, Pest un trinôme du second degré, positif sur lR tout
entier, donc son discriminant Li est négatif. Nous avons donc
Li= 4 (
Lb
f(t)g(t)dt
)2
- 4 L L
b
f 2 (t)dt.
b
g 2 (t)dt ,( O. ■
( L
b
f(t)g(t)dt
)2 = L
b
2
f (t)dt. Lb
2
g (t)dt?
PREUVE. Soit f une fonction monotone sur [a, b]. Quitte à prendre -f, on peut supposer
que f est croissante. Elle est minorée par f(a) et majorée par f(b) sur [a, b]; donc elle est
bornée sur ce segment.
777
Soient E E lR"t- et n EN* tels que (b - a)(f(b) - f(a))/n < E. Posons pour tout entier k
entre 0 et n, Xk = a + k (b-a).
n
Soient cp et 1j, les deux fonctions en escalier sur [a, b] définies
par cp(a) = f(a) et lj,(a) = f(a), cp(t) = f(xk) et lj,(t) = f(xk+il pour tout t E]xk, Xk+il
et tout k = 0, 1 ... , n - 1. Comme f est croissante nous avons cp ~ f ~ lj,. Le nombre
f!(tl>(t) - cp(t))dt est égal à
k=n-l b- a k=n-l b- a
L (xk+l -xk)(f(xk+il -f(xk)) = ~ L (f(xk+il - f(xk)l = ~(f(b) - f(a)).
k~ k~
Le choix (b - a)(f(b) -f(a))/n < E permet d'en conclure que f!(t!>(t) - cp(t))dt < E. Nous
avons ainsi, grâce à la proposition 27.16, établi l'intégrabilité de f. ■
PREUVE. Soit f une fonction continue sur [a, b]. Nous rappelons qu'une telle fonction est
bornée et uniformément continue sur [a, b]. Si nous appliquons cette dernière propriété à
E = 4 (b~al où E est un réel fixé stritement positif, alors il existe TJ E lR"t- tel que si t et t' de
1
L (xk+
~
1 -xk)(f(xd +E 1
- f(xk) +E 1
) = 2E'(b - a)= i·
Nous avons ainsi, toujours grâce à la proposition 27.16, prouvé l'intégrabilité de f. ■
Grâce au théorème précédent on peut affirmer par exemple que tous les polynômes sont
intégrables. Les fractions rationnelles le sont également sur tout segment contenu dans leur
ensemble de définition.
Si on garde à l'esprit l'idée que l'intégrale est une aire (algébrique), l'identité ci-dessus traduit
simplement que l'aire d'une partie est la somme des aires de ses différentes composantes.
On peut se convaincre facilement, en faisant un dessin par exemple, que la relation (*)
est vérifiée par toutes les fonctions en escalier. En revanche pour les fonctions quelconques
intégrables sur [a, bl, sa validité nécessite l'intégrabilité de telles fonctions sur [a, c] et [c, b].
778
ES~1:f~J~~~ÛJ}~tl•~tfr~1:,i:~·.~1
2) pour toute -E [n,bJ, si î .est intigro,ble surfa1 c] et fc,11}, alôr{êlle"lr'esfstkr[t:t,bJ
3). si f est· intégroble su.r [o., b], alors pour tout t>E fa; b.} f .vérifi~ la 'relati()n de, Okasleg
-- : - --, - , - - - - - -_ " - f_ ,, ' ;- ,,_ - - ' - - - -- - -- - ' - - --· - ' - - ~- o- "c- _- -
PREUVE. Prouvons la propriété 1. Soit f bornée et intégrable sur [a, b]. Fixons E E ~~, x
et y dans [a, b] avec x :::::; y. Il existe deux fonctions cp et 1jJ en escalier sur [a, b] vérifiant
cp :::::; f :::::; 1jJ et J!(ljJ(t) - cp(t))dt < t:. Notons cp 1 et 1)> 1 respectivement les restrictions
de cp et 1jJ à [x, y]. Nous avons évidemment sur le segment [x, y], (f)1 :::::; f :::::; 1)>1. Comme
J~(cp 1(t)-1)> 1(t))dt:::::; J!(ljJ(t)- cp(t))dt, on peut en déduire que J~(cp1(t)-1)>1(t))dt < [.
Nous avons ainsi établi l'intégrabilité de f sur [x, y].
Montrons maintenant la propriété 2). Soient c E [a, b] et E E ~~; l'intégrabilité de f sur
[a, c] (resp. [c, bl) entraîne l'existence de deux fonctions (f)1 et 1P1 (resp. (f)2 et 1)> 2) en escalier
sur [a, c] (resp.[c, bl) telles que
Soient cp et 1jJ deux fonctions définies sur [a, b] par cp (t) = cp 1(t) et 1jJ (t) = 1jJ 1 ( t), si t E [a, cl
et cp(t) = cp 2 (t) et ljJ(t) = 1)> 2 (t), si t E]c, b]. Il est facile de voir que cp et 1jJ sont en escalier
sur [a, b] et que
On déduit de la relation ci-dessus que J!(ljJ(t) - cp(t))dt < E, ce qui permet de conclure que
f est intégrable sur [a, b].
Il reste à prouver la relation de Chasles pour c E [a, b] et f intégrable sur ce segment.
Pour E E ~~, il existe deux fonctions cp et 1jJ en escalier sur [a, b] telles que cp :::::; f :::::; 1jJ et
J!(ljJ(t) - cp(t))dt < E. En intégrant sur [a, cl, et sur [c, bl, les inégalités cp :::::; f :::::; 1)>, on
obtient que
Comme les fonctions en escalier vérifient la relation de Chasles, on en déduit alors l'encadre-
ment
r cp(t)dt:::::; f f(t)dt+ r r f(t)dt:::::; ljJ(t)dt. (**)
779
J: f(t)dt + r
f(t)dt = f f(t)dt.
■
[ f(t)dt = - f f(t)dt.
vrai.
Coro.lliûre. i!;û: Sâll f'tl.tAeJondi<>n bornëê éf. întlgfubté S'/J,t fa, bJ. Alors, '[}<>Ur t<>US 'X, y
et .z .élémè'nts ilê [a. bl ntÎus:âoons · . .. . . .. . . . .
Nous abordons maintenant l'étude du second aspect de l'intégrale, que nous allons chercher à
voir comme l'opération réciproque de la dérivation, au moins dans quelques cas particuliers.
En faisant varier la borne de l'intégrale, on obtient une fonction F définie par F(x) = J:
f(t)dt.
Quand f est continue, la fonction Fest une primitive de f, c'est-à-dire qu'elle est solution de
l'équation F' = f.
Dans toute la suite, sauf indication contraire, les intervalles utilisés ne sont pas réduits à
des singletons.
r
PREUVE.
En intégrant membre à membre l'inégalité lfl :::; M sur l'intervalle [x, y], on obtient
Comme nous savons que If~ f(t)dtl :::; f~ lf(t)ldt, on déduit alors l'inégalité
IF(y) - F(x)I:::; M(y -x).
Dans le cas où x ;?! y, en permutant x et y, l'inégalité ci-dessus devient
IF(y) - F(x)I:::; M(x -y).
Nous pouvons conclure que, pour x et y quelconques dans [a, b]
IF(y)- F(x)I:::; Mly-xl. ■
Rappelons qu'une fonction définie sur un intervalle I qui vérifie la propriété de la proposi-
tion 27.25 précédente est dite lipschitzienne sur 1. Une telle fonction est évidemment continue,
mais elle n'est pas toujours dérivable.
781
ÊÎ
r/J
PREUVE. Soit x 0 un point de [a, b[ où f possède une limite à droite, notée l. Si h > 0 est
un réel tel que x 0 + h E [a, b], nous avons, grâce à la relation de Chasles, l'identité
F(xo + h) - F(x 0 ) _ li
h ~ t:.
1
L'inégalité ci-dessus est valable tant que h vérifie O < h < TJ. Nous venons de prouver que l
est la dérivée à droite de F au point Xo. ■
~~lhlit! ~t:.2t. Soîeint eAE :fct~bl et·r1u+tej,,netilm .bornée etinf,f,grnble su,- fn, b]. Pour
xe;[~,blt, qrtpô,9e t(xl"'?kfftldt, .·;?i, . : • •·· .··. . . .• . . . ..· . .· ·.•
Si f ~ t:,ontinuft à ir<Jitefresf}è• ôrg•~ltif!f!t>#tt,~ tle fa, ·bh. alo.t;$ f e.'ît dérivable à droite
(resp: à gauehê) âu PJ}mtx.o iiè dé~ à iJ~ïté(rêsp.. fi!JaVicke)f{x0 ): ··
Le théorème ci-dessus traduit simplement qu'une fonction continue possède au moins une
primitive définie par son intégrale .
Corollaire 27.31.
Soiênt f 1t~··fc~on;œntînue
ffxl = JJfftJ.tt. ·
1) 'lbûtè JirftnfflvitG <lé i~ui-J. 11ê ...
- <;,? ~-
Pour la propriété 2), le seul point à prouver est l'unicité de F. Soit donc G une primitive de
f sur I telle que G(c) = O. D'après la proposition 27.30, il existe un réel C tel que G = F + C.
Nous avons alors G(c) = F(c) + C, c'est-à-dire C = 0; a fonction Gest donc égale à F. ■
PREUVE. Posons f = h'. La fonction h est une primitive de f sur I; donc d'après la propriété
r
1 du corollaire 27.31, nous avons
Notation. Dans ce qui suit, le symbole Jf(t)dt désignera toutes les primitives de la fonction
f, c'est-à-dire que si Fest une primitive particulière de f, alors on peut écrire Jf(t)dt = F+ C,
où C est une constante.
Avec cette notation, l'identité du théorème ci-dessus s'écrit alors Jh' (t) dt = h + C. Elle
fournit les primitives usuelles rassemblées dans le tableau suivant. Le lecteur est invité à
déterminer les intervalles sur lesquels ces primitives sont définies.
fonction primitive
nulle constante
x«+l
t'X, avec ex cf. -1 et+l
1/t ln lxl
sin t -cosx
cost sinx
1
✓ 1-t2
arcsin x
-1
✓ 1-t 2
arccosx
1
î+i2" arctanx
expt expx
cht shx
sh t chx
13\ avec 13 ER~ ~
lnB
Là encore, on a anticipé sur les preuves des propriétés des fonctions usuelles, à la seule fin
de constituer un tableau récapitulatif. On pourra les admettre en première lecture et revenir
à ce tableau après avoir lu le chapitre 28.
784
1) .Sfri ~ D/ à!~ri:t: ê8tune prlmi~tie sur} tl~J #_j· . ·•. ·.· . .·• .• ·•
1
3) Si :f est â, vàleurs dâtW R*, alors tn tfl est une primitifii de f 1/f.
4) Si a. =,f.:.:C1 ~êtf d valetrs dans R!,· alors :;; est mie primitive de f'f« '~ùrI.
r r
Ce qui donne l'identité
Cette simple remarque est très importante dans la pratique : elle permet de séparer le calcul
d'une intégrale en deux parties, l'une étant une simple prise de primitive. Pour l'exploiter,
rappelons la notation
[f(t)]~ = f(y) - f(x)
si f est une fonction. On obtient alors la proposition suivante.
785
I 2
(arccost) dt= t(arccost) 2
I
+ 2 t~
arccos t
2
1 -t
dt.
I V
t
~
1 - l-
arccos tdt = - yr;--;;
1 - t 2 arccos t - I~
~ d t = - yr;--:;
V] - t 2
1 - t 2 arccos t - t + C'.
On trouve enfin
r r
PREUVE. Soit Fest une primitive de f sur I. Nous avons
f(cp(s))cp'(s)ds = F'(cp(s))cp'(s)ds
Comme la fonction F'( cp )cp' n'est que la dérivée de F o cp, on déduit alors
f3 dt 1
J ex k 2 +t 2 = k(arctan(/3/k)-arctan(cx/k)).
Le lemme suivant montre, dans le cas où f est une fonction en escalier, que cette somme
a pour limite l'intégrale 'de f sur [a, bl, quand le pas de la subdivision tend vers O.
PREUVE. Soient f E JR~ et ME JR~ tels que lfl :::;; M. On choisit une subdivision (ah)o,:;h,:;p
de [a, b] adaptée à la fonction f. Soit maintenant X = (xk)o,:;k,:;n une subdivision de [a, b]
dont le pas est strictement plus petit que celui de ( ah)O,:;h,:;p• Notons K l'ensemble des entiers
788
k=n-1
S(X,E,,f) = .L, (xk+1-xk)f(E,kl-
X
k=O
0
Ce nombre est la somme des aires des rec- a b
tangles de côtés les [xk, Xk+1l et de longueurs
FIGURE 27.6. Une famille de
(algébriques) f (E,kl- Ces rectangles ne sont rectangles
k entre O et n - 1 tel que [xk, Xk+1l soit inclus dans un certain ]ah, ah+l [. Si E, = (E,k)O,(k,(n
est une suite finie associée à X, posons
kEK kEK'
Comme le cardinal de K' ne dépasse pas p+ 1, nous avons lu'I :S b(X)M(p+ 1 ). Or S(X, E,, f) =
cr+ u', donc IS(X, E,, f) - cri :S b(X)M(p + 1). En imposant à X la condition b(X) < ZM(~+ll'
nous avons
IS(X, E,, f) - cri < c/2. (*)
Si k E K, la fonction f est constante sur [xk, Xk+1l de valeur f(E,k)- Dans le cas où k E K',
l'intervalle [xk, xk+ 1l contient un unique point de la subdivision ( ah)O,(h,(p· En ajoutant ces
éventuels points à (xk)o'(k,(n, on obtient une nouvelle subdivision (yj)O'(j,(q adaptée à f. Le
calcul de l'intégrale de f, à l'aide de cette subdivision, entraîne l'inégalité
En utilisant l'inégalité triangulaire, et les relations (*) et (**), on peut conclure que
pour toute subdivision X vérifiant b(X) < min(A, Z(p:l)M), où A est le pas de (ah)O'(h'(p· ■
Thêorème "21:43. Sint i une ]orit:tÎ<Jn fiornêë êt}ntëgfâlile"$Ur [O:, &t Âl<>rs jJÔÙr ii>ût e É
itt, . j t ~ ll i5.~;• t~kque.~x e,{.,n~~~ ~~:~ iqf,l>lc~~H{Nl ,<ti,:JJlflrBPPJJ,r
totJtl.âss~.r1.â'/1sfN.l:ntJ!.fîtJâtf~:fz:t•·''"···.')~•,.:·:}}···X,.••·· •. c···· . •.";.• . ??>:?.:~}.'.
PREUVE. Soit f une fonction bornée et intégrable sur [a, b]. Pour une telle fonction, étant
donné E E JR~, il existe deux fonctions en escalier cp et 1j, vérifiant
Le lemme précédent appliqué pour E/2 aux fonctions cp et 1jJ entraîne l'existence de 11 E lî~
et 11' E lî~ tels que si X est une subdivision de [u, b] vérifiant ô(X) < 11 et ô(X) < 11', alors
f!
IS(X, E,, cp) - cp(t)dtl < E/2 et IS(X, E,, 1jJ) - f!
1\J(t)dtl < E/2 pour tout E, associé à X.
r r r
Nous déduisons de cp ( f ( 1jJ les inégalités suivantes :
cp(t)dt ( f(t)dt:::; 1\J(t)dt (*) et S(X, E,, cp) ( S(X, E,, f) ( S(X, E,, 1jJ ). (**)
Comme
r cp(t)dt - E/2 < S(X, E,, cp) et S(X, E,, 1jJ) < r 1\J(t)dt + E/2,
r r
de (**) nous déduisons la double inégalité
r r r
En faisant la différence membre à membre de (*) et des inégalités ci-dessus, nous obtenons
(cp(t) -1\J(t))dt- E/2 < S(X, E,, f) - f(t)dt < (1\J(t)- cp(t))dt + E/2.
Cette dernière inégalité est vérifiée pour toute subdivision X telle ô(X) < 11" où 11"
min(11, 11'). Nous avons ainsi établi le théorème. ■
Pour un entier naturel non nul n, on note Xk =a+ k (b~al quand k = 0, 1, • • • , n. Le pas
de la subdivision (xk)o,s;k,s;n est égal à (b - u)/n et il tend vers O quand n tend vers l'infini.
En utilisant cette subdivision dans le théorème précédent, on obtient le corollaire ci-après.
Corollaire 27.44. Si f est une fonction born6! et intégrable sur [a, b], alors
Un = n
1(
] +1]/n + ] +12/n + ... + 1 + 1n/n ) .
Si pour t E [O, 1], on pose f(t) = :t'
1 alors le terme Un vérifie
1 (k)
Un=-.[_f
k=n
- .
n n
k=l
On reconnaît donc la somme de Riemann de la fonction f sur le segment [O, 1]. On peut
affirmer que la suite (un)n::>1 est convergente de limite f~ f(t)dt, c'est-à-dire ln 2.
790
1
Vn = - ,V(n + 1)(n + 2) · · · (2n).
n
En factorisant par n, le terme Vn devient
(1)
1 k=n (
Un=-.L,ln l + n .
k)
n k=l
La suite (unln>l est bien la somme de Riemann de la fonction ln(l + t) sur [O, 1]. Elle est
donc convergerrte de limite J~ ln(l + t)dt. À l'aide d'une intégration par parties, on obtient
J~ ln(l + t)dt = 2ln2- l.
Nous avons ainsi prouvé que la suite (vnln:::i est convergente, de limite e21 n 2- 1 = 4/e.
pour ex> 1. Posons, pour tout t E [O,n], f(t) = ln(l - 2excost + ex2). La fonction f est
définie et continue sur [O, n] ; donc elle est intégrable. Si n E N*, notons
k=n-1
Sn=~ .L, k~).
f (
k=O
En utilisant l'identité ln xy = ln x + ln y, on obtient
Sim et M sont respectivement les bornes inférieure et supérieure de f sur [a, bl, nous avons
alors, pour toute subdivision X, les inégalités
s(X, f) ::,; (b - a)M , (b - a)m::,; S(X, f).
Désignons par s!(f) (resp. S!(f)) la borne supérieure (resp. inférieure) de toutes les sommes
s(X, f) (resp. S(X, f)) quand X décrit toutes les subdivisions de [a, b); l'existence de telles
bornes est assurée par les inégalités ci-dessus. Nous rassemblons dans la proposition suivante
quelques propriétés utiles de s!(f) et S!(f).
Pl'oposition .2.7.48. Soient f .êt g deuxfonctiâns bornées sur [u,bJ. Nous avons les pro-
priétés .suivantes :
1} s:m~ i!(f} ~ 1~tois; s:ch,
2). si f estpofti,ti~e 11ur {ti?bl,,ator,., s!(f}~ 0;
3) si f::,; g sur la. b], alors s!(f} ~ s!(g) et S!{fl~ S!(1:d;
~)Qi:fëst'~{isCl!liet8Udil,b],, âii>r~·s:(f)::;; S~(f) t:# Jf f(t}d'.1;.
Le théorème essentiel est maintenant le suivant.
Théo:r~me.'/,7.49. Soit.f·t,itle]ont.tîon bornée tJut{a1 bJ. tvok avons alors l'éqti,ivalen.ce,
(;Sfintégrable stJrJo., b] si etseuleineut id&c!ff) = s:fü. Danscé. cas ce nombre est l'intégrale
.fde'J sut {a, b]. · ·· · ·· ··· · · · · · ·
1
2) Cas des fonctions rationnelles de première espèce. Une primitive de t H ( ) , quand
t-a n
n =fa 1, est
(1 - n)(t- a)n-T'
alors que la fonction
t H ln lt- al,
1
est une primitive de t H --.
t-a
3) Déterminons maintenant une primitive d'une fraction rationnelle de seconde espèce, de la
forme t H cxt + l3
(tl+bt+c)n· Nousavons l'"d fl'
1 en1e
(t 2 + bt+ c)n
Il suffit donc de savoir calculer cette dernière primitive. Ceci peut se faire par récurrence.
Posons pour n E N*
I
n-
-J (s2
ds
+ l)n
nous avons I 1 = arctan s + C et une intégration par parties montre que pour tout n ~ 2
s
(2n-2)In= (sZ+lJn-l +(2n-3)In-l•
Cette relation permet d'exprimer la primitive cherchée dans tous les cas pratiques, lorsque n
n'est pas trop grand.
Dans toute la suite la fonction F désigne, sauf indication contraire, une fonction rationnelle
ou polynomiale à deux variables, à valeurs réelles.
I(
2
I F(cost,sint)dt= 1- s 2s )
F - - -2 , -- 2
- - - ds.
1 +s 1 +s 2 l+s 2
794
On se ramène ainsi au calcul d'une primitive de fonction rationnelle, qu'il s'agit d'expliciter
dans chaque cas particulier. Là encore, on prendra garde à revenir aux variables initiales au
moyen du changement de variable inverse.
Distinguons maintenant trois cas particuliers, pour lesquels le calcul est beaucoup plus
simple que dans le cas général précédent.
i) Si F( cos t, sin t) = G(cos t) sin t, où G désigne une fraction rationnelle d'une variable, on
utilise le changement de variable s = cos t qui conduit à
JF(cost,sint)dt = JG(s)ds.
On reconnaît ce cas en essayant le changement de variable t H n - t, qui doit transformer la
fonction rationnelle initale en son opposée.
iii) Si F( cos t, sin t) = G (tant), on utilise s =tant qui donne
G(s)
JF(cost,sin t)dt = J 1 + 52 ds.
On reconnaît ce cas en essayant le changement de variable t H n + t, qui doit laisser la
fonction rationnelle initale invariante.
Dans le cas où F est un polynôme à deux variables, la détermination d'une primitive se
ramène à celle de la fonction cosP t sin q t où p et q sont des entiers naturels. Nous distinguons
trois cas.
i) Si p et q sont pairs, on linéarisera l'expression en utilisant les formules d'Euler.
. 4 2 -(eu-e-u)4(eit+e-it)2
sm t cos t - i ,
2 2
d'où
sin4 t cos2 t = ~ ( e6it - 2e4it - e2it + 4 - e-2u - 2e-4it + e-6it) '
ou encore
. 1
sm4 tcos 2 t = (cos(6t) - 2cos(4t) - cos(2t) + 2).
32
Nous avons donc
I( F t,
n at+b)
- - d dt =n(ad- be)
et+
I (dsn-b )
F - - - , s ( sn~l )2 ds.
a - esn a - esn
.. .
En ut1hsant le changement de vanable s = 2a (t + b)
#Ï Za , nous obtenons
avec G une fonction rationnelle de deux variables à valeurs réelle et <X = ~. Suivant les signes
de a et de .0., on se ramène au calcul de l'une des trois primitives
Cette courte section est esssentiellement d'un intérêt théorique, c'est sur elle que seront fondées
les définitions des fonctions trigonométriques que nous verrons au chapitre suivant.
2
Définition 27.51. Un arc plan est une application d'un segment [a, b] dans JR . La donnée
2 les Jonctions Yx
d'un arc y : [a, b] -, JR est équivalente à celle de ses deux composantes,
etyy de [a,b] danslR telles quey(t) = (yx(t),Yy(t)) pourt E [a,b]. On dit que y est de
1
classe C sur [a, b] si ses deux composantes le sont. Une courbe plane est l'image d'un arc
plan.
Le nombre de pas le long d'un sentier sinueux mesure avec une certaine erreur sa longueur.
La formalisation de ce fait empirique revient à considérer la longueur des lignes polygonales
dont les sommets se trouvent sur la courbe à étudier. G. Peano définit la longueur d'une
courbe comme la borne supérieure des longueurs de toutes ces lignes polygonales associées.
Plus précisément, soit y un arc défini sur [a, b]. Notons I: l'ensemble des subdivisions de
[a, b]. Pour cr = (t 0 , ••• , tnl E I:, on note P cr la ligne polygonale associée à y et cr, c'est-à-dire
la réunion des segments [y( tk), y( tk+ 1 )] pour O :::; k :::; n - 1
Po-= u
o:;;k:;;n-1
[y(tk),y(tk+iJJ.
On désigne par l(P cr) la longueur de P cr, c'est-à-dire la somme des longueurs des segments qui
la constituent
n-1
l(P) = Llly(tk+ll -y(tklll,
k=O
y(a)
On note l(y) la borne supérieure de l'ensemble de tous les l(P crl quand cr décrit l'ensemble
des subdivisions de [a, bl, soit
Définition 27.52. Un arc y est dit rectifiable si l(y) est fini. Dans ce cas le réel l(y) est
appelé la longueur de l'arc y.
1
Nous allons considérer dans cette partie des arcs de classe C •
798
PREUVE. Nous allons identifier JR 2 à <C de manière habituelle, le couple (u, v) E JR 2 étant
considéré comme égal au complexe u + iv. Dans cette identification, lu+ ivl = Il (u, v) Il- Soit
y: [a, b] --t JR 2 un arc de classe ci. Notons Yx, Yy ses composantes. On va donc considérer y
comme une fonction à valeurs dans <C en posant y(t) = Yx(t) + iyy(t). Comme la fonction y
est supposée de classe ci, ses composantes ont des dérivées continues, donc elles sont bornées
sur [a, bl, on peut définir
Soit CY = (tk)O(k(n E I:, et soit P cr la ligne polygonale associée. Utilisons l'inégalité des
accroissements finis (voir chapitre 26, III.2) pour écrire pour tout k entre O et n - 1
En conséquence, l'ensemble {l(Pcr) 1 CY E I:} est majoré par M(b- a), donc l(y)::;; M(b- al,
ce qui prouve que y est rectifiable. ■
Théorème. 21.54. Soit y un f!f'C ile.cJasse C1 S'lirta,bl, Alors sa longueur est ilonnre par
l'intégrale ·
l[y) =rhii(tJfdt.·
PREUVE. Il faut d'abord justifier que l'intégrale est bien définie. Les fonctions t H y~(t) et
t H y~(t) sont continues, donc la fonction t H ly'(t)I est continue par composition, elle est
donc intégrable sur [a, b].
Nous allons admettre provisoirement un résultat intermédiaire, que nous montrerons après
cette preuve.
Lemme 27.55. Pour toute> 0, ·il, wteœ> 0 tel (J'Uè si{s,t} E fa;b} 2 vérifiels-tl < œ,
alors
Fixons E > O. Considérons une subdivision CY = (tk)O(k(n E I:, de pas inférieur à ex.. Alors
d'après le lemme et l'inégalité triangulaire dans <C
(1)
D'autre part, comme la fonction t H ly'(t)I est continue sur [a, bl, elle est uniformément
continue. On peut alors supposer que ex. est assez petit pour que pour tout k E {O, ... , n - l}
Il en résulte que
(2)
799
(3)
Il suffit maintenant de choisir une subdivision cr de pas < <X telle que
VIII. EXERCICES
27.1. positive sur [u, b], on note,
27.4.
27.7.
Soient f une fonction continue sur [a, b] et 1j.,
une fonction convexe de lR dans JR. Montrer Soient À un réel et f une fonction intégrable sur
l'inégalité, le segment [a, b]. On pose,
I(a2 ) 1
I(a) = - - et I(a)-1( ) = 2nlnlal.
In= J: f(t)I sin(nt)ldt.
2 0 Montrer que
2. Pour lai< 1 montrer que II(a)I S 2nln(l +
a). En déduire I(a) pour lai< 1. lim In= -2 Jb f(t)dt.
n->+oo 7t a
3. Déterminer la valeur de I(a) pour lai> 1.
27.6. 27.9.
Soit f une fonction dérivable, strictement crois- Soit f une fonction continue et positive sur
sante et surjective de JR+ dans lui-même. [a, b]. Si M est sa borne supérieure sur [a, bl,
1. Si g est la fonction réciproque de f, montrer montrer que,
que pour tout x E JR+, on a l'inégalité,
Jf(x)
I
X
xf(x) = f(t)dt + g(s)ds.
0 0
Chapitre 28
RETOUR SUR LES FONCTIONS
.,. .,.
ELEMENTAIRES
Mais il existe encore d'autres mameres naturelles de construire des fonctions à partir
d'autres fonctions : on peut aussi considérer leurs primitives, par exemple lorsqu'elles sont
continues. On peut montrer en effet qu'il existe alors des fonctions algébriques (continues)
très simples dont les primitives ne sont plus algébriques mais transcendantes. L'exemple le
plus fameux et le plus simple est celui de la fonction algébrique rationnelle x H 1/x dont une
primitive conduit à une fonction transcendante : le logarithme néperien. Les primitives de la
fonction algébrique rationnelle x H l~x2 ou de la fonction algébrique irrationnelle x H vl~x2
conduisent aussi respectivement aux fonctions transcendantes x H arctan x et x H arcsin x.
Ces derniers exemples incitent tout naturellement à mentionner encore une extension natu-
relle des fonctions, qui consiste à prendre les bijections réciproques de bijections déjà connues.
Notons en particulier que dans le cas des fonctions algébriques l'introduction de radicaux re-
lève déjà de cette idée, puisque par exemple la fonction x H y'x est la bijection inverse de la
fonction x H x 2 (ces fonctions étant vues comme définies et à valeurs dans~+). Par exemple,
l'introduction de la bijection inverse du logarithme déjà mentionné conduit à l'exponentielle,
et l'inversion des fonctions x H arctan x et x H arcsin x donne lieu aux fonctions x H tan x et
x H sin x. Ces dernières sont cependant traditionnellement définies « directement », les fonc-
tions x H arctan x et x H arcsin x étant alors définies comme leurs réciproques respectives
sur des intervalles convenables. Nous allons néanmoins ici introduire les fonctions trigonomé-
triques à partir de l'inverse de la fonction cos, en insistant sur les relations entre cette méthode
et la définition des lignes trigonométriques à partir de la longueur des arcs du cercle unité.
Cette étude reposera donc en grande partie sur le calcul des longueurs d'arcs plans, tel qu'il
a été introduit à la fin du chapitre précédent.
Enfin, certaines fonctions élémentaires peuvent être vues comme les solutions de certaines
équations. Par exemple, la bijection réciproque d'une bijection f est bien, par nature, définie
comme l'unique solution de l'équation f o g = go f = Id. À ces équations fonctionnelles s'en
ajoutent d'autres, très importantes, les équations différentielles. Nous verrons comment ces
idées permettent de donner d'autres présentations des fonctions exp et ln.
Dans ce qui suit, nous allons survoler toutes ces techniques pour construire les fonctions
élémentaires et les montrer sous divers aspects. Nous introduirons de manière complètement
formalisée les fonctions ln et exp, puis les fonctions hyperboliques et leurs inverses, qui ne né-
cessitent que la connaissance de l'exponentielle. Puis nous consacrerons une longue étude aux
fonctions trigonométriques, et nous reviendrons ensuite sur quelques équations fonctionnelles
et différentielles donnant lieu de nouveau par exemple à la fonction exponentielle.
I. LOGARITHMES ET EXPONENTIELLES
Dans cette partie, nous allons donner diverses présentations des fonctions exponentielles et
logarithmes, directement basées sur les propriétés de la droite réelle.
La première d'entre elles, pour la fonction exp, est inspirée de celle que donne L. Euler dans
son Introductio in analysin infinitorum. C'est certainement la plus naturelle : elle est basée,
comme nous l'annonçions dans l'introduction, sur l'étude préliminaire de fonctions simples,
les fonctions de la forme n H un, où a est un réel positif, définies sur l'ensemble des entiers
relatifs. Il s'agira ensuite d'étendre le domaine de définition de ces fonctions à toute la droite
réelle, ce qui se fait en deux étapes : la première, algébrique, consiste à définir ces fonctions
sur (Q), la seconde, analytique, consiste à prolonger par continuité les fonctions ainsi obtenues à
la droite réelle. Cette dernière étape utilise la densité de (Q) dans ~ et la complétude de ~ ; elle
peut donc être considérée comme complètement rigoureuse, après notre étude des chapitres
803
21 et 22. Nous verrons ensuite comment le nombre e se distingue dans ce cadre d'un réel a
ordinaire, donnant lieu à l'exponentielle usuelle.
Une autre approche, elle aussi pleinement satisfaisante du point de vue de la rigueur,
consiste à définir d'abord le logarithme comme la primitive sur JR~, nulle en 1, de la fonction
continue x H 1/x. Notre étude des fonctions continues permettra ensuite de montrer que
cette fonction est une bijection de JR~ sur lR ; et il est donc possible de définir la fonction
exponentielle (de base e) comme sa bijection réciproque.
Euler définit ensuite ce qu'il entend par là, car en dehors des exposants entiers les choses
ne sont pas claires. Il commence donc justement par le cas où z est un entier positif, ce qui
donne successivement
Suivons toujours Euler, en épargnant le latin au lecteur ; il envisage après cela le cas des
entiers négatifs -1, -2, -3, -4, ... pour lesquels les valeurs de la fonction présentée seront
804
successivement
fIl)
Nous allons donner un sens rigoureux à cette présentation de la fonction x H ux due à Euler.
Notre étude va reposer sur la présentation des fonctions puissances d'exposant rationnel,
présentée au chapitre 25, partie 111.3. Le lemme suivant nous sera utile pour la suite.
Leminê 2sà~ Soif~ ê R. ?iéf'î]Îânt ci~ 1; êt sôifi ê,ttt:::"'ôn>ll Ïei priipfîêtls iùî~ri.Eiis :· ,
r
_ _ -:' a ' ', _ ' ~' _ ,_, ,- ' , _ -C , ,,, ,, , ',, c'a'~, - , _ ' a ,-, -, ,
PREUVE.
o Le réel a étant > 1, la fonction rH ur est strictement croissante sur (Ql, puisque si s > r
as
-ar = as-r > 1,
par construction de la fonction Ps;r (voir chapitre 25, partie III.3). Pour x E JR, notons
L'ensemble Rx est non vide, car il existe bien des rationnels inférieurs à x; il est majoré, car
il existe aussi des rationnels supérieurs à x et si s est un tel rationnel, Rx est majoré par as
puisque r H ar est croissante sur (Ql. Ainsi, on peut définir sup Rx, et sup Rx ~ as. Pour
des raisons analogues on peut définir inf Sx et par définition des bornes sup et inf, on vérifie
facilement que
805
◊ Six est un réel quelconque et si (rnlnEN est une suite croissante de rationnels convergeant
vers le réel x, alors la suite croissante ( uTn lnEN converge vers le réel sup Rx. En effet, la suite r/)
V
( u Tn lnEN est clairement croissante et majorée, donc elle converge et sa limite, notée l, vérifie
l :( sup Rx. Si on avait l < sup Rx, par définition d'une borne supérieure, il existerait un
rationnel r :( x tel quel< uT. Mais alors, pour tout entier naturel n, on aurait uTn :( l < uT
et donc Tn < r :( x, ce qui contredirait le fait que limn-Hoo Tn = X. De la même manière, on
1
•V
:V
r/)
a la propriété correspondante sur la borne inférieure, ce qui achève la preuve du point 2).
◊ Soient donc (rnlnEN une suite croissante de rationnels convergeant vers le réel x et (snlnEN
une suite décroissante de rationnels convergeant vers le réel x. On a alors, pour tout n E N
1
.8
r/)
~
3
r/)
Nous allons montrer que les deux suites ( u Tn) nEN et ( u sn) nEN convergent vers la même limite, 3
ce qui prouvera l'égalité des nombres sup Rx et inf Sx. On a en effet .B
&!
cxi
C"I
donc, comme la suite ( uTn lnEN converge et est donc en particulier bornée, il s'agit de prouver ..d
ü
que
lim USn-Tn - 1 = o.
n---++oo
Or, la suite (sn -rnlnEN converge vers O (en décroissant), donc pour NE N* fixé, il existe un
entier no E N*, tel que sin ~ no, alors O :( Sn-r n :( 1/N. Par suite, 0 :( u sn -Tn - 1 :( u l/N _ 1.
Or, d'après la formule du binôme de Newton, si ex> 0, on a
l+cx::;(1+~r,
d'où, en passant à la racine N-ième (qui est une fonction croissante)
(X
(1 + cx)l/N :( 1+ N.
Appliquant cela à ex= u - 1, on obtient donc que u l/N :( 1+ aNl, et donc en définitive que
Ceci étant, on peut énoncer le théorème principal, que nous allons complètement montrer,
et qui fonde l'existence des fonctions exponentielles sur les propriétés de la droite réelle.
Théorème 28.2. Soit u > 1. Il existe une unique fonction f strictement croissante prolon-
geant la fonètion Q -t R, r H or, à R tout entier. Elle est à valeurs dans R~, et est définie
pourx;eJl~ par
PREUVE.
o Unicité
Si f est un prolongement strictement croissant de la fonction Q-----, JR, rH ur, à lR tout entier,
alors par définition des bornes sup et inf et avec les notations de la preuve précédente
pour x E lR donné (le vérifier soigneusement) et donc les deux membres extrêmes de cet
encadrement étant égaux d'après le lemme précédent, il en résulte qu'ils sont égaux à f(x).
◊ Existence
Posons, pour x E lR
f(x) = sup Rx = inf Sx,
La fonction f ainsi définie prolonge la fonction rH ur à lR. En effet, six E Q, l'ensemble Rx
possède un plus grand élément, qui est ux, et donc f(x) = ux. Cette fonction f est de plus
strictement croissante. En effet, si (x, y) E JR 2 , avec x < y, alors, par densité de Q dans JR,
il existe des rationnels s, s' tels que x < s < s' < y. Pour tout rationnel r ::::; x, ur < as
donc f(x)::::; as. Mais aussi as' ::::; f(y) puisque s' < y, et donc f(x)::::; as< as' ::::; f(y), donc
f(x) < f(y).
◊ Équation fonctionnelle
Il nous reste à vérifier l'équation fonctionnelle satisfaite par la fonction f. On sait que, pour
tous rationnels r et s, on a ur+s = urus. Si maintenant x et y sont des réels quelconques,
soient (r nlnEN et (snlnEN des suites croissantes de rationnels convergeant respectivement vers
x et y. Alors (r n + snlnEN est une suite croissante de limite x + y et, puisque pour tout entier
naturel n, on a urn+sn = arnasn, en passant à la limite et en utilisant la propriété 3) du
lemme précédent, nous obtenons que
donc l'existence est montrée dans le théorème précédent, est appelée la fonction exponentielle
de base a.
PREUVE. Montrons d'abord la continuité en O. Il s'agit de voir que pour toute suite (xnlnEN
de réels, de limite 0, on a axn -----, 1 quand n-----, +oo, ce qui se fait exactement comme la fin de
la preuve du lemme 30.1. Il est ensuite facile de voir que la propriété fonctionnelle 28.2 assure
la continuité en tout point, dès lors que la continuité en O est vraie. On laisse les détails au
lecteur. ■
807
La relation entre une suite géométrique de raison a et la suite arithmétique de ses exposants
aoala2a3a4 ...
l l l l l···
01 234-··
est déjà connue d'Archimède. Elle est redécouverte par Chuquet dans son Triparty en 1484
puis complétée par Stifel en 1544 et conduit à la notion de logarithme. Ces mathématiciens
remarquèrent, en effet, que si on multiplie deux éléments de la suite géométrique, on obtient
l'élément dont l'exposant est la somme des exposants des termes dont on a fait le produit.
Galilée aussi s'intéressa à cette correspondance qui montre (bien que ce ne soit pas le moyen le
plus simple), en prenant a entier naturel, que l'on peut avoir deux sous-ensembles (infinis) de
N dont l'un est strictement contenu dans l'autre (sur le diagramme ci-dessus, celui représenté
par la première ligne dans celui représenté par la seconde ligne), et qui pourtant sont en
bijection.
C'est l'écossais John Napier, dit Neper, qui construisit en 1614 la première table de loga-
rithmes et considéra véritablement le logarithme dans le cas d'une variable continue et pas
seulement entière.
Revenons une nouvelle fois à L. Euler et à son Intmductio. Après avoir défini la fonction
z H aZ, (a> 0, a=/= 1) il continue dans le même chapitre à s'intéresser à l'équation en z,
az = y, y > 0 donné, et définit le logarithme de base a de y, qu'il note ly, comme étant
l'unique z vérifiant az = y. Qu'un tel z, s'il existe, soit unique, est évident en vertu de la
stricte croissance de l'exponentielle. En revanche son existence est basée sur la continuité de
la fonction exponentielle, notion qui n'est pas encore bien définie à l'époque d'Euler 1 . Nous
donnerons en exercice une construction rigoureuse du logarithme de base a dans le même
esprit que la construction de l'exponentielle de base a que nous venons d'exposer.
1
D'ailleurs, pour Euler, une fonction continue est une fonction définie par une seule formule et ne correspond
pas à ce que nous appelons aujourd'hui une fonction continue. Par exemple, pour Euler, la fonction définie
par
f(x) = 0 six,,; 0 et f(x) = x six> 0
n'est pas une fonction continue alors que, bien sûr, elle l'est pour nous.
808
comme l'unique solution z de l'équation uz = 1J, autrement dit en langage moderne comme la
bijection réciproque de la fonction exponentielle de base a.
Dans ce qui suit, nous allons voir une autre idée extrêmement importante et fructueuse, qui
nous permettra de définir d'abord le logarithme puis, au moyen de sa réciproque, la fonction
exponentielle.
Cette nouvelle idée 2 consistera à définir une nouvelle fonction comme primitive d'une
fonction connue. Notre remarque de départ est que dans les fonctions puissance x H x"', une
seule ne possède pas de primitive issue de la même famille, à savoir celle qui correspond à
l'exposant -1,
1
I : JO, +ooh lR, X H I(x) = -.
X
Ce fait est suffisamment singulier pour que l'on s'y intéresse. Il s'avère être d'une importance
cruciale comme nous le verrons plus tard dans l'étude des fonctions de variable complexe, et
en particulier dans ce que l'on appelle le calcul des résidus (cours de L3). Mais, pour l'instant,
nous savons déjà, par la théorie développée lors du chapitre précédent, que la fonction I,
puisqu'elle est continue, admet une primitive sur l'intervalle JO, +oo[ et que deux primitives
de cette fonction diffèrent d'une constante. Cela conduit à la définition suivante.
Définition 28.5. La fonction logarithme néperien est définie comme l'unique primitive sur
]0,+oo[ de la fonction x H 1/x s'annulant en x = 1. On la notera ln. Ainsi, pour tout
x E ]O, +oo[, le logarithme néperien est défini par l'expression
x dt
ln(x)=
J
1
-.
t
Évidemment, par définition même, la fonction logarithme néperien est dérivable et même
de classe C 1 , a fortiori continue et on a
1
ln 1 = 0 et Vx E ]O, +oo[, ln'(x) = -.
X
En particulier la fonction ln est donc strictement croissante, négative sur JO, 1 [ et positive
sur ]1, +oo[. Nous allons maintenant donner la propriété fonctionnelle fondamentale du loga-
rithme, à savoir qu'il« envoie produit sur somme», en d'autres termes que c'est un morphisme
du groupe multiplicatif (lR"t-, x) sur le groupe additif (JR, +).
PREUVE.
1) Montrons d'abord que pour x > 0, ln(l /x) = - ln(x). En faisant le changement de variable
u = 1/t dans l'intégrale définissant ln(l/x), nous obtenons
2
Idée que nous allons revoir plusieurs fois à l'œuvre au cours de ce chapitre.
J
809
ln(xy) =
xy dt
J
, t
- =
Jx
1/y
ydu
-
yu
=
Jx
1/y
du
- =lnx-ln(l/y) =lnx+lny,
u
l'avant-dernière égalité résultant de la relation de Chasles pour les intégrales, et la dernière
1
,Q)
~
rJJ
■
du point 1).
En effet, puisque ln 1 = 0 et ln est strictement croissante, on a par exemple ln2 > O. Soit
l&
A > 0 quelconque ; comme IR. est archimédien, il existe n E N tel que n ln 2 > A. Or, par la cxi
C'I
propriété fonctionnelle, n ln 2 = ln 2n, donc, puisque ln est strictement croissante, pour tout .d
x > 2n, on a ln x > ln 2n > A. On a ainsi prouvé que ü
VA E JO, +oo[, :3B E JO, +oo[ (B = 2n) tel que si x > B, alors ln x > A,
ce qui est la définition même du fait que limx-Hoo ln x = +oo. Maintenant, puisque ln(l /x) =
- ln x, il en résulte immédiatement que limx-,o+ ln x = -oo.
Résumons nos résultats dans le théorème fondamental suivant.
'rhêo~. . - 28!T/ l,5 JJtù:ti~ togo,ri~e ~péritn ·ést ·.· rtti· :01 .-diff~~'flJ~t~ ~rîcte--
me~t croiMant de JO, +oo[ sur R: En outre, c'est un isomorphisme du groupe mûltiplicatif
(16, +oo{; .f;urie groupe additif fR, +). · · · ·· · ·
En particulier, il existe un unique réel strictement positif en lequel la fonction ln prend la
valeur 1. Cela conduit à la définition suivante.
Définition 28.8. On note e l'unique réel strictement positif vérifiant ln e = 1. Ce nombre
est appelé nombre de Neper. Une valeur approchée en est 2, 7182818284590 · · ·
donc la fonction q, est positive et décroissante sur l'intervalle [e, +oo[ et donc a une limite
l E IR. lorsque x tend vers +oo. En particulier, la suite de terme général est Un = q,( en), doit
donc tendre vers l quand n--, +oo. Or, q,(en) = n/en, donc la suite (unlnEN converge vers 0
comme on le voit facilement puisque le quotient Un+ if un tend vers 1/ e < 1 (par comparaison
à une suite géométrique). Par unicité de la limite, il en résulte que l = O.
810
1
ln(l) = 0 ln' lxl = -, x E JR*
X
lim log x = +oo lim log x = -oo
X----)+oo x-...+O+
Comme nous disposons maintenant de plus des notations de Landau, nous pouvons les
utiliser pour faire une mise au point. Introduisons la relation d'ordre lexicographique sur JR 2
définie par
[(ex, f3) ::s (ex', f3')] si et seulement si [ex< ex' ou (ex= ex' et f3::::; f3')]
avec la convention (ex, f3) -< (ex', f3 ') si et seulement si ( ex, f3) ::s (ex', f3 ') et ( ex, f3) =1- (ex', f3 ').
On introduit aussi la relation d'ordre lexicographique sur JR 3 définie par
[( ex, f3, y) ::s (ex', f3 ', y')] si et seulement si [ex < ex' ou (ex = ex' et ( f3, y) ::s (f3 ',y'))]
j
avec la même convention. Ceci nous permet de donner un tableau récapitulatif, qu'il ne s'agit
pas de mémoriser ainsi, mais de pratiquer couramment.
Pour tous réels l3 > 0,y et 13' > 0,y', et pour x > 0
Les autres cas de figure s'en déduisent facilement par changement de variables. On renvoie au
chapitre 4 pour les autres résultats sur les fonctions exp et ln, que nous pouvons considérer
comme acquis, leurs preuves étant élémentaires.
t H lnt
Définition 28.12. Soit a un réel strictement positif, a =I= 1. On définit la fonction exponen-
tielle de base a comme la bijection réciproque de la fonction logarithme de base a. Notons-la
temporairement expa.
Pour a réel strictement positif différent de 1 donné, il est immédiat que la fonction lo-
garithme de base a a la même propriété fonctionnelle que le logarithme néperien. Pour tout
(x,y) E]0,+00(2, on a donc
loga(xy) = loga x + loga y.
Il en résulte que la fonction exponentielle de base a a aussi la même propriété fonctionnelle que
la fonction exponentielle « ordinaire », définie dans le paragraphe précédent comme fonction
réciproque du logarithme néperien, et qui n'est autre que la fonction exponentielle de base e.
Précisément, on a pour tout (x, y) E JR 2
Cette propriété, jointe au fait que expa 1 = a, montre immédiatement que cette fonction
prolonge à lR la fonction n H an définie sur N, puis Z puis IQ. D'autre part, elle est strictement
croissante pour a > 1 et strictement décroissante pour a < 1. C'est donc bien la même fonction
que celle d'Euler définie précédemment. Nous la noterons donc plutôt que expa, sous la forme
x H ax. En particulier, on pourra désormais noter aussi l'exponentielle «ordinaire» sous la
forme x H ex.
813
La loi fondamentale de la statique appliquée à cet élément de fil nous donne donc
Àdsg + df = 0,
où dT = f(s + ds) - f(s)
représente la résultante des tensions entre les deux extrémités s et s + ds. Nous avons ainsi
Si on note ex l'angle que fait la tension au point s (qui est dirigée suivant la tangente) et
l'horizontale, cette dernière équation vectorielle équivaut aux deux équations scalaires
ds = c1dex .
Àg cos 2 ex
814
Or, si le petit élément de longueur ds a des composantes dx et dy sur les axes de coordonnées
choisis, alors dx = ds cos <X et dy = ds sin <X, d'où
x=
f C1
coscxds = :,-
/\Q
f -d<X
-
cos (X
et y= f. C1
smcxds = :,-
/\Q
f sin<Xd<X •
cos 2 (X
Posons a = c,/Àg; il vient (la constante d'intégration de x est nulle par choix de l'axe des
ordonnées)
a
et y= --+Yo•
cos (X
Ces relations donnent
x/a _ (~ ~) _ 1 + tan(cx/2)
e - tan 4 + 2 - 1 - tan(cx/2)'
et ainsi
ex/a+ e-x/a = 1 + tan(cx/2) + 1 - tan(cx/2) = _2__
1-tan(cx/2) l+tan(cx/2) coscx
Mais alors,
a ex/a+ e-x/a X
y-yo=--=a =ach-,
cos <X 2 a
en posant pour t E lR
et+ e-t
cht= - - -
2
Ainsi le fil épouse la forme du graphe d'une fonction définie très simplement à l'aide de
la fonction exponentielle. Cette fonction est appelée le cosinus hyperbolique. Le problème
précédent est appelé le problème de la chaînette, car le cas d'une fine chaîne portée autour du
cou est un exemple approximatif de cette situation de fil pesant inextensible accroché à deux
points.
Définition 28.13. On définit les fonctions sinus hyperbolique (sh) et cosinus hyperbolique
(ch) par les expressions
La relation fondamentale se montre immédiatement par simple calcul, en utilisant les proprié-
tés de l'exponentielle. C'est précisément cette relation qui explique les liens entre les fonctions
hyperboliques et les hyperboles.
Considérons d'abord une branche .Yt' d'hyperbole équilatère, graphe de la fonction <I> de
JR~ dans lR définie par <l>(x) = 1/x, dans un repère orthonormé; c'est aussi l'ensemble des
points dont les coordonnées (x, y) dans ce repère vérifient x > 0 et x y = 1. On montre
facilement que .Yt' se décrit aussi de la manière suivante
815
(/J
1
•CI.J
~
En effet, tout point de la forme (et, e-tJ appartient bien à .Ye, et inversement si (x, y) E .Ye, il
suffit de choisir t = ln x pour voir que (x, y)= (et, e-1 ), ce qui montre notre assertion. On dit
que la fonction 11: IR H IR2 définie par 11(t) = (et, e-1 ) est une paramétrisation de la branche
d'hyperbole considérée.
Soit maintenant l'application <D de IR2 dans IR 2 définie par
x+y x-y)
(x,y)H ( X=- - , Y = -- .
2 2
Elle est linéaire, son effet sur les parties du plan est facile à étudier. On voit en particulier
que <D(.Ye) = X, où
X= {(X, Y) E IR 2 IX> 0, X2 - Y2 = l}
(il suffit de raisonner par double inclusion); X est bien sûr encore une branche d'hyperbole,
dont les asymptotes sont les droites d'équations X = ± Y. Il est donc possible de déduire une
paramétrisation de X de celle de .Ye : puisque .Ye = 11(IR), alors X= <D(.Ye) =<Do 11(JR).
Posons E, = <D o 11, on vérifie immédiatement que E,( t) = (ch t, sh t) ; nous venons donc de
montrer que
X={(cht,sht) itElR}.
Notons une analogie certaine avec les fonctions circulaires usuelles : si on remplace la
branche d'hyperbole X par un cercle, les fonctions ch et sh sont les analogues des fonctions
sin et cos. Mais il faut insister sur le fait que cette analogie est loin d'être complète; nous
laissons pour le moment au lecteur le soin de comprendre pourquoi et nous y reviendrons plus
loin dans ce chapitre.
Par analogie avec le cas des fonction circulaires, on définit aussi les tangente et cotangente
hyperboliques par
sh t cht
\lt E IR, tht=-h,
C t
VtElR*, cotht = -h.
s t
Rappelons rapidement quelques formules fondamentales sur ces fonctions hyperboliques. Leur
preuve est immédiate à partir de leur expression et des propriétés de l'exponentielle réelle.
816
11 = chx 11 = sh x
11 = th x
11 = coth x
7
FIGURE 28.4. Les graphes des fonctions hyperboliques.
2
6) 1::/x E lR, coth' x = 1 - coth 2 x = -1/ sh x.
À partir de ces formules, l'étude de ces fonctions est très simple et a déjà été menée au
chapitre 4. Rappelons simplement que la fonction x H ch x est paire, alors que les trois autres
fonctions hyperboliques sont impaires; d'autre part, la fonction x H ch x est strictement
décroissante sur ]R_ et strictement croissante sur lR+, les fonctions x H sh x et x H th x sont
strictement croissantes sur lR et la fonction x H coth x est strictement décroissante sur chacun
des deux intervalles constituant son ensemble de définition. Voici les graphes des fonctions
hyperboliques. À titre d'exercice, nous laissons au lecteur le soin de vérifier directement que
la fonction E, introduite plus haut réalise une paramétrisation de la branche d'hyperbole X.
817
mer sous forme de sommes de termes du type L. ch(a + kb) et .L_ sh(a + kb).
k=O k=O
ch ka et sh ka).
Ainsi nous avons les formules ci-dessous, résultant de la définition même des fonctions
réciproques.
Compte tenu de la formule donnant la dérivée d'une fonction réciproque, on obtient les
expressions rationnelles des dérivées des fonctions hyperboliques inverses, qui sont souvent
très utiles dans les problèmes de calcul de primitives.
818
1 1 1 1
Vx E [1,+oo[, argch x = ~, Vx E ffi., argsh x = R+î"
vx2 - l X +1
2
1 1
Vx E] -1, 1[, argth x = - - -2 .
1 -X
-y= argthx
y= argshx
y= argchx
Ces fonctions hyperboliques inverses ne sont pas vraiment de nouvelles fonctions trans-
cendantes, car elles s'expriment à l'aide de la fonction logarithme et de fonctions algébriques.
Nous avons par exemple pour la fonction x argth x
, 1 21( 1 + +1)
argth x = 1 - x 2 = 1- x 1 x '
qui donne donc par intégration, puisque argth0 = 0, l'expression
Vx E] - 1 , 1[, argth x = ; ln ( ~ ~: ) .
Pour les deux autres fonctions, le calcul par primitive est moins évident ; procédons autre-
ment. Par exemple pour y H argch y, si y E [1, +oo[, on veut résoudre en x E lî+ l'équation
eX + e-X
chx= =y.
2
Posant t = ex, cela conduit à l'équation t + 1/t = 2-y, donc à l'équation du second degré
t 2 - 2ty + 1 = O.
Les solutions de cette équation sont t1 = y - ~ et t2 = y + ~ - Or, t = eX avec
x;?: 0 donc t;?: 1 et, par suite, la solution qui convient est t 2, d'où l'expression
Vy E [1,+oo[, argchy = ln(y + ~ ) .
Raisonnant de la même manière, on obtient l'expression suivante de la fonction argument
sinus hyperbolique
Vy E ffi., argshy = ln(y + Jyï"+î).
Il nous reste maintenant à représenter ces trois fonctions, dont les graphes s'obtiennent évi-
demment à partir des fonctions directes, par symétrie par rapport à la première bissectrice.
819
Nous abordons maintenant la partie centrale de ce chapitre. Nous avons mis l'accent sur le fait
que, dans les classes secondaires, l'étude des fonctions trigonométriques ainsi que la définition
du nombre 7t étaient basées sur une intuition géométrique et ne pouvaient donc être considérées
comme complètes. Nous sommes maintenant en mesure de construire ces objets de manière
rigoureuse. Notre approche sera basée sur la structure de la droite réelle, ainsi que sur notre
définition de la longueur des « courbes planes». Appliquant ces idées au cercle, ainsi qu'aux
segments de cercle, il est possible de donner un sens précis aux lignes trigonométriques à partir
de la présentation géométrique classique. Cette méthode nous permettra de fonder tous les
résultats que nous avons rencontrés au chapitre 3 de cet ouvrage. Signalons cependant qu'une
autre approche, basée sur l'étude de l'exponentielle complexe, est plus rapide et directe, mais
elle repose sur des idées qui ne seront pleinement développées que dans le cours de L2.
On introduit ensuite au lycée une définition de ces lignes trigonométriques, valable pour
toute mesure d'angle, en utilisant le cercle trigonométrique de centre O et de rayon 1. Préci-
sément, en orientant les droites horizontales par le vecteur OI et les verticales par le vecteur
ÔJ, on définit les lignes trigonométriques
COS IX= OX, sin IX= OY,
(voir figure suivante). Ces définitions sont bien un prolongement des précédentes, et on
conserve celles de tan et cotan. La tangente (resp. la cotangente) n'est donc définie que pour
des réels IX distincts de n/2 + kn, k E Z (resp. kn, k E Z). Sur la figure, elles sont repérées
par les points T et C.
Le problème crucial est que la mesure de l'angle n'est pas clairement définie. Exprimée en
820
radians, c'est en effet la longueur du segment de cercle limité par le point I = (1, 0) et le point
M. Nous pouvons maintenant faire mieux.
Commençons par définir les objets principaux, qui seront des parties de JR. 2 .
Définition 28.14. Le cercle trigonométrique est le sous-ensemble 'ef' de JR. 2 défini par
Notons que ces définitions ne reposent sur aucun a priori géométrique. Le cercle est une
partie de JR. 2 formée par les couples dont les coordonnées satisfont une certaine égalité. On
choisit de représenter ce cercle par notre cercle familier, mais nous n'utiliserons jamais de
propriétés issues de cette représentation. En particulier, les mots supérieur et inférieur ne
sont que des moyens mnémotechniques pour repérer les demi-cercles.
Nous ne chercherons pas dans cette partie à donner les démonstrations les plus courtes,
mais plutôt à montrer plusieurs variations sur un même thème, invitant ainsi le lecteur à se
forger sa propre intuition des diverses questions que nous allons aborder.
Pour (u,v) E JR. 2 , rappelons que l'on note ll(u,v)II = ✓u2 +v 2 . Pour A= (u,v) et
A= (u', v') dans JR. 2 , on définit la distance entre A et A' par d(A, A') = IIA-A'II (c'est aussi
par définition la longueur du segment [A, A')). Le cercle 'ef' est donc l'ensemble des éléments
M de JR. 2 qui vérifient d(M, 0) = 1, où O = (0, 0).
Nous allons montrer que le cercle a une longueur bien définie. Pour cela, nous allons nous
limiter au demi-cercle supérieur, et donner en même temps les définitions des fonctions cosinus
et sinus, ainsi que celle du nombre n.
821
Pour x E [-1, 1], on note Ax le point du demi-cercle 'if+ d'abscisse x, c'est-à-dire le point
Ax = (x,vl -x2 ). On note I = (1,0), J = (0, 1) et K = (-1,0). Si Met M' sont des points
de 'if+, dont les abscisses m et m' vérifient -1 ~ m ~ m' ~ 1, on note
l(cr) =~
n-i
IIAsi+, -AsJ L, 11 (si+i - Si, ✓1
= n-i - s~+i - ✓1 - sf)
Il
(28.3)
l=Ô l=Ô
c'est donc la longueur de la ligne brisée associée aux points As; (noter que A 50 Met
Asn = M'. On notera aussi que 6(m, m) = {(ml}.
Définition 28.15. Soient M et M' des points de 'if+, dont les abscisses m et m' vérifient
-1 ~ m ~ m' ~ 1. On définit la longueur du segment de cercle (MM') par
Comme la partie {l(cr) cr E 6(m,m')} est non vide, la borne supérieure est bien définie
1
dans ~ : elle est égale à +oo si cette partie n'est pas majorée, et c'est la borne supérieure
usuelle si cette partie est majorée. En particulier, lg MM'= 0 si M = M'.
Insistons sur le fait que cette définition de la longueur est aussi purement ensembliste, et
ne repose pas sur la donnée préalable d'une fonction d'un intervalle de lR dans JR 2 dont l'image
serait le cercle. Elle diffère donc de celle que nous avons donnée au chapitre 27. Nous allons
voir au paragraphe suivant comment relier les deux notions.
Le lemme suivant est de démonstration facile, basée sur les propriétés de la borne supé-
rieure, et laissée au lecteur à titre d'exercice.
Lemme 28.16.
1) S<ii~n(x,x',~";dans [-l, 1] avec X:~ x'.,;;; x.1'; .Alors
Q)
<Il
.Q
al
'if+
~
t:: K I
Q) m m
~
c..
o Soit <j:> : [a, b] ---i JR 2 un arc plan de classe ci. Pour toute subdivision O' = (s 0 , •.. , sn) de
[a, b] (qui vérifie par définition a= s 0 <si ... < Sn= b), on note
n-i
f(<P, O') = L. ll<P(si+i) - <j:>(silll- (28.5)
i=O
On voit donc que f( <j:>, O') est la longueur de la ligne brisée associée à O', union des segments
dont les extrémités sont les points consécutifs de la suite <j:> (0'1), 0 ~ i ~ n.
o Alors la longueur 2(4>) de l'arc <j:> est définie par
Ces préliminaires étant posés, revenons à notre problème. Pour étudier la longueur du
demi-cercle 'if+, l'idéal serait de connaître une fonction de classe ci ayant 'if+ pour image.
Mais jusqu'ici nous n'en avons pas à notre disposition (notre travail va d'ailleurs conduire à la
construction d'une telle fonction, à savoir t H (cos t, sin t)). Cependant, il existe une fonction
très intéressante, dont l'image est le demi-cercle 'if+, il s'agit de la fonction <1> de [-1, 1] dans
JR 2 définie par
<l>(t) = (t, ✓i-=='t2).
Il est clair que que six E [-1, ll, Ax = <l>(x) = (x, ✓ 1 -x2 ), et que <1>([-1, ll) = 'if+· La
fonction <1> n'est pas de classe ci sur [-1, 1], car ses deux composantes ne sont pas dérivables
en -1 et +1, mais elle est de classe ci sur l'ensemble] - 1, 1[, puisque ses deux composantes
le sont. C'est évident pour t H t, et la fonction t H ✓ 1 - t 2 est la composée de t H (1 - t2 ),
qui est clairement ci et à valeurs dans JR*, par x H VX, qui est de classe ci dans lR"t., Il en
résulte donc que pour tout intervalle fermé [m, m'] contenu dans ]-1, 1[, l'arc <l>l[m,m'l obtenu
par restriction de <1> à l'intervalle [m, m'] a une longueur 2(<1>nm,m'J) bien définie.
823
De plus, par définition de <D, si u est une subdivision de [m, m'], la longueur f(<D, u) définie
en (28.5) coïncide avec la longueur l(u) définie en (28.3). Par passage à la borne supérieure,
en utilisant les égalités (28.4) et (28.6), on obtient donc
(28.7)
Notons que si t E] -1, 1[, ll<D'(t)II = 1/v'f=tï. Comme <D est de classe C 1 sur] -1, 1[,
la fonction t H 1/ v'f=t2 est continue sur ] - 1, 1 [ (on le vérifie directement) ; elle est bien
intégrable sur [m, m'], et on obtient
m' dt
lg AmAm' =
J
m V
~.
2 1- t
(28.8)
PREUVE. Nous allons commencer par une étude préliminaire du comportement asymptotique
d'intégrales du type précédent. Soit a E] - 1, 1[. Pouru E [a, 1[, posons
u dt
f(u)=
J
a V
~-
1- t2
La fonction f : [a, 1[-, lR que nous venons de définir ainsi est dérivable, sa dérivée est donnée
par f'(u) = 1/ ✓ 1 -u2 ; f est donc strictement croissante. Remarquons que
Il en résulte donc que f est majorée, et possède une limite lorsque u -, 1- , avec
2v'f=a
lim f(u) ~ v'f+u .
u-ll 1+ a
a dt 2v'f+u
fV vT=t2 ~ yl-a • (28.10)
Par ailleurs, on déduit en particulier de (28.9) et (28.10) que pour -1 < m ~ 0 ~ m' < 1
Jm' -v'f=t2
m
--dt
~
Io ---===
m
dt
+ Jm' - -
v'f=t2
dt
- ~ 4.
0 v'f=t2
Cette majoration est encore clairement valable pour tous m, m' vérifiant -1 < m ~ m' < 1.
824
Revenons à la proposition et montrons le point 1). On voit que L(l) = 0 par définition,
et on vérifie que la fonction L est décroissante, en vertu du lemme 28.16. Il suffit donc de
démontrer que L(-1) < +oo et, pour cela, de vérifier que l'ensemble {l(cr) cr E 6(-1, 1)} est
1
majoré. Pour simplifier l'exposition, nous considérerons seulement des subdivisions de ~-1, 1]
de la forme (s 0, ... , snl avec n ): 3, qui vérifient s1 < 0 et Sn-I > 0 et noterons 6 leur
ensemble. Il est en effet facile de voir que
Alors, si cr E 6(m, m'), et= (s 1, ... ,sn_1) est une subdivision de [m, m'l, et on voit immé-
diatement que d'après les égalités (28.3) et (28.5)
Les hypothèses sur met m' montrent que [[K -Am[[ ~ ,/2 et [[Am' - If[ ~ ,/2. On sait de
plus que
des ensembles 6( m, m') lorsque m décrit ]-1, O[ et m' décrit JO, 1[, il en résulte que l'ensemble
{l(cr) 1 cr E 6} est aussi majoré par 4 + 2,/2. C'est ce que nous voulions montrer; il en résulte
queL(-1) ~4+2,/2.\
Pour montrer l'égalité du point 2), nous allons vérifier deux inégalités. On voit d'abord
d'après l'égalité (28.8) et le lemme 28.16 que pour tous x et u vérifiant -1 < x ~ u < 1
u dt
fX
~ = lgAxAu ~ L(x).
Montrons l'inégalité opposée. Soit E: > O. Par définition de L(x), il existe une subdivision
cr= (s 0 , ••. , Sn) de [x, 1] telle que l(cr)): L(x) - t:/2 (par définition de la borne supérieure).
On peut de plus supposer que Sn-l vérifie
En effet, si ce n'est pas le cas, il suffit d'ajouter un point s E Jsn-1, 1[ à la subdivision, qui
vérifie [[As - If[ ~ t:/2, et de considérer la nouvelle subdivision cr' ainsi obtenue, qui vérifie
Nous supposerons donc dans la suite que IIAsn-, - Ill !( E/2. Notons alors fr= (s 0 , ••• , Sn-l),
donc fr E 6(x, Sn-il- On a d'une part
et d'autre part
ce qui prouve par passage à la limite que limu_,1- f~ ✓ id~t2 ?,: L(x)-t:. Comme é: est arbitraire,
on en déduit que
u dt
v'f=t2?,:
lim
u-,J- X 1 - t2 J L(x).
Ceci montre l'égalité cherchée grâce à (28.11), et termine la preuve du point 2).
Pour montrer le point 3), on voit d'abord facilement en utilisant le lemme 28.16 que Lest
strictement décroissante. En effet, si -1 !( x < y !( 1
u dt Ju dt
L(xo + h) - L(xo) = limu-,1- v'f=t2
2
- lim v'f=t2
2
" J "<J+h 1-t u->J- "<l 1-t
u dt Ju dt
- lim -
- u-,J- (J"<J+h v'f=t2 "<l v'f=tï)
"<J+h dt J"<J+h dt
-
-
lim
u->J- (
-
J "<J v'f=tï) -- - "<J v'f=t2
et il est évident que
"<J+h dt
lim(L(xo + h) - L(x 0 )) = lim v'f=t2 = 0,
~o ~o"<>
J 1-~
La proposition que nous venons de montrer va nous permettre maintenant d'établir toutes
nos définitions de manière satisfaisante.
826
7t
- = L(0) = lim
Jb -Jf=xî'
dt
2 b--lJ·- O 1 - x2
Le réel n/2 est donc par définition la longueur du segment de cercle compris entre les
points J = (0, 1) et I = (1,0). Pour des raisons intuitives, nous avons l'habitude de considérer
ce segment comme un « quart de cercle». De même, nous avons dès le début qualifié 'ti+ de
«demi-cercle». On peut espérer que la longueur du demi-cercle soit le double de celle du
quart de cercle, c'est ce que nous allons montrer.
PREUVE. La longueur de 'ti+ est par définition L( -1), soit, par continuité de L
Jb
L(-1) = lim L(a) = lim
O--l-1+ a--l-]+ ( I vT=t2
o
a
dt
+ lim
b--l]- 0
dt
vT=tï) ,
donc
L(-1) = lim ( Io dt + ~) = ~ + lim Io vT=t2
dt .
a--l-1+ a vT=t2 2 2 a--l-1+ a
I Jî--=îZ- 1-a
o
a
dt
0 ~,
ds
donc
.
11m Io ---c=~
dt = 1·1m Ju ds 7t
2·
0--l-]+ a ✓ 1 -x2 U--ll- 0 ~
Il en résulte que
7t 7t
L(-1) = 2+2= n. ■
La fonction L que nous avons construite dans la proposition 28.17 est donc une application
continue et strictement décroissante de [-1, 1) dans l'intervalle [L(l), L(-1)) = [O, n]. Nous
savons donc que c'est une bijection sur cet intervalle. Ceci nous permet de définir les deux
premières fonctions trigonométriques de manière rigoureuse.
Définition 28.20. On note cos la bijection réciproque de la fonction L. La fonction cos est
donc définie sur [0, n], et à valeurs dans [-1, 1], elle est continue et strictement décroissante.
Pour tout x dans [O, n], on pose sin x = Jl - (cos x)2. La fonction sin est donc continue sur
[0,n] et à valeurs dans [O, 1). En d'autres termes, pourx E [0,n], les réels cosx et sinx sont
définis de telle manière que la longueur lg AI du segment de cercle compris entre les points
A= (cos x, sin x) et I = ( 1, 0) soit égale au réel x.
Nous n'avons en fait défini que les restrictions à [O, n] des fonctions sin et cos usuelles, nous
les notons cependant de la même manière pour simplifier l'exposé. Il est maintenant possible
d'étudier les propriétés de régularité des fonctions sin et cos.
827
Il en résulte que sin est dérivable sur JO, 7t[ par composition. La dérivabilité à droite en -1
et à gauche en 1 provient de la proposition 26.33. En particulier, cos~(O) = 0 et sin~(O) = 1,
cos~(n) = 0 et sin~(7t) = -1. Le reste de la proposition en résulte facilement. ■
Pour retrouver toutes les propriétés usuelles des fonctions cos et sin, il nous reste seulement
à montrer la formule « d'addition des angles». Pour la prouver, nous allons utiliser un peu
2 2
d'algèbre linéaire. Soient u et v des réels tels que u + v = 1. Considérons l'application
2 2
linéaire 'l' de IR dans IR définie par
2
c'est-à-dire l'application dont la matrice dans la base canonique de IR est
2
Cette application 'l' a la propriété de conserver les distances entre couples de points de IR ;
en effet, si (x, y) et (x', y') sont donnés, et si 'l'(x, y)= (X, Y) et 'l'(x', y') = (X', Y'), alors
ll(X- X', Y- Y')II = Il u(x-x') -v(y -y'), v(x -x') + u(y -y')) Il
(u2 +v 2 )((x-x')2 + (y-y')2) = ll(x-x',y-y')I I-
1
Elle est de plus bijective, et on vérifie facilement que son inverse 'l'- a pour matrice la
transposée de la matrice M. Elle préserve donc aussi la distance entre couples de points du
plan. Il en résulte, comme le cercle C(f' est l'ensemble des points du plan M dont la distance
IIOMII à Oest égale à 1, que 'l'(<:(l) = C(f'_
Nous connaissons l'interprétation géométrique de l'application 'l'; il s'agit d'une rotation
de centre O = (0, 0), dont l'angle est le réel <p E [O, 2n[ tel que cos <p = u et sin cp = v.
828
Mais bien évidemment il n'est pas question d'utiliser cette interprétation avant que toutes les
relations trigonométriques usuelles aient été prouvées. Cependant il peut être utile de garder
cette vision géométrique présente à l'esprit pour comprendre la structure de la démonstration
qui va suivre. Elle sera basée sur le lemme suivant.
PREUVE. Par définition Am= (m, ✓1 - m 2 ) et Am'= (m', J1 - m' 2 ). D'après (28.12), les
ordonnées des points 1J'(Aml et 1J'(Am,) sont positives, puisque les coordonnées de Am et Am,
sont positives, et puisque u ~ 0 et v ~ O. Ceci montre que 1J'(Aml E 'ti+ et 1J'(Am,) E 'ti+· Les
abscisses de ces points sont données par
µ=um-vJl -m2 ,
et par définition on a donc Aµ= 1J'(Am) et Aµ, = 1J'(Am, ). Comme met m' sont positifs et
vérifient m ,( m', ✓1 - m 2 2: J1 - m' 2 , et comme u 2: 0 et v ~ 0, on en déduit que µ ,( µ'.
Notre définition (28.4) de la longueur du segment (AµAµ,) s'applique donc.
Considérons maintenant une subdivision cr= (sk)o,;;;k,;;;n E 6(m, m'). Alors si
rk = usk -vJl - s~
on voit en utilisant le même raisonnement que p = (rk)o,;;;k,;;;n est une subdivision de [µ, µ'],
et elle vérifie par construction
l(cr) = .L_ IIA"k -A"k+' Il= .L_ ll1J'(A"k) -1J'(A"k+' lll = l(p).
k=O
alors cr = (sk)o,;;;k,;;;n E 6(m, m') et Vk E {O, ... , n}, A"k = 1J1- 1 (ArJ On en déduit que
l(p) = l(cr) et il en résulte que que sup{l(cr) 1 cr E 6(m, m')} ~ sup{l(p) 1 cr E 6(µ, µ')}.
Nous avons donc montré que lgAmAm, = lg1J'(Am)1J'(Am, ). ■
PREUVE. Les expressions étant symétriques en ex et f3, on peut supposer O ~ f3 :S: ex :S: n/2.
Posons A = (cos ex, sin ex) et considérons l'application linéaire 1J' définie précédemment, avec
u = cosf3 et v = sinf3. Notons I' = 1J'(I) = (cosf3,sinf3), et A'= 1J'(A). On a clairement
A' E 'i&'+, puisque si A'= (X', Y')
Par ailleurs
X'= cos a cos f3 - sin a sin f3 :S: cos (3.
Il en résulte que le segment [X', 1] est la réunion des segments [X', cos (3] et [cos (3, 1], et que
les arcs de cercle [A', I '] et [I', I] correspondants vérifient
On sait par définition que lg I'I = (3. De plus, le lemme précédent nous montre que
Il en résulte que lg A 'I = a + (3. Mais par définition, ceci entraîne que
donc cos(a+ (3) = X' et sin(a+ (3) = Y', ce que nous voulions montrer. ■
Notre but est maintenant de construire les fonctions cos et sin sur la droite réelle. Tout
d'abord, nous allons les prolonger à l'intervalle [O, 21t] en posant
Nous laissons au lecteur le soin de vérifier (par une étude au point n) que les fonctions ainsi
obtenues sont dérivables sur [O, ln], et vérifient encore les relations cos' = - sin et sin' = cos.
En particulier, elles sont encore de classe cxi sur [0,2n].
Il est intéressant de remarquer que l'on peut encore interpréter les fonctions ainsi pro-
longées comme les «inverses» d'une fonction longueur définie sur le cercle. Pour un point
A E 'i&'_ \ {I}, on définit la longueur du segment (IA) comme la longueur 7t du demi-cercle
supérieur (KI), à laquelle on ajoute la longueur du segment de demi-cercle inférieur compris
entre les points K et A. Cette dernière longueur se définit de manière exactement analogue à
la longueur des segments du demi-cercle supérieur; on laisse au lecteur le soin d'écrire cette
définition en détail.
La proposition suivante est alors de démonstration immédiate.
t H cost t H sint
0 7t
Les graphes des fonctions cos et sin ainsi prolongées se déduisent immédiatement de l'étude
des variations, basée sur l'expression des dérivées et leur étude sur [O, n], en utilisant la relation
de prolongement.
Enfin, on obtient des fonctions définies sur la droite réelle en prolongeant les fonctions cos
et sin que nous venons d'obtenir par Zn-périodicité, c'est-à-dire en posant pour x E lR
cosx = cos~, sinx = sin~,
où ~ est le seul élément de [O, 2n[ tel qu'il existe k E Z vérifiant x = ~ + 2kn. En d'autres
termes,~= 2n{x/2n}. On vérifie encore facilement par une étude aux bornes que les fonctions
ainsi obtenues sont dérivables et vérifient cos' = - sin, et sin' = cos. Elles sont donc de classe
C 00 sur R De plus, elles sont Zn-périodiques par définition même. Enfin, on vérifie facilement
que les formules d'addition sont valables sans changement pour ces nouvelles fonctions. On
en déduit toutes les propriétés usuelles par une étude directe.
d'après les formules d'addition pour les fonctions cos et sin. En particulier,
le'xl = e'x e-,x = ew = 1.
La fonction g : x H e'x est donc un morphisme du groupe additif (JR, +) dans le groupe
multiplicatif (U, -), où U est l'ensemble des complexes de module 1. En voici maintenant une
propriété fondamentale.
Cette propriété sera utilisée à de multiples reprises. Elle est en particulier à la base de la
mesure des angles. On peut aussi rapprocher cette propriété de la construction précédente. En
effet, en identifiant JR 2 à C, l'ensemble U s'identifie au cercle CC, et le point e'x = cos x+ isin x
s'identifie au point du cercle CC de coordonnées {cos x, sin x). La proposition précédente est
donc une reformulation de la proposition 28.24.
831
À l'aide des fonctions sinus et cosinus, on définit les fonctions tangente et cotangente.
Définition 28.26. Les fonctions tangente et cotangente sont définies respectivement sur les
ensembles~\ {n/2 + kn I k E Z} et~\ {kn I k E Z} par
sinx cosx
tanx=-- cotan x = -.--.
cosx smx
Il est facile de vérifier que ces deux fonctions sont n-périodiques. Compte tenu des opéra-
tions sur les fonctions dérivables, ces deux fonctions sont dérivables, de dérivées respectivement
données par
2
tan' x = 1 + tan2 x et cotan' x = -1 - cotan x.
On voit aussi par une étude directe que
lim tant= -oo, lim tant= +oo, lim cotant= +oo, lim cotant= -oo.
t--l-n/2+ t--l+n/2- t--lO+ t--ln-
Voici les graphes des fonctions tangente et cotangente, en restriction à] - n/2, n/2[ et ]O, n[.
t H tant t H cotant
1 1
1 1
1 1
1 1
1 1
1 1
1 1
1 1
1 1
ni ln 0
-2, 12
:n
1 1 1
1 1 1
1 1 1
1 1 1
1 1 1
1 1 1
1 1 1
On renvoie le lecteur au chapitre 3 pour les autres propriétés des fonctions trigonomé-
triques, qui peuvent maintenant être considérées comme complètement établies.
832
Sur l'intervalle [-rr/2, rr/2], la fonction x H sin x est strictement croissante; puisqu'elle est
continue, elle définit donc une bijection de [-rr/2, rr/2] sur son image [-1, 1]. La bijection
réciproque est appelée la fonction arcsinus et notée
\/x E [0, rr], arccos( cos x) = x, \/-y E [-1, 1], cos(arccos-y) =-y.
La fonction sinus étant dérivable sur ] - rr/2, rr/2[, avec une dérivée non nulle, la fonction
arcsinus est dérivable sur ] - 1 , 1 [ et pour tout x E ] - 1 , 1 [
. 1
arcsm' x = - - - - -
sin' (arcs in x) cos (arcs in x) ·
Puisque cos 2 (arcsinx) = 1-sin2 (arcsinx) = 1-x2 , et comme la fonction cosinus est positive
sur l'intervalle ] - rr/2, rr/2[ dans lequel la fonction arcsinus prend ses valeurs, on en déduit
que
•
\/x E] - 1, 1[, arcsm 1 x = ~ 1
.
vl -x 2
833
-1 0
FIGURE 28.11. Les graphes des fonctions x >--l arcsinx et x >--l arccosx.
La fonction tangente, en restriction à l'intervalle ] - n/2, n/2[, réalise une bijection sur IR. La
fonction réciproque de cette bijection est appelée la fonction arctangente et notée
1 1
Vx E JR, arctan x = - --2"
1 +x
La proposition suivante établit deux formules importantes concernant le comportement de
cette fonction vis-à-vis de la somme.
Proposition 28.27'.
1) Poor tout réel x non nul on a
.a,rctanx
· ·..... .. t .7t
•
+ arctatl.-.=
X
e-:;,. ·
.t.
=
avec t = 1 six > 0 et E- -,-cl ilx < O.
2) PfhJ,r}o'JJJ5 réels x et y non nuls et non inverses l'un. de l'a,tre (X.lf'F 1)
. .•. x.if.· • .
3rctat1x+ arctan-y ·. · y + C;
= arctan -1·-xy
> ,, C - ~ -
où C = 0 si xy < l, C = ....:.n six•< 0, y< 0 et xy> let C=1t sî i > 0, y> 0 et xy > 1.
PREUVE.
1) Posons f(x) = arctanx+arctant; cette fonction est dérivable sur JR*, et sa dérivée est
nulle. Par suite, elle est constante sur chacun des intervalles J - oo, 0[ et JO, +oo[. Ainsi, pour
tout réel x E JO, +oo[, on a
1
arctan x + arctan - = f(l) = arctan 1 + arctan 1 = n/4 + n/4 = n/2.
X
De même, en prenant la valeur de f en -1, on obtient que, pour tout x E J - oo, 0[, on a
- 1
arctan x + arctan - = -n/2.
X
x+b
g (x) = arctan x + arctan b - arctan - - - .
1 -bx
Cette fonction est dérivable et là encore, comme le lecteur pourra le vérifier à titre d'exercice,
sa dérivée est nulle. Elle est donc constante sur chacun des intervalles dont JR* \ {b} est
réunion. Si par exemple b > 0, on a JR* \ {b} =J - oo,0[UJ0, 1/b[U]l/b,+oo[, et donc en
utilisant le fait que la fonction arctangente est continue et impaire, et la propriété 1), on
a Vx EJ-oo,0[, g(x) = limt--t_00 g(t) = -n/2+arctanb-arctan(-l/b ) = O. De même,
Vx E JO, 1/b[, g(x) = limt--,o+ g(t) = arctan b - arctan(b) = O. Enfin, Vx E Jl/b, +oo[, g(x) =
limt--t+oo g(t) = n/2 + arctan b - arctan(-1 /b) = 7I.
On a ainsi prouvé que si y = b > 0, pour tout x non nul vérifiant xb = xy < 1, g(x) = 0
et pour tout x non nul vérifiant xb = xy > 1, g(x) = 7I. En procédant de même si b < 0,
on obtient que, pour tout x non nul vérifiant xb = xy < 1, g(x) = 0 et pour tout x non nul
vérifiant xb = xy > 1, g(x) = -7I. La propriété est donc prouvée. ■
Nous renvoyons le lecteur au chapitre 3 pour les autres propriétés des fonctions trignomé-
triques réciproques.
835
f(x) = Ix 1 dt 2.
0 +t
La fonction intégrée étant paire, la fonction f est donc impaire. D'autre part, elle est évidem-
ment dérivable et même indéfiniment dérivable et, pour tout réel x, on a f'(x) = l~xz > O.
La fonction f est donc strictement croissante sur JR. Montrons que f est majorée, ce qui mon-
trera qu'elle admet une limite lorsque x tend vers +oo (et donc aussi lorsque x tend vers -oo
puisqu'elle est impaire). En effet, on a clairement, pour x ~ 0
f(x) = IX dt
0
1 + t2 =
Il
0
dt IX dt Il dt IX dt
1 + t 2 + 1 1 + t 2 :S O 1 + t 2 + 1 t 2
Il dt
= o 1 + t2 +
[-1] x
t 1
'
d'où finalement
f(x) =
IX dt
-1--2 :S
o +t
Il dt
-1--2
o +t
+ 1- -1
X
( 1+
Il dt
-1--2·
o +t
Notons l = limx---Hoo f(x). On vérifie que l > 0 et on peut définir le nombre n par l'égalité
n = ll. La fonction continue f est alors une bijection strictement croissante de lR sur l'intervalle
] - n/l, n/l[; c'est même un C 1--difféomorphisme. Notons alors
tan : lR \ {n/l + kn, 1 k E Z} -----, JR, x H tan x
l'unique fonction n-périodique prolongeant la fonction f~l à lR \ {n/l + kn, 1 k E Z}. On a
alors, pour tout x E] - n/l, n/l[,
sin x = J1 - cos2 x.
836
La fonction x H cosx est évidemment dérivable sur [0,n/2[U]n/2,n]; elle l'est aussi en n/2
puisque, en dérivant son expression à gauche, puis à droite de n/2, on obtient respectivement
-tanx tanx
et
✓1 2
+ tan x
et ces fonctions ont la même limite -1 lorsque x tend vers n/2 respectivement par valeurs
supérieures et inférieures. Les dérivées à droite en O et à gauche en 7t étant nulles, et la fonction
étant paire et 2n-périodique, la fonction est finalement dérivable sur IR. En outre, on a, pour
tout réel x, cos' x = - sin x. Les autres propriétés sont laissées au lecteur (en particulier la
formule d'addition ... ).
Nous avons vu au chapitre 24 que certaines fonctions pouvaient être définies comme solutions
d'équations, c'est par exemple pour la réciproque d'une bijection. Nous allons voir dans ce
qui suit deux types d'équations particulières dont les inconnues sont des fonctions. Nous
distinguerons de manière un peu arbitraire les équations ne faisant intervenir aucune dérivée
de la fonction inconnue, que nous appellerons équations fonctionnelles, de celles qui font
effectivement intervenir ces dérivées, que nous appellerons équations différentielles. Notre but
est ici de montrer quelques exemples de telles équations, dont les solutions nous permettront
de retrouver les fonctions élémentaires que nous avons construites au début de ce chapitre.
certaines fonctions possèdent une grande « rigidité », en ce sens que si on les connaît sur
une « petite » partie de leur ensemble de définition, on les connaît partout. Par exemple,
les fonctions polynômes possèdent une telle propriété de rigidité, puisque la donnée de n + 1
valeurs pour une fonction polynôme de degré n la détermine complètement. Plus généralement,
Cauchy parle de fonctions entières, qui seront étudiées dans les cours de L2 et L3. Ces fonctions
entières, qui sont des « polynômes de degré infini », ne sont pas aussi rigides que des polynômes
et leur restriction à un ensemble fini de points ne les caractérise pas complètement. Ce fait
est intuitivement compréhensible, puisqu'il faut de plus en plus de valeurs pour déterminer
un polynôme à mesure que son degré grandit. Cependant, on peut montrer que si on connaît
la restriction d'une fonction entière à un intervalle non réduit à un point (ou même seulement
à l'image d'une suite convergente et son point limite), alors on la connaît cette fonction en
tout point.
Jusqu'à l'époque de Cauchy, la plupart des fonctions manipulées par les analystes ont
cette propriété, et ce n'est qu'à partir des « temps modernes» que l'on se met à envisager des
fonctions beaucoup plus générales, qui ne se comportent donc pas aussi simplement. Parmi ces
nouvelles fonctions, les fonctions continues jouent un rôle central. Elles sont beaucoup moins
rigides que les fonctions entières, mais Cauchy avait déjà remarqué qu'elles ne sont pas si
imprévisibles que cela. En fait, leur propriété fondamentale, qui va être utilisée pour résoudre
ces diverses équations fonctionnelles, est qu'elles sont parfaitement déterminées lorsqu'on les
connaît sur une partie dense de leur ensemble de définition. C'est demander beaucoup plus
que pour les polynômes ou les fonctions entières, mais cela suffit pour traiter les problèmes
posés par Cauchy. Nous allons énoncer un lemme préliminaire qui met en relief cette propriété
de rigidité des applications continues.
tëmm.e 28.2!; .•··•Soit A ùne· partie ilt;ni~ ·de lt.. s;;îènt f .• et ·g p,euxffJnttions contirfaes. de R
dans RJelles.quêf(x.}= g(xJpour toutx de Â; .Alors f(x),,.;: g{x)~~rtout x de R, donc.
f :=; g. .
sont les fonctions linéai~s ax, où ô ést une constailte réelle arbitraire. Ên tem,es
.?iJgéb.~, .et;la iignifiei;'D!ê7 les~ ei1,dèrrÛ>'iphîsme$
H
continw ·d11r• urO'JJ4JfJ ct,dd'ib,J {R:v+) sont
·ex.actement les Jonctions lm~ires. •. ·
PREUVE. Il est clair que les fonctions linéaires satisfont cette équation (E 1).
Réciproquement, montrons que toute solution est linéaire. En appliquant l'équation à
x =y= 0, on voit que f(O) = O. Il en résulte que pour tout réel x, on a f(-x) = -f(x) en
appliquant l'équation à y = -x.
838
Posons alors a = f(l); utilisant l'équation fonctionnelle, une récurrence immédiate nous
montre que pour tout n EN, on doit avoir f(n) =an.Donc puisque f(-n) = -f(n), on voit
que f(n) = an pour tout n E Z.
Maintenant, si q E N*, en écrivant 1 = 1/ q + 1/ q + · · · + 1/ q ( q fois), on montre par une
récurrence immédiate que
a= f(l) = f(l/q + 1/q + · · · + 1/q) = f(l/q) + f(l/q) + · · · + f(l/q) = qf(l/q),
d'où f(l/q) = a/q. Mais alors, si p EN, en écrivant le rationnel p/q comme p fois la somme
de 1/q, on obtient f(p/q) = pa/q = ap/q et donc finalement, en utilisant la propriété
f(-x) = -f(x),
\/r E Q, f(r) = ar.
La fonction g : lR -) lR définie par g(x) = ax est continue. Les fonctions f et g sont égales
sur Q, et Q est dense dans R Il résulte donc du lemme 28.28 que f = g, ce qui montre notre
assertion. ■
Nous allons donner une autre preuve du théorème précédent, basée sur le fait qu'une
fonction continue satisfaisant l'équation (El) est automatiquement dérivable. Soit f continue
satisfaisant pour tous réels x et y
f(x +y)= f(x) + f(y).
Fixons x E lR et intégrons en y entre Oet 1, ce qui est possible puisque les fonctions considérées
sont continues. Il vient alors
où F est une primitive de f sur R Il en résulte 'facilement que f est dérivable en vertu des
théorèmes usuels. Mais alors, revenant à l'équation initiale, fixant y E lR et dérivant par
rapport à x, nous obtenons que f'(x+y) = f'(x). Ainsi, pour tous réels x et y, on a f'(x+y) =
f'(x), donc f'(x) = f'(O) pour tout x, donc f' est constante. Notant a la valeur de f', et posant
g = f - a, on a donc g'(x) = 0 pour x ER Nous savons, par le théorème des accroissements
finis, qu'il existe alors b E lR tel que g(x) = b pour tout x E JR, soit f(x) = ax + b. Mais
f(O) = 0 donc b = 0 et le résultat est prouvé.
Passons maintenant à la deuxième équation de Cauchy.
PREUVE. La fonction nulle est évidemment solution et on a vu que les fonctions exponentielles
de base a > 0 le sont aussi.
Réciproquement, soit f une fonction continue, non identiquement nulle, solution de cette
équation fonctionnelle. Alors f ne peut jamais s'annuler car si on avait un réel xo tel que
f(x 0 ) = 0, on aurait pour tout réel x
f(x) = f(x - x 0 + x 0 ) = f(x - x 0 )f(xo) = 0,
et donc f serait identiquement nulle. En outre, on a alors f(x) > 0 pour tout réel x, car
f(x) = f(x/2 + x/2) = f(x/2)2. On peut donc définir une fonction g par g(x) = ln f(x) pour
x E lR. Cette fonction composée est continue et satisfait l'équation fonctionnelle
V(x, y) E Ile, g(x +y)= ln f(x + y) = ln(f(x)f(y)) = ln f(x) + ln f(y) = g(x) + g(y),
donc g est solution de (El). Il s'ensuit qu'elle est de la forme g(x) = Ax où A est une constante
réelle arbitraire. Posons a = exp A, alors, pour tout réel x,
f(x) = exp g(x) = exlnu = ax,
Nous allons utiliser la même stratégie pour résoudre le troisième problème de Cauchy.
Les solutions de l'équation (E3) sont donc la fonction nulle et les fonctions logarithmes de
base a, x H log a x = ln x/ ln a, où a est une constante réelle strictement positive et différente
de 1.
Th~"1ê' $:;32:"; .kslJitfflèii~ ~tî~s'. fn 10.+r/lbf➔ lit s~Jai,ant ·.
V{x1 y} ElO,+CX1{2, f{xu) =f{x)f{y},
&1:•t ~t·~'
840
V(x, y) E]O, +oo[2 , g(x-y) = ln f(x-y) = ln(f(x)f(-y)) = ln f(x) + ln f(-y) = g(x) + g(-y).
Par conséquent, il existe un réel ex tel que, pour tout x > 0, g(x) = cxln x, d'où f(x) = xcx (le
cas ex = 0 correspondant à la fonction constante de valeur 1), ce qui termine la preuve. ■
L~tnllle ~$.3$. .· Soient I un inter;1Jalle de lit et g ·une fonétionContinue surf ,Alqri Î 1équ<.Jtïrm
t/:ilférentfel,le
f'(x) = g(x), VxE I
a pour ense:mple de solutions S ={G + c l c E JR.}, où.Gest u11,e primitive quelconque de g.
Si Xo E I et a ER, l 'éqù.ation ·différentielle avéc donnée• de Caùchy ·
~
f'(x) = g{:xj; V:x E I, et f(Xo) =a f~C):
admet une unique solution.
PREUVE. Comme la fonction g est continue sur I ; elle possède une primitive G sur I. On
voit que toute fonction de S est solution de (E). Réciproquement , si f est une solution de
E, alors f - G a une dérivée nulle sur I ; elle est donc constante puisque I est un intervalle,
donc f = G + c, où c E JR, ce qui montre que toute solution est dans S. Enfin, il en résulte
directement l'existence et l'unicité des solutions de (EC). ■
Dans ce paragraphe nous allons étudier l'exemple fondamental donné par le théorème
suivant.
Ce théorème peut être démontré de deux manières très différentes. Si l'on connaît au
préalable l'existence et les propriétés de la fonction exponentielle, la preuve est très simple.
L'existence provient directement des propriétés de exp, qui est clairement solution, et l'unicité
est presque immédiate. Si en revanche on ne suppose pas connue la fonction exponentielle, il
est possible de donner du théorème une preuve directe, basée sur une méthode due à Euler,
qui peut être vue comme une nouvelle construction de l'exponentielle.
Pour commencer prouvons le théorème en utilisant les résultats de la partie I sur l'expo-
nentielle.
1) Existence. La fonction x H ex satisfait bien (P).
2) Unicité. Soit f une solution de (P). Considérons la fonction qi définie par qi(x) = f(x)e-x.
Cette fonction est dérivable sur lR et sa dérivée est donnée par qi'(x) = f'(x)e-x - f(x)e-x.
Elle est donc identiquement nulle puisque, pour tout x, f'(x) = f(x). Il en résulte que qi est
constante et puisque qi(O) = 1, on a f(x)e-x = 1 pour tout réel x, soit f(x) = ex.
La première preuve est donc presque immédiate. Passons maintenant à l'exposé de la
méthode d'Euler.
Résolution de (P) par la méthode d'Euler. Il s'agit d'une méthode d'approximation de
solutions d'équations différentielles, dont la portée est plus large qu'une simple application à
(P). Elle consiste à remplacer la dérivée par le taux d'accroissement sur un petit intervalle,
c'est-à-dire, géométriquement, la tangente par la corde. Ainsi, si l'on veut approcher une
fonction f vérifiant (P) sur l'intervalle [O, x], x réel fixé, on découpe, pour n E N*, cet intervalle
en n sous-intervalles de longueur x/n, et on écrit
X
= 1 + -,
X
f ( -X) ;;:;; f(O)
X
+ -f'(O) = f(O) + -f(O) n
n n n
f(x) = lim
n-t+oo
(1 + ~)n,
n
ce qui nous reste à prouver maintenant que nous avons expliqué pourquoi nous allons nous
intéresser à cette suite. Pour x fixé dans JR, notons
et Vn(X) ( nx)-n .
= 1-
Nous désignerons plus simplement ces suites par Un et Vn lorsqu'il n'y aura pas d'ambiguïté
sur le réel x. Nous allons montrer que ces deux suites sont adjacentes et donc, en particulier,
que la suite (unlnEN* converge, puis que la limite constitue ainsi une solution de (P) lorsque
x varie.
◊ Montrons que (UnlnEN* est croissante à partir d'un certain rang. On a
n+l ( )n+l
Un+l = ( 1 + n: 1 ) = 1 + ~ - n(n\ 1) '
842
et donc comme 1 + x/n est non nul pour n assez grand, on peut écrire
(1.)
-Un = ( 1 -xz)n
-
2
x2
? 1--,
Vn n n
d'après l'inégalité (28.13) qui s'applique puisque x2 /n2 < 1 pour n assez grand. Ainsi
d'où
xz
0 ,:;; Vn - Un ::;; -Vn.
n
Mais la suite (vnlnEN* est décroissante à partir d'un certain rang, donc est majorée, et par
suite (vn - Un) -, 0 lorsque n -, +oo.
o Posons maintenant pour x E JR,
x+
Un(X + h) = ( 1 + ~
n (
= 1+
h)
x) n (
n
1 + n (1 + x/n)
n ( h )
= Un(x) 1 + (n + x)
n h)
843
Or, pour n assez grand, ;! < 1 ; donc en vertu de l'inégalité (28.13), nous avons
1.1.n(x + h) = 1.1.n(x) h( )n), 1.1.n(x) (1 - n -h ) = 1.1.n(x) (1 + nh ) ,
(1 + -n+x 1 n+x n+x
d'où
nh
1.1.n(x + h) -un(x)), 1.1.n(x)--.
n+x
Faisant tendre n vers +oo dans cette inégalité, on obtient que, pour tous réels x eth-/- 0, on
a
f(x + h) - f(x) ): hf(x).
Soient alors t et k des réels fixés, k -/- 0 ; appliquant cette inégalité à x = t et h = k puis à
x = t + k eth= -k, on obtient
La seconde de ces deux inégalités conduit si 1 - k > 0 à f(t + k) :S ;~L, d'où nous déduisons
finalement l'encadrement
f(t) kf(t)
kf (t) ~ f (t + k) - f (t) ~ l _ k - f (t) = l _ k ·
cj)(x) = lim
n------HXJ
(1 + ~)n
n
est donc solution de l'équation (P).
Pour conclure, nous allons voir comment montrer l'unicité de la solution de (P) sans faire
appel à l'exponentielle. Nous pouvons remarquer que, si f est une solution de (P), alors f
ne peut pas s'annuler sur R En effet, si nous considérons la fonction auxiliaire définie par
cj)(x) = f(x)f(-x), cette fonction est dérivable et
cj)'(x) = f'(x)f(-x) - f(x)f'(-x) = f(x)f(-x) - f(x)f(-x) = 0,
donc cj) est constante sur JR, de valeur cj)(0) = 1. Il en résulte que f ne peut s'annuler.
Si donc maintenant f et g sont des solutions de (Pl, aucune des deux ne peut s'annuler
assurément. On peut donc considérer la fonction auxiliaire définie comme leur rapport, soit
par exemple lj,(x) = f(x)/g(x). Cette fonction est dérivable sur lR et
ll>'(x) = f'(x)g(x) - f(x)g'(x) = f(x)g(x) - f(x)g(x) =
0
g2(x) g2(x) ,
844
donc 1J, est à nouveau constante sur R, de valeur 1J, (0) = 1 ; donc f = g.
Nous avons déjà montré que la fonction exponentielle est solution de (P). L'unicité montre
que
Vx ER, expx = lim
n--->oo
(1 + ~)n,
n
ce qui nous conduit donc à une nouvelle manière de définir cette fonction.
V. EXERCICES
28.1. 28.3.
Montrer qu'il n'existe qu'un seul prolongement Montrer que la fonction rationnelle x H 1/x ne
continu de la fonction possède pas de primitive rationnelle et donc en
particulier que la fonction logarithme néperien
Q ~ JR., TH a\ n'est pas rationnelle.
à lR tout entier.
28.4.
28.2.
Montrer que pour tout réel positif, on a l'enca-
Avec les notations d'Euler, nous voulons mon- drement,
trer que si a> 0, a fc 1, et y > 0, il existe
un unique réel z tel que az = y. Ce réel z sera x2 x2 x3
x- -
2 -
< ln(l +x) <
-
x- - + - .
2 3
appelé le logarithme de base a de y.
1. Montrer qu'on peut se ramener au cas où
a > 1, hypothèse qui sera faite dorénavant.
2. Montrer que pour tout entier n E N*, on a 28.5.
an - 1 2': n( a - 1), et en déduire que
Déterminer les endomorphismes de l'anneau JR,
a-12':n(a 1/n_l). i.e. les applications f : lR ~ !R., satisfaisant
f(l) = 1 et les deux équations fonctionnelles,
3. Montrer qué si,.\> 1 et n > (a-1)/(,.\- l),
alors al/n < ,.\.
f(x +y)= f(x) + f(x) et f(xy) = f(x)f(y).
4. En appliquant ce qui précède à ,.\ = ya~t,
montrer que si t vérifie a t < y, alors pour n
(indication : on ne suppose pas ici que f conti-
assez grand, on a
nue ; on montrera que cependant elle est néces-
sairement croissante, ce qui permettra tout de
même un passage des rationnels aux réels.)
5. Montrer maintenant que si t vérifie at > y,
alors pour n assez grand, on a 28.6.
vérifie bien az = y.
j
845
28.7. 28.9.
Déterminer les fonctions continues f : lR ----, lR Étudier la fonction x H x 1/x_ En déduire que
vérifiant, pour tout couple d'entiers naturels non nuls
(m, nl, l'un des deux nombres y'n ou y'nÏ est
inférieur ou égal à {/3.
28.10.
28.8.
Montrer que la fonction
Déterminer les fonctions continues f : lR ----, lR
vérifiant, 1 + 3thx
x H argth h ,
3 +t X
NE partie importante des mathématiques dites appliquées consiste à introduire les ou-
U tils permettant de modéliser les phénomènes issus des sciences exactes ou des sciences
humaines, puis à poser en termes précis les problèmes obtenus. Un tel problème est
bien posé lorsqu'il admet une solution et une seule, et si de plus cette solution est peu modi-
fiée lorsque les données du problème varient légèrement. Ceci assure une certaine robustesse
du modèle relativement aux diverses sources d'imprécisions inhérentes à toute formalisation
(erreurs de mesures, d'arrondis, etc).
Parmi les nombreux exemples connus de problèmes bien posés, on se rend compte rapide-
ment que ceux qui possèdent une solution explicite, que l'on peut écrire au moyen de formules
exactes, sont très exceptionnels. Ce constat a été à l'origine du développement d'une nouvelle
discipline mathématique, l'analyse numérique, dont nous donnerons un aperçu dans la suite
du cours de série L.
Il existe cependant une classe très importante de problèmes dont la résolution est, sinon
toujours possible, au moins à la portée de techniques bien établies : ce sont les problèmes
dits linéaires. Nous n'aurons pas besoin d'en connaître une définition générale, il suffira de
considérer que ce sont les problèmes posés au moyen d'applications linéaires entre espaces
vectoriels convenables. Par exemple, un système linéaire de la forme Ax = a (où A est une
matrice carrée d'ordre net a E !Rn, et où l'inconnue x est dans !Rn), ou encore une équation
différentielle linéaire comme ü = -u (où u est une fonction de IR dans IR), qui intervient
souvent en physique élémentaire.
Lorsque- les problèmes envisagés font intervenir des fonctions non linéaires, comme par
exemple x H x 2 de IR dans IR, leur résolution est presque toujours hors de portée de méthodes
générales, et donc beaucoup plus difficile. On cherche alors à se ramener au cas de problèmes
linéaires en approchant les fonctions non linéaires considérées, au voisinage de points bien choi-
sis, par leurs applications affines tangentes. Ces dernières sont en effet sommes de constantes
et d'applications linéaires, et la résolution des problèmes obtenus relève des méthodes linéaires
précédentes. On peut alors souvent obtenir sur le problème initial des renseignements précieux.
Par exemple, l'équation différentielle décrivant le mouvement du pendule simple s'écrit (aux
unités près) ë = -sin 0, où e est l'angle du pendule par rapport à la verticale. Si on se limite
à des mouvements voisins de la position basse du pendule, correspondant à 0 très petit, on
peut en première approximation remplacer sin 0 par 0 (on a donc remplacé la fonction sin
par son application affine tangente au point 0), ce qui conduit par exemple à la propriété
d'isochronisme des petites oscillations bien connue en physique 1 : la période d'une oscillation
est indépendante de son amplitude, pourvu qu'elle reste petite.
Mais lorsqu'on cherche à étudier des mouvements de plus grande amplitude, cette ap-
proximation linéaire de la fonction sin ne suffit plus. Il est clair, en effet, qu'une oscillation
1 La justification complète de cette propriété est un peu délicate et repose sur la propriété de conservation de
l'énergie du pendule.
848
de grande amplitude aura une période plus grande qu'une oscillation de faible amplitude : la
propriété d'isochronisme n'est plus valable. Il est donc tentant d'essayer d'approcher la fonc-
tion sin par une fonction un peu plus compliquée que 0 H 0, mais qui reste assez simple pour
autoriser des calculs effectifs. Il s'avère que les fonctions polynômes sont de bonnes candidates
pour de telles manipulations, à condition qu'elles soient bien choisies (le cas des applications
tangentes que nous venons de décrire est d'ailleurs celui des polynômes de degré égal à 1). La
base de la construction des applications tangentes est la notion de dérivée. Pour obtenir des
polynômes de degré supérieur, et donc de meilleures approximations au voisinage d'un point,
nous allons être amenés à itérer cette opération de dérivation.
C'est ainsi que la première section va introduire les dérivées successives d'une fonction, qui
nous permettront de construire ses polynômes de Taylor de degrés quelconques en un point,
qui sont les polynômes de meilleure approximation au voisinage de ce point. Nous verrons
ainsi que si un entier n est donné, et si une fonction f est « assez régulière », son polynôme
de Taylor P de degré n en un point x 0 vérifie
où C est une constante positive. L'approximation locale ainsi obtenue est donc remarquable
lorsque n est assez grand (par exemple sin= 10, et si lx-xol ~ 10-2 , l'erreur est majorée par
C 10-20 !). La notion de développement limité, que nous introduirons aussi dans ce chapitre,
conduira ensuite à des méthodes de calculs de ces polynômes de meilleure approximation qui
ne nécessiteront pas le calcul (souvent fastidieux) des dérivées successives.
Avertissement. Ce chapitre constitue une première introduction aux problèmes
de dérivation à l'ordre supérieur. Nous avons centré l'exposé sur les résultats théo-
riques, et limité le nombre d'exemples et applications qu'il est possible de donner.
Toute l'étude sera reprise et amplifiée dans le cours de 12, lorsque les outils de
calcul formel nous permettront d'obtenir rapidement des développements limités
dans des cadres très variés.
I. DÉRIVÉES SUCCESSIVES
Comme nous l'avons vu, la notion de dérivée a été introduite pour une raison fondamentale
chercher à la meilleure approximation locale d'une fonction par une fonction affine, qui lui est
alors tangente. Nous avons ensuite montré que la notion de dérivée permettait de faire l'étude
du sens de variation des fonctions, et donc d'obtenir des renseignements de nature globale,
basés sur le signe de la fonction dérivée. Mais parfois l'étude de ce signe n'est pas simple, et
ne peut se faire qu'au moyen de l'étude des variations de la fonction dérivée elle-même, ce qui
demande de répéter l'opération de dérivation. Cet exemple, parmi beaucoup d'autres, montre
l'intérêt de la notion de dérivées successives, que nous introduisons dans cette partie.
Soit F(I) l'ensemble des fonctions de I dans lll, et P(I) l'ensemble des fonctions dérivables de
I dans R
Définition 29.1. On construit par récurrence une suite décroissante (PP(IllvEN* de sous-
ensembles de P(I), et une suite (<Dµ)pEN* de fonctions, avec <Dv : PP(I) -----, .r(I), de la
manière suivante. Pour p = 1, on pose P 1(I) = P(I) et <D1(f) = f' pour f E P 1(I). Si
PP(I) et <Dv sont donnés, avec p ~ 1, on pose
Une fonction f de I dans lll est dite p fois dérivable dans I lorsqu'elle appartient à Pµ(I). Sa
dérivée d'ordre p, notée f(vl, est alors par définition f(Pl = <Dµ(f).
Cette définition paraît certainement compliquée, ce n'est pourtant rien d'autre que la
formalisation complète de la construction par récurrence des dérivées successives. Notre en-
semble PP(I) est l'ensemble des fonctions p fois dérivables dans I, et l'application <Dv n'est
rien d'autre que l'application qui à une fonction associe sa dérivée d'ordre p, que l'on appelle
aussi dérivée pième_ Par exemple, P 2 (1) est l'ensemble des fonctions f de P 1 (I), c'est-à -dire
dérivables dans I, telles que la fonction dérivée f' = <D 1 (f) soit dans P 1 (1), c'est-à-dire dont
la dérivée f' est dérivable dans 1. On reconnaît bien la construction initiale. Pour les dérivées
d'ordres 1, 2 et 3 d'une fonction f, on note en général f', f", f 111 •
Définition 29.2. Une fonction est dite indéfiniment dérivable dans I si elle appartient à
l'intersection â:e tous les PP(I), pourp EN*. On note P 00 (1) leur ensemble.
Enfin, il est souvent très utile d'imposer une condition de continuité aux dérivées d'ordre
supérieur.
Définition 29.3. Soit p E N*. Soit I un intervalle ouvert de R On dit que f : I -----, lll est
de classe cv sur I si f E PP(I) et si f(Pl est continue dans 1. On dit que f : I -----, lll est de
classe C00 sur I si f est de classe cv pour tout p E N*. Pour p E NU {oo}, on note CP(I)
l'ensemble des fonctions de classe cv sur I, à valeurs réelles.
Remarque. Soit p E N* U {oo} et f de classe CP sur 1. Soit q < p. La fonction f(q) étant
dérivable sur I (puisque q < p), elle est en particulier continue.
Pour définir les dérivées d'ordre supérieur d'une fonction p en un point, il n'est pas né-
cessaire que cette fonction ait ses dérivées successives (jusqu'à l'ordre p - 1) définies sur tout
l'intervalle initial. Pour mettre en forme cette idée, rappelons d'abord la définition suivante.
850
Définition 29.4. Soit x 0 E R Un voisinage de x 0 est une partie de ]Pl. qui contient un
intervalle ouvert contenant x 0 . Un voisinage à gauche de Xo est une partie de ]Pl. qui contient
un intervalle de la forme ]xo - b, x 0 ], avec b > O. Un voisinage à droite de x 0 est une partie
de ]Pl. qui contient un intervalle de la forme [x 0 , xo + b], avec b > O.
Une fonction définie dans un voisinage de x 0 (on dit aussi au voisinage de x 0 ) est donc
une fonction dont l'ensemble de définition contient un intervalle ouvert de lPI. contenant x 0 .
Une fonction définie dans un voisinage à gauche (resp. à droite) de x 0 est une fonction dont
l'ensemble de définition contient un intervalle ]xo - b, x 0] (resp. [xo, Xo + ô[), avec b > O.
Cette définition est en accord avec une terminologie générale que nous verrons dans la
suite du cours (topologie). Par exemple la fonction x H 1/{x} est définie au voisinage de tout
point x 0 non entier.
Définition 29.5. Soit I un intervalle ouvert de JPI.. Soit Xo dans I. Pour p ) 2, nous dirons
que f est p fois dérivable au point x0 s'il existe un intervalle ouvert J C I, contenant Xo,
tel que f soit p - 1 fois dérivable dans J, et si sa dérivée d'ordre p - 1, définie dans J, est
dérivable en Xo.
Pour résumer la condition intervenant de cette définition, on dit que la dérivée d'ordre
p - 1 de f doit être définie au voisinage de Xo.
Il peut être enfin commode d'introduire une définition de la dérivabilité sur des intervalles
semi-ouverts ou fermés. Nous considérons le cas des intervalles fermés, pour alléger les énoncés
(voir aussi les définitions données au chapitre 26, partie I.2).
On peut de la même manière parler de fonctions dérivées successives pour des fonctions
définies sur un intervalle semi-ouvert, et on conserve les notations E(}P(I), <l>v et f(Pl dans ce
cas.
Passons maintenant aux propriétés algébriques de la dérivation. Nous avons déjà étudié ces
notions pour la dérivée première. Rappelons que si Xo E JPI., et si f et g sont deux fonctions
définies au voisinage de x 0 et dérivables en x 0 , alors (f + g)'(x 0 ) = f'(x 0 ) + g'(x 0 ), et si À E JPI.,
(M)'(x 0) = À(f'(x 0)). On a la même propriété pour les fonctions définies sur des voisinages à
851
1
droite ou à gauche de x 0 et dérivables à droite ou à gauche en x 0. Rappelons aussi que E1 (I)
est un sous-espace de l'espace vectoriel .F(I) des fonctions de I dans JR, et que l'application
<l> 1 est linéaire : ceci donnera la première étape de certains raisonnements par récurrence.
PREUVE. Supposons I ouvert. Montrons la propriété pour E1P (I), avec p E N*, par récurrence
sur p. Pour p = 1, c'est la propriété que nous avons rappelée. Supposons la propriété vraie
au rang p - 1, prenons deux fonctions f et g de E1P(I) et deux scalaires À et µ. Les fonctions
f(p-l) = <l>P_ 1(f) et g(p-lJ = <l>P_ 1(g) sont dans E1(I), par définition de E1P(I). Par hypothèse
1
de récurrence, on peut écrire <I>p_ 1(M + µg) = À<l>p-1(f) + µ<I>p-1(9). Comme E1 (I) est un
1
espace vectoriel, À<l>p_,(f) + µ<l>p_ 1(g) E E1 1(I), donc <I>p-1(M + µg) E E1 (I), ce qui montre
que M + µg E E1P(I).
De plus <I>p(M + µg) = <l>1(À<l>p-1(f) + µ<I>p-1(9)) = À<!>1(<I>p-1(f)) + µ<l>1(<I>p-1(g)) =
À<l>p(f) + µ<I>p(g) puisque <1> 1 est linéaire. Il en résulte que <I>p est linéaire, et ceci termine la
00
preuve pour E1P(I). On raisonne de manière analogue pour (P(I). Pour les ensembles S1 (I)
et ( (Il, on utilise le fait qu'une intersection de sous-espaces vectoriels est un sous-espace
00
La proposition précédente a aussi une version ponctuelle (c'est-à-dire portant sur des
fonctions p fois dérivables en un point x 0 E I); on laisse au lecteur le soin de l'énoncer. Pour
l'aider, examinons maintenant les relations entre dérivation et produit dans cette version
ponctuelle.
PREUVE. L'énoncé se démontre par récurrence sur p. Pour p = 1, nous l'avons déjà montré.
Supposons-le vrai pour p - 1. On a alors, pour x dans un intervalle J contenant x 0
p-1
(fg)(p-ll(x) = L C~_,f(kl(x)g(p-1-kl(x).
k=O
Dérivons cette formule par rapport à x au point x 0 , ce qui est licite car le membre de droite
est dérivable en x 0 . Il vient
p-1
(fg)(Pl(xo) = .L. C~_1[f(k+ll(xol9(p-l-kl(xo) + f(kl(xo)g(p-kl(xo)l.
k=O
p-1 + p-1
+ (kp-1 g(p-k)(X)0 = [(k-1 0 = (kg(p-k)(X)
(k-lg(p-1-(k-l)l(x) (k ]g(p-k)(X) p O,
p-1 0
852
le facteur de f(x 0) est g(Pl(x 0) = C~g(Pl(x0), enfin celui de f(Pl(x 0) est g(x 0) = qg(x 0). On
reconnaît bien la formule annoncée, ce qui achève la récurrence. ■
PREUVE. Il suffit de montrer que ce sont des sous-algèbres de (F(I), +, ., x), ce qui découle
immédiatement des propriétés que nous venons d'énoncer. ■
Pour terminer notre première approche du problème des dérivées successives, il ne nous
reste plus qu'à examiner les propriétés de la composition des fonctions.
f~~sit~>:i9:Ml,, Sqi(Xo,}E. lit ,tt~~J!tr,,,;il~titlr1, .1éfinie •fl!l »J>#irt,11,(Je Jlç ,~ êt.p foi$
dérifffJ,bJe, ww~nt. ~::.ffo# If ttJie;Ji>.~it:iµ J4init .~f.f:tip~'(le dé; r{~)··ttsp,fti11Ji,trj'V:,~ll!
enf(¾h. ô1<Yt8·99,f est'pfo!is.dê rt~e~~.· ·
PREUVE. Lorsque p = 1, l'énoncé est connu, et de plus (go f)'(x) = (g' o f)(x)f'(x) pour x
dans un intervalle J contenant x 0 . Raisonnons par récurrence, et supposons l'énoncé vrai pour
p - 1. Comme f (resp. g) est p fois dérivable en x 0 (resp. f(x 0 )), on a en particulier que f
(resp. g') est p - 1 fois dérivable au voisinage de x 0 (resp. au voisinage de f(x 0 )). Alors par
hypothèse de récurrence on voit que la fonction x H (g' o f)(x)f'(x) est p - 1 fois dérivable
en x 0 , ce qui signifie que ( g o f)' est p - 1 fois dérivable en x 0 , et donc que g o f est p fois
dérivable en x 0 . Ceci termine la preuve. ■
Les dérivées successives des fonctions sin et cos sont un peu plus compliquées à écrire direc-
tement, mais on peut en obtenir une expression simple à condition d'introduire des déphasages
convenables.
Proposition 20,14. Les fonctions sin et cos sont de classe C00 • Pour tout. k. Et N .· et tout
1!'-€lll
sin(kl(x} = sin(x + k.7.C/2},
PREUVE. Démonstration immédiate par récurrence. ■
Intuitivement, une fonction convexe est une fonction qui reste toujours en-dessous de ses
cordes. Nous allons ici présenter des propriétés de base des fonctions convexes, et notamment
leurs relations avec les dérivées successives.
Définition 29.15. Soit I un intervalle de R Une fonction f : I --, lR est dite convexe lorsque
854
La figure suivante illustre la définition : une fonction convexe est une fonction dont le
Cl)
graphe est toujours au-dessous de ses cordes.
f
~
~
o..
X1
w-v
f(v) ~ --f(u) + ( 1- w-v)
- - f(w)
w-v
= --f(u) v-u
+ --f(w).
w-u w-u w-u w-u
En multipliant par w - u, on obtient (v- u)f(w) + (w -v)f(u) ~ (w- u)f(v), soit encore
Cet énoncé s'interprète géométriquement en introduisant les trois points A = (u, f(u)),
B = (v, f(v)) et C = (w, f(w)). Il exprime que les pentes des droites (AB), (AC) et (BC)
vérifient les inégalités
Pente(AB) ~ Pente(AC) ~ Pente(BC),
u V w
~n :t:::r:·::~t!{[ônèt~ êfiJisi~tês..
aussi la dernière inégalité. Pour voir la deuxième, notons que lorsque h < -y - x, on a g(h) ~
g(-y - x), ce qui donne directement
f(x + h) - f(x) f(-y) - f(x)
------ ~ ----.
h -y-x
Donc en faisant tendre h verso+, on voit que f~(x) ~ f(y~=:(xl par prolongement des inégalités.
La troisième inégalité se démontre de la même manière.
Quatrième assertion. Soit a et b des éléments de I, avec a< b. Alors par le point 3),
on voit que six et -y sont dans [a, b], avec x < -y
f~(a)(-y -x) ~ f(-y) - f(x) ~ f~(b)(-y -x),
ce qui montre que lf(-y) - f(x)I ~ Cl-y -xi, avec C = max(f~(a), f~(b )). En conséquence f est
lipschitzienne sur [a, bl, et donc continue sur [a, b). Comme tout point de I est contenu dans
un tel intervalle [a, bl, cela montre que f est continue dans 1. ■
C'est le théorème suivant qui montre tout l'intérêt des dérivées d'ordre supérieur vis-à-vis
de la notion de convexité.
t~~e':af1~;c>: SDüJ uMjô~ct,f()ft aftfwii\1#~'11: uV:•· intemùlè l. liflle esf'con*e ~ ~t
;s~tmk,~t ~iJ', . . . tfio_rsqise f~t df:ux/()îs dé~akle ,SUif ), ille: ~8{ÇQ1wexe si et
~~tJJbtf,ènt's~f11' siit I. :,, · ··· · · · · ·· · · · · ·· · ··· · ·· · ·
PREUVE. Tout d'abord, lorsque f est deux fois dérivable, f' est croissante si et seulement si
sa dérivée, qui est f", est positive ou nulle. Ainsi, on voit qu'il suffit de montrer la première
assertion.
Lorsque f est dérivable, on sait que f' = f~, et si f est convexe le théorème 29.19 montre
que f' est croissante. Donc, lorsque f est convexe et dérivable, f' est croissante.
Supposons maintenant que f' est croissante, et montrons que f est convexe. Soient x 1 , x 2
dans I tels que X1 < x2 (par exemple), soit À E [O; 1], et notons -y = Àx 1 + (1 - À)x 2. On a les
inégalités x1 < -y < x2. Grâce au théorème des accroissements finis, on peut trouver E, 1 et E,2
vérifiant X1 < E,, < -y < E,2 < X2 tels que
f(-y) - f(x1) = f'(E,i), f(x2) - f(-y) = f'(E,i).
1,J-X1 X2-1J
On a en particulier E,, < E,2, ce qui impose f'(E,i) ~ f'(E,2). Par conséquent,
f(-y)-f(x 1) f(x 2)-f(-y)
----- ~ -----.
1,J-X1 X2-1J
Mais on a -y - X1 = (1 - ;\)(x2 - x1) > 0 et x2 - -y = À(x2 - x 1) > O. Multipliant l'inégalité
précédente par À(l -À)(x2 - x1) > 0, on obtient À( f(-y) - f(x 1)) ~ (1 - ;\)( f(x 2 ) - f(-y )), soit
après réarrangement f(-y) ~ M(xi) + (1 -À)f(x 2), ce qui montre la convexité de f. ■
858
EXEMPLE 29.21. La fonction fa: JR~-----, lR définie par f a(x) = xa est convexe sur JR~ pour
1 ex E [1, +oo[. La fonction exp est convexe sur R
Nous avons déjà vu que le graphe d'une fonction convexe est situé sous ses cordes. Montrons
maintenant qu'il est situé au-dessus de ses tangentes.
en multipliant par y-x > 0, on trouve f(y)-f(x) ~ f~(x)(y-x) ~ f~(x)(y -x), et lorsque
x < y, on procède de même en utilisant la relation
pour obtenir f(x)-f(y) ~ f~(x)(x-y) ~ f~(x)(x-y), et on multiplie tout par -1, ce qui
renverse le sens des inégalités. ■
Cet énoncé dit exactement que le graphe d'une fonction convexe est au-dessus des demi-
tangentes, et donc des tangentes lorsqu'elles existent.
Toute l'étude que nous venons de faire se transpose immédiatement au cas des fonctions
dites concaves.
Définition 29.23. Une fonction f de F(I) est dite concave si son opposée -f est convexe.
C'est ainsi que, par exemple dans la définition, une fonction concave est une fonction dont le
graphe est toujours au-dessus des cordes. On laisse au lecteur le soin d'énoncer les analogues
de résultats précédents, en changeant simplement le sens des inégalités. Par exemple, une
fonction dérivable est concave si et seulement si f' est décroissante, et une fonction deux fois
dérivable est concave si et seulement si f" est négative.
E;EMPLE 29.24. La fonction ln est concave sur ]1, +oo[. La fonction fa est concave sur
1 lR+ pour ex E] - oo, 1].
859
PREUVE. Bien entendu, si f est minimale sur un intervalle ouvert en un point x où elle est
dérivable, on a toujours (même si f n'est pas convexe) f'(x) = O. C'est la réciproque qui est
spécifique au cas convexe. Prenons 1J dans I vérifiant y > x. On sait que f(y~=:(xl ): f~(x) =
f'(x) = 0, et donc comme y - x > 0, on obtient f(y) ): f(x). De même, lorsque 1J < x, on
__ Vneut écrire f(x)-f(y)
x-y
( fd' (x) = f'(x) = 0, et donc comme x -y > 0, il vient f(x) ( f(y). ■
Remarque. On notera que l'énoncé précédent est global, au sens où le minimum considéré
est un minimum global pour la fonction f.
Ce résultat, en apparence très simple, est en fait une mine pour les applications de la
notion de convexité. Nous en verrons des exemples dans la suite du cours. En complément de
ce chapitre, nous montrons une application de la convexié en modélisation économique.
Les formules de Taylor utilisent les dérivées successives d'une fonction pour construire des
polynômes de meilleure approximation au voisinage d'un point. Dans la pratique, on peut
y voir un analogue du problème de l'approximation des réels par les rationnels, au sens où
les fonctions polynômes sont explicitement définies au moyen d'un nombre fini de termes, et
donc « complètement connues », alors que les fonctions générales ne peuvent se décrire aussi
simplement. Même une fonction aussi simple que l'exponentielle nécessite pour la définir un
processus de passage à la limite et ne peut donc être décrite au moyen d'un nombre fini
d'opérations. Nous reviendrons sur ces problèmes en des termes beaucoup plus précis dans la
suite du cours de série L
860
Comme nous l'avons déjà signalé, les notations de Landau ne sont pas absolument irrépro-
chables. Pour qu'elles aient un sens, il faudrait par exemple que o(xm) soit une fonction,
puisque f = o(xm) pour une fonction f. Mais alors on ne pourrait pas avoir g = o(xm)
si g est différent de f. Il faut les interpréter en pensant que o(xm) est en fait un ensemble
de fonctions, celui de toutes les fonctions définies au voisinage de x 0 et vérifiant le deuxième
membre de l'équivalence. La notation correcte devient alors f E o(xm). C'est cependant l'usage
mathématique d'écrire le signe = à la place du signe E, ce qui n'entraîne pas d'inconvénient
une fois ces précautions clairement énoncées. Nous utiliserons dans ce chapitre les opérations
usuelles sur les notations de Landau.,
Définition 29.27. Soit f une fonction définie au voisinage de x 0 . Alors f est dérivable en
Xo si et seulement si il existe une fonction E définie au voisinage de O et de limite nulle en
0 telle que
f(xo + h) = f(xo) + f'(xo)h + hE(h),
ce qui s'écrit aussi, avec la notation de Landau, f(x) = f(xo)+f'(x 0 )h+o(h). On peut encore
écrire f(x) = f(xol+f'(x 0 )(x-xol+(x-x0 )dx-x0 ) ou f(x) = f(x 0 )+f'(x0 )(x-x0 )+o(x-x0 ).
Comme nous l'avons déjà signalé, cet énoncé traduit le fait que x H f(x 0 ) +f'(x 0 )(x-x0 )
est la meilleure approximation affine de f au voisinage de x 0 , on l'appelle application affine
861
On note Rt,n,xo le reste d'ordre n de f au voisinage de Xo, défini comme la différence entre
la Jonction f et son polynôme de Taylor de degré n en x 0 . De manière plus précise,
Pour étudier la qualité de l'approximation d'une fonction par son polynôme de Taylor,
nous allons utiliser le lemme fondamental suivant, qui relie l'approximation d'une dérivée à
celle de la fonction initiale, et qui permettra de faire des raisonnements par récurrence.
"~~::e~~t:jJf-}t~titl:~:~~lîlili'!411,~is,h'tÏjf;i~~"?~f~,!i~1:#i
PREUVE. Soit E > 0 fixé. Par hypothèse, lorsque h tend vers 0, g'(h)/hk tend vers O. Donc, il
existe ho> 0 tel que si lhl ~ ho, on a lg'(h)I:::; elhkl. Appliquons l'inégalité des accroissements
finis dans l'intervalle [0, hl, pour 0 ~ h < ho on obtient
lg(h) - g(0)I:::; Ehk+l _
De la même manière, si -ho < h < 0, l'application de l'inégalité des accroissements finis
entre entre h et 0 conduit à lg(h) - g(0)I :::; elhlk+l _ Donc pour lhl ~ ho, on obtient l'inégalité
lg(h) - g(0)I ~ rlhlk+l. Comme E est arbitraire, on a bien g(h)- g(x 0 ) = o(hk+1). ■
et comme g(0) = 0, le lemme conduit à g(h) = o(hn), ce qui est la formule cherchée. ■
Définition 29.31. Soit n E N*. On dit qu'une fonction f définie au voisinage de x0 E lR.
possède un développement limité à l'ordre n lorsqu'il existe n+ 1 coefficients a 0 , •.• , Un dans
lR. tels que au voisinage de 0
n
f(x) = L adx-xo)k+o(x-x )n. 0
k=O
Équivalence seulement si n =1
Lorsque n > 1, il n'y a pas équivalence entre la dérivabilité à l'ordre n et l'existence
d'un développement limité à l'ordre n.
EXEMPLE 29.32. Pour mieux voir le problème, considérons la fonction f définie sur JR.* par
f(x) = x 512 sin(1/x). La fonction f est de classe C 00 dans JR.*. Elle vérifie lf(x)I ~ lxl 5/ 2 et est
donc prolongeable en 0 par une fonction (notée encore f) telle que f(0) = O. Cette fonction
est dérivable en 0, et vérifie f'(0) = 0, par définition même de la dérivée.
863
Nous avons aussi lxi 5 / 2 = o(x 2 }, donc f(x) = o(x2 ). C'est un développement limité de f à
l'ordre 2 en O.
Si l'on calcule f' pour x-/- 0, on obtient
Comme pour le cas de l'approximation par les fonction affines, nous allons voir que lors-
qu'une fonction possède un développement d'ordre n en un point, la partie polynomiale de
ce développement est la meilleure approximation locale par un polynôme de degré n de f. Ce
sera bien sûr le cas pour les polynômes de Taylor des fonctions n fois dérivables. Nous allons
préciser un peu cette question, en montrant d'abord deux lemmes d'unicité.
PREUVE. Écrivons P(x} = .L.~=0 akxk. On sait que la fonction P est nulle si et seulement si
tous ses coefficients ak sont nuls. Supposons que l'un au moins des ak soit non nul, et soit
p = min{k E {0, ... , n} 1 ak-/- 0}. En divisant par xP
n
av= - L. akxk-p + o(l}.
k=p+l
Le membre de droite a une limite nulle quand x -t 0, et il est constant et égal à ap, donc
Up = O. C'est une contradiction. Tous les coefficients Uk sont nuls, et P est nul. ■
PREUVE. C'est une conséquence du lemme précédent, il suffit de faire la différence des
développements. ■
Q)
U)
~
~
ê::
Q)
~
PREUVE. Si P = Q, c'est évident. Sinon, notons p la valuation du polynôme P - Q. Alors,
on voit immédiatement que
Comme f(x) - P(x - x 0 ) = o((x - x 0 )n) avec n ~ p, il existe b1 E JR~ tel que
1
lf(x) - P(x - Xo)I ~ zlap - bbllx - Xolp
dès que lx - xol ~ &1. On obtient donc lf(x) - P(x - Xo)I ~ lf(x) - Q(x - xo)I dès que
lx - xol ~ min( bo, b1), ce qui termine la démonstration.
■
En particulier, si une fonction f est n fois dérivable au voisinage d'un point x 0 , son poly-
nôme de Taylor est le polynôme de meilleure approximation de f au voisinage de x 0 .
Ces développements sont en général écrits en Oet donnent les développements impairs et pairs
suivants:
N (-l)P
sin(h) = ;.. (-1 )P h2p+l + o(h2N+2) et cos(h) = ' - - h2P + o(h2N+l)
L
p=O
(2p + 1)! L (2p)! .
p=Û
Connaissant ces deux derniers développements, on peut retrouver les premiers grâce aux
formules de trigonométrie (sin et cos d'une somme).
865
Lorsque ex est un entier n, le terme o(hn) est nul, c'est la formule du binôme (1 + h)n =
L~=O C~hk_ Il faut aussi savoir écrire très vite cette formule pour ex= -1 ; elle donne
n
(1 + h)-1 = L(-lJkhk+o(hn)
k=O
Théorême.~.36. .Scient (l et b deu:r:réel:J, a <b, so# f une f<,uetion dda, bJ dans R.. et
1) Formule a~ 'laylol'-Lagr~ge.· Fonetio" tk:IS'i f .êst de filasse Ct:i 8Ur {a, bJ et n+ 1
Jo1t$ dérivable sur }a,b[, .il. existé c E Ja, b{ tel que ·
:
- ; ~ ' -
où C est une constante choisie telle que g (a) = 0 (ce qui est bien possible, puisque le facteur
de C est non nul si x =•.a). C'est le calcul de la valeur de C qui va permettre de montrer
l'égalité.
Il est clair que g(b) = 0, et la fonction g est continue dans [a, b) (puisque f est de classe
en dans [a, bl) et dérivable dans ]a, b[ (puisque f est (n + 1) fois dérivable dans ]a, b[). Il
est donc possible de lui appliquer le théorème de Rolle, qui conduit à l'existence d'un réel
c E ] a, b [ vérifiant g 1 ( c) = 0. Mais un calcul immédiat montre que
(b -T)n-1
Calculons l'intégrale par parties, en dérivant TH f(nl(-r) et en intégrant TH (n _ 1)! . On
obtient
Les formules de Taylor possèdent de multiples formes, à adapter suivant les besoins. Par
exemple, un changement de variables dans la formule avec reste intégral conduit à l'expression
f(b) - f(a) -
f(kl( )
LT
n-1
,(b - a)k = (b - a)n
Il (1 e)(n-1)
(~ _ 1)! f(nl(a + 0(b - a))d0.
1=1 O
La formule de Taylor-Lagrange que nous avons donnée est en fait un résultat d'existence.
Elle indique qu'il est possible de trouver un réel c dans l'intervalle ] a, b[ pour lequel une
certaine égalité est réalisée. La figure suivante en donne une interprétation géométrique (pour
l'ordre 2).
Graphe de f"
f"(c)
Graphe de f
f"(c)
2
0 0 C
"" (n + 1) ! '
Vx ER, . 'X
hmL-k=e.
n->+oo !
x
n k
k=O
Le développement de Taylor, pourtant de nature locale, permet donc dans ce cas de recons-
truire toute la fonction (on verifiera qu'il en est de même lorsque x < 0), ce qui est très
remarquable.
Ceci n'est pas toujours le cas. Par exemple, dans le complément sur les fonctions plateaux,
nous étudierons la fonctions cp 00 définie sur R par
cp 00 (x)=O si x~O,
On montrera que cp 00 est de classe C00 et que pour tout n, cp):1(0) = O. Ainsi son polynôme
de Taylor est le polynôme O à tout ordre: cp 00 (x) = o(xn). Ces polynômes ont une limite qui
est le polynôme 0, mais bien entendu, cette limite n'est égale à cp 00 sur aucun voisinage (à
droite) de O.
Le comportement des polynômes de Taylor pour l'exponentielle peut donc paraître sur-
prenant. Ce phénomène fondamental (dit d'analyticité) sera étudié plus en détail dans le
cours de L2.
PREUVE. Nous allons faire la démonstration pour f paire; la démonstration pour f impaire
n
est identique. Du développement limité f(h) = L. akhk + o(hn), on déduit
k=()
n n
Comme f(h) = f(-h), l'unicité du développement limité fournit pour tout k ak = (-1 ]kuk,
et donc uk = 0 si k est impair. ■
Nous allons voir maintenant que les développements limités de nombreuses fonctions se
calculent aisément à partir des développements obtenus dans la partie III par somme, produit,
et composition.
PREUVE. Supposons pour fixer les idées que n ,,:; p. Alors pour la combinaison linéaire, on
peut bien entendu écrire
n P
(M+µg)(xo+h) = L_(Àak+µbk)hk+µ L. bkhk+o(hn)+o(hP),
k=O
la seconde somme étant absente si n = p. Remarquons cependant que si k ?, n + 1, on
p
a hk = o(hn), par conséquent µ L. bkhk + o(hn) + o(hP) = o(hn). Ainsi, nous arrivons
k=n+l
à la formule annoncée. Nous voyons d'ores et déjà dans cette première démonstration le
comportement que devra avoir le virtuose du calcul de développements limités : il est inutile
d'écrire les termes qui entrent dans le o(hn) (ce que nous ferons cependant dans les premières
démonstrations).
De même, pour le produit
n p
(fg)(xo + h) = (r ukhk + o(hnl) (r Ufhf + o(hPJ)
k=O f=O
= L. L. ukbfhk+f + o(hn)g(xo + h) + o(hP)f(xo + h),
kEÔn fEt.p
870
avec ~n E {O, ... , n} et ~P = {O, ... , p}. Comme g est continue en Xo, elle est bornée au
voisinage de x 0 , donc o(hn)g(x 0 + h) = o(hn) ; de même o(hP)f(x 0 + h) = o(hP) = o(hn) (car
p ): n) et donc
(fg)(xo + h) = .L, .L,
akbehkH + o(hn).
kE4n fEL'.p
Notons M, = {(k,C) E ~n x ~PI k+C ~ n} et M2 = {(k,C) E ~n x ~v I k+ C > n}. Alors,
(fg)(xo + h) = .L, akbehkH + .L, akbehk+f + o(hn).
(k,f)EM1 (k,f)EM2
Clairement L(k,f)EMz akbehk+e = o(hn), donc (fg)(xo +, h) = L(k,f)EM, akbehkH + o(hn). Il
reste seulement à remarquer que L(k,f)EM, akbehk+f = t:=oCmhm, avec Cm= I:~aibm-i,
ce qui termine la preuve. ■
Calcul pratique
Dans la pratique, pour calculer le développement limité à l'ordre n d'un produit de
deux facteurs, on considère des développements limités à l'ordre n des deux facteurs, on
multiplie leurs deux parties polynomiales, et on ne tient compte dans ce produit que des
termes de degré inférieur ou égal à n.
f(x) = x~sin(x).
+x
► Nous allons considérer f(x) comme le produit de g(x) = x 2 sin x et de h(x) = 1/(1 + x),
et nous allons développer chacun des termes à l'ordre 5.
Commençons par g. La fonction g est elle-même un produit. Le premier terme x 2 est un
polynôme de degré 2, son développement à l'ordre 5 est donc égal à x 2 . Nous connaissons
aussi un développement de sin x à l'ordre 5 : sin x = x - x 3 /6 + x 5 /120 + o(x 5 ). Le produit
des deux termes conduit donc à
x 2 sin x = x 3 - x 5 /6 + o(x5 ),
puisqu'on ne tient compte dans le produit que des termes de degré ~ 5. Notons donc qu'il
aurait été suffisant de développer sin x seulement à l'ordre 3. Il est souvent possible d'utiliser
ce type de raccourci, mais il est plus sûr au début d'appliquer strictement les règles de calcul,
au prix de quelques lourdeurs.
Passons maintenant à 1/(1 + x). On sait que
1
- - = 1 - x + x 2 + x 3 - x 4 + x 5 + o( x 5 ).
1+ X
En utilisant la règle du produit, il vient donc
f(x) = (x 3 - x 5 /6 + o(x5 ))(1 - x + x 2 + x 3 - x 4 + x 5 + o(x5 ))
= x 3 - x 4 + 5x 5 /6 + o(x 5 ).
Notons que, là encore, il aurait été possible de ne développer 1/( 1 +x) qu'à l'ordre 2, puisque
x 3 est en facteur dans le premier terme g.
871
Dans les calculs suivants, nous allons utiliser quelques raccourcis permettant d'éviter cer-
tains calculs. Nous conseillons au lecteur d'étudier attentivement la structure des exemples,
pour éviter des erreurs.
x2 x4 4 )) 2 = ( x2 x4 ) ( xz x4 ) x2
1--+-+o(x4) 1--+-+o(x4) = 1--+o(x3 )
( 1--+-+o(x
6 120 6 120 6 120 3 '
et donc
De même
Continuons de même
Il vient alors sin5 (x) = x 5 + o(x 5 ), puis pour tout k? 6, sink(x) = o(x 5 ) .
.Prllposîtion 29,43. lntêgrâtion•. $(i1;1, io·,e Jlt, Soit f uné fondiM déritittblè dàris' un
v<n$i-riaJJe ~ X(). 0Si f' admet à1vvoisinage de x.0 oo dé'#Jêloppement iJrordrè n. ~ la forme
f'tXô +lt) :=-' [ ~ 11):lil,; +o(hnk aiors f admèf tW voisinage dé Xo le dé'!Jèloppement d'ordre
rt + 1 suivant : . . •
n+l
.f{Xo +h.} =fh:i>} +L af k.=1
1
..
h.k +:o(h,~-H).
872
n
PREUVE. Utilisons le lemme 29.29 avec g(h) = f(x 0 + h) - (f(x0 ) + L kakl hk+ 1
). On a
k=O +
par hypothèse g'(h) = f'(x 0 + h) - .L~=0 akhk = o(hn) et donc, comme g(0) = 0
~1:~~!~1~-~·--i
r.~t?tlf + o{li~J, ·altJ'e,S ·~() f .adme.t un dévelop~mentlimiti 'ordre. q :;::.tnfü{n, p} obtentJ.
par substitution et troncature li l'orilre, q; ·
PREUVE. Nous allons utiliser pour f et pour g des développements à l'ordre q = min{n, p}
(pour l'une des deux fonctions, on tronque donc le développement initial).
On a (go f)(xo+ h) = g(f(x 0 + h)), et lorsque h tend vers 0, il en est de même de f(xo+ h)
par continuité. Aussi, on peut introduire dans le développement limité de g, l'expression
f(xo + h) (résultat sur la composition des relations de comparaison),
q
(go f)(xo + h) = L bef(xo + h)f + o(f(x 0 + h)q).
f=O
873
De plus, au voisinage de 0, f(x 0 + h) = a 1h + o(h) = 0 (h), donc f(xo + h)q = 0 (hq), d'où
o(f(x 0 + h)q) = o(hq)_ De plus, on peut calculer un développement à l'ordre q de f(x 0 + h)e
par produits successifs
q e q
f(xo+h)e= (Lakhk+o(hql) = .L_Cm,ehm+o(hq)
k=l m=O
où cette fois f(x 0 + h)-f(x 0 ) admet le développement limité L~=l akhk+o(hq); il est donc
possible d'appliquer le théorème précédent.
n (-l]k
arctan(x) = ' - - - x2 k+l + o(x 2n+ 1 ].
Lzk+l
k=O
Pour mieux illustrer les différentes techniques de calcul, nous allons dans ce qui suit étudier
la formation du développement de la fonction tan à l'ordre 7, par différentes techniques. La
première est d'utiliser le développement de arctan, qui en est la réciproque.
874
x = tan(arctan(x))
x2 x4 x6 )
u = arctan(x) = x ( 1 - + - + o(x 6) .
3 5 7
On trouve
2 4
2x 23x )
u2=x2 ( 1-3+45+o(xs) '
ce qui permet de calculer
x3 2x5 17x7
tan(x) = x + + ~+ + o(x 7 ).
3 315
L'exemple de la fonction tangente, quotient des fonctions sin et cos, nous montre qu'il
peut être intéressant d'avoir des méthodes de calcul de développements pour les quotients.
Nous allons en montrer une, basée sur l'utilisation de la division des polynômes suivant les
·puissances croissantes. Nous commençons par énoncer le résultat d'existence.
Alors, grâce aux résultats sur la composition,¼ = cpog admet un développement limité d'ordre
n en x 0 . Nous avons tous les ingrédients pour conclure que f/g admet un développement limité
d'ordre min{p, n} en Xo. ■
Pour fabriquer à droite le terme x, il faut que Q (x) commence par un x. On écrit donc
Q (x) = x + Q 1 ( x), ce qui donne après développement
On trouve alors que Q1 (x) a pour terme dominant x 3/3. On écrit donc Q 1(x) = x 3 /3 + Q 2 (x)
ce qui donne après simplification
2x5 x2 x4
+ o(x 5 ) = (1 - + + o(x5 ))(Q 2 (x) + o(x 5 )),
15 2 24
Il faut tout d'abord déterminer le développement limité de 1/ cos. Il suffit de l'avoir à l'ordre
6, puisque x peut être mis en facteur dans le sin. Pour cela, notant
xz x4 x6
U= - - -+-+o(x 7)
2 24 720
on constate que u-----+ 0 lorsque x tend vers 0 et que costJ = l~u· Comme u = 0 (x 2), pour
avoir un développement limité d'ordre 6 de 1/ cos, il suffit de pousser celui de l~u à l'ordre
3 en u
1
- - = 1 +u+u2 +u3 +o(u3 ).
1 -u
On substitue puis on développe, sans calculer les termes inutiles (c'est-à-dire ceux qui vont
entrer dans le o(x 6)),
1 x2 x4 x6 x2 x4 3
x6 6 x2 x4 x6
cos(x) = 1 + ( 2 - 24 + 720) + ( 2 - 24 + 720)2 + ( 2 - 24 + 720) + o(x ) =
On fait ensuite le produit des deux développements limités, toujours sans calculer les termes
qui vont disparaître dans le o(x 7 ),
► Méthode 2. Utilisons l'équation dont est solution tangente tan(x) = + tan(t)2)dt. J;(l
Du fait que tan'(0) = 1, on a à l'évidence le développement tan(x) = x + o(x), et donc
X3
I
X
t3 t2
1 + tan(t) 2 = 1 + (t + + o(t 3))2 = 1 + t 2(1 + + o(t 2))2)
3 3
2t 2 2t4
=1 +t 2(1 + +o(t 2)) =1 +t 2 + +o(t4),
3 3
et donc
2t 4 x3 2x5
I
x
tan(x) = (1 + t 2 + + o(t4))dt =x+ + 5
0 3 3 15 + o(x ).
d'où en intégrant
x3 2x5 17x 7
tan(x) =x+ + + + o(x 7 ).
3 15 315
877
► Méthode 3. Cherchons le développement sous la forme tan(x) = cxx+ f3x 3 +yx5 +6x7 +
7
o(x ). L'égalité sin(x) = cos(x) tan(x) permet d'écrire, en faisant les développements limités
d'ordre 7 de chacun des membres,
x3 x5 x7
x- - + - - - - + o(x 7 ) = cxx + (f3- cx/2)x 3
6 120 5040
+ (cx/24- f3/2 +y)x 5 + (-cx/720 + f3/24 -y/2 + 6)x 7 + o(x 7 ),
ce qui donne par identification des coefficients un système linéaire à résoudre. Ce système
étant triangulaire, sa résolution est aisée.
Ces deux applications étant similaires, nous les citons simultanément. La recherche d'équi-
valents est essentielle dans le cas des limites présentant une forme indéterminée, et les déve-
loppements limités permettent de trouver des équivalents. En voici un exemple.
► Cette fonction présente une forme indéterminée de la forme 0/0; on chercher un équi-
valent du numérateur et du dénominateur. Le dénominateur est trivialement équivalent à
f,
xn. Un développement limité d'ordre 3 du numérateur fournit l'équivalent 2 ainsi on a au
voisinage de 0, f(x) ~ Zx~-n. La limite est donc O lorsque n < 3, 2/3 lorsque n = 3 et nous
avons deux limites infinies distinctes à droite et à gauche lorsque n > 3.
Nous renvoyons aux exercices pour beaucoup d'autres applications aux déterminations de
limites. Il est essentiel d'en résoudre un grand nombre pour acquérir une pratique suffisante.
878
Soit x 0 E lR et soit f une fonction dérivable dans un voisinage de Xo telle que f'(xo) = O.
Rappelons que x 0 est un minimum local pour f si il existe un intervalle ouvert I contenant
x 0 pour lequel Vx E I, f(x) ~ f(x 0 ), et un maximum local pour f si il existe un intervalle
ouvert I contenant pour lequel Vx E I, f(x) ~ f(xo). Un minimum local est dit strict s'il
existe un intervalle I contenant pour lequel Vx E I \ {x0}, f(x) > f(x 0 ), et on adopte une
définition analogue pour les maxima stricts. Il est évidemment intéressant d'avoir des critères
d'existence de maxima ou minima en un point. Les développements limités permettent en
général de répondre à cette question.
dès que lx- x 0 1 est assez petit pour que Io((x -xoJP)I ~ 1(x - xo)P /4. Donc
(X,
f(x) ~ f(xo) + (x - x 0)P > f(xo)
2
si x est suffisamment voisin de Xo et différent de Xo. Le deuxième cas se ramène au premier
en considérant -f. Dans le troisième cas, supposons par exemple a> 0 (l'autre s'y ramène
en changeant f en -f). On a alors, en suivant une démarche analogue,
(X,
f(x) ~ f(x 0 ) + (x - x 0 )P > f(x 0 )
2
pour x voisin de x 0 et x > xo, ce qui interdit d'avoir un maximum local ; et lorsque x < x 0
est voisin de Xo
Notre étude est en fait un cas particulier du résultat suivant, qu'on invite le lecteur à
démontrer en se rapportant au précédent.
879
Le terme localement signifie ici dans un voisinage suffisamment petit de (x 0 , f(x 0 )).
dans lesquels chaque terme de la somme domine le suivant au voisinage de a. Nous voudrions
procéder à des développements du même type, sauf que l'on veut pouvoir étudier les fonctions
au voisinage de +oo, -oo, ou bien pouvoir les développer dans une autre famille que la famille
des (x - a)n. Par exemple, écrire au voisinage à droite de O le développement
x 2 x4 x 2P 2 1
COS X = 1 - 1f + 4Î + · · · + (- l)P [lp) ! + 0 (X p+ )
3 17 x 7 +o(x8)
tanx-x+x
- + 2 x 5 + IB
"3TT5
x3 x5 x 2v+i 2 +z
sh x = x + "3T + 5! + • • • + (lp + 1)! + o(x P )
x3 x5 x 2P 2 1
chx=x+1r+ 5 ! +···+ (lp)! +o(x v+)
'V= ±1
x3 xs xzv+l z z
arctan x = x - -,, + - + • • • + (-1 )P--=----,---, + o(x P+ )
.-, 5 -"'-P+ 1
x3 x5 x2v+i
argth x = x + 5 + :r 2 2
+ ... + 2p+T + o( x v+ )
-yP • 1 · 3 · · · (2p - 1) 2
1 1 + 1-vx2 + 1 · 3 x 4 + .. • + - - - - ~ ~ ~ x P+o(x P+ ) -v -
2 1
±1
J1 _ -vxz 2 T-4 2 • 4 .. • (2p) ' -
V. EXERCICES
29.1. 29.6.
Soit P une fonction p fois dérivable sur lR telle Démontrer avec un mm1mum de calculs que
que p(Pl soit la fonction nulle. Montrer que P pour tout 0 > 0 et tout x E ]0; 0[, on a
est une fonction polynôme (on pourra procéder ln(l +e)
par récurrence sur p). e x<ln(l+x)<x.
29.2.
29.7.
Montrer que pour tout n E N*, et tout x dans
] - n/2; n/2[, on a une relation de la forme Soit (x1, ... , Xn) E (lR+ln. On introduit les
tan(nl(x) = Pn(tan(x)), où Pn est un poly- moyennes arithmétiques Sn, géométriques Gn
nôme. Déterminer le degré de Pn et son terme et harmoniques Hn
dominant.
29.3.
29.4. 29.9.
Soit f : x H y'l+x.
Soit f : I -t f(I) bijective et convexe. Montrer
1. Écrire le développement de Taylor en 0 que f- 1 : f(I) -t I est concave.
d'ordre 2 de f.
2. On cherche à donner une valeur approchée 29.10.
de v'10Î (sans utiliser de calculatrice). Un étu-
diant se propose de poser x = 100 dans la for- Soit I, J deux intervalles.Trouver toutes les fonc-
mule obtenue en l. Que peut-on en dire ? tions bijectives f: I -t Jtelles que f et f- 1 soient
3. Proposer une méthode plus efficace utilisant C2 à dérivées positives (on utilisera les résultats
la même formule. de deux exercices précédents).
29.5. 29.11.
Montrer par un exemple que la composée de Éffectuer les développements limités des fonc-
deux fonctions convexes n'est pas nécessaire- tions suivantes aux ordres demandés :
ment convexe. 1. t H arccos ( sint(t)), ordre 2.
882
Notre but dans ce complément est de présenter une construction de fonctions dont le graphe
présente un plateau, représentée dans la figure suivante.
Sans plus de précision, une telle fonction sera appellée fonction plateau. Il est clairement
possible de définir des fonctions plateau, par exemple la fonction f affine par morceaux donnée
par f(x) = 0 si x < -2 ou x > 2, f(x) = x + 2 si x E [-2, -1], f(x) = -x + 2 si x E [1, 2]
et f(x) = 1 six E [-1, 1]. Cette fonction n'est pas dérivable dans R Notre problème va être
de montrer qu'il est possible de construire des fonctions plateau de classe C 00 , ce qui n'est
nullement évident. De telles fonctions sont très utilisées en mathématiques, notamment en
géométrie différentielle.
0 si X:,;; 0
<Pk(x) = { xk+ 1 six> 0 ·
Elle est donc de classe Ck sur IR.. Ce choix est bien entendu non unique. Par exemple, on aurait
pu multiplier <rk par une constante, ou bien remarquer que la fonction <rk+l répond aussi au
problème à l'ordre k.
où cpk est la fonction définie plus haut, et où ck E lR't sera choisi plus bas. Ceci a pour effet
de transformer la condition sur ]O, 1[ en une condition sur JR;:.
La fonction 'Vk est (k par composition d'une fonction (k et d'une fonction C00 ( qui est donc
Ck). Bien entendu 'Vk(x) > 0 si et seulement si x(l -x) > 0, c'est-à-dire si et seulement six E
]O; 1[. On choisit ck de sorte que J~ 'Vk = 1, c'est-à-dire que l'on pose ck = [J~ xk(l -x]kdxJ-1
(la valeur exacte de ck importe peu). On voit donc que l'on peut construire ainsi une fonction
'Vk répondant à notre question.
Nous pouvons maintenant aller plus loin. Posons pour k )! 2
Comme 'Vk-l est nulle sur JR-, llk = 0 sur JR-. La fonction TJk est dérivable, comme intégrale
fonction de la borne supérieure d'une fonction continue. Sa dérivée est 'Vk-1, la fonction TJk est
donc de classe (k sur JR. Par définition de 'Vk, on voit de plus que six )! 1, TJk( x) = J~ 'Vk( t) dt.
La fonction llk présente donc un « plateau infini», sur [1, +oo[, d'ordonnée 1.
Pour tout ex E lR, ceci rend possible la construction d'une fonction de classe (k présentant
un plateau infini d'ordonnée 1 sur [ex, +oo[, et nulle sur ] - oo, ex - 1]; il suffit bien sûr de
choisir 11L'xl(x) = 11dx + 1 - ex). Et on en déduit la construction symétrique d'une fonction
qui présente un plateau infini d'ordonnée 1 sur] - oo, 13] et nulle sur [13 + 1, +oo[, avec 13 E lR
quelconque. Il suffit de poser cj! 1(x) =11L-f3l(-x) (ou aussi cj! 1(x) = l -11j! 1(x-1)).
Il est maintenant facile de répondre à notre question sur les fonctions plateau. Posons par
exemple
F(x) = 11L-2 l(x)(( 2 l(x).
La fonction Fest de classe Ck, elle est nulle sur] - oo, -2] et sur [2, +oo[, et constante égale
à 1 sur [- 1, 1] .
Il apparaît sur les premières expressions que cp/!1(x) est de la forme cp 00 ( x) Pk( 1/x), où Pk est
un polynôme. Ceci se démontre par récurrence sur k. On a en effet bien entendu P0 = 1, et si
le résultat est vrai pour k
car lorsque t ---1 o+, on au= 1/t ---1 +oo et donc e-"-u ---1 0, car l'exponentielle l'emporte sur
les polynômes. Ainsi, on a bien l'énoncé au rang 1. Supposons l'énoncé au rang k, et soit Qk
le polynôme XPk. Nous avons
(k)( ) (k1( )
<Poo t - <Poo O = cp 00 (t) X (1/t)Pk(l/t) = <Poo(t)Qdl/t) ---1 0,
t
puisqu'encore une fois, on a une expression de la forme e-uQdu), avec l'exponentielle qui
l'emporte sur le polynôme lorsque u ---1 +oo. Ainsi, on en déduit que <Poo est k+ 1 fois dérivable
à droite en 0 et que (cp 00 )~k+ll(O) = 0, ce qui achève la récurrence.
La fonction proposée est donc de classe C00 • ■
Comme pour la dérivée première, l'argument limx.---,o+ cp;!l(x) = 0 est insuffisant pour
montrer que cp 00 est k fois dérivable en 0 (comme le montre l'exemple de la fonction partie
entière en 0). Il faut avoir auparavant montré la continuité de <Pk-l en 0 (ce qui allègerait à
peine la récurrence).
On laisse maintenant au lecteur le soin de s'inspirer de la construction précédente en classe
Ck pour obtenir une fonction plateau de classe C00 , cela se fait sans aucune difficulté.
COMPLÉMENT 2. CONVEXITÉ
Lorsqu'elle produit une quantité q, l'entreprise fait donc le profit n(q) = pq - C(q). Il est
donc naturel qu'elle cherche à rendre maximum ce profit. On constate que la fonction n est
concave, ainsi une quantité q * E JR.';_ réalise le maximum si et seulement si n' (q *) = 0,
c'est-à-dire si q* E c- 1 ({p}). Rappelons que n'est décroissante. Il y a donc trois situations
possibles (du fait que n'est strictement décroissante).
- limq---;oC'(q)?,: p. Ici le choix optimal est q* = 0 (l'entreprise ne produit rien).
- limq--->+oo C'(q) ~ p. Ici il n'y a pas de choix optimal, le profit est strictement croissant.
- Dans les autres situations, le choix optimal est l'unique élément de l'ensemble c- ({p})
1
L'hypothèse de convexité des fonctions de coût est très souvent vérifiée en pratique. En re-
vanche, la représentation continue des quantités comme q est certainement une approxima-
tion : il est difficile de produire 5678,547653 voitures ! Cette approximation est faite pour
plusieurs raisons. L'une est bien entendu la possibilité de faire des calculs de maximisation
plus aisément. Pour une autre explication, il faut penser à une entreprise fabriquant des objets
en grande quantité. Ainsi, si l'on pense à une entreprise fabriquant des clous par millions, et
si l'unité de compte est le million de clous, le chiffre pourra atteindre la sixième décimale.
Reprenons cet exemple et imaginons que le calcul donne la valeur optimale q * = 12, 14134567
millions de clous (soit 12141345,67 clous). Comme 7î est décroissante sur [0;q] et croissante
après (du fait que 7î est concave), on vérifie immédiatement que la quantité optimale sur N
est 12141345 clous ou 12141346 clous, ces deux solutions sont pratiquement les mêmes. Le
calcul au moyen de nombres réels est donc parfaitement licite, et conduit à une solution très
satisfaisante.
889
Cinquièm e partie
CALCUL DIFFÉREN TIEL
ETTE très courte partie contient seulement deux chapitres, tous deux d'introduction
où par définition le terme o(h) désigne une fonction de la forme h H hE(h), avec E de limite
nulle en O (en fait ici nulle en O et continue au point 0). Il apparaît donc deux nouvelles
fonctions : daf: h H f'(a)h, que l'on appelle la différentielle de f au point a, et Îaf: h H
f(a) + daf(h). Cette dernière est construite de telle manière que l'écart
~(h) = f(a + h) - Taf(h)
soit négligeable devant h au point O. C'est une fonction affine, somme d'une constante et
d'une fonction linéaire, et on voit facilement que c'est la seule fonction affine à posséder cette
propriété. On l'appelle application affine tangente à f au point a.
Nous avons rencontré une première généralisation de cette idée lorsque nous avons construit
les polynômes de Taylor de f au point a, qui permettent d'approcher f( a+ h) avec un écart
du type o(hn), pour n;::: 2.
Nous allons donner au chapitre 30 une autre généralisation, plus proche de l'idée initiale,
qui consiste simplement à la transposer de la manière la plus naturelle possible au cas des
fonctions de plusieurs variables. Limitons nous au cas d'une fonction f de ]Rn dans lR. Le point
a E ]Rn étant donné, il s'agit alors de trouver une fonction affine Ta(f) : ]Rn-+ JR, somme de
f(a) et d'une fonction 2 linéaire daf: ]Rn-+ JR, telle que l'écart ~(h) = f(a + h) - Taf(h)
soit négligeable devant h au point O. Mais nous n'avons pas encore défini cette dernière notion
lorsque h E lRn, l'idée est simplement de demander que l'écart soit négligeable devant
11h11 = ✓hf+···+h~
lorsque 11h11 tend vers O. Ainsi cette définition prolonge celle que nous avons donnée dans
le cas n = 1. Il n'est pas toujours possible de trouver une telle fonction da(f), on dit que
1
Il est possible de définir la dérivée de fonctions de icn dans icm, ou même de fonctions dont les variables sont
éléments d'espaces vectoriels de dimension infinie, mais nous ne nous en occuperons pas dans cet ouvrage.
2
Une forme linéaire, dans ce cas.
890
f est différentiable au point a lorsque elle existe. Lorsque f est différentiable au point a,
sa différentielle d 0 f décrit donc au premier ordre, et à une constante près, la fonction f au
voisinage de a.
Dans le cas des fonctions à une variable, ceci permettait d'étudier les variations de la
fonction : croissance ou décroissance, suivant le signe de la fonction dérivée. Ici on peut encore
parler d'une fonction dérivée, qui a tout point a où f est différentiable associe la différentielle
d 0 f, elle est donc à valeurs dans l'espace des formes linéaires L(!Rn, IR) (signalons que L(IR, IR)
s'indentifie à IR, ce qui permet de retrouver la fonction dérivée usuelle dans le cas n = 1). Mais
cette fonction ne peut rendre exactement les mêmes services que dans le cas des fonctions à
une variable: la question du sens de variation de f n'a pas vraiment d'intérêt puisqu'il y a une
infinité de directions suivant lesquelles la variable peut se déplacer (toutes les droites issues du
point a). On pourrait cependant, lorsqu'une courbe 3 est donnée dans !Rn, étudier le sens de
variation de la restriction à f à cette courbe, mais cela n'a pas vraiment d'intérêt en général.
Le calcul différentiel s'oriente plutôt dans une autre direction. Notons d'abord que ce qui
vient d'être dit pour les fonctions de !Rn dans IR se transpose sans changement au cas des
fonctions à valeurs dans !Rm, étant entendu que d 0 (f) est dans ce cas une application linéaire
de !Rn dans !Rm, et que le terme o(h) est lui aussi à valeurs dans !Rm. Notons aussi que tout
ceci n'est rendu possible que par les constructions que nous avons introduites dans la partie II.
Le but du calcul différentiel est, dans un premier temps, de mieux comprendre la structure
de l'égalité f( a+ h) = f( a)+ d 0 (f) + o(h) et en particulier du terme o(h). La question la plus
naturelle étant de savoir s'il est possible de supprimer ce terme, en se livrant à des manipula-
tions sur les variables, c'est-à-dire en procédant à des changements de variables bien compris.
La réponse est affirmative dans le cas ou n =met où la différentielle d 0 f est bijective4, c'est
l'objet du théorème d'inversion locale qui affirme qu'il est possible de« tordre »légèrement les
coordonnées au voisinage du point a pour qu'il soit possible de supprimer le o et pour que
l'application f se comporte dans ces nouvelles coordonnées exactement comme une application
linéaire. Dans le cas des fonctions de IR dans IR, ceci veut simplement dire qu'au voisinage
d'un point en lequel le nombre dérivé n'est pas nul, il est possible de changer la coordonnée
de l'ensemble de départ, par exemple, pour que le graphe de la fonction devienne une droite,
ce qui se comprend assez facilement. Nous ne donnerons cependant pas ici le théorème d'in-
version locale exactement sous cette forme, nous verrons simplement (et sans démonstratio n
complète) qu'au voisinage de tout point où la différentielle d'une fonction est bijective, la
fonction elle même est aussi bijective.
Dans le cas plus général des fonctions de !Rn dans !Rm avec n f= m, il faut modifier un
peu la question précédente pour la rendre plus claire, et se demander comment interpréter
le fait qu'il soit possible de supprimer le terme o(h) dans l'égalité fondamentale. On le fait
en remarquant que dans notre énoncé précédent (n = m), dire que f est localement une
bijection revient à dire que dans un voisinage du point image f (a), tout point admet un
unique antécédent par la fonction f. Il est donc légitime de se demander si dans le cas où
n f= m il est encore possible de décrire simplement l'image inverse f- 1 ({y}), que nous avons
appelée la fibre au-dessus de 1}. On s'aperçoit facilement que cette question n'est pertinente
que dans le cas où m 2:: n. Dans ce cas, sous certaines conditions que nous préciserons,
il est possible de montrer que la fibre f- 1 ({y}) est le graphe d'une fonction entre espaces
convenablement choisie. Cette nouvelle fonction, introduite au moyen de la résolution de
l'équation f(x) = 1J (équation des fibres) est appelée fonction implicite, et le théorème que
3
Notion qui reste à définir.
4
Et ou la fonction dérivée est continue, autre notion à définir.
891
nous évoquons s'appelle le théorème des fonctions implicites. Ce résultat est à rapprocher du
problème des systèmes linéaires, dans le cas où ils ont plus d'inconnues que d'équations. On
choisit alors un système d'inconnues auxiliaires, par rapport auquel les inconnues principales
s'expriment au moyen d'une application linéaire. Cette application est, dans ce cas très simple,
la fonction implicite que nous avons décrite plus haut. Et la possibilité de supprimer le terme
o dans l'égalité fondamentale au moyen d'un changement de variables signifie que ce même
changement ramène l'équation f(x) = y à un système linéaire de la forme que nous venons de
décrire.
La manipulation de ces théorèmes, ainsi qu'une bonne compréhension de leur nature, de-
mande une certaine familiarité avec les nouvelles notions que nous allons introduire. Cette fa-
miliarité demande à son tour l'étude détaillée d'une grande variété de situations et d'exemples.
C'est pourquoi une grande part du chapitre 30 sera consacrée à l'étude des courbes planes,
2
c'est à dire des images des fonctions de li dans 11 , qui permettront d'appréhender plus
concrètement les difficultés propres à cette nouvelle théorie, que nous ne présenterons ici que
de manière très illustrée. Nous remettrons aux cours de 12 et 13 une étude beaucoup plus
fine des théorèmes et de leurs applications.
Le chapitre 31 est lui aussi basé sur la possibilité de dériver des fonctions, dans la mesure
où il devient alors naturel d'envisager des équations fonctionnelles, qui font intervenir à la
fois les fonctions et leurs dérivées. Ces équations s'appellent des équations différentielles. Elles
ont été essentiellement inventées par Newton pour la résolution du problème de l'évolution
des planètes posé par Kepler. De manière plus générale, la théorie des équations différentielles
s'est souvent nourrie de problèmes issus du monde physique, et par là même est l'un des lieux
privilégiés de l'interaction entre mathématiques et physique.
Plus précisément, une équation différentielle est une écriture de la forme
où Fest une fonction de 11n+l dans li, vérifiant certaines conditions de régularité, et où f est
la fonction inconnue, définie sur un intervalle de li et à valeurs dans li, f', ... , f(n) désignant
ses dérivées successives. Résoudre cette équation, c'est trouver toutes les fonctions f définies
sur un intervalle I de li et n fois dérivables sur cet intervalle, telles que pour tout t E I,
l'équation F(t, f(t), f'(t), ... , f(nl(t)) = 0 soit satisfaite.
Il existe de nombreux problèmes physiques donnant lieu à des équations de cette forme.
Si l'on considère un point matériel de masse m dans l'espace soumis à l'action d'une force
cp dépendant de sa position, et si le référentiel dans lequel on repère la position du point
est Galiléen, la dérivée seconde de cette position x(t) par rapport au temps vérifie l'équation
fondamentale de Newton
mx"(t) = cp(x) (N)
qui est bien de la forme (E). Par exemple, l'évolution d'un point matériel de masse m soumis
à l'attraction d'un point matériel fixe de masse M situé au point x 0 sera décrite par l'équation
GM(x-xo)
x"(t) =
llx(t)-xo(t)ll 3
que l'on appelle équation de Kepler. Il est très remarquable que l'on sache résoudre cette
équation, qui montre que les trajectoires suivies par le point matériel sont des coniques, ce
que nous verrons en détail dans le cours de 12. Ces solutions s'avèrent être avec une bonne
précision conformes aux mouvements observés des planètes ou des comètes (ellipses, paraboles
ou hyperboles, suivant l'énergie).
892
Il existe en fait extrêmement peu d'exemples d'équations différentielles qu'il est possible
de résoudre explicitement au moyen de fonctions élémentaires. Le meilleur exemple que l'on
puisse donner est certainement celui du problème des trois corps, qui décrit l'évolution de
trois particules dans l'espace soumises à l'interaction gravitationnelle. Ce problème a une
longue histoire. Après des tentatives infructueuses de résolution jusqu'à la fin du XIXe siècle
(mais qui ont malgré tout ouvert la voie à de très importantes avancées mathématiques) le
mathématicien Henri Poincaré a donné une première preuve du fait qu'il est impossible de le
résoudre (dans un sens qu'il convient de préciser, et qui n'est pas exactement le même que
celui que nous avons posé comme définition).
L'exemple le plus important d'équations différentielles qu'il est possible de résoudre est
celui des équations linéaires à coefficients constants, comme on pouvait peut-être s'y attendre
eu égard de la simplicité des applications linéaires que nous avons déjà maintes fois signalée.
De manière plus précise, une équation de la forme (E) est dite linéaire homogène à coefficients
constants si l'application F est une forme linéaire de !Rn dans IR, ne dépendant pas de son
premier argument t. L'équation (E) a dans ce cas la forme
et on montre qu'il est possible d'expliciter ses solutions au moyen de fonctions élémentaires.
On peut aussi résoudre par des moyens semblables les équations de la forme
(l2)
lorsque g est une fonction continue. L'objet du chapitre 31 est d'exposer les bases de la
résolution de telles équations lorsque n = 1 ou n = 2, ainsi que d'envisager le cas où les
coefficients Un dépendent du temps.
Nous avons inclus ce chapitre dans la partie d'introduction au calcul différentiel, ce qui
correspond d'ailleurs à la tradition. Ceci peut paraître un peu abusif, puisque les dérivées
d'ordre n d'une fonction d'une variable réelle ont été définies et étudiées au chapitre 29. Il
aurait donc été possible d'étudier ces équations dans la partie d'analyse. Mais il faut tenir
compte du fait que, même si cela n'est pas explicitement signalé, ces équations différentielles
linéaires apparaissent en général dans les problèmes, comme approximations locales au premier
ordre d'équations du type (El, dans lesquelles la fonction F (ou la fonction partielle obtenue
en fixant la première variable) est remplacée par sa différentielle en un point donné.
Citons deux exemples. L'équation du pendule simple, repéré par son angle par rapport à
la verticale, est de la forme suivante
(c'est-à-dire de la forme (ll) ou (l2) avec n = 2), éventuelleme nt avec un second membre g
périodique. Ces constituants R, l, C (résistance, impédance, condensateur ) sont à la base de
la construction des appareils électroniques usuels (bien qu'ils apparaissent maintenant inté-
grés dans des ensembles énormes de constituants de taille extrêmement réduite, et qu'ils ne
soient pas les seuls à intervenir dans ces complexes). Supposons néanmoins par exemple qu'un
système électronique soit formé de ces constituants, par exemple une sonnerie de téléphone
portable (là encore, il est possible de la construire avec des composants R,L,C, mais les mé-
thodes actuelles permettent de le faire beaucoup plus commodémen t). Lorsqu'un tel système
fonctionne par exemple avec une pile de 4,5 V, on entend un air familier. On peut alors se
poser la question de savoir ce qui se passe si l'on branche le système sur une source de tension
beaucoup plus élevée (par exemple 220 V continus). Il est clair pour chacun que le système
va se détériorer. Or si ce système était linéaire, on entendrait le même air, simplement joué
beaucoup plus fort. Même sans aller jusqu'à la détérioration , on peut simplement multiplier la
tension par 4, et on s'aperçoit rapidement que les effets sont beaucoup plus complexes qu'une
simple multiplicatio n de l'intensité sonore. L'explication de ce phénomène tient là encore au
fait que la mise en équation du système sous forme d'équations différentielles linéaires se fait
au moyen d'une approximatio n d'une fonction très complexe par sa différentielle au voisinage
du point correspondan t au régime de fonctionneme nt habituel du circuit.
Il faut donc voir ce chapitre 31 comme une introduction à une théorie plus vaste, dans
laquelle la résolution explicite des équations n'est plus la seule source de questions. On se
pose par exemple aussi le problème de l'existence de solutions vérifiant certaines conditions
initiales, de leur comportemen t en temps fini ou de leur évolution asymptotique . Cette théorie
sera développée dans les cours de 12 et surtout de 13, elle est elle-même à l'origine d'une
théorie plus vaste et encore en plein développement, celle des systèmes dynamiques.
Chapitre 30
INITIATION AU CALCUL DIFFÉRENTIEL
OMME on l'a montré dans les chapitres précédents, il y a une classe de problèmes
f(xl- a= 0 (El
a pour ensemble de solutions Y= a+ Ker f, où a est une solution particulière quelconque de
(El. Cet ensemble est ce que l'on appelle un espace affine, il s'obtient à partir du sous-espace
vectoriel Ker f par translation au moyen du" vecteur a. Les exemples usuels d'espaces affines,
en dimension p = 2 ou p = 3, sont des points, des droites, ou des plans. Ils sont donc faciles
à déterminer et à décrire : il suffit de deux points pour définir une droite, et de trois points
pour définir un plan.
Notons que l'équation (El se met sous la forme F(xl = 0, avec F(xl = f(x) - a, F est
donc une application affine. Nous allons dans ce chapitre généraliser ce problème. Notre but
est de donner les premières bases pour résoudre des équations de la forme F(xl = 0, quand
F: JRP--, ]RQ n'est plus de la forme affine précédente. Par exemple, on peut essayer de résoudre
l'équation obtenue lorsque p = 2 et q = 1, avec
F(xl=xf+x~-1.
Dans ce cas on sait bien que l'ensemble des solutions est le cercle de centre O et de rayon 1.
Cet ensemble est d'une nature plus complexe que les ensembles de solutions précédents, c'est
un objet «courbe», alors que les ensembles précédents étaient des objets «droits». Le cercle
est cependant encore facile à décrire. Mais si nous considérons la fonction
F(xl = xf + x~ - 3x1x2
l'ensemble des solutions est nettement plus difficile à étudier, il s'agit du Folium de Descartes.
On voit donc qu'on peut, lorsque la fonction F n'est plus affine, avoir à affronter des
situations beaucoup plus complexes que celles que nous connaissons.
L'idée générale du calcul différentiel est, comme nous l'avons fait pour les fonctions d'une
variable réelle, d'approcher les fonctions générales par des applications linéaires (ou plus exac-
tement affines), au voisinage de certains points. Nous avons dans ce but introduit la notion
de nombre dérivé en un point pour une fonction à une variable, défini comme la limite du
taux d'accroissement de la fonction en ce point (lorsque cette limite existe), et permettant
de définir la meilleure approximation affine de cette fonction au voisinage du point considéré.
Nous allons dans ce chapitre présenter la notion de dérivée de fonctions ayant plusieurs va-
riables, c'est-à-dire définies dans JRP avec p ~ 2, et nous verrons que comme pour les fonctions
à une variable ces dérivées permettent de définir les meilleures approximations affines d'une
fonction non linéaire au voisinage d'un point.
Nous ne développerons pas ici toute la théorie du calcul différentiel, elle sera étudiée plus
complètement dans les cours de 12, et surtout de 13. Il est en effet indispensable d'aborder
896
Une courbe du plan ou de l'espace est un objet « de dimension 1 ». Bien que la notion
de dimension pour des objets qui ne sont pas des espaces vectoriels n'ait pas été définie (elle
ne le sera pas avant le cours de 13 ou Ml), on peut néanmoins lui accorder le sens intuitif
usuel : au voisinage de chacun de ses point, une courbe est bien représentée par une "droite
tordue». Une surface de l'espace est un objet « de dimension 2 » : au voisinage de chacun de
ses points elle ressemble à un « plan tordu». Nous allons maintenant rappeler introduction
les différents modes de représentation des droites et des plans, qui serviront de guide à toute
notre discussion ultérieure.
Droites du plan. On peut représenter une droite ~ du plan de trois manières différentes.
1) Par une équation dite implicite (ou cartésienne):~ est l'ensemble des solutions (x, y) E IR. 2
d'une équation de la forme ax + by + c = 0 avec (a, b)-=/- (0,0).
2) Par une représentation paramétrique de la forme ~ = {(x0 +tu,, Yo + tu2), t E IR.}, avec
(xo, Yol E IR. 2 et (u,, u2) E IR. 2 \ {O}.
897
2
3) Par une représentation en graphe: t;g est l'ensemble des points (x,y) de IR vérifiant
2
y = <XX+ (3 (graphe au-dessus de l'axe des x), ou t;g est l'ensemble des points (x, y) de IR
vérifiant x = yy + ô (graphe au-dessus de l'axe des y), avec <X, (3, î' et b dans R
Il est bien entendu possible de passer de l'une de ces représentations à l'autre sans difficulté.
Le fait marquant est que chacune de ces représentations est valable pour la totalité de l'objet.
Nous verrons que ceci ne subsiste pas dans le cas des courbes.
Droites de l'espace. Calquons notre étude sur la précédente. On peut représenter une droite
t;g de l'espace de trois manières différentes.
1) Par une équation implicite (ou cartésienne) : t;g est l'ensemble des solutions de l'équation
F(x, y, z) = (0, 0), avec F(x, y, z) = (ax + by + cz + d, a'x + b'y + c'z + d') (où les vecteurs
(a, b, c) E IR 3 et (a', b', c') E IR 3 sont non colinéaires). Cette représentation fait apparaître t;g
comme l'intersection de deux plans non parallèles.
2) Par une représentation paramétrique: çg = {j(t) 1 t E IR}, avec
essaie de décrire. De plus, alors que les fonctions intervenant dans les représentations précé-
dentes étaient toujours affines, les fonctions que nous aurons à manipuler seront parfaitement
générales (polynômes, fonctions transcendantes, etc).
Considérons l'exemple du cercle 'ef' de centre O et de rayon 1 dans le plan. On le définit
comme l'ensemble
'ef' = {(x, y) E JR.21 x 2 +y 2 = l}.
Il possède donc une équation implicite de la forme F(x, y) = 0, avec F(x, y) = x 2 + y 2 - 1.
Dans ce cas, cette représentation est globale, une seule équation donne tout l'objet. Le cercle
possède aussi une représentation paramétrique
Mais il faut se rendre compte que la situation est ici beaucoup plus complexe que dans le cas
des droites et plans. En premier lieu, alors que le passage d'une représentation à l'autre était
presque immédiat dans le cas des droites, dans le cas du cercle il est nécessaire d'introduire les
fonctions sin et cos, dont l'étude est beaucou plus difficile que celle des fonctions linéaires, ce
sont des fonctions transcendantes dont la définition complètement achevée ne sera obtenue que
dans le cours de L2, grâce à l'utilisation des séries et de l'exponentielle complexe. En second
lieu, on obtient encore une représentation globale du cercle, mais il faut prendre garde au fait
que le même point du cercle est obtenu une infinité de fois, puisque la fonction t H (sin t, cos t)
est ln-périodique.
Enfin, la représentation en graphes peut aussi être obtenue, mais elle n'est cette fois plus
globale, puisque le cercle est la réunion de deux graphes au-dessus de l'axe des x, l'un situé
dans le demi plan lR. x JR.+, et l'autre dans le demi-plan lR. x JR.-. De même, 'ef' est la réunion
de deux graphes au-dessus de l'axe des y. Dans ce cas, la représentation en graphe est donc
seulement locale.
L'objet du calcul différentiel est de donner les outils pour étudier des situations analogues
de manière complètement générale. Il est très remarquable que toute la théorie repose sur le
développement d'une seule idée, celle de dérivée ( ou différentielle) d'une fonction à plusieurs
variables.
Pour terminer cette introduction, et pour développer l'intuition des phénomènes que nous
allons considérer, nous allons essayer de donner une équation de la tangente en un point a
du cercle 'ef', en utilisant successivement ses trois représentations. Nous choisirons le point
a = {1/ \l'l, 1/ v'l). On note que la tangente en a dépend seulement du comportement de la
courbe 'ef' dans un voisinage de a, on peut donc se limiter à la partie supérieure 'ef' n (JR. x lR.+)
pour déterminer la tangente au point a.
1) Commençons par la représentation en graphe, qui est la plus commode pour déterminer
les tangentes. La partie supérieure du cercle admet la représentation en graphe y = cp(x),
avec cp: x H ✓ 1 - x 2 . Alors l'équation de la tangente est donnée par
soit finalement y = -x + v'l. Notons que nous avons là obtenu une représentation en graphe
de la tangente, ce qui est directement lié au fait que nous avons utilisé une représentation en
graphe de notre cercle.
2 2
2) On peut aussi représenter le cercle par l'équation implicite x + y = 1. Plaçons nous au
point a= (x 0 , y 0 ) et regardons à quelle condition un point très proche de a, de coordonnées
(x 0 +<5x, y 0 +<5y) (où <5x et ôy sont des réels supposés très petits), appartient encore au cercle. 0
C")
Ce nouveau point doit donc vérifier l'égalité ..d
ü
2
(xo + ôx) 2 + (yo + ôy) = 1.
Raisonnons maintenant de manière intuitive. En négligeant les termes carrés, on trouve x 0 <5x+
1Joô1J = 0, soit
Xo
ôy = --ôx = -ôx.
1:Jo
Cette expression est certainement presque « correcte »lorsque ôx et ôy sont extrêmement
petits, puisqu'alors leurs carrés sont totalement négligeables devant ôx et ôy. L'idée est sim-
plement de considérer l'équation que nous avons obtenue comme celle d'un objet défini globa-
lement, qui n'approchera le cercle qu'au voisinage de notre point a initial. Il suffit pour cela
de remplacer ôx par x - x 0 et ôy par y - 1:Jo, et de considérer que x et y varient dans lR
tout entier, en omettant de leur imposer la restriction d'être proches de x 0 et y 0 . On obtient
alors l'équation y -1/v'l = -(x-1/v'l), soit y= -x + v'l, ce qui est bien l'équation de la
tangente que nous avons déterminée grâce à la représentation en graphe.
3) Enfin, on aurait pu représenter paramétriquement le cercle, comme l'image j(JR), où
j : t H (cos(t),sin(t)). Le point a qui nous intéresse est j(n/4). Si l'on calcule j'(n/4) =
(-1/v'l, 1/v'l), on constate que j'(n/4) est un vecteur directeur de la droite que nous avons
obtenue. Il suffit alors de former la représentation paramétrique
(1/v'l-(1/v'l)t, 1/v'l-(l/v'l)t)
de la droite de vecteur directeur j'(n/4) passant par le point a pour obtenir tangente à '#5'
au point a. On vérifie bien que cette droite est la même que celle que nous avons déterminée
dans les deux études précédentes.
Le point remarquable dans ce qui précède est que si l'on considère l'une des trois repré-
sentations possibles pour le cercle, la tangente sera naturellement déterminée dans la même
représentation. Le calcul différentiel nous donnera tous les outils pour manipuler convenable-
ment toutes les situations que nous venons d'évoquer rapidement. Soulignons une fois encore
qu'il s'agit d'une matière délicate, qui nécessite l'étude d'un très grand nombre d'exemples
pour s'en construire une bonne représentation.
900
1. 1. 1. Définitions générales
Nous allons commencer par étudier les propriétés des fonctions à valeurs dans IR 2 , et nous
allons d'abord leur donner un nom spécifique.
901
Définition 30.1. Un arc plan est une application y définie sur un intervalle I (non réduit
à un point) de JR, et à valeurs dans JR 2 . Une courbe paramétrée plane est l'image d'un arc
plan. La courbe y(I) est dite courbe représentative de y.
Pour bien mettre en évidence le domaine définition de l'arc considéré, on note parfois cet
arc ( I, y), bien que cette écriture soit redondante (la donnée d'une fonction sous-entend celle
de son ensemble de départ et de son ensemble d'arrivée).
Il est équivalent de se donner un arc plan y de I dans JR 2 et de se donner ses deux
fonctions composantes, c'est-à-dire les deux fonctions Yx et Yy de I dans JR 2 qui vérifient
y(t) = (Yx(t), yy(t)) pour tout t dans I. On notera parfois simplement x(t) = Yx(t), -y(t) =
Yy(t)) ces composantes, lorsqu'il n'y a pas d'ambiguité. Ainsi, chacune des fonctions x, y
est une fonction d'un intervalle I de lR dans R Il arrive aussi qu'on adopte une notation en
colonne pour les arcs, on écrit alors
EXEMPLE 30.2. Si Fest l'application de lR dans lR définie par F(t) = (cos(t),sin(t)), les
trois arcs ([0,2n), F l[o,2 niL ([0,4n], F l[o,4 nil et ([0,2n], (t H F(-t)) sont de même image mais
ils sont différents. Dans une interprétation de nature cinématique, on voit par exemple que
le premier parcourt le cercle une seule fois dans le sens direct, le second deux fois dans le
même sens, enfin le troisième parcourt le cercle une seule fois dans le sens indirect.
Cette équivalence entre la donnée d'un arc et celle de ses composantes permet de définir très
simplement les notions de limite, continuité et dérivabilité des arcs. Rappelons que si I est un
intervalle d'extrémités u :Sv, son adhérence (c'est-à-dire l'ensemble de ses points adhérents)
est l'intervalle fermé [u, v].
Définition 30.4. Soit I un intervalle non trivial de lR et y un arc défini sur I. Soit a un
point adhérent à I. On dit que y a pour limite f = (fx,fy) E JR 2 au point a lorsque les
deux composantes Yx et y1-J ont pour limite fx et fy au point a respectivement. On note alors
limt-rn y( t) = f
902
Cette définition est très simple, elle à l'avantage de n'utiliser aucune nouvelle notion. Mais
il est très important pour la suite de comprendre la notion de limite d'une autre manière,
qui met en évidence la notion de distance entre les points de lR?. 2 . En effet, un arc est une
fonction à valeurs dans lR?.2 . Dire qu'un arc y possède une limite€ E lR?.2 en un point a signifie
intuitivement que la distance entre y(t) E lR?. 2 et € tend vers 0 lorsque t tend vers a. Pour
donner un sens à cette intuition, il faut au préalable donner une définition de la distance entre
les points de lR?. 2 •
Rappelons qu'on peut mesurer la longueur d'un vecteur u de lR?. 2 à l'aide de sa norme
euclidienne, définie par
llull = + y2.Jx2
2
La distance de deux éléments u et v de lR?. est alors par définition la norme euclidienne de
leur différence
distance(u,v) = llu-vll = llv-ull-
Les propriétés suivantes de la norme euclidienne sont élémentaires mais fondamentales.
PREUVE. Les propriétés 1) et 2) sont évidentes. L'inégalité triangulaire 3) est une consé-
quence de l'inégalité de Cauchy-Schwarz. Pour montrer 4), on constate que
donc llull - llvll ::; llu - vll- De plus, Il - vll = llvll par 2). Il en résulte en changeant v en -v
que llull - llvll ::; llu + vll- En intervertissant u env, on obtient llvll - llull ::; llu + vll- Donc
Proposition SQ.6. ·Soit I un ànter'IJ(J,lle '1,(J'n trima( de J, et y un arç défini fJtJ.1' l,$oit a u~
point àdhérent à I. Alors limt➔ a y{ t) ,:;, l si et seulement si lirilt➔a lly(t) -tJf = o. . ... .
on obtient limt-ia lly(t) - €11 2 = O. On sait de plus que la fonction cp: t H v't, de JRt+ dans lRt,
est continue en 0, et vérifie cp(0) = O. Par composition, on voit que
ce qui montre que si y possède une limite au point a, alors la distance de y(t) à cette limite
tend vers O lorsque t tend vers a.
Réciproquement , supposons lly(t) - fil lorsque t -1 a. Notons que
Il en résulte que limt-rn IYx(t)-fxl = 0 par le théorème des gendarmes, et donc que limt-rn Yx(t) =
fx. Le même argument montre que la limite est nulle pour l'autre composante, ce qui termine
la preuve de l'équivalence. ■
Comme pour les fonctions à valeurs réelles, nous pouvons maintenant donner la définition
de la continuité d'un arc plan en un point de son intervalle de définition.
EXEMPLE 30.8. Voici quelques arcs (dont on pourra à titre d'exercice essayer de tracer
l'image).
► L'arc y: JR~ -11R défini par y(t) = (e-t, t ) est continu sur JR~, et limt--; 0 y(t) = (1, 0).
2 2
2
► L'arc y: JR~ -1 JR défini par y(t) = (sin(l/t), t ) est continu sur JR~, mais n'a pas de
2
limite en O.
► L'arc y: JR~ -1 JR défini par y(t) = (sin(l/t), e-t) est continu sur JR~, et a pour limite
2
(0, 0) en +oo.
On traduit ainsi facilement la continuité en termes de distance : l'arc y est continu ena
lorsque la distance de y (t) à y (a) tend vers O lorsque t tend vers a. De la même manière que
pour la continuité, on peut définir la dérivabilité des arcs composante par composante.
Définition 30.9. Soit I =]ex, 13[ un intervalle non trivial de lR ety un arc défini sur I. Soit
a E I. Alors on dit que y est dérivable au point a lorsque ses composantes Yx et Y-y sont
toutes deux dérivable au point a. On note alors
Pr:oposiiijpn 30~10~ .So# {::z}«. ~[ 'Un in:teey(Ûleno11. trlwd de 1R ~t y. un "ro déji:ni sur I.
Soit a E I. Alors y t3st dédvable çiu point a si et seùlement sil'e:Epre$sitm, ·· ·
l. . ...
ÎÎ.(Yx[ t+ h.}-y,,,{t), Yy{t + h.) -yy(t))
Définition 30.11. Soit I = [ex, f3] un intervalle non trivial de lR et soit y= (Yx, Y-y) un arc
défini sur I. On dit que y est dérivable à droite en ex lorsque ses composantes Yx, Y-y sont
toutes deux dérivables à droite en ex. On définit alors le vecteur dérivé à droite de y en ex,
par
y~(ex) = ((Yxl~(ex), (yy)~(ex)).
On a une définittion analogue pour la dérivée à gauche en f3.
On peut maintenant passer à la définition de la dérivée d'un arc, et de la classe de diffé-
rentiabilité d'un arc.
Définition 30.12. Soit (I, y) un arc plan. Lorsque l'arc y est dérivable en tout point de I,
on dit que y est dérivable dans I, et on définit l'application dérivée y' de I dans JR 2 comme
l'application t H y'(t).
Comme pour les fonctions à une variable, on définit les dérivée d'ordre supérieur d'un arc.
Définition 30.13. Soit (I, y) un arc plan. Soit k EN*.
1) On dit que l'arc y est k fois dérivable si ses fonctions composantes sont k fois dérivables
dans I. On note alorsy(kl(t) = (y~k1(t),y~kl(t)) le vecteur formé par les dérivées d'ordre k
des composantes au point t, on l'appelle vecteur dérivé d'ordre k de y en t.
2) On dit que l'arc y est de classe Ck si ses fonctions composantes sont de classe Ck dans
I.
Nous verrons dans la suite comment définir la dérivabilité sans avoir recours aux compo-
santes. En pratique, nous étudierons des arcs de classe au moins C 1 , sauf éventuellement en
des points isolés. Il faut noter que si l'on suppose seulement qu'un arc est continu, son image
peut réserver quelques surprises. Par exemple, comme nous le verrons dans le cours de 12,
Péano a montré que le carré plein [O, 1]2 du plan est l'image d'un arc continu. En ce sens, le
carré plein est une courbe paramétrée continue !
C'est encore l'équivalence entre la donnée d'un arc et celle de ses composantes qui va nous
permettre de définir facilement la notion de développement limité pour un arc plan.
Définition 30.14. Soit (I, y) un arc plan. Soit a un point adhérent à I. On dit que y
possède un développement limité à l'ordre k au point a lorsque ses deux composantes Yx et
Y-y possèdent des développements limités à l'ordre k au point a.
Le dernier terme de ce développement peut aussi se noter o( (t - a Jk). Pour donner un sens
à cette notation, nous avons besoin de la définition suivante.
905
Définition 30.15. Soit a E JR. Soit y un arc plan défini au voisinage de a. Soit k EN. On
dit que y est négligeable devant (t - a) k lorsque t tend vers a (ou au point a) lorsque
On voit facilement que y est négligeable devant (t - a) k lorsque t tend vers a si et seulement
si ses deux composantes Yx et )'y sont négligeables devant (t-a)k lorsque t tend vers a. C'est
ce qui permet de justifier la notation précédente pour le dernier terme du développement
limité d'un arc plan.
Lorsque l'intervalle I est un voisinage de a, et lorsque l'arc y est k fois dérivable au point
a, comme ses composantes sont par définition k fois dérivables en a, nous avons vu qu'elles
possèdent un développement limité à l'ordre k au point a. Par définition même, l'arc y possède
donc aussi un développement limité à l'ordre k au point a.
De manière plus précise, on peut énoncer la proposition suivante.
La preuve de cette proposition est une conséquence directe des définitions précédentes et
de la formule de Taylor-Young appliquée aux composantes de l'arc y.
Définition 30.20. On dit que deux arcs (I 1 , yi) et (I2, Y2) sont Ck-équivalents s'il existe un
Ck difféomorphisme cp de I 1 sur I2 qui vérifie
Yl = Y2 o cp.
L'application cp s'appelle alors un changement de paramétrisation de classe Ck.
On notera que si deux arcs sont Ck-équivalents, ils sont aussi Ci-équivalents pour tout
E {1, ... , k}. Pour tout k ~ 1, on voit que deux arcs Ck-équivalents ont la même courbe
représentative, puisque avec les mêmes notations
Si l'on veut tracer la courbe représentative d'un arc, il est donc intéressant de choisir un arc
C 1-équivalent qui soit le plus simple possible.
on voit que c'est le graphe de fly• La courbe image de l'arc initial est donc un graphe au-dessus
de l'axe des x.
EXEMPLE 30.21. Soit à tracer la courbe représentative de l'arc (JR, y), avec y(t) = (t 2, t 3 ).
► Découpons notre courbe en trois parties : les courbes de (JR~, y+), (lR'_, y_), où y+ (resp.
y_) est la restriction de y à JR~ (resp. JR'_), et le point O = (0, 0) = y(0). Nous verrons plus
tard que l'on peut déduire l'image de (JR'_,y_) de celle de (JR~,Y+l par des arguments de
symétrie, nous allons pour l'instant ignorer cet aspect des choses.
► Sur JR~ la première coordonnée x : t H t 2 est un C00 difféomorphisme sur JR~, on peut
donc trouver un arc ri+ C 00 -équivalent à y+ en composant par l'application réciproque x- 1 ,
907
312
comme nous venons de le voir. Cet arc est donné par lJ+(t) = (t, t ), sa courbe est le graphe
de la fonction f +: ]R~ -----+ JR définie par f +r X) = x 312 .
► On peut faire la même étude sur lR"._, la courbe représentative de y_ est le graphe de la
2
fonction f_: JR~-----+ lR définie par L(x) = -x31 .
► En cherchant x en fonction de 1}, on aurait pu obtenir un arc « C0-équivalent »à (JR, y),
avec une seule expression x = sgn(y)lyi 213 . Mais cet arc n'est pas ci-équivalent à y puisque
la bijection réciproque de x H x 3 n'est pas dérivable en O.
et le vecteur (Yx(t+ h)-Yx(t 0 ),yy(t+ h)-yy(t 0 )) est précisément le vecteur défini par la
corde issue de y(to) et passant par y(to+ h). Si la limite existe, elle indique certainement une
position limite de la corde lorsque le point courant se rapproche du point initial y(t 0 ).
Mais cette « définition »heuristique pose plusieurs difficultés. Tout d'abord, elle exclut le
cas des points en lequels y'(t 0 ) n'existe pas, où encore celui où y'(to) est le vecteur nul. Par
9 9
exemple, la courbe paramétrée définie par l'arc y(t) = (t , 2t ) est en fait une droite (la droite
d'équation 1} = 2x). Sa tangente en tout point est donc évidemment bien définie. Mais pour
t = 0 le vecteur dérivé y'(t) est nul, notre définition préliminaire ne convient donc pas.
On voudrait également pouvoir traiter le cas des demi-tangentes, comme celui de l'arc
y(t) = (t 2 , t 3 ) au point t 0 = 0, que nous avons déjà rencontré dans l'exemple précédent.
Ceci conduit à proposer la définition suivante. Rappelons qu'un point est dit intérieur à
un intervalle s'il n'est pas égal à l'une de ses extrémités.
Définition 30.22. Soit (I, y) un arc de classe ci, et soit t un point intérieur à I. On dit
que la courbe représentative r de y admet une tangente au point y(t 0 ) si y(t) # y(t 0 ) dans
un voisinage de to, et si de plus la fonction u définie au voisinage de t 0 par
1
u(tl = lly(t)-y(tolll (y(tl -y(toll
possède une limite à droite U+ et une limite à gauche u_ en t 0 , et si ces deux vecteurs
limites sont colinéaires. La tangente à r au point t 0 est alors par définition la droite passant
par y(to) et de vecteur directeur u+ ou u_ {le choix est indifférent, puisque U+ et u_ sont
colinéaires).
Nous allons maintenant voir que la définition précédente est compatible avec ce que l'on
souhaitait écrire dans le cas où l'arc est dérivable et de dérivée non nulle en t 0 . Introduisons
d'abord une définition.
Définition 30.23. Soit (I, y) un arc, et t 0 un point intérieur à I. On dit que t 0 est régulier si
y est dérivable en t 0 et y'(to) # O. Si y'(t 0 ) = 0, on dit que l'on a un point stationnaire. Un
arc défini sur un intervalle ouvert est dit régulier s'il est dérivable et sans point stationnaire.
908
Comme limt-->to y'(to) + e(t) = y'(tol, par définition limt->to IIY'(to) + e(t)II = IIY'(to)II- Pour
t > to il vient donc par définition de la dérivée
Ainsi, on voit que la tangente existe et qu'elle est de vecteur directeur y'(t 0 ). ■
qui permet d'obtenir comme dans l'énoncé précédent l'existence des limites u(tt) = limHt+ u(t)
0
et u(t;;-J limt->t;, u(t), et les formules :
+ _ 1 y(Pl(tol
u(t ) - u(t ) - , si p est pair,
0 - 0 - 11-y(P~~tolll p!
- 1 y(Pl(to)
u(tt) =-u(tol = 11-yrP~\tolll p! , si p est impair.
■
909
Remarque. Dans la démonstration précédente, le seul point utile est l'existence d'un déve-
loppement limité avec un terme non nul (autre que y(t 0 )). L'énoncé pourrait être légèrement
affaibli (et d'ailleurs souvent on se contente du développement limité pour obtenir la direction
de la tangente).
où la fonction TJ est négligeable par rapport à (t - t 0 )P lorsque t tend vers to (c'est le terme
complémentaire usuel du développement), et où la fonction e tend vers O lorsque t tend vers
t 0 . En effet, par hypothèse, il existe pour p + 1 ::; j ::; q - 1 un coefficient <Xj E lR tel que
y0l(t 0 ) = <Xff(Pl(t 0 ). En conséquence, le terme d'ordre j dans le développement s'écrit
avec €j(t) = (<Xj(p!)/(j!)) (t-t 0 Ji-v_ La fonction ei ainsi définie a donc pour limite Olorsque t
tend vers t 0 . Enfin, la fonction € est la somme des fonctions €j obtenues pour p + 1 ::; j ::; q - 1,
elle est donc de limite nulle en t 0 .
Pour étudier la position de la courbe par rapport à sa tangente, nous allons nous placer
dans le repère (y(t 0 ), X, Y), où X et Y sont les vecteurs de lR. 2 définis par
Q+- = {(x, y) 1 x > 0, y < 0}, Q-+ = {(x, y) 1 x < 0, y > 0}, Q-- = {(x, y) 1 x < 0, y < 0},
si l'on se donne la partité de p et de q, il est donc possible de déterminer le quartier auquel
appartient le point courant de la courbe lorsque t > t 0 et t < ta, assez voisin de t 0 . Comme
nous savons de plus que la tangente à la courbe est dirigée par le vecteur X, il est possible de
conclure aux quatre formes possibles suivantes, en fonction de la parité de p et q.
Si maintenant le point t 0 est l'une des extrémités de l'intervalle, on obtient facilement
l'allure de la courbe pour t voisin de t 0 en utilisant les méthodes précédentes à droite ou à
gauche de to, suivant les cas. On parle alors de manière évidente de demi-tangente, etc.
910
p impair et q impair :
l-~~•X
:
.
..
p pair et q impair : p pair et q pair
gente ordinaire point d'inflexion rebroussement de pre- rebroussement de se-
mière espèce conde espèce
Pour des raisons qui vont nous apparaître clairement, sa courbe représentative s'appelle une
astroïde. Nous allons donner en premier lieu la démarche génerale, et l'illustrer étape par étape
au moyen de notre exemple.
► Comme pour tout ton a x(-t) = x(t) et y(-t) = -y(t), on peut étudier la courbe sur
[0, 7t] et compléter par une symétrie par rapport à l'axe des abscisses. Ensuite, l'application
t H 7t- t change x en -x et laisse invariant y. Il suffit donc d'étudier la courbe sur [0, n/2]
et de faire une symétrie par rapport à l'axe des ordonnées. Ces restrictions d'intervalles
suffisent à étudier la courbe presque sans calculs. On peut aussi remarquer que l'application
t H n/2 - t échange x et 1J, ce qui signifie que l'on peut étudier la courbe sur [0, n/4] et
faire une symétrie par rapport à la première bissectrice.
Etape 2. Etude au voisinage des bornes de l'intervalle. Dans cette partie, l'uti-
lisation des développements limités ou asymptotiques est souvent indispensable. On notera
t 0 E îR le point d'étude. En pratique, on se trouve soit dans la situation où y a une limite
finie lorsque t-) t 0 (il se peut que l'on étudie seulement la limite à droite ou à gauche), soit
au moins l'une des composantes tend vers l'infini.
Dans le premier cas, on complète l'étude par la présence éventuelle d'une tangente (ou
d'une demi-tangente) et la position de la courbe par rapport à la tangente.
EXEMPLE 30.27. Les points extrêmes pour l'astroïde.
► On a y(0) = (1, 0) et y(n/4) = (1, l)/(2v'2). En n/4, la pente est -1 pour des raisons
de symétries par rapport à la première bissectrice (il n'y a pas de rebroussement car x et 1J
sont strictement monotones au voisinage de n/4). En 0, on utilise un développement limité,
qui conduit à
ainsi on sait que la tangente est l'axe des abscisses et que la courbe part dans la direction
de l'origine.
Détaillons maintenant la seconde situation. Nous sommes donc dans le cas où
(la limite pouvant être seulement à droite ou à gauche). On dit alors que la courbe admet une
branche infinie quand t -) to.
On étudie d'abord l'existence éventuelle de directions asymptotiques, puis d'asymptotes,
ou de branches paraboliques.
Définition 30.28. On dit que la droite vectorielle dirigée paru E IR2 est la direction asymp-
~i!l
totique de la courbe lorsque t-) t 0 si 11 11 (qui existe au voisinage de to) tend vers u lorsque
t -) t 0 . Si de plus il existe une droite affine 'D de vecteur directeur u telle que la distance de
y(t) à 'D tende vers 0 lorsque t-) t 0 , on dit que 'D est une asymptote. Si l'on a une direction
asymptotique mais pas d'asymptote, on parle de branche parabolique (de direction u).
Très souvent, dans la pratique, on se trouve dans la situation où au moins l'une des égalités
suivantes limlx(t)I = +oo ou limly(t)I = +oo est satisfaite (ce qui n'est pas toujours le cas,
penser ày(t) = t(cos(t),sin(t)) au voisinage de +oo). On a alors les critères simples d'études
suivants.
912
PREUVE. Étudions d'abord le cas 1). La distance entre la droite d'équation y= Yo et y(t)
est majorée 1 par :
11-y(t)- (x(t),Yolll = ly(t)-Yoi-, 0,
et donc la droite y = y 0 est bien asymptote. Réciproquement, notons que si y = Yo est
asymptote, on doit avoir y(t)-, Yo et par conséquent, comme 11-y(t)II-, +oo, !x(t)I-, +oo.
Le cas 2) est analogue.
Cherchons maintenant à quelle condition, sous l'hypothèse que !x(t)! et !y(t)I tendent tous
deux vers +oo, une droite est asymptote. On voit facilement que dans ce cas une droite V
asymptote est nécessairement d'équation cartésienne y = cxx + f3 avec ex -=/ O. On a alors
nécessairement lim(y(t) - cxx(t)) = (3, et donc en divisant par x(t) (dont la valeur absolue
tend vers +oo), lim(y(t)/x(t)) =ex.Ceci explique pourquoi dans les cas 3) et 4) nous n'aurons
pas d'asymptote.
Dans les cas 5) et 6), si la droite est asymptote, on doit avoir ex = a, puis lim(y(t) -
ux(t)) = (3, donc on obtient que l'on a une asymptote dans le dernier cas. Supposons que
lim !y(t)-ux(t)! = +oo, bien entendu il n'y a alors pas d'asymptote, mais comme y(t) ~ ux(t)
et y(t) ~ !x(t)!v'î+a2:
:1!;
où é: = lim 1 1 E {-1, l}. Ainsi on a une branche parabolique de direction (1, a) (soit de
direction y = ax).
Pour terminer, traitons complètement le cas 3) (le cas 4) est analogue). Cette fois, en
~1!;
notant é: = lim 1 1 E {-1, l}, nous pouvons dire que 11-y(t)II ~ Ey(t), et donc
1
et même égale.
913
Si cette équation admet des solutions, le point y(t 1 ) est dit multiple (on parle de double,
1
triple, quadruple, etc. en fonction du cardinal de y- (y(ti)). Bien entendu lorsque la courbe
est périodique, cette notion de points multiples n'a d'intérêt que lorsqu'il y a des points
multiples sur un intervalle [t0 , t 0 + T[, où T est la période.
Etape 5. Etude aux points privilégiés. Pour faire un tracé précis, on peut, aux points
multiples, stationnaires et d'inflexion, faire une étude de l'allure locale de la courbe.
Avant de passer à l'étude d'exemples, résumons les diverses étapes que nous venons de
décrire.
y(t) = (1 t3t
4
).
1+ t4
1. On commence par restreindre l'intervalle d'étude. Comme on a pour toute valeur de t
l'égalité y(-t) = -y(t), on peut limiter l'étude à IR+ et compléter le graphe par la symétrie
centrale d'origine O.
On constate de plus que y(l/t) = (y(t), x(t)), ce qui signifie que y([l, +oo[) se déduit de
y(]O, ll) par la symétrie axiale d'axe la première bissectrice. Ainsi, on peut limiter l'étude à
[O, 1].
2. Cet exemple ne présente pas de branche infinie.
914
-1
-1
Ainsi, sur [0, 1], on a x(t) > 0 si et seulement si t < to = W'et on a y(t) 2 O. En 0,
comme y(t) ~ (t, t 3 ) on voit que y(t) = t(l, 0) + o(t) et donc la tangente est dirigée par
le vecteur ( 1, 0) (elle est ainsi horizontale). Au voisinage de +oo, on a y( t) = (1/t 3 , 1/t) =
1/t(0, 1) +o(l/t) ce qui indique que lorsque t--) +oo, y(t) tend vers (0,0) verticalement.
En y(t 0 ), la tangente est nécessairement verticale puisque y(t 0 ) = (0;y(t 0 )) avec y(t 0 ) /= O.
On donne les valeurs approchées to ~ 0, 76, et y(to) = (3to/4; ~) ~ (0, 57; 0, 33).
4
5. Enfin, sur ]0, 1 [, il ne peut pas y avoir de points multiples puisque y est strictement
croissante. Au point limite (1, 1), on a y( 1, 1) = (1/2, 1/2) et y( 1, 1) = (-1 /2, 1/2) donc la
tangente est dirigée par (-1, 1) (sachant que y est C 1 en 1 et compte tenu de la symétrie,
aurait-on pu le prévoir?). Pour conclure notre étude, voici le tableau de variations suivi de
la représentation graphique.
t 0 1/v'J 1
x'(t) + 0 -
/x(to)~
x(t) 0 1/2
1/2
/y(to)/
y(t) 0
y'(t) +
915
3
(tl = (t (3t--2l).
y t(t-1)
1. On ne détecte pas de symétrie particulière.
2. Il reste à préciser que lorsque t tend vers +oo ou -oo, x et 1J tendent tous deux vers +oo,
et que le rapport 1)/X est équivalent à 1/(3t 2 ) donc tend vers O. On a ainsi des branches
paraboliques de direction (Ox).
y
2
'(t) = (6t (2t-
2t-1
l)) .
Ainsi les dérivées sont négatives jusqu'à t = 1/2 puis positives. On remarque aussi que
la dérivée de x s'annule (sans changement de signe) en O. Ainsi, apparaissent deux points
intéressants, correspondant aux valeurs O et 1/2 du paramètre. On calcule
On calcule aussi y'(l/2) = (-1/16;-l/4). L'étude en 1/2 est plus délicate puisque
y'(l /2) = (0, 0). On utilise donc un développement au voisinage de 1/2. On pose t = 1/2+ h,
avec h ----1 O. Il faudrait en général utiliser des développements limités, mais ici du fait que les
expressions sont polynômiales de degré inférieur à 3 (degré qui va être nécessaire pour évaluer
la position par rapport à la tangente), les dévloppements s'obtiennent immédiatement. Après
calculs, on trouve
916
y(t) ~ ( '~/11)
1. Le domaine de définition est D =] - oo; - l[U] - 1; O(Ullt'+-· Il n'y a pas de symétrie
particulière.
2. Branches infinies. Nous allons voir ici que déjà l'étude aux bornes du domaine permet
de faire une ébauche de la courbe. Aux bornes infinies, on constate que
ce qui permet de dire que la droite x = 0 (axe vertical) est asymptote et de plus qu'au
voisinage de -oo, on est dans le troisième quadrant et au voisinage de +oo, dans le premier.
Au voisinage de -1, on constate que l'on a
y(t) =- -(
t-1
t
1) ( 1)
t+l
t+l
~2
t+l
t+l
'
ce qui permet de conclure d'une part que l'axe horizontal 1J = 0 est asymptote, et que d'autre
part en (-1 )- on est dans le troisième quadrant et en (-1 )+ dans le premier.
Il reste le cas de t = O. Au voisinage de 0, on peut écrire :
y(t) =
1(
t t-l
t 2t~ 1
)
~
1t (-1)
-1 ,
et donc les deux limites sont infinies. On calcule par conséquent la limite de y(t)/x(t). Mais
(ce que l'on aurait pu voir sur l'équivalent), et donc il reste à calculer lim(y(t) - x(t)). On
trouve aisément
2
y(t) - x(t) = (t - ; ~~ + ) ---, -2,
y'(t) =
-(t2 - 2t-
(t(t + 1)) 2
l)) ,
(
1 + l/t 2
ce qui montre que 1J est toujours strictement croissante et pour la fonction x il y a des
changements aux points t1 = 1 - ,./2. et t2 = 1 + ,./2.. En ces points les tangentes sont
verticales. Remarquons que l'on aurait pu dire à vue que 1J est strictement croissante comme
somme de deux telles fonctions (car 1J (t) = t - 1/t), mais nous avons calculé les dérivées
aussi pour déterminer les tangentes. On donne des valeurs approchées des coordonnées de
ces points remarquables y(t 1 ) ~ (5,83, 2) et y(t 2) ~ (0, 17, 2) (la seconde composante est
exacte). On constate que ces deux points sont sur la droite horizontale 1J = 2.
5. Intersections avec les droites remarquables. Nous avons fait apparaître que la courbe
allait couper la droite D et les axes. Ces points nous permettront d'affiner le tracer, nous les
déterminons. Il est facile de voir que x(t) = 0 est équivalent à t = 1 et y(t) = 0 est aussi
équivalent à t = 1 (car t ED), donc la courbe rencontre les deux axes simultanément lorsque
918
t = 1. On a alors bien entendu y(l) = (0, 0), et l'on calcule y(O) = (1 /2, 2) pour dire que la
tangente a pour pente 4 en ce point. La tangente est donc la droite 1J = 4x et l'on pourrait
calculer
11(t)-4x(t} = (t-1) 2 (t+ l}(t+ 3 } ~ 8(t-1) 2
t
pour constater que la courbe reste (localement) au dessus de sa tangente.
De même, nous pouvons déterminer les intersections avec D. 11(t} = x(t) - 2 aboutit
au système t 2 (t + 3) = 0, soit t = -3. On détermine y(-3) = (-2/3, -8/3) et y'(-3) =
(-7 /18, 10/9), donc la pente de la tangente est : -20/7 ~ -2, 86.
Donnons pour conclure le tableau de variations.
a~ 5, 83, b = 0, 17, c = 2, d = 2.
Une courbe définie en coordonnées polaires est en fait une courbe paramétrique où le paramètre
est l'angle t = 0, c'est-à-dire qu'elle possède une paramétrisation de la forme
y(0) = f(0)ua.
0o
On constate aisément que u 0 est dérivable par rapport à 0 et que (u 0 )' = v 0 . Ainsi, lorsque
f est dérivable, y l'est également, et
(0x) est 0 0 + V(0 0) = 0 0 + n/2. Si p'(0 0) =/- 0, soit V(0 0) l'angle compris dans] - n/2;n/2[
tel que
p(0o)
tan(V(8 0)} = p'( 8 o).
Alors la tangente fait un angle V(8 0) avec la droite dirigée par u0 0 , et donc un angle total
80 + V(8o} avec l'axe (0x).
La recherche des points multiples consiste à trouver des couples (81, 82} distincts tels que
p(8,)cos(8 1) = p(82)cos(82)
{ p(8 1) sin(81) = p(82) sin(82)
On a nécessairement lp(8 1)1 = lp(82}I, mais la présence de ces valeurs absolues introduit un
signe. Il faut donc résoudre séparément les deux systèmes
et
EXEMPLE 30.34. Le premier exemple classique est la cardioïde dont une équation est
p = a(l + cos(0)),
où a > 0 est un réel fixé. On peut se limiter à l'étude avec a = 1, la cardioïde générale se
déduisant alors par une homothétie de centre l'origine et de rapport a.
p = 1 + tan(0/2).
La fonction p est définie sur lR \ {(2k + 1 )n; k E Z}, 27I-périodique; nous allons donc
l'étudier sur I =] - TI; 7I[.
922
Pour étudier p au voisinage den (ou -n, ce qui revient au même par ln-périodicité),
on calcule, avec les notations habituelles
sin(h)
Y(8 + h) sin(h) = (1 + tan(n/2 + h/2)) sin(h) ~- tan(h/l) ~ -2,
1 +t=-(1-1/t)
donc à t 2 + 2t- 1 = 0, soit t = 1 - vl (car t < 0). Ceci donne 8 = -n/4. Voici maintenant
le tracé de la courbe.
On peut aussi déterminer les tangentes en -n/4 et 3n/4 pour améliorer le tracé.
EXEMPLE 30.36. Soit à tracer la courbe d'équation polaire
1 - sin(8)
p-------,--
- 1 + cos(8)'
La fonction p est ln-périodique, positive, définie sur lR \ {(2k+ 1)n; k E Z}. On peut étudier
p sur [0,2n].
La dérivée de p est donnée par :
, sin(8) - cos(8) -1
p =-------
(1 + cos(8))2)
923
On détermine les points p(0) = 1/2, p'(0) = -1/4 (donc tan(V(0)) = -2), p(n/2) = 0,
p(3n/2) = 2, p'(3n/2) = -2 (donc tan(V(3n/2)) = -1 d'où une tangente parallèle à la
première bissectrice).
Il reste à étudier ce qui se passe au voisinage de 7t. Ici p tend vers +oo,
et par ailleurs,
·en posant 8 = 7t + h (avec h tendant vers 0) :
1 + sin(h) 2
p(n + h) sin(h) = ( ) sin(h) ~ -h,
1 -cos h
+oo
qui tend vers l'infini (vers à droite et -oo à gauche). Donc on a une branche parabolique
de direction (0, x). Voici le tableau de variations et la représentation graphique.
80 7t
2 7t 2n
p
½~ 0 /+0011+00~ 1
2
prix de quelques lourdeurs d'écriture, pour souligner le caractère intuitif des idées que nous
introduisons.
lim 1111-n -ull = lim cp(Jl11-n -uii2) = cp( lim llun -uJJ 2 ) = 0,
n---+oo n-+oo n--too
ce qui montre que si la suite converge, alors la suite des normes tend vers O.
Réciproquement, supposons 1111-n - uJJ--, O. Notons que
Il en résulte que limn-Joo lxn - xi = 0 par le théorème des gendarmes, et donc limn-Joo Xn = x.
Le même argument vaut pour les deux autres composantes, ce qui termine la preuve de
l'équivalence. ■
Cette équivalence permet de former une nouvelle définition pour la limite : une suite
(UnlnEN de JRP converge vers un vecteur u si et seulement si la distance 1111-n-uJJ de son terme
général à sa limite tend vers 0, ce qui correspond bien à l'intuition, et généralise de manière
naturelle la définition de la convergence dans R.
Commençons par la notion de boule ouverte, qui généralise celle d'intervalle ouvert de R.
Définition 30.42. Soit p E {1, 2, 3}. Soit a E IftP, et soit r E JR';_. La boule ouverte de centre
a et de rayon r est l'ensemble
Cette terminologie est un peu trompeuse. Il faut comprendre qu'un voisinage contient tous
les points « voisins » de a, et non qu'un voisinage ne contient que des points voisins de a.
Pour s'en convaincre, il faut voir que si V est un voisinage de a, toute partie W contenant V
est aussi un voisinage de a, en particulier W = JRP est un voisinage de n'importe quel point
a E JRP, pourtant il contient des points arbitrairement « éloigné » de a.
Terminons par une définition que nous serons appelés à rencontrer souvent.
Définition 30.44. Une partie O de JRP est dite ouverte lorsque pour tout point a de O, il
existe r > 0 tel que O contienne la boule ouverte B ( a, r). On dit alors aussi que O est un
ouvert de JRP.
En d'autres termes, une partie O est ouverte si elle est un voisinage de chacun de ses
points. Intuitivement, ceci traduit le fait que la partie O n'a pas de points à sa «frontière»,
ou encore qu'elle << entoure »chacun de ses points.
Voici maintenant une proposition souvent très utile, qui donne beaucoup d'exemples de
parties ouvertes.
Proposition 30.;,ffi. SmtP E {t,2;3}:Soit c E j,P et soît1' >'O. Aliîrs la' lJ<Jmtf ôfJll)/!Jrtê
'tJ( C, T) est Un OUfJerl âe JllP. . . . ..
PREUVE. Soit u E B(c, r). Alors lla-cll < r, donc p = r-lla-cll > O. Nous allons montrer
que la boule B(u, p) est contenue dans B(c, r). En effet, si u E B(u, p), alors
llu- cil= llu- a+ a - cll ::; llu- ail+ lia - cil < P + llu - cil = r
par l'inégalité triangulaire et la définition de p. Ceci montre que llu - cll < r, et donc par
définition que u E B (c, r). Comme u est arbitraire dans B ( a, p), on en déduit que B ( a, p) c
B(c, r). Ceci montre bien que B(c, r) est un ouvert. ■
Considérons maintenant une fonction f définie sur une partie D C JRP. Comme nous
voulons définir la notion de limite de f en un point a, il est raisonnable de demander que ce
point a puisse être approché aussi près qu'on le veut par des points de l'ensemble de définition
D de f. Ceci conduit à la définition suivante.
927
Remarque. Toute partie est contenue dans son adhérence. En effet, si a E D, a est limite
de la suite (UnlnEN définie par Un= a pour tout n EN (suite constante égale à a), dont tous
les éléments sont dans D. Donc par définition a E D. Ceci montre bien que D C D.
Nous pouvons maintenant donner la définition de la limite dans le cadre des fonctions à p
variables, pour p E {1,2,3}. Nous allons commencer par le cas des fonctions à valeurs dans
R Comme nous allons le voir, la présente définition va généraliser celle que nous avons déjà
manipulée dans le cadre élémentaire des fonctions de lR. dans R
Définition 30.49. Soit p E {1, 2, 3}, soit D C JR.P, et soit f : D ---1 lR. une fonction. On
considère un point a E D. On dit que f a pour limite i E lR. au point a, suivant la partie D,
lorsque
Ve> 0, 3rJ > 0, Vu ED, (llu- ail:::: TJ) =} (llf(u) - EII:::: e).
On écrit alors limu-ta f(u) =t
Cette définition est très semblable à celle que nous avons vue pour les fonctions à une
variable, mais elle est en fait un peu plus générale. En effet, pour une fonction à une variable,
nous avons demandé qu'elle soit définie dans un voisinage épointé du point a. Ceci revient à
demander que le domaine de définition D contienne une partie de la forme ] a - €, a[ U] a, a+€[.
Dans ce cas, le point a est bien dans l'adhérence de D. Mais réciproquement, la partie D =
{1/n In EN*} est une partie de lR. telle que 0 E D, et ce n'est pas un voisinage du point O.
la notion de limite que nous introduisons ici est donc plus générale, puisqu'elle vaut pour des
fonctions définies sur des parties plus générales.
EXEMPLE 30.50. Soit la fonction f de D = {1/~I n EN*} dans lR. définie par f(l/n) =
1 (n + 1 )/n. Alors f admet une limite au point O E D, et cette limite est 1.
Il faut aussi prendre garde au fait que la limite dépend de la partie D considérée, ce que
l'on rappelle en parlant de limite suivant la partie D.
928
On prendra garde au fait que dans le cas des fonctions de lR dans JR, nous avons impli-
citement défini la notion de limite suivant le voisinage épointé. En d'autre termes, nous ne
voulions pas tenir compte de la valeur éventuelle de la fonction au point considéré.
L'intérêt de supposer que le point a est dans l'adhérence du domaine de définition est
illustré par la proposition fondamentale suivante.
PREUVE. Supposons d'abord que limu--la f(u) = t Fixons E. > 0 et prenons une suite (Un)nEN
d'éléments de D convergeant vers a (il en existe, puisque a E D). Appliquons la définition de
la limite de la fonction f. Il existe T] E JR~ tel que pour tout u E D vérifiant llu - ail :::; T],
alors llf(u) - fll :::; E.. Maintenant, comme la suite (UnlnEN converge vers a, il existe n 0 E N
tel que pour n 2 no, lia - 1.1.nll :::; T]. Donc pour n 2 no, on aura lf(1.1.n) - Cl :::; E.. Mais ceci
montre que la suite (f(1.1.nlln converge vers C.
Pour montrer la réciproque, supposons que la fonction f ne possède pas la limite Cau point
a. Alors il existe E. E JR~ tel que pour tout T] E JR~, il existe u E D tel que llu - all :::; T] et
lf(u)-CI > E.. Pour n EN*, posons T] = 1/n. Il existe alors Un ED tel que 111.1.n-all:::; 1/n et
lf(Un) - Cl> E.. Considérons la suite (unlnEN*· C'est une suite d'éléments de D, qui converge
vers a, puisque 111.1.n - ail---, 0, et qui vérifie llf(1.1.n) - CIi 2 E. pour tout n EN*. Ceci montre
la réciproque par contraposition. ■
liniÜgJ{û)
U-fa . .
~ (littff{~iïf~.!){1,J.}}(
. . . u--ta • .U--Hl, .
..•.
Xa.ll
f(x, -y)= -2--2•
X +-y
tend vers O que si a + b > 2, c'est-à-dire (dans notre cas) lorsque ( a, b) =/- (1 , 1) . Donc si
(a, b) = (1 , 1), la fonction considérée n'a pas de limite en (0, 0).
Pour démontrer que lorsque a+ b > 2, la limite en (0, O) de f est 0, il faut encore
travailler un peu. ·La méthode générale consiste à majorer lf(x, y)I par un terme de la forme
cp ( 11 (x, 1J) Il), où cp tend vers O en O. Procédons ainsi
0 0
· If( )I < lxl l1:1lb < ll(x, 1J)ll ll(x, Ylllb = ll(x y)llu+b-2
x,y - ll(x,1:1)II 2 - ll(x,1:1)II 2 ' ·
EXEMPLE 30.55. Voici un exemple plus subtil. Considérons la fonction f définie sur D =
.d
ü
JR. 2 \ {(O, O)} par l'expression f(x, y) = 1 si 1J = x 2 et f(x, y) = 0 dans tous les autres cas.
Comme f(x, 0) = f(O, y) = 0, pour tous x et y non nuls, la seule limite possible est O. Si
l'on considère des termes sur la droite 1J = kx avec k E JR* fixé, on a f(x, y) = 0 sauf
lorsque x = k, ce qui est exceptionnel. Donc si (UnlnEN est une suite d'éléments de cette
droite tendant vers (0, 0), on aura également f(un) ----, O. Pourtant, si l'on considère la suite
de terme général Un= (1/n, 1/n2), on voit f(un) = 1 alors que (UnlnEN tend vers O. Ceci
montre que la fonction considérée n'a pas de limite en O.
Nous pouvons maintenant donner la définition de la continuité des fonctions de JRP dans JR.k.
Comme pour les limites, notre définition sera légèrement plus générale que celle que nous
avons déjà rencontrée dans le cas p = 1, puisque nous considérons maintenant des fonctions
définies sur des parties quelconques.
Définition 30.56. Soit D une partie de JRP. Soit f : D ----, JR.k, u E D. On dit que f est
continue en u si la limite de f en u suivant D existe et vaut f(u). On dit que f est continue
sur D si elle est continue en tout point de D.
EXEMPLE 30.57. Toute fonction de N dans lR est continue. En effet, il suffit d'appliquer la
définition de la limite en un point n E N pour voir que limu-rn f(u) = f(n) (on choisit par
exemple T] = 1/2).
Comme pour les limites, la continuité est stable par les opérations élémentaires.
EXEMPLE 30.59. Considérons une fonction polynôme à deux variables, c'est-à-dire une
fonction de la forme
P: (x, y) H L
aiixi-yi,
O<::i,i<::n
où les termes aii sont réels, et montrons que P est continue en (0, 0). En vertu de la proposition
précédente, il suffit pour cela de montrer que chaque fonction monôme (x, y) H aiixi-yi est
continue. Mais chaque monôme s'exprime comme produit à partir des fonctions (x, y) H x et
(x, y) H y, qui sont continues. Il est donc aussi continu, encore par la proposition précédente.
EXEMPLE 30.60. La fonction norme N: JRV--, lR définie par N(x,-y) = llx, 1111 est continue
sur JR 2 . En effet, au point (x 0 , -y 0 ), l'inégalité triangulaire conduit à
lll(x,11lll-ll(xo,11ollll:::; ll(x-xo,11-11olll,
et lorsque (x, y) --, (x 0 , -y 0 ), le terme de droite tend vers (0, 0), celui de gauche aussi. On en
déduit aisément la continuité au point (x 0 , -y 0), et donc la continuité sur JR 2.
Comme nous l'avons déjà vu dans l'étude des arcs plans, l'étude des fonctions vectorielles se
fait immédiatement au moyen de leurs composantes.
Définition 30.61. Soit Dune partie de JRV, avec p E {1,2,3}, et soit f: D--, lRq, avec
q E {1,2,3}. On note fi: D--, lR les composantes de f, pour 1:::; j:::; q. Soit a ED. On dit
que f tend vers e E lR q au point a, suivant D, si et seulement si chacune des fonctions fi
tend vers ri au point a suivant D, pour 1 :::; j :::; q, où l'on a noté fi les composantes de e.
Comme nous l'avons déjà montré dans la partie 1.1, il est facile de relier notre définition
de la limite à l'intuition usuelle.
{l
Proposition 3().63. Sôit D tint partie tJe RP; )ivet v•e ,:Z, 3}, et JJoitf ~ 1)-+ R<1, à11ec
q E {t, 2~ 3}. Alors f ·a pour limite t E JR<1 -au point tt, ~iint D, si èt;seulernent si ·_.· .
lim l!f(u) -
u-n1
tH ='lk
Définition 30.63. Soit Dune partie de JRV, avec p E {1,2,3}, et soit f: D--, lRq, avec
q E {1, 2, 3}. On note fi : D --, lR les composantes de f, pour 1 :::; j :::; q. On dit que f est
continue au point a E D, si chacune des fonctions fi est continue au point a suivant D. De
manière équivalente, f est continue au point a si
On dit que f est continue dans D si elle est continue en tout point de D.
931
Notons que nous n'avons pas donné leur domaine de définition. Comme Q est ouvert et a E Q,
il existe un rayon r > 0 tel que le disque B(a, r) soit contenu dans O. La fonction f1al est donc
définie sur l'intervalle lxo = Jxo-r, xo+r[, et fia) est définie sur l'intervalle 1110 = ]y 0 -r, y 0 +r[.
Ces fonctions sont toutes deux à valeurs réelles, comme f. Notons aussi que nous avons rappelé
en indice la coordonnée qui varie, et en exposant le point a initial (bien qu'en apparence une
seule de ses coordonnées intervienne dans chaque expression).
Il est facile de déterminer les graphes des applications partielles ainsi définies. Plaçons-
nous pour simplifier dans le cas où Q = JR 2 , alors lxo = lR et 1110 = R Le graphe de f1al est
par définition
G(f1al) = {(x, f1al(x)) 1 x E lR} = {(x, f(x, 1:!oll l XE lR}.
Il peut être identifié à l'intersection du graphe de f avec le plan 9(11ol d'équation y = y 0 . En
effet le graphe de f est G(f) = {(x, y, f(x, y)) (x, y) E JR 2 } et donc
1
Ainsi, le calcul des dérivées partielles en un point consiste à fixer une variable à la valeur
qu'elle prend en ce point, à dériver par rapport à l'autre variable, et à considérer le nombre
dérivé obtenu lorsque cette autre variable prend la valeur qu'elle a au point considéré. Le
problème de l'existence des dérivées partielles ainsi que leur calcul peut donc se traiter par
les moyens bien connus, issus de l'étude des fonctions de lR dans JR.
1J
G(f)
XQ
a
X
f
En suivant notre illustration géométrique précédente, la dérivée partielle (a) s'interprète
comme la pente de la tangente au point d'abscisse x 0 à la courbe obtenue comme intersection
du graphe de f avec le plan &,o (Yo l ; et la dérivée partielle : (a) est la pente de la tangente
en 1Jo à la courbe obtenue comme intersection du graphe de f avec le plan &,o(xal, comme le
montre la figure 30.13.
EXEMPLE 30.65. Considérons la fonction u définie sur (R\__)2 par u(x, 1J) = x"1)f3, où a
et f3 sont deux paramètres strictements positifs. Déterminons les dérivées partielles de u en
un point (xo, 1Jo) E (lR"t-)2, Pour la première dérivée partielle, on fixe 1J à 1Jo et on regarde
933
Nous sommes habitués à interpréter la dérivée en un point d'une fonction à une variable
comme la pente de la tangente à son graphe en ce point. La notion de dérivée partielle en
découle assez facilement. Mais nous n'avons pas encore construit l'objet qui serait l'équivalent
pour les fonctions à 2 variables de la droite tangente au graphe, dans le cas des fonctions à ci
C')
une variable. Cet objet doit certainement être « de dimension 2 », donc un plan, et il faut .d
donner des conditions pour que ce plan soit tangent au graphe. ü
Avant de définir convenablement ce plan tangent, nous allons essayer d'en deviner l'équa-
tion au moyen des dérivées partielles que nous venons d'introduire. Considérons de nouveau
le point a= (x 0 , y 0 ) E O. L'idée très simple est que si P est le plan tangent au graphe de f
au point a, l'intersection de P avec le plan 9(Xo l doit être la droite tangente à l'intersection
du graphe de f avec 9(Xol, c'est-à-dire au graphe de l'application partielle f~a); et de même
l'intersection de P avec le plan 9(1101 doit être la droite tangente à l'intersection du graphe de
f avec 9(wl, c'est-à-dire au graphe de l'application partielle f~aJ_ Comme ces deux tangentes
se coupent en (a, f(a)) et ne sont pas confondues, elles définissent bien un plan, qui sera le
plan tangent. Mais nous avons vu que les pentes de ces droites sont précisément les deux
dérivées partielles. Si l'on connait ces dérivées partielles, on connait les équations des droites
tangentes (ou simplement leurs vecteurs directeurs) et il est alors facile de former l'équation
du plan tangent.
Cherchons maintenant les vecteurs directeurs des tangentes. La tangente D 11 à l'intersection
du graphe de f avec 9(Xol est contenue dans 9lXol, donc la première composante du vecteur
tangent est nulle, et sa pente dans 9(Xol est donnée par : (a). Le vecteur tangent U 11 s'écrit
donc
U 11 = ( 0, 1, :: (a)).
De la même manière, la tangente Dx à l'intersection du graphe de f avec 9(1101 est contenue
dans 9(11ol, donc la deuxième composante du vecteur tangent est nulle, et sa pente dans 9l1iol
est donnée par ~(a). Le vecteur tangent lix s'écrit donc
Le plan tangent TT au graphe de f au point a est donc le plan passant par le point ( a, f (a)),
de vecteurs directeurs lix et U 11 • Pour en avoir une équation cartésienne, on écrit simplement
son vecteur normal
af af )
N = lix /\ U11 = ( - ax (a), - ay (a), 1
et on obtient l'équation de TT en écrivant que son point courant (x,y,z) est tel que le vecteur
(x-xo,Y-Yo,z-f(a)) soit orthogonal à N, soit
934
Essayons maintenant une autre approche. Prenons une fonction f : Q -, R qui admet des
dérivées partielles au point u E Q et livrons-nous à un calcul (non rigoureux, mais qui le
sera rendu plus tard sous certaines conditions). Supposons que l'on fasse subir à x 0 et y 0 des
petites variations en leur ajoutant les réels (supposés très petits) ôx et ôy. On obtient alors
en utilisant la définition des dérivées partielles, et en omettant les termes o
of
f(xo + ôx, Yo + ôy}:::::: f(xo, Yo + ôy) + ox (xo, Yo + ôy)ôx::::::
of of of
f(xo, Yo + ôy} + ox (xo, Yo)ôx :=:::: f(xo, Yol + oy (xo, Yo)ôy + ox (xo, Yo}ôx.
Nous obtenons donc ainsi une application affine, définie dans R 2 tout entier, qui va être la
meilleure approximation affine possible au voisinage de u pour l'application initiale f. Nous
avons donc ainsi trouvé l'analogue pour les fonctions à deux variables de ce que nous avions
construit pour les fonctions à une variable. Le graphe de cette fonction <D est, comme on le
voit, précisément le plan tangent au graphe de f que nous avons introduit plus haut. Les deux
approches donnent donc le même objet tangent, ce qui est satisfaisant.
Bien entendu, rien de ce qui précède n'est vraiment rigoureux. Nous allons dans ce qui suit
définir les fonctions dérivables en u comme celles pour lesquelles le procédé que nous venons
de décrire est justifié.
pour tous les h voisins de O. Prenant d'abord h sous la forme (t, 0) (t > 0 petit destiné à
tendre vers 0), nous avons
. \11l'll(Ïull Linéarité
Il faut bien voir que c'est l'application h H d 0 f(h) qui est linéaire, et non l'application
a H d 0 f(h).
La notion de différentielle pose deux difficultés. La première est la question de son existence,
et, lorsqu'elle existe, la deuxième est celle de sa détermination. Nous allons voir qu'heureuse-
ment ces questions peuvent, dans les cas usuels, se résoudre à l'aide des dérivées partielles.
Etudions d'abord un exemple trivial.
Voici comment déterminer la différentielle à partir des dérivées partielles, si l'on sait qu'elle
existe.
936
PREUVE. Démontrons la première relation. Pour cela, prenons h = (t, 0) dans la définition
de la différentielle, et posons ex( t) = E( t, 0). Alors ex est une fonction d'une variable, continue
et nulle en 0, et nous avons
f(xo + t, Yol = f(xo, Yol + daf(t, 0) + lticx(t) = f(xo, Yol + tdaf(l, 0) + ltlcx(t),
ce qui montre bien que f(xo+t,Yotf(xo,Yol tend vers d 0 f(l, 0) lorsque t tend vers 0, on en déduit
donc que *(a) = d 0 f(l,0) par définition. La démonstration de la deuxième relation est
identique. La troisième se déduit des deux précédentes, puisque la linéarité de d 0 f implique
af(a)
( ax
n'est autre que la martice de l'application linéaire d 0 f dans la base canonique ((1,0),(0, 1))
de JR 2 (au départ) et la base canonique (1) de JR, à l'arrivée. Cette matrice s'appelle la matrice
Jacobienne de f au point a, et se note Jacf(a).
Avant d'aller plus loin dans l'étude de la différentiabilité, nous allons élargir la cadre au cas
des fonctions de trois variables (il serait possible de considér des fonctions d'un nombre quel-
conque de variables, mais nous nous limiterons à trois pour permettre une intuition commode
des divers objets considérés), et à valeurs dans ]RQ, avec q E {1, 2, 3}.
Tout ce qui a été dit pour les fonctions de JR 2 s'étend sans aucune difficulté au cas des
fonctions à 3 variables, à valeurs réelles, comme nous allons le voir. Pour les fonctions à
valeurs vectorielles, il suffira simplement d'adapter ce qui précéde aux fonctions composantes,
qui sont à valeurs réelles.
Soit .Q un ouvert de JR 3, a= (xo, y 0, z0) un point de flet f une fonction de .Q dans R Alors
il existe un rayon r > 0 tel que la boule B ( a, r) soit contenue dans fl. Il est possible de
définir trois applications partielles au point a, sur lx= ]x 0 - r, x 0 + r[, 111 = ]y 0 - r, y 0 + r[,
Iz =lzo -r,zo + r[, par
937
pour x E lx, 1J E 111 et z E Iz respectivement. Lorsque ces applications partielles sont déri-
vables, on en déduit les dérivées partielles correspondantes
La démonstration est analogue à celle que nous avons donnée pour les fonctions à deux
variables. Enfin, la matrice
Jacf( a)
af
= ( ôx (a) ôf
ôz
(al)
est la matrice de daf dans les bases canoniques de IR 3 et IR, c'est la matrice Jacobienne de f
au point a.
Enfin, il est clair que lorsque p = 1 , la définition que nous avons donnée pour la différen-
tiabilité coïncide avec celle de la dérivabilité. Une fonction f définie au voisinage de a E IR et
à valeurs dans IR est dérivable en a si et seulement si il existe un réel ex tel que
Considérons maintenant une fonction définie sur un ouvert Q de IRP, p E {1, 2, 3} et à valeurs
dans IR q, pour q E {1, 2, 3}. La donnée de f est donc équivalente à celle de ses q applications
composantes f = (f 1, ... , f q). Ces composantes sont des fonctions de IRP dans IR, on peut donc
définir les applications dérivées partielles en un point a de 0, ainsi que leur différentiabilité
en un point. Il serait possible de définir la différentiabilité de f au moyen de la différentiabilité
de f des composantes. Mais nous allons en donner une définition globale équivalente.
938
Définition 30. 72. On dit que la fonction f est différentiable au point a s'il existe une
application linéaire l de JRP dans lR q et une application E définie dans Q - a, à valeurs dans
lRq, continue et nulle en 0, telles que pour tout h E Q - a,
Définition 30.74. La matrice Jacobienne de f en a est la matrice de daf dans les bases
canoniques de JRP et lRq, c'est la matrice à q lignes et p colonnes dont les éléments sont les
dérivées partielles des applications composantes de f.
éH1(a) éH1(a)
ox oy
Jacf(a) =
ôf3(a) 2.h(a)
ox ay
► Si p = 1 et q = 2, puis si p = 1 et q = 3, on obtient respectivement
ôfl(a))
Jacf(a) = ax ' Jacf(a) =
( ôf2(a)
ax
llit
ax al
939
Passons maintenant à une propriété beaucoup plus intéressante, qui concerne la composi-
tion des applications différentiables. On introduit un nouvel entier r E {1, 2, 3}.
0
~~-~;:;~, ~::~~t:J~;~~'.i:~~
O')
.d
ü
Constatons aussi que si f et g sont des fonctions à une variable et à valeurs réelles, nous
retrouvons la formule de la dérivée d'une composée. En effet
· · 1t1tttlff ~ êl11t1l.
PREUVE. Nous allons faire la démonstration avec p = q = 2 pour fixer les idées, mais bien
entendu les arguments restent valables pour tous p et q. Notre application linéaire prend la
forme l(x 1, x 2) = (l 1(xi, x 2), l2(x 1, xz)), avec li(x1, x2) = aux1 + auxz. On a successivement,
en majorant simplement lh;I par 11h11, la majoration:
et donc:
2 2
2
lll(h)ll2 = L_(li(h)) 2 :S llhll L_(lai1I + laulJ2,
i=l i=l
Nous reconnaissons l'application linéaire h H dgt(aJ(df 0 (h)) qui est notre bon candidat pour
être une différentielle. Il faut alors montrer que
C'est un calcul un peu fastidieux. Pour le premier terme, c'est trivial dans la mesure où lorsque
h tend vers 0, il en est de même de Et(h), et donc de dgt(aJ(Et(h)) d'après le lemme 30.78.
Ainsi, il vient bien
Pour le second terme, comme lorsque h tend vers 0, k tend vers O également, on sait déjà que
t: 9 (k) tend vers O. On note alors que
Mais, en vertu du lemme 30. 78, on voit qu'il existe une constante C > 0 telle que puisque
lldfa{h/llhll)II ~ C, et de plus Et(h) tend vers O. Ainsi pour h assez proche de 0, on aura la
majoration llkll ~ llhll(C + 1). Il en résulte que pour h assez proche de 0
qui est bien de la forme souhaitée, puisque (C + 1) Il t: 9 (k) Il ---) 0 lorsque h ---) O. d'où notre
résultat. ■
·:~~T4i~
J~'tgêcf)t Q}';.;;; ~q(f{éJ}j~;i{iiÎf\ ; ,·•
PREUVE. Il suffit d'utiliser la définition des matrices Jacobiennes, et la relation entre produit
de matrices et composition des applications linéaires. ■
EXEMPLE 30.80. Nous allons calculer ici la dérivée partielle d'une fonction composée. Pour
fixer les idées, disons que les fonctions f et g sont définies dans JR 2 à valeurs dans JR 2, et l'on
suppose f différentiable en a= (x 0 , y 0 ) E JR 2 et g différentiable en f(a). On veut calculer la
dérivée partielle o(~:fl (a).
► On sait que g o f est différentiable par composition, et donc on peut écrire
o(gof)
ox (a)= d 0 (g o f)((l0)) = df(alg(d 0 f(l,0)) = df(al9 (of
ox (a) ) .
Soit
o(g Of) (a)= og (f(a)) of1 (a)+ og (f(a)) of2a),
ox ox ox ox ox
où f = (f 1, f 2) (les fi sont à valeurs réelles).
Soit f une fonction définie sur une partie Q de JRP, a E O de sorte que O soit un voisinage
de a, à valeurs dans JRP. L'entier p est encore dans {1, 2, 3}, et il est important ici qu'il soit le
même au départ et à l'arrivée. On s'intéresse à la résolution de l'équation
f(x) = Y,
y étant donné et x étant l'inconnue (dans Q). Si y = f (a), il y a bien sdr (au moins) une
solution qui est x = a. On va donc chercher, pour y proche de f(a), s'il existe encore une
solution x proche de a. Pour cela, on utilise la définition de la différentielle pour écrire que
C'est maintenant que l'on va faire une opération non rigoureuse. On néglige le reste (du fait
que l'on cherche x proche de a) pour écrire que
Si l'on veut avoir une solution pour toute 1J proche de a, on a besoin que d 0 f soit surjective, et
comme c'est une application linéaire entre espaces vectoriels de même dimension, sa surjecti-
vité équivaut à sa bijectivité. Supposant alors d 0 f bijective, on voit que l'équation approchée
a une solution et une seule, qui est
Si on omet nos approximations, il semble légitime de dire que f est inversible au voisinage de
a, et que
Bien entendu, notre calcul étant fait d'approximations, on ne peut pas espérer que l'on ob-
tienne une telle expression explicite. Mais l'intuition que donne ce calcul est exacte. C'est
l'objet du théorème d'inversion locale, dont l'énoncé suit.
On se donne maintenant une fonction f définie sur un voisinage li x V d'un point a de IR2 à
valeurs réelles. On pose a= (xo, Yol et li= lxo - f., Xo + d et V= lYo - f., Yo + d, où f. > O.
On pose c = f(x 0 , y 0 ) et on s'intéresse à l'ensemble
On cherche notamment à savoir si l'on peut représenter r par une relation liant x à y, ou y
à x, au moins pour x proche de x 0 et y proche de 1Jo. On commence l'étude comme dans la
partie précédente, en remplaçant f par son expression approchée
of of
f(a) + ox (a)(x - xo) + oy (a)(y -110).
Simplifiant alors par f(a) = c, l'équation que l'on cherche à résoudre s'approche par
Les dérivées partielles de f sont des nombres réels. On voit que, sur le problème approché,
pour exprimer y en fonction de x, il est nécessaire que : (a) soit non nul, et pour exprimer
x en fonction de y, il est nécessaire que M
(a) soit non nul. Plaçons nous dans la première
situation (la seconde est analogue). On obtient alors l'égalité
y= ax+ b,
f(x, cp(x)) = c
et on aura encore cp'(xo) = a. Le théorème des fonctions implicites formalise les remarques
que nous venons de faire.
944
(f(x, y)= 1, (x, y) E ]x0 - r,, x 0 + r,[ x ]1Jo - f2, 1Jo + r2[) #(y= cp(x)).
La fonction <p est bien sëlr ici connue (il suffit de calculer), mais nous ignorerons cet
aspect des choses (provisoirement). La raison d'être des voisinages est évidente ici, puisque
bien entendu on n'a plus de relation six (f. [-1, 1] (ce qui justifie la restriction en x) et on
a deux choix de y (ce qui justifie la restriction en 1J). On ne connaît pas grand chose de <p,
sauf que
, lxo
<p (xo) = - - .
lyo
En fait, on peut aller un peu plus loin. Comme pour tout x E]xo-f1, xo+r 1 [, on a la relation
il vient en dérivant
x + cp(x)cp'(x) = O.
Supposant, quitte à diminuer r 1 , que <p ne s'annule pas sur ]x 0 - r,, x 0 + r 1 [, on voit alors
que <p est solution de l'équation différentielle
945
ce qui montre au passage que cp est c:xo et permet, par récurrence, de déterminer successive-
ment les cplPl(x 0 ) en fonction de x 0 et 1Jo. Par exemple, on sait déjà que cp(x 0 ) = 1Jo et que
cp'(x 0 ) = -x0 /1J 0 . Dérivant une nouvelle fois la relation, il vient
1 + cp'(x) 2 + cp(x)cp"(x) = 0,
cp "( Xo ) = - 31 .
1Jo
On peut ainsi donner un développement limité d'ordre 2 de la solution, au voisinage de x 0
Xo 1 2 2
cp(x) = 1Jo - -(x-xo) - 3 (x -xo) + o((x -xo) ).
1Jo 1Jo
On voit au passage quelle est l'équation de la tangente et le fait que la courbe est (localement)
sous la tangente.
Regardons maintenant le point (1, 0), en lequel l'hypothèse du théorème des fonctions
implicites n'est pas vraie. On constate dans ce cas que la conclusion n'est pas vraie non
plus, car quels que soient les réels e, et E:2 strictement positifs que l'on prendra, il y aura
dans l'intervalle )1 - e 1; 1 + e 1 [ des x pour lesquels aucun point n'est sur la courbe (prendre
x E]l; 1+e 1 [ arbitraire) et des x pour lesquels l'équation 1) 2 = 1-x2 aura deux solutions dans
] - e2; e2[ (prendre x < 1 assez proche de 1 pour que l'une des solutions soit dans] - e2; e2[,
l'autre solution sera nécessairement dans cet intervalle).
Le lecteur pourra comparer ce que l'on a obtenu dans le premier cas avec ce que l'on
obtiendrait avec l'expression explicite de cp (qui sera cp(x) = ✓ 1 - x 2 si 1Jo > 0 et cp(x) =
- ✓ 1 - x 2 si 1Jo < 0).
Il est conseillé au lecteur de discuter le cas où l'on chercherait à exprimer x en fonction
de 1J.
Cette partie est fortement calquée sur la précédente. On se donne trois intervalles ouverts
li, V, W de JR, et une fonction f définie sur li x V x W, à valeurs dans lR. Soit a= (x0 , 1Jo, z 0 ) E
li x V x W. On pose c = f(x 0 , 1Jo, z 0 ) E lR et l'on s'intéresse à l'ensemble
ôf ôf ôf
f(a) + ôx (a)(x -xo) + 0/aH1J -1Jol + ôz (a)(z - zo).
946
Simplifiant alors par fa) = c, l'équation que l'on cherche à résoudre s'approche par
On voit que pour exprimer l'une des variables en fonction des deux autres, il est nécessaire que
la dérivée partielle correspondante soit non nulle. Supposant par exemple ~(xo,Yo,zo)-/- 0,
on obtient
Z =<XX+ f3y + Y,
VI. EXERCICES
30.1. 30.5.
On reprend la définition de u dans la défini- On est intéressé par la recherche de toutes les
tion de la tangente (30.22). On suppose que u fonctions u différentiables sur R 2 qui vérifient
existe au voisinage de to, et on prend t dans ce
2 ôu ôu
voisinage. lf(x,1J) ER, ôx (x,1J) = Ô1J (x,1J).
1. Montrer que pour tout t, llu( t) Il = 1.
2. Déduire de la question 1 les normes des vec- 1. Montrer que l'ensemble des solutions est un
teurs u( ttl et u( tol (lorsqu'elles existent). En espace vectoriel.
déduire que si l'arc admet une tangente en to, 2. On cherche les solutions qui sont de la forme
on a u(tt) = u(t 0) ou bien u(ttl = -u(t0). u(x, -y) = A(x)B(1J) avec A et B non constam- ci
C')
3. Donner un exemple pour chaque situation ment nulles. Montrer qu'il existe (k, a) E lR x R* ..d
tels que pour tout (x, -y) E R 2, u( x, 1J) =
u
décrite dans la question précédente.
aek(x+11l_
4. Onnoteu(t) = (u1(tl,u2(t)) et prenons une
suite (tn) E (R;;)N de limite nulle. En utili- 3. Grâce aux questions précédentes, on voit que
sant la question 1, montrer que l'on peut trou- les fonctions <p de la forme
ver une sous-suite (tcp(n)ln telle que (u(tcp(n)lln n
ait une limite (on construira la sous-suite en <p(t) = L ai<;(tl,
· deux étapes, en se concentrant successivement j=l
sur chacune des composantes).
la fonction (x, 1J) H <p (x + 1J) fournit une solu-
tion. Montrer que c'est bien le cas pour toute
30.2.
telle fonction, avec <p : R H R arbitraire et dé-
rivable.
Soit <X E R irrationnel. Montrer que l'adhé-
4. On établit maintenant la réciproque à la
rence de l'image de l'arc (R;y) où y(t) =
question précédente. On introduit le change-
(cos(t); cos( cxt)) est [-1; 1] 2 (on utilisera que
ment de variables cp(x, 1J) = (x + 1J, x -1) ). Soit
si <X est irrationnel, Z + <XZ est dense dans R).
u une solution, et on introduit v de sorte que
L'arc y est-il périodique? u = vo cp (c'est-à-dire que v = uo cp- 1 ). Notons
ô1v et ô2v les dérivées partielles de v. Vérifier
30.3.
que ~~(x, 1J) = ô1v(x+1J, x-1J)+ô2v(x+1J, X-1Jl
et calculer de même t(x, 1!) en fonction de
On considère la fonction f définie de R 2 dans
ô1v(x+1J, X-1J) et ô2v(x+1J, X-1J). En déduire
R par f(x, 1J) = 1 lorsque 1J = x 2 et f(x, 1!) = 0
que v vérifie ô2v = 0, puis conclure.
dans les autres situations.
1. Trouver deux suites (xnlnEN et (-YnlnEN de
30.6.
réels convergeant vers 0 de sorte que f(xn, 1Jn)
ne tende pas vers 0 = f(0,0) (ainsi f n'est pas
On considère l'ensemble r des couples de réels
continue en (0, 0)).
(x, 1J) satisfaisant la relation
2. Montrer que f admet des dérivées partielles
en (0,0) et les déterminer. Au vu du résultat
de la question précédente, celui-ci vous paraît-il
surprenant ? Soit (0,0) Er.
1. Vous semble t-il possible d'exprimer à l'aide
30.4. d'une formule explicite 1J en fonction de x? x
en fonction de 1J? Si oui, donnez l'expression.
Trouver toutes les applications f : R 2 --, JR, dif- 2. Le théorème des fonctions implicites s'ap-
férentiables sur R 2, telles que pour tout h E R 2, plique t-il pour exprimer x en fonction de 1J?
l'application (x,1J) H df(x,y)(h) soit linéaire. -y en fonction de x ?
948
'INVENTION du calcul différentiel à la fin du XVIIe siècle par Newton, puis indépen-
L damment par Leibniz dont les travaux sur les infiniment petits éclaircis par les frères
Bernoulli 1 , a permis la résolution de nombreux problèmes réputés à l'époque in-
solubles par le calcul analytique. En dehors des déterminations de minima ou de maxima,
le « nouveau calcul» a très vite fait ses preuves dans l'étude des courbes mécaniques - l'ex-
pression est employée par le Marquis Michel de L'Hospital dans son Analyse des infiniment
petits - telle que la tractrice : quelle est l'équation de la courbe décrite par un objet remorqué
le long d'une droite par un câble tendu de longueur constante ?
\
\
\
\
\
\
\
\
N
Mise en équation Courbe obtenue
Ce problème, initialement étudié par Huygens, fut résolu par Leibniz en 1693. La remarque
essentielle est que, puisque le câble est supposé tendu, il est porté en tout point par la tangente
à la courbe recherchée. Choisissons l'axe (Ox) selon la droite de remorquage puis (Oy) tel que
l'on obtienne un repère orthonormé direct du plan. Notons y(x) l'ordonnée du point d'abscisse
x de la tractrice, C la longueur du câble, et M(x,y(x)) et N(xN,0) les extrémités du câble.
Puisque (MN) est tangente à la courbe en M, on a
1
Les idées de Newton dateraient de 1671 et celles de Leibniz de 1684. Jacob et Johann Bernoulli ont étudié le
sujet vers les années 1691-1692; ils initièrent Le Marquis de L'Hospital à ce « nouveau calcul».
950
Nous avons donc à résoudre une équation dont l'inconnue est une fonction -y dérivable.
Cette équation ne faisant intervenir que la dérivée première est appelée équation différen-
tielle d'ordre un. L'introduction du calcul différentiel a donc permis la mise en équation de
ce nouveau type de problème. Une nouvelle classe de questions est alors apparue : comment
résoudre ces équations 2 et, si les tentatives de calcul échouent, peut-on tout de même décrire
quelques propriétés des éventuelles fonctions solutions (existence, unicité, les solutions sont-
elles bornées, etc) ?
Ce chapitre sur les équations différentielles portera essentiellement sur la résolution d'une
classe d'équations bien connues et sur lesquelles on dispose de nombreux résultats, il s'agit des
équations différentielles linéaires d'ordres un et deux dont nous allons préciser la définition
dans ce qui suit. L'étude d'équations plus générales sera abordée dans le cours de 12.
Les fonctions <X et 13 sont les coefficients de l'équation et y s'appelle le second membre de
l'équation; l'équation homogène associée (EH) est souvent qualifiée d'équation sans second
membre. On dit que l'équation (E) est linéaire parce que l'inconnue -y apparaît de manière
2
Nous renvoyons le lecteur aux exercices de ce chapitre, parmi lesquels il trouvera la solution de l'équation
différentielle de la tractrice.
951
linéaire au premier membre. Plus exactement, si la "fonction" <l> qui, à une fonction 11 (déri-
vable sur I), associe la nouvelle fonction <l> (11 l = ex 11' + 1311 est linéaire, comme on le vérifie
facilement. Cette linéarité aura des conséquences fondamentales dans la suite, par exemple
par le biais du principe de superposition. L'équation (El est dite d'ordre 1 car elle ne fait
intervenir que la dérivée d'ordre 1 de la fonction inconnue 11·
On notera Y l'ensemble des solutions de (El et Ytt l'ensemble des solutions de (EHl-
Convention de résolution
On adoptera la convention suivante : lorsque les coefficients et le second membre de
l'équation sont tous à valeurs réelles, on ne recherchera que les solutions de (El à valeurs
réelles, sauf mention contraire. En effet, les équations à coefficients réels ont souvent une
origine physique et seules les solutions réelles sont alors intéressantes. Mais il ne s'agit ......
là que d'une convention, il est toujours possible de rechercher les solutions à valeurs C'"l
..d
complexes. ü
Définition 31.2. Soit (El une équation différentielle linéaire d'ordre un. On appelle courbe
intégrale de (El le graphe d'une solution de l'équation (El. Une courbe intégrale est donc
une partie de lR x R
Lorsque le coefficient ex ne s'annule pas sur I, (El est équivalente à 11' + !\!!11 = :\!l,
c'est-à-dire 11' + a(tl11 = b(tl en posant et b = a=! !-
On remarquera que les fonctions a
et b ainsi définies sont continues sur l'intervalle I.
Définition 31.3. Une équation (El du type 11' + a(tl11 = b(tl sera dite réduite.
Nous étudierons d'abord la résolution des équations réduites avant de revenir en fin de
parcours aux équations différentielles générales du premier ordre.
Nous pouvons maintenant résoudre par exemple l'équation de décharge d'un condensateur
établie ci-dessus, u~ + RCuc = O. La tension Uc aux bornes du composant est de la forme
uc(tl = Àe-t/'r où 't = 1/RC, avec À ER
952
Le cas d'une équation à coefficient variable se traite suivant le même principe : il s'agit
de multiplier l'inconnue par une exponentielle bien choisie, pour faire apparaître une nouvelle
équation que l'on sait résoudre.
Comme dans le paragraphe précédent, et comme le montre la preuve, le choix des deux
primitives (A primitive de a et B primitive de t H b(t)eA(tl) est arbitraire. On peut aussi le
vérifier directement. En effet, modifier A par addition d'une constante u revient à multiplier
-y par e-u, alors que B est changée en euB, il suffit alors de changer À en eu;\ pour que la
solution soit inchangée. De même, on vérifie que l'addition d'une constante à la fonction B ne
perturbe pas la forme des solutions.
En notant 9 l'ensemble des solutions de l'équation (E), nous avons prouvé que
Il apparaît que la fonction t H B e-A(tl est une solution particulière de l'équation (E),
obtenue lorsque À = O. La terminologie usuelle oppose souvent les solutions particulières aux
solutions générales, comme f ci-dessus, qui décrivent l'ensemble des solutions au moyen de
constantes appropriées. Nous reviendrons sur ce point dans un prochain paragraphe.
Revenons un instant sur la démonstration de cette proposition. Les solutions de l'équation
(E) : -y'+ a(t)-y = b(t) sont de la forme µ(t) x e-A(tl oùµ vérifie µ'(t)cA(tl = b(t). Soit
1Jo une solution non nulle de l'équation homogène (EH). Il existe µo =/= 0 tel que -y 0 = µ 0 e-A.
En posant À = µ/µo, les solutions de (E) s'écrivent donc au moyen de -y 0 sous la forme
À(t) x cA(tJ où À vérifie À1 (t)-y 0 (t) = b(t). On retrouvera donc sans effort les formules de la
proposition précédente en appliquant la méthode décrite ci-dessous et appelée variation de la
constante 3 .
3
Mais qu'est-ce qu' "une constante qui varie» sinon une fonction?
954
Remarquons avant de clore ce paragraphe que les solutions d'une équation différentielle
(données par les formules de la proposition 10) ne peuvent pas toujours être explicitées à
l'aide des fonctions usuelles : les primitives de fonctions obtenues à partir des opérations
algébriques (le produit, la composition, etc.) sur les fonctions usuelles ne s'expriment pas
systématiqueme nt à l'aide des fonctions usuelles. Citons par exemple les primitives sur IR de
la fonction x H e-x', qu'on appelle gaussienne et qui intervient de manière essentielle en
théorie des probabilités.
Pr<>f10flit~on
y =1:h -f-,Y'~1îl.t,bI
, . .Soit
. l({ûtê-sôlutitln
. .. . fiarliem,iènr ile zriquàti&n ij 1 ~ (lît)·V -;; bJt). ·Aldr$
. ... .. . . . . . . .
PREUVE. Soit -y : I ----+ IR (ou C) dérivable. Puisque 'v't E I, -y;( t) + a( t )-y 1(t) = b (t), la
fonction -y est solution de (E) si et seulement si -y\(t) + a(t)-y 1(t) = -y'(t) + a(t)-y(t), soit
(1J1 - -y)'(t) + a(t)(-y1 - -y)(t) = 0, c'est-à-dire -y -1)1 E Ytt soit encore -y E -y 1 + Ytt. On a
donc .9' = 1!1 + Y'tt- ■
955
◊ On a Y = 1Ji + Y'tt, ainsi la solution générale de (E) est la somme d'une solution
particulière de (E) et de la solution générale de (Ett).
L'équation de charge d'un condensateur se prête bien à une résolution de ce type; elle
s'écrit Uc + ¾uc = e et admet une solution constante évidente, -re. La tension Uc aux bornes
du composant est donc de la forme uc( t) = -re + Àe-t/'r où -r = 1/RC.
..-<
Nous avons vu que la méthode de la variation de la constante est valable dans tous les cas
C".I
..d
de figure, car elle réduit la résolution d'une équation différentielle linéaire du premier ordre (E) ü
à deux calculs de primitives: A(t) = f u(t)dt puis B(t) = f b(t)eA(tldt. Nous savons de plus
que B est une solution particulière de (E) : 1J' + u(t)1J = b(t). À la réflexion, il apparaît donc
que la variation de la constante permet d'aboutir directement à l'écriture solution générale
de (E) = solution particulière de (E) + solution générale de (Ett).Par exemple, les solutions
2
de 1J 1 + 1J = e 2t sont de la forme 1J(t) = À(t)e-t avec ;\'(t)e-t = e t donc ;\'(t) = e \ i.e.
3
2
À(t) = !e3t + k, ainsi 1J(t) = !e2t + ke-t où t H !e t est une solution particulière. On
est alors en droit de trouver absurde la recherche d'une solution particulière de (E) sachant
que la primitive B en est une! Cependant, lorsque B est difficile à calculer, l'équation (E)
peut admettre des solutions plus évidentes que B; c'est dans ce cadre que la recherche d'une
solution particulière diffère sensiblement de la variation de la constante et devient intéressante.
Le lecteur comparera les deux approches au travers de l'exemple suivant.
2 2
dx J1 + x 2 -
x J dx J x dx
(x2+1)s;2·
J (x2+1)5/2 = (x2+1)5/2 = (x2+1p12-
d'où
De même
dx Jx 2 + 1 -
x
2
J dx J 2
x dx
J (x2+1)3/2 = (x2+1)3/2dx= ✓x2+1 - (x2+1)3/2"
Intégrons par parties
ainsi
On a donc
X 2x
À(x) = 3(x2 + 1)3/2 + 3(x2 + 1)1/2 + k (k E JR)
et les solutions de (E) sont les fonctions de la forme x H x + 2; 3 + k(x 2 + 1 )312 , avec k ER
Remarque.
1. Pour rechercher une solution polynomiale à une équation différentielle dont les coef-
ficients et le second membre sont des fonctions polynômes, on commence par poser p (x) =
PnX n + ... + p 0 puis on injecte cette expression dans l'équation. Après regroupement des mo-
nômes de même degré dans chacun des membres, on identifie les coefficients, ce qui se traduit
par des équations linéaires qu'il faut ensuite résoudre. Afin de simplifier les calculs, on essaie
parfois (c'est le cas dans l'exemple précédent) de déterminer le degré n de p (il faut pour cela
s'intéresser aux mônomes de plus haut degré).
2. Le calcul de primitive s'effectue au moyen de méthodes élémentaires mais nécessite un
peu d'astuce et de persévérence.
Un cas où la recherche d'une solution particulière est possible est celui des équations à
coefficients constants dont le second membre est une fonction polynôme-exponentielle, c'est-
à-dire de la forme t H P(t)e"'t, avec P polynôme à coefficients complexes et w E C.
PREUVE. Posons, pour tout réel t, f(t) = Q(t)e"'t. La fonction f est dérivable sur lR et, pour
tout réel t, f'(t) = [wQ(t) + Q'(t)]e"'t ; f vérifie l'équation si et seulement si
soit \lt E lR, (a+w )Q(t)+Q'(t) = P(t). Lorsque w+a = 0, l'équation devient Q' = P. Il suffit
alors de choisir un polynôme Q parmi toutes les primitives de P (qui sont toutes des fonctions
polynômes de degré deg(P) + 1). Supposons <X= w+a =/- O. Écrivons P(t) = Pntn+ ... +p 0 .
Recherchons Q sous la forme Q(t) = qntn + ... + qo. On a
n
aQ(t) + Q'(t) = aQ(t) + L. kqktk-l
k=l
et
n n-1
L. kqktk-l = L. (k + 1)Qk+1t\
k=l k=O
ainsi
n-1
aQ(t) + Q'(t) = <XQntn+ .L_(<Xqk + (k+ l)qk+1ltk. .....
e
k~c() (".)
Après identification des coefficients, l'égalité aQ + Q' = P est équivalente aux n + 1 égalités
suivantes:
Dans la pratique, on cherchera une solution particulière f(t) = Q(t)ewt avec Q choisi à
l'aide de la proposition précédente et l'on injectera cette expression dans l'équation. On suit
alors pas à pas le déroulement de la preuve exposée ci-dessus : les exponentielles se simplifie-
ront et l'équation se résumera à l'égalité de deux polynômes. L'identification des coefficients
aboutira à un système linéaire qu'il faudra résoudre pour trouver Q.
(f1 + if2)'(t) + a(t)(f 1 + ifz)(t) = f; (t) + if~(t) + a(t)f1 (t) + ia(t)f2(t) = b 1(t) + ib 2(t).
Après identification des parties réelles et imaginaires de chacun des deux membres de l'égalité,
on obtient f;(t) + a(t)f 1(t) = b 1(t) et f~(tl + a(tlf 2(tl = b 2(tl. ■
Cette technique est souvent très efficace lorsque le second membre contient des fonc-
tions circulaires, on utilise alors l'exponentielle complexe. Examinons par exemple le cas de
l'équation y'+ ay = P(tl cos(tl avec a E lR et P polynôme à coefficients réels. Puisque
\it E JR, P(tl cos(t) = 9îc(P(t)ei1), on peut commencer par rechercher une solution particu-
lière f de l'équation y'+ ay = P(t)eit_ On sait (et c'est la proposition 13 qui nous le dit) que
la fonction 9îc(fl est une solution de y'+ ay = P(tl cos(tl. On adapte sans peine ce schéma
au cas du sinus en utilisant l'égalité P(tl sin(tl = '.Jm(P(tleitl.
i 2i] . [t2
f(t) = [ -1 - -t +
2
e't = --
+ i1-
2
t] x [cos(t) + isin{t)] =
>_--,,,:1;~:c-
~.:~~t.U.t~~~1:~l,rii11Jtt..;~+vo<i&t:~~.
~{E},<
PREUVE. Soient Y1 et Yz des solutions des équations (E1) et (E2). Posons y = Y1 + yz.
La fonction y est dérivable sur I et \it E I, y'(t) + u(t)y(t) = (Y1 + Yzl'(t) + u(t)(y1 +
Yzl =y\(t) + u(t)y 1(t) +y;(t) + u(t)yz(t) = b 1(t) + b2(t). La fonction y est donc solution
de (E). ■
C'est en vertu de ce résultat (il s'agit à dire vrai d'une généralisation de cette proposition)
que le physicien se borne à étudier la réponse d'un circuit à des signaux périodiques purs
de période T, c'est-à-dire du type t H cos(27rt/T + <p ). En effet, on prouve que tout signal
périodique de période Test la superposition (la somme) de signaux purs du type précédent.
Ce résultat, énoncé ici de manière un peu vague, relève de la théorie des séries de Fourier et
sera précisé dans le cours de L2.
EXEMPLE 31.18. Résoudre sur :IR l'équation y' -y= et+ e 2t.
► Recherchons une solution particulière : d'après le théorème de superposition, il suffit de
trouver des solutions particulières des équations y' -y= et et y' -y= e2t et de les ajouter.
2
En appliquant la méthode précédente, on trouve facilement les solutions t H tet et t H e t.
2
Les solutions de l'équation sont donc les fonctions de la forme t H tet+ e t+ ket avec k ER
Examinons par exemple le cas de l'équation différentielle (El : 11' -11 = et. La fonction
f 0 : t E lR H tet est une solution particulière de l'équation (E) et la solution générale de
l'équation homogène associée (EH) est t H ,\et où,\ ER Les courbes intégrales de (El sont
donc les courbes représentatives des fonctions f,\ définies sur lR par
Les solutions, définies sur JR, ont été tronquées dans la figure ci-contre à la fenêtre [-2, 2] x
[-5,6].
961
de ce type d'équation s'expriment à l'aide des fonctions circulaires. Nous reviendrons sur ce
vocabulaire dans la suite et tenterons de le justifier.
IL 1. Définitions et notations
Définition 31.22. On appelle équation différentielle linéaire d'ordre deux toute équation du
type (E) : a(t)-y" + f3(t)-y' + y(t)-y = ô(t) où a, f3, y et b sont quatre fonctions définies et
continues sur un intervalle I de JR, à valeurs dans C. Résoudre l'équation (E) sur l'intervalle
I, c'est déterminer toutes les fonctions deux fois dérivables f : I ~ (C telles que \ft E
I, a(t)f"(t) + f3(t)f'(t) + y(t)f(t) = ô(t). A l'équation (E), on associe l'équation (EH) :
a( t )-y" + f3 (t )-y' + y( t )-y = 0, dite homogène.
Comme pour le cas des équations du premier ordre, la fonction inconnue -y intervient
dans l'équation au moyen d'une application linéaire, ce qui justifie la terminologie. L'ordre de
l'équation est l'ordre maximal de dérivation de la fonction inconnue. Les fonctions a, f3 et y
sont les coefficients de l'équation et ô s'appelle le second membre de l'équation; l'équation
homogène associée (EH) est souvent qualifiée d'équation sans second membre. On notera
9 l'ensemble des solutions de (E) et Ytt l'ensemble des solutions de (EH)- Sauf mention
contraire, on adoptera comme pour les équations d'ordre 1 la convention suivante :lorsque les
coefficients et le second membre de l'équation sont tous à valeurs réelles, on ne recherchera
que les solutions de (E) à valeurs réelles. On appellera encore courbes intégrales de (E) les
courbes représentatives des solutions de l'équation (E).
;_J:::.~tion.·~-'-èt_~Jk_:P·._.~--·:_ir_\ . .
'1-~ M'
J:_;+~ffl-•~--~~--
, IJ!ll T
\:li;::: . litiêt;:,r, ~rt,:ii~~s1r:1e
Z;;~:j~:~_1\,.V~>
·:-.f~Jitl:~la~t,i;~;:
dela forme t i.-+ {Àt+µ)e~ pc,ur• 1/é C et µ .è Ç~•," . . · ·.
PREUVE.
: · . ····
Écrivons les relations coefficients-racines pour P : a+ f3 = -~ et af3 = ~'
. . .·. < .·
l'équation est donc équivalente à -y" - (a+ f3)-y' + af3-y = O. Soit -y : lR H (C deux fois
dérivable. Posons \ft E JR, z(t) = e-cxt-y(t). On a donc sur JR, -y'(t) = (z'(t) + az(t))ecxt, puis
-y"(t) = (z"(t) + 2az'(t) + a 2 z(t))ecxt, d'où, \ft E JR,
963
1
-y"(tl-(a+l3)-y'(t)+al3-y(tl = (z"(t)+(a-13lz'(t)+-P(alzle"'t = (z"(t)+(a-13lz'(t)le"'t
a
car P(al = O.
1) -y est donc solution de (El si et seulement si \ft E lR, z"(t) + (a- l3)z'(tl = 0, donc
si et seulement si z' est solution de -y' + ( a - 13 l-Y = 0, ce qui est équivalent à z' de la forme
z'(tl = k 1 e(f3-oc)t avec k 1 E <C, soit z de la forme z(tl = f3~oce(f3-ocJt + k2 avec k2 E <C et
finalement, on aboutit à une solution -y (t l = z( t l e"'t = f3~oc ef3t + k2e"'t. La fonction -y est bien
de la forme annoncée. Réciproquement, soient À, µ dans <C et \ft E lR, -y (t) = Àe"'t + µef3t_ On
vérifie facilement que -y" - (a+ 13l-y' + al3-y = ÀP(a)e"'t + µP(l3lef3t = 0, d'où le résultat.
2) Dans ce cas a= 13, d'où -y"(tl- (a+ 13 l-y'(tl + al3-y(t) = z"(tle"'t. L'équation est donc
équivalente à z" = 0, donc il existe À,µ dans <C tels que z(tl = at + 13, d'où le résultat. La ......
Cf)
réciproque se vérifie comme dans le cas précédent. ■ ..d
ü
EXEMPLE 31.25. Déterminons les solutions à valeurs complexes des équations suivantes.
1. -y" +-y' +-y= o.
2
► Le trinôme caractéristique de l'équation valant P(t) = t + t + 1 = (t - j)(t - i2l où
2 3
j = e in/ = -½
+ i 'J:,
les solutions à valeurs complexes de l'équation sont les fonctions
définies sur lR part H -y(tl = ;\eit + µeh avec À,µ dans <C.
2. -y" - 2i-y' --y = O.
► Le trinôme caractéristique de l'équation valant P(tl = t 2 -2it-1 = (t-i}2, les solutions
à valeurs complexes de l'équation sont les fonctions définies sur lR par t H -y (t) = (Àt + µle it
avec À, µ dans <C.
3. -y" - i-y' + 2-y = O.
► Le trinôme caractéristique de l'équation valant P(tl = t 2 - it + 2 = (t - 2i)(t + il, les
solutions à valeurs complexes de l'équation sont les fonctions définies sur lR par t E lR H
-y(t) = ;\e 2it + µe-it avec À,µ dans <C.
La résolution des équations linéaires d'ordre deux à coefficients constants n'est pas encore
complète. Il reste à déterminer la forme générale des solutions à valeurs réelles lorsque les
coefficients de (El appartiennent à R
tr~1:!i~•;tfit~t,Jk~,î~}:~t[et~~ ft~:'Jf~t_;·fflt 1
PREUVE.
L Les solutions à valeurs complexes sont de la forme -y(t) = Àeat + µef3t avec À,µ E <C.
En reprenant la démonstration de la proposition 31.24, on s'aperçoit que À et µ sont des
constantes d'intégration de fonctions à valeurs réelles : on a donc À et µ réels.
2. Les solutions à valeurs complexes sont de la forme -y(t) = (;\t + µ)eat où À,µ E <C. Le
même argument qu'au 1) permet de conclure que À et µ sont réels.
3. Soit -y une solution à valeurs réelles de (E) ; -y étant a fortiori une solution de (E) à valeurs
complexes, -y est de la forme -y(t) = Àe(r+is)t + µe(r-is)t avec À,µ dans <C. Puisque -y est à
valeurs réelles, \lt E JR,
Après regroupement des termes en sinus et en cosinus, on voit que la fonction -y est bien de
la forme annoncée.
Réciproquement, puisque cos(st) = e"'+t'''
et sin(st) = e''' 2 r'",
une fonction de la forme
indiquée s'écrit également -y(t) = À1eist + µ1e-i st avec À1, µ1 E <C, il s'agit donc d'une
solution de (E).
■
EXEMPLE 31.27. Résolvons sur lR les équations suivantes.
1. -y" +-y' +-y= O.
► Le trinôme caractéristique de l'équation vaut P(t) = t 2 +t+ 1 = (t-j)(t-j2). Les solutions
à valeurs réelles de l'équation sont donc les fonctions de la forme -y(t) = (;\cos('i3t) +
µsin('i3t)Je-½t avec À,µ dans R
2. -y"+ 3-y' + 2-y = O.
► Le trinôme caractéristique de l'équation vaut P(t) = t 2 + 3t + 2 = (t + l)(t + 1). Les
solutions à valeurs réelles de l'équation sont donc les fonctions de la forme -y (t) = ;\e-t+µe- 2t
avec À, µ dans R.
3. -y" - 4-y' + 4-y = O.
► Le trinôme caractéristique de l'équation vaut P(t) = t 2 -4t+4 = (t-2)2. Les solutions à
valeurs réelles de l'équation sont donc les fonctions de la forme -y(t) = (Àt + µ)e 2t avec À,µ
dans JR.
Remarque. On comparera avec profit l'équation L des deux exemples 31.25 et 31.27 : il ne
suffit pas d'imposer À E JR, µ E lR pour que la solution définie par -y(t) = ;\eit + µei 2 t soit à
valeurs réelles.
ou, de manière équivalente, celles de la forme -y(t) = A cos(wot + cp) avec A et cp réels.
Étudions plus généralement les équations du type (E) : -y"+ k-y = 0 où k E R Lorsque
k > 0, il existe w 0 E R* tel que k = w§ et l'on est ramené à l'étude d'un oscillateur non
amorti. Lorsque k = 0, les solutions sont bien sûr les fonctions affines. Soit k < O. Il existe
w
alors 0 ER* tel que k = -w3
et le trinôme caractéristique de l'équation vaut P(t) = t 2 -w§.
Ses racines valent ±w0 et les solutions de l'équation sont de la forme -y(t) = Àewot + µe-wot
avec À,µ ER Puisque les formules 2ch(w 0 t) = ewot + e-wot et 2sh(w 0 t) = ewot - e-wot
s'inversent immédiatement en
les solutions peuvent également s'écrire sous la forme -y(t) = À1 ch(wot) + µ, sh(wot) avec À1
et µ 1 réels. .....
C'J
..d
ü
La solution oscille entre les courbes représentatives des fonctions t H ±e-t/4 et tend vers 0
lorsque t tend vers +oo (cela vient de l'exponentielle et du signe positif de À), ce qui justifie
la terminologie « oscillateur amorti ».
2.. f
Ye
Il
+ 2ÀWoYe + Wo!:le
/
= -.
m
FI-
Lorsque la force extérieure vibre à la pulsation w, par exemple F(t) =
GURE31.5. ( )
Oscilla- Fo cos wt , on s'aperçoit qu'après un régime transitoire, la bille oscille
tions à la pulsation w; on parle à ce sujet d'oscillations forcées ou entre-
entrete- tenues. Nous justifierons ces observations et montrerons en particulier
l'e~ce du phénomène de résonance, à l'aide de la théorie générale exposée ci-dessous.
Les méthodes de résolutions générales des équations linéaires d'ordre deux à coefficients
constants sont les mêmes que pour l'ordre un : variation des constantes et recherche d'une
solution particulière. Nous étudierons la variation des constantes dans le cours de 12.
PREUVE. Soit y: 1 --t <C dérivable. Puisque 'v't E 1, ay;'(t) + by\(t) + cy 1(t) = li(t), la
fonction y est solution de (E) si et seulement si ay\'(t) + by\ (t) +cy 1(t) = ay"(t) + by\ (t) +
cy1 (t), soit a(y1 - y)"(t) + b(y1 -y)'(t) + c(y1 - y)(t) = 0, c'est-à-dire y - y 1 E Ytt soit
encore y E Y1 + Ytt. On a donc Y= Y1 + Ytt. ■
967
Le cas usuel est celui d'un second membre en polynôme-exponentielle. La recherche d'une
solution particulière généralise dans ce cas la méthode exposée dans la proposition 31.12. On
utilisera le lemme 31.13 pour le prouver.
....
P~16sitiôn ·!I!so. Si>iènf A''.#= <>;ll; è éflb rfoi,,tre 'tiombres complexe$ eiS uiè J()rl,ction C'")
..d
I~~~:fi~tJd,ëti~,itEt~tC, Albfi,l~Ôff:{Jil:iaflj+b\ Jt +.ej·•·;;.S(t:~~ otlmet 9:ùr ü
'Rê.,t;,ffl.u~;~~' l~cl4' f<>rmt ftt) == t'{t}ê~ ••~,J '8t ttn Jlf)~n:,f,i,~ )i ·•toeJll,dients
.
Jiii,iC~(jù~ë . . . . .. . . .
·.,,,j~~1e11•iiii
PREUVE. On a f'(t) = (T'(t) + wT(t))e"'t et f"(t) = (T"(t) + 2wT(t) + w 2T(t))e"'\ d'où,
pour tout t réel, af"(t) + bf'(t) + cf(t) = (aT"(t) + (2wa + b)T'(t) + P(w)T(t))e"'t. La
fonction f vérifie donc l'équation si et seulement si aT" + (2wa+ b)T' + P(w)T = S. Posons
À= 2 "'~+b etµ= P(w)/a. L'équation est équivalente à T" + ÀT' + µT = S/a. Notons u, v les
racines complexes du trinôme t 2 + Àt + µ. On a donc À= -u -v et µ = uv. L'équation est
donc équivalente à (T'-aT)' -b(T'-aT) = S/a. D'après le lemme 31.13, il existe une solution
polynomiale V à V' -vV = S/a puis il existe une solution polynomiale de W' - uW = V. Il
suffit de choisir T = W.
1. Lorsque w n'est pas racine de P, P(w) = a uv /. 0, u et v sont donc non nuls et d'après le
lemme 31.13, deg (W) = deg (V)= deg (S).
2. Lorsque w est racine simple de P, P(w) = 0 et À/. O. On peut donc supposer (quitte à
permuter u et v) que u = 0 et v /. O. On a donc deg (V)= deg (S) puis deg (T) = deg (W) =
deg (V) + 1 = deg (S) + 1.
3. Lorsque w est racine double de P, on a P(w) =À= 0 d'où u = v = O. D'après le lemme
31.13, on a donc deg (V) = deg (S) + 1 puis deg (T) = deg (W) = deg (V)+ 1 = deg (S) + 2. ■
EXEMPLE 31.31. Résolvons sur IR l' équation y" - 3-y' + 2-y = f(x) pour plusieurs fonc-
tions f.
1. f(x) =X
► Toutes les équations qui suivent admettent le même polynôme caratéristique de solutions 1
2
et 2. L'équation (EH) admet donc pour solutions les fonctions de la forme x H Àex+µe x, À,µ
3 2
dans IR. Les solutions de l'équation sont les fonctions de la forme x H zx: + Àex + µe x, À,µ
dans IR.
2. Puisque 2 est solution simple de l'équation caractéristique, l'équation admet une solution
particulière de la forme x H axe 2x.
968
3. f(xl = e 2x
► Puisque 2 est solution simple de l'équation caractéristique, l'équation admet une solution
particulière de la forme x H uxe 2x. On aboutit à u = 1. Les solutions de (El sont donc les
fonctions de la forme x H xe 2x + Àex + µe 2x, avec À, µ dans IR.
4. f(xl = xex
► Puisque 1 est solution simple de l'équation caractéristique, l'équation admet une solution
particulière de la forme x H ( ux 2 + bxlex. On aboutit à u = -1 /2 et b = -1. Les solutions
de (El sont donc les fonctions de la forme x H -(x2/2+xleX+Àex+ µe 2x avec À,µ dans IR.
Remarque.
1. On se gardera d'affirmer directement que
ex+ e-x
VxElR, 6be-x-aex= ---, a=-l/letb=l/12 .
2
Cette implication est vraie mais nécessite une démonstration. Puisque nous recherchons une
solution particulière (et non pas toutes les solutions de l'équation qui sont de la forme f(x) =
axex + be-x), on se borne à déterminer une condition suffisante sur a et b pour que f ainsi
définie soit une solution.
2. Il n'est pas nécessaire de mentionner à chaque fois le théorème de superposition. On consi-
dère qu'il va de soi que la «superposition» d'une solution de y" - 3-y' + 2-y = ~ et d'une
solution de y" - 3-y' + 2-y = e;x est solution de l'équation initiale. On applique alors à deux
reprises la proposition précédente sans plus de précision.
Lorsque (E) est à coefficients réels et que le second membre est du type P(t) cos(wt) ou .....
C')
P(t) sin(wt) (où P désigne un polynôme à coefficients réels), par exemple dans le cas des ..d
ü
oscillations forcées d'un système mécanique, le passage à C nous permettra de trouver des
solutions à valeurs réelles de (E). Comme dans le cas des équations d'ordre 1, les calculs
seront justifiés par la proposition qui suit.
PREUVE. Soit 1J : I H C. Posons 1J1 = !Re(y) et 1J2 = Jm(y). La fonction 1J est deux fois
dérivable sur I si et seulement si y 1 et 1J2 sont deux fois dérivables sur I. Sous cette hypothèse,
1
on a ay"+by'+cy = a(1J1+i1Jz)"+b(y 1+i1J2l'+c(1J1+1Jzl = ay; +by;+c1J1+i(ay 2+by~+
C1Jz). En identifiant les parties réelle et imaginaire on obtient que la fonction y est solution
de uy" + by' + cy = d si et seulement si !Re(y) et Jm(y) sont respectivement solutions de
ay" + by' + cy = !Re(d) et ay" + by' + cy = Jm(d). ■
2
EXEMPLE 31.35. Résolvons sur lR l'équation y"+ 4-y' + 5-y = e- xsin(x).
► Recherchons une solution particulière de l'équation y"+ 4-y' + 5-y = e(-l+ilx_ Puisque les
solutions de l'équation caratéristique sont -2 ± i, il existe une solution particulière de la
forme f: x H axe(-l+i)x_ On a, pour tout nombre réel x, f'(x) = ((-2 + i)ax + u)e(-l+ilx,
f'(x) = ((-2+i)2ax+2(-2+i )a)eH+ilx et f"(x) +4f'(x) +Sf(x) = 2iaeH+ilx_ La fonction
f est donc solution si et seulement si a = 1/li = -i/2. La partie imaginaire de2 cette solution
particulière est une solution de l'équation initiale et vaut f 0 : x H - xcos(;Je- ' . La solution
2
générale de (EH) s'écrivant x H [Àcos(x) + µsin(x)]e- x avec À,µ dans JR, les solutions de
(E) sur lR sont donc les fonctions de la forme
xcos(x)e-2x
XH + [Àcos(x) + µsin(x)] e-2x avec (À,µ) E JR2.
2
Nous sommes maintenant en mesure d'expliquer les phénomènes observés lors des expé-
riences sur les oscillations mécaniques entretenues. L'équation générale d'une grandeur phy-
sique -y(t) soumise à des oscillations forcées s'écrit
(El: -y"(t) +2Àw 0-y'(t) + w~(t) = Acos(wt)
où À ;:: 0 est le coefficient d'amortissement du système (on fait toujours l'hypothèse d'un
faible amortissement À< 1), w 0 est la pulsation propre du système (c'est-à-dire la pulsation
qu'aurait le système s'il n'était soumis à aucune force extérieure ni amortissement), w est
la pulsation de l'excitation extérieure subie par le système et A son amplitude. On souhaite
connaître la réponse du système à cette excitation extérieure, c'est-à-dire que l'on recherche
la forme générale de la solution de (E). Commençons par passer à C en recherchant une solu-
tion particulière de -y"(t) + 2Àw 0-y'(t) + w~(t) = Aeiwt_ Le trinôme caractéristique de cette
équation vaut P(t) = t 2 + 2Àw 0 t + w~ et son discriminant réduit L1 = wMÀ 2 - 1) est négatif
dans le cas d'un faible amortissement. Posons b = ~ -
◊ CAS D'UN OSCILLATEUR NON AMORTI : À= o. Les racines de p valent dans ce cas
±iw~. Lorsque w = w 0 , il existe une solution particulière de la forme -y(t) = Ateiwot_ En la
reportant dans l'équation, on trouve facilement A = -2,wo 1
. . La partie réelle de cette solution
valant t H tsi2n(wotl, la solution générale de l'équation s'écrit
wo
. tsin(w 0t)
-y(t) = Àcos(w 0 t) + µsm(w 0 t) + avec À,µ E lR.
2Wo
L'excitation à la pulsation propre d'un oscillateur non amorti se traduit donc par une explosion
progressive de la réponse du système, comme le montre la figure suivante :
avec a, b dans R Puisque la solution générale de (EH) tend vers zéro lorsque t tend vers
+oo, on voit progressivement apparaître un régime d'oscillations à la même pulsation w que
l'excitation (ce régime correspond à la solution particulière calculée ci-dessus), ce qui justifie
la terminologie « oscillations forcées ».
On remarque que l'amplitude de la réponse à l'excita- ....
tion Acos(wt) passe par un maximum pour w = Wr tel que O')
.d
w; = wW - D-1] (on suppose ici en plus que À< 1/v'l). ü
Une étude un peu plus précise prouverait que l'amplitude va-
rie considérablement au voisinage de cette pulsation lorsque
À est petit. L'amplitude de la réponse admet dans ce cas
un pic prononcé en Wr- Ce phénomène s'appelle la « réso-
FIGURE 31.6. nance » de l'oscillateur. Citons un exemple connu de tous
Amplitude A(w) de les lecteurs de Tintin: l'augmentation subite de l'amplitude
la réponse de la vibration au voisinage de Wr ~ Wo permet de briser
des verres de cristal par émission d'un son pur à la fréquence propre du cristal f 0 = wo
ln.
La présence de deux constantes Àetµ dans la description générale des solutions de l'équa-
tion homogène (EH) a pour conséquence qu'une solution de (E) est entièrement déterminée
par la donnée d'une condition initiale du type y(to) = Yo, y'(to) = Yb- En langage de méca-
nicien : le mouvement d'un point matériel de masse m est entièrement défini par la donnée
des forces auxquelles il est soumis (la donnée d'une équation différentielle d'ordre deux) et
par sa position et sa vitesse initiales (la condition initiale). On appellera problème de Cauchy
pour l'équation (E) la donnée d'une telle condition initiale.
PREUVE. Soient ex, 13 les racines complexes du trinôme caractéristique de l'équation (E) et
y : I H C deux fois dérivable. Posons Vt E I, z(t) = y(t)e-at_ La fonction z est également
deux fois dérivable sur I et sur cet intervalle
On prouve facilement que si les coefficients, le second membre et la condition initiale sont
à valeurs réelles, l'unique solution au problème de Cauchy correspondant est à valeurs réelles.
Remarque. Dans le 4., on aurait également pu écrire la solution générale de l'équation sous
la forme y(t) = Acos(v'3t/2 + cp)e-t/l et déterminer les constantes A et cp à l'aide de la
condition initiale. Attention : la solution est unique mais il existe une infinité de constantes
possibles car le cosinus est n-antipériodique.
973
III. EXERCICES
31.1. 5. Résoudre (El.
Soit (El l'équation (t2 + 1l-Y" - 2-y = O. réalise une bijection de ]O, 1[ sur ]O, 1[, établir
1. Établir qu'une éventuelle solution polyno- que sa bijection réciproque notée x: y H x(yl
miale et non nulle de (El est nécessairement est dérivable et vérifie
de degré deux.
2. Trouver une solution polynomiale et non x'(yl =
nulle p de (El.
3. Justifier qu'une fonction y deux fois déri- 2. Vérifier le résultat de Leibniz,
vable de R dans R peut s'écrire sous la forme
y = p x z où z est une fonction deux fois déri-
vable de R dans R. I
4. Montrer qu'une fonction z : R ---, R deux
fois dérivable est solution de (El si et seule-
ment si la fonction Z = z' (où z est définie sur JO, 1(.
comme à la question précédente l est solution 3. En déduire que sur ]O, 1[
d'une équation différentielle linéaire d'ordre un
(E'l à préciser.
Sixième partie
SOLUTIONS DES TESTS
1.15.
d'où
M111t/6
1.2. On trouve
1.9. Non.
1.10. a= b[n] =}a= b[n/2]
1.3. R et a= b [2n] =} a= b [n].
Chapitre 6 3.
6.10. On a n i
6.1. 218. as + bs = as - ( -b )5 ' \ ' \ a·
L_L_i,J.
6.7. -1.
2. 6.20. 63.2 13 ln(2).
n-1 n
6.8. -14+38i. L L Ili,j L Ili,j
6.9. Remarquer que i=l j=i+l 1 (i<j(n
n j-1
= rrai,j
i=2 i=l
{4nln EN}.
7.3. {-1,0, 1, -i, i}.
7.22. Soit x E A. Co=e
f(x) E f(A), x E f~ 1(f(A)).
neutre: 0.
7.34. On trouve x = a~ 1 * b.
■
7.23. Pour tout élément x de 7.35. X= a~l *C* b- 1.
7 .4. Voir le chapitre 23.
E, llt-'(BJ(x) = 1 si et seule-
7.5. Elle est vraie. ment si f(x) E B, c'est-à-dire 7.36.
(11B o f)(x) = 1. D'où le résul- 1} Réflexive, symétrique et
7.6. C'est faux considérer transitive (mais pas antisymé-
tat, puisque les deux fonctions
{(1, bl, (2, a)}. trique).
ne prennent que les valeurs O et
7.7. z. 2} Symétrique (mais pas ré-
1. flexive, ni antisymétrique, ni
7.8. Oui, car Ac lR \ IQ. 7.24. Notons f = llt-'(AuBJ· On transitive dès que E f= 0).
a 3} Réflexive (mais pas antisy-
7.9. An B. métrique, ni symétrique, ni tran-
f = llAuB O f = ]IA O f + lis O f sitive dès que E f= 0).
7.10. {N XE) U {A X Be).
-IA ofllB of 4} Réflexive, symétrique et
7.11. Ona
= llf-1 (A)+ llf-1 (B) transitive (mais pas antisymé-
trique).
9"(E) = {0,{0},{l},E}, - llf-1 (A)llf-1 (B)
= lit-' (A)uf-1 (B)· 7. 3 7. La seule relation symé-
et ,9"(9"(E)) est égal à
trique et antisymétrique est la
relation d'égalité.
{ 0, { 0}, {{O}}, {{1}}, {E},
7.25. L'application f n'est pas 7.38. On a n:~ 1 (E/'R,) =E et
{{0}, { O}}, {{0}, {1 }}, injective car f(-1) = f(l ). L'ap- n:~ 1 {x) = X:.
{0, {E} }, {{O},{l}}, {{O}, E}, plication f est surjective d'après
le théorème de d'Alembert- 7 .39. 'R, est la relation d'égalité.
{{l}, E}, { 0, {O}, {l}}, { 0, {O}, E},
Gauss.
{{O},{l}, E}, { 0,{l}, E}, 9/'(E)}
7.26. Toutes les fibres de f sont 7.40. sup(F) = x.
des singletons. 7.41. (JR,,;;;;) et F=ll,2].
7.12. UxE9"(El X E et 7.27. La bijection réciproque de 7.42. On a inf(F) = 0 et
nXE9"(E) X= 0 . f o g o t~ 1 o g~ 1 est égale à sup{F) = {l, 2}.
gofog- 1 of- 1.
7.13. 4. 7.43. Les trois inf ne sont
7.28. f~ 1({y}) ={f- 1 (y)}. pas définis. On a par contre
7.14. 1.
7.29. f- 1(B) est l'ensemble des sup{F2) = sup(F3) = 3 et
7.15. (f o g)(x) = x 2 + sin(x2 ) sup{F1) =2.
antécédents par f des éléments
et (go f)(x) = (x + sin(x)) 2 .
de B. Puisque tout élément y de
7.16. f"(x) = x si n est pair,
f(x) = 1/x sin est impair.
B admet un unique antécédent
par f qui vaut t~ 1 (y), f- 1(B) est
Chapitre 8
7.17. 111 = IA et llAIAc = o. égal à l'ensemble {f- 1 (y)ly E 8.1. On a
B} = f- 1(B), image directe de
7 .18. llA.1.B = IA + 11B - 211AIB. B par l'application t~ 1. llAuB = IA + 1B -llAis,
d'où
7.19. g = flA est l'aplication de 7.30. Il est facile de constater
A dans B définie par g(l) =cet que l'application '1> de 6F dans
6E définie par '1>(0") = f- 1 o(Jof
g(2) =a. xEE
0(1) = 0(5) = {1,5}, 10.20. Non, cet ensemble ne (0, 1,0, ... )(1,0 ... ) = (0, ... ).
et 0(3) = {3}.
10.6. On a
Chapitre 11 Chapitre 12
0(1) = 0(3) = 0(4) = {l,3,4} 11.1. Non. En revanche, la for-
12.1. Si a = ±b, on a claire-
mule est valable dans un anneau
et 0(2) = 0(5) = {2, 5}. ment a Ib et b I a. Réciproque-
commutatif.
ment, il existe {k, k') E Z 2 tels
10.7.
que a = kb et b = k'a, donc
1234567) a= kk'a. Si a= 0, on a aussi
cr= ( 2647351 · 11.3. Non, 2Z ne contient pas
le neutre 1. b = O. Sinon, kk' = 1 donc
k = k' = ±1 et a= ±b.
11.4.0ui.
10.8. 12.2. Oui.
11.5. Si A = {0A}, seule la
123456) 12.3. Si bZ C aZ, alors en par-
cr= ( 462153 · deuxième inclusion est vraie. Si-
non, la première inclusion est ticulier b = b x 1 E aZ et il
toujours vraie mais la seconde existe k E Z tel que b = ka,
est équivalente à la proprosition donc a Ib. Réciproquement, si
10.9. cr= (a, c).
« A est un corps». a Ib, il existe k E Z tel que
10.10. C'est un cycle de lon- b = ka et bZ = kaZ c aZ.
gueur n. 11.6. (±1,±1).
12.4. On a
10.11. cr = (1,3,2)(4,5) et 11.7. I =A. n-1
()"2007 = (4,5). 11.8. Il n'y en a qu'un : A. lûn-1 =(10-1) L 10k.
10.12. o( cr) = 3. k=O
11.9. Notons * et • les lois de
10.13. cr= (1, 3)(3,2)(2,4). A et B. On a
12.5. Le quotient vaut 11509 et
10.14. cr= (1, 3)(3, 6)(6,4)(2,5). ls = cp(lA) E lm(cp).
le reste 28.
Pour tous a et b dans lm {cp),
il existe x et y dans B tels que 12.6. Le quotient vaut n 2 + 1 et
10.15. On a
le reste n.
a= f(x) et b = f(y). On a alors
(1,2,3)(1,2)(1,2,3) 2 = (2,3) a•b=f(x)•f(y) 12.7. 1112121113.
et = f(X*Y) E Im(cp). 12.8.1236.
5 51
12.18. Par l'algorithme d'Eu- 13.1. On a (x+ 1)5- '\"" · k
- L (5- k)!k!x .
clide, k=O
P+Q = (-1,3,5,-1,0, ... ).
(Sn+l -1)/\ (Sn -1) = (Sn - l)/\4 On reconnaît la formule du bi-
=4. nôme.
13.2. On a 13.15. Si BJK[X] c AJK[X], alors
PQ = (0,-1,0,4, 13, 7,-3,0, ... ). en particulier B = B x 1 E AJK(X]
12.19. On a 3 x 7-4 x 5 = 1. et il existe Q dans JK[X] tel que
12.20. Après élévation au carré B = QA, donc AI B. Récipro-
de l'égalité 3 x 7-4 x 5 = 1, on quement, si AI B, il existe Q
aboutit à 9 x 72 -88 x 5 = 1 mais 13.3. Le produit de deux poly- dans JK[X] tel que B = QA et
également 16 x 5 2 - 57 x 7 = 1. nômes unitaires est unitaire.
Après une nouvelle élévation au BJK[X] = QAJK(X] C AJK[X].
13.4. La somme de deux po-
carré, on trouve
lynômes unitaires n'est jamais
88 2 5 2 -3951 x72 =1. unitaire. La différence de deux 13.16.On a
polynômes unitaires n'est pas en
général unitaire. X3 +27 = (X+3l(X 2 -3X+9).
12.21. 43 - 2 X 21 = Î.
13.5. Q = 3X 2 + 3X + 1. On a
12.22. Comme 11 /\ 8 = 1, 7 ap- deg {Q) = 2 et val{Q) = O.
partient à Z = 1 JZ + 8Z, d'où 13.17. On trouve Q = 2X 2 +4
l'existence de (u, v) E Z 2 tels 13.6. R = 6X + 6 et S = 6. et R = 3X2 +X+ 5.
que 7 = llu + 8v. 13. 7. Ces deux fonctions sont 13.18. On a
12.23. C'est vrai. égales. Le premier x est la mul-
R = 2 + 5(X - 1) = 5X - 3.
tiplication sur JK[X], le deuxième
12.24. La réciproque est x désigne la multiplication sur
fausse : 2A3/\4 = 1 mais JRIR.
2A4=2c;fl. 13.19. Cette équivalence est
13.8. Ces deux fonctions sont vraie.
12.25. Cela découle immédiate- égales. Le premier o est la com-
ment de l'égalité 13.20. Supposons que
position sur JK[X], le deuxième o
(aZnbZ)ncZ = aZn(bZncZ). désigne la composition sur JRIR.
Comme
AC-BD= C(A-B) + B(C-D)
X1XzX4 + X1X3X4 + X2X3X4 et
0"4 = XJ XzX3X4.
14.2. D'abord on remarque que
les formules sont trivialement
■
vraies si l'une des fractions ra-
13.35. cr1 = cr3 = 0, cr2 = -~ tionnelles est nulle. Soient alors
et P divise A - B et C - D,
etcr4=½- F1 = ~ 11 et F2 = ~~ . On a
P divise aussi AC - BD et donc
AC= BD [P]. 13.36. xf+x~+xi = crf-2crz. P1P2
deg (F1 F2) = deg Qi Qz
13.21. L'ensemble PIK[X] est
non vide car il contient le poly- 13.37. C'est faux : pour tout
nôme nul. Soient (A, B) E PlK[X]
= deg (P1 P2) -deg (Q1 Q2)
a E IC, le polynôme X - a est
et C E lK[X]. Il existe alors = deg P1 + deg P2 - deg Q1
(Q1, Q2) E lK[X] 2 tels que irréductible sur IC. En revanche,
un polynôme irréductible sur lK -deg Q2
A= PQ1 et B = PQ2. de degré supérieur ou égal à 2 = deg F1 + deg F2 .
n'admet aucune racine dans lK.
D'oùA-B = (Q1-Q2)P appar-
deg (F1 + F2) =deg Pi Q 2 + P2 Q 1
tient à PlK[X] et CA= (CQi)P 13.38. C'est faux : le poly- Q1Q2
à PlK[X] : PlK[X] est un idéal nôme (X 2 + 1)2 n'admet aucune = deg (P1 Q2 + P2Q1) -deg (Q1 Q2)
de lK[X]. Il en est de même de racine réelle mais n'est pas irré-- ,;;; max(deg (P1 Q2 ),deg (P2Q1))
QJK[X]. La suite résulte du fait d uctible sur IR.. -deg Q1 -deg Q2
que l'intersection de deux idéaux
13.39. On trouve =max(deg P1 +deg Q2,deg P2+
est toujours un idéal.
deg Q1 )-deg Q, -deg Q2
13.22. La somme de deux x4_, =
=max(deg P1 -deg Q1 ,deg P2-
idéaux est toujours un idéal.
deg Q2) = max(deg F1 ,deg F2).
(X- l)(X+ l)(X-i)(X+i)
13.23. On trouve X+ 1.
13.24. On trouve X+ 1 par l'al- et
14.3. Existence : On sait que
gorithme d'Euclide.
X' - 1 = (X- 1)(X+ 1 )(X2 + 1 ). toute fraction rationnelle F a une
13.25. On a écriture irréductible F = -G-· No-
X+2_X-l=l. tons a le coefficient dominant de
3 3 13.40. On a Q. Alors F = ~j: et cette écri-
ture est irréductible avec coef-
X3 +1 =(X+l)(X+j)(X+j2) ficient dominant du dénomina-
13.26. On a
teur égal à 1.
2 et
X - 2X + 1 _ X - 3 (X+ l) = 1. Unicité : Soient -G- = ~~ deux
4 4 X3 + 1 = (X+ ll(X2 -X+ 1). telles écritures. Alors QP1 =
PQ 1 , c'est-à-dire Q divise PQ1.
Or Q et P sont premiers entre
13.27. X 6 - , .
eux, donc Q divise Q 1. Or dans
13.28. X5 +x 3 +x 2 + 1. une écriture irréductible les de--
13.29. (X 2 + 1ln convient.
Chapitre 14 grés sont les plus petits pos-
sibles, donc Q et Q1 ont le même
13.30. On trouve{± 1, ±j, ±j2}. 14.1. Soient F = -G- = ~~ deux degré. Alors Q = aQ1, avec a E
écritures de F. Alors, on a l'éga- lK. Par comparaison du coeffi-
lité PQ1 = QP1, d'où cient dominant on trouve a = 1
13.31. Le nombre a est une ra-
cine d'ordre au moins égal à 3. et Q = Q 1. Par conséquence
deg P+deg Q1 = deg Q+deg P1,
P=P1.
= X2 - X+ 1 +
15.9. p inconnues et n équa-
tions.
15.10. n équations et p incon-
16.3. On a
13) ~ (-20) (03).
(01+226 14 '=
nues.
14.7. Quatre pôles: 0 d'ordre 16.4. On a
3; i d'ordre 1; 1 d'ordre 4; -1 15.11. Non.
d'ordre 3. Un zéro: i-2 de mul- 15.12. Non.
tiplicité 5.
15.13. Oui. Les deux nombres 4 8 12)
14.8. Non, car le polynôme au 0, 1 sont non tous nuls, mais non C = 32 et D = 5 10 15 .
( 612 18
dénominateur ne peut pas pos- tous non nuls.
séder une infinité de zéros. 15.14. 16.5.
a. Faux. c. Faux.
14.9. 3tz
est déjà décomposée, a. vrai. c. non.
b. Vrai.
c'est un élément simple. b. non.
14.10. c = -d. 16.6. m=n=p=q.
15.15.
a. non. b. vrai. 16.7. eeA est la i-ième ligne de
A et Ae{ est la k-ième colonne
Chapitre 15 15.16. Les deux assertions sont de A.
fausses.
15.1. 16.8. AEek est la matrice dont
15.17. Oui, car ce sont 4 vec- la k-ième colonne est la i-ième
a. (1 +i)(l,i) = (1 +i,-1 +il
appartient à IC 2 . teurs de JR:. 3 qui est un espace de colonne de A et toutes les autres
dimension 3. colonnes sont nulles. Eek B est la
b. D'après la règle 6), le vecteur
matrice dont la i-ième ligne est
i((l + i)(l, i, 1 - i)) est égal à 15.18. C'est vrai, car l'espace
(i(l +i))(l,i, 1-i). la k-ième ligne de B et toutes
de solutions est un sous-espace
les autres lignes sont nulles.
vectoriel de ocn et que tout sous-
15.2. V= (-4,-20+i,4i+2). espace vectoriel de ocn est de la EekEpq = ôkµEeq-
15.3. forme demandée. 16.9. n 3 et n 2 (2n- l).
a. Deux, à savoir les sous- 15.19. 16.10. eeAe{ est l'élément aek
espaces triviaux. a. Cela se vérifie par le calcul, de la matrice A.
b. Une infinité, par exemple les composante par composante.
16.11.
sous-espaces JK( cos -& , sin -& ) où b. w =w et w =u+2v.
-& E [O, n[. a. x 2 - 1 = O équivaut à l'équa-
tion (x + 1)(x - 1) = O. Dans
15.20. Oui. Pour démontrer un corps tout élément non nul
15.4. Il n'y a que l'espace nul. que tout vecteur de ocn s'écrit est inversible, donc x = 1 ou
En effet si (x, -y) est un vecteur de manière unique comme com- X= -1.
non nul, alors ,\(x,-y) !/. B pour
tout réel ,\ assez grand.
binaison linéaire de ces vecteurs, b. Par exemple ( b~1 ) ou
on se ramène au système linéaire (?b).
15.5. Non, car ffi:.TTL n'est pas un de l'exemple 15.7. Il possède une
unique solution.
16.12. Notons
sous-ensemble de ffi:.n.
A= (!Xhj) E .4'tmn(lK),
15.6. Oui. 15.21. dimXo = 4.
B = (/3jk) E .4'tnp (JK),
15.7. 15.22.;, ;
et C = (Ykll E A'lµq(lK). Dé-
a. non. c. non. terminons d'abord le coefficient
15.23. d'indice (h,i) de (AB)C. Il est
b. oui. d. oui. le produit de la h-ième ligne de
AB avec la €-ième colonne de C :
15.8. Le système à deux in-
connues et une seule équation
ux1 + bx2 = -y avec
Chapitre 16 (f. <Xn;f3;1 , ... ,f. <Xn;f3;p)
j=l j=l
X
a. a = b = 0 et -y = 1, 16.1. à A'l2,3(1C).
b. a = b = 1 et -y = O. 16.2. dim.4'tmn(lK) = mn.
expression égale à {0, ± 1, ... , ±9} ! Les matrices
qu'il peut ainsi obtenir forment
16.26. Tout est faux.
16.27. La première assertion
■
un ensemble fini dans lequel les
est fausse, la seconde est vraie.
matrices de rang non maximal
constituent une partie non négli-
Maintenant nous comparons geable. 16.28. Seul le b. est vrai.
avec le coefficient d'indice (h, i)
de A(BC). Ce dernier est le pro- 16.17. La réponse est oui aux 16.29. Toutes les assertions
duit de la h-ième ligne de A avec deux questions. sont vraies, sauf les deux der-
la i-ième colonne de BC nières.
16.18. 21. Pour la somme de deux matrices
16.19. Pour (A, B) appartenant nilpotentes, on a
à Gl(n,JK) x GL(m,JK), la ma-
trice
c'est-à-dire
<D(A, B) = ( 4s)
t (t ahj ~jkYkl)
est dans Gl( n + m, JK). On vé-
rifie facilement que l'application
(A, B) H <D(A, B) définit le mor-
Pour le produit de deux matrices
symétriques, on a
t (t ahj(~jkYkiJ),
phisme recherché.
16.20. Oui. D'après 16.25, on
soit encore a m = rg (AB) ::;; rg A ::;; n et
n=rg(B'A)::;; rg A::;; m. 16.30.
a. n(~+l) c. n(~-1)
16.21.
a. Faux. c. Vrai. b. n(~+l);
b. Vrai. d. Faux.
16.31. Oui.
16.22. Nous savons que le sous-
16.32. Il suffit de calculer les
espace vectoriel F engendré par
et finalement puissances successives A k de A.
les lignes de A est le même que
On a A 2 # 0 et A 3 = O. La ma-
celui engendré par les lignes de
trice A est nilpotente, d'ordre de
A et que la dimension de F est
nilpotence 3.
r. Les dernières n - r lignes de
où l'on a utilisé les lois suivantes A sont nulles. Donc F est né- 16.33. Toutes les identités sont
dans 1K : l'associativité de la cessairement engendré par ses r vraies sauf la deuxième, qui n'est
multiplication, la commutativité premières lignes. Ces lignes sont vraie que pour µ = O.
de l'addition et la distributivité. donc libres car dimF = r.
16.34.
16.23. Il suffit de choisir a, b, c
16.13. rg (lln) = n. tels que a ,l 3b - 2c. 000
0100
1)
16.24.
16.14. 2 pour les deux ma- ( 001 0 '
trices. a. 4. b. Oui. 1000
R=
111) b. Pour la fonction constante
rait que quatre sous-espaces vec-
( 003
021 .
w = 1, on a toriels (voir la question-test I.2).
19.6. 19.13.
Le rang est n - 1. Cela se voit
aussi à l'aide le théorème du a. La linéarité de Lj est évi- a. Oui, c'est le noyau de J :
rang puisque le noyau est consti- dente. On a '6' 1 ([O, ll} --) JR, f H J~ f. La
fonction x H x engendre un sup-
tué des polynômes constants.
plémentaire.
18.41. Elles sont toutes vraies. iEJ iEJ b. Non car sa dimension est 1.
et c. Oui, c'est le noyau de ev0 :
'6' 1 ([O, ll} --) JR, f H f(O). L'es-
18.42. n2 la famille u+v= LPi(u+v). pace des fonctions constantes est
2
(idE, ... , f" ) est liée puisque iEJ un supplémentaire.
dim(2'(E)) =n2. d. Oui, c'est le noyau de
En prenant la so=e on trouve
'6'1 ([O, ll} --) JR, f H f"(l). La
que LiEJ(Pi(v) +Pi(u)) est égal
18.43. Soit P = Lr=l akxk_ fonction x H x 2 engendre un
La condition P(O) cJ O signifie à LiEJ Pi(u+v), et par unicité
supplémentaire.
que no-# O. De P(f) = 0 on dé- de la décomposition,
duit e. Oui, c'est le noyau de
'6' 1 ([O, 1]) --) JR, f H f(l) - f(O).
p p La fonction x H x engendre un
f L_ akfk-l = L_ UJ<f" = -Cl()Ïn · b. Pi o Lk = 0 si j -/- k et supplémentaire.
k=2 k=Z
Pi O lj = idF;. f. Non, car les deux fonction
c. La composée Lk o Pi a seule- x H 1 et x H x se trouvent dans
f ment un sens si j = k. On a un supplémentaire. Or tout sup-
AinsI,. f-1 _ l
- - - L_Ok
fk-1
.
plémentaire d'un hyperplan doit
no k=2 Lio Pi =idf;.
être de dimension 1.
19.14. Oui car la trace est une
forme linéaire, et que les ma-
trices de traces nulles en consti-
Chapitre 20
20.1.
20.10. 198.
20.11. Si rg (A)= n, A est in-
versible et com(A) également. Si
rg(A)<n-1,
-
tuent le noyau. La dimension de a. 0(6, -5) et O'(0, -3).
ce dernier est n 2 - 1. b. (ABCD) est le parallélo- rg (com(A)) = O.
19.15.VH-V. gramme formé par AB(-3, 1) et
A0(4, -6). Son aire est donc
Si rg (A) =n - 1, on a
19.16. Seulement dans le cas de rg(com(A)) = 1.
la décomposition triviale 1- 3 X (-6) - 1 X 41 = 14.
19.18. A=-B=h.
a. X2 . b. x2 -x 20.13.
b. Faux, car a. Vrai. b. Vrai.
19.19. Conjugaison complexe. 20.14. On a le système
Partie réelle.
19.20. c. Faux, car 2-1 2) (<p1(v))
0 1 1 <p2(v) =V,
( 1 -3-2
012) -1 2 4) det(-A) = (-l)ndetA. <p3(v)
(012
000
, 0 1 4
( 0 0-1
.
donc
19.21. On a
20.4. det(-lln) = (-1 )n.
(v)) = (2-11
<p 1
<p2(V) Û
2)-l
1 V.
20.5. (-l)n. ( <p3(v) 1 -3-2
s: .Jf:--,.Jf:, 20.6. Le volume est 21 car
La matrice est à coefficients en-
et 1 -2 1 1 tiers et elle a déterminant -1,
det(AB, AC, AD) = -2 2 3
donc son inverse aussi est à co-
M H M-2E,(M)ll, 1 3 -1
1 efficients entiers.
=-21.
où E, : X --, R est la forme li- 20.15. {l,-1} et {1}.
néaire qui à un carré magique
20.16. GL( 1, Z) contient les
associe son caractère. La symé-
20.7. detB = det('AA) est deux éléments 1 et -1 .
trie change le signe du caractère
égal à Si n > 1 alors GL( n, Z) est
car E,(M-2E,(M)ll) est égal à
<let 'AdetA = (detA) 2 ?, O. un ensemble infini. En effet,
E,(M) - 2E,(M) = -E,(M). pour tout k E Z, la matrice
42-8 82-8
( k_k_ 1 kt 1 ) est de déterminant 1.
-1 0 -1 H -1 4 -1 Cela donne une infinité de ma-
-5 ---4 7 -5 ---4 11
20.8. An = 0 implique que A
trices dans GL(2, Z) qu'on peut
n'est pas inversible et donc que
aussi utiliser comme blocs pour
det(A) =0.
19.22. On trouve p = t1 o Pl et montrer que GL( n, Z) est infini
S = L] 0 Pl - t2 0 P2 · 20.9. 132. si n>2.
- 20.17.
a. Vrai, en vertu de la règle
20.20.
a/b avec a > et b ;,, 1, et on au-
rait 3b = 2°, ce qui est absurde
car 3 ne divise aucune puissance
de 2.
b. Faux.
o De même, Vz ne peut être
rationnel sans quoi on aurait
2b 3 = a 3 pour des entiers a et
b d'où à nouveau une contradic-
Chapitre 21 tion avec l'unicité de la décom-
position en facteurs premiers
21.1. Ceci est immédiat en dis- puisque, l'entier premier 2 appa-
raît à gauche avec une puissance
cutant selon les signes de x et 11.
du type 3n + 1 et à droite du
type 3m. 21.9. X= 11 = 0,5.
21.2. Si lxl ~ 1111 alors 2
x ~ 11 2
. 21.10. X= 11 = 0,4.
Sinon, on a x 2 ;,, 11 2 . 21.6.
21.11. Le premier sous-
21.3. Non car, pour tout ration- a. Si x et 11 sont rationnels, leur
ensemble est l'intervalle
somme et leur produit le sont
nel r > 0, on a O < f < r et [-v'l, v'l] tandis que le second
aussi.
I E IQ. est la réunion des deux inter-
b. Si x et 11 sont irration- valles disjoints ] - oo, -1 [ et
21.4. L'unicité est claire car, si nels, leur somme et leur produit
on a des entiers met n vérifiant, ]1, +oo[ et donc n'est pas un in-
peuvent être aussi bien ration-
nels, qu'irrationnels, comme le tervalle (-2 et 2 y appartiennent
m:Sx<m+l etn:Sx<n+l, mais pas leur milieu 0).
montrent les exemples,
alors, m - 1 < n < m + 1 et 21.12. L'intersection de deux
donc m = n. Pour l'existence, si
v'2 + (-v'l) = 0 EIQ, intervalles est toujours un inter-
x = 0, n = 0 convient et plus valle. La réunion de deux inter-
généralement si x est un entier, v'2.v'2 = 2 EIQ, valles I 1 et I2 non disjoints est
n = x convient ; on suppose dé- toujours un intervalle.
sormais x non entier; si x > 0,
v'2 + v3 ElR \ IQ,
21.13. Dans tous les cas
par la propriété d'Archimède, le
v'2v3 ElR \ IQ. sup(I) = 1 et inf(I) = O.
sous-ensemble de N* constitué
des entiers k vérifiant k x 1 > x c. Si x est rationnel et 11 est 21.14. [a, bl, [a, +oo[ ou bien
est non vide, donc admet un plus irrationnel, la somme est tou- ]-oo,a].
petit élément ; si on note n + 1 jours un irrationnel et le produit
21.15. Oui t H 1 - t.
ce plus petit élément, alors n aussi, sauf si x = O.
convient. Enfin, six< 0, d'après 21.16. Non.
21.7. E n'est ni paire ni pério-
le cas précédent il existe un en- 21.17. Il est évidemment mo-
dique.
tier m tel que m < -x < m + 1, nogène, précisément il s'agit de
donc -m-1 < x <-met donc
n = -m - 1 convient. •
1
1
v'2Z; en effet, pour tout entier
relatif k, il existe m et n entiers
relatifs vérifiant 2m + 3n = k car
21.5. 1 -
.
v'2/v3 1 2 et 3 sont premiers entre eux.
o Si était un ration-
nel a/b, on aurait 2b 2 = 3a2 ,
1: --.0
. sin(a+ h)-sina
qui peut encore s'écrire
h'{x) =
■
contre-exemple des fonctions f 1Jm - - - - - - - = cos a.
h->0 h
et g définies sur IR par f(0) = 2, (1 -x2 ) cosx - (x2 + 1)xsin x
g(0) = 0, f(t) = g{t) = 1 si Ainsi, la fonction x >-l sin x est
(x2 + 1)2
t E IR*. dérivable et sa fonction dérivée
est donnée par x >-l cos x. 26.10.
25.34. Oui.
26.4. Le réel cos(a+ b) est égal a. f'(x) = ✓x~+i ·
25.35. Oui.
à cosacosb-sinasinb, et on b.
25.36. Non : considérer g = sin conclut comme dans la question g'(x) =
et L= 1. test précédente.
2x2
26.5. Léquation est y - 16 2xcosx 2 +ln(l +x2 ) +---z-
25.37. Cette fois-ci la proposi- 1 +x
tion est vraie. 32(x - 2), c'est-à-dire c.
h'(x) =
25.38. Le point a est adhérent y= 32x-48.
à In A. expx2 (2xln{l + x 4 ) + *4)
25.39. Non, voir f(x) = x 3 12 . · ✓1 +x2
26.6. Da pour équation y-1 =
25.40. Non. 3(x-1 ), soit y= 3x-2. Si (x, y) x(expx2 ln{l +x4 ))
appartient à r n D si et seule- (1 + x2)3/2
25.41. Cela équivaut à ment si x 3 = 3x - 2 et y = x 3 ; et arranger l'expression ne pré-
lim f(t) =
t-;n
e. or, sente pas d'intérêt!
25.42. Oui, non et non. x 3 -3x+2 = (x+2)(x-1) 2 , 26.11. On a f'(x) = 4x 3 + 6x,
25.43. f ~a g =} f = Üa(g).
Mais c'est faux pour oa(g).
donc f"(x) = 12x2 + 6
k = sup
[0.10]
12xl = 20.
]*, f~
fonction f prend la valeur k sur
lier.
k~ 1 [ elle est donc en esca-
f(t)dt = I:~:~-l k/n =
intégrable sur [0, 1] définie par
x(t) = 0 si t est rationnel et
x(t) = 1 sinon.
n-1
-2-· 27.15. l. Si f(t) 2 0, alors
27 .6. Il suffit de prendre <p et 1j.> f(t) = f+(t) et L(t) = 0,
26.27. Elle est évidemment lip-
donc f(t) = f+(t) + L{t) et
schitzienne de rapport 100. distinctes en O.
lf(t)I = f+(t)-L(t). Si mainte-
26.28. Oui, c'est immédiat par 27.7. En général, on n'a pas nant f(t):::; 0, alors f(t) = L(t)
l'inégalité triangulaire, et le rap- l'égalité. Il suffit de prendre sur et f+(t) = 0, donc f(t) = f+(t)+
[0,2], <p =1'> = 1. L(t) et lf(t)I = f+(t) - L{t).
port de Lipschitz de la somme
2. Nous avons f+ = f"ifl et
est inférieur ou égal à la somme 27.8. L = f-tl.
des rapports de Lipschitz de cha-
1. Si <p est constante sur
cune des fonctions. ]xk, Xk+ 1 [, alors 1/ <p l'est égale- 27.16. Montrons que f+ :S 9+.
26.29. Non, il suffit de prendre ment. Si f(t) 2 0, alors 9(t) 2 O.
2. On peut voir facilement que Nous avons dans ce cas f+(t) =
le produit de la fonction id11., par
sur [0, 2] la fonction constante f(t) :::; 9(t) = 9+(t). Si main-
elle-même.
égale à 1 ne vérifie pas l'égalité. tenant f(t) :::; 0, alors f+(t) =
0:::; 9+(t). De la même manière
Chapitre 27 27.9. Oui. se prouve l'inégalité L :S 9-•
27.10. Elle est nulle sur [a, bl, Pour la dernière inégalité, écri-
27.1. La fonction f n'est pas en sauf éventuellement en un vons 9 - f = 9+ + 9- - (f+ +
escalier car elle prend une in- nombre fini de points. L) = 9+-f++9_-L. Comme
finité de valeurs sur [0, 1]. Par 9- - L est positive, on déduit
27.11. Pour € E lft';_, il existe
contre, la fonction t H [t 2 ] est que 9 - f 2 9+ - f+.
en escalier sur [0, 10] ; il suffit de
prendre la subdivision Xk = Jîë
<p en escalier sur [0, 1] vérifiant
<p :S x et ib(xl - € < ib(cp) :S 27.17. Supposons J: 92 (t)dt f-
0. L'égalité de l'énoncé entraîne
ib(x). Nous avons ib(<p) :S 0
pourk=0,··· ,10 que le discriminant L'. est nul,
(voir l'exemple), donc ib(x) -
c'est-à-dire qu'il existe un réel À
27.2. La fonction <p est bornée
car elle prend un nombre fini de
€ :::; O. On en déduit alors que
à gauche (resp. à droite), car 27.14. Les deux assertions sont 27.19.
elle est constante sur ]xk-1 , xk [ fausses comme le montre le 1. Soit h la fonction définie sur
(resp. ]xk, Xk+ 1[). contre-exemple suivant : 1 = 1 - [a, b] par h{t) = 1 si t E [a, c]
et h(t) = 0 si t E]c, b]; g n'est 27.28. Si a f 0, on peut f! f{t)dtl < € pour tout E, as-
que la fonction produit fh, elle prendre comme primitive la sociée à X. Si on prend tous les
est donc intégrable. fonction x 1--) exp~ax). Dans le termes de E, rationnels, on ob-
2. Nous avons f! g(t)dt cas a = 0, la fonction x 1--) x est tient If! f(t)dtl < €. Le cas où
f! f(t)h(t)dt = I: f(t)h(t)dt + une primitive. ils sont tous irrationnels conduit
f: f(t)h(t)dt. Comme h est
nulle sur [c, b], nous avons
27.29. Nous avons f tan tdt = à Il - f!f(t)dtl < €. On ob-
tient alors la contradiction, 0 =
f: f(t)h{t)dt 0, donc
-lnlcostl + C sur ] - rc/2 +
krc, rc/2 + br[. f! f(t)dt = 1.
I: f(t)dt = f! g(t)dt. 27.30. Nous avons f thtdt = 27 .38. Il est facile de voir
que s6(f) = O. Montrons que
27.20. Oui, car f est intégrable ln(cht) + C.
si(f) > o. Si X = (xk)O:,k:Sn
sur [a, c] et [c, b]. 27 .31. Une intégration par par- une subdivision de [O, 1], nous
27 .21. La fonction f définie par ties montre que f arctan tdt = avons S(X, f) = I:.;:6
(xk+ 1 -
f(t) = ltl est lipschitzienne sur tarctant- ½ ln(l + t 2 ) + C. xk)Xk+ 1- Notons ko le plus
[-1, 1] et non dérivable en O. 27.32. Grâce à une intégration grand entier entre O et n tel
par parties, nous obtenons que que xko :::; 1/2. On peut vérifier
27.22. Supposons f lipschit-
2f~Jî=tldt = cx✓ l -cx2 + que 1/4 :::; S(X, f). En prenant
zienne sur I, c'est-à-dire qu'il
arcsin ex. la borne inférieure sur toutes
existe k tel que pour tout x f 11
de I nous avons lf(x)-f(y)I < k. les subdivisions, nous obtenons
, lx-yl - 27.33.
1/4:::; S6(f). La fonction f n'est
En fixant x et en faisant tendre 1. Pour obtenir le résultat, on donc pas intégrable car s6( f) =
11 vers x, on obtient lf'(x)I :::; k. utilise le changement de variable 0fS6(f).
Pour la réciproque, on utilise le t 1--) -t.
théorème des accroissements fi- 2. L'égalité f: 0
f(t)dt 27.39. Les deux égalités sont
nis. vérifiées par toute fonction f
f~a f(t)dt + f~ f(t)dt et le
27.23. F est définie et déri- changement de variable t 1--) bornée sur [a, b]. Montrons que
vable sur [-1, 1] avec F'(x) = -t appliqué dans l'intégrale s~(f) = i~(f). Pour € E IR~,
3x2f(x 3 ). f~a f(t)dt permettent de prou- il existe une fonction en esca-
ver l'identité demandée. lier cp vérifiant cp :::; f et i~ (f) -
27.24. La relation F'(x) = f(x+
27.34. Oui, il suffit d'utiliser la
€ < f! cp(t)dt. Or, f! cp(t)dt =
T) - f(x) permet de prouver s~(cp) :::; s~(f). Nous déduisons
l'équivalence. relation de Chasles pour se ra- donc que i~(f) - € < s~(f) pour
mener à un intervalle où la fonc- tout € E IR~. Ce qui entraîne
27.25. Elle est fausse car si F
tion est constante. i~(f) :::; s~(f). Nous avons alors
est la fonction nulle sur IR* et G,
la fonction égale à 1 sur IR~ et 27.35. Le changement de va- i~(f) = s~(f).
nulle sur IR''_, nous avons F' = G' riable t H Vt permet de trou-
27.40. Le changement de
mais G f F+C sur IR* pour tout ver la primitive -3 ifiZI cos {lx+
variable s expt donne
CER 6 {lx sin {lx + 6 cos {lx.
=ln(-~+t 13394 < log 10 (2 44497 ) 28.8. Posons pour x E]O, +oo[,
<p{x) = ln x - y'x. On a alors,
= 44497log 10 2 < 13395,
<p'{x) = 1/x-1/2y'x; on en dé-
+J(t-a)(t-b)) +C.
donc duit que le maximum de la fonc-
tion <p est atteint en 4 et vaut
1013394 < 244497 < 1013395_
donc ln4-y'4 = 2(ln2-1) < 0,
27.45. Dans le cas fi.= 0, nous
d'où il résulte que la fonction <p
avons ✓at 2 + bt + c = fait+ Puisque les deux entiers 1O13394
et 244497 sont différents, leur dif- ne prend que des valeurs stricte-
2b0 1 avec a > O. Le calcul ment négatives.
de f F(t, ✓at 2 + bt + c)dt se ra- férence est au moins égale à 1 et
par suite, 28.9. Les identités
mène alors à celui d'une fraction
rationnelle ou d'un polynôme en 1013394 :S 244497 - 1 < 1013395,
t. e 0 = ch a+ sh a,
d'où il résulte que e- 0 =cha-sha
chna=chna
31.12. -y= o.
30.2. Non, ils n'ont pas la même 31.13. -y(t) = ae' + be 2 t, avec
(a, b) E IR2 .
image. 31.2. -y(t) =et+ K, KER
31.14. -y(t) = (acos(2t) +
31.3. En notant A(t) bsin(2t))et, avec (a, b) E IR2 .
Chapitre 31 J a(t)dt, les solutions sont de
la forme t H Àe-A(t). Si À = 31.15. -y(t) ach(2t) +
0, la solution est identiquement bsh(2t), avec (a, b) E IR 2 .
nulle. Si À /= 0, la solution cor- 31.16. -y(t) acos(2t) +
respondante ne s'annule jamais bsin(2t), avec (a, b) E IR2 .
(car l'exponentielle ne s'annule
31.17. -y(t) = ~e'-tet+aet+
pas sur IR).
b, avec (a, b) E IR 2 •
31.4. L'expression est la même,
31.1. Les solutions sont de la 31.18. -y(t) = ½et - ¾et +
il suffit d'imposer À E IC.
forme t H Àet, avec À E R ae-t + b, avec (a, b) E IR 2 .
Septième partie
SOLUTIONS DES EXERCICES
Chapitre 2 c'est-à-dire
r.:t:: b-a
2.1. Soient f et g deux fonctions de lR:. dans R On tl->(yu1u)=ln(b)-ln(a)- r=·
vab
prouve sans peine les résultats suivants à partir des
définitions :
o si f et g sont impaires, f o g est impaire; 2.5. o Première méthode : utiliser la définition, ce
o si f et g sont paires, f o g est paire ; qui revient à résoudre en x l'équation y = f(x).
On remarque que f est définie sur lR:. à valeurs dans
o si f est paire et g est impaire, f o g est paire;
]0, +oo[. Soit y > O. L'équation ln(l + ex) = y est
o si f est impaire et g est paire, f o g est paire. équivalente à 1 + ex = eY, c'est-à-dire ex = eY - 1.
Puisque eY - 1 > 0, cette équation admet une unique
2.2. La fonction f est un produit de fonctions stric- solution, x = ln( eY - 1). La fonction f réalise donc
tement croissantes et strictement positives sur ]0, 1 [. une bijection de lR:. sur ]0, +oo[ de bijection réci-
f est donc strictement croissante sur cet intervalle ; proque f- 1 vérifiant
f étant de plus continue, elle réalise une bijection de
[0, 1] sur son intervalle image [f(0), f(l )] = [0,2e].
2.3. Notons f la fonction de l'énoncé. Puisque ◊ Seconde méthode : utiliser la dérivation. On re-
marque que f est la composée de deux fonctions
.
hm -f(x)
x--t +oo X
.
= X----thm +oo
✓ /x + 1/x 2
( 1-1 ) = 1, strictement croissantes sur R Elle est donc stricte-
ment croissante sur JR:.. Puisqu'elle est continue sur
lR:. et que
la première bissectrice est la direction asymptotique
de la courbe de f en +oo. Comme lim f(x) = 0 et lim f(x) = +oo,
X--t-oo x--t+oo
lim f(x) - x = -
x--t+oo
lim
x-t+oo
v'x+1 = -oo,
f réalise une bijection de lR:. sur ]O, +oo[.
la fonction f n'admet pas d'asymptote en +oo. 2.6. ◊ Puisque pour tout x E lR:.
2.4. Soit tj., la fonction définie par 1 ex
--- =1----,
1 + ex 1 + ex
1
Vx~ 1, tj.,(x) = 2ln(x) -x + -.
X les primitives sur lR:. de la fonction f sont les fonc-
tions du type
D'après les théorèmes sur les opérations et la dériva-
tion, tj., est dérivable sur (1, +oo[ et sur cet intervalle
7t
2
3.3.
o Pour x: E [n/2, n], 2n - 2x E [0, n] et a le même
1. On remarque que la fonction de l'énoncé, que
cosinus que 2x:, donc arccos(cos{2x:)) = 2n-2x: et
nous noterons f, est Zn-périodique et paire. Il suf-
f(x:) = 2x - n.
fit donc de l'étudier sur I = [On]. Sur I, on a
arccos(cos(x:)) = x:.
o D'où le graphe de f sur lR à la figure 1.4.
o Pour x: E [0, n/2], 2x: E [0, n] et donc
arccos(cos(2x:)) = 2x:, puis f{x:) = O. 2. On remarque que la fonction de l'énoncé, que
7I
2
7I
2
nous noterons g, vérifie 3.4. Il faut faire apparaître un sinus, puisque y est
un arcsinus.
Vx E IR, f(x +br)= f(x) + n.
cos(4y) = 1 - lsin 2 (ly) = 1 - 8sin 2 (y) cos 2 (y)
On déduira donc le graphe de g sur lR de celui sur
[0, ln] par translations de vecteurs
= 1 - 8u2 [1 - u 2 ].
1:x
Posons u = tan(4cx). On a alors u = 1 :~,, où
2 tan(cx,) 5
= 2 ( J(\-::_x:212 - l)
v = tan(2cx) = ( ) 2
1 -tan2 ex, 12 = --(sgn(l -x2 )-1).
1 +x 2
donc u =
~
l-H,- =
120
ÎÎ9'
,
d ou
, oSur)-1, 1[, le signe de 1-x2 est +1; d'où f'(x) = 0
donc f est constante et puisque f(O) = 0, f est nulle
sur cet intervalle et par continuité même sur [-1 , 1].
u-1/239
tan(4cx- f3) = 1 + (u/239) o Sur] - oo, -1 [, le signe de 1 - x 2 est -1 ; d'où
7î
2
7t
2
4.1.
t
( 1 + :;;:
)n ~ et ~
(1 - :;;: )-n ,
t
-(1 - ~r;;;,
2. Un réel x est solution de l'équation si et seule-
ment si e-t O.
32x + 32x-1 = 2x+½ + 2x+f,
De plus,
ce qui équivaut à 3Zx- l (3 + 1)
à 3Zx- 3 = 2x-½ et donc à
= 2x+ ½(1 + 23 ), puis (i+~r ~ et.
En multipliant membre à membre cette inégalité par
le nombre positif {l - t/n)n, on obtient
(2x-3) ln(3) = ( x-D ln(2).
t2 )n ( t )n
( 1 - n2 ~ et 1 - :;;: '
Ainsi, l'unique solution de l'équation est
X
3 ln(3) - ln(2) J
= -c-c--c--,-,--~,.......,.,..,--- = -
3 soit encore
2ln(3) - ln(2) 2· t2 )n ,
t)n ~ -e-t ( 1 - n2
- ( 1 - :;;:
_1_,;::1,;::_1_
e-t - (1 - ~r ~ fn(t).
1 +t"' "'1-t' 4. Pour n ) 1, notons HR(n) la proposition sui-
vante
on a par positivité de l'intégrale
(1-u)n) 1-nu.
lu
0
_dt_ ,;::
l+t""
lu lu
0
dt,;'.'.
"'
-dt-
1-t'
o HR(0) est claire.
0
o Soit n) 1. Supposons HR(n) vraie, c'est-à-dire
c'est-à-dire
(1 - u)n ) 1 - nu.
ln(l + u) ~ u ~ -ln(l - u). En multipliant membre à membre par 1 - a ) 0, on
obtient
2. Puisque t/n E [0, 1 [, on peut appliquer les in-
égalités de la question 1., (1-u)n+l )(1-nu)(l-u)
= 1-(n+ l)u+nu2 ) 1- (n+ l)u,
ln(l +t/n) ~ t/n ~ -ln(l -t/n),
et HR(n+ 1) est vraie.
puis en multipliant par n ) 1
o La proposition HR(n) est donc vraie pour tout n
nln(l + t/n) ~ t ~ -nln(l - t/n), positif d'après le principe de récurrence.
5. Appliquons ce qui précède à a = t 2/n2. Figure 1.7. Graphe de x t-t x 2 2x
3t- ~ =4
ce qui achève l'exercice. t '
La fonction g est donc croissante sur] - oo, - 1nf2i] S n = ch(b +na /Z)sh((n+ l)a/2)
sh(a/2)
et sur IR.+ et décroissante sur [ - Inf2l , 0] . On a
lim g(x) = 0, lim g(x) = +oo. et
x---+-oo x-++oo
.- = h(b /Z) sh((n + 1 )a/2)
"-n s +na sh(a/2) .
s = (1 -1)1547 -1 = -1.
Figure 1.8. Graphe de x H x - th(x) 5.4. Notons les deux sommes respectivement a et
b. D'après la formule du binôme, (1 +i)7 = a+ib.
4.10. Posons pour tout réel x, Or,
f(x) = sh(x) + sh(a +x) + sh(2a + x) + sh(3a + x).
(1 + if = (1 + i)(2i) 3 = (1 + i)(-8i) = 8 - 8i,
1. Puisque sh est impaire, on a
d'où a= 8 = -b.
3a)
= - sh 3a + sh a a 3a
2-
f (- sh + sh
2 2 2 2 5.5. o On a w = 2ei1t/ 6 donc wn = 2neinrr/ 6 .
=0. Ainsi, wn E lR si et seulement si sin(nn/6) = 0,
c'est-à-dire il existe k E Z tel que nn/6 = kn.
Le réel - ~ est donc une solution évidente de L'ensemble des solutions est donc 6Z.
l'équation.
◊ De même, wn E ilR si et seulement si cos(nn/6) = on obtient
0, i.e. il existe k E Z tel que nn/6 = (n/2) + kn.
L'ensemble des solutions est donc 3 + 6Z.
5.6. Puisque a= (a+ b)/2+ (a- b)/2, -1 - w + w 2 + w 3 + w 4 + w 5 + w 6
l+w
lai ~ la+ bl/2 + la - bl/2.
-1-w-1-w
=-----=-2
De plus, b = (b + a)/2 + (b - a)/2 , donc 1 +w ·
lbl ~ la+ bl/2 + la - bl/2,
5.9.
et en sommant les deux inégalités,
1. 41-i 3. J·2 -
_ -1-iv'3
-2-·
lai + lbl ~ la+ bl + la - bl.
2. -1 +i. 4. _2+v'3
2
+ .i2'
Il y a égalité ci-dessus si et seulement si il y a égalité
dans les deux premières inégalités, i.e. 5.10. Rappelons que le conjugé d'un complexe de
module 1 est son inverse.
a=b, a =-b 1. La conjuguaison donne
ou a+ b, a - b et b - a sont non nuls et ont le
1 +ab
même argument : ce dernier cas ne peut manifeste-
a+b '
ment pas se produire puisque a - b = -{b - a). Il
y a donc égalité ci-dessus si et seulement si a = b d'où le résultat.
ou a= -b. 2. De même
5. 7. Soit Z E C. On a Z4 - 1 = (Z 2 - 1 )(Z 2 + 1)
z+abz-a-b) = z+abz-_a-b
d'où ( a- b a- b
Z 4 -1 = (Z-l){Z+ l)(Z-i)(Z+i). z+ (ab)- 1z-a- 1 - b- 1
a-1 - b-1
Puisque pour tout z E C, ~::;:i~ -/-
1 et d'après la
z+ abz-a- b
formule de la série géométrique, l'équation étudiée
a-b
est équivalente à
d'où le résultat.
w + w 2 + w4 + w 5
d'où l'inégalité au rang n + 1. Il y a égalité si et
w 8 -1
u,2-1 seulement si il y a égalité dans les deux inégalités
précédentes, c'est-à-dire d'après l'hypothèse de ré-
De plus, w 7 = 1 donc w 8 = w et currence si, premièrement
1 + w + · • • + w 6 = 0,
arg(z1) = · · · = arg(znl,
w w2
- - +2- - = ( l4+ w ) ( - 1 - w 3 -w)
6 ce qui impose arg(z1 +···+Zn) = arg{z1), et deuxiè-
1 +w 1 +w mement, d'après l'inégalité triangulaire du cours, si
=-1 +w 2 +w5 .
arg(z1 + .. ·+Zn)= arg(Zn+il-
D'où puisque
Ensemble ces deux conditions sont donc équiva-
w3 w3 w4
lentes à arg(z1) = · · · = arg(Zn) = arg(Zn+ 1).
l+w 6 1+1/w l+w'
5.12. 5.14.
1. On a 1. D'après la formule de Moivre, 5 est la partie ima-
ginaire de
ze = -sin(20) + i(cos(20) + 1) = i + ie 2ie
= 2cos(0)iei0 = 2cos(0)ei(e+t l. 22
L. [e"'/23
k~o
. ] k e23xin/23 _ 1
= -~~--
ei1t/23 - 1
On aboutit donc à la discussion suivante :
-2
o si 0 E ~ + nZ, ze = 0; 2isin(n/46)ei"/46
◊ si 0 E LJkEZ] - n/2 + 2kn, n/2 + 2kn[, on a i e-in/46
sin(n/46) ·
7I
Izel= 2cos(0) et arg(zel = 0 + 2 [2n] ;
Ainsi
◊ si 0 E LJkEZ]n/2 + 2kn, 3n/2 + 2kn[, on a 5 = cotan(n/46).
lw 2k -11 = 2sin(kn/23),
z+ 1 _ 2ikn/n
z-1 -e '
L'ensemble des solutions de l'équation initiale est
donc c'est-à-dire
1 +wm+w2m+···+w(n-1)m=n.
6.1. An est la partie réelle de
o Sinon wm i= 1 . Utilisant wn = 1 on a
Ln ( -2-
k=l
ein/3) k
= -2-
ein/3
X----
1 _ ein,r/3 /2n
] - ei1t/3 /2 . wnm 1
l+wm+w2m+···+wln-1)m= -
e'" 13 _ i,/3 wm-J
E n remarquant que 2_e<n; 3 - ~, on trouve
=0.
_ v'3sin(nn/3)
An - 3 X 2n · 2. Appliquons la formule du binôme de Newton
n-1
6.2. On rappelle la relation 1 + j + j2 = O.
s(z)= L (z+wk)n
k=O
429
L
k=27
429
k=27
]
(1 +i2t = L (-j)k = (-j)27 -
( •)403
-J.
] - (-J)
= ~fo (:)wkln-m)zm
= -1.
D'après la question 1., \lm E {O, ... , n} où l'on a effectué le changement de variable i = n-i.
Ainsi
si m E {O, n} n-1 n-1 n-1
sinon. 2Wn = L_ i(i+ 1) = .L_ i 2 + L_ i
i=l i=l i=l
Ainsi s(z) = n(zn + 1). (n- l)n(2n-1) n(n-1)
= 6 +--2-·
6.5. La somme S est la partie réelle de
d'où
4 4 _ n(n 2 -1)
U= L e(2k+T)in/11 = ein/11 L (e2in/1J)k Wn - 6 .
k=0 k=0 4. On a
= ein/11 elOin/11 -1 = eSin/11 sin(Sn/11)
Ainsi
e2in/11 -1 sin(n/11) ·
Xn = ~
1(1.<J(n
i = :f ( f
t.=1
i_
J=1.+l
1) = L i(n - i)
t=l
n-1 n-1
S = sin(Sn/11) cos(Sn/11) = sin(lOn/11) =n.[_i-.[_i2
sin{ n/11) 2 sin{ n/11) i= 1 i= 1
l(i<j(n Ainsi
n
+ .[_max(i,i) y _ Yn _ n(n+ 1)(2n+ 1)
i=l n - 2 12
n n 2 (n+ 1) 2 n(n+ 1)(2n+ 1)
=2 L max(i,j)+.[_max(i,i) 8 12
l(i<j(n i=l
_ n(n2 -1)(3n+2)
n n j-1
- 24
, . , . ,,. n(n+ 1)
=2 L J+Lt= 2 LLJ+--2-
l(i<j(n i=l j=2 i=l
6.7. Si X = 1, le produit vaut 2n+l_ Sinon, on
= 2 f_(i2-j)+ n(n+l) prouve sans peine par récurrence sur n E N que
2 le produit vaut
i=l
2n(n2 -1) n(n+ 1) n(n+ 1)(4n-1) zn+l_l zn+l
= 3 +--2- = 6 . .L_ k X -1
k=0 X = X-1
2. Ona
8.1. Soit n;;, 2. Notons Pl, ... , Pn les n pays d'une P"(x) = f / ( k - 1) (:)xk-l
planète P donnée. Notons Vi le nombre de voisin(s)
sur P du pays Pi· Raisonnons par l'absurde en sup- =n(n-1)(1 +x)n- 2 ,
posant, quitte à permuter les pays, que
de sorte que
V1 < · · · < Vn.
de sorte que
8.3. Une surjections de Nn+ 1 dans Nn possède clai-
rement la propriété suivante : il existe un unique
élément ()( de Nn+ 1 admettant exactement deux
antécédents par s. Contruisons une surjection s :
t
k~l
k2 (2n) = Q'(l) + Q"(l)
2k 4
Nn+ 1 --l Nn : il y an choix de ()(. Pour chacun de = n(2n + 1J2 2n- 4 .
ces choix, on dénombre (nr1) = n(n + 1)/2 choix
possibles d'une paire d'antécédents {a, b} de ()( par
s. Pour chacun de ces choix, il reste alors à définir s 8.5. Inspirons-nous de la démonstration de la for-
sur Nn+ 1 \ { a, b} à valeurs dans Nn \ {()(} de manière mule de Vandermonde. Posons, pour tout x réel,
à obtenir une surjection. Comme les ensembles de P(x) = (1 + x) 2n(1 - x) 2n. Pour tout réel x, on
départ et d'arrivée sont de même cardinal n - 1, a
cela revient à définir une bijection : on dénombre
{n-1 )! possibilités. Ainsi, l'ensemble des surjections
de Nn+ 1 sur Nn est de cardinal
P(x) = ( ; (2;)xk)
0
Ct0
(-1t(2;)xk)
1
nx n(n+l) xn
~
( -l) 1 _n(n+l)!
2
.- .
2 = c~:~{i~ 2n/-llk(2;) t~\) )x'.
8.7. Pour toute suite stationnaire a= (anlnEN no- car lR contient strictement plus qu'un élément.
tons i(a) la valeur commune des Un pour n assez 3. Si ( e1 , e2) était un élément neutre, alors, (x, 1J) *
grand (autrement dit i(a) est la limite de la suite). (e1,e2) = (xe1,1J-e2) = (X,1J). Nécéssairement
Alors l'application e1 = 1 et e2 =0. Mais (1,0)*(X,1J) = (x,-1)) donc
(E, *l n'admet pas d'élément neutre. (E, *) n'est pas
IQ)~-) IQ)(Nl xiQ), a f-) (a-i(a),i(a)), un groupe.
4. lR est un élément neutre. Si (E,*) était un
est bijective d'inverse ( a, a) f-) a + a. Nous sa- groupe, l'équation 0nX = lR admettrait une unique
vons que IQ)(NJ et iQ) sont dénombrables, et par consé- solution (l'inverse de X). Or cette équation n'a pas
quence leur produit l'est aussi. de solution car elle est équivalente à lR = 0. {E,*)
n'est pas un groupe.
8.8.
5. 0 est un élément neutre. Si (E, *) était un
1. Pour construire une permutation <Y de Nn ad- groupe, l'équation lRUX = 0 admettrait une unique
mettant exactement k points fixes, on commence solution (l'inverse de X) or cette équation n'a pas de
par choisir les k points fixes : il y en a (~) . Pour solution car elle est équivalente à lR =X= 0. (E, *)
chacun de ces choix de k points fixes que l'on ras- n'est pas un groupe.
semble dans un ensemble F, il faut définir la per-
mutation sur Nn \ F. Comme F est un ensemble de 9.2.
points fixes de <Y, la restriction de <Y à Nn \F doit être 1. Il faut vérifier que l'ensemble E est non-vide, que
une permutation sans point fixe de Nn \ F. Comme la composition o est associative, qu'elle admet un
INn \ FI = n - k, on dénombre rl.n-k.O = rl.n-k pos- élément neutre et que tout élément de E est inver-
sibilités. Ainsi, sible pour la loi o.
Or toutes ces vérifiactions sont évidentes ; en effet
les éléments de E ne sont que des re-écritures des
éléments de G et loi o n'est qu'une re-écriture de la
loi*· On dit que "la bijection f: G -) E transporte
2. L'ensemble 6n des permutations de Nn est la la structure du groupe G sur l'ensemble E".
réunion disjointe des ensembles suivants : Par exemple la vérification pour l'élément neutre
est :
Posons e' = f(e), où e désigne le neutre de G. Soit
Pk = {a E 6n 1 <Y a précisément k points fixes}
x E E. Posons g = f- 1(x). On a
pour k variant de O à n. Ainsi, d'après la première xoe' = f(f- 1 (x) *f- 1(e')) = f(g H) = f(g) = x
question,
et
n! = f_ rl.n.k = k~O
k~O
f_ (:)rl.n-k
= ktO (n: k)hk = to (:)hk,
L'élément e' est donc neutre pour la loi o. .
2. Evident d'après ce qu'on vient de dire en haut,
l'isomorphisme réciproque étant f- 1.
La relation de l'énoncé est donc bien vérifiée pour Or le produit des éléments de A C IC* est un nombre
tout n E Z. complexe non-nul, d'où un= 1.
2. D'après ce qui précède, A C Un. Comme on a i(ci) = i(c2).
IAI = IUnl = n, il y a en fait égalité : A = Un.
(4=) Soient c1 = (k1, ... , k,,) et c2 = (k{, ... , k{,).
9. 7. Appliquons la caractérisation usuelle des sous- Clairement il existe une permutation cr E 6n telle
groupes. que
10.2. Il faut distinguer les cas n = 2 et n ~ 3. o Si n est impair : n = 2m + 1 avec m E N*. Alors
o Sin= 2, 62 = {idr, 2 , (1,2)} donc Z = 62.
o Soient n ~ 3 et cr E Z. Soit i E Nn. Il existe j cr= fl(k,2m+2-k) et e(cr)=(-l)m.
et k dans Nn tels que i, j et k soient deux à deux k=l
distincts. Comme cro (i,j) = (i,j) o cr, on a
(i, j) = cr o (i, j) o cr- 1 = (cr(i), cr(j)). 10. 7. Une permutation cr vérifie cr2 = idNn si et
seulement si w( cr) = 1 ou 2. Puisque l'ordre d'une
Ainsi, cr(i) = i ou cr(i) = j. Comme le même raison- permutation cr c/ idr;n est égal au ppcm des lon-
nement nous conduit à cr(i) = i ou cr(i) = k cl j, on gueurs des cycles de sa décomposition en produit
a cr(i} = i. Ainsi, cr= idr;n et Z = {idr;J de cycles de supports disjoints, une permutation cr
10.3. Prouvons que deux cycles sont conjugués est d'ordre deux si et seulement si elle est le pro-
dans 6n si et seulement si ils sont de même lon- duit d'un nombre fini non nul de transposition de
gueur. supports disjoints. Les permutations cr telles que
cr2 = idr;n sont donc l'identité et les produits de
(==}) Sic1 =(k1, ... ,kp)etc2=croc1ocr- 1 avec
cr E 6n, on sait que c2 = ( cr(k1), ... , cr(k,,)) et donc transpositions de supports disjoints.
10.8. 11.2.
1. Soient C1 et c2 deux cycles qui commutent tels 1. Z[j] contient 0 = 0+0j et 1 = 1 +0j. Soient z et z'
que Supp(c1) nSupp(cz) i= 0. Notons u un élément dans Z[j]. Il existe a, b, a', b' E Z tels que z = a+jb
de cette intersection. On sait que et z' = a' +jb'. On a z-z' = (a-a') +j(b- b') E
Z[j] et
Supp(ci) = {c}(u) 1k EN}
zz' = aa' +j(ab' +a'b) +j2bb'
et = aa' +j(ab' + a'b)- (1 +j)bb'
Supp{cz) = {c~(u) 1 k EN}. = (aa' - bb') + j(ab' + a'b- bb') E Z[j].
Il existe a E Supp(c1) et 13 E Supp(cz) tels que Ainsi, Z[j] est un sous-anneau de C. Z[j] n'est pas
u = c1 (a) = Cz(/3). Soit k E N. Comme c1 et c2 un sous-corps de C car ½!/. Z[j]
commutent, on a 2. Soit z E Z[j]. Il existe ( a, b) E Z 2 tel que
z = a+jb d'où
c}(u) = c}(c2(13)) = c2(c}(l3)).
/z/ 1 =zz= (a+jb)(a+jb)
Mais c~(l3) E Supp(cz) car sinon c~(u) = c~(l3) et
= (a+jb)(a+j2b) = a1 + b 1 + (j +j2)ab
donc u = 13 par injectivité de c~, ce qui est absurde
car alors 13 = Cz(l3) et 13 r/. Supp(cz). On a donc = a1 + b 1 - ab E Z
c~(u) E Supp(cz). D'où Supp(c1) c Supp(cz) puis 1
Supp(c1) C Supp(c1), car c1 et cz jouent des rôles et comme /z/ est positif on a même /z/2 E N.
symétriques. 3. Ona
2. Bien sûr que non. Il suffit de considérer 1lh ={l,-l,j,-j,j2,-j2}={1, -l,j,-j,-1-j, 1 +j}.
12.5. m
12.6.
1. Raisonnons par contraposition. Soit n ;,: 2 non
Chapitre 13
premier. Il existe alors deux entiers k > 1 et k' > 1
tels que n = kk'. Mais alors 13.1.
1. o Prouvons l'unicité de În-
k-1
2n-1 = (2k')k-1 = (2k' -1) L 2k't_ Soient În et Yn deux polynômes vérifiant la rela-
e~o tion de l'énoncé. Posons P = În - Yn. Le polynôme
P vérifie \ft E IR, P(cos(t)) = O. Il admet donc une
Et comme n > k' > 1, 2k' - 1 est un diviseur de
infinité de racines : les réels appartenant au segment
Mn strictement compris entre 1 et Mn : Mn n'est
[-1, 1]. On a donc P = 0 et În = Yn.
pas premier.
2. Après une méthode de crible, on trouve que o Prouvons l'existence de În,
11
2 - ] = 2047 = 23 X 89. Soient n E Net t ER D'après la formule de Moivre,
= t
k~O
(:}ksink(t) cosn-k(t). o L'hypothèse HR(n) est donc vraie pour tout entier
naturel n ;;, 1, d'après le principe de récurrence.
5. Soit n ~ 1. Posons, pour tout O ( k ( n - 1,
Et puisque i k E lR si et seulement si k est pair
puis
Ainsi, \ln ~ 0 et t E IR,
f"(t) = -n 2 cos(nt) - sin 2 (t)T;(cos(t))
cos((n - 1)t) + cos((n + 1)t) = 2cos{nt) cos(t).
+ cos(t)T~(cos(t))
Le polynôme = -n2 cos(nt) + cos(t)T~(cos(t))
- (1 - cos2 (t))T;(cos(t)).
admet donc une infinité de racines, les nombres de Puisque f est nulle sur IR, le polynôme
la forme cos(t), t décrivant R On en déduit que le
polynôme Pest nul, i.e. Tn+ 1 = 2XTn - Tn-1 · P = (X2 - 1)T; + XT~ - n 2 Tn
4. Prouvons par récurrence sur n ~ 1 la proposi- admet une infinité de racines, les nombres de la
tion HR(n) suivante: forme cos(t), t décrivant R Ainsi, P = O.
<< Pour tout 1 ( k ( n, Tk est de degré k,
de coefficient dominant 2k- l et a la même 13.2.
parité que k. » 1. Les seuls polynômes constants à vérifier (*) sont
o L'hypothèse est banale aux rangs 1 et 2. clairement le polynôme nul et le polynôme constant
égal à 1.
o Soit n ~ 2. Supposons HR(n) vérifiée. Puisque
2. D'abord prouvons que °'
cJ O : si O était une
racine de P alors 1 aussi car
n!pnP(-y) = n!pn1Jn.
ce qui est le cas pour tout n EN, puisque
Ainsi, P(X) = xn.
13.7.
◊ Calcul de cr;. On a cr; = :, = -1.
1. Soit n > deg (P). Écrivons la formule de Taylor
à l'ordre n pour P,
◊ Calcul de cr~. On a cr~= N2 = -2.
n p(kl(a)
P = P(a) + (X- u) L
-k-!-(X- a)k-l.
◊
I
Calcul de cr3" On a cr3I -
- ~
c,
-
- cr3 _- -1.
k~l 3
Par unicité dans la division euclidienne de P par Les trois réels sont donc les racines du polynôme
X- a, le reste recherché vaut P(a).
2. Soit n > deg (P). Écrivons la formule de Taylor
à l'ordre n pour P, Q = X3 + X2 - 2X + 1.
P = P(a) + P'(a)(X- a)+
P = (X- a)(X- b)Q +uX +v, Rappelons les calculs menés à la question 2. du
on obtient après évaluation en u et b, même exercice ; on a les relations N 1 = cr1 , puis
= -3 + (2-
a2 + __!__
b2 + 2-)N2
c2 X3 - X2 -4X + 4 = (X-1 )(X-2)(X + 2).
u
=-3+N2x 2 .
cr3
Ainsi, S = -5.
13.10. et par injectivité de x >-t cotan2 (x) sur ]0,1t/l[, les
1. Soient x E IR\ 1tZ et n E N*. D'après la formule nombres réels
de Moivre,
cotan2 ( lnk1t
+ ) , 1 ,( k ,( n
sin((ln + 1)x) = '.Jm((eix) 2n+l) 1
ln+
(ln+l)cr1 = ( ln-l
1)
et donc
Or, i 2n+l-k E IR si et seulement si k E lN + 1. La
partie imaginaire de In vaut donc ~ 2 n(ln-1)
cr 1 = L cotan (k1t/(ln + 1)) = .
3
k=l
sin2n+l(x) L (2~;,)r-lln-kcotan2k(x),
o:,;;;2k:,;;;2n+ 1
3. Posons, pour tout x E [O, 1t/l[,
c'est-à-dire
f1 (x) = sin(x) - x et f2(x) = tan(x) - x.
sin((ln+ l)x) = sin 2n+l (xJPn(cotan2 (x)). f1 (x) < f1 (0) = 0 et f2(x) > f2(0) = O.
2 2
=sin n+l (~)rn(cotan ( ~ ) )
ln+ 1 ln+ 1 d'où
1
cotan2 (x) < 2 < 1 +cotan2 (x).
et puisque X
Puisque Vl ,( k ,( n,
sin 2n+ 1(k1t/(ln + 1)) fc 0,
kn/(ln + 1) E]0, 1t/l[,
le nombre réel
on a
k1t )
cotan2 ( ln+ 1 2( kn ) (ln+1)
2
cotan ln+ 1 < 7r2k2 '
est une racine de Pn. Puisque Vl ,( k ,( ln,
et
2
2 ((ln+ 1 - k)1t) 2 ( k1t ) (ln+l) 2( k1t )
cotan ln + 1 = cotan ln + 1 n2k2 < 1 +cotan ln+ 1 .
Puis, en sommant de 1 à n, et le pôle a est de l'ordre 2 car Pet Q1 ne s'annulent
pas en a.
n (2n+1) 2
f
n
cotan
2 ( kn )
2n + 1 < n2k2 f Cherchons la partie polaire de F en a. Selon le lemme
14.7, le pôle en a de
On trouve que les solutions sont de la forme (À, 0, À) ce qui montre bien que H est un sous-espace vecto-
avec À E lit. Donc (1, 0, 1) est une base de L et riel de llt 3 .
dim L = 1.
Reprenons les questions dans le cas complexe. 16.5.
E n'est pas un sous-espace vectoriel de IC 3 . En effet,
1. Il est clair que toute combinaison linéaire de ma-
E contient les vecteurs (1, i, 0) et (1, -i, 0) mais il
trices de C est encore une matrice de C, C est donc
ne contient pas leur somme (2, 0, 0). Pour F, G et H
bien un sous-espace vectoriel. Sa dimension est 2,
les réponses ci-dessus ainsi que leurs preuves restent
valables dans le cas complexe.
une base en est par exemple Ili , J = ( ?-,} ).
2. Il est évident que l'application
Chapitre 16
est injective et que son image est C. Il ne reste qu'à
( 2
7
1
1
4
- 1 1
4
2
5
11
1
2
6
1
-1
4
9
lJ-1
16.1. Appliquons la méthode du pivot de Gauss
sous sa forme matricielle (A, y) :
1
<--+
<-----
J-2 i-7
+
<--------- +
montrer que f est un morphisme d'anneaux. Évi-
demment, l'image du nombre complexe 1 est la ma-
trice identité. Pour la multiplication, on a
-;,l
0(. (X
(l 0
0
0
0
0
0 = (cos(koc) - sin(koc))
sin(koc) cos(koc) ·
16.2. Pour tout m o, ... ,n - 1, ap-
pelons la m-ième diagonale supérieure d'une
16.6.
matrice (bekl E An(OC) le n - m-uplet
(b1 ,l+m, b2,2+m, ... , bn-m,nl- La puissance Am 1. D'abord, nous notons que l'élément nul et l'élé-
est alors la matrice n x n dont la m-ième diagonale ment unité sont dans le centre. Soient b, b' E Z(A).
Alors
supérieure ne contient que des 1 et est nulle ailleurs.
En particulier, Am = 0 pour tout m;?: n. a. on ab - b' E Z(A) car, pour tout a E A,
l}
0 b1k 0
0 b2k 0 de conclûre lorsqu'on prend leur somme.
(l 0 b1k 0
3. La matrice n(Iln +A) est à diagonale dominante
au sens de la première question.
Donc, b 1i = 0 dès que j # t. Ainsi, B est une ma- 16.8. Le tableau de composition est
trice diagonale. En plus, en comparant les coeffi-
cients d'indice (k, !) de ces deux matrices, on trouve
bu = bkk. Ainsi, tous les coefficients diagonaux de Il e I a I b I c I d I f 1
B sont identiques, d'où e e a b C d f
a a e d f b C
b b f e d C a
C C d f e a b
d d C a b f e
16.7.
f f b C a e d
1. Supposons par l'absurde que A n'est pas inver-
sible. Donc il existe une relation de dépendance li-
Nous notons que dans chaque ligne figure l'élé-
néaire entre les colonnes Ci de A, c'est-à-dire on a
ment neutre e = Il2, ce qui montre que chacune
x = (x1, ... , Cn) E icn non nul tel que LJ=l xi Ci=
des matrices est inversible et que son inverse est
O. On a donc le système
l'une parmi ces mêmes six matrices à coefficients en-
U11X1 + a12x2 + ... + a1nXn = 0 tiers, donc les six matrices sont bien dans le groupe
a21X1 + a22x2 + ... + UznXn = 0 Gl(2, Z) et forment un sous-groupe.
Notons les six permutations dans 63 comme suit
{
+ Un2X2 + ... + UnnXn ~ (123) (123)
Un]Xl
213 b' = (123)
Û.
::::l:~:::'(ï13r:.:::::':,::
sous-espace vectoriel car c'est le noyau de l'applica-
Ainsi, ÀuU + ÀvV = Àu+vU + Àu+vV, et puisque la
famille est libre, Àu = Àu+v = Àv-
◊ Cas 2 : (u, v) est liée.
tion linéaire de IR 3 dans IR donnée par (x, -y, z) H
X+ 2-y. Puisque u fc 0 et v fc 0, il existe donc µ E lK*
tel que v = µu. On a f(v) = ÀvV = µÀvU, mais
2. Un vecteur appartient à F n G si et seulement
aussi f(v) = f(µu) = µÀuU- Ainsi, Àu = Àv puisque
s'il est de la forme
µ#O.
(À - 3µ, 2;\ + 3µ, À) avec À - 3µ + 2(2;\ + 3µ)
Conclusion : en notant À la valeur commune des Àv
et À,µ E IR. C'est-à-dire si et seulement si il est de pour v non nul, on a pour tout v non nul, f(v) = Àv.
la forme Puisque f(0) = 0, cette égalité est valable sur E.
(6À, -3À, À) avec À E IR. 18.2.
Ainsi, F n Gest la droite JK.(6,-3, 1). 1. Notons n = dim E.
(====}) Si f est une homothétie, alors f = ÀÏdE- Clai-
17.3. o Fest un sous-espace vectoriel de E. En effet, rement pour toute base !Ji! de E, on a M.s,i(f) = Àlin.
F contient la suite nulle ; la stabilité par combinai- ( ~ ) Montrons d'abord que pour tout v E E les
son linéaire résulte de la linéarité de lim, vue en vecteurs v, f(v) sont liés. Supposons le contraire,
analyse - plus précisément, si (UnlnEN et (unlnEN c'est-à-dire qu'il existe v 1 E E non colinéaire avec
sont dans F et si À est dans lK, alors v2 = f(v1 ). On complète (v1, v2) en une base !Ji!=
(v1, v2, ... , Vn) de E. Alors l'élément d'indice (2, 1)
dans M.s,i(f) est 1. En revanche, si on prend la base
est égale à !Ji!' = (2v1, V2, ... , Vnl alors l'élément d'indice (2, 1)
dans M.s,i, (f) est 2. C'est en contradiction avec l'hy-
lim (Un -Un+1l +À lim (vn -Vn+l) = O. pothèse selon laquelle Mai (f) et M.s,i, (f) doivent
n-+oo n-+oo
coïncider. 1. PH XP.
On conclut avec l'exercice 18.1. 2. PHP 1 •
2. Une matrice A E Gl(n, IK) commute avec tous 18.5.
les éléments de Gl(n,IK) si et seulement si
1. E est de dimension infinie.
VC E Gl(n,JK), 2. 1jJ est bien définie car la fonction primitive
lj)(f) = g est bien une fonction continue. La véri-
Cela signifie que la classe de conjugaison de A ne fication de la linéarité est facile.
contient que A. Autrement dit, l'application linéaire 3. o Soit f E Ker lj). On a alors
définie par A possède la mème représentation ma-
tricielle dans toutes les bases. D'après la question 1.
cela revient à dire que A est une matrice homothé-
Vx E lll+, I tf(t)dt = O.
tique, A = Àlln, d'où La fonction t H tf(t) étant continue sur lll+, l'ap-
plication
Z(Gl(n,IK)) ={Àlln I À E IK*}.
trices carrées est le même que le centre du groupe est dérivable sur lll+ de dérivée
des matrices inversibles. x H xf(x).
18.3. Ainsi,
2 Vx E lll+ , xf(x) = O.
1. Puisque f = 0 est équivalent à lm (f) C Ker (f),
on a dim(lm(f)) :( dim(Ker(f)). De plus, lm(f) f- En particulier, Vx > 0, f(x) = 0 puis f(0) = 0 par
Ker (f) car sinon, en appliquant le théorème du rang, continuité de f en zéro. Le noyau de 1jJ est donc ré-
on obtiendrait la contradiction 2 dim(lm (f)) = 3. duit à 0 et 1jJ est injective.
Ainsi, dim(lm (f)) < dim(Ker (f)). Puisque f est non
o L'application 1jJ n'est pas surjective puisque
nulle,
Vf E E, lj)(f)(0) =0
1 :( dim(lm (f)) et dim(Ker (f)) :( 2.
et qu'il existe des fonctions g E E telles que g(0) f- 0
Ainsi, rg (f) = 1. Un exemple est l'endomorphism e (comme g = cos ou g = 1).
de lll3 associé à la matrice
4. Soient À E lll et f E Ker (lj) -Ài.dE).
01 0) o Cas 1 : À= O.
(00 00 00 On a montré à la question précédente que Ker 1jJ =
2
o.
2. Puisque f 3 = 0 équivaut à lm (f) c Ker (f ), on
2
a dim(lm (f)) :( dim(Ker (f )). o Cas 2 : À f- O.
2
1 :( dim(Im(f)) et dim(Ker(f )) :( 2. I tf(t)dt - M(x) = 0,
o L'application
(qui est d'ailleurs l'inverse de la matrice M81J(f) en '6'(IR) --l '6'd (IR), g H (x H [ g(t)dt),
haut) et on fait le même raisonnement que dans
la preuve ci-dessus : f' est un isomorphisme qui
envoie la famille libre (u1, ... , Un) sur la famille est linéaire. Elle est bijective car la dérivation f H f'
(v1, ... , Vn) qui est donc libre. est son inverse. Ainsi,
On remarque que la fonction ft est dérivable en tout est linéaire. Elle est bijective car (f, c) H f + c est
point de JE. sauf en t. Ainsi, la somme ci-dessus son inverse. Donc
donne une fonction dérivable en r, ce qui est en
contradictoire car f T n'y est pas dérivable.
18.11. o Pour des raisons de dimension, on a
ccd (IR) x JE. CC:'. cc 1 (IR).
o Soit 1j, : JE. --l] - 1, 1 [ une bijection (par exemple REMARQUE - On vient de montrer que parmi
x H -#; arctan x). les 17 espaces vectoriels proposés, le nombre de
Il est clair que l'application IC1- 1•11 --l IC1\ f H folj,, classes d'isomorphie est au plus 6. On n'a pas dé-
est linéaire. Elle est bijective car f H f olj,- 1 est son montré que ce nombre est égal à 6.
inverse. Donc
ICJ-1,11 CC:'. ICI!.
18.12. Non, en effet si c'était le cas, alors JE.'.:::'. QIN).
o Même idée : soit cp : l\l --l Z: une bijection
Or dans des exemples du chapitre sur la dénom-
(par exemple O H 0, 1 H 1, 2 H -1, 3 H 2,
brabilité nous avons vu que JE. est non-dénombrable
4H-2 ... ).
Il est clair que l'application IC" --l ICN, (uklkEZ H tandis que QIN) est dénombrable.
18.13. Ou encore
1. Un élément de JKixJ est une fonction f: I x J -l
E. En posant cp(j)(i) = f(i, il, (i, il E I x J, cela
définit pour tout j E J une fonction cp(j) : I -l E,
donc cp est un élément de (JK:1) 1. ce qui se ramène à la seule condition
Réciproquement, si tf, E (IK 1 ) 1, alors en posant
f(i, j) = 1),(j)(i), on obtient un élément f de JKixJ.
Cela définit une bijection naturelle entre 1K I x I et
(JKl)I.
Or t, et T] sont des variables muettes (on n'a pas
2. Si f: I x J -l E est à support fini, alors f(i, il = 0 fait de changement de coordonnées), donc on peut
pour tout (i,j) E I x J\{(i,,i,), ... ,(in,in)} avec les renommer par x et y. Ainsi l'équation de l'image
certains ik E I et ik E J. On pose I' = {i1, ... , in} c; de C par A 1 est
et J' = {i,, ... ,in}- Alors {(i1 ,i,l, ... , (in,in)} C
l' x J'. Donc cp(j)(i) = f(i,i) = 0 pour tout i E I\I' c; : x2 +411 2 =4.
et cp(j) est la fonction nulle sur I pour tout j E J\J'.
Réciproquement, soit 1), E (JK( 11J(I)_ Alors, 1),(j) est De même, en remplaçant dans l'équation carté-
la fonction nulle sur I pour tout j E J\{i,, ... , in} sienne de D, on obtient
avec certains Îk E J. De plus, on a 1),(jk)(i) = 0
pour tout i E I\I(, où I( est un sous-ensemble fini
o; : x+2v13-y =4.
de I, k = 1, ... , n. Donc f(i, il = 1),(j)(i) = 0 pour
tout (i,j) E (I x J)\((LJ;~, I{) x J').
1
18.14. 1
1
1
► Images par Az : On trouve par la même méthode
ou encore
c'est-à-dire on remplace dans l'équation 'l'(x, -y) = 0
les varibales (x,y) par A- 1 (x,y). On le comprend
mieux dans la pratique :
► Images par A 1 •
L'équation 'l'( x, -y) = 0 du cercle C est donnée par la
fonction 'l'(x, y)= x 2 +y 2 - 1. Un point (t,, T]) de JR 2
est dans A 1 ( C) si et seulement s'il existe (x, y) E JR 2
tel que
► Images par A 4 : On a REMARQUE - A une homothétie près, il s'agit de
la projection orthogonale sur la droite IR( 1, 1) .
A-l=(co~'t sinÏ)=~(v'3 1 ).
4 cos6
-sm 6 2 ~1 v3
On trouve
et D~ : y= 1.
Chapitr e 19
19.1.
1. Puisque Im(f + g) = {f + gl(E) C f(E) + g(E),
on a
► Images par As : Ici on n'a pas affaire avec un
2
automorphisme . En effet As envoye tout IR sur la rg (f + g) :(; dim{Im (f) + Im (g))
droite d'équation y - x = O. D'après la question 2., :(; dim(Im (f)) + dim(Im {g))
D~ = {P~(2,2)}. = rg {f) + rg {g) .
q consiste de tous les points de la forme {x +
v'3y, x + v'3y) avec x 2 + y 2 = 1. Autrement dit, ce En appliquant l'inégalité précédente à f + g et -g,
sont tous les points de la forme (x+ J3(1 -x2 ), x+ on obtient
J3(1 -x2 )) ou (x - J3(1 -x2 ), x - J3(1 - x 2 ))
rg (f) = rg {f + g - g) :(; rg {f + g) + rg {g),
avec -1 :(; x :(; 1. Par un petit calcul d'extrema
on trouve que C~ consiste de tous les points de la c'est-à-dire rg (f) -rg (g) :(; rg (f + g). Les endomor-
forme (t, t) avec \t\ :(; 2. phismes u et v jouant des rôles symétriques, on a
aussi rg (g) - rg {f) :(; rg (f + g) et donc
On trouve
1rg (f) - rg {g)I :(; rg (f + g).
{x-y=O , {x=2
C' \xi:(; 2 et Ds : y= 2 .
s : 2. D'abord nous remarquons qu'on a l'égalité
rg (f + g) = rg f + rg g si et seulement si les deux
REMARQUE - A une homothétie près, il s'agit de inégalités de la question 1. sont en fait des égalités,
la projection sur la droite IR (1, 1) parallèlement à la autrement dit, si et seulement si
droite IR( v'3, -1) , donc parallèlement à la tangente
Im (f + g) = lm {f) EEi Im (g).
T.
o Supposons que rg (f + g) = rg (f) + rg (g). Nous
devons prouver que Ker (f) + Ker (g) = E.
D'abord nous constatons que
19.3.
1. Fest un hyperplan; le vecteur (1, 1, 1) n'est pas Les trois autres points sont leurs opposés, car on a
dans F et engendre G et. Donc IR3 = F œ G. Zkl = -z1k. Il s'agit des 6-èmes racines d'unité.
D'autre part, on sait que la dimension de E* =
.Z(E, IK) est n, donc {<p1, ... , (f)n) est une base de
E*. Deux espaces vectoriels de même dimension finie
sont isomorphes.
2. Dans JKn, il y a la base canonique e1, ... , en. No-
z12 tons {<p1, ... , (f)n) les coordonnées canoniques. Alors
ek H (f)k définit un isomorphisme canonique de E
sur E*.
Sous cet isomorphisme canonique, le vecteur
( a 1, ... , Un) E IKn correspond à la forme linéaire
(x1, ... , Xn) H a1x1 + · · · + UnXn.
19.7.
3. Nous ne faisons la preuve que pour CY12 (pour les
1. Linéarité :
deux autres transpositions 0"23 et 0"13, c'est pareil).
D'une part, de la preuve de l'exercice précédent, x(u + Àv)(f) = f(u + Àv) = f(u) + M(v)
nous connaissons déjà la matrice de ô'1z. Avec la
base d = {z12,Z23) dans IC, nous trouvons
= x(u) + 7'x(v).
Supposons par l'absurde que X n'est pas injective.
M,1(ô'1kl = M,1(f O O!k O f- 1i
Alors il existe v E E non nul tel que x(v) = O. Donc
= M,1,qJ(f)M,qJ(01k)M,qJ,1(f- 1) pour tout f E E*, on a f(v) = O. On complète v en
_ (1 0) (-1 1)
-01 01
(1010) = (-101·
1)
une base E. Dans le système de coordonnées asso-
cié à cette base, la fonction qui correspond à v est
une forme linéaire sur E qui prend la valeur 1 sur v.
D'autre part, la droite perpendiculaire à lRz12 est C'est une contradiction.
l'axe imaginaire. La réflexion par rapport à l'axe 2. Si dim E = n < oc, alors d'après l'exercice précé-
imaginaire envoie la base d = (z12,Z23) sur dent, l'espace E, le dual E* et le bidual E** ont tous
(z21,z13) = (-z12,z12 + z23). Donc dans la base la même dimension finie. Donc le morphisme injec-
d, cette réflexion a la représentation matricielle tif de la question précédente est un isomorphisme.
("01 l), ce qui prouve qu'elle est bien l'automor- Comme il ne dépend d'aucun choix, il s'agit d'un iso-
phisme ô'ik• morphisme canonique; on peut donc identifier l'es-
Les six éléments du groupe symétrique 63 s'iden- pace avec son bidual.
tifient à des transformations de l'hexagone régulier
de sommets z12,z13, z23,z21, Z31,Z32 en lui-même. 19.8. La vérification de A 2 = A est facile. Donc
Les transpositions CY12, 0"23, 0"13 correspondent aux l'endomorphisme A : IKn --l IKn, x H Ax, est une
reflexions par rapport aux trois axes de symétrie de projection. Son rang est 1. Ainsi, A est semblable à
l'hexagone qui passent au milieu des arêtes. Elles la matrice
engendrent le groupe 63; les trois éléments de 63
qui ne sont pas des transpositions correspondent aux
trois rotations d'angles respectives 0, 23" et ~.
19.10.
1. Puisqu'en dimension 1, le seul hyperplan est l'es-
pace nul, on a n ;) 2. Il est facile de voir que ces deux facteurs ont pour
2. Puisque les deux hyperplans sont distincts, il déterminants précisément <let A resp. <let D. On
existe u E H1 \ H2. On a donc conclut alors en appliquant la formule du détermi-
nant d'un produit.
E = H2 EB lKu C H2 + H1 CE, Généralisation : on considère des matrices en blocs
de la forme
ainsi E = H1 + H 2 et d'après la formule des dimen-
sions,
det M = det(A + iB) det(A - iB). Du fait que les droites G1 et G2 sont distinctes,
on déduit qu'au moins un des coefficients 112 - 13111
ou x2 - j3x1 est non nul. Cela prouve que (1.3) est
l'équation d'une droite, à savoir la droite G cher-
2. Si n = 1, la formule est manifestement vraie. chée.
Considérons donc le cas n ~ 2. 3. Soient (G1,G2,G3,G4) et (G\,G~,G~,G;) deux
Si AB = BA, la formule est vraie car alors quadruplets de droites vectorielles distinctes dans
OC. 2 . Soient (xi, 11i) des vecteurs tels que Gi =
IK(Xj,1ljl-
2
(A+iB)(A-iB) = A 2 + B . (===}) Soit f un automorphisme de OC. 2 tel que
1
f(Gj) = G pour j = 1, ... ,4, et soit(~~),
ad- be # 0, la matrice de f dans la base naturelle.
Elle est fausse dans le cas général, comme le prouve 1,
On pose (x 11f) = f(xj, 11il = (axi + b1Ji, cxi +d11il-
le contre-exemple suivant : Alors
(1.4)
01-10)
A -B 10 0 0
M=(*)=
(
10 01 .
00 1 0 Ona
On a donc L',4 = O.
1 0 0 1
L'.2=(2a+x) lx-a O =(2a+x)(x-a)2. o Posons
1
1 0 x-a
M=
(
abc)
cab et D=
11 1)
lj j2
( 1 j2 j
,
20.8. Notons Ck, 1 ~ k ~
3 les colonnes du déter- b c a
minant. Puisque pour tout x E JR,
où j c/= 1 est une troisième racine de l'unité. On a
cos(x) + cos(x + 2k) = 2cos(k) cos(x + k),
a j3 y )
les colonnes du déterminant sont liées par la relation MD= a jj3 j2y ,
( a j2j3 jy
OÙ
P = (X-a)(X- b)(X-c)(X-t).
D-3 = IA+ s, s + c,A+ ci. P = (X- a)(X- b)(X- c)(X +a+ b + c).
3. On obtient 20.15. Calculons le déterminant de Ma par déve-
2
loppement par rapport à la première ligne.
1a a 0 2
1b b2
2
0
= P(d) 1a
1b
a
b2
I det(Ma) = (a+ l)(a2 +5a)-2a+ (-3a)
1C c Û = a((a+ l)(a+5)-5)
1C c2
1d d 2 P(d) 1
=a2 (a+6)
= (d- a)(d- b)(d- c)(d +a+ b + c)
x (c-b)(c-a)(b-a). La matrice Ma est donc inversible si et seulement
si a 1/c {O, -6}.
20.12. Soit M = ( g ~). On a alors par blocs, 20.16. Pour M = A, on a
2detA = detA+detA = det(A+A) = 2ndetA
~= 1 aM bM 1
bMaM.
et comme n? 2, detA = O.
Effectuons l'opération par blocs C2 f-- C2 + C1, Raisonnons par l'absurde en supposant A non nulle.
Son rang r est alors supérieur ou égal à 1. On sait
~-1 aM(a+b)MI=( +b)zl aMMI qu'il existe des matrices inversibles Pet Q telles que
- bM(a+b)M a bMM. A= PJrQ avec
M=
11
012
0) .
det(A + M) = det(PQ) = <let Pdet Q #0
car P et Q sont inversibles. Cela contredit l'hypo-
( 001
thèse det(A + M) = <let A+ <let M.
On a donc det(f) = det(M) = 1. Donc f est un 20.17. Il s'agit d'un système homogène de matrice
automorphisme.
20.14. Voici deux démonstrations possibles.
o Première version. Il existe p, q, r E ffi. tels que
sup(AB) ~supAsupB.
d'où Il nous reste à voir que cette inégalité est une égalité.
Par définition d'une borne supérieure, pour€ E lfl'j.,
(µ+ 1/n) 3 ~ µ 3 + (3µ 2 +3µ+ 1)/n il existe a E A et b E B tels que
infA+infB ~ a+ b ~ supA+supB,
Il nous reste à voir que ces deux inégalités sont des supAsupB ~ sup(AB)
égalités; les deux cas étant analogues, nous traite-
rons uniquement le cas de la borne supérieure. Sup-
et on peut ainsi conclure que sup A sup B
posons donc par l'absurde que l'on ait
sup(AB). Cette égalité n'est plus vraie si A et
supA + sup B > sup(A + B). B contiennent des réels négatifs ; on peut vérifier
que supAsup B c/ sup(AB), si par exemple, A =
Notons
{-2,-1} et B = {-1}.
€:=supA+supB-sup( A+B) >0. 21.4. Si ce nombre était rationnel, son carré le se-
rait aussi, soit
Par définition d'une borne supérieure, il existe a E
A et b E B tels que
v'2 + V3 = r E IQ.
€
sup A - ~
2< a sup A Mais alors, 3 = (r - J2)2 = r 2 - 2v'2r + 2 et donc,
puisque r c/ 0,
et
€
sup B - ~
2< b sup B, r2 - 1
d'où par addition,
v'2= 2 r EIQ,
Un 1
Uzn:;;; T + 2 y'n.
pour tout n E N. Le passage à la limite per-
3. La sous-suite de terme général Uzn est aussi met d'avoir lim(Unvn) :,;; lim(11n)lim(vnl- En gé-
convergente de même limite ; en passant à la limite, néral, l'égalité n'est pas réalisée comme le montre
dans l'inégalité de la question 2, on obtient l :;;; l/2. l'exemple des deux suites (Unln;;,o et (vnln;;,o défi-
On en déduit que l = O. nies par Uzn = Vzn+ 1 = Û et Uzn+ 1 = Vzn = 1.
b) Supposons la limite de (vnln)O nulle; pour Comme Urq = ruq + rc avec Ici ,( 1, l'égalité ci-
€ E IR~, il existe N E N tel que si n ? n, alors dessus devient
0 ,( Vn < €. En multipliant par Un, on obtient Urq
kb rc
0 ,( UnVn ,( €Un ; le passage à la limite supérieure Vp-Vq =a/p+-+-+ur/p--.
p pq pq
entraîne alors que
En écrivant Urq = QUr + qd avec ldl ,( 1, on obtient
kb rc
En faisant tendre € vers 0, on obtient v p -v q =a/p+-+--d/p.
p pq
lim(UnVn) = O.
L'inégalité triangulaire et le fait que r est compris
Supposons maintenant que (vnln)O a une limite l entre O et q entraînent que
non nulle. On peut alors trouver N E N tel que, pour
tout n? N, Vn > O. L'égalité Un= (UnVn)l/vn,
pour n? n, et la question 3a) entraînent l'inégalité
Comme k/p ,( 1/q et 1/p ,( 1/q, nous déduisons
alors
et
u;!n < U~n(l + €)1-N/n < l + 2€.
L'inégalité ci-dessus montre que lim un/n = 7r.
n---t+oo
Nous avons donc, pour n ) N', lwn - li < 2€ et
nous avons ainsi montré que la suite (wnlnEN est 22.16. Pour la première, on étudie donc la suite
convergente de limite l. homographique (unlnEN, définie par
Si l = 0, on peut avoir facilement l'inégalité
4un+2
0 < Un/UN < En-N, pour n ) N. Le fait que Un+l = - - --, Uo E ~ \ S,
Un+ 5
u~n€J-N/n tend vers € permet de conclure que
l'ensemble S à ôter à~ étant celui des nombres u 0
(wnlnEN est convergente de limite O.
tel qu'il existe n E N vérifiant fn(Uo) = -5, où fn
désigne la composée de f, n fois avec elle-même. Évi- on a alors Vn+ 1 = Vn + 1, donc la suite (Vn) nEN
demment, -5 E S; nous déterminerons précisément tend vers +oo et la suite {UnlnEN tend donc vers O.
S ultérieurement. L'ensemble S des valeurs uo à exclure est donné par
Pour l'instant, cherchons les points fixes de f,
i.e. les x tels que f(x) = x; cela conduit à l'équation S={n-~l I nEN}.
Nous avons donc lim [an]/[bn] = 0 si a< b et solution si et seulement si 1 = [n(~ll, c'est-à-dire
n---++oo XE [1,2 1 /n[.
lim [an]/[bn] = +oo si a > b. Dans le cas où
n---++oo Dans le cas où O ( x < 1, alors O ( xn < 1. Nous
a= b, la suite est constante de valeur 1. déduisons donc [xn] = 0 = [x]. Tout élément de [O, 1[
est solution.
23.2. Posons x' = x - [x] et -y' = -y - [-y]. En résumé, l'intervalle [0,2 1 /n[ est l'ensemble de
tous les x > 0 vérifiant [x] = [xn].
Nous avons alors [x + -y] = [x' +-y'] + [x] + [-y],
[2x] = [2x'] + 2[x] et [2-y] = [2-y'] + 2[-y]. L'in- 23.5.
égalité [x] + [-y] + [x + -y] ( [2x] + [2-y] est donc
1. La définition de la partie entière entraîne que
équivalente à [x' + -y'] ( [2x'] + [2-y']. En ajou- 0 ( f(n) < 1.
tant membre à membre les inégalités O ( x' < 1
2. Supposons f(n) = f(m). Nous déduisons alors
et O ( -y' < 1, on obtient O ( x' + -y' < 2. (n - m)8 = [n8] - [m8]. Comme 8 est irrationnel,
Nous allons distinguer deux cas. Si x' + -y' < 1, l'égalité précédente entraîne que n - m = 0, c'est-
l'inégalité est trivialement vérifiée; dans le cas où à-dire n = m.
1 ( x' +-y'< 2, alors 2 ( 2x' +2-y'. Nous en dé- 3. f n'est pas surjective car 1/2, par exemple, n'a
duisons que 2x' ), 1 ou 2-y' ), 1, ce qui entraîne que pas d'antécédent.
[2x '] ), 1 ou [2-y '] ), 1. L'inégalité est alors vérifiée,
puisque [x' +-y']= 1 ( [2x'] + [2-y']. 23.6.
1. On peut vérifier que f(x+ 1/10) = f(x); la fonc-
23.3. La division euclidienne de p par q donne tion f est donc périodique, de période 1/10.
p = kq + r, où k et r sont deux entiers naturels
p-q 2. Pour x E [0, 1[, notons 0, X1X2 · · · Xn • • • son dé-
avec 0 ( r < q. Nous avons - - = k- 1 + r/q. veloppement décimal. On peut vérifier facilement
q
Comme 0 ( r/q < 1, alors que, pour tout n EN*, f(nl(x) = 0,Xn+l ···.Nous
savons que x est rationnel si et seulement si son
développement décimal est périodique à partir d'un
certain rang. On peut donc conclure que x est un
rationnel si et seulement si la suite (f(nl (xlln)l est
périodique à partir d'un certain rang.
1 1
L'égalité p + = k + + r et les inégalités 1/ q ( 3. Si 0, X1 Xz · · · Xn · · · est le développement déci-
q q mal d'un réel x E [0, 1[, solution de f(x) = x,
l+r
- - < 1 + 1/ q entraînent que alors 0,Xz···Xn··· = 0,x1X2···Xn···. Par uni-
q cité du développement décimal, nous déduisons que
Xi = Xi+ 1 pour tout i E N*. La suite (Xk) kEN·
est donc constante ; notons a sa valeur. De l'égalité
x = 0, x 1xz · · · Xn · · · , nous déduisons que x = a/9,
avec a un entier entre 0 et 8. Réciproquement, tout
réel de la forme a/9, où a est un entier compris entre
Les identités ( *) et ( **) prouvent le résultat.
0 et 8, est solution.
23.7. Le développement décimal de 1/47, donné ci--- M est la borne supérieure de lfl sur [A, A+ 1] (elle
aprés, est de période 46 : existe car f est continue) alors
4. Si t E ll, alors il existe une suite de rationnels lt - t'I ,:;; 11, alors lf(t) - f(t')I < 1. Sin E Z, nous
(rnlnEN de limite t. En passant à la limite quand avons lf((n + 1)11) - f(n11)I < 1. Nous en déduisons
n tend vers +oo dans la relation f(rn) = rnf(l), on que, pour tout k E Z, l'inégalité lf(k11) - f(O)I < lkl.
obtient f(x) = xf(l ). Pour t E ll, si h est la partie entière de x/11, alors
lf(t) - f(h11)I < 1. L'inégalité triangulaire entraîne
25.7. Si <XE [O, 1], le réel <Xf(a) + (1 - <X)f(b) est
lf(t)I ::;; lf(h11)I + 1 ::;; lf(O)I + 1 + lhl. En utili-
entre f(a) et f(b). Le théorème des valeurs intermé-
sant l'inégalité lhl ,:;; ltl/11 + 1, on obtient lf(t)I ,:;;
diaires appliqué à f sur [a, b) permet de conclure.
lf(O)I + 2 + ltl/11.
f(-y)-f(x)l ,(lx-111"'-1,
l 11-x
donc tend vers 0 lorsque y tend vers x. Il en résulte 26.12. Puisque <f>(o) = <f>(b) = 0 et que
que f est dérivable sur I et que sa dérivée est nulle;
comme I est un intervalle, f est donc constante. f(o) f(b) f'(x) 1
<t>'(x) = g(o) g(b) g'(x) ,
26.8. La fonction g est dérivable sur ]0, +oo[ et sa h(o) h(b) h'(x)
l
dérivée est donnée par
le théorème de Rolle nous donne l'existence d'un
'( ) _ xf'(x) - f(x) réel c E]o, b[ tel que
g X - x2 .
Or, par l'égalité des accroissements finis appliquée f(o) f(b) f'(c)I
entre 0 et x, il existe un réel c E]0, x[ tel que, g(o) g(b) g'(c) = O.
JY g(s)ds = xf(x) + JY
J x f(t)dt +
0 0 f(x)
g(s)ds.
I
+" ln(a 2 -2acos0+l)d0. tion f(t) =tp-l_
27.7.
Le changement de variable 0 H 0- 7t dans la der- 1. On commence par prouver le résultat pour une
nière intégrale conduit à fonction en escalier. Si f est une telle fonction, no-
tons (xk)O,;k,;n une suite finie de points de [a, b]
2I(a) = [(ln(a2 -2acos0 + 1)) telle que f soit constante sur ]xk, Xk+ 1 [ de valeur
ck, pour tout k entre 0 et n - 1. Nous avons, pour
x (ln(a 2 +2acos0+1))d0 tout À> 0,
I(l/a) = 1 J 2
2
2 ln(1/a (1-2acos0+a ))d0
0
" 2
k~O
En faisant tendre À vers +oo, on obtient
entraîne que
lim
J..---1+00
Jb f(t) sin(Àt)dt = O.
a
I(l/a) = -2nlnlal + I(a).
Maintenant, si f est intégrable, alors pour tout
E E JR~, il existe g et h en escalier vérifiant f = g + h,
2. Si a E [0, 1[, nous avons pour tout 0 E [O, 2n]
a 2 - 2acos 0 + 1 ( (1 + a) 2 . En intégrant membre à avec h positive et J: h(t)dt < €. Nous avons, grâce
membre l'inégalité, on obtient II(a)I ( 2nln(1 + a). à l'inégalité triangulaire,
La même preuve s'adapte au cas où a E] - 1, 0]. 1 J: f(t) sin(Àt)dtl (
À l'aide d'une récurrence, on peut montrer que
I(a2n) zn 1 J: g(t) sin(°Jlt)dtl + I J: h(t) sin(°Jlt)dtl.
I(a) = z;,-- pour tout n EN*. Comme II(a )1 <
2 2
2nln(1 +la nl), alors la suite I(a n) est bornée. En De l'inégalité
passant à la limite, on trouve I(a) = O.
3. La seconde identité de la question 1 et la ques-
1J: h(t) sin(Àt)dtl ( J: lh(t) sin(°Jlt)ldt ( E,
tion 2 montrent que si lai > 1, alors I(a) - 0 = nous déduisons
2nlnlal; on a donc I(a) = 2nlnlal.
27.6.
1 J: f(t) sin(°Jlt)dtl ( J: g(t) sin(°Jlt)dtl +
1 €.
1. Notons F(x) = J~f(t)dt + J~(xl g(s)ds. Nous Comme g est en escalier, il existe un A> 0 tel que
avons si À > A alors,
=Û.
Il en résulte que
on déduit que
2
lim In= 2 lim ([nc/1t)/n-[nd/1t)/n) = -(d-c).
z k=n-1 z Jb n---t+oo n---t+oo 7t
lim In= -
n---t +oo 7t
L.
k=O
ck[xk+l -Xk) = -
7C a
f(t)dt.
L b
g(t)I sin(nt)ldt +
Jb
a k(t)I sin(nt)ldt
obtenons alors
et
Des inégalités
Fixant x et faisant tendre n vers +oo, la conti- et des deux familles de fonctions
nuité de f en 0 nous donne f(x) = f(0), i.e. que
x f-l cos wx et x f-l ch wx,
f est coutante. Ainsi, seules les fonctions constantes
sont solutions de cette équation fonctionnelle (elles wER
le sont clairement). 28.8. Il faut d'abord se convaincre qu'une solution,
28. 7. Évidemment, la fonction nulle est solution; si elle n'est pas la fonction identiquement nulle, ne
cherchons désormais les solutions non triviales. Si s'annule jamais. Par continuité, une solution non
f est une telle solution, puisqu'elle est continue, on nulle f peut donc être supposée par exemple stric-
peut considérer l'unique primitive f de f sur IR, s'an- tement positive; la fonction g = ln f satisfait alors
nulant en O. On a alors, en primitivant en x l'équa- l'équation fonctionnelle
tion fonctionnelle et en effectuant un changement
V(x,y) E ffi:. 2 , g(x+y) + g(x-y) =2(g(x) +g(y)).
de variable (translation), que pour tous réels x et y,
Par des arguments classiques déjà utilisés dans des
f(x+y) + f(x-y)- f(y) - f(-y) = 2f(y)f(x).
exercices précédents, on montre alors que
Il existe évidemment un réel a tel que f(a) c/ 0,
\Ir E IQI, g(r) = r 2 g(l ).
sans quoi f et donc f seraient identiquement nulles.
L'écriture de l'égalité précédente pour x = a et y Par continuité de g, et densité de IQI dans IR, nous
quelconque, fait alors apparaître f comme une fonc- obtenons donc
tion de classe C1 sur IR, puisque f l'est. Mais alors,
de ce fait, f est même de classe C2 , et donc aussi \lx E IR, g(x) = x 2 g(l)
f par la même identité! En dérivant alors deux fois
et donc finalement que les solutions de l'équation
l'équation fonctionnelle par rapport à x, on obtient
fonctionnelle initiale sont les fonctions
que, pour tous réels x et y,
l=j
t
avec bk = 0 1 pour k E 1, ... , n + 1. Donc Jf est
bien une fonction polynôme. Pour la dernière somme, on remarque que le mo-
Passons maintenant à la résolution de l'exer- nôme Xk est une combinaison linéaire des poly-
cice. La fonction nulle est une fonction polynôme. nômes (X(X- 1) ... (X-j + 1 l)iE{O, ... ,kJ, dont le co-
efficient devant (X(X - 1) ... (X - k + 1) est égal à
D'après la propriété précédente, la fonction p(p- l l
1. On a alors
est aussi une fonction polynôme. Ainsi, on montre
que toutes les fonctions p(p-k) sont des fonctions k-1
polynômes. Donc P est bien une fonction polynôme. sk = L (-11k-1-1c}J(-ll ... (l- k+ 11 + P{l).
1=0
29.2. Procédons par récurrence sur n. Le terme P(l) est une combinaison linéaire de termes
Pour n = 1, la dérivée de tan est de la forme
k-1
tan'(x) = 1 + tan2 (x) = P1 (tan(x)),
.L_{-l)k-l-lCkl( -1) ... (l-j + 1),
avec P1 (X)= X2 + 1. 1=0
Pour n = 2, le calcul donne avec j < k. On sait que ces derniers termes sont
tan"(x) =2tan(x)(l +tan 2 (x)) = P2(tan(x)), nuls. Donc
k-1
avec P2{X) = 2X 3 + 2X. sk = .[_(-l)k-l-lct1( -l) ... (l- k+ 1) = O.
Supposons que pour n donné, la dérivée n-ième 1=0
de la fonction tangente s'écrive Pn(tan(x)) avec Pn
un polynôme de degré n + 1 et de terme dominant
REMARQUE - Si on pose
n!. Dérivons
k
Si= .L_(-l)k-1-ICkli,
Le polynôme p;_ est un polynôme de degré n - 1 1=0
et de terme dominant (n+ l).n! = (n+ 1)!. Ainsi, alors on obtient en raisonnant comme précédem-
tanin+ 1l s'écrit ment
v'îoî = 1ov1foî.
On utilise alors la formule de la question 1. avec Ce qui donne
X= 0.01. Gn c( Sn.
4 4 On peut remplacer chaque Xi par 1/xi dans la for-
vlOÎ = 10(1 + ;0.01 - 110- + o(l0- )).
mule précédente
d'où
vlOÎ = 10.0050125 + o(l0- 3 ).
Une calculatrice donne
f et g n'est pas convexe. est croissante et admet des limites à gauche g(x-)
29.6. La fonction f : x Hln(l + x) définie sur et à droite g(x+) en x vérifiant g(x-J ,( g(x+).
] - 1, +oo[ est strictement concave. En effet Comme K est borné, l'application g est bornée. Il
existe M > 0 tel que
Il -1
f (x) = (l +x) 2 < 0, 1./x E]-1,+oo[. 19(llll c( M, 'ill E K \ {x}.
Son graphe est donc situé sous ses tangentes et au- Ce qui s'écrit
dessus de ses cordes. L'équation de la tangente en 0
est li= f(0) + f'(0)x = x. Donc lf(lll -f(x)I c( Mill - xi, 'ill E K \ {x}.
ln(l + x) < x, 1./x E] - 1, +oo[\{0}. Comme cette inégalité est aussi vraie pour li = x,
on en déduit que f est M-lipschitzienne.
L'équation de la corde passant par les points (0,0)
Pour une fonction non lipschitzienne sur I lip-
et (8, ln(l + 8)) avec 8 > 0 est
schitzienne sur K, il suffit de prendre f( x) = x 2 et
ln(l +8) I = IR.
li= X.
8
29.9. Une fonction f: l-, l bijective est monotone. Si t E IR+ n V, on a :
Étudions séparément le cas f croissante et le cas f
décroissante. tcost -sin t
F'(t) =
Supposons que f est croissante. Alors f- 1 est aussi t2 ✓1 _ (si~t)2
croissante. En effet, on a
si~t -cost
29.10. Puisque f et f- 1
possèdent des dérivées se-
condes positives, elles sont convexes. D'après l'exer-
cice précédent, elles sont aussi concaves. Donc leurs
dérivées secondes sont aussi négatives. Nécessaire-
ment, leurs dérivées secondes sont nulles. Les fonc-
tions f et f- 1 sont donc affines, c'est-à-dire qu'elles
s'écrivent
ln(a' + b') = ln(2 + t(lna + ln b)+
1 t2
f(x) = ax+ b, f- 1 (y) =-y+ b', = ((lna) 2 + (lnb) 2 ) + o(t 2 )).
a 2
On sort le 2 gênant :
avec a, b et b' des nombres réels. Comme elles sont
bijectives, leur graphe est une des deux diagonales t
ln(a' + b') = ln2 + ln(l +
du rectangle lx J. On détermine ainsi les coefficients 2(lna + ln b)
t2 2 + (ln b) 2 ) + o(t 2
a, b et b 1 • Les intervalles l et J fixés, il n'existe que +
deux applications bijectives de classe <ef?2 à dérivées
4 ((ln a) )).
29.11.
3. On sait que
1 1 2
v'l+t= 1 + t- t +o(t2 ).
2 8
On remplace dans Jl + v'f+î
On obtient finalement
J1 + v'î+t = J1 + ½t- ½t 2 +o(t 2) 1 19 2 29 3
( 1 - t + t 2F = e- 1 1 + - t + - t + - t
1 [
✓1 + v'f+î 2
= 1 + ½(½ t - ½t ) - } ( ½t - ½t 2 ) 2 24 48
+o(t) 281 4 4 ]
2 + t + o(t ) .
J1 + v'f+î = 1 + ¾t- fit 2 +o(t ). 720
On remplace encore et on trouve au final : 5. Développons l'exponentielle p
1 2 2
J1 + J1 + v'l+t = 1 + ~t- 1; 8 t +o(t )
0
52
e- ds ='L --=----
P (
k~O
l)k t2k+l
k! 2k+ 1
+ o(t 2
P+1J.
3 4
+ 1(-t+t2)s +o(tsl]).
29.12. On commence par transformer l'expression
On développe les termes à l'intérieur de l'exponen- donnée afin de faire apparaître des fonctions bien
tielle sans tenir compte des termes dont la puissance connues
est supérieure ou égale à 6 (ils rentrent dans le o(t5 ))
1
-1
1
(1 + t)• = exp(- ln(l + t)).
2
(1 - t + t ) += exp ( ~ [ - t+t
2 t2 + t3 t
D'où t2 t3 t4 t5 t6 t7
2 2 1 ln(l +t) = t - - + - - - + - - - + - + o ( t7 )
2 1 2 3 4 5 6 7 .
(1 - t + t F = exp ( - 1 + t + t
2 3
1 1 On a développé jusqu'à l'ordre 7 à cause de la
+4t3-st4+o(t4 )).
t
présence du dans l'exponentielle. On introduit ce
développement dans l'exponentielle
On factorise par e- 1 puis on développe l'exponen-
tielle
t t 2 t3 t4 t5 t6
(t6))
1
(l+tF =exp(l--+- --+---+-+o .
234567
D'où
On utilise encore la méthode de composition des dé-
veloppements limités. On a
, t t2 t3 t4 t5 t6
(l+t)• = e exp(--+---+---+-+o(t 6 ))
234567 . _x_ = x-x 2 +x3 -x4 +o(x4 ).
l+x
Le terme dans l'exponentielle tend vers O et on
connaît le développement limité de l'exponentielle à Donc
tout ordre. Notons E le terme dans l'exponentielle.
On a
·(X)
sm - - =x-x 2+x3-x4--(x-x
1 +x
1
6
2+x3
-x 4 ) 3 +o(x4 ),
1 1 1 1 1 1 5 sin x 2 5 3 2
--+-(--) 3 +2-(--)(--)=-- --.- = X - X + -X - -x4 + o(x4 ).
4 6 2 2 2 3 48" 1+smx 6 3
1 1 1 3 1 1 1 5 911 29.14.
(-4l) +24( 4 (-:zl 3l+ 120(-:zl =-2304·
1. Comme x ln x tend vers O lorsque x tend vers 0,
Le coefficient devant t 6 vaut on a
1 1 1 1 2 11 2 1 1 1 1 xx -1 = exp{xln x) - 1 = xln x + o(x2 ln2 x).
7 + :z( 2(-:zH-6l + 23s + (-4l) + 6( 3(-:zl s
+6(-! 1!r_! 1+ r! J3 ) + ~(4(-! J3 r-! 1 On a aussi
2 3 4 3 24 2 4
+6(-! )2 ( ! )2 ) + _!___5(-! )4 ! XX-X= exp(xxlnx) = eexp(xlnx)lnx,
2 3 120 2 3
1 1 6 81737
+720(-:zl = 193536. xx" = elnx(l+xlnx+o(x 2 In 2 x)l,
Finalement, on a trouvé
1 11 2 5 3
(l+t)• =e 1 - - t + - t - - t +2447
l ( 4
--t
2 24 48 5760
911 5 81737 6 xx' = x (1 + xln 2 x + o(x 2 ln 3 x)).
- 2304 t + 193536 t .
On en déduit
xxx ln x
lim - -
r xlnx+x2 In 2 x+o(x3 Jn4 x)
29.13. Comme sin x ~ 0 x, on doit faire un déve- xx-1
x:---tO+ x~~+ xlnx+o(x2 In 2 x)
loppement limité à l'ordre 4 de sin( 1 :x) - 1 ~~: x. =1.
2. On a déjà Le deuxième terme de l'expression devient
On développe le numérateur
(1 +x)(Inx)/x = e(lnx)/x ln(l+x)
= e(Inx)/x(x-x 2 /2+o(x 2 ))
0 ex 3 ln(l + 1/x) =--; ln(l + u).
u
puis
(1 +x)(lnx)/x = elnx(l-x/2+o(x))
et finalement
Développons le logarithme.
xlnx
(1 +x) (Inx )/x = x(l - -2- + o(xlnx)).
On en déduit que
. (1 +x)(lnx)/x - X
hm--~-~-=
x->0+ x(xx - 1)
e e u2 u2
2 -ln(l +u) = - 3( u - - +-+o(u3 )).
lim -(x lnx)/2+o(x2 lnx) =-! u 3 u 2 3
x->0+ x 2 lnx+o(x2 lnx) 2·
29.15.
1. Posons u = 1/x. Lorsque x tend vers +oo, u
tend vers O. On peut alors appliquer les formules de
développement limité La différence est donc
On a aussi
On en déduit
Comme uln(-½u+o(u)) tend vers O lorsque u tend
vers 0, on a
1 e u 11
-(1 +u) 11 u = -(1- - +-u2 +o(u2 )).
u2 u2 2 24
29.16. 29.17.
1. On utilise l'astuce 1 = t/t. Effectuons alors une 1. Cas n = 2.
intégration par parties. Pour tout A > x, nous avons La formule de Taylor-Lagrange à l'ordre 1 entre x
etx+hest
A -t2 [ le-t']A lJAe-t'
e dt = - - -- - - - -dt. hz
Jx 2 t x 2 x t2 f(x+ h) = f(x) + f'(x).h+ f"(c)
2
On fait ensuite tendre A vers +oo pour obtenir
où c E]x, x + h[. Ainsi, on a
+oo -t2 1 e-x' 1 J+oo e-t'
e dt = - - - - - - 2-dt. hz
Jx 2x 2x t lf'(x)lh = lf(x + h) - f(x) - f"(c)I ~ lf(x + h)I
2
C'est ce qu'on voulait avec hz
+ lf(x)I + 1f"(c)I.
2
On en déduit
-t 2 2
Comme ¾,- = o( e-t ) lorsque t tend vers +oo, les
théorèmes de comparaisons nous permettent d'affir-
mer que 2. La fonction <l> est définie sur JO, oo[. La dérivée
de
2
+oo e-t J+oo <l> est
- -dt = o( e-t' dt) <l>'{h) = _ 2Mo
JX 2
t Mz
X h2 + 2 .
et donc que La dérivée s'annule en h = 2JMo/Mz qui est défi-
nie si Mo et Mz sont non nuls. Si Mo est nul, alors
la fonction f est la fonction nulle et alors M 1 et Mz
sont nuls et les inégalités de Kolmogorov sont tri-
Posons I(x) = J: 00 2
e-t dt. On a
vialement vérifiées. Si M2 est nul, alors la fonction
f est affine et pour qu'elle soit bornée, elle doit être
constante. Alors M 1 = 0 et les inégalités de Kolmo-
I(x) x2 J+oo e-t2 gorov sont encore vraies.
--(-) = 1 - xe - 2-dt.
D1 X x t On a aussi
2 +oo -tl . lim <l>{h) = lim <l>{h) = +oo.
Posons f(x) = xex fx ¾,-dt. Il est clan que f h---tO h to+oo
est positive. Ensuite, puisque 1/t2 ~ 1/x2 pour tout
t ~ x > 0, on a Donc le point où la dérivée de <l> s'annule est le lieu
du minimum.
D'après la question 1), on a
f(x) ~ -1 J+oo ex 2- t 2dt.
X X
lf'(x)I ~ <l>{h), 'efh E]0,oo[, Vx ER
Effectuons le changement de variables u
Donc
v't 2 - x 2 . On obtient
lf'(x)I ~ <l>(2JMo/Mz) = 2JMoMz, Vx ER
1 J+oo ue-u2
f(x) ~ - v'u2+x2du.
x o uZ+xz On a bien
On élimine comme précédemment le dénominateur
3. Cas n = 3.
1 J+oo -u2 1 Il existe C1 E]x, x + h[ et cz E]x, x + 2h[ tels que
f(x) ~ ue du= - 2 •
2
X o 2X
hz h3 111
On en déduit f(x+ h) = f(x) +f'(x)h+ 2f"(x) + f {ci),
6
On en déduit
On étudie la tangente en t = O.
lf'(x)lh ( 5Mo + h 3 M 3
2 3 t
lf"(x)lh ( 6Mo + ~h M3. ui(t)= - -
u( t l = u t - ittl .
6. Posons <1>1 : h -+
5
~
0
+ h 2M 3 et <1>2 : h -+ { 2( l - v'lttl
6;jo + jhM3.
Comme précédemment, pour obtenir les minima ab- On en déduit
solus des fonctions <l> 1 et <l> 2, il suffit de trouver le
point où leurs dérivées s'annulent.
et
C(3,2) = 6(25/36) 113 + ~(36/5) 113 .
4. Posons Xn = u1 (tn) et Yn = u2(tnl- D'après la 30.4. Soit f: ll2 --t ll. Pour h = (h1, h 2 ) E ll2 fixé,
question 1, on a l'application (x,y) r i dftx.yJ(h) s'écrit
lim X~ +y~= 1.
n->oo
Ainsi, on a
2
f(x, y)= Ïx + bxy + g(y),
cx01 + lncx~ --t 02[mod2n].
Posons tn = 01 + lnk~. On a
Comme f(O,O) = 0 et dès que x est différent de 0, g'(y) = cy, puis g(y) = i11 + d.
f(x,O) = 0, on a
of
-;-(0,0) = lim O = O.
uX x-----tO
Les fonctions cherchées sont de la forme
On obtient de même
f(x,y) = ax 2 + bxy + cy 2 + d.
Le résultat n'est pas surprenant. L'existence de dé-
rivées partielles ne dépend que de la forme de la
fonction f le long des axes. Or, chacune des appli-
cations partielles x r i f(x,O) et y r i f(O,y) sont
identiquement nulles.
30.5. 4. On au= v o <I>. On écrit <I> = (<I> 1, <I>2). La loi
de composition des dérivées donne
1. L'espace des solutions est un sous-ensemble de
l'espace vectoriel des fonctions différentiables. La ou o<I>1
fonction nulle est clairement une solution. De plus, ox (x,11) = 01v(<I>(x,11))ilx(x,11)+
si u1 et u2 sont des solutions, alors, pour tout À
réel, on a o<I>2
02v(<I>(x, 11))ilx(x, 11).
1
On remplace dans l'équation F(x, <p(x)) = 0 pour -y"+ 4-y = 2·
obtenir
Il existe une solution particulière évidente, la fonc-
tion constante t H 1/8.
Pour résoudre les deux autres équations, nous utili-
Les coefficients sont solutions du système
sons la méthode de la variation de la constante.
a+l =0 Résolution de
a 2 - b-½ = 0
{ 2ab-c-
¼=O.
31.2. D'après la proposition 23.8, les solutions sont Cherchons une solution particulière de la forme
de la forme
1i(t) = atcos(2t)et.
1)(t) = (B(t) +À)e-A(tl,
Les calculs donnent
où A(t) = J-tan(s)ds et B(t) Jl/(1 +
cos(s))eA(slds. Maintenant l'intégration 1i"(t) -21i'(t) +51J(t) = -4asin(2t)et.
On prend a= -1/4.
A(t) = J-tan(s)ds = ln(cos(t)). Résolution de l'équation
B(t) = I 1 - u2 1 2du
l+u21+1-u2J+u2
2
= J1 - u2 du
l+uz .
puis de prendre la partie réelle. Posons 1J (t) =
A(t)e(l+Zi)t_ La fonction 1J est solution de l'équa-
l+u
tion précédente si A est solution de l'équation
Nous décomposons en éléments simples
A" +4iA' = e-(l+ilt_
B(t) = J-1 + 1 : u2 du. Les solutions de l'équation homogène associée sont
de la forme
Nous trouvons alors A'(t) = Àe- 4 it.
B(t) = -tan(t/2) +2arctan(tan(t/2)) Nous utilisons encore la méthode de la variation de
= 1 - tan(t/2). la constante. La fonction À doit vérifier
3 4
1i(t) = Asin(2t)et + Bcos(2t)et. ( cos(-t) + sin(t))e-t.
25 25
Finalement, les solutions de (E2) sont de la forme
31.4. Les solutions de l'équation homogène associée
à (E1) sont de la forme
Utilisons la même méthode pour trouver les so- Or, p est solution de (E), donc
lutions de (E2)-
Les solutions de l'équation homogène associée sont (t 2 + l)p"z-2pz=0.
de la forme
y(x) = Àe-x. Nous en déduisons que Z = z' est solution de l'équa-
tion
La méthode de la variation de la constante nous
amène à calculer (t 2 + 1)(2p'Z +pZ') = O.
•• ds =À
Nous cherchons des constantes A, B telles que la
fonction f = A cos +B sin vérifie l'équation de dé-
■
Z(t)=Àe - f -;z-:;:,
1 , ÀER part. Cette équation doit être vérifiée en particulier
(1 +t 2 ) 2 pour x = O.
Il faut encore intégrer pour obtenir z
B = f'(0) = f(2005) = Acos(2005) + B sin(2005).
où (a,A) E JR:.2 . et
B
31.6. Nous utilisons la remarque faite à l'exercice f(2005 - x) = cos( ) ( cos(x - 2005)
2. Nous avons 2005
1 +sin((2005-x)-2005)).
y'+ tan- 1 (t)y =-.-(-)(y' sin{t) + cos(t)y)
sm t
Nous avons bien
.
1 (1J sm(t)
= -.-(-) ) 1.
sm t f'(x) = f(2005 - x), Vx ER
Sur l'intervalle JO, n[, le sinus ne s'annule pas. Ainsi,
une fonction 1J est solution de (E) si la fonction
z = 1J sin est solution de 31.8. Sur ] - oo, 0[ et sur ]1, oo[, la fonction x >--+
x(x - 1} est strictement positive. Donc, sur chacun
z' = sin(t) cos 2 (t). de ces intervalles, l'exercice se ramène à résoudre
l'équation
Nous intégrons
1 X
z(t) = Jsin(s) cos (s)ds = -~ cos (t) + À.
2 3 1J 1 + - - - y
x(x - 1)
= --
x-1·
Les solutions de (E) sont donc de la forme Les solutions de l'équation homogène sont de la
forme
y(x) =Àe-f ,1,'-11ds_
En décomposant en éléments simples la fraction ra-
tionnelle, nous trouvons facilement
31. 7. L'application cp: x H 2005 -x est dérivable, X
y(x) =À-- .
donc f' = f o cp est aussi dérivable. On peut donc X- 1
dériver l'équation f' = f o cp. Nous obtenons
La méthode de la variation de la constante nous
f"(x) = -f'(2005 - x) = -f{2005 - (2005 - x)) donne une solution particulière
=-f(x). s s-1
Les fonctions cherchées sont aussi solutions de
l'équation différentielle f" +f = 0 dont nous connais-
y(x)
f s-
= - - --ds = x.
1 s
Sur ] - oo, 0[ et sur ]1, oo[, les solutions sont de la
sons bien les solutions. Elles sont de la forme
forme
f(x) = Acos{x) + B sin(x), {A, B) E JR:. 2 •
Sur ]O, 1[, la fonction x H x(x - 1) est stricte- 31.9.
ment négative. Donc, sur cet intervalle, l'exercice se
1. Soit f une fonction bijective. Nous avons
ramène à résoudre l'équation
1 1 X
1J - - - - y = - - - .
x(x-1) x-1 Donc
s2 2s - 1 2 1 f'(y) =- 1J + .!._
(s -1 ) 2 = 1 + (s -1 )2 = 1 + s -1 + (s -1 )2 · 1- ✓f=yI 1J
•
47 bis, rue des Vinaigriers
. 75010 Paris
Tél. : 01 72 74 90 00
Fax : 01 42 05 22 17 111111111 11
www.pearsoneducation.fr
9 782744 072581