Vous êtes sur la page 1sur 1089

Cours complet avec 1000 tests

et exercices corrigés

Sous la direction de :
Jean-Pierre Marco
Laurent Lazzarini

Hassan Boualem
Robert Brouzet
Bernhard Elsner
Laurent Kaczmarek
Denis Pennequin ·

PEARSON
Education
Mathématiques
Cours complet avec 1000 tests
et exercices corrigés

1
Cours complet avec 1000 tests
et exercices corrigés

Sous la direction de:


Jean-Pierre Marco, Laurent Lazzarini

Hassan Boualem, Robert Brouzet, Bernhard Elsner


Laurent Kaczmarek, Denis Pennequin

PEARSON
a -

1
Education
Publié par Pearson Education France
47 bis, rue des Vinaigriers
75010 Paris
Tél. : 01 72 74 90 00
ISBN : 978-2-7440-7258-1
© 2007 Pearson Education France
Mise au point de la feuille de style TEX : Laurent Kaczmarek et Bruno Ayela
Aucune représentation ou reproduction, même partielle, autre que celles prévues à l'article L.
122-5 2° et 3° a) du code de la propriété intellectuelle ne peut être faite sans l'autorisation
expresse de Pearson Education France ou, le cas échéant, sans le respect des modalités prévues
à l'article L. 122-10 dudit code.
Les auteurs
Hassan Boualem est maître de conférences à l'université Montpellier II. Il y enseigne les
mathématiques discrètes et l'algèbre linéaire en 11. Il donne également des cours dans le
cadre des préparations aux agrégations externe et interne de mathématiques. Son domaine
de recherche est la géométrie différentielle. Il est par ailleurs coauteur, avec Robert Brouzet,
d'un livre d'enseignement intitulé La planète lR (Dunod, 2002).

Robert Brouzet est maître de conférences au Centre universitaire de formation et de re-


cherche de Nîmes. Il y assure des cours et des travaux dirigés de mathématiques au niveau 1. Il
enseigne également à l'université Montpellier II dans le cadre de la préparation à l'agrégation
interne de mathématiques à l'IREM. Ses recherches concernent la géométrie différentielle. Il
est coauteur, avec Hassan Boualem, d'un livre d'enseignement intitulé La planète lR (Dunod,
2002).

Bernhard Elsner est professeur agrégé au lycée Saint-Exupéry à Créteil. Il y enseigne les
mathématiques aux élèves de premières S, ES et 1 et de terminales STT.

Laurent Kaczmarek est professeur en classe préparatoire PCSI au lycée François 1er du
Havre et intervient à la préparation à l'agrégation de mathématiques de l'université Pierre et
Marie Curie (Paris VI). Il a organisé la mise en page de cet ouvrage sous TEX-

Laurent Lazzarini est maître de conférences à l'université Pierre et Marie Curie (Paris
VI) où il donne des cours et des travaux dirigés d'analyse et participe à la préparation au
Capes et à l'agrégation. Il assure également une charge d'enseignement à l'École polytechnique
universitaire Pierre et Marie Curie (Paris VI). Ses domaines de recherche sont la géométrie
symplectique et l'analyse sur les variétés.

Jean-Pierre Marco est à l'origine de ce livre et est le coordinateur de l'équipe d'auteurs. Il


est maître de conférences à l'université Pierre et Marie Curie (Paris VI) et y est responsable
de la préparation à l'agrégation de mathématiques. Par ailleurs, il donne un cours sur les
systèmes hamiltoniens au niveau M2 à l'Observatoire de Paris et à l'université Paris VI. Il
est aussi l'auteur de Analyse pour la licence (Dunod, 2002). Ses travaux de recherche portent
sur les propriétés dynamiques des systèmes hamiltoniens et sur le problème des n-corps, en
relation avec la mécanique céleste.

Denis Pennequin est maître de conférences à l'université Panthéon-Sorbonne (Paris I). Il y


enseigne en fillière MASS (12 à Ml) l'analyse, la dynamique et l'analyse numérique. Il enseigne
également l'optimisation à l'École nationale de la statistique et de l'administration économique
(ENSAE). Ses travaux de recherche concernent les solutions presque-périodiques de systèmes
discrets et continus. Il est l'auteur de l'article Optimisation statique du dictionnaire de sciences
économiques des PUF.
Table des matières
Avant-propos xiii

Remerciements xvi

Quelques modes de raisonnement xvii


I Exemples de propositions mathématiques xviii
II L'implication . . . . . . . . . . XXI

III L'équivalence . . . . . . . . . . XXIV

IV Le raisonnement par récurrence XXV

I Bases 1

1 Un peu de géométrie plane 5


I Prérequis de géométrie plane . 6
II Produit scalaire et déterminant 11
III Les angles et leurs mesures . 18

2 Guide d'analyse réelle 29


I Fonctions et graphes . . . . . . 29
II Propriétés usuelles des fonctions 31
III Branches infinies d'un graphe 36
IV Bijections . . . . . . 38
V Continuité . . . . . . 40
VI Tangente et dérivées 42
VII Exercices . . . . . . 50

3 Fonctions circulaires 51
I De la trigonométrie· aux fonctions circulaires 51
II Fonctions circulaires réciproques . . . . . . . 57
III Application à la superposition de sinusoïdes 66
IV Exercices . . . . . . . . . . . . . . . . . . . . 67

4 Logarithme, exponentielle, fonctions hyperboliques 69


I Fonctions logarithme et exponentielle 70
II Fonctions hyperboliques 79
III Exercices . . . . . . . . . . . . . . . 84

5 Le corps C des nombres complexes 87


I Définition des nombres complexes 89
II La conjugaison et le module . . . . 93
III L'exponentielle complexe . . . . . . 99
IV Nombres complexes et trigonométrie 106
V Équations algébriques . 107
VI Exercices . . . . . . . . . . . . . . . . 112
viii

6 Symboles [ et TT 115
I Calculer avec le symbole [ . . . . . . 115
II Séries arithmétiques et géométriques 120
III La formule du binôme . . . . . . . . 122
IV Sommes et produits trigonométriques 125
V Les sommes doubles . 128
VI Les produits finis 132
VII Exercices . . . . . . . 134

II Structures fondamentales 135


7 Ensembles, applications et structures algébriques 139
I La notion d'ensemble . . . . . . . . . 139
II Applications et fonctions . . . . . . . 147
III Lois de composition sur un ensemble 157
IV Relations binaires sur un ensemble 160
V Les ensembles N, Z et (Q) • . • . . . . 165
VI Exercices . 169
Complément 1 En traversant une rivière . 171
8 Dénombrement 179
I Ensembles de même cardinal . 179
II Ensembles finis . . . . . . . . 179
III Opérations sur les cardinaux finis 183
IV Arrangements et combinaisons . . 189
V Quelques dénombrements classiques 193
VI Ensembles infinis 196
VII Exercices . . . . . . . 200
9 La structure de groupe 201
I Définition des groupes 201
II Sous-groupes 205
III Morphismes de groupes . 210
IV Ordre d'un élément . . . 215
V Exercices . . . . . . . . 216
Complément 1 Les groupes quotient 218
10 Le groupe symétrique 6 223
I Permutations d'un ensemble à n éléments 224
II Décompositions d'une permutation 229
III La signature d'une permutation . . 232
IV Exercices . . . . . . . . . . . . . . 235
Complément 1 Groupes et symétrie 237
11 Anneaux et corps 259
I La structure d'anneau . . . . . . . . . . . 259
II Sous-ensembles remarquables d'un anneau 261
III Morphismes d'anneaux . . . . . . . . 264
IV Arithmétique dans un anneau intègre . . . 265
ix

V La structure de corps . . . . . 266


VI Exercices . . . . . . . . . . . 267 r/J

Complément 1 Un autre corps ~


269 ,(1)
:0
c,J

12 Arithmétique dans Z 281 s


r/J
(1)
I Divisibilité dans l'anneau (Z, +, x) 281 'O
II La relation de congruence sur Z . . 284 ~
{l
III Les notions de PGCD et de PPCM 286 E-<
IV Nombres premiers . . . . . . . . . . 292
V L'équation diophantienne du premier degré . 295
VI Lesanneaux(Z/nZ,+,x) .. 296
VII Exercices . . . . . . . . . . . 298
Complément 1 Quelques jeux . 299
13 Polynômes à une indéterminée sur le corps 1K = lR ou C 303
I L'algèbre JK[X] . . . . . . . . . . . . . . 303
II Opérations usuelles sur les polynômes . 310
III Arithmétique dans JK[X], acte I 316
IV Racines d'un polynôme . . . . . 327
V Arithmétique dans JK[Xl, acte II 335
VI Exercices . . . . . . . . . 340
Complément 1 Des racines 342
14 Fractions rationnelles 353
I Quand les polynômes deviennent inversibles 353
II Décomposition en partie entière et partie polaire . 356
III Décomposition en éléments simples 358
IV Exercices . . . . . . . . . . . . . 370
Complément 1 L'idée de fraction .. 371

III Algèbre linéaire 379


15 Calcul vectoriel dans ocn 387
I L'espace vectoriel canonique ]Kn . . . . . 387
II Familles libres, familles liées . . . . . . . 393
III Exemple : l'espace des carrés magiques . 402
IV Exercices . . . . . . . . . . . . . . . . . . 404
16 Calcul matriciel 405
I Matrices . . . 405
II Rang d'une matrice . . . . . . . 414
III L'algorithme du pivot de Gauss 421
IV Matrices spéciales . 437
V Exercices . . . . . . . . . . . . . 451
1 7 Espaces vectoriels et applications linéaires 453
I JK-espaces vectoriels et lK-algèbres . . . 453
II Applications linéaires . . . . . . . . . . 462
III Sous-espaces vectoriels. Image et noyau 468
X

11111! 1
IV Exercices. . 473
rJJ
...
(!;
18 Bases 475
:=:
I Sous-espace vectoriel engendré par une partie 475
.__,)
E
rJJ II Bases. Dimension . . . . . . . . . . . . . . . . . . . . . . 480
V
"Cl III Représentation d'une application linéaire par une matrice 502
V
IV Exercices . . . . . . . . . . . . . . . 511
~
E-<
19 Sommes de sous-espaces vectoriels 515
I Somme directe de sous-espaces vectoriels 515
II Sommes directes et applications linéaires 524
III Exercices . 533
Complément 1 Noyaux . . . . . . . . . . 535

20 Déterminants 539
I Aire d'un parallélogramme . . . . . . . . 539
II Déterminant d'une matrice . . . . . . . . 541
III Calculs de déterminants et conséquences 547
IV Exercices . 556
Complément 1 Questions d'orientation 559

IV Analyse 563
21 La droite réelle 571
I La nécessité d'enrichir le corps des rationnels . 573
II La droite réelle 578
III Exercices . . . . . . . . . . . . 591

22 Les suites réelles ou complexes 593


I Suites bornées, suites majorées, suites minorées 595
II Suites convergentes . . . . . . . . . . . . 596
III Opérations élémentaires sur les limites . 598
IV Ordre total et suites réelles convergentes 602
V Critère de Cauchy . . . . . . . . 608
VI Extension de la notion de limite . . 610
VII Limite sup et limite inf . . . . . . . 614
VIII Les valeurs d'adhérence d'une suite 615
IX Exercices . 619
Complément 1 Jeux et intérêts . . . 621
Complément 2 Les suites homographiques . 626
Complément 3 Construction de IR . . . . . 632

23 Représentation et approximation
des réels 635
I Développement d'un réel dans une base donnée 636
II Exercices . 643
Complément 1 Fractions continuées 644
Complément 2 Les gammes . . . . . 655
xi

24 La notion générale de fonction


en analyse 667 rJJ

I La notion moderne de fonction . . . . . . . . . f::


667 •V

II Quelques propriétés des fonctions de lR dans lR 673 ~


s
Complément 1 Historique . . . . . 678 rJJ
V
'Cl
Complément 2 Des constructions . 682 ..!::l
~
25 Les fonctions continues E-<
689
I Limite d'une fonction en un point 691
II Continuité d'une fonction ..... 705
III Propriétés globales des fonctions continues 708
IV Comparaison des fonctions 717
V Exercices . . . . . . . . 725

26 Les fonctions dérivables 727


I Définitions générales et premières propriétés 729
II Le théorème des accroissements finis 738
III Cas des fonctions à valeurs complexes . . . . 744
IV Application : retour sur les suites Un+1 = f(Un) 746
V Exercices . . . . . . . . 760

27 Les fonctions intégrables 763


I Intégrale d'une fonction en escalier 765
II Fonctions Riemann-intégrables 769
III Primitives et intégrales . . . . . . . 780
IV Deux méthodes de transformation des intégrales 784
V Sommes de Riemann et de Darboux . . . . 787
VI Méthodes usuelles d'intégration . . . . . . 792
VII Le calcul des longueurs des courbes planes 796
VIII Exercices . . . . . . . . . . . . . . . . 799

28 Retour sur les fonctions élémentaires 801


I Logarithmes et exponentielles . . . . 802
II Fonctions hyperboliques et leurs inverses 813
III Fonctions trigonométriques et inverses 819
IV Les fonctions comme solutions d'équations 836
V Exercices . . . . . . . . . . . . . . . . . . . 844

29 Dérivées d'ordre supérieur et applications 847


I Dérivées successives . . . . . . . 848
II Fonctions convexes et dérivation . . . . . . 853
III Les formules de Taylor . . . . . . . . . . . 859
IV Les développements limités et leurs applications 868
V Exercices . . . . . . . . . . . . . 881
Complément 1 Fonction étranges . 884
Complément 2 Convexité . . . . . 886
xii

V Calcul différentiel 889


30 Initiation au calcul différentiel 895
I Arcs plans et courbes planes . 900
II Étude des courbes planes . . . 905
III Les courbes en coordonnées polaires . 919
IV Continuité des fonctions à 2 ou 3 variables 923
V Calcul différentiel à 2 et 3 variables. . 931
VI Exercices . . . . . . . . . . . . . . . 947

31 Équations différentielles ordinaires 949


I Équations linéaires du premier ordre 950
II Équations linéaires d'ordre deux . 961
III Exercices . . . . . . . . . . . . . . . . 973

VI Solutions des tests 974

VII Solutions des exercices 1003


Index 1075
Avant-propos

A réforme de l'enseignement universitaire, conduisant au système lMD (licence, maî-

L trise, doctorat), est l'occasion de moderniser à la fois les programmes et la structure


des ouvrages d'enseignement. Pour le cycle L, la possibilité d'unifier l'enseignement
des trois premières années d'université permet de proposer un équilibre différent et plus har-
monieux entre acquisition des techniques élémentaires et découverte des grandes idées de la
discipline mathématique.
Ce nouvel ouvrage, le premier d'une série qui couvre la totalité du programme du cycle L,
est fondé sur trois faits d'expérience.
En premier lieu, l'apprentissage des mathématiques ne se fait pas en ligne droite, de la
notion la plus simple à la notion la plus complexe. Il dépend au contraire de la structure
d'esprit de chacun, et nécessite de multiples aller-retours entre les éléments rapidement acquis
et ceux qui semblent plus difficiles à assimiler. Les indispensables techniques de résolution des
problèmes doivent être étudiées de manière progressive et testées fréquemment au moyen de
nombreux exercices incitant à un travail personnel approfondi.
Par ailleurs, ce travail personnel est stimulé et aussi grandement facilité par l'application
à des problèmes originaux, destinés à élargir l'horizon de la discipline.
Enfin, le travail de fondement et d'acquisition des connaissances doit être accompagné très
tôt d'une présentation accessible des grandes idées mathématiques à l'origine des notions qui
forment le programme.
L'unification des trois premières années de la licence est une opportunité pour faire au-
jourd'hui un pas en avant dans le sens d'une présentation plus équilibrée des techniques et des
idées de la discipline. À cet effet, dans cet ouvrage, nous avons opté pour une présentation
très détaillée d'un << noyau dur » de notions et techniques indispensables à tout étudiant de
première année, et nous avons enrichi ce cours didactique de « compléments » permettant de
mieux faire saisir la portée des outils mis en œuvre et de souligner Fimportance des idées
développées dans le cours. Ces compléments présentent des applications originales dans le
domaine mathématique, mais aussi dans d'autres domaines : musique (structure des gammes
musicales), problèmes de stratégie (jeu des tours de Hanoï, jeux de nim), etc. Nous avons
aussi réservé une place particulière aux applications physiques des théories abordées, qui se-
ront précisées et développées tout au long des ouvrages de la collection.
Dans le but de permettre à l'étudiant de faire un point précis sur les notions qu'il doit
être en mesure d'utiliser en abordant ce texte, nous avons adjoint à l'exposé de niveau 11
une mise au point générale des connaissances acquises dans les classes secondaires, dans la
partie « Bases ». Cette mise au point nous apparaît comme indispensable. Au-delà d'une
simple révision, l'objectif est d'aider l'étudiant à passer d'une perception intuitive des idées
à une formalisation mathématique indispensable au niveau 11. En effet, durant les premières
années de mathématiques, au collège et au lycée, les définitions d'objets comme la droite, le
plan, le cercle, l'angle, la mesure des angles, la longueur des segments, la longueur des arcs
de cercles, les nombres réels et le nombre 71 font appel à une grande part d'intuition. Il est
d'ailleurs presque inévitable de commencer ainsi, ces notions ont toutes nécessité des siècles
d'élaboration pour atteindre la forme que nous leur donnons aujourd'hui. Notre récapitulation
aura l'avantage de mettre clairement en relief ce contenu intuitif et en tirera un ensemble
de questions clairement formulées (sur la nature du nombre 71 par exemple). La plupart de
ces questions trouveront des réponses dans cet ouvrage, ou dans les suivants pour quelques-
xiv

unes d'entre elles. Elles seront donc autant de points de repère pour apprécier l'intérêt de la
formalisation élaborée par les mathématiciens au fil des siècles, et accéder à une approche
mathématique de niveau universitaire.
Il ne nous sera cependant pas possible, ni réellement utile, de décrire toute cette formali-
sation. En particulier nous conserverons dans cet ouvrage leur caractère intuitif aux notions
indispensables d'ensembles et d'éléments. La logique et la théorie des ensembles constituent
des disciplines à part entière, dont la présentation dépasse le niveau Ll. Nous en donnerons
une idée dans les ouvrages de L2 et L3.

L'ouvrage se divise en cinq parties.

o La partie I - BASES - déjà évoquée, a pour but d'exposer de manière synthétique les
connaissances acquises dans l'enseignement secondaire (trigonométrie, études de fonctions,
fonctions usuelles, géométrie plane), en soulignant clairement les questions que leur présenta-
tion intuitive conduit à se poser. Ces questions seront reprises et résolues dans le cours de ce
tome Ll et des suivants.
o La partie II - STRUCTURES FONDAMENTALES - est nouvelle pour l'étudiant. On y
présente une première approche de la notion de structure qui, de manière générale, formalise
les relations entre objets d'un système composé en faisant abstraction de la nature des objets
eux-mêmes. C'est la notion de groupe, imaginée par Évariste Galois au début du XIXe siècle,
qui inaugure cette nouvelle tendance de pensée structurelle. Cette notion sera présentée dans
la partie II, ainsi que des structures algébriques plus élaborées, comme celle d'anneau qui
permet de formaliser l'arithmétique classique et de montrer de manière claire ses relations
avec l'arithmétique des polynômes. On introduira aussi la notion de corps, fondamentale à la
fois en analyse et en algèbre linéaire.
o La partie III - ALGÈBRE LINÉAIRE - sous-tend de nombreux phénomènes rencon-
trés depuis les classes primaires et en élargit considérablement la portée. La règle de trois
bien connue est la première manifestation d'un phénomène linéaire, mais il y en a beaucoup
d'autres comme, par exemple, le célèbre théorème de Thalès. L'algèbre linéaire fonde en par-
ticulier la notion d'espace à plusieurs dimensions et donne la possibilité d'étendre l'idée de
proportionalité à ces nouveaux espaces. Les applications intervenant dans ce cadre sont les ap-
plications linéaires, généralisation multidimensionnelle de la règle de trois. Par l'intermédiare
de ces applications, l'algèbre linéaire est aussi à la base de tous les problèmes d'approximation
au premier ordre que l'on rencontre en analyse, notamment celui de la dérivation.
o La partie IV - ANALYSE - est certainement celle qui est la plus détaillée dans les
classes secondaires, surtout par le biais des études de fonctions. On sait, par exemple pour
une fonction comme
x3 + 1
f : lR ---, JR, XH xz+ 1'

calculer la dérivée, dresser un tableau de variations et tracer un graphe. Mais on ne sait pas
encore exactement ce qu'est l'ensemble lR sur lequel elle est définie, ni comment cette dérivée se
formalise de manière satisfaisante. De même, les fonctions usuelles (exp, ln, sin, cos, tan) sont
« bien connues » depuis les classes secondaires, mais leur définition ne peut être considérée
comme satisfaisante au niveau Ll. L'objet de cette partie IV est d'établir tous les outils
nécessaires à la construction rigoureuse d'une théorie des fonctions, de la notion de nombre
réel à celle de fonction dérivable et de fonction intégrable. Cette dernière notion permet à son
tour de donner un sens précis à la notion de longueur des courbes planes et par là même de
donner la première définition pleinement aboutie du nombre 7t.
XV

◊ La partie V - INTRODUCTION AU CALCUL DIFFÉRENTIEL - est une première approche


des idées liées à la possibilité de dériver des fonctions, de plusieurs variables en général. Cette
idée peut s'énoncer très simplement : il s'agit d'approcher une fonction au voisinage d'un
point par la somme de sa valeur en ce point et d'une fonction linéaire bien choisie. Cette idée
conduit à une vaste théorie permettant de décrire la « forme » des fonctions, dans un sens qui
sera précisé tout au long du cours du cycle L. La possibilité de dériver des fonctions conduit
aussi à celle d'écrire des équations différentielles qui, outre leur intérêt propre, permettent
de faire un pont entre la discipline mathématique et la description de nombreux phénomènes
physiques d'évolution (du mouvement des planètes aux problèmes de résonance par exemple).
La partie V présente aussi les premiers aspects du calcul différentiel ainsi que ceux de la
théorie des équations différentielles.

La construction d'un programme d'enseignement exige que l'on fasse des choix. Nous avons
privilégié dans ce tome Ll la mise en forme et le développement des notions de mathématiques
pures abordées au lycée. Nous ne négligerons pas pour autant les aspects plus récents de
l'approche des mathématiques, liés souvent au développement de l'informatique, comme le
calcul formel dont l'étude sera abordée dans le tome L2. D'autres parties plus traditionnelles,
comme les probabilités et statistiques, ont été elles aussi jugées mieux adaptées au cours de L2.
Un texte mathématique doit être lu de manière critique et active. Tout au long du texte,
des questions test sont destinées à permettre au lecteur de s'assurer de sa compréhension des
sujets abordés. Il est conseillé de les résoudre au fur et à mesure de la lecture. Elles sont
corrigées à la fin de l'ouvrage. Des exercices, d'un niveau plus élevé, sont regroupés à la fin
de chaque chapitre; ils sont eux aussi corrigés à la fin de l'ouvrage.
Pour conclure cette entrée en matière, nous espérons que cet ouvrage saura apporter au
lecteur non seulement les bases techniques qui lui seront nécessaires dans son cursus univer-
sitaire, mais aussi une part indispensable de plaisir dans la découverte des notions qui y sont
abordées. Pour souligner l'aspect «humain» indissociable de la création mathématique, nous
avons, au début de chaque chapitre, brièvement évoqué quelques personnalités marquantes
(certes choisies de manière très partiale, l'exhausitivité en ce domaine n'étant pas dans les
objectifs de notre ouvrage). Nous espérons ainsi que le lecteur se fera une idée plus fidèle de
la genèse du vaste édifice que sont nos mathématiques contemporaines.
Remerciements

'ÉQUIPE d'auteurs tient à remercier tous ceux qui ont participé de près ou de loin à cet

L ouvrage et, en particulier, tous les étudiants qui dans nos cours ont assisté parfois
patiemment à la mise au point du style d'enseignement qui a motivé sa rédaction.

Nos étudiants de M2 et de thèse ont aussi participé à l'élaboration de ce livre. En premier


lieu, Clémence Labrousse nous a particulièrement aidés par ses commentaires et critiques sur
l'ensemble du texte. Vicky Kass et Sarah Carr ont attentivement relu nos essais et nous ont
permis d'en améliorer la forme. Édouard Pennamen a accepté de rédiger les solutions des
exercices de calcul différentiel. Que tous quatre soient très vivement remerciés.

Sihem Mesnager a relu une première version de la partie «Analyse». Ses critiques construc-
tives en ont fait évoluer la présentation et nous lui en sommes reconnaissants.

C'est à Arnaud Néris que nous devons la fractale qui a servi de base à l'illustration de
couverture. Nous lui sommes reconnaissants de nous avoir permis de l'utiliser.

L'intervention de Jean-Côme Charpentier pour la toute dernière mise en place des solutions
a été déterminante, de même que celle de Bruno Ayela pour la compilation finale. Nous leur
adressons nos sincères remerciements.

Nous remercions vivement Franck Lepargneux pour sa relecture extrêmement attentive


d'une grande partie de l'ouvrage et Jean-Philippe Moreux pour son important travail de
correction des feuilles de style et des coquilles.

La composition de cet ouvrage a été l'occasion d'échanges parfois mouvementés mais tou-
jours fructueux avec Pascale Pernet, directrice éditoriale, et Louise Blottière, éditrice scien-
tifique. Leur foi constante en notre capacité à mener ce lourd projet à bien dans un temps
raisonnable a simplement permis de le voir naître aujourd'hui, ce dont nous les remercions
chaleureusement.
Quelques modes de raisonne ment
ANS la vie de tous les jours, nous utilisons souvent des affirmations pour décrire le

D

monde qui nous entoure, les propriétés des objets, des êtres, etc. Par exemple, une
personne qui voyage souvent peut être amenée à dire
Paris est une grande ville,
◊ Paris est une petite ville,
◊ Paris a plus d'habitants que Lyon,
◊ Lyon a plus d'habitants que Paris.
Les deux premières affirmations expriment des opinions. Paris semble certainement être une
petite ville lorsque l'on revient de Mexico, mais c'est une grande ville si on la compare à Pau
par exemple. Ces deux affirmations ne portent pas de valeur de vérité a priori. En revanche,
nous nous accorderons pour dire que la troisième affirmation est vraie, alors que la quatrième
est fausse. Nous ne nous intéresserons qu'à ce dernier type d'affirmations, que nous appellerons
des propositions, ou aussi des assertions.
Notre but dans tout cet ouvrage va être d'étudier des propositions portant sur des objets
mathématiques, et de déterminer si elles sont vraies ou fausses. Nous ne chercherons pas ici
à définir ce que nous entendons par objet mathématique, et admettrons qu'il s'agit des objets
rencontrés dans la pratique courante de la discipline mathématique, depuis l'enseignement
secondaire. La famille de ces objets s'enrichira de nouveaux membres tout au long de ce
texte, et nous apprendrons progressivement à les manipuler. Ce n'est que dans le cours de
L2 que nous commencerons à donner des définitions plus précises, cela ne sera pas nécessaire
auparavant.
Revenons à l'intuition courante pour présenter plus en détail ce que seront nos problèmes.
Nous aurons à notre disposition des propositions dont nous saurons dès le départ qu'elles
sont vraies ou fausses et toute la question sera de déterminer à partir de ces données si
d'autres propositions, qui nous intéresseront au premier chef, sont vraies ou fausses. Nous
appellerons valeur de vérité le caractère vrai ou faux d'une proposition. En d'autres termes,
nous chercherons donc à déterminer la valeur de vérité de certaines propositions connaissant
la valeur de vérité d'autres propositions. Nous appellerons raisonnement la chaîne de pensées
qui nous permettra de le faire.
La logique a pour objectif premier de dégager les règles du raisonnement correct. Consi-
dérons les deux raisonnements R1 et R2 suivants.

Si la lampe est allumée, alors l'interrupteur est fermé.


R1 Or l'interrupteur n'est pas fermé.
Donc la lampe n'est pas allumée.

Si Milou est un martien, alors il a les yeux bleus.


R2 Or Milou a les yeux verts.
Donc Milou n'est pas un martien.
xviii

Dans R1, deux propositions sont de valeur de vérité connue.


1:: La première est la clause [Si la lampe est allumée, alors l'interrupteur est fermé]. L'expé-
s
<1)
rience ou la compréhension de la physique nous conduisent à la certitude qu'elle est vraie. Elle
nous dit simplement que chaque fois que l'assertion [la lampe est allumée] est vraie, l'assertion
§
[/J
[l'interrupteur est fermé] se trouve aussi être vraie.
-~ La deuxième est l'assertion [l'interrupteur n'est pas fermé], on peut constater qu'elle est
<1)
'O vraie ou fausse par un simple regard sur l'interrupteur, dans notre cas on constate qu'elle est
[/J
<1) vraie.

1
[/J
<1)
En d'autres termes, notre deuxième assertion nous indique que la deuxième assertion de
la clause est fausse. On en déduit que la première assertion de cette clause est nécessaire-
ment fausse. Donc la proposition contraire [la lampe n'est pas allumée] est vraie, d'où notre
I
;::l
conclusion.
Dans le raisonnement R2 , les assertions sont changées (et quelque peu fantaisistes) mais la
Ol
structure de la chaîne de pensées utilisée est exactement la même, comme on peut facilement
s'en convaincre. C'est précisément ainsi que le logicien envisage ses problèmes. Il oublie la
valeur de vérité des propositions qu'il considère et ne s'intéresse qu'aux structures des chaînes
de pensées qui permettent de passer des unes aux autres. Du point de vue logique, les deux
raisonnements R1 et R2 sont exactement les mêmes.
Le raisonnement R1 porte sur des objets de la vie courante, alors que R2 porte sur des
propositions abstraites. Les choses ne seront pas différentes lorsque les propositions porteront
sur des objets mathématiques. Donnons un troisième exemple, emprunté aux connaissances
des classes secondaires.

Si x 3 ~ 27, alors x E [3, +oo[.


R3 Or 2 (f. [3, +oo[.
Donc 2 3 < 27.

Cet exemple est encore basé sur le même type de raisonnement. On affirme que 2 n'est
pas dans l'intervalle [3, +oo[ (ce qui provient de nos définitions des symboles 2 et 3), et la
première clause nous apprend que si l'assertion x3 ~ 27 est vraie, alors l'assertion x E [3, +oo[
est vraie. Comme cette dernière est fausse lorsque x = 2, il en résulte que la première assertion
x 3 ~ 27 est aussi fausse dans le cas où x = 2. C'est donc le contraire de cette assertion qui
est vrai, et ce contraire est 2 3 < 27.

1. EXEMPLES DE PROPOSITIONS MATHÉMATIQUES


Nous allons maintenant donner des exemples de propositions mathématiques souvent utilisées
dans la pratique. L'ensemble des définitions et des règles que nous allons énoncer sont l'objet
du calcul des prédicats, dont les fondements dépassent le cadre de cet ouvrage. Nous nous
appuierons ici sur notre simple bon sens.

1.1. Les quantificateurs V et :3


Les mathématiciens manipulent souvent des propositions dépendant d'une ou plusieurs va-
riables x, 1}, z, qui appartiennent à des ensembles bien définis X, Y, Z. Par exemple, x peut être
xix

un nombre réel, l'ensemble de référence est alors la droite réelle, traditionnelleme nt notée JR.
Considérons la proposition p(x) suivante, qui dépend d'un nombre réel x et qui est définie par 1::

1
2
p(x) : « x ) 0 ».

On sait (par la règle des signes) que cette proposition est vraie pour toute valeur de x. On r/J
·ca
écrira donc « pour tout réel x, p(x) est vraie » ou encore « pour tout x appartenant à JR, ~
(L)
x2 ) 0 ». "O
~
En revanche, l'énoncé
q(x) : « x 2 > 4 »
1r/J
(L)

2
n'est pas vrai pour tout x réel, mais puisque 3 = 9 > 4, il existe une valeur réelle x telle
que la proposition q(x) soit vraie (la valeur x = 3 convient, mais ce n'est évidemment pas la
i;:l
Ol
seule). On écrira donc « il existe un réel x tel que q (x) soit vraie » ou encore « il existe un
réel x tel que x2 > 4 ».
2
Notons que dans les deux exemples précédents, l'écriture explicite des assertions x ) 0 et
x 2 > 4 à l'intérieur des propositions considérées sous-entend qu'elles sont vraies. Pour cette
raison, on convient que l'écriture « p (x) » à l'intérieur d'une proposition signifie « p (x) vraie».
Ceci nous amène à souligner la convention suivante.
Convention (C). Lorsqu'on rédige des mathématiques, une proposition écrite est implicite-
ment supposé vraie, sauf mention contraire.
Afin d'alléger l'écriture des propositions, les logiciens ont choisi une notation symbolique
2
pour les locutions «quelque soit 1 » et « il existe ».
Définition 1. Le symbole V signifie «quelque soit», on l'appelle le quantificateur universel.
Le symbole :l signifie « il existe », on l'appelle le quantificateur existentiel.

On précisera toujours l'ensemble X dans lequel l'élément x varie. En vertu de la convention


précédente, on écrira donc « Vx E X, p(x) » pour signifier la proposition « pour tout x dans
X, p(x) est vraie» et« :lx E X, p(x) » pour la proposition « il existe au moins un x dans X
pour lequel p(x) est vraie». Les exemples précédents peuvent ainsi se formuler comme suit
2
« Vx E JR, x 2 ) 0 » et « :lx E JR, x > 4 ».
Définition 2. Lorsqu'une proposition p(x) n'est vraie que pour une seule valeur de la va-
riable x, on écrit « :l ! x, p (x) », assertion qui se lit « il existe un unique x tel que p (x) soit
vraie».

1.2. Propositions plusieurs fois quantifiées


Compliquons légèrement la situation en considérant une proposition notée p (x, y) qui dépend
de deux variables x et y, et examinons les huit propositions suivantes formées à partir de p
1) VxEX,VyEY, p(x,y). 2) Vy E Y, Vx EX, p(x, y).
3) :lx EX, Vy E Y, p(x, y). 4) :ly E Y, Vx EX, p(x, y).
5) Vx EX, :ly E Y, p(x, y). 6) :lx E X,:ly E Y, p(x,y).
7) :ly E Y,:lx EX, p(x,y). 8) Vy E Y, :lx EX, p(x, y).

1
Le symbole V n'est ni plus ni moins que le A à l'envers du al/ anglais.
2
Le symbole :3 n'est ni plus ni moins que le E à l'envers du exists anglais.
X][

Le premier énoncé se lit, dans l'ordre « pour tout x EX, la proposition « pour tout y E Y,
.
É p(x, y)» est vraie». Le bon sens montre qu'il revient au même de dire que« pour tout x EX et

.
E
C
tout y E Y, la proposition p (x, y) est vraie » ou encore que « pour tout couple (x, y) E X x Y,
la proposition p (x, y) est vraie ». Il revient donc encore au même de dire que « pour tout y, la
E proposition « pour tout x, p(x, y) » est vraie» : les propositions 1) et 2) ont donc toujours
i
la même valeur de vérité, nous dirons provisoirement qu'elles sont synonymes.
Ë
.
-c Le lecteur aboutira de la même manière au constat que les propositions 6) et 7) sont aussi
.
,n

-g
synonymes, et se convaincra ainsi du bien-fondé de la règle suivante.
e
,n
V Rigi~. f Lê8 propasit{o1%S .ivx . ~· x;VjfE' Y.p(1'i\tf»'et"«Vv":E V: 'il*••·e X~p(1e/!k}. » sont
X.,39 'ÈË Y;<'.,pf'lt;, y}~· ét. •ilf··ay•. :e.,Yj:lx E :X;· pli; lil »
ÇJ/li01l1J'll,ifs; ÜS· p~Jiitttitts 4\3x·!:E
!
;::l .s<mt, syhTJti~-
Ol

Il faut en revanche prendre garde à l'intervertion des symboles V et :3. L'énoncé 3) signifie
il existe un x tel que la proposition « pour tout y, p (x, y) » soit vraie. En permutant les blocs
«::lx» et « Vy », on obtient la proposition 8) qui signifie pour tout y, la proposition « il
existe x tel que p(x, y) » est vraie. Ces deux propositions ne sont pas synonymes.

Les lecteurs que ces deux règles laisseraient perplexes s'exerceront à discerner les différences
entre les huit propositions dans des cas issus de la vie courante. Le prochain exemple éclaicira
certainement ce propos.

EXEMPLE 5. Traduisons en toutes lettres les huit propositions précédentes lorsque x désigne
un homme, y un film et que p(x, y) est la proposition« L'individu x a vu le film y».
1) signifie « Chaque individu a vu tous les films ».
2) est synonyme de 1).
3) signifie « Il existe un individu qui a vu tous les films ».
4) signifie << Il existe un film qui a été vu par tous les individus ».
5) signifie « Chaque individu a vu au moins un film».
6) signifie « Il existe un film qui a été vu par au moins un individu »ou encore « Il existe un
individu qui a vu au moins un film ».
7) est synonyme de 6).
8) signifie « Chaque film a été vu par au moins un individu».

Nous vérifions sur cet exemple que les propositions 3) et 8), obtenues par permutation
des blocs \;/y et ::lx, ne sont pas synonymes.

I.3. Négation d'une proposition quantifiée


Commençons par introduire ce que nous appellerons la négation d'une proposition p dépendant
d'une ou plusieurs variables. Il s'agira de la proposition qui dépend des mêmes variables et a
toujours la valeur de vérité opposée à celle de la proposition p. Par exemple, si la proposition p,
dépendant de la variable réelle x, est définie par p(x) :« x 2: 0 », sa négation est la proposition
xxi

« x < 0 ». Nous noterons non(p) la négation de la proposition p, elle est fausse si p est vraie,
et vraie si p est fausse 3 .
On peut maintenant aller plus loin et chercher comment trouver la négation de proposition
contenant des quantificateurs. En faisant encore appel au bon sens, on voit que la seule
manière de contredire une proposition telle que « quel que soit x dans X, la proposition p(x}
est vraie » est d'en donner un contre-exemple, c'est-à-dire de mettre en évidence une valeur
10
r/J
'@
1.

particulière x 0 E X telle que la proposition p(xo} soit fausse. La négation de « Vx EX, p(x}» ~
est donc« ::lx EX, non(p(x}} ». D'une façon tout aussi intuitive, la négation d'une proposition
r/J
Ill
'O
telle que « il existe x dans X tel que la proposition p(x} soit vraie » est « pour tout x dans
X, la proposition non( p (x}) est vraie ». Le contraire de « ::lx E X, p (x} » est donc « Vx E X,
s
r/J
Ill
non(p(x)} ». Nous résumerons ces résultats dans la très importante règle suivante.
t;:l
~gl~:Jl, /: . ·>:,~\ < . . . .•· .·. •.. .. . : Ol
X,.
Là négoiwrt. àe '!tex e y(xJ ,esf•ih ~X, 11.~{p{xH,
l,iJ, itiêgâtiw de h EX;.f>{'ll) est Vx:eX;ti0n(p(X :)}:
Notons là encore que les négations ainsi construites ne sont que des exemples dans la classe
de toutes les propositions synonymes possibles.
Plus généralement, la négation d'une proposition s'écrivant

où chaque symbole D désigne V ou :3, s'obtient en interchangeant les symboles V et :3, et en


terminant la proposition par non(p(x 1, ... , Xm}). Ainsi, la négation de la proposition Vx E
X, :311 E Y, Vz E Z, p(x, 11, z) s'écrit ::lx EX, \/11 E Y, ::lz E Z, non(p(x, 11, z}}.

EXEMPLE 7. Pour m EN, notons Nm l'ensemble des entiers n 2: m. Voici la définition de


la convergence vers O d'une suite de réels (un}nEJ\I

Ecrivons la négation de cette proposition.


► Il suffit d'appliquer à trois reprise les règles de négation des propositions quantifiées pour
obtenir

Il. L'IMPLICA TION

L'implication mathématique est à la base de la plupart des raisonnements que nous aurons à
rencontrer. En voici la définition.
Définition 8. Soient p et q deux propositions. Nous dirons que la proposition p implique
la proposition q, et nous noterons p ==} q, si on peut affirmer que q est vraie lorsqu'on sait
que p est vraie.

3
Notons que notre présentation comporte ici une part d'intuition et ne peut être considérée comme complète-
ment établie. En particulier, non(p) désigne en fait tout énoncé dont la valeur de vérité est celle que nous
avons décrite. Cela n'entraîne cependant en pratique aucun inconvénient.
xxii

Notons que si p et q sont des propositions, p =} q peut aussi être considérée comme
.., une proposition, qui peut être vraie ou fausse. Conformément à notre convention, dans un
C
CU
texte mathématique l'écriture p =} q sous-entend toujours que cette proposition est vraie.
Ê Ici cependant nous considérons encore l'écriture p =} q comme une proposition pouvant être
§
<1}
vraie ou fausse.
"§ L'utilisation de l'implication est à la base de ce que l'on appelle le raisonnement dédl!ctif,
CU
'O dont le principe est donné dans la règle suivante.
<1}
CU

1<1}
CU
On retiendra que les deux hypothèses p =} q vraie et p vraie sont indispensables. Il faut
& donc pour un raisonnement déductif pouvoir assurer à la fois que l'implication est vraie, et
'il
;:l
Ol que la première assertion de l'implication l'est aussi. Il faut donc en particulier disposer de
procédés permettant de décider qu'une implication est vraie.

Il.1. Comment prouver qu'une implication est vraie.


Montrer que p =} q est vraie revient à prouver que l'on ne peut avoir simultanément p vraie
et q fausse. Dans la pratique, afin d'établir que p =} q est vraie, on suppose donc p vraie et
on cherche à démontrer que q est vraie.

EXEMPLE 10. Soient <X et 13 dans JR. Montrons que (a2 + al3 + 13 2 = 0) =}(<X= 13 = O).
► Supposons que a 2 + al3 + (3 2 = O. Puisque

(a+ 13/2) 2 ): 0 et 313 2 /4): 0, on a a+ 13/2 = 0 et 13 = 0, c'est-à-dire <X= 13 = O.

Notons que nous avons utilisé la convention (C) dans l'exemple précédent. En effet, ( a 2 +
al3 + 13 2 = 0) =}(<X= 13 = 0) y signifie: l'implication« (a2 + al3 + 13 2 = 0) =}(<X= 13 = O) »
est vraie.
Cet exemple peut donner l'impression de tourner en rond. Nous voulons démontrer que
certaines assertions sont vraies au moyen d'implications, et nous venons de démontrer qu'une
implication est vraie au moyen d'une étude directe des assertions qu'elle contient. L'intérêt
du raisonnement déductif vient en fait de la règle suivante, que l'on appelle transitivité de
l'implication.

Règle 11. Si p ::::l? q et q =} r sont vraies, alors p =} r est vmié.

Ce résultat est à la base de preuve par déduction : si partant d'une hypothèse vraie p, on
prouve successivement que des implications sont vraies, jusqu'à aboutir à une proposition r,
alors r est vraie. Il est donc possible de montrer que des implications entre propositions sans
rapport immédiat entre-elles sont vraies, au moyen de chaînes d'implications plus faciles à
aborder. Nous en verrons de nombreux exemples dans cet ouvrage.

II.2. Condition nécessaire et condition suffisante


Appuyons nous encore une fois sur un exemple issu de la vie courante. Examinons les pro-
positions p : Il fait froid et q : Il neige. Personne n'a jamais vu neiger lorsqu'il fait chaud.
xxiii

On dit en français que la proposition p est une condition nécessaire de q ou encore que q est
une èondition suffisante de p. D'un point de vue logique, ces deux affirmations signifient que
l'implication q =} p est vraie.

Définition 12. Soient p et q deux propositions. On dit que p est une condition suffisante
de q ou de manière équivalente que q est une condition nécessaire de p lorsque p =} q est
vraie.
Il existe d'autres mameres pour dire qu'une condition est nécessaire, ou suffisante. Si
p =} q, on voit que pour que p soit vraie, il faut que q soit vraie, alors que pour que q soit
vraie, il suffit que p soit vraie.

II.3. La contraposition
Considérons la phrase suivante

Les vaches normandes sont les seules vaches à taches.

Chacun aura remarqué qu'il s'agit en fait d'une implication déguisée

vache à taches=} vache normande (I).

Sans préjuger de la validité de cette proposotion, chacun s'accordera à dire qu'elle est équi-
valente à
vache pas normande=} vache sans tache (II).
Le passage de l'énoncé (I) à la proposition synonyme (II) s'appelle en logique la contraposition.

~,~.i!J~(~j>TflpoMti~1ttl1#c q ~~{q)•~·.• no11,{P:)··. ·~ant··.sy1n11ifjmès:,1,a:i#JPf>~1/tûm


rt;tli,:t{4l # 1\-~rtfp}esf;ap~~ lâ èontra~ de p •.~ qr · · · ·

Dans la pratique, lorsque l'on devra démontrer une implication, on se demandera s'il n'est
pas plus simple, en fonction des hypothèses de l'énoncé, de prouver sa contraposée. Illustrons
sans plus attendre ce principe.
2
EXEMPLE 14. Soit n EN. Prouvons que (n impair) =}(n impair).
(n pair) =} (n 2 pair).
► Raisonnons par contraposition. Soit n E N. Il s'agit d'établir que
2 2 2
Supposons n pair. Il existe alors m E N tel que n = 2m. Ainsi n = 4m et n est donc
pair.

Dans cet exemple, la contraposée est plus facile à prouver : l'hypothèse non( q) portant sur
n, il suffit d'élever au carré pour obtenir un renseignement sur n 2 . Bien entendu, il n'y a pas
de miracle. Deux propositions synonymes sont aussi difficiles à montrer l'une que l'autre. Mais
il est possible que l'une des deux versions soit mieux adaptée aux données dont on dispose,
ou aux habitudes de preuve de chacun.

EXEMPLE 15. Soit a ER Prouvons que (Ve E JR~, lai< c) =}(a= 0).
► Raisonnons par contraposition. Supposons a f. O. Posons E = lal/2: on a E > 0 et lai): E.

Ainsi 3c E JR~ tel que lai ): E, ce qui est la négation de \ic E JR~, lai < E, comme nous
l'avons vu.
xxiv

III. L'ÉQUIVAL ENCE


] (
Deux propositions p et q sont dites équivalentes si on peut affirmer que q et vraie quand on

~ sait que p est vraie, et si de plus on peut affirmer que p est vraie si on sait que q est vraie.
On peut donc donner la définition suivante.
~
11)
"Cl Définition 16. Deux propositions p et q sont équivalentes si p ==} q et q ==} p. On note
r/)
11) alors p # q.
"Cl
0
a
r/) En d'autres termes, deux implications sont équivalentes lorsqu'elles sont synonymes.

!;:l
Ol
Lorsque p et q sont équivalentes, p est une condition nécessaire de q et p est aussi une
condition suffisante de q. On dit alors que p est une condition nécessaire et suffisante4 de
p. On écrira également que p est vraie si et seulement si q est vraie. De même q est une
condition nécessaire de pet q est aussi une condition suffisante de p, donc q est une condition
nécessaire et suffisante de p.

III.1. Comment prouver une équivalence


Pour rédiger la preuve qu'une équivalence est vraie, il est souvent utile de la séparer en deux
volets. On démontre successivement que les deux implications qui la constituent sont vraies.
En voici un exemple.

EXEMPLE 17. Montrons que pour tous nombres réels x et y, lx+yl = lxl+lyl si et seulement
si xy O.~
► Raisonnons en deux temps.
( {==) Supposons xy ~ 0. Alors x et y ont nécessairement le même signe. Notons é: = + 1
s'ils sont positifs, et é: = -1 s'ils sont négatifs. On voit donc que lxl = EX, 1111 = é:1/ et
lx+yl = dx+y) d'où lx+yl = lxl + 1111-
(=}) Supposons lx+ 111 = lxl + IYI- En élevant cette égalité au carré, on obtient sans peine
x2 + y2 + 2xy = x2 + y 2 + 2lxllyl, ainsi xy = lxllYI et donc xy ~ O.
Dans un souci de clarté, on énoncera toujours précisément l'implication que l'on est en
train de montrer. Notons que cet exemple est écrit de la manière légèrement abrégée qu'il est
de coutume d'employer en mathématiques. Nous avons dit « On voit que» pour signifier que
la vérification de l'assertion qui suit ne présente pas de difficulté. De même « On obtient sans
peine » fait ici référence à un simple calcul.
Bien entendu, il n'est pas toujours indispensable de dissocier la preuve d'une équivalence
en deux volets ({==) et (=}) , on peut aussi raisonner directement.

EXEMPLE 18. Mçmtrons que pour tous nombres réels x et y, lx+yl = lxl+lyl si et seulement
si xy ~
O.
► Puisque les deux membres sont positifs lx+ YI = lxl + 1111 si et seulement si lx+ yl 2 =
(lxl + lyl)2, ce qui équivaut à xy = lxyl, soit xy ~ O.
Les deux preuves que nous venons de donner ne sont pas différentes. Elles se distinguent
simplement par leur présentation, et par l'accent mis sur l'une ou l'autre des difficultés.

4
Ce que l'on note parfois CNS en abrégé.
XXV

111.2. Le raisonnement par équivalences


Comme pour le raisonnement déductif, on peut montrer l'équivalence de deux assertions au
moyen d'une chaîne d'équivalences intermédiaires.
1
~<Il
Notons que nous avons adopté la convention (C) dans cette règle. Les raisonnements "O
rJJ
par équivalence sont souvent employés dans des phases calculatoires, par exemple lors de la ~
résolution de systèmes d'équations (le cas des systèmes linéaires est bien connu des lecteurs). s
rJJ

EXEMPLE 20. Établissons que pour tous réels x et y, lx+ YI:( lxl
► Soient x et y dans lR. Comme les deux membres sont positifs,
+ lyl.
lx + y1:( lxl + IY I si et
2
seulement si lx+yl 2 :( (lxl + lyl)2, donc lx+yl :( lxl + IYI # x2 +2xy +y 2 :( x2 +21xllyl +y .
i
Ol

Comme x + 2xy + y :( x + 2lxllYI + y # xy :( lxllYI = lxyl, on a lx+ YI :( lxl + IYI #


2 2 2 2

xy :( lxyl. Puisque cette dernière inégalité est vraie, on en déduit que lx+ YI :( lxl + IYI est
également vraie.

111.3. Comment prouver l'équivalence de plusieurs propositions


On se convainc aisément que prouver l'équivalence de trois propriétés 1), 2) et 3) (ou plus)
se résume à montrer une chaîne d'implications, par exemple 1)=? 2), 2) =9 3) et 3) =9 1)
ou encore 1) =9 3), 3) =9 2) et 2) =9 1). On choisira parmi les trois chaînes possibles celle
qui semble la plus rapide. Énonçons une règle qu'il conviendra d'adapter à chaque cas.

Toutes les règles précédentes formalisent certains types de raisonnements. Elles ne doivent
pas faire oublier que le « bon sens», emprunté à la vie courante, est toujours à l'œuvre dans
les considérations que nous allons développer dans cet ouvrage. Il serait illusoire de prétendre
tout démontrer en détail.

IV. LE RAISONNEMENT PAR RÉCURRENCE


Ce raisonnement est l'un des plus courant en mathématiques et il importe de le maîtriser
parfaitement. L'invention du raisonnement par récurrence est traditionnellement attribuée par
les historiens à Francisco Maurolico, mathématicien italien du xvre siècle. Il est intimement
lié à la structure de l'ensemble des entiers naturels N. Nous ne pourrons pas dans ce texte
entrer plus avant dans les problèmes posés par l'axiomatique de la théorie des ensembles. Là
encore, le sens commun sera notre meilleur guide.

"~
•--- -:;,.;-~
xxvi

Il est recommandé au lecteur de présenter ses raisonnements par récurrence selon l'exemple
suivant.

10
rJJ
·@
...
EXEMPLE 23. Montrons que \ln E N, 5n+2 ? 4n+2 + 3n+2_
► Raisonnons par récurrence. Pour n EN, notons HR(n) la proposition 5n+2 ? 4n+2+3n+2_
◊ HR(O) est clairement vraie puisque 5 2 = 4 2 + 3 2 .
Cl)
'O ◊ Prouvons que Vn? 0, HR(n) =} HR(n + 1 ). Soit un entier n? O. On suppose que HR(n)
rJJ
Cl) est vraie, c'est-à-dire que 5n+2 ? 4n+2 + 3n+2 . Ainsi 5n+3 = 5 X 5n+2 ? 5 x 4n+2 + 5 x 3n+2 •
s
'O
Or, 5 X 4n+2? 4n+3 et 5 X 3n+2 ? 3n+3 d'où 5n+3 ? 4n+3 +3n+3 _ L'hypothèse HR(n+ 1) est
rJJ
Cl)
donc vérifiée.
& ◊ D'après le principe de récurrence, HR(n) est vraie pour tout entier naturel n.
-g
Ol Il est parfois nécessaire de recourir à une version légèrement différente du raisonnement
par récurrence, donnée dans la règle suivante.

Règle 24. $oit no E ~- P!Jv,r tO'Ut entier natureln ?: lto,· on considère. un~ irar,mntiQrt
HR(nJ dépt,ntlànt;tjf! a. Alors, si ttRJ1to)est vraie et si pour tout entier n ;;,, notla proposition
{HR(no) etliR(]lo+l) et .•. t!,t HR{tt}]'. =} }J.R(n+))
est. vraiè; âlôrs '[)Our tJut entiéi n J n 0 , HR(n) est vraie.
Première partie
BASES
ANS cette partie, nous rappelons les connaissances acquises dans les classes secondaires

D en insistant en particulier sur la trigonométrie, les techniques d'étude de fonctions, les


fonctions dites élémentaires (exp, ln, sin, cos, tan, ch, sh), les propriétés des nombres
complexes, les techniques de manipulation des sommes et produits finis et enfin la géométrie
dans le plan.
Comme nous l'avons déjà indiqué dans l'avant-propos, le but de cette partie de révision
est double. D'une part, il est indispensable de mettre au point les bases sur lesquelles se fonde
l'intuition développée durant les première années de l'apprentissage mathématique, et d'autre
part il est primordial de souligner de manière claire les imperfections de cette construction
mathématique préliminaire. Nous allons dans cette introduction mettre l'accent sur quelques-
unes de ces insuffisances, et montrer dans quelle mesure nous pourrons les corriger dans cet
ouvrage, et dans la suite du cycle L.
o Les nombres. La notion de nombre repose tout d'abord sur l'idée intuitive d'entier naturel.
À toute collection d'objets concrets, de livres ou d'assiettes par exemple, nous apprenons
depuis l'enfance à associer un symbole, le nombre d'objets contenus dans cette collection. Ce
nombre permet de comparer la taille de deux collections distinctes, sans tenir compte de la
nature des objets qui les constituent. Nous apprenons très vite à faire des opérations sur ces
nombres : addition, soustraction, multiplication et division. Cette notion de nombre entier sera
aussi à la base de toute notre construction dans ce cours, et nous devons souligner que nous ne
pourrons pas aller beaucoup plus loin dans sa mise en forme, ceci dépasserait en effet le cadre de
cet ouvrage. Nous admettrons qu'il existe un ensemble d'entiers naturels N = {O, 1, 2, 3, 4, ...}
muni d'une addition notée+, d'une multiplication notée x, et d'une relation d'ordre notée :S,
vérifiant un certain nombre de propriétés que nous préciserons. Nous ne chercherons pas à
définir ce qu'est un ensemble, ni à aller plus avant dans les problèmes de logique qu'une telle
notion pose d'emblée. La donnée de cet ensemble Net de ses propriétés, ainsi que l'approche
naïve de la théorie des ensembles que nous adopterons, permettent cependant de donner un
sens satisfaisant à toutes les notions que nous rencontrerons par la suite.
En particulier, il devient alors possible de construire l'ensemble Z des entiers relatifs et
l'ensemble (Q des nombres rationnels, ainsi que les opérations+, x et la relation :S dont ils sont
munis, par des procédés algébriques bien établis. Un entier relatif est simplement un ensemble
de couples d'entiers naturels, tels que la différence du premier et du deuxième éléments d'un
couple soit constante pour tout couple dans cet ensemble. Il est ensuite possible de définir les
opérations sur les entiers et la relation d'ordre de manière très simple à partir de celles de N.
L'ensemble (Q des rationnels peut alors être construit à partir de Z par un procédé analogue.
Le passage de l'ensemble des rationnels (Q à celui des nombres réels lR est en revanche
d'une tout autre nature et n'est qu'effieuré dans les programmes du secondaire, bien que la
manipulation des nombres réels soit permanente. Nous consacrerons les chapitres 21, 22 et 23
de cet ouvrage à familiariser le lecteur avec la construction de la droite réelle, et à explorer
ses conséquences les plus importantes. En particulier, la représentation familière des nombres
au moyen d'un développement décimal illimité sera complètement élucidée.
o La droite, le plan, l'espace. Ces notions sont intimement liées à notre expérience quo-
tidienne, et c'est aussi sur cette expérience que repose leur introduction dans les classes se-
condaires. La construction de la droite réelle nous permet d'aller beaucoup plus loin dans
2

la formalisation de ces idées, en permettant de donner des modèles pour ces objets, dont les
premiers sont les espaces vectoriels réels de dimension 1, 2 ou 3. Bien entendu, la portée de
l'algèbre linéaire ne se limite pas à unuelle formalisation : il est par exemple possible de
définir des espaces de toutes dimensions, et d'étudier certaines de leurs transformations. Il est
toujours possible de fixer une base dans un espace vectoriel, finie si la dimension de l'espace
est finie, et de repérer les éléments de cet espace vectoriel par leurs coordonnées dans cette
base. À quelques nuances près 1 on peut ainsi considérer que le cadre général de ce que nous
appelons habituellement «géométrie» sera fermement établi, à l'exception cependant de la
définition des distances et longueurs, sur lesquelles nous allons revenir.
o Distance entre deux points, longueurs de segments. Lorsqu'on se donne un repère
orthonormé dans le plan, et que l'on représente les points par leurs coordonnées dans ce repère,
il est possible de définir la distance entre le point A de coordonnées (x, -y} et le point B de
coordonnées (x', -y') au moyen de l'expression

d(A, B) = J(x - x') 2 + (-y --y')2. (D)

Mais la notion de repère orthonormé n'est pas clairement définie, on fait en général de nouveau
appel à l'intuition en figurant un tel repère au tableau par un couple de vecteurs issus d'un
point et faisant entre eux un« angle droit». La distance calculée au moyen de l'expression (D)
correspond alors à la distance usuelle, mesurée au moyen de règles, ce qui traduit simplement
le théorème de Pythagore.
La formalisation complète de ces notions sera donnée dans le cours de L2 , elle fait partie
de ce que l'on appelle la géométrie euclidienne. Nous nous limiterons ici, lorsque nous aurons
à parler de distance entre deux points du plan ou de l'espace, aux modèles donnés par les
espaces vectoriels JR. 2 et JR. 3 ( que nous appellerons canoniques), dans lesquels les éléments sont
des couples et des triplets, et nous définirons la distance entre ces éléments au moyen de
l'expression (D) ou de sa version tridimensionnelle.
o La longueur des courbes du plan. Le plan sera donc maintenant représenté par le
modèle de l'espace vectoriel canonique JR. 2 , et la distance entre deux éléments du plan sera
définie par (D). On se pose alors le problème de mesurer la longueur des courbes du plan. Il
est donc d'abord nécessaire de définir ce que nous entendons par «courbe». Il s'agit d'une
notion assez difficile à mettre au point complètement, cela ne pourra être fait convenablement
qu'au chapitre 30. Pour l'instant, limitons-nous à l'idée intuitive que l'on peut se faire d'un
tel objet, fondée sur des exemples. Une droite du plan est certainement une courbe, la plus
simple d'entre elles, de même que le cercle, ou que l'ellipse, ou qu'un arc de cercle, ou que des
arcs de cercles joints bout à bout.
Comment définir convenablement la longueur d'un tel objet? Pour un segment de droite,
c'est simplement la distance entre les points extrêmes. Dans les autres cas, il est clairement
nécessaire d'introduire une définition nouvelle, qui sera fondée sur la définition préalable de la
notion de courbe et que nous ne donnerons donc pas encore (voir les chapitres 27 et 30). Nous
nous limiterons ici à tenter de faire sentir qu'il serait risqué de se satisfaire de l'idée intuitive
de cette notion sans la formaliser précisément.
Nous allons considérer dans le plan un segment S de longueur 2, et noterons O son milieu.
Puisqu'on connaît la notion de distance entre deux points, il est possible de considérer un
demi-cercle C de centre O et de rayon 1, dont les points extrêmes A et B sont les deux

1
Le modèle le plus adéquat pour la notion d'espace est en fait celui d'espace affine, que nous verrons dans le
cours de 12.
3

extrêmités du segment S. On sait depuis les classes primaires que la «longueur» de C est
égale à n, mais on ne connaît pas le sens exact du mot longueur. Nous n'en aurons pas besoin §
ici. Nous supposerons seulement.__gue si Cest la longueur du demi-cercle C, alors un demi-cercle :0
(.)

dont le diamètre est de longueur a (ce qui est bien défini) a pour longueur a x C/2. .g
Considérons maintenant la figure suivante, dans laquelle nous avons tracé une famille de
courbes (Cn), La courbe Co est par définition le demi-cercle C. La courbe C 1 s'obtient en
j
mettant bout à bout deux demi-cercles de rayon 1/2, centrés aux points milieux de AO et
OB. De même la courbe C2 s'obient en mettant bout à bout quatre demi-cercles, et ainsi de
suite.

FIGURE 1. La suite des courbes Cn

On obtient ainsi une suite de courbes, qui s'aplatissent sur le segment S, comme le montre
l'exemple de la courbe Cs.

ooooooooooocv::v:vv:::-ooooooooooocv::,ooo

FIGURE 2. La courbe Cs

Quelle est la longueur de la courbe Cn? On voit que pour obtenir C 1, on a juxtaposé deux
demi-cercles de longueur C/2, donc la longueur de C 1 doit être C. De même, pour construire
C2, on a juxtaposé 4 demi-cercles de longueur C/4, on en déduit que la longueur de C2 est C.
On se convainc ainsi que la longueur de Cn est toujours égale à C.
Mais une autre intuition nous dit que comme Cn s'aplatit sur S à mesure que n grandit,
sa longueur doit être de plus en plus proche de celle de S. On en déduit donc que C= 2. Or C
est la longueur de C, dont nous avons depuis longtemps admis qu'elle était égale à n. Et nous
avons aussi appris que n = 3, 14159 ... Il y a donc là certainement un problème.
o Le nombre n. Le problème que nous venons de signaler porte à la fois sur la mesure des
longueurs des courbes et la définition du nombre n. On pourrait aussi penser que notre in-
tuition portant à croire que la longueur de Cn doit se rapprocher de celle de S est erronée,
et que l'on n'a pas le droit de passer à la limite quand on considère des longueurs. Mais
c'est précisément ainsi qu'Archimède a donné des évaluations assez précises du rapport de
la «longueur» du cercle à celle du diamètre (rapport noté 2n ... ). Il a construit des suites
de polygones inscrits et circonscrits dans le cercle, dont il pouvait définir et calculer les lon-
gueurs puisqu'il s'agit de réunions de segments de droites, et montré que les deux suites de
(
longueurs ainsi obtenues semblaient se rapprocher indéfiniment. Leur « limite » commune ne
pouvait qu'être ln.
Nous n'irons pas plus loin dans ces questions ici, nous ne les avons signalées que pour mettre
en évidence plusieurs nécessités. Les longueurs sont des nombres, il faut donc en préalable
;::: définir correctement ce qu'est un nombre. Les longueurs semblent faire intervenir ce que nous
avons appelé un passage à la limite, ce procédé doit donc être convenablement étudié. La
longueur d'une courbe n'est pas clairement définie, et il n'est même pas évident que tout ce
que nous pensons être une courbe puisse posséder une longueur ... il y a donc beaucoup de
travail avant d'espérer donner un sens précis à toutes les notions évoquées plus haut.
Une grosse partie de ce travail de fondement sera donnée dans la partie analyse de cet
ouvrage, on se reportera en particulier au chapitre 28 pour les questions concernant la longueur
des arcs de cercles. Seule l'explication du paradoxe des courbes Cn, tendant à prouver que
f = n, sera remise au tome 12, elle nécessite l'étude des modes de convergence de suites de
fonctions.
o Les mesures d'angles et les lignes trigonométriques. Ce qui précède montre assez le
danger de travailler sur des notions incomplètement formalisées. Nous espérons en évoquant la
difficulté inhérente à la mesure des courbes avoir fait sentir au lecteur que les notions d'angle,
telles qu'on les définit sur le cercle trigonométrique, ainsi que celles de lignes trigonométriques,
sont en fait en attente de définitions plus complètes que celles que l'on donne à titre provisoire
dans l'enseignement secondaire. On trouvera dans cet ouvrage les réponses à ces questions,
en particulier au chapitre 28.
c Chapitre 1
UN PEU DE GÉOMÉTRIE PLANE

ES origines de la géométrie remontent aux royaumes de Babylone et d'Égypte. Née de

L considérations pratiques (architecture, arts décoratifs, astronomie, etc.), la géométrie


se développe progressivement de manière autonome; les archéologues ont trouvé la
trace de nombreux problèmes géométriques tels que les calculs d'aires sur des tablettes ba-
byloniennes. Selon l'historien grec Herodote 1 , « la géométrie est un don du Nil » : les crues
répétées du fleuve obligèrent les arpenteurs à retracer régulièrement les limites des domaines
agricoles avoisinants, ce qui les obligea à systématiser les calculs de longueurs et d'aires. Le
Papyrus Rhind atteste le savoir-faire egyptien en matière d'aire.

C'est sous l'impulsion de Thalès de Milet 2 que la géométrie devient déductive : l'idée de
démonstration s'impose et repousse les limites mathématiques au-delà de la simple descrip-
tion. Selon Proclus, Thalès rapporta la géométrie de ses nombreux voyages en Égypte.

De nombreux savants prennent alors le relais. Pythagore de


Samos fonde une école à Crotone, La Fraternité pythagoricienne.
Puis, vers 490 avant avant J.-C., se développe !'École d'Athènes
dont la figure de proue est Eudoxe et qui comptera parmi ses
membres Anaxagoras, Hyppocrate et Hippias. Après le déclin de
la cité athénienne à l'époque hellenistique, Alexandrie devient la
nouvelle capitale intellectuelle de l'empire. L'École d'Alexandrie,
fondée vers 330 avant J.-C., marque un véritable âge d'or de la
pensée mathfmatique. Euclide publie les treize volumes 3 de ses
Éléments qui seront considérés pendant plus de deux mille ans
comme un ouvrage pédagogique de référence en matière de géo-
métrie4. Le savant y expose les célèbres postulats sur lesquels il
fonde la géométrie et démontre à partir de ceux-ci les théorèmes
Thalès fondamentaux. Citons également les contributions d'Archimède
de Syracuse et d'Apollonius de Perge, autres membres de l'École
d'Alexandrie. Suit alors un lent déclin de l'activité mathématique dans le bassin méditerrra-
néen : l'Empire romain compte de moins en moins de savants de premier plan, citons tout
de même Pappus au 1v• siècle après J.-C. L'héritage grec fut transmis après traduction aux
savants arabes. Ces derniers développèrent de nouvelles méthodes de calculs d'aires et de
volumes et contribuèrent, comme nous l'avons déjà souligné, au développement de la trigono-
métrie.

1
484-425 av. J.-C.
2
625-547 av. J.-C. On peut voir une reconstruction de la porte du marché de Milet au Pergamonmuseum de
Berlin.
3
:s;ous dirions de nos jours chapitres.
~ :S.ewton lui-même écrira son célèbre ouvrage Philosophiae Natumlis Principia Mathematica dans le style des
Éléments d'Euclide.
6

I. PRÉREQUIS DE GÉOMÉTRIE PLANE


~

I.1. Avertissement
..:
.!::
;:: Toute théorie mathématique repose sur un certain nombre de résultats considérés comme
t vrais et que l'on appelle des axiomes 5 . Ce recours est inévitable : on ne peut construire une
théorie à partir de rien. Euclide fut le premier savant à proposer une axiomatisation de la
géométrie. Par exemple, le cinquième et célèbre postulat d'Euclide affirme que « par tout
point du plan passe une unique droite parallèle à une droite donnée ». Cette axiomatique
imparfaite fut retravaillée par David Hilbert à la fin du XIXe siècle. De nos jours, l'approche
traditionnellement retenue est de fonder la géométrie sur la notion de vecteur. L'ambition
de ce chapitre n'est pas de définir rigoureusement les notions de points et de vecteurs mais,
à partir des notions empiriques de géométrie acquises dans le secondaire, de développer de
nouveaux outils de résolution et de calcul.

I.2. Les vecteurs du plan


La notion intuitive de vecteur du plan est supposée
connue. Rappelons simplement qu'un vecteur est dé-
fini par la donnée d'une direction, d'un sens et d'une
longueur. La description d'une direction et d'un sens
suppose la présence d'une référence par rapport à la-
quelle ils sont définis, par exemple un axe. Dans la
FIGURE 1.1. L'addition des
pratique, cette référence est laissée à l'observateur de
vecteurs
la figure géométrique. La notion de longueur suppose
en plus le choix d'une unité de référence; la longueur définissant un vecteur Ü sera appelée
norme de Ü et notée Il ûll. On prendra garde à ce que le vecteur nul échappe à cette descrip-
tion - il n'a en effet aucune direction. On le notera O. On désigne par la lettre P l'ensemble
des vecteurs du plan.

Essayons de dégager les particularités de cet ensemble.Pest muni d'une opération appelée
addition dont le contenu est rappelé dans la figure l. Il est clair que l'ensemble (P, +) jouit
des propriétés suivantes.

Propriétés de l'addition des vecteurs du plan

o (P, +) est un groupe dont l'élément neutre est noté O, c'est-à-dire que + vérifie les
propriétés suivantes :
a. Associativité: Vû, v, w E P, ü + (v +w) = (û + v) +w;
b . le vecteur Ô est élément neutre : V Ü E P , Ü + Ô = Ô + Ü = Ü;
c . existence d'un opposé : tout vecteur Ü E P admet un opposé, ie V Ü E P, il existe
v E P tel que Ü + v = v + ü = O. On le note v = -Ü;
o Le groupe (P, +) est abélien, c'est-à-dire V Ü, v E P , Ü + v = v + ü.

5
Ou encore des postulats.
7

Ajoutons que la notation -ü empfoyée ci-dessus a un sens car l'opposé est nécessairement
unique (cf. le chapitre sur les structures).
Le groupe (P, +} est également muni d'une opération dite externe qui à un nombre réel À et
un vecteur ü associe le vecteur À· Û (que l'on note plus simplement "Au) défini naturellement:
ÀÛ est nul si À = 0 ou ü = Ô; À· Ü est de même direction que Ü; À· Ü de même sens
si À > 0, de sens contraire lorsque À < 0; la norme de À· Ü vaut l"AI fois celle de Ü. Cette
opération vérifie les règles de calculs suivantes.

Propriétés de l'opération des réels sur les vecteurs

o vü, v E P, v"A E IR., "A. (ü + v} ="A. ü +"A. v. ,....;


..ci
o \::/ Ü E P , \::/À,µ E IR. , (À+µ)· Ü =À· Ü + µ · Ü. ü

o \::/Ü E P, \::/À,µ E IR., À•(µ· Ü) =("Aµ)· Ü.


o \::/ Ü E P , 1 · Ü = Ü.

On résume l'ensemble de ces propriétés en disant que ces opérations définissent sur l'en-
semble P une structure d'espace vectoriel réel. L'étude de cette structure particulière est l'objet
de l'algèbre linéaire, et plusieurs chapitres y seront consacrés. On déduit de la définition des
vecteurs que pour tous À E IR. et Ü E P, l'égalité À· Ü = Ô est équivalente à la proposition
"A= o ou ü = o.
6

La description de P donnée ci-dessus est-elle complète ? Suffit-elle à caractériser les vec-


teurs du plan? Quand on y réfléchit un peu, on s'aperçoit que les vecteurs de l'espace vérifient
exactement les mêmes propriétés. Il faut donc ajouter à cette description une notion qui per-
mettrait de distinguer le plan de l'espace. Cette idée nouvelle que nous recherchons correspond
à la notion intuitive de dimension. Les vecteurs du plan sont des objets bidimensionnels. Se
pose alors le problème de la traduction mathématique de cette dimension. Quelle définition
rigoureuse en donner ? Avant d'aller plus loin, nous commencerons par rappeler quelques dé-
finitions usuelles.
Définition 1.1. (Colinéarité). Soient Ü et v
appartenant à P. On dit que Ü et sont v
colinéaires si et seulement si l'un des deux vecteurs est nul ou s'il existe À E IR. tel que
v="Au.

Définition 1.2. (Combinaisons linéaires de deux vecteurs). Soient ü, v E P. On


appelle combinaison linéaire de Ü et v
tout vecteur de P de la forme À Ü + µ où À et µ v
sont des nombres réels.
La colinéarité nous permet de préciser l'idée de dimension deux : deux vecteurs non co-
linéaires suffisent à décrire tous les autres par combinaison linéaire. On peut considérer la
propriété suivante comme une caractérisation de la dimension deux.

6
On pourrait en fait déduire ce résultat des seules propriétés encadrées, (cf. la règle 17.3).
8

rfl
P est un espace vectoriel réel de dimension deux
Cl)

~
CO Soient (Ü, v) un couple de vecteurs non colinéaires de P. Pour tout vecteur w, il existe
..... un unique couple de nombre réels (x, -y) tel que w= x Ü + -y v.
w=xÜ+-yv

v ,,
-------.,!

û xu

Cette propriété motive l'introduction du vocabulaire suivant.

Définition 1.3. (Bases de P, coordonnées d'un vecteur dans une base). Un couple
de vecteurs non colinéaires !!il = (Ü, v) est appelé une base de P. Pour tout vecteur w, il
existe un unique couple de nombre réels (x, -y) tel que w = x Ü +-y v.
On dit que (x, -y) ,qg sont
les coordonnées de w dans la base !!il.

Il faut savoir calculer sans hésiter les coordonnées dans une base d'une combinaison linéaire
de vecteurs de P.

Coordonnées d'une combinaison linéaire


Soient !!il = (û, v) une base de P, ai et ai de coordonnées (x 1 , -y 1),qg et (x 2, -y 2),qg
dans !!il. Pour tous nombres réels À et µ, les coordonnées du vecteur Àai + µai sont
(Àx 1 + µx2, À1J1 + µfü),qg.

v v
En effet, ai= x 1Ü + -y, et ai= x 2Ü + 1J2 donc, d'après les règles de calcul énoncées
ci-dessus, Àai +µai= (Àx1 + µx 2)Ü + (À-Y1 + µ-y 2)v. Ainsi, par définition, les coordonnées de
Àai + µai sont (Àx 1 + µx 2, À-y 1 + µ-y 2),qg. On retiendra que les coordonnées d'une combinaison
linéaire de vecteurs se calcule en effectuant la même combinaison linéaire sur les coordonnées
des vecteurs en jeu. Cette règle se généralise sans peine à toute combinaison linéaire d'un
nombre fini de vecteurs, telle que Àai + µai+ 'V(½.

Une unité de longueur et une orientation de Pétant choisies, nous verrons dans la partie III
de ce chapitre qu'il est possible de définir la notion de mesure des angles orientés.

Définition 1.4. (Vecteurs orthogonaux et notation ..l). On dit que deux vecteurs Ü et
v sont orthogonaux lorsque l'un d'entre eux est nul ou lorsque (û, v) = ±n/2. On notera
de manière condensée Ü..l v cette propriété.
9

1.3. Bases de P
Une orientation du plan étant choisie (ie un sens de parcours sur les cercles, appelé sens
trigonométrique), on peut définir la notion de base directe de P.

Définition 1.5. (Base directe). Une base (Ü, v} est dite directe lorsque (ü, v} E]O,n[
et indirecte lorsque (Ü, v} E] - n, O[.

,....;
.d
u

v v
(û, V) est une base indirecte (û, V) est une base directe

FIGURE 1.2. Orientation d'une base

Une base &J = (Ü, v} de P sera dite orthonormée lorsque llûll = llvll = 1 et Ü..l v. On
dira que &J est orthonormée directe lorsque en plus (Ü, v} = +n/ 2. Il faut connaître les
résultats fondamentaux suivants, qu'il faut considérer comme de véritables axiomes.

Bases orthonormées du plan P

◊ Le plan P admet des bases orthonormées directes 7 ( et même une infinité).


◊ Tout vecteur Ü de norme 1 peut être complété en une base orthonormée directe (û, v}
du plan vectoriel P.

On retiendra également que deux vecteurs non nuls et orthogonaux ne sont pas colinéaires
et forment donc une base de P.

1.4. Droites vectorielles


Définition 1.6. (Droites vectorielles). Soit â un vecteur non nul du plan. On appelle
droite vectorielle engendrée par â, l'ensemble des vecteurs colinéaires à â. On le note
vect (Ü}. On a donc vect (û) = P,ulÀ E JR}. Une partie D de P est une droite vectorielle si
et seulement si il existe â E P \ {Ô}, tel que D = vect (Ü}.

Soit D une droite vectorielle de P. Il est immédiat que Vu E D \ { Ô}, D = vect ( Ü} : une
droite vectorielle est engendrée par n'importe lequel de ses éléments non nul. Une droite vecto-
rielle est stable par combinaison linéaire, c'est-à-dire que toute combinaison linéaire de vecteurs
de D est un vecteur de D. En effet, il existe un vecteur non nul Ü tel que D = vect (û}; il
est clair que toute combinaison linéaire de vecteurs colinéaires à Ü reste colinéaire à ü, d'où
le résultat. D'un point de vue intuitif, une droite vectorielle est un objet de dimension un;
d'une manière générale, on appelera espaces vectoriels de dimension un les droites vectorielles.
10

Anticipons un peu le mouvement du cours. Les droites vectorielles nous serviront à diriger
UJ
V
les droites affines (ie des droites en tant qu'ensemble de points du plan 9). Ce qui se cache
gJ derrière la notion de droite vectorielle est donc l'idée de direction.
CO
...:

1
V

I.5. Vecteurs et nombres complexes

3û ----, w(4+3il
Rappelons que le choix d'une base orthonormée
directe !?li = (û, v) du plan vectoriel P per-
met de définir l'affixe d'un vecteur. Soit w un

û :
Z:
:

v
___________
1
1

j
4v
vecteur de coordonnées (x, 1Jl.sW dans la base !?li.
L'affixe z de w dans !?li (on dit aussi « relati-
vement à !?li » ) est définie par z = x + i1J.
On écrira de manière condensée w(z) la pro-
position « w est d'affixe z » , voir la figure ci-
FIGURE 1.3. Affixe d'un vecteur contre.

:ProposfJ:ibn l.7~ {ltfglê de gi:lêtd); -• f>oùr tou~ vêcteuts <tt, <ii ·dla~ês a:1 , a'.2 et tt?-«S
réels À, µjl'o,ffixe du vecteur Ànt +µiij èst À.0..1 + µttz. - -

PREUVE. Soient (xi, 1Ji ).sW et (x2, 1J2).sW les coordonnées des vecteurs ai et ai dans la base !?li.
Puisque les coordonnées du vecteur Àaj + µai dans cette même base sont (Àx 1 + µ1) 1, Àx 2 +
µfü).@, son affixe est égale à ÀX1 + µ1)1 + i(ÀX2 + µfü) = Àa, + µaz. ■

Le plan vectoriel P est muni d'une base


orthonormée directe !?li = (û, v). Soit a â(a)
un vecteur non nul de P d'affixe a. Notons
0 = (ü, a). Par définition des fonctions cosi-
nus et sinus, les coordonnées de a dans !?li sont
(i!"cill cos(0), Weill sin(0)).sW. Ainsi V~·······
û
a= llâll( cos(0) + isin(0)) = llâllei8. FIGURE 1.4. Interprétation
géométrique du module et de
On en déduit la proposition suivante. l'argument d'un vecteur

Piôpôsitronl.8,{Co ~po~(t'ttn veetêur).·te pla,i tlèt;t~rlf!lP est·rtruni


d'une flà§e -prthon~ dtrècte ~ ::c Jü; "iD. Soit li'_ t.m vëeteur rtôn ·nul· d'ajjj:r;è à âans fil.
On a al1>rslàl= liât! et{û, â} =a:rg{a}[2'1t"J. - - -
11

Il. PRODUIT SCALAIRE ET DÉTERMINANT

Dans ce paragraphe, nous présentons deux outils fondamentaux de la géométrie que nous
généraliserons dans la suite à des espaces vectoriels de dimension quelconque.

11.1. Le produit scalaire sur P


Définition 1.9. (Produit scalaire sur P). Soient Ü et v
deux vecteurs de P. Si Ü = Ô
ou v = Ô, on pose Ü • v = O. Dans les autres cas, on pose Ü · v = llûllllvll cos(û, v).

,....;
L'expression « Ü • v » se lit « u scalaire v » ou encore « produit scalaire de Ü par v » . De
.d
la définition donnée ci-dessus de l'orthogonalité, on déduit immédiatement la caratérisation ü
des vecteurs orthogonaux à l'aide du produit scalaire.

Prop0$if;i<îh J:.1J). (Qrtht>i<>illilitê èfpt-Odùit. ~aire): Soient û :et V. dêux vecteurs


de P. •rr. v ;:; ;
osi et seulement si ûJ,. v~ .
Prop.~~~J-1..bfQ~~.~l§.9~,.$~~~~. ort~9!}91'Jn~)'. . ·• r .~~!:.lr+~tii~d'!é1t.f111,~t
ortlwnorml!:- ~; ftJient ïi et V dewrvect~v/rs du plan de coorclonndes œ~pectives [-x, 1 y )a et
{x',y'}ai ~titfJ:ns 'fi +iti·
x ~t v ""' x' :t ly': •lf,s• p;Jfius•.tl.e û ·. et•V. rnlativeimtnt. à. dl,. On·. à
tJlomltis~iJks,iu,~r,,tes ·it ·~ v =!fté{ttvf'...:,- xx'.+ yy'; ·

PREUVE. Notons ~ = (a, b). Écrivons u et v sous forme trigonométrique : u = luleie


et v = lvlei<p_ D'après la proposition 1.8, on peut choisir 0 = (a, Ü) et cp = (a, v). On a
donc UV= lullvlei(<p-B)_ Or <p - 0 = (a, v) - (a, û) = (Ü, a)+ (a, v)[ln], et , d'après la
relation de Chasles, cp - 0 = (û, v)[2n]. On a donc en particulier cos(û, v) = cos( cp - 0).
Puisque!Re(uv) = lullvlcos(cp-0), on a!Jte(uv) = llûllllvlicos(û,v) = u- v. Comme
uv = xx' + yy' + i(xy' - x'y), on a aussi ü • v = 9te(uv) = xx' + yy'. ■

~~:~.~~,'f(~~~:~,~~~t~)··•····•·~·. :
:~~ "Y";t'" €,Î~,;~~ . . •.·l%*t'iz·:'#.à(~t..m,tr;,?i.r.;;~:i;
s) ~if~, "~J)fp,:•·tt~, • ü.~~··ll~ll~.•?•o:;
4) ·,XJ;:.fiè~·y~,f: .faurw/4.v~;~rti.',,.~~ J tr '. ii ~ Jrü'U ,!1o~l;éfuîvalerice suivante
ü. û ± ô lii étsêulêmèntsî û:,:: ô. . ..···. ·... · . .. . ' . .
PREUVE. Notons u, v et w les affixes relativement à ~ des vecteurs u, v et w. 1) Soit
µ E R On a Ü · (v + µw) = 9te(u(v + µw)) = 9te(uv + µuw) = 9te(uv) + µ9te(uw) par
R-linéarité de la partie réelle, µ étant un réel. On a donc ü • (v + µw) = ü • v + µ ü •w. La
deuxième partie du 1) découle de la première et de 2) qui est immédiat car Ü • v = !Re (uv) =
!Re(uv) = !Re(uv) = 9te(vu) = v · ü. 3) ü · ü = !Re(uu) = 9te(lul ) = lul 2 = llûll2 > O.
2

4) D'après le calcul précédent, ü • ü = lluii2 = 0 si et seulement si ü = O. ■

Remarque. Les propriétés 2) à 4) peuvent également être démontrées à partir de la défini-


tion ü. V= llullllvll cos(Ü, v). Le recours aux nombres complexes est par contre indispen-
sable pour le 1).
12
/'-
Ces règles de calcul permettent de développer (comme dans le cas de la multiplication des
rJJ
<!.)
nombres réels) le produit scalaire de deux combinaisons linéaires de vecteurs du plan. Par
~ exemple, pour tous vecteurs du plan P Ü et v,
C!l
...;
<!.)

=e 11rr + v11 2 = (ü + v). rrr + v) = rr. (ü + vl + v. rrr + vl


8: = U· ü+ü- V+ V· ü+ V· V= llûll +2ü- V+ llvll 2 - 2

Cette formule est à connaître par cœur.

Identités remarquables
Pour tous vecteurs Ü et v,

et
11rrll2- llvll 2 = (ü + vl. (ü- vJ.

On déduit de ce calcul élémentaire que l'annulation de Il ü + vll 2 - Il ûll 2 - Il vll2 caractérise


l'orthogonalité de Ü et v; ce résultat est connu sous le nom de « théorème de Pythagore» .

.J)~opositfun 1.1ai('t'h~ ~·.J>ythag~)f


~-,,- _ _ _ -, - ,, _, f-, --,,-<_-- ,_-~Qfj.7'.t~-~~té~~§
~f_, - '-', ',
:-,_ '_,
î[.~fll':;4'Ùi•~-i
~_,- '-•'-,-,
',i1,--,-J----, ,,,,-
--- '-"'
>,. ' ' - _- o"--7"' '-<:'\ "--~,••-J

·. '\J.EV;sfli~J~t~ ·u1t t~w~·~j_< .. lf~~Stif >


'-;;,_-,,,~-".'lc' 0 >,<s,' i

1
.
Le produit scalaire de deux vecteurs est un nombre réel dont la valeur absolue est majorée
par le produit des normes des vecteurs.

PREUVE. L'inégalité est immédiate lorsque Ü ou v est nul. Dans le cas contraire, on a
Jt·1i;.
11 11
= cos(û, v) E [ -1, ll, d'où le résultat. Le cas d'égalité est clairement équivalent à
Ü = Ô ou v = Ô ou Ü et v non nuls et Icos(Ü, v)[ = 1 ie (Ü, v) = 0 ou n. On a donc
égalité si et seulement si Ü et v sont colinéaires. ■

IYmt,~tti',)ut,J'&. tln"~ll~é ~i-1~aîr~);··· Pour'tôiii ~ec~&q.rs: w~~·y;· <Ylli.


Jtü"+:{rft~flüff\tt!YU·;.···• ! Ci.

PREUVE. Nous donnerons deux preuves de ce résulat. 1) Choisissons une base orthonormée
directe !JlJ de Pet notons u et v les affixes respectives de Ü et v relativement à !Jl/. On a alors
û + v = (u+v), llû + vll = [u+vl, llûll = [u[ et llvll = [vl, l'inégalité triangulaire pour les
vecteurs est donc une simple conséquence de l'inégalité triangulaire sur (C vérifiée paru et v :
[u+v[:,;; lui+ [v[.
l
13

i
:s
Cl)

,Cl)

FIGURE 1.5. L'inégalité triangulaire §


,Cl)
'O{J
Cl)

2) Puisque les deux membres sont positifs, l'inégalité triangulaire est équivalente à 11 u+ vll 2 :( "Cl
2
(llull + llvlll2, c'est-à-dire llull2 + 2u · v + llvll2:,;; llull + 2llullllvll + llvll2, ou encore [
u · v :( Il ull Il vil qui est acquise puisqu'il s'agit de l'inégalité de Cauchy-Schwarz. ■ §
,....;

Test 1.1. Test 1.2. 6


Soient û et v deux vecteurs. Etablir que Soient û et v deux vecteurs. Développer

rr. v = 1 rr + vll2 -
[Il Il rr - vll2].

Il.2. Déterminant de deux vecteurs


Définition 1.16. (Déterminant de deux vecteurs de P). Soient et u v
deux vecteurs
du plan P. Si u = 0 ou v = 0, on pose Det(u, v) = O. Dans tous les autres cas, on pose
Det (u, vl = llullllvll sin(u, vJ.
Le déterminant s'interprète géométriquement comme une aire algébrique.

Déterminant et aire algébrique


Soient deux vecteurs non colinéaires u et v. On considère un parallélogramme construit
à partir de ces deux vecteurs :

-u
Puisque la hauteur de ce parallélogramme vaut llvlll sin(u, v)I, son aire est égale à
llullllvlllsin(u, v)I = IDet(u, v)I. Plus précisément, Det(u, v) vaut l'aire du paral-
lélogramme lorsque (u, v) est une base directe, Det (u, v) vaut l'opposé de l'aire du
parallélogramme lorsque (u, v) est une base indirecte.

Le déterminant de deux vecteurs permet de caractériser la colinéarité.

Pr~ôl(l,1on.··i~J}i;Jc~î~i,ij.a~miinanf)~,"tâ~.~~~Jfet:'î41Jiart.en~.~
p sont (1t}linéaîres•l¼Î•èi;J~tlÎ_émènt ~ Det(l'.t, V J =-0. •Sn pa1rt~'er, {i!1 v} est une base
de V ai.ètseulementéi ~t(û;v},6 o~ . .. . .
14

PREUVE. Supposons u et v colinéaires. Si l'un des deux vecteurs est nul, alors on a
Det (u, v) = O. Dans le cas contraire, il existe un nombre réel À tel que v = Àu. On a donc
(u, v) = 0 ou n selon le signe de À. Dans les deux cas, sin(u, v) = 0 et donc Det (u, v) = O.
.... Réciproquement, supposons Det (u, v) = O. Si l'un des deux vecteurs est nul, les vecteurs sont
colinéaires. Dans le cas contraire, puisque llullllvll /= 0, on a sin(u, v) = O. Ainsi (u, v) = 0
ou 7t : les vecteurs u et v sont donc colinéaires. ■

Comme le produit scalaire, le déterminant de deux vecteurs se calcule facilement à l'aide


des coordonnées dans une base orthonormée directe.

~ t l , ::JtJ:8/(ê~ëfils. d~s 'uhê 1>~tf&tfî~nirmêf])·r P" ~'~lmf{if:ii i.'~i


'!iÎ direif:te: $oiént ït et V tléû:tliect~wr,s du plan dt cooritrnnéetl ~if}~
{%, y)ieHx', y')~. N~tans u. = x+ v
i.y ,~tv :;,;; ~'+tyt les afJi;!res tk ït êt ~lâti~j, i,,
!Kt. diia alors
le8'.f,Jtmwes suivantes;: DetHt, v} =i'11t(iîvf=xy1.-,e1:1.· · ,. ;~,; :.,·,•.
PREUVE. Notons !JlJ = (ci, b). Ecrivons u et v sous forme trigonométrique : u = lulei0
et v = lvlei.q:,_ D'après la proposition 1.8, on peut choisir 0 = (ci, u) et cp = (ci, v). On a
donc UV= lullvlei.(q:,-B)_ Or cp - 0 = (ci, v) - (ci, u) = (u, ci)+ (ci, v)[2n], et' d'après la
relation de Chasles, cp - 0 = (u, v)[2n]. On a donc en particulier sin(u, v) = sin(cp - 0).
Puisque Jm(uv) = lullvl sin( cp - 0), on a Jm(uv) = llullllvll sin(u, v) = Det (u, v). Comme
UV= xx' + 1}1} 1 + i(xy' - x'y), on a aussi Det (u, v) = Jm(uv) = xy' - x'y. ■

Cette formule motive l'adoption de la notation de Cauchy des déterminants. Nous la


généraliserons dans le cours d'algèbre linéaire.

Définition 1.19. (Notation de Cauchy). Pour tous nombres complexes x, 1J, x' et y', on
pose
xx'I = X1J ,- X,1J.
1J y'
1

'efl)et{tr + µW,ü:):: Qêf Cvi


2) A~tîsymétrie rVît,
VE P,
PREUVE. Notons u, v et w les affixes relativement à !JlJ des vecteurs u, v et w. 1) Soit
µ E l!t On a Det(u, v +µw) = Jm(u(v+µw)) = Jm(uv+µuw) = Jm(uv)+µJm(u w) par
lR-linéarité de la partie imaginaire, µ étant un réel. On a donc Det (u, v +µw) = Det (u, v) +
µDet (u, w). La deuxième partie du 1) découle de la première et de 2) qui est immédiat car
Det (u, v) = Jm(uv) = -Jm( uv) = -Jm(uv) = -Jm(vu) = -Det (v, u). ■

Remarque. Comme dans le cas du produit scalaire, la propriété 2) peut être démontrée à
partir de la définition Det (u, v) = llullllvll sin(u, v). Le recours aux nombres complexes
est par contre indispensable pour le 1).
15

Les propriétés d'antisymétrie et de bilinéarité du déterminant "1nt à considérer comme des


règles de calcul ; elles permettent de développer par bilinéarité des déterminants de vecteurs
qui sont des combinaisons linéaires d'autres vecteurs.

EXEMPLE 1. 21. Soient û et v deux vecteurs de P. Posons ai = 3 û - v et ai = û + 4 v.


Calculons le déterminant Det (ai, ai) en fonction de Det (û, v).
► On a

Det (ai, ai)= Det (ai, û) + 4Det (ai, v)


= [3Det (û, û) - Det (v, û)] +4[3Det (û, v) - Det (v, v)]
....
= Det (û, v) + 12Det (û, v) = 13Det (û, v). ..d
ü

Le calcul entrepris dans l'exercice précédent est généralisable : il s'agit de trouver l'ex-
pression de Det (ai, ai) lorsque les vecteurs ai et ai sont déterminés par leurs coordonnées
(x 1, y 1).&iJ et (x 2, y 2)9J relativement à une base /!,6 = (û, v) quelconque. Puisque /!,6 n'est pas
nécessairement orthonormée, la formule Det (ai, ai) = XfY2-1J1X2 n'est a priori plus valable.
On a ai= x 1û + y 1v et ai= x2Ü + y 2v, d'où, par bilinéarité du déterminant,

Det (ai, ai)= Det (ai, x2Ü +1J2v) = x2Det (ai, û) +1J2Det (ai, v).
De même,

Det (ai, Ü) = Det (x1 Ü + 1}1 v, Ü) = X1 Det (û, Ü) + l/1 Det (v, Ü) = -y1 Det (û, v)
car Det (v, v) = 0 et Det (û, v) = -Det (v, û). En utilisant le même type d'arguments, on
aboutit sans peine à la l'égalité Det (ai, v) = x 1 Det (û, v) et donc

Det (ai, ail= (X11J2 - X21Jil Det (û, v) = 1 ~~ ~~ 1 Det (û, v).

~ = (û, v) étant une base, Det (û, v) =/- 0, l'annulation de Det (ai, ai) est donc équivalente
à celle de j. On en déduit la caratérisation suivante des bases du plan vectoriel P.
1 ~] ~;

Caractérisation des bases à l'aide du déterminant


Soient !!,6 = (û, v) une base quelconque de P, ai et ai de coordonnées respectives
(x,, l/1 lPB et (x2, l/2).Œ relativement à /!,6. Alors

-)
D et ( -a 1,a2 = 1 x, x21 Det (-u, -)
v , d'où
lJ 1 lJ2

(ai, ai) est une base de P si et seulement si Det (ai, ai) =/- 0, ie 1 ~~ ~~ 1 =/- O.

Test 1.3. Test 1.4.


Soient !1lJ une base de P, a E ffi'., ü(l - a, a).Œ Soient !1lJ une base orthonormée directe de P,
et v(2, -2).Œ. Déterminer les valeurs de a telles ü(7, -5).Œ et v(3, -1 ).Œ- Calculer l'aire du pa-
que (Ü, v) soit une base de P. rallélogramme formé par Ü et v.
11.3. Application aux changements de base
Le déterminant nous permet de caractériser les bases de P. Essayons maintenant de répondre
.....; à la question suivante. Etant données deux bases !JlJ = (Ü, v) et !Jll' = (ü', v'), comment
déterminer les coordonnées (x', y').'l<I dans !Jll' d'un vecteur dont on ne connaît les coordonnées
(x, y).'l<I que relativement à !JlJ? Autrement dit, comment trouver les formules de changement
de base ? Le déterminant va s'avérer un outil puissant pour résoudre le problème. On sait que
w = xü + yv = x'Ü' + y'v'. Ainsi, par bilinéarité du déterminant,
Det (w, ü') = Det (x'ü' + y'v', ü') = x' Det (û', ü') + y' Det (v', û'l = y' Det (v', û'l
et
Det (w, v'l = Det (x'ü' +y'v', v'l = x'Det (ü', v') +y'Det (v', v'l = x'Det (ü', v')
on a donc
, Det (w, v') , Det (w, û'l
x = Det (u', _V 'l et 1} u', v' l ·
= D et (-
Ces deux égalités s'appellent les formules de Cramer. Elles ne sont pas exigibles sous cette
forme mais il faut savoir les retrouver rapidement. Elles permettent de calculer les coordonnées
x
x' et y' en fonction de et y dès que l'on connaît les coordonnées des vecteurs de la nouvelle
base !Jll' dans l' ancienne base !Jll.

EXEMPLE 1.22. Soit !Jll0 = (Ü 0 , v 0 l une base du plan P. On note Ü = 2Ü 0 + 3v0 et


v = ü 0 + v 0 . Prouvons que la famille !JlJ = (Ü, vl est une base de P et déterminons les
coordonnées du vecteur w = 6ü0 + 3v0 dans la base !Jll.
► On a
Det (Ü, v) = 1 ~~ 1 Det (Ü 0 , v 0) = -Det (Ü 0 , v 0 )-/- O.

La famille (Ü, v) est donc une base de P. D'après ce qui précède, on sait qu'il existe deux
réels X et 1J tels que w = xü +yv. On a

Det (Ü, wl = Det (Ü, xü +yvl =y Det (Ü, vl,

et
Det (w, vl = Det (xü +yv, vl = xDet (Ü, v),
d'où

Det(w, vl 1 j ~ 1 Det (Üo, vol


x = Det (Ü, v) 2 11
Det (uo, v 0 l = 12.
13 1

Remarque. Cette méthode (et donc les formules énoncées ci-dessus) cachent en fait la
résolution d'un système linéaire. Illustrons ce propos à partir de l'exercice précédent. Puisque
!JlJ est une base, on sait qu'il existe deux réels x et y tels que
w = xü +yv = x(2ûo + 3vol +y(Üo +vol= (lx +y)ûo + (3x +y)v 0 •
Or, w = 6Ü 0 + 3v0 , et puisque la famille de vecteurs (ü 0 , v 0 l est une base de P, l'égalité
(2x+ylûo+(3x+y)vo = 6Üo+3vo est équivalente au système linéaire lx+ y= 6, 3x+y = 3.
On retrouve alors sans peine les valeurs x = -3 et y = 12.
17

Formules de changement de base


Soient deux bases !!iJ = (û, v) et !!lJ' = (û', v'). On note (x,-y).%' et (x',-y').%' les
coordonnées d'un vecteur w dans les bases !!iJ et !!lJ'. On dispose de deux méthodes de
changement de base.
◊ Avec le déterminant, on retrouve les formules de Cramer.

On exploite la bilinéarité et l'antisymétrie du déterminant :

Det (w, û') = Det (x'û' +-y'v', ü') = -y' Det (v', û')
....;
et ..d
ü
Det (w, v') = Det (x'û' +-y'v', v') = x'Det (û', v')
on a donc
, Det(w, v') , Det (û',w)
X=----- et -y = --~~-.
Det (u', v ') Det (u', v ')
o En identifiant des coordonnées, on se ramène à un système linéaire.

On part de l'égalité w = x'û' +-y'v', puis on exprime û' et v' en fonction de û et v, ce


qui permet d'exprimer le vecteur w dans la base !!iJ. Puisque l'on a aussi w = xû +y v,
on peut identifier les coordonnées précédentes avec x et -y, ce qui donne un système
linéaire d'inconnues x' et -y' permettant de les calculer.

Un cas particulier à connaître est celui où


les deux bases !!iJ et !!lJ' sont orthonormées et v
directes. Nous démontrerons dans le cours d'al-
gèbre euclidienne que la base !!lJ' s'obtient à par-
tir de !!iJ par une simple rotation8 . Notons 0
l'angle de cette rotation, de sorte que
ü' = cos(0)Ü + sin(0)v û

et 1.6. Changement de base


FIGURE
v' = -sin(0)Ü + cos(0)v. orthonormée
Mettons en œuvre les deux méthodes précédentes de changement de base. On reprend les
notations définies dans l'encadré ci-dessus.

o Application des formules de Cramer.

Puisque !!iJ est orthonormée, on a Det (û', v') = 1 ~~:/:l --;,:~~~~) 1 = cos2 (0) + sin2 (0) = 1
et

et

Ce résultat peut être considéré comme une évidence géométrique.


18

◊ Résolution d'un système linéaire. i


~
rJJ
Cil On a
CO
...; x'û' +-y'v' = x'(cos(0)û + sin(0)v) +-y'(-sin(0)û + cos(0)v)
= (cos(0)x' - sin(0)-y')û + (sin(0)x' + cos(0)-y')v = xû +-yv
et après identification des coordonnées dans la base !16, on aboutit au système suivant :
cos(0)x' - sin(0)-y' = x
{ sin(0)x' + cos(0)-y' =1:J.
On obtient d'abord x' = cos(0)x + sin(0)-y en écrivant l'équation cos(0)l1 + sin(0)l2 puis
-y' = -sin(0)x + cos(0)-y par - sin(0)l 1 + cos(0)l 2. Ceci n'est pas a priori un raisonnement
par équivalence (car il ne s'agit pas à proprement parler d'une technique de pivot); cependant,
il n'y a aucune réciproque à vérifier car on sait que le système admet une unique solution, ce
ne peut donc être que celle trouvée par implication.

Test 1.5. Test 1.6.


On fait tourner une base orthonormée directe On fait tourner une base orthonormée directe
/Ja de l Écrire les formules de changement de /Ja d'un angle 0, on note /Jas la nouvelle base.
base. Soit a E P. Exprimer l'affixe z' de a dans /Jas
en fonction de l'affixe z dans /Ja. Retrouver les
formules de changement de base.

III. LES ANGLES ET LEURS MESURES

La notion d'angle est délicate à définir précisément. Elle fut pourtant au


cœur des premiers développements de la géométrie- à l'époque baby-
lonienne - principalement en raison de son utilisation lors des calculs en
astronomie. Il ne faut pas confondre un angle avec la donnée d'une de
ses mesures, car interviendrait alors le choix (arbitraire) d'une unité, et le
fait qu'un angle admet une infinité de mesures. La définition d'un angle
donnée par Euclide dans ses Éléments comme « inclinaison mutuelle de FIGURE 1.7.
deux droites n'ayant pas la même direction» reflète bien la difficulté sou- Couples de
levée. L'angle délimité par deux droites ne dépend des deux droites qu'au demi-droites
travers de leur position relative; en effet, en déplaçant de manière rigide différents,
mais de
la figure dessinée par les deux droites, on obtient le même angle alors
même angle
que les droites ne sont plus les mêmes : on tourne en rond. Les notions
algébriques modernes qui permettent de sortir de ce cercle vicieux sont
les relations d'équivalence et la structure de groupe. En guise de première
approche, nous ne tenterons pas dans les pages qui suivent de définir ce
qu'est un angle au sens moderne, mais concentrerons nos efforts sur les
mesures d'angle, plus importantes dans les applications.

IIl.1. Définition des mesures d'angles orientés


Le plan f!lJ est muni d'un repère orthonormé direct d'origine O. "ef' désigne dans tout le chapitre
le cercle de centre O et de rayon une unité de longueur. Il existe une infinité de chemins tracés
19

sur C#J' de M à N dans le sens trigonométrique 9 : le plus court èpnsiste à parcourir le cercle
de M à N dans le sens positif, nous le noterons MN+; tous les autres chemins dans le sens
direct de M à N diffèrent alors de MN+ d'un nombre entier de tours de cercle dans le sens
trigonométrique (voir figure 1.8).

N N
M M

0 0
,....;
..c::i
ü
-+ L'arc MN-
L'arc MN

FIGURE 1.8. Longueur algébrique d'un arc de cercle orienté

De même, il existe une infinité de chemins tracés sur le cercle C#J' de M à N dans le sens
indirect, le plus court consistant à parcourir le cercle de M à N dans le sens négatif, nous le
noterons MN - ; tous les autres chemins dans le sens indirect de M à N diffèrent alors de MN -
d'un nombre entier de tours de cercle dans le sens trigonométrique inverse.
On définit alors la longueur algébrique d'un chemin tracé sur le cercle de M à N : si ce
chemin est dans le sens direct, sa longueur algébrique est égale à sa longueur; si ce chemin est
dans le sens indirect, sa longueur algébrique est égale à l'opposé de sa longueur.

Définition 1.23. (Mesure d'un angle orienté). Soit C#J' le cercle de centre O et de rayon
1. Soient u et v deux vecteurs du plan non nuls et U, V les points du cercle C#J' définis par
=
6ü u/llilll et av= v/llvll- On appelle mesure de l'angle orienté des vecteurs u et V
la longueur algébrique de tout chemin de U à V tracé sur le cercle C#J' ( voir figure 1. 9).

FIGURE 1.9. Définition des mesures d'angles

Définition 1.24. (Le nombre n). Le nombre 7t désigne le demi-périmètre d'un cercle de
myon 1.

9
C'est-à-dire dans le sens opposé des aiguilles d'une montre.
20
)

C'est le savant anglais W. Jones qui a introduit cette notation en 1706, la lettre 7t étant
rn
Il)
l'abréviation du mot periphery. Les mathématiciens, d'Archimède à cewc de l'ère informatique,
~ n'auront de cesse de calculer 7t avec une précision croissante. Euler obtint, par des méthodes
a:l
....;
que nous détaillerons dans le cours de L2
n r::::; 3 , l 4 l 592653589793238462643383279502884 l 97169399375105820
97494459230781640628620899862803482534211706798214808651
32823066470938446
Il découle de la définition précédente qu'un angle orienté de dewc vecteurs admet une
infinité de mesures. Parmi les dewc chemins uv+ et uv-, il en existe un plus court dont
la longueur (non algébrique) est nécessairement inférieure à la longueur d'un demi-tour, qui
vaut 7t. Si cette longueur est strictement inférieure à 7t, on choisit de noter (Ü, v) la longueur
(algébrique cette fois-ci) de ce chemin. Si les chemins ont même longueur 7t, on pose (Ü, v) =
7t. Soit maintenant Ü un vecteur non nul du plan. Étudions par exemple l'angle orienté des
vecteurs ü et Ü. Dans ce cas U = V et donc (ü, Ü) = O. Les autres mesures de cet angle
orienté sont donc toutes les longueurs algébriques des chemins tracés sur les cercle de U à U
dans le sens positif ou négatif; puisque qu'un tour de cercle est de longueur 2 7t, il s'agit des
nombres réels 2nk, k E Z. Insistons sur le fait que ces nombres ont en commun de mesurer le
même angle mais ne sont pas égawc (le nombre réel 2 7t est différent du réel 0) : il ne faudra
pas confondre les notions d'angle et de mesures d'angle.

Le cercle trigonométrique

On note !Ji: = (0, ü, v) un repère orthonormé direct du plan et'(/ le cercle de centre
0 et de rayon l'unité, appelé cercle trigonométrique du repère !Ji:. A désigne le point du
cercle trigonométrique de coordonnées (1, 0) dans le repère !Ji:. Rappelons que l'équation
cartésienne de !Ji: est x 2 +-y 2 = 1, c'est-à-dire qu'un point M(x,-y) appartient à'(/ si et
seulement si x 2 + -y 2 = 1. Ce cercle permet d'obtenir une représentation géométrique
commode des mesures d'angles.

Le cercle trigonométrique

Soit 0 E JR. On lui associe un unique point de '(/ noté Me de la manière suivante : Me
est l'extrémité de l'unique chemin d'origine A tracé sur le cercle trigonométrique de
longueur algébrique 0.
)

21

Test 1.7. Test 1.8.


On parcourt 5 demi-tours dans le sens direct, 6 Placer sur le cercle trigonométrique les points §
quarts de tour dans le sens indirect puis 7 tiers Me pour -a
de tour dans le sens direct sur le cercle trigono- Il)

métrique. Quelle est la longueur parcourue ? E


,11)

§
,11)
'Oil
Il)
"O
;:l
Il)
o.
III.2. La notion de congruence §
....;
Commençons par rappeler une notation utile. .d
ü

La notation a + b.Z
Pour tous nombres réels a et b, on note a+ bZ l'ensemble des nombres réels de la forme
a + kb, où k E Z. Autrement dit

a+ bZ = {a+ kb I k E Z}.

L·ensemble des multiples entiers de 7t sera donc noté nZ, celui des multiples entiers de
2rr, 2rrZ, etc.

Pour des raisons de commodité, nous utiliserons cette notion de congruence dans l'ensemble
de ce chapitre. Elle permet de calculer des sommes de mesures d'angles à partir de règles
simples telles que la relation de Chasles.

Définition 1.26. (La notion de congruence). Soient a, b, cp trois réels. L'écriture

a= b [cp]

81gnifie qu'il existe k E Z tel que a = b + kcp et se lit « a est congru à b modulo cp ». Les
riels a et b diffèrent donc d'un multiple entier de cp, soit a - b E cpZ.

:\"ous pouvons donc reformuler la proposition 1.25 de la sorte: 8 est une mesure de l'angle
orienté des vecteurs û et v (non nuls) si et seulement si 8 = (û, v)[2rr].

EXEMPLE 1.27. Déterminons l'unique nombre réel ex appartenant à [0,2rr[ et congru à


-irr modulo 2rr.
► On remarque que -irr + 2rr = ~7t E (0, 2rr[ et ainsi <X= ~7t.

Les règles de calcul sur les congruences, exposées dans la proposition suivante, sont à
connaître parfaitement.
22

rJl
PREUVE. On suppose que a = b [cp] et a' = b' [cp]. Alors il existe (k, l) E Z 2 tels que
11)
a= b + kcpet a'= b' + lep , ainsi a+ a'= b + b' + (k + l)cp et donc a+ a'= b + b' [cp].
!..... De même, Àa = ;\b + k;\cp et ainsi Àa = ;\b [Àcp]. La réciproque découle de l'implication
précédente appliquée à 1/;\. ■

Le lecteur devra savoir passer de l'équation 70 = n/2 [n] à l'équation 0 = n/14 [n/7] qui
lui est équivalente, et cela sans la moindre hésitation. Ces équations, dites de congruence, sont
à manipuler avec précaution: il ne faut pas confondre les symboles = et =. Rappelons encore
une fois que 2n # 0 mais 2n = 0 [n].

Test 1.9. Test 1.10.


Est-il vrai en général que Démêler le nécessaire et le suffisant entre les
trois propositions suivantes :
a= b [<p] =} a
2
= b2 [<p] ?
a= b [n]; a= b [2n] et a= b [n/2].

Les réels a# 0, b et cp étant donnés, étudions plus généralement la résolution dans lR de


l'équation ax+ b = 0 [cp]. D'après les propriétés du symbole= énumérées dans la proposition
précédente, cette équation est équivalente à ax = -b [cp], puis finalement à x = -b/a [cp/a].
On en déduit que l'ensemble des solutions est

b cp
Y'= { - b/a + kcp/a , k E Z} = -- + -Z.
a a

Grâce au cercle trigonométrique et à l'application 0 H Me, on peut représenter géométri-


quement Y', c'est-à-dire dessiner sur le cercle l'ensemble des points Me pour 0 décrivant
l'ensemble des solutions Y'.

EXEMPLE 1.29. Résolvons par exemple se+ n/2 = 0 [n].


► Cette équation est équivalente à se = -n/2 [n], et finalement à 0 = -n/1O [n/S].
Puisque 10 x n/S = 2n, la représentation géométrique de l'ensemble des solutions est ré-
duite à 10 points: M-n/10, M-n/lO+n/5, M-n/10+2n/5, M-n/10+3n/5, M-n/10+4n/5, M-n/10+5n/5,
M-n/10+67I/5, M-n/10+7n/5, M-n/10+8n/5, M-n/10+9n/5, soit, après simplification, M-n/10,
Mn/10, M3n/10, Mn/2, M1n/10, M9n/10, Mnn/10, M13n/10, M3n/2, Mlln/10· Nous sommes sim-
plement partis de la solution particulière -n/1O en ajoutant à chaque pas n/S jusqu'à décrire
un tour de cercle complet, ce qui nécessite exactement 10 étapes car 10 x n/S = 2n.
23

Résolution d'une équation de congruence


On peut employer trois langages différents pour représenter l'ensemble des solutions
d'une équation de congruence.

LA DONNÉE DE UNE ÉCRITURE UNE


L'ÉQUATION DE CONDENSÉE DE REPRÉSENTATION
CONGRUENCE L'ENSEMBLE DES GÉOMÉTRIQUE SUR LE
« RÉSOLUE » SOLUTIONS Y CERCLE
TRIGONOMÉTRIQUE

....;
..d
ü

Appliquons sans plus tarder ces conventions.

EXEMPLE 1.30. Résolvons l'équation 20 = 7t [2n/3].


► Elle est équivalente à 0 = n/2 [n/3]. Puisque 6n/3 = 2n, la représentation géométrique
de l'ensemble des solutions est composé de six points :

Remarque. Nous avons choisi ici une représentation géométrique sur le cercle. L'équation
<< résolue» est 0 =
1 [1]
et l'ensemble des solutions s'écrit Y = + z. 1 1
Test 1.11. Test 1.12.
Résoudre 20 + n = 0 [n] géométriquement. Déterminer l'ensemble Y des solutions de
-20 + n = n [n/3].

111.3. Propriétés des mesures d'angles orientés


La proposition suivante prouve que (Ü, v) + (v, w) est une mesure de l'angle orienté des
vecteurs Ü et w. Puisque cette somme n'appartient pas nécessairement à l'intervalle] -7t, n],
elle n'est pas toujours égale à la mesure principale (Ü, w), c'est donc bien le symbole = qu'il
faut utiliser.
24

rJ)
<l)

~
O'.l
....;

Rappelons les relations bien connues suivantes, qu'un simple schéma permet d'ailleurs de
retrouver en cas d'oubli.

iP-r9~psiJ~".ff~~L{~r-OPfiêt'és··~ ni~ÜF«èi d'~~s iirfènêês)i~~"îv'fet V deu:i


vecte1.Ût$Yoofi:n't.tlsiitj1j~'. O'nr a nJ,ms . . .

III.4. Définition des angles géométriques


Définition 1.33. (Angle géométrique de deux vecteurs non nuls). Soit 'fi le cercle
de centre O et de rayon 1. Soient Ü et v deux vecteurs du plan non nuls et U, V les points
du cercle 'fi définis par OU= û/llûll et OV = v/llvll- On appelle angle géométrique des
vecteurs Ü et v la plus petite des longueurs (non algébriques) des arcs de cercle uv+ et uv-.
On le note (TI,V).

L'angle géométrique de deux vecteurs non nuls appartient toujours à l'intervalle [O, n] et ne
dépend pas de l'ordre des vecteurs. Il s'agit donc d'une notion de mesure d'angle non-orienté.
On a bien sûr l'égalité (if,~-) = ±(Ü, v).

Définition 1.34. (Angles nul, plat et droit). L'angle géométrique de deux vecteurs Ü et
v non nuls est dit nul lorsque ~= 0, plat lorsque (Dl= n et droit lorsque (iI,VJ= n/2.

On retiendra deux configurations angulaires particulièrement importantes en géométrie.

Définition 1.35. (Différentes configurations angulaires). Soient <X et 13 deux angles


géométriques, c'est-à-dire deux réels appartenant à l'intervalle [O, n]. Les angles <X et 13
sont dits supplémentaires lorsque <X + 13 = n, et complémentaires lorsque <X + 13 = ~
(voir la figure 1.10).

/3
<X

Angles supplémentaires Angles complémentaires

FIGURE 1.10. Configurations angulaires


25

Angles alternes-internes
Rappelons un peu de vocabulaire concernant les droites sécantes. Soient ~,, ~ 2 et ~ 3
trois droites non-concourantes et non-parallèles du plan. Quitte à permuter les indices,
on peut supposer que ~ 3 intersecte les autres droites en deux points distincts, définissant
ainsi quatre angles géométriques décrits dans la figure ci-dessous.

,...;
6
\\ ,;

Les couples d'angles ex, ô et /3, y sont dits alternes-internes. Les droites ~, et ~ 2 sont
parallèles si et seulement si les angles alternes-internes ex, ô sont égaux ou si et seulement
si les angles alternes-internes /3, y sont égaux.

~ous pouvons maintenant introduire la notation usuelle des angles géométriques d'un
triangle ABC.

Définition 1.36. (Notation des angles). Soient A, B et C trois points distincts du plan.
L ·angle géométrique des vecteurs AB et AC est noté Â, BAC ou CAB (voir la figure 1.11.1).

C C

A
L La notation Â
B A B

Preuve de  + B + ê = n

FIGURE 1.11. Angles géométriques

Venons-en à une célèbre propriété : la somme des angles géométriques d'un triangle est
égale à 7t. En guise d'esquisse de preuve, la figure 1.11 de droite rappellera au lecteur que la dé-
monstration de cette égalité repose sur la propriété énoncée précédemment sur le parallélisme
H les angles alternes-internes.

On déduit sans peine de cette proposition que, si ABC est un triangle rectangle en B, les
de~ angles géométriques  et ê appartiennent à l'intervalle ]O, 1t/2[. De plus, les angles Â
et C sont complémentaires.
26

Test 1.13. Test 1.14.


UJ
4)
UJ
Que dire de la somme des angles au sommet Proposer une généralisation à un polygone
ro d'un quadrilatère convexe ? d'un pentagone convexe à n côtés.
IIl
....; convexe ? d'un hexagone convexe ?

IIl.5. Périmètres et aires


On admettra ici, comme le firent les géomètres de l' Antiquité, l'évidence géométrique suivante :
lorsque n tend vers l'infini, l'aire et le périmètre d'un polygône régulier à n côtés inscrit dans un
cercle tendent respectivement vers l'aire et le périmètre du cercle - c'est d'ailleurs le principe
des approximations de 7t obtenues par Archimède. Il est important de souligner qu'une telle
évidence ne peut en aucun cas jouer le rôle de preuve, au sens où nous l'entendons désormais.

"Pfo}i~iîtin tY.38/tp~iàlèt~>d'¼Îif~lê)2 Cè-pétim,êtré !B ,1J'wn éerelff ~e rû,gon r es'


d,rYhifl4par(i4jor111,'I/Jê~ ;..1:rtt, .
PREUVE. Un cercle de rayon Tétant l'image par une homothétie de rapport T du cercle unité,
une simple règle de trois permet de conclure. ■

On généralise ce résultat à un arc de cercle quelconque, formule souvent utile en mécanique


du point, du solide et en sciences industrielles (et parfois en mathématiques).

Pt~#\()»; t.3fi."(:tp~~··d~~.~•Jle è~cfe). Là 1aiigu~ d'11R âre ;de •CfJ'relë tie


r&1Jô'fl, r~,ef l'<ttz~~& efq",lnf!l~•~nné~:par lttfi>mùlel'O~•• :•

FIGURE 1.12. Un secteur angulaire d'ouverture 0

PREUVE. On utilise la même homothétie que dans la preuve précédente. ■

La version suivante de la preuve établissant la célèbre formule d = nr2 de l'aire d'un disque
est due à Johannes Kepler. Cette formule fut établie pour la première fois par Archimède à
l'aide de polygônes réguliers.

PREUVE. Soient "&' un cercle de rayon T et n ;;;, 1.


◊ Soit 9n un polygône régulier à n côtés inscrit dans le cercle"&'.
◊ On note Pn son périmètre et Un son aire. Nous utiliserons le fait que les suites Un et Pn
tendent respectivement vers d et .:E = 2nr lorsque n tend vers l'infini (ce qui nécessite une
vraie preuve).
◊ On note hn la hauteur commune des n triangles formant les «secteurs» de 9n. L'aire de
la surface délimitée par 9n est la même que celle d'une frise de triangles superposables de
base Pn/n et de hauteur fln. Notons [AB] la base d'une telle frise.
27

Il)

A=B
]
o.
....-~
•Il)
a
0
•Il)
L'aire de !Yn 'oJJ
Il)
'O

~
o.
B
A B A

La frise associée Un triangle de même aire que la frise
,...;
..d
FIGURE 1.13. La démonstration de Kepler illustrée ü

o Cette dernière a la même aire que le triangle obtenu en translatant à hauteur constante les
n sommets à la verticale du point A. La longueur h-n tend vers r lorsque n tend vers l'infini.
Puisque l'aire de ce triangle vaut -½ x Pn x h-n, on obtient par passage à la limite que l'aire d
du disque vaut -½ x 2nr x r = nr 2 . ■

Rappelons la généralisation de ce calcul à l'aire d'un secteur angulaire d'ouverture 0.

Propœ~~ ~.l:C(!i~ dt•~~~ur dë di!KfUe}•. t 'Itiro d'un s~teur de dîsq!O,e de


myon {,~t; tf!Qtt~#Jf,E l(),~[~~t,,dr,~née par }6r',

PREUVE. La démonstration exposée ci-dessus peut être reprise point par point en partant
d"un secteur de disque au lieu du disque tout entier. On peut aussi invoquer la proportionnalité
de l'aire d'un secteur et de son ouverture angulaire 0, le résultat découle dans ce cas d'une
simple règle de trois. ■

Test 1.15. Test 1.16.


En inscrivant le cercle trigonométrique Cef/ dans Soient Cef/ le cercle circonscrit à un triangle ABC
un carré puis un carré dans le cercle Cef/, justifier et d son diamètre. Établir que
que 2 < 7t < 4.
a+b+c
d?----
7t
Chapitre 2
GUIDE D'ANALYSE RÉELLE

' IDÉE de fonction a été forgée progressivement par les mathématiciens; outil indis-

L pensable en géométrie depuis Descartes, les fonctions réelles 1J = f(x) de la variable


réelle x devinrent indispensables pour l'étude des courbes et les calculs mécaniques
et astronomiques. Le mot functio fut employé par Leibniz et l'écriture 1J = f(x) par Euler.
L'analyse réelle - qui est l'étude des fonctions de la variable réelle à valeurs réelles - est
née de considérations essentiellement géométriques. Cependant, les mathématiciens se sont
progressivement aperçus que tout fondement géométrique de la notion de limite (qui est au
cœur de l'analyse réelle) resterait incomplet tant que la notion de nombre réel ne serait pas
correctement définie. Ce fut le point de départ d'une grande refonte de l'analyse entreprise par
des mathématiciens comme Cauchy, Weierstrass ou encore Bolzano. Ce chapitre de rappels a
pour objectif de redonner un sens géométrique intuitif à certaines notions bien connues telles
que la dérivée d'une fonction, la bijectivité, l'intégrale d'une fonction continue entre deux
bornes a et b, etc. Ces notions seront reprises sous l'angle de l'analyse moderne dans la partie
analyse de ce livre.

I. FONCTIONS ET GRAPHES

I.1. Qu'est-ce qu'une fonction ?


Le lecteur a certainement l'habitude de définir les fonctions par la donnée d'une formule telle
que pour x appartenant à un certain ensemble '!J, on note f(x) = ... Cette définition a été
généralisée par le mathématicien norvégien Niels-Henrik Abel : une fonction de l'ensemble
A C lR à valeurs dans l'ensemble B C lR est la donnée pour chaque élément x de A d'un
unique élément 1J de B appelé image de x. Dans la pratique, afin de différencier une fonction
d'une autre, on lui assigne un nom ou une lettre telle que f, g, etc.; on note alors 1J = f(x)
l'image de x par la fonction f.
Définition 2.1. Une fonction f est définie par la donnée de trois objets : un ensemble de
départ A, un ensemble d'arrivée B et, pour tout x E A, la donnée d'une (unique) image notée
f(x).
Il faudra être particulièrement rigoureux : les fonctions f : lR -, JR, x H sin(x)
et g : lR+ -, JR, x H sin(x) ne sont pas les mêmes car leurs ensembles de départ sont
différents. Autrement dit, on ne confondra pas une fonction et la donnée d'une formule .

. \tt('llti()ll L'ensemble d'arrivée d'une fonction


Dire que l'ensemble d'arrivée d'une fonction f est B ne signifie pas que f prend toutes
les valeurs contenues dans B. Cela signifie simplement qu'elle est à valeurs dans B. Par
exemple, les fonctions suivantes sont correctement définies :

f: lR-, JR, x H sin(x) et g: lR-, [-1, 1], x H sin(x).


30

1.2. Le graphe d'une fonction


Définition 2.2. (Graphe). Soit f: A------, B une fonction. On appelle graphe de f, et on note
Gf, l'ensemble des couples de la forme (x, f(x)). Ainsi Gf = {(x, f(x)), x E A} .
....;

Un repère orthonormé !Jl du plan 9 étant choisi, le graphe Gt de f: A------, B s'identifie à


l'ensemble des points de coordonnées (x, f(x)) pour x décrivant A, appelé courbe représenta-
tive de f dans /Jl. On emploiera abusivement 1 le terme graphe de f pour désigner la courbe
représentative de f dans /Jl.

Une courbe qui est un Une courbe qui n'est pas un graphe
graphe dans .Cfl dans .Cfl

FIGURE 2.1. Exemple et contre-exemple de graphe

Le graphe d'une fonction f: A------, B vérifie la propriété fondamentale suivante : pour tout
a E A, la droite verticale~ d'équation x = a coupe Gf en un unique point M de coordonnées
(a, f(a)). On peut même aller plus loin et affirmer qu'une courbe 't? du plan 9 est le graphe
d'une fonction f définie sur A si et seulement si pour tout a E A, la droite verticale ~
d'équation x = a coupe Gf en un unique point 2 .

Test 2.1. Test 2.2.


ce
Soit un demi-cercle du plan de centre Q et de Existe-t-il un repère orthonormé du plan dans
rayon R > O. Montrer qu'il existe un repère or- lequel la courbe de la figure 2.1.2 est un
thonormé !Y1 dans lequel ce
est le graphe d'une graphe?
fonction que l'on précisera.

1.3. Composition des fonctions


Définition 2.3. (Composée). Soient f: A------, B et g: C------, D telles que B C C. Pour tout
x appartenant à A, l'expression g(f(x)) a un sens et on la note (go f)(x). La fonction ainsi
définie de A dans 0, x E AH (go f)(x), est notée go f et on l'appelle la composée des
fonctions g et f.

1
Cet abus de langage est sans équivoque lorsque l'on travaille dans un seul repère .'Jt.
2
Cette propriété fondamentale permet de définir une fonction f: A --J B par la donnée de A, B et d'une courbe
~ vérifiant cette propriété. Il s'agit d'ailleurs de la définition abstraite d'application que nous donnerons dans
le cours d'Algèbre.
31

Diagrammes de composition
(l.)

~
Il est souvent commode d'utiliser des diagrammes lorsque l'on manipule des composées. ...
•<Ll
(l.)
On note classiquement
A ------t B c C ~ D .
~
gof
f
i:l
(l.)

s
'O

c-i
.d
Test 2.3. Test 2.4. ü
2
Soient les fonctions de lR dans lR définies par Soit, pour tout nombre réel t, P(t) = t +t+ 1.
f(x) = x 2 et g(x) = sin(x). Exprimer (f o g)(x) Calculer (Po P)(t) pour tout t réel.
et (go f)(x) pour x réel.

Il. PROPRIÉTÉS USUELLES DES FONCTIONS

11.1. Sens de variation


Rappelons quelques définitions essentielles énoncées ici à l'aide du quantificateur universel.

Définition 2.4. Soient A et B deux sous-ensembles de lR. et f : A --+ B. On dit que


1) f est croissante sur A lorsque \l(x, y) E A 2 , x ~ 1J =} f(x) ~ f(y);
2) f est décroissante sur A lorsque \l(x, y) E A , x ~ 1J =} f(x) )! f(y);
2

3) f est strictement croissante sur A lorsque \l(x, y) E A 2 , x < 1J =} f(x) < f(y);
4) f est strictement décroissante sur A lorsque \l(x, y) E A 2 , x < 1J =} f(x) > f(y);
5) f est monotone sur A lorsqu'elle est soit croissante, soit décroissante sur A ;
6) f est strictement monotone sur A lorsqu'elle est soit strictement croissante, soit stricte-
ment décroissante sur A.

On peut reformuler en toutes lettres la définition d'une fonction croissante : f : A --+ B


est dite croissante lorsque les points de A sont rangés dans le même ordre que leurs images
par f. De plus, il est clair qu'une fonction f monotone sur un intervalle I, mais qui n'est pas
strictement monotone, admet au moins un palier, c'est-à-dire qu'il existe un intervalle J C I
non réduit à point sur lequel f est constante.

Test 2.5. Test 2.7.


:\lontrer le résultat précédent. La fonction f définie de JR* dans lR par l'ex-
Test 2.6. pression f (x) = 1/ x est-elle décroissante sur
l'ensemble JR* ? sur l'intervalle lR'i- ? sur l'inter-
Le produit de deux fonctions décroissantes est-il valle lR*_ ?
nécessairement décroissant ?
32

II.2. Fonctions majorées, minorées et bornées


00
~
00
ro
Définition 2.5. Soient A et B deux sous-ensembles de lR et f: A-----+ B. On dit que
a:)
1) f est majorée sur A lorsqu'il existe un réel M tel que \/x E A, f(x) ~ M. Un tel réel M
...;
est appelé un majorant de f sur A ;
2) f est minorée sur A lorsqu'il existe un réel m tel que \/x E A, f(x) ) m. Un tel réel M
est appelé un minorant de f sur A ;
3) f est bornée sur A lorsque f est minorée et majorée sur A.

Les interprétations géométriques sont claires : une fonction f est minorée si et seulement
si son graphe est contenu dans un demi-plan horizontal ouvert vers le haut et une fonction
f est majorée si et seulement si son graphe est contenu dans un demi-plan horizontal ouvert
vers le bas.

Une fonction minorée par m Une fonction majorée par M

FIGURE 2.2. Lecture de la minoration et de la majoration sur un graphe

Une fonction f étant bornée si et seulement si elle est majorée et minorée, on voit que f
est bornée si et seulement si son graphe est contenu dans une bande horizontale.

FIGURE 2.3. Le graphe Gf d'une fonction bornée f est contenu dans une bande

fropositi9ij.~.(i. ~9~i,. êtJtdêu:t sous-ensemblês·de JR:. Urtê'/i,.nctwiif<;,/., M.lfest


bQmée. stlr A si et seÙlen)ent siil ciiste un réel K tel qùe If( x)I ~
0 0
1( pour tout X tl,<1,'fM! A·.
PREUVE. Raisonnons en deux temps.
( ==}) Supposons f bornée sur A, c'est-à-dire qu'il existe deux réels met M tels que, pour tout
x E A, m ~ f(x) ~ M. En notant K le plus grand des deux nombres IMI et 1ml, on a bien,
33

pour tout x dans A, -K ~ m ~ f{x) ~ M ~ K car, par définition de K, -m ~ K et M ~ K.


On a donc Vx E A, -K ~ f{x) ~ K, c'est-à-dire lf(x)I ~ K.
({=) Supposons l'existence d'un réel K tel que Vx E A, lf(x)I ~ K. Alors -K ~ f(x) ~ K et f
est majorée et minorée sur A. ■

Test 2.8. Test 2.9.


La fonction définie par f(x) = x sin(l /x) est-elle Le produit de deux fonctions définies et bornées
bornée sur JO, n] ? sur A est- il borné sur A ?
C'I
..d
u
Il.3. Symétries du graphe
II.3.1. Rappels sur quelques transformations élémentaires du plan

Passons en revue quelques transformations utiles lors de l'étude des représentations graphiques
des fonctions numériques. Après chacune des définitions, nous donnerons la forme analytique
de la transformation, c'est-à-dire l'expression des coordonnées {x', y') du point M', image de
M, en fonction des coordonnées (x, y) de ce dernier.
M'

M/MM'-ü
~M'

Translation
M~M'

Symétrie centrale
.X M

Réflexion d'axe Çj}


./M),
V_
Symétrie glissée

FIGURE 2.4. Transformations planes usuelles

o Soit Ü un vecteur du plan de coordonnées (a, /3). La translation de vecteur Ü est l'applica-
tion qui à tout point M du plan !Y associe l'unique point M' défini p a r ~ = ü. L'égalité
vectorielle ~ = Ü se traduit analytiquement en passant aux coordonnées de M, M' et Ü.
On a x' -x = ex et y' -y= /3. D'ou

x' = x + a, 11' = 11 + /3.


o Soit Q un point du plan de coordonnées ( a, b). La symétrie de centre Q est l'application qui
à tout point M associe l'unique point M' tel que Q soit le milieu de [MM'] ou, de manière
équivalente, DM' = MQ. Puisque Q est le milieu de [MM'], on a x+/
= a et Y~l/ = b,
c'est-à-dire
x'=la-x, y'=lb-y.
o Soit~ une droite du plan. La réflexion d'axe çg est l'application qui à tout point M associe
l'unique point M' tel que ~ soit la médiatrice de [MM']. Dans le cas où ~ est verticale
d'équation x = m, l'orthogonalité de MM' et de la direction de çg est équivalente à y'= y;
et le milieu de [MM'] étant d'abscisse x+/,
il appartient à~ si et seulement si x' = lm - x.
Ainsi x' = lm- x, y'= y. Dans le cas où~ est horizontale d'équation y= m, on trouve

x' = x, y'= lm-y.


o Soient ~ une droite du plan et Ü un vecteur directeur de ~- La symétrie glissée d'axe ~
et de vecteur Ü est la composée de la translation de vecteur Ü et de la symétrie d'axe ~-
34

L'ordre de composition est sans importance car les deux transformations commutent. Dans le
,ri
V
cas où L1 est l'axe des abscisses et Ü = À i (avec À E JR), l'image de M par la translation de
,ri
al vecteur Ü est le point M 1 de coordonnées (x + À, y), qui est à son tour transformé en M' de
c:l
....;
coordonnées (À+ x, -y) par la réflexion d'axe i:1. On a donc

x' =À+ x, y'= -y.

Il.3.2. Application aux fonctions paires et impaires

Rappelons qu'une partie Ç!J de lR est dite symétrique par rapport à Olorsque V x E Ç!J, -x E Ç!J_

Définition 2. 7. Soit f : Ç!J H lR une fonction définie sur Ç!J C lR symétrique. On dit que
1) f est paire lorsque Vx E Ç!J, f(-x) = f(x);
2) f est impaire lorsque 1::/x E Ç!J, f(-x) = -f(x).

Notons M(x) le point de coordonnées (x, f(x)). Les points M(x) et M(-x) sont symétri-
ques par rapport à (O-y) lorsque f est paire, et symétriques par rapport à l'origine O lorsque
f est impaire. La courbe représentative de la fonction f est donc symétrique par rapport à
(O-y) dans le premier cas et symétrique par rapport à O dans le second cas. On en déduit que
dans les deux cas (f paire ou impaire), il suffit de construire la courbe sur Ç!J n [O, +oo[ ou
Ç!J n ] - oo, O] et de compléter la figure par la bonne symétrie pour obtenir la courbe sur Ç!J_

Tracé sur IR+ Tracé sur lR. '!racé sur IR+ Tracé sur IR

FIGURE 2.5. Tracés de courbes de fonctions paire et impaire

La généralisation de la situation de parité est exposée dans la proposition suivante.

itt. ."îfütâêf:
..;.;•.'le}=J(x/.·.· À$ors ùi,
.·· ....

PREUVE. Le résultat est clair car, d'après les rappels sur les transformations usuelles du
plan, les points de coordonnées respectives (x, f(x)) et (2a - x, f(2a - x)) = (2a - x, f(x))
sont symétriques par rapport à la droite d'équation x = a. ■

Dans le cas d'une telle symétrie, il suffit de construire la courbe représentative de la


fonction étudiée sur [a, +oo[ ou ] - oo, a] et de compléter la courbe par la réflexion d'axe
,:1: X= a.

EXEMPLE 2.9. Thouvons un axe de symétrie de la fonction définie sur lR par l'expression
f(x) =x 2 +4x-4.
► Écrivons le trinôme sous forme canonique. Pour tout réel x, f(x) = (x + 2) 2 - 8. Ainsi,
f(-4 - x) = f(x). La droite d'équation x = -2 est donc un axe de symétrie de la courbe
représentative de f.
35

Remarque. La courbe représentative de f est bien sûr une parabole dont le sommet
S(-2, -8) appartient à l'axe de symétrie.

Test 2.10. Test 2.11.


Soit f : IR. --l IR. vérifiant Vx E IR., f( 6 - x) Soit f: IR. --l IR. définie par f(x) = 2x 2 + 3x - 7.
4- f(x). Trouver une symétrie de Gf. Trouver un axe de symétrie de Gf.

11.3.3. Application aux fonctions périodiques et antipériodiques

Pour pouvoir définir la notion de périodicité, il faut au préalable introduire une notion d'in-
variance portant sur les domaines de définition. Soit T E lR. Une partie çg de ~ est dite
invariante (ou stable) par l'application 't: x H x + T lorsque 't(çg) = çg_ Comme 'test une
bijection de~, d'inverse 't- 1 : x H x- T, on voit en composant que si la partie çg est invariant
par 't, elle est aussi invariante par 't- 1 . Cela signifie simplement que, partant d'un point x de
çg, on reste dans çg lorsque l'on effectue un saut de ± T.
Définition 2.10. Soient TE~• et f: çg H ~ une fonction définie sur un sous-ensemble çg
de~ invariant par x H x ± T. On dit que
1) f est T-périodique lorsque \lx E çg, f(x + T) = f(x);
2) f est T-antipériodique lorsque \lx E çg, f(x + T) = -f(x).

Remarque. Si f est T-périodique, on prouve par une récurrence facile que pour tout x dans
q et tout k dans Z, f(x + kT) = f(x). Remarquons enfin qu'une fonction f T-antipériodique
est nécessairement 2T-périodique : Vx E çg, f(x + 2T) = -f(x + T) = f(x). Une fonction
T-antipériodique est donc plus symétrique qu'une fonction T-périodique, ce qui simplifie le
tracé de son graphe.

Pro~tiÔ'1. 2.fl; .$,Jit f: ~ ~ ~ i~ }onètion 'àift:nié..sur~ CJI[ st~ ~rx ~ X ± T.


1) Lors1Jûe~ J~ction;f est.î-:Péri.~i~ sa· coltrw représent~tî'fJ~ €st in~aria~e .par,les
tmnslatiôtl$ rte viiéteu,rs.:±Tt~ · ;;•· 1 · ·
2> tors;i~kJ</4i:ii&nlisf-F~ii,tii,,~ sa co,ùJti: re@int~~è.i#. fi~ri~te~r,Jes
symétries;.gU$sée$ d'~ {Ç)xJet ~•vectêurs ±tï. . ·. · . ... . . . . .· .
PREUVE. 1) Le résultat est clair car l'image de M(x, f(x)) par la translation de vecteur Ü
est le point M' de coordonnées (x ± T, f(x)) = (x ± T, f(x ± T)), qui appartient à la courbe
représentative de f. 2) Le résultat est acquis puisque l'image de M(x, f(x)) par la symétrie
glis.5ée indiquée est le point M' de coordonnées (x± T,-f(x)) = (x± T, f(x± T)), qui appartient
à la courbe représentative de f. ■

\'otons que nous ne nous sommes pas préoccupés du problème de minimalité de la période.
Il est évidemment intéressant de connaître la plus petite période strictement positive d'une
fonction périodique, nous y reviendrons dans des exemples.
36

r/J
Fonctions périodiques ou antipériodiques
Il)
r/J
Cil
Ill Cette proposition permet en cas de périodicité ou d'antipériodicité de simplifier l'étude
....; de f et le tracé de sa courbe représentative .

◊ Dans le cas d'une fonction T-périodique, il suffit de tracer la courbe sur l'intersection
de~ avec un intervalle de longueur T, par exemple [O, Tl, et d'effectuer, pour tout k E Z,
la translation de vecteur k Tï afin de compléter la courbe.

◊ Dans le cas d'une fonction T-antipériodique, il suffit de tracer la courbe sur l'intersec-
tion de~ avec un intervalle de longueur T, par exemple [O, Tl, et d'effectuer la symétrie
glissée d'axe (Ox) et de vecteur û pour tracer la courbe sur~ n [T,2T]. Afin de tracer
la courbe sur ~, on translate la portion de courbe sur ~ n [O, 2T] du vecteur 2kTÏ, k
décrivant Z.

V V V
EXEMPLE 2.12. Construisons la courbe représentative de l'unique fonction
2-antipériodique notée f coïncidant avec x H 1 - x 2 sur l'intervalle [-1, 1].
► Plutôt qu'un long discours :

LJ t V LJV

Test 2.12. Test 2.13.


Soient T E lR et çg C lR stable par x H x ± T. Soient T E lR et f : lR ---+ lR une fonction paire et
Est-il vrai que lR \ çg est stable par x H x ± T ? T-antipériodique. Prouver que f(T/2) = O.

III. BRANCHES INFINIES D'UN GRAPHE


Définition 2.13. (Branche infinie). Soient f: I --+ lR et <XE {±oo} U lR. On dit que f
présente une branche infinie en <X lorsque lf(x)I tend vers +oo lorsque x tend vers <X.

Afin de tracer le plus fidèlement possible la courbe représentative d'une fonction, il est utile
d'étudier avec soin ses branches infinies.
Définition 2.14. (Asymptote verticale). Soient f : I --+ lR et x 0 E lR tels que lf(x)I
tende vers +oo lorsque x tend vers x 0 . On dit alors que la droite d'équation x = x 0 est une
asymptote verticale à la courbe représentative de f en x 0 .
37

L'interprétation géométrique d'une asymptote verticale


est claire : la fonction « s'écrase » (c'est une expression un Cl)

peu malheureuse mais très appropriée) sur la droite verticale ~


,Cl)
....
d'équation x = x 0 lorsque la variable x tend vers Xo. Cl)
00
Lorsque ex= ±oo, on recherchera d'abord une éventuelle ~
direction asymptotique. @
FIGURE 2.6. Asymptote ::a
Cl)

verticale :9
Définition 2.15. (Direction asymptotique). Soient ME IR et f: [M, +oo[---, lR tels que
6
f~) tende vers un nombre réel a i- 0 lorsque x tend vers +oo. On dit alors que la droite
d'équation li = ux est une direction asymptotique de la courbe représentative de f en +oo.
Lorsque If~J I tend vers +oo (resp. 0) lorsque x tend vers +oo, on dit que f admet une
branche parabolique en +oo de direction (0ll) (resp. (0x)).

Le lecteur adaptera sans peine cette définition au


cas d'une limite en -oo. L'interprétation géométrique
f(x)
d'une direction asymptotique est la suivante : le quo-
tient f~J est la pente de la droite (0M) où M est
le point du graphe de f d'abscisse x. L'existence de
la limite en +oo permettra de guider le bras du lec-
teur lorsqu'il dessinera l'allure du graphe de f au voi-
0 X
sinage de l'infini. En cas de branche parabolique de di-
rection (0ll) (resp. (0x)), la courbe aura en +oo l'al-
FIGURE 2.7. Direction
asymptotique
lure d'une parabole d'équation li = ±x2 (resp. li =
±y'x).

En cas d'existence d'une direction asymptotique, on re-


cherchera une éventuelle asymptote à la courbe.

Définition 2.16. (Asymptote oblique). Soient M E lR et f: [M, +oo[---, lR tels que f~l
tende vers un nombre réel ai- 0 et f(x) - ux vers un réel b lorsque x tend vers +oo. On dit
alors que la droite d'équation li = ux+ b est une asymptote oblique à la courbe représentative
de f en +oo.
Le lecteur adaptera sans peine cette définition au
cas d'une limite en -oo. L'existence d'une asymp-
tote en +oo se traduit géométriquement par un
« écrasement » du graphe de f sur la droite d'équa-
tion li = ux + b lorsque x tend vers +oo : en effet,
si M et N désignent les points d'abscisse x situés
respectivement sur la courbe représentative de f et
sur la droite d'équation li = ux + b, on a
FIGURE 2.8. Asymptote
MN=f(x)-ux-b,

qui tend par définition vers O. De plus, le signe de MN permet de déterminer la position
relative de la courbe par rapport à son asymptote.
38

EXEMPLE 2.17. Étudions les branches infinies de la fonction définie sur çg = lll \ {-2} par
rJl
V f. X H 3x2+1
rJl • x+2
ro ► Puisque lim lf(x)I = +oo, le graphe de f admet la droite d'équation x = -2 pour asymp-
:0 x----) -2
.....; 2
tote verticale. De plus, pour tout réel x i- 0, f(xl
X
= 3
1
++lz/;x
X
d'où lim
x~±oo
f(x)
X
= 3. Le graphe de

f admet donc une direction asymptotique en ±oo d'équation y = 3x. Étudions l'existence
d'une asymptote : f(x) - 3x = - 6+x+2 1 = -16+2111X, et ainsi X--t±oo
lim f(x) - 3x = -6, et le graphe
X + X

de f admet en ±oo une asymptote d'équation y = 3x - 6. Puisque f(x) - 3x + 6 = x1:z, la


courbe est au-dessus de l'asymptote en +oo, en-dessous en -oo.

Plan d'étude d'une branche infinie


1) Si lf(x)I tend vers +oo en x 0 E lll, alors la droite d'équation x = Xo est asymptote à
la courbe en Xo.

2) Si lf(x)I tend vers +oo en ±oo, alors on étudie f~l-

◊ Si tend vers +oo en ±oo, f admet une branche parabolique d'axe (Oy) en ±oo.
f(xl
X

◊ Si
X
tend vers O en ±oo, f admet une branche parabolique d'axe (Ox) en ±oo.
f(xJ

◊ Si f(xl
X
tend vers a E lll* en ±oo, on dit que f admet une direction asymptotique
d'équation y = ax en ±oo.

3) Si f admet une direction asymptotique d'équation y = ax en ±oo, on étudie l'ex-


pression f(x) - ax. Si cette expression admet une limite b E lll en ±oo, alors la droite
d'équation çg : y = ax + b est asymptote à la courbe de f en ±oo.

IV. BIJECTIONS

Soient I et J deux intervalles de R Une fonction f: I ----, J est dite injective lorsque
V(x, y) E !2, f(x) = f(y) =} x = Y,

autrement dit, lorsque f prend une valeur, elle ne la prend qu'en un seul point; une fonction
f : I ----, J est dite surjective lorsque tout élément de J admet un antécédent dans I par f,
autrement dit
Vy E J,:3x E I, y= f(x).
Une fonction f: I----, J est dite bijective lorsqu'elle est injective et surjective3 • On résume tout
cela dans la définition suivante.
Définition 2.18. (Bijection). Une fonction f: I----, J est dite bijective si tout y 0 apparte-
nant à J admet un unique antécédent x 0 par f, c'est-à-dire si l'équation f(x) = y 0 admet une
unique solution x = x 0 . On dit alors que f réalise une bijection de I sur J.

3 On comprend maintenant pourquoi il est essentiel de préciser les ensembles de départ et d'arrivée d'une
fonction : le caractère surjectif ou injectif d'une fonction ne dépend pas seulement de la formule f(x) = ...
39

EXEMPLE 2.19. La fonction f de lR dans lR définie par x H x 2 - x + 1 est-elle bijective?


► La réponse est négative, donnons-en deux démonstrations. La fonction f n'est pas bijective
car non-injective; l'équation f(x) = 1 admet deux solutions dans lR: 0 et 1. Autre argument:
f n'est pas bijective car non-surjective; l'équation f(x) = 0 n'admet aucune solution dans lR.

L'interprétation géométrique de la bijectivité d'une fonc-


tion est claire : pour tout nombre réel y 0 E J, la droite
horizontale d'équation y = Yo coupe la courbe représen-
tative de la fonction f sur I en un unique point, x 0 . Les
figures suivantes illustrent les notions d'injectivité, de sur- CN
..d
jectivité et de bijectivité. La première figure montre que la ü
fonction cos : [-n/2, n/2] -, [O, 1] est surjective mais non
Yo -------- ----
injective ; le deuxième graphe illustre la non-surjectivité de
cos : [-n/2, n/2] -, [-1, 1] et la bijectivité de la fonction
Xo
sin : [-n/2, n/2] -, [-1, 1] est illustrée dans la dernière fi-
FIGURE 2.9. Bijectivité gure.

Non-injectivité Non-surjectivité Bijectivité

FIGURE 2.10. Injectivité, surjectivité et bijectivité vues sur un graphe

Définition 2.20. (Bijection réciproque). Soit f: I-, J une fonction bijective. Pour tout
y E J, l'unique antécédent de y par f est noté f- 1 (y). La fonction ainsi définie, f- 1 : J -, I,
qui à y associe f- 1(y), est appelée fonction réciproque de f ; la fonction f- 1 réalise une
bijection de l'intervalle J sur I de bijection réciproque (f- 1 1- 1 = f.

Pour tout Xo E I, notons y 0 = f(xo), de


sorte que Xo = f- 1 (y 0 ). Les points M 0 et
Mb, de coordonnées (xo, Yolet (Yo, xol, appar-
tiennent aux courbes représentatives de f et de
f- 1 . Notons Y~ la symétrie d'axe~ : y = x xo = 1 Mo
f- (110) --- ,
(appelé première bissectrice). Cette symétrie
''
échangeant les points de coordonnées Mo et Yo = f(xo)
'
Mb, les graphes des fonctions f : I -, J et
f- 1 : J -, I sont symétriques par rapport à ~, 0 Yo xo
ce qui permet de construire le graphe de f- 1
connaissant celui de f. FIGURE 2.11. Graphes de f et f- 1
40

EXEMPLE 2.21. Prouvons que la fonction f définie par x H l~x réalise une bijection de
[0,+oo[ sur (0, 1[. Exprimons f- 1 (y) en fonction de 1J E (0, 1( puis traçons les graphes de f
et f- 1.
...; ► Il est clair que la fonction f, définie sur (0, +oo[, est à valeurs dans [0, 1[. Soit y E [0, 1[.
L'équation x~ 1 = y est équivalente à x = y (x + 1), c'est-à-dire ( 1 - y) x = y, soit encore
x = ~' et puisque y E [0, 1[, 1 ~ E [0, +oo[. La fonction f réalise donc une bijection de
11
[0, +oo[ sur [0, 1[ de bijection réciproque f- 1 vérifiant \ly E (0, 1[, f- 1 (y) = 1~ .
11
L'expression f(x) = 1 - l~x permet de tracer simplement (i.e. sans étude) la courbe repré-
sentative de f. On en déduit celle de f- 1 (en pointillé sur la figure 2.12) par la symétrie d'axe
1J =X.

,,
,,

FIGURE 2.12. Un graphe et son symétrique

Contrairement à l'exemple précédent, où l'équation (en x) y = f(x) se résolvait sans


difficulté à l'aide des fonctions usuelles, il n'est pas toujours possible de prouver directement
la bijectivité d'une fonction. Dans ce contexte, la notion de dérivée nous permettra parfois de
conclure.

Test 2.14. Test 2.15.


Une fonction f : lR -+ lR paire peut-elle être Une fonction strictement monotone est-elle né-
injective ? surjective ? cessairement injective ? Étudier la réciproque.

V. CONTINUITÉ
La définition de la continuité repose sur la notion de limite, que nous supposerons ici acquise.

Définition 2.22. (Continuité). Soient f: I-+ lR une fonction définie sur un intervalle de
lR et x 0 E I. On dit que f est continue en x 0 lorsque f (x) tend vers f (x 0 ) quand x tend vers
x 0 . On dit que f est continue sur l'intervalle I lorsque f est continue en tout point de I.

Le graphe d'une fonction continue est un objet plus complexe4 qu'il n'y paraît. On se
méfiera des représentations naïves des fonctions continues masquant la réalité géométrique
de cette notion. Les mathématiciens de la seconde moitié du XIXe siècle nous ont appris

4
La notion de continuité a d'ailleurs donné du fil à retordre à de nombreux et fameux mathématiciens du
xrxe siècle.
41

à distinguer la notion de continuité de celle de dérivabilité, cette dernière traduisant l'idée


intuitive de régularité, c'est-à-dire le caractère lisse du graphe, ce qui n'est pas le cas de la (1.)

continuité. La liste des a priori en la matière est hélas fort longue. On ne confondra pas ~
,(1.)
1..,
non plus la continuité et l'idée d'un tracé à main levée. Par exemple, la fonction définie (1.)

par f(0) = 0, x-=/ 0 H f(x) = xsin(l/x) est continue sur [0,n] mais présente une infinité
d'« arches» d'aires alternativement positives et négatives, ce qui rend tout tracé à main levée
du graphe de f au voisinage de O mensonger.
f
i:,
(1.)
On retiendra qu'une fonction continue peut avoir un comportement extrêmement irré-
gulier. Nous étudierons dans le cours de l 2 les exemples donnés par le mathématicien allemand
Weierstrass de fonctions continues sur IR mais dérivables en aucun point de R
s
"Cl

c-i
..d
ü
Les fonctions usuelles (fonctions polynômes, fractions rationnelles, cos, sin, tan, exp, ln)
sont continues sur leurs ensembles de définition. Les sommes, produits et quotients (lorsqu'ils
sont définis) de fonctions continues sont des fonctions continues.

Ne pas confondre lisse et continu Ne pas confondre tracé à main levée


et continuité

FIGURE 2.13. Méfions-nous des représentations naïves de la continuité.

Rappelons le théorème des valeurs intermédiaires, souvent indispensable pour justifier


l"existence d'une solution pour certaines équations.

-------------- f(x1)

XJ X

FIGURE 2.14. Le théorème des valeurs intermédiaires


Test 2.16. Test 2.17.
Établir que Vx E JR*, lx sin( 1/x) 1 ,:;; lxl. En dé- Quelles sont les seules fonctions continues sur
duire que f définie sur JR* par f(x) = xsin(l/x) lR ne prenant que les valeurs O ou 1 ?
.....; et f(O) = 0 est continue en O.

VI. TANGENTE ET DÉRIVÉES

On cherche ici à étudier localement une fonction f : I ---, R

Vl.1. La notion de dérivée


Étudions la courbe représentative d'une fonc-
tion f au voisinage d'un point Mo de coor-
données (x 0 , f(xo)). Lorsque l'on cherche à dé-
M
f ( x)
finir la notion de tangente à la courbe en Mo,
l'idée la plus naturelle est la suivante : on consi-
dère une corde [MoMl de la courbe (c'est-à-
dire que le point M appartient à la courbe),
et on choisit de définir la tangente à la courbe
en Mo comme l'éventuelle position limite de
cette corde lorsque M tend vers M 0 . Puisque
toutes ces cordes rayonnent d'un point fixe M 0 ,
f ( Xo)
l'existence d'une position limite est équivalente
0 Xo X à l'existence d'une limite de la pente de la
corde [MoMJ lorsque M tend M 0 . Voilà de quoi
FIGURE 2.15. Le taux éclairer la définition suivante du nombre dé-
d'accroissement rivé.

Définition 2.24. (Nombre dérivé). Soient f : I ---, lR une fonction définie sur un intervalle
de lR et x 0 E I. On dit que f est dérivable en x 0 lorsque le taux d'accroissement de f en x0 ,
noté 'Txo et défini par 'Txo : I \ {xo}---, :IR, x H f(x2=~xol, admet une limite quand x tend vers
x 0 . Dans ce cas, cette limite est appelée nombre dérivé de f en x 0 et on le note f'(x 0 ).

Le quotient Txo(x) est la pente de la corde reliant les points de coordonnées (x 0 , f(x 0 )) et
(x, f(x)). En cas de dérivabilité de f en x 0 , sa courbe représentative admet donc en M 0 une
tangente de pente f'(x 0 ) et d'équation y = f(x 0 ) + f'(xo)(x - x 0 ).

Définition 2.25. (Équation de la tangente). Lorsque f est dérivable en x 0 , la tangente à


la courbe représentative de f au point M 0 est la droite d'équation y= f(x 0 ) +f'(x 0 )(x-x0 ).

Dans le cas où le taux d'accroissement de f en xo tend vers ±oo lorsque x tend vers x 0 ,
la fonction n'est pas dérivable en x 0 mais la courbe représentative de f admet en Mo une
tangente verticale.
43

EXEMPLE 2.26. Étudions la dérivabilité de la fonction « racine carrée» sur lR+.


► Il faut distinguer O des autres réels positifs.
o Dérivabilité en O. Notons 'To le taux d'accroissement de la racine carrée en O. Pour h > 0,

\/h-0 1
'<o(h) = h-0 = )h"
Cette fonction tend vers +oo en 0+, la racine carrée n'est donc pas dérivable en O.

o Dérivabilité en x 0 -1- O. Le taux d'accroissement de la racine carrée en x 0 est défini


au voisinage de O par h H 'TXo (h) = ~-,.fi-0 = ~+v'rt· Par continuité de la racine
carrée en x 0 , lim 'TXo (h) = 2 ~ . La racine carrée est donc dérivable en x 0 et sa dérivée en ce
h-->0 vXo
point vaut 2
~.

Remarque. On a utilisé la méthode de la quantité conjuguée pour simplifier 'TXo : pour tous
nombres réels strictement positifs a et b, y'a- 0J = ( y'a- 0J) X ~:~ = Fa~Fb-
Proposition 2.27~{Dérivabilité et continuité). Soitf: I 4 Rune foncti-on définie sur
un interoallel de R, déri:vable en xo E I. Alors f est continue en Xo-
La réciproque est bien sûr fausse, comme l'illustre la fonction f : x E lR H lxl, qui est
continue mais non dérivable en O. En effet, les limites à droite et à gauche du taux d'accrois-
sement de f en O sont égales à 1 et -1 respectivement. Le taux d'accroissement ne possède
donc pas de limite en 0, et par conséquent f n'est pas dérivable. Mais elle est continue en 0,
puisque ses limites à droite et à gauche sont nulles.

Lorsque la fonction f est dérivable sur tout l'intervalle I, on appelle fonction dérivée de f
ou plus simplement dérivée de f sur I, et on note f', la fonction définie sur I par x H f'(x).

Rappelons brièvement les opérations sur les fonctions dérivées.


Prop~ition 2.28, {Formulair~). Soient u. et v deux fonctions définies sur un intervall.e
I tvaleù,rs dans R. On su;,poseu et v dérivables sud. On a alors les propriétés suivantes :
l) La fonctionµ +v est dérivable sur l et (u + v)' = u' + v';
2) La/onction uv est dérivable sur I et (uv}1 = uv' +u'v;
3), Dè plil,s~ sîv.neS'â.nnule pas surI, là fonction t est dérivable surl et

5) Pàulr toute;f oncti<ins U : i ---f R et v : J 4 R dériva blés et Ûlles que u s?Jit à valeurs dans
J, la fonction composée vou est dérivable surI et pour toutx E I, (voù)'(x} = u'(x}v'(u(x}),
c'est'-d.~dite (\r ou)' :h u' x {v' ou).
44

Toute étude de fonction commencera par une étude soigneuse de ses propriétés de dériva-
bilité (et de continuité).

VI.2. Dérivées usuelles

Formulaire de dérivation

Fonctions Domaine çg Dérivée


sin lR cos
cos lR -sin
tan lR \ (n/2 + nZ) 1 + tan 2 = 1/ cos 2
t H t"' (où IX E JR) t H <Xtcx-l
]R~
t H et lR t H et
t H ln(t) ]R~ t H 1/t

fg Cf. proposition 2.28 fg' + f'g


f/g idem (gf' - fg')/g 2
fO9 idem g' X (f' o g)
fn (pour n E Z) idem nf'fn-l

Remarque. La formule de dérivation de fn pour n E Z est un cas particulier important de


la formule de dérivation d'une composée. Elle contient la formule (1/f)' = -f'/f2 (il suffit de
l'appliquer au cas n = -1 ).

EXEMPLE 2.29. Justifions la dérivabilité et calculons la dérivée de la fonction définie sur


)0,7t[ par f(t) = si)(t)"
► Comme, sur )O,n[, f(t) = sin-5 (t), la fonction f est dérivable sur ]O,n[ en tant que
composée de fonctions dérivables et, sur cet intervalle

f'(t) = -S(sin(t))' sin-5- 1 (t) = -5 ~os(t).


sm 6 (t)

Remarque. Il est préférable ici de dériver une puissance directement plutôt que d'appliquer
la formule de dérivation de l'inverse. On écrira sobrement en tant que composée de fonctions
dérivables sans détailler davantage.

Test 2.18.
Étudier la dérivabilité et calculer la dérivée de Test 2.20.
t H cos 3 (t).
Soient f, g et h trois fonctions dérivables sur
Test 2.19. un intervalle I de lR. Étudier la dérivabilité et
Étudier la dérivabilité et calculer la dérivée de trouver une formule pour (fgh)'.
45

.\ttc11tim1 Les théorèmes de dérivation


Terminons ce paragraphe en rappelant que tous les théorèmes précédents énoncent des
conditions suffisantes de dérivabilité. Il se peut par exemple, qu'un produit de fonctions
non dérivables soit dérivable : c'est le cas de x H x 2 = lxl.lxl en O.

Vl.3. Variations d'une fonction dérivable


La proposition qui suit précise le lien entre le signe de la fonction dérivée et le sens de variation
de la fonction. Le lecteur l'adaptera sans peine au cas d'une dérivée négative.

Proposition ~~30.. (Dêrivie et sens .de variatit>nJ. Soit f : .· I .·~· R dérivable sur un
intervallel.de ~. teîlef[aèpourfout:tf1JP41'tènant ~ r, fit)~ o. Alors f est croissq,nte $Ur
I. De plus, .si f I n'est ide'fbtifù,emen-t nul!ê. sur àucunjnten,alle ouvert 'IWII, vide c ~ u daM
I, f est sttii::tement croissantê. sur L

Remarque. Rappelons qu'une fonction f est dite identiquement nulle sur un ensemble J
lorsque Vt E J, f(t) = O. En vue d'appliquer cette proposition, on commencera donc par
rechercher l'ensemble des zéros de f' (i.e. l'ensemble des réels t tels que f'(t) = 0). Si ce dernier
ne contient aucun intervalle ouvert non vide, on pourra en conclure que f est strictement
croissante.

Proposition 2;3k (Fonctiotis de dérivêe nulle SUI" ùn illtervalle). Soient l un inter-


valle etf: l..,.-t Jffd~vaplê'tettê,què,
1. .. .. . . '[10ur.. toutt
. € I,. f'{t):;::0. Alors f est
. constante
. . sur

. \t (<'111Î()ll (f' = 0 sur I) =} (f est constante sur I)


Ce résultat est FAUX en général. Il tombe en défaut lorsque I n'est pas un intervalle
de IR : la fonction f définie sur JO, 1[ U [2, 3] valant O sur le premier intervalle et 1 sur le
second est un contre-exemple flagrant. Cette situation n'est pas pathologique, nous la
retrouverons dans le cours sur les fonctions circulaires.

Proposition 2.32. (Bijectivité et dérivée). Soit f ; [a, b] .-:-4 R continue sur [a, b] et
dérivable.sur Ja,b[, telle qtté f' ~ 0 et telle que f' ne sàit identi~ement nulle sur aucun
intervalle ouvert ri.on mde contè:hu· dans fa/bJ. Alors·f réalisê uve bijection strictement crois-
sante de [a, bl sur [f(a},f(b)] de bijection réèiproque f- 1.: [f(n)~ f(b)l ~ fa, b] strictement
croissante et rontinue 5Ur tf{a};f(b)J,

Nous n'avons énoncé ce théorème que dans le cas particulier où l'intervalle de départ est
de la forme [a, bl, il va de soi qu'il existe des variantes correspondant aux cas où f est définie
sur un intervalle semi-ouvert [a, b[, [a, +oo[ ou]~ oo, bl, etc. Dans la pratique, on repère une
éYentuelle bijection entre intervalles en étudiant le signe de f' (t) et en lisant les intervalles en
question sur le tableau de variation de f.
46

Bijections lues sur un tableau de variation


Cas d'une fonction f :]a, b[---t lR dérivable avec a et b éventuellement égaux à ±oo .
...:
◊ Si f' :::;; 0 sur ]a, b[ et si l'ensemble des zéros de f' ne contient aucun intervalle ouvert
non vide, alors f est strictement décroissante sur ]a, b[.

◊ Afin de connaître l'intervalle image de f, on calcule les limites l = lim f(t) et


t->a+
C= lim f(t), puis on dresse le tableau de variation de f sur ]a, b[,
t->b-

t a b
f'(t) -

f(t)
l~C

On conclut alors directement que f réalise une bijection strictement décroissante de ]a, b[
sur ]C, l[.

Remarque. Il est clair que le caractère injectif est assuré par la stricte monotonie de f et
que le caractère surjectif est assuré par la continuité de f (et plus précisément par le théorème
des valeurs intermédiaires).

EXEMPLE 2.33. Montrons que la fonction définie sur lR par f(t) = t - sin(t) réalise une
bijection strictement croissante de lR sur R
► Cette fonction est dérivable sur lR et, pour tout réel t, f'(t) = 1 - cos(t) ? O. La fonction
f est donc croissante sur JR. Puisque f'(t) = 0 équivaut à cos(t) = 1, l'ensemble des zéros de
f' est 21tZ et ne contient aucun intervalle ouvert non vide. La fonction f est donc strictement
croissante sur R Comme \ft E :IR, f(t) ? t-1, f(t) tend vers quand t tend vers +oo. Puisque
f est impaire, f(t) tend vers -oo avec t. On a donc le tableau de variation suivant :

t -(X) +oo
f'(t) +
/+oo
f(t) -(X)

La fonction f réalise donc une bijection strictement croissante de lR sur R

Remarque. Ce n'est pas le signe + figurant sur la ligne de f'(t) dans le tableau précédent
qui justifie la stricte croissance de f. Le tableau ne suffit pas à établir la stricte monotonie, il
faut toujours étudier l'ensemble des zéros de f'.
47

Test 2.21. Test 2.22.


Montrer que t H t + sin( t) réalise une bijection Montrer que t H t 2 ~ 1 réalise une bijection de Ill

de lR sur JR. [-1, 1] sur un intervalle à préciser. ~


•Ill
~
Ill
(/)

On notera que si la continuité de la fonction réciproque f- 1 est acquise, sa dérivabilité ~


n'est pas automatique et nécessite une petite discussion. @
ï::,
Ill
:g
VI.4. Dérivabilité d'une bijection réciproque 6
c-i
Soit f: I --t J une bijection. Puisque les courbes de f et f- 1 sont symétriques par rapport à la .d
u
première bissectrice L1 du repère, la dérivabilité de f- 1 en y 0 = f(xo) est reliée à celle de f en
x 0 . Voici une première approche intuitive de ce problème, qui sera revu de manière rigoureuse
dans la suite du cours. On observe que la réflexion d'axe L1 conserve la propriété de tangence
entre les droites et les courbes, et transforme donc la tangente en Mo(xo, Yol à la courbe de
f en la tangente en Mb(Yo, xo) = L1(Mo(xo, Yoll à la courbe de f- 1 . Le nombre dérivé f'(xo)
(quand il est défini!) étant la pente de la tangente en Mo à la courbe de f, nous aurons besoin
pour aller plus loin du petit calcul suivant.

EXEMPLE 2.34. Prouvons que l'image par la réflexion d'axe L1, notée Y,.,, d'une droite de
pente p non nulle est une droite de pente 1/p.
► Soient A(xA, YA) et B(xs, y 8 ) deux points distincts tels que la droite (AB) ne soit ni
horizontale ni verticale, c'est-à-dire YA c/c y 8 et XA c/c Xs. Notons A' et B' les images par Y,.,
des points A et B. On a bien sûr A'(YA, XA) et B'(y 8 , xs). On sait que l'image de la droite
(AB) par la symétrie Y,., est la droite (A'B'). Or, la pente de (AB) valant p = 1.Js-1.JA, celle
Xs-XA
de (A'B') vaut 118 ' -11A' = xs-xA = 1/p.
Xsr-xA, YB-YA

M'0

f- 1 non-dérivable en Yo f- 1 dérivable en Yo

FIGURE 2.16. Dérivabilité d'une bijection réciproque

Reprenons les notations précédentes , Mo et Mb. Supposons f dérivable en x 0 et notons


3é la tangente en Mo à la courbe représentative ~ de f. L'image par Y,., de ~ est la courbe
représentative~' de f- 1 ; l'image !fà' de la droite 3é est tangente à~' en Mb = Y,,.,(M 0 ). Il
y a donc exactement deux cas de figure :
o la droite 3é est horizontale, ce qui équivaut à f'(x 0 ) = 0, et dans ce cas !fà' est verticale:
la fonction f- 1 n'est pas dérivable au point y 0 .
48

o la pente f'(x 0 ) est non nulle et dans ce cas la droite :Yo' est tangente non verticale à "fl en
Mb; d'après le calcul précédent, :Yo' est de pente 1/f'(x0 ) :la fonction f- 1 est donc dérivable
en y 0 et son nombre dérivé est donné par la formule (f- 1 )'(yo) = 1/f'(f-1 (y 0 )).
...;
Regroupons l'ensemble de ces résultats dans la proposition suivante, que nous appliquerons
à de nombreuses reprises dans le cours d'analyse, après en avoir donné une autre démonstra-
tion.

Proposition 2.35. (Dérivabilité d'une fonçtion réciproq11e): Soit f: I -+ J une bijec-


tion entre deux intervalles de 'B. dérivy,~t~ sur LSoien~~J J e~ . x = f= ,~)- La/onctir f:-
1 1

1
est dérivable en y si et seulement si f'(f- (y)) i: 0 e~ dans.ce cas (f-1)'{y) = f'(f-l(y)f
Lorsque;f'(f-1 (yî} = 0, le graphe de la fonction f- 1 admet "èn y une td,i,,gente verl;icale.

EXEMPLE 2.36. Définissons la fonction « racine carrée» sur [0, +oo[ comme une bijection
réciproque. Étudions alors sa dérivabilité et retrouvons l'expression de sa dérivée sur][{';_.
► Notons f la fonction définie sur ][{ par f(x) = x 2 . En tant que fonction polynôme, f est
dérivable sur][{ et sur cet intervalle f'(x) = 2x. Puisque f' est positive sur][{+ et ne s'annule
qu'en 0, f est strictement croissante. Comme f(O) = 0 et lim f(x) = +oo, le tableau de
x-----++oo
variation de f est le suivant :
t 0 +oo
f'(t) +
/+oo
f(t) 0

On en déduit que f réalise une bijection de][{+ sur][{+· Notons, pour tout x) 0, f- 1 (x) = y'x.
D'après la proposition précédente, la racine carrée est continue sur ][{+, non-dérivable en 0
car f'( ylQ) = 0, dérivable sur ][{';_ avec sur cet intervalle, ( vxl /
= f'(f-1i (x)) = 2f-1 (x) = 2,½-

VI.5. Application à l'étude d'une fonction


Les résultats précédents permettent de tracer approximativement la courbe représentative
d'une fonction donnée. Commençons par un exemple.

EXEMPLE 2.37. Étudions puis traçons le graphe de la fonction f définie par la formule
f(x) = ln (ex+rx).
► Puisque l'exponentielle est toujours strictement positive, f est définie sur R De plus, il
est clair que f est paire. On se contentera donc de l'étudier sur l'intervalle I = [0, +oo[. Sur
cet intervalle, f est dérivable en tant que composée de fonctions dérivables et, pour tout x
positif, f'(x) = ::~:=: )
= =~=~~ 0, avec f'(x) = 0 si et seulement si x = O. La fonction f
est donc strictement croissante sur][{+· Comme f(O) = 0 et lim f(x) = +oo, on en déduit
X---l+oo

le tableau de variation suivant,


X 0 +oo
f'(x) +
/+oo
f(x) 0
49

Il y a donc une branche infinie en +oo. On remarque que, pour tout réel x,

ainsi lim (f(x) - x + ln(2)) = 0 et la droite d'équation -y x - ln(2) est asymptote au


x----t+oo
graphe Gt en +oo. Comme

Vx E IR, f(x) - x + ln(2) = ln(l + e-2x) > 0,


la courbe est située au-dessus de son asymptote. On en déduit le tracé du graphe Gf.

On retiendra cette démarche générale.

Plan d'étude d'une fonction numérique


Soit f: [g --, IR une fonction dérivable définie sur [g, réunion d'intervalles.
o On commence par rechercher les symétries de la fonction f afin de limiter son étude
à un sous-ensemble [g' de çg le plus simple possible. [g' sera également une réunion
d'intervalles.
o On étudie les variations sur chacun des intervalles composant [g'_ Il est important de
se placer sur des intervalles car sans cette précaution, l'implication f' ~ 0 =} f croissante
peut tomber en défaut comme le prouve le contre-exemple f(x) = -1 /x sur [g =IR*.
o On détermine les branches infinies de f sur [g' à l'aide du tableau de variation de f.
On recherche éventuellement la position de la courbe par rapport à ses asymptotes.
o On trace la portion de la courbe représentative de f correspondant à [g', la main étant
guidée par le tableau de variation, les éventuelles détermination de tangentes à la courbe
et les branches infinies.
o On complète la courbe de f à [g tout entier grâce aux symétries.
50

VII. EXERCICES
2.1. 2.4 .
..;
Quelle est la parité de la composée de deux Prouver que, pour tous réels O < a,( b,
fonctions impaires ? paires ? paire et impaire ? b-a
ln(b) - ln(a) ,( r::-;:-.
vab
2.2. On commencera par établir que

Montrer que la fonction définie par 1


\:/x ~ 1, 2ln(x)-x+- ,( 0
X

en étudiant une fonction bien choisie.


réalise une bijection de [O, 1) sur un ensemble à
déterminer. 2.5.

2.3. Soit f la fonction de IR dans IR définie par

Étudier la branche infinie en +oo de la fonction


définie par
Montrer que f réalise une bijection de IR sur un
intervalle à préciser de deux manières. Exprimer
f- 1 à l'aide des fonctions usuelles exp et ln.
Chapitre 3
FONCTIONS CIRCULAIRES

ES lignes trigonométriques sont nées de l'astronomie bien avant l'émergence de la no-

L tion de fonction au XVIIe siècle. Le passage des tables numériques de l' Antiquité aux
fonctions numériques accompagna l'intérêt des mathématiciens pour des formes géo-
métriques s'éloignant de plus en plus des objets de la géométrie grecque.

L'invention du calcul différentiel au XVIIe siècle par New-


ton et Leibniz fut le point de départ de la théorie moderne
des fonctions à partir de laquelle les fonctions trigonomé-
triques passèrent du domaine géométrique à celui de l'ana-
lyse (il fallut toutefois attendre Weierstrass pour arriver à
la notion actuelle de fonction ; ce dernier reprenant dans
les grandes lignes l'approche d'Euler au détriment de celle
de Leibniz, qu'il jugea moins générale et trop géométrique).
Leonard Euler utilisa ces fonctions pour l'étude des nombres
complexes et prouva qu'elles pouvaient être définies à partir
de la seule fonction exponentielle (cf. les célèbres formules
d'Euler). La trigonométrie devint alors une application des Euler
nombres complexes, l'ensemble des formules connues et dé-
montrées jusqu'alors géométriquement découlant des règles de calcul propres à l'ensemble C
Les fonctions trigonométriques devinrent dès lors incontournables aussi bien en mathéma-
tiques pures qu'appliquées (cf. les travaux de Joseph Fourier au début du XIVe siècle).

1. DE LA TRIGONOMÉTRIE AUX FONCTIONS CIRCULAIRES

Grâce aux lignes trigonométriques, nous disposons de trois « nouvelles » fonctions dites cir-
culaires - cosinus, sinus, tangente; les pages qui suivent sont consacrées à leur étude (déri-
vabilité, calcul le cas échéant de leur dérivée, détermination de leurs variations, etc).

I.1. Dérivabilité des fonctions circulaires


La présentation retenue dans ce cours pour la dérivation des fonctions circulaires repose sur
trois lemmes et les formules d'addition trigonométriques.

Lemme 3.L Pourtoutréel8 E [Ô,1t/2[, sin(8) ·~ 0 ~ ta.n(8).


1

PREUVE. Tout repose sur des considérations géométriques. Soit 0 E [O, n/2[. Plaçons-nous
sur le cercle trigonométrique Cf?, où M est le point de coordonnées (cos (0), sin (0)) et A celui
de coordonnées (1, 0). N désigne le point d'intersection de la tangente au cercle Cf} en M avec
la droite (OA).
52

o Puisque le triangle AMH est rectangle en H, on a


l'inégalité MH = sin(0) ,( MA; le plus court che-
min d'un point à un autre étant la ligne droite, la
...;
longueur MA est majorée par la longueur de l'arc
de cercle AM qui vaut 0 et on peut en conclure que 0 HAN
sin(0) ,( 0.

o Puisque la tangente (MN) est extérieure au disque, l'aire du triangle OMN, qui vaut
½tan(0), est supérieure à l'aire du secteur de disque (d'ouverture 0) délimitée par le segment
[OM], l'arc de cercle MA et le segment [AO] qui vaut ½0. Ainsi 0 ,( tan(0). ■

PREUVE. On pourrait admettre ces résultats comme des évidences géométriques liées à la
définition du sinus et du cosinus, nous adopterons cependant un regard plus analytique en nous
basant sur des inégalités. Le sinus étant positif sur [O, n/2], on déduit du lemme 3.1 que sur
cet intervalle O ,( sin(0) ,( 0. on a donc, d'après le théorème d'encadrement, lim sin(0) = O.
x--->O+
Puisque la fonction sinus est impaire, on en déduit que lim sin(0)
X--)Û
= 0 = sin(O). La fonction
sinus est donc continue en O. Puisque le cosinus est compris entre O et 1 sur l'intervalle [O, n/2],
on a cos 2 (0) ,( cos(0) ,( 1, c'est-à-dire 1-sin2 (0) ,( cos(0) ,( 1 et puisque le sinus tend vers 0
avec 0, on a d'après le théorème d'encadrement que lim cos(0) = 1. Puisque la fonction cos
x--->O+
est paire, on en déduit que lim cos(0) = 1. ■
x--->O

Des premier et second lemmes, nous déduisons la limite du rapport sin(0)/0 lorsque 0
tend vers O; cette quantité n'est autre que le taux d'accroissement de la fonction sinus en
O. Ce résultat du lemme 2 prouve donc la dérivabilité de la fonction sinus en O et précise la
valeur du nombre dérivé du sinus en O : sin'(O) = 1.

PREUVE. D'après le lemme 3.1, pour réel 0 appartenant à l'intervalle ]O,n/2[, on a sin(0) ,(
0 ,( tan(0). D'où, 0cos(0) ,( sin(0) ,( 0 pµis cos(0) ,( sin~eJ ,( 1. D'après le théorème
d'encadrement, on a donc lim sint) = 1. La fonction 0 H sin(0)/0 définie sur IR* étant
0--->0+
pa1re, r -sin(eJ- = l .
. on a d one e1!fb

0

Poursuivons notre chemin: du lemme 3.3 nous déduisons la limite suivante, qui n'est autre
que la limite du taux d'accroissement de la fonction cosinus en O. Ce résultat prouve donc la
dérivabilité du cosinus en O et précise la valeur du nombre dérivé du cosinus en O: cos'(O) = O.

PREUVE.
2
Pour tout O < 0 < n/2 ) cos(:)-l = -2sin ~0121 = -Hsin~~;21 )2.
Puisque 0/2
tend vers O avec 0, on déduit du lemme 3.3 et du théorème de composition des limites que
le rapport sin~~{21 tend vers 1 lorsque 0 tend vers O; d'après le théorème sur le produit des
53

limites, il en est de même de son carré. Et, toujours par le théorème sur les produits de limites,
le rapport cos(:l~l tend vers O avec 0. ■

L'essentiel du travail est maintenant accompli : nous allons réduire la dérivabilité des
fonctions sinus et cosinus en 0 0 E lR à l'étude (déjà menée à bien) du cas 0 0 = 0 grâce aux
formules d'addition.
Proposi~ion 3.5.. (Dérivabilité des fonctions cosinus et sinus). &sfortctions .wsmus
et sinus stint dérivables sur lR avec cos' = - sin et sin' =cos.
PREUVE. D'après le lemme 3.3, la fonction sinus est dérivable en O de dérivée 1. D'après le
lemme 3.4, la fonction cosinus est dérivable en Ode dérivée O. Soit 0 0 ER Puisque, pour tout
0 E lR
sin(0 0 + 0) = sin(0 0 ) èos(0) + cos(0o) sin(0),
la fonction sin est dérivable en 0 0 de dérivée sin(0 0 ) x O+cos(0o) x 1 = cos(0o). On raisonne
de la même façon pour la fonction cosinus. ■

Du théorème de dérivation d'un quotient découle sans peine la dérivabilité des fonctions
tangente et cotangente, ainsi que les formules résumées dans l'ultime proposition de ce para-
graphe.

Proposition 3.6. (Dérivabilité des fonctionstangente et cotangente). Lés foncJions


tangente et cotq,ngente sont dérivables respectivement sur leurs ensembles de définition et sùr
ces derniers

tan'{x}= 1 + tan2 (x)


1
= -COS2 () cotan'(x) = -1 - cotan2{x) = -~(·.
l
· X sm x)
PREUVE. o D'après le théorème de dérivation d'un quotient, la fonction tangente est dérivable
sur son ensemble de définition çg = lR \ { n/2 + kn, k E Z}, et sur çg

'( ) _ cos(x) cos(x) + sin(x) sin(x) _ 2( ) _ _ 1_


tan x - ( ) - 1 + tan x - ( ).
COS 2 X COS 2 X

o D'après le théorème de dérivation d'un quotient, la fonction cotangente est dérivable sur
son ensemble de définition çg = lR \ {kn, k E Z}, et sur çg

'( ) -sin(x)sin(x)-cos(x)cos(x)
cotan x = - - - - - ~2~ - - - - - = - 1 - cotan 2 ( x ) = - - -1- .
sin (x) sin 2 (x)

I.2. Étude des fonctions circulaires


o On a montré dans les classes secondaires les formules suivantes : pour tout réel 0, sin(-0) =
- sin( 0) et sin( 0+ 2n) = sin( 0), la fonction sinus est donc impaire et 2n-périodique; il suffit de
l'étudier sur l'intervalle [O, n]. D'après le paragraphe 11.1, la fonction sinus est dérivable sur lR
et sur cet ensemble sin'= cos. Le sinus est donc croissant sur [O, n/2] de O à 1 puis décroissant
sur [n/2, n] de 1 à O. La courbe représentative du sinus admet des tangentes horizontales aux
points d'abscisse x = n/2[n]. La tangente à l'origine est d'équation y= x (il s'agit donc de la
première bissectrice L1 du repère). On en déduit la courbe représentative de la fonction sinus.
54

r/J
V
~
i:o
,..;
V

~
o..

2

FIGURE 3.1. Courbe représentative de la fonction sinus

EXEMPLE 3. 7. Traçons la courbe de la fonction définie sur IR par f(x) = x + sin(x).


► Notons, pour tout réel x, M(x) le point de coordonnées (x, f(x)). Le point M(x + 2n) a
pour coordonnées (x+2n, f(x) +2n), il est donc image de M(x) par la translation de vecteur
u de coordonnées (2n, 2n). Il suffit donc de construire la courbe représentative de f sur [O, 2n]
et de translater la figure obtenue de ku pour tout k E Z. La fonction f est dérivable sur IR et
sur cet intervalle, f'(x) = 1 +cos(x) ~ 0 ne s'annulant qu'en n. La fonction réalise donc une
bijection strictement croissante de [O, 2n] sur [O, 2n]. On en déduit la courbe représentative
de f sur IR.

o D'après le formulaire de trigonométrie, pour tout nombre réel 0, on a cos(-0) = cos{0)


et cos(0 + br) = cos(0), la fonction cosinus est donc paire et 2n-périodique. Nous avons
également établi que le cosinus est dérivable sur IR et que cos' = - sin; on en déduit sans
peine les variations du cosinus sur IR. De plus, \10 E IR , cos(0) = sin(0 + n/2). Le point de
coordonnées (0,cos(0)) = (0,sin(0 + n/2)) se déduisant de M(0 + n/2,sin(e + n/2)) par la
translation de vecteur u= -fi, on construit la courbe du cosinus en translatant celle du
sinus du vecteur u.

EXEMPLE 3.8. Traçons la courbe de x E IR H f(x) = cos(x) + ½cos(2x).


► La fonction f est clairement paire et 2n-périodique, il suffit donc de l'étudier sur [O, n]. Elle
est de plus dérivable sur IR et sur cet intervalle, f'(x) = -sin(x)-sin(2x) = -2sin(x)[cos(x)+
1/2] Ainsi f' est négative sur [O, 2n/3] puis positive sur [2n/3, n], ne s'annulant qu'en 0, 2n/3
54

rJJ
Q,)
rJJ
cil


,...;
Q,)

~ 7I
2

FIGURE 3.1. Courbe représentative de la fonction sinus

EXEMPLE 3. 7. Traçons la courbe de la fonction définie sur R par f(x) = x + sin(x).


► Notons, pour tout réel x, M(x) le point de coordonnées (x, f(x)). Le point M(x + 2n) a
pour coordonnées (x + 2n, f (x) + 2n). il est donc image de M (x) par la translation de vecteur
Ü de coordonnées (2n, 2n). Il suffit donc de construire la courbe représentative de f sur [O, 2n]
et de translater la figure obtenue de kû pour tout k E Z. La fonction f est dérivable sur R et
sur cet intervalle, f'(x) = 1 + cos(x) :? 0 ne s'annulant qu'en ?T. La fonction réalise donc une
bijection strictement croissante de [O, 2n] sur [O, 2n]. On en déduit la courbe représentative
de f sur R.

7[

o D'après le formulaire de trigonométrie, pour tout nombre réel 0, on a cos(-0) = cos(0)


et cos(0 + 2n) = cos(0), la fonction cosinus est donc paire et 2n-périodique. Nous avons
également établi que le cosinus est dérivable sur R et que cos' = - sin; on en déduit sans
peine les variations du cosinus sur R De plus, \f0 E R , cos(0) = sin(0 + n/2). Le point de
coordonnées (0, cos(0)) = (0, sin(0 + n/2)) se déduisant de M(0 + n/2, sin(0 + n/2)) par la
translation de vecteur Ü = -fi, on construit la courbe du cosinus en translatant celle du
sinus du vecteur Ü.

EXEMPLE 3.8. Traçons la courbe de x ER H f(x) = cos(x) + ½cos(2x).


► La fonction f est clairement paire et 2n-périodique, il suffit donc de l'étudier sur [O, n]. Elle
est de plus dérivable sur R et sur cet intervalle, f'(x) = -sin(x)-sin(2x) = -2sin(x)[cos(x)+
1/2] Ainsi f' est négative sur [O, 2n/3] puis positive sur [2n/3, n], ne s'annulant qu'en 0, 2n/3
55

et 1r. La fonction f est donc strictement décroissante sur [O, 2n/3) de 3/2 à -3/4 et strictement
croissante sur [2n/3, n] de -3/4 à -1 /2. On en déduit la courbe représentative. rJJ

1
-~u
rJJ

1
7[

O?
..d
ü

----

7[

FIGURE 3.2. Courbe représentative de la fonction cosinus

o La fonction tangente est définie sur l'ensemble

91 = lR \ {n/2 + kn, k E Z}.

D'après le cours de trigonométrie, pour tout nombre réel appartenant à 91, tan(0+n) = tan(0)
et tan(-0) = - tan(0). La tangente est donc une fonction impaire et 7t-périodique : il suffit de
l'étudier sur l'intervalle [O, n/2[ pour tracer sa courbe représentative sur 91. On rappelle que,
pour tout réel x appartenant à [O, n/2[, on a tan(x) = sin(x)/ cos(x), or, lim sin(x) = 1
X---ln/2-
et lim cos(x) = 0+, ainsi lim tan(x) = +oo. Puisque la dérivée de la tangente vaut
X---l7î/2- X---l7î/2-
tan1 = 1 + tan 2 = ~
cos
> 0, la fonction tangente réalise une bijection de [O, n/2[ sur [O, +oo[.

o La fonction cotangente est définie sur l'ensemble 91 = lR \ {kn , k E Z}. Elle est dé-
rivable sur cet réunion d'intervalles, avec cotan' = -1 - cotan 2 = -::b-.
sm
D'après le cours
de trigonométrie, pour tout réel 0 E 91, cotan(0) = - tan(0 + n/2). Puisque le point
M(0,cotan(0)) = (0,-tan(n/2+0)) se déduit du point M'(0+n/2,tan(0+n/2)) par la
symétrie glissées d'axe (Ox) et de vecteur û = fi,
la courbe représentative de la cotangente
est l'image de la courbe de la fonction tangente par la symétrie glissée s. On rappelle que,
pour tout x E)O, n/2[, on a cotan(x) = cos(x)/ sin(x). Or, lim sin(x) = 0+ et lim cos(x) = 1,
X---lO+ X---lO+
ainsi lim cotan(x) = +oo.
X---lO+
56

rf)
<U
~
CO

7r
2

7I

La tangente La cotangente

FIGURE 3.3. Courbes représentatives de la tangente et de la cotangente

EXEMPLE 3.9. Prouvons que la fonction cp définie paru H ucotan(u) réalise une bijection
de l'intervalle ouvert JO, n[ sur un intervalle à préciser.
► La fonction <D est dérivable sur JO, n[ en tant que produit de
fonctions dérivables sur cet intervalle et Vu EJO, n[, 7I

-u cos(u) sin(u) sin(2u) - 2u


cp'(u) = sin 2 (u) + sin 2 (u) = 2sin 2 (u)

Or, Vx > 0 , sin(x) < x, d'où pour tout O < u < 7t, cp'(u) < O.
La fonction cp est donc strictement décroissante sur ]O, n[. De plus
sin(u)
lim cp(u) = -oo; comme cp(u) = ~(1 cos(u) et lim - - = U~Ü+ U
U-----f7T- Slll U

1, on a lim cp(u) = 1. La fonction cp réalise donc une bijection


u--;0
strictement décroissante de JO, n[ sur J - oo, 1[.

Remarque. L'inégalité sin(u) < u peut s'obtenir de deux manières : par une étude de
fonction (ici x H x - sin(x)), par un argument géométrique exposé dans le lemme 1.

Test 3.1. Test 3.2.


Justifier sans aucun calcul l'inégalité Déterminer l'équation de la tangente en n/4 au
graphe dans un repère orthonormé de
'r/x) Î , sin(x) < x. 1
x H tan(x)- --(-).
tan x
57

li. FONCTIONS CIRCULAIRES RÉCIPROQUES

Rappelons la célèbre loi de Snell-Descartes de


la réfraction d'un rayon lumineux au contact de
deux milieux d'indices différents, n, et nz. En no-
tant respectivement i et r les angles d'incidence
i et de réfraction du rayon lumineux, la loi de Des-
cartes s'écrit n 1 sin(i) = n 2 sin(r). Connaissant
les indices n, et n2 ainsi que l'angle d'incidence
i, la détermination de la direction du rayon ré-
fléchi au contact du dioptre passe donc par la
résolution de l'équation
r
. ()
sm X = -n, sin
. (")
l .
n2
Au-delà des équations particulières

FIGURE 3.4. Loi de la réfraction sin(x) = 0, ± 1, ± 1/2, etc,


dont les solutions se décrivent au moyen des mesures d'angles remarquables 0, ±n/2, ±n/6,
etc, nous devons forger un outil permettant de résoudre ces équations.

II.1. La fonction arcsinus


Le sinus réalise une bijection de l'intervalle
[-n/2, n/2] sur [-1, 1]. Pour tout réel x com-
pris entre -1 et 1, l'unique mesure d'angle ex
appartenant à l'intervalle [-n/2, n/2] dont le si-
nus vaut x est appelée l'arcsinus de x et notée --y
7(

ex= arcsin(x). On a par exemple arcsin(0) = 0,


7(

. 7t 2
arcsm(± 1) =± . /1
arcsm(±1/v2) = ± 7t ,
2 4 -1
. /1 7t . 7t
arcsm(±v 3/2) =± , arcsm(±l/2) = ± .
3 6
Ces résultats se retrouvent facilement à partir du FIGURE 3.5. Le sinus sur [-n/2, n/2]
cercle trigonométrique.
58

<ll
L'arcsinus vu sur le cercle trigonométr ique
GJ
<ll
C!l
CD L'arcsinus d'un réel x appartenant à l'intervalle [-1, 1] est l'unique réel appartenant à
....; l'intervalle [-n/2, n/2] dont le sinus vaut x .

arcsin ( x)

0 0
arcsin (x)
X < Ô

Test 3.3. Test 3.4.


Soit x E [-1, 1]. L'équation sin(0) =x est-elle Montrer que la fonction sin réalise une bijec-
équivalente à 0 = arcsin(x)[2n] ? tion f de [n/2, 3n/2] sur [-1, 1]. Exprimer f~l
à l'aide de arcsin.

L'équation arcsin(x) =a
Le lecteur prendra garde à ce que l'équation arcsin(x) = a n'est pas équivalente à
sin(a) = x, afin d'obtenir une équivalence, il faut imposer -n/2 ~ ex ~ n/2. Par
exemple, l'égalité sin(2n) = sin(0) = 0 est vraie mais 2n =f 0 = arcsin(0).

Revenons un instant à la loi de réfraction de Descartes.

EXEMPLE 3.10. Calculons de manière approchée la direction du rayon réfracté issu d'un
rayon d'angle d'incidence 90 degrés au contact du dioptre air-eau.
► L'indice de l'air vaut 1 (1 est en fait l'indice du vide), et celui de l'eau vaut à peu près 1,3.
On doit donc résoudre sin(r) = 1/1,3. Ainsi, r ~ arcsin(l/1.3) ~ 0.877 radians ie r ~ 50.3
degrés.

Proposition 3.11. (Propriétés de l'arcsinus).


l) Vxe [~1, 11, sin(arcsin{x)J;, x et oos(arcsin(x))::;:: Jl-x2 .
2) Vx E llt, arœin(siù(x}) = x siet seulement si - ; ~ x.~ η

PREUVE. 1) Soit x E [-1, 1]. D'après la définition de l'arcsinus, arcsin(x) est une me-
sure d'angle dont le sinus vaut x. Ainsi, sin(arcsin(x)) = x. On a de plus cos 2 (arcsin(x)) +
sin 2 (arcsin(x)) = 1 d'où cos(arcsin(x)) = ±vî=xZ. La fonction cosinus étant positive sur
59

l'intervalle [-n/2, n/2] auquel appartient arcsin(x), on a cos(arcsin(x)) = v'l - x 2 . 2) Par


définition de l'arcsinus, la fonction arcsin o sinl [-n/2,n/2] vaut id 1. Ce qui prouve, pour tout
réel x, l'implication - 1 ~ x ~ 1 =} arcsin(sin(x)) = x. Réciproquement, soit x E lR. Puisque
l'arcsinus est à valeurs dans I, arcsin(sin(x)) = x ---1 x E 1. ■

EXEMPLE 3.12. Calculons arcsin(sin(a)) lorsque a= 3n/7, -2n/3 puis 19n/7.


► Puisque 3n/7E [-n/2, n/2], on a arcsin(sin(3n/7)) = 3n/7. Puisque sin(-2n/3)
sin(-n/3) et que -n/3 E [-n/2,n/2], on a aussi arcsin(sin(-2n/3)) = -n/3. Puisque
sin(19n/7) = sin(2n/7) et 2n/7 E [-n/2,n/2], on a arcsin(sin(19n/7)) = 2n/7.

7[
2

7[
2

7[
--y

FIGURE 3.6. Courbe représentative de la fonction arcsinus

Pro11~~i~<>!l 3.13, c{Pl'Qpriêt~ <!~ l'~~s~us}... U Jon<;twn ~w. r6.ûis~. ~rilbîjecti<m. ~e·
[-7t!Î{'1tf2ksurl-l, ll de bijection réë.ipTV:</#e .Mt{e ~ciùµ î hl,Jl t4'l~i/2; i/2]. ·
1) '~fonÙion aresin est i~paite et Qdntin~ sur hl,tj, ... · . . ....
2) L 'arcsinus est dérivable sur] - l, l[ avec, Vx Ei --": 1f lf , a.rcsiu'{~) =· .l · • >·•
·.· . . .. .· . .··· y1-~2
3} L'arcsmus n'est pas dérivable en ±1, sti. courbe representative admettant en ces points
une tangente verticale.
PREUVE. 1) La fonction sinus est dérivable sur lR de dérivée cosinus, qui est positive sur
l'intervalle [-n/2, n/2] ne s'annulant sur cet intervalle qu'en ±n/2. D'après la proposition
2.30 (page 45), la fonction sinus réalise une bijection strictement croissante de [-n/2, n/2]
sur [-1, 1]. De plus, sa bijection réciproque arcsin: [-1, 1] ---1 [-n/2,n/2] est continue. Soit
x E [-1, 1]. Puisque le sinus est impair, - arcsin(x) est un angle dont le sinus vaut -x, puisque
- arcsin(x) E [-n/2, n/2], - arcsin(x) = arcsin(-x). L'arcsinus est donc une fonction impaire.
2) Soit y E [-1, 1]. D'après le théorème de dérivabilité d'une bijection réciproque (cf. page
48), la fonction arcsinus est dérivable en y si et seulement si

sin' ( arcsin(y)) = cos ( arcsin(y)) = ~ /. 0,

c'est-à-dire si et seulement si y /. ± 1. La fonction arcsin est donc dérivable sur] - 1, 1 [, avec


sur cet intervalle (toujours d'après le théorème de dérivabilité d'une bijection réciproque),
arcsin'(y) = ~ -
yl-1!2
60

3) D'après le théorème de dérivabilité d'une bijection réciproque et le calcul précédent, la


courbe représentative de la fonction arcsin admet une tangente verticale aux points
d'abscisses ± 1. ■
...;
On déduit la courbe représentative de l'arcsinus sur [-1, 1] de celle du sinus sur l'intervalle
[-n/2, n/2] par une symétrie par rapport à la première bissectrice,

EXEMPLE 3.14. Étudions la fonction f définie par f(x) = arcsin(sin(x)) en répondant au


questions suivantes :
1. Tracer la courbe représentative de f après avoir examiné les symétries de la fonction.
2. Résoudre dans lR les équations f(x) = 0, f(x) = 1 et f(x) = 7t.
3. Soit k E Z. Exprimer la fonction f sur l'intervalle Ik = [-n/2 + kn, n/2 + kn].
► La fonction f est définie sur lR car le sinus est défini sur lR à valeurs dans [-1, 1], ensemble
de définitions de l'arcsinus.
1. La fonction f est impaire en tant que composée de fonctions impaires et ln-périodique
comme le sinus. On peut cependant faire mieux en remarquant que pour réel x, f(x + n) =
-f (x) : la fonction est 7t-antipériodique, il suffit donc de l'étudier sur l'intervalle [O, n/2]. Sur
cet intervalle, on a arcsin(sin(x)) = x. On en déduit la courbe de f.

2. f(x) = 0 équivaut à arcsin(sin(x)) = 0 ou encore à sin(x) = O. Ainsi l'ensemble des


solutions est-il égal à nZ; f(x) = 1 équivaut à arcsin(sin(x)) = 1 ou encore à sin(x) =
sin(n/3). Ainsi l'ensemble des solutions est la réunion de 1 + 2nZ et de 2f
+ 2nZ. Puisque
7t r/. [-n/2, n/2], la dernière équation n'admet aucune solution.
3. Soient k E Z et x E Ik. Distinguons deux cas.
Supposons k impair. On a alors sin(kn - x) = sin(x) et puisque kn - x E [-n/2, n/2],

f(x) = arcsin(sin(k7t- x)) = kn - x.

Supposons k pair. On a alors sin(x - kn) = sin(x) et puisque x - kn E [-n/2, n/2],

f(x) = arcsin(sin(x - kn)) =x- kn.


II.2. La fonction arccosinus
Le cosinus réalise une bijection de l'intervalle [0, 7t] sur
[-1, 1]. Pour tout réel x compris entre -1 et 1, l'unique me- 7{

sure d'angle ex appartenant à l'intervalle [0, 7t] dont le cosinus


vaut x est appelée l'arccosinus de x et noté ex= arccos(x).
On a par exemple

arccos(l) = 0 , arccos(-1) = 7t , arccos(l /2) = n/3,


FIGURE 3.7. La fonction
arccos(l/v'2) = n/4 arccos(0) = n/2 , arccos(\/3/2) = n/6, cosinus sur [0,n]
arccos(-1/2) = 2n/3 , arccos(-1/v'2) = 3n/4,

et arccos(-v'3/2) = Sn/6.
On utilisera le cercle trigonométrique pour retrouver ces valeurs particulières en prenant
garde à l'ensemble d'arrivée de la fonction arccosinus. Ainsi l'équation arccos(x) = ex n'est
pas équivalente à cos( ex) = x, pour obtenir une équivalence, il faut imposer la restriction
0 ~ex~ 7t. Par exemple, le nombre réel arccos(cos(3n/2)) est l'unique réel apartenant à [0,n]
dont le cosinus vaut cos(3n/2) = 0, on a donc arccos(cos(3n/2)) = n/2.

EXEMPLE 3.15. Calculons arccos(cos(cx)) lorsque ex= 3n/7,-2n/3 puis 19n/7.


► Puisque 3n/7 E [0,n], on a arccos(cos(3n/7)) = 3n/7. Puisque cos(-2n/3) = cos(2n/3)
et 2n/3 E [0,n], on peut en conclure que arccos(cos(-2n/3)) = 2n/3. Puisque cos(19n/7) =
cos(Sn/7) et Sn/7 E [0, n], on a arccos(cos(l9n/7)) = Sn/7.

On tirera la leçon de cet exemple en mémorisant la figure suivante.

L'arccosinus vu sur le cercle trigonométrique

L'arccosinus de x E [-1, 1] est l'unique point de [0, 7t] dont le cosinus vaut x.
62

Test 3.5. Test 3.6.


00
Soit x E [-1, 1]. Représenter sur le cercle Montrer que la fonction cos réalise une bijection
~
til
trigonométrique l'égalité arccos(-x) = 7t - f de [21t,31t] sur [-1, 1]. Exprimer f- 1 à l'aide
.... arccos(x). de arccos .

La proposition suivante détaille les propriétés de l'arccosinus, qui se démontrent facilement


selon les mêmes arguments qu'à la proposition 3.13.

P~îtmîr"af16f (i>rÔi,~ét~ Jte J'ar~~in~). .. ....:'tî. ·


:'it cgs{ai~~f~)J;=x ~
0 •·.-1.· .

1) ·. Vx Ë [-1 ~tsî~{axq«is{x}} 1
2) vie R, ar~{;ua{xH ~-X si et sèuleniênt~si O~ x i"~t
EXEMPLE 3.17. Simplifions, pour tout x E [-1, 1], sin(2arccos(x)) et sin(4arccos(x)).
► Soit x E [-1, 1]. Posons 0 = arccos(x). On a sin(20) = 2sin(0) cos(0) = 2x ✓ l - x2 . De
plus,cos(20) =2cos (0)-1 =2x 2 -1 doncsin(40) =2sin(20)cos(20) =4x ✓ l -x2 [2x 2 -l].
2

Remarque. Puisque cos(arccos(x)) = x et sin(arccos(x)) = ✓1 -x2 , l'idée directrice de ce


genre d'exemple est de tout exprimer en fonction de cos et sin.
On étudie la fonction arccosinus à l'aide du théorème de dérivation d'une bijection réci-
proque. La démonstration suit point par point celle déjà entreprise pour la fonction arcsinus.

PropositionS.18•. {Propr~és de l1ai:ccosînus). Lafonctîon·cos réalisê une bijection de


[O, 111 S'll,r .[-l ,JJ tfe .biJ'ectitmfréaiprfJque notlfe. -~•.:+-,l, ll H l~·nl~
1) La fonctio.n arcoos est continue sur L-1, 1}.
, • ,>-'' • ,-'_ ._a_~---

2)L'(l~sinl(#isti~ê•sur'fl 1/1t~~\i'x~Je::1f,:1r:I~"{i)-=4
3) L'a~sîh~l:•~~ÎHtS'iUrl,wllk ~n
une tangente !flèrtîcoJe. ·. ·
±1,. sa•wûrilè'.~~~~'ailmê~
·· ·
.en. œs p<>i:rits

Les courbes représentatives de l'arccosinus sur [-1, 1] et du cosinus sur [O, 7t] sont symé-
triques par rapport à la première bissectrice, d'où le tracé suivant.

-1

Courbe représentative de l'arccosinus Arcsinus + arccosinus = "Î


FIGURE 3.8. Autour de l'arccosinus
63

R~O$~â;,if+,'.~"~J~~-~fl'~Ji:i {~ijf~,~~~~,.
ttngûfà ï~4{~:1~15,1i ~(xf+.~ûf~l'si;'Jt'<:' è·.·

PREUVE. Soit x E [-1, 1]. Posons a=n/2-arcsin(x). Puisque arcsin(x) E [-n/2,n/2], on


a a E [0, n]. De plus, cos(a) = sin{arcsin(x)) = x. Ainsi a= arccos(x). ■

EXEMPLE 3.20. Démontrons la proposition 3.19 en utilisant la dérivation.


► Posons, pour tout x E [-1, 1], f(x) = arcsin(x) + arccos(x). Cette fonction est continue
sur [-1, 1] et dérivable sur] - 1, 1[. Sur ce dernier intervalle, f'(x) = vl~x2 - vl~x2 = O. La
fonction f est donc constante sur l'intervalle] - 1, 1 [. Puisque f(0) = arcsin(0) + arccos(0) =
0 + 1 = 1, f vaut 1 sur] - 1, 1 [. On en déduit que arcsin(x) + arccos(x) = 1 sur [-1, 1] par
continuité de f sur cet intervalle.

Remarque. L'argument de continuité est ici essentiel car il permet de prolonger l'égalité
arcsin( x) + arccos( x) = 1, valable a priori sur ] - 1, 1 [, à l'intervalle fermé [-1 , 1].

11.3. La fonction arctangente


La fonction tangente réalise une bijection de ] - n/2, n/2[ sur R
Pour tout nombre réel x, l'unique mesure d'angle a appartenant
à l'intervalle ] - n/2, n/2[ telle que tan( a) = x est appelée l'arc-
tangente de x et notée a = arctan( x). On a par exemple
arctan(l) = n/4 , arctan(0) = 0,
arctan(l/v'3) = n/6, arctan(v'3) = n/3, FIGURE 3.9. tan sur
arctan(-v'3) = -n/3, arctan(-1/v'3) = -n/6. ] - n/2, n/2[
Ces valeurs se lisent directement sur le cercle trigonométrique. Comme pour les fonctions
arcsinus et arccosinus, il est recommandé de retenir la petite musique suivante.

L'arctangente vue sur le cercle trigonométrique


L'arctangente d'un nombre réel x est l'unique nombre réel appartenant à l'intervalle
] - n/2, n/2[ dont la tangente vaut x.

X> Û

arctan (x)

arctan ( x)
0
X< Û
64

Mettons encore une fois en garde le lecteur contre les équations où interviennent des fonctions
(F) circulaires réciproques. Par exemple, l'égalité arctan(x) = ex n'est pas équivalente à l'égalité
s<lJ

...;
tan(cx) = x, car dans cette dernière le réel ex n'appartient pas nécessairement à l'intervalle
] - n/2, n/2[. Voici un autre exemple : le nombre réel arctan(tan(n)) est l'unique réel ap-
partenant à] - n/2, n/2[ dont la tangente vaut tan(n) = 0, ainsi arctan(tan(n)) = O. La
proposition suivante est une conséquence immédiate de la définition de l'arctangente.

Proposition J.~n~. (Propriétés de rar:e~en.te).


l)·~ ER ,"iM(tirè\iail{xH= ;,x;.
2) Pourtou(réel X~. 1{1il, ai-ctan\tan(x)) =isi etseû1Jment si -1< x < l
EXEMPLE 3.22. Calculons arctan(tan(cx)) lorsque ex= 33n/7,-8n/3 puis 19n/7.
► Puisque 33n/7 = 57t - 2n/7 et -2n/7 E] - n/2, n/2[, on a arctan( tan(33n/7)) = -2n/7.
Puisque -8n/3 = -3n+n/3 et n/3 E]-n/2, n/2[, on a arctan(tan(-8n/3)) = n/3. Puisque
19n/7 = 3n - 2n/7 et -2n/7 E] - n/2, n/2[, on a arctan( tan( l 9n/7)) = -2n/7.

Pràposition, a.23.. (Défüdtlon,tl~l'~tangenté); ·l,d,/Q'fÙ;tiooÎàn 'l'ialisë ûne JÎijectimt


de J - n/2; 1t/1[ sur R. de bijection n!ciprogùe notée a,retan : R H]. - 'lr,/2, 7i:/2[.
1) La fonction ~tan 'est îm)pairé et· eôntinké SÙ'f' lR': ·.

2) L'aœtangente et déri~ble sur !R avec 1-/x ER. , a,rctanf(x}=


1
+xr
!J

PREuvE. 1) La fonction tangente est dérivable sur] - n/2,n/2[ de dérivée 1 + tan 2 , qui
est strictement positive sur R D'après la proposition 2.30 (page 45), la fonction tangente
réalise une bijection strictement croissante de ] - n/2, n/2[ sur R Sa bijection arctan : lR ---)
] - n/2, n/2[, est continue. 2) Soit 1J E R D'après la proposition 2.35 (page 48), la fonction
arctangente est dérivable en 1J si et seulement si tan'(arctan(y)) = 1 + tan 2 (arctan(y))
1 +y 2 -/- O. La fonction arctan est donc dérivable sur lR et \fy E JR, arctan'(y) = G7
1
. ■
+Y

On déduit la courbe représentative de l'arctangente sur lR de celle de la tangente sur


l'intervalle] - n/2, n/2[ par la réflexion d'axe l'., première bissectrice du repère.

------------------------------------i-~------ -
'1
FIGURE 3.10. Courbe représentative de la fonction arctangente

Test 3.7. Test 3.8.


Quelle est l'équation de la tangente à l'origine Établir que Vx? O,arctan(x) ,S:: x.
du graphe de l'arctangente ?
65

Propôski~·:S,24~\Prtjpriêfê.;iœi :tterèf~}.t\ 'i$x:{E: g;,~ t'é~}J:Ôf~ttiit~i+


arctan{l/x) ,;,,signe(x}l · · · · · ···

PREUVE. Soit x > O. Posons ex= n/2-arctan(x). Puisque arctan(x) E]O,n/2[, ex appartient
à ]O,n/2[. De plus, tan(cx) = 1/tan(arctan(x)) = 1/x. D'où arctan(x) + arctan(l/x) = 1-
Dans le cas où x < 0, la formule découle de ce qui précède par imparité de l'arctangente. ■

Cette proposition peut également être démontrée par une simple étude de fonction.

EXEMPLE 3.25. Redémontrons la proposition 3.24 en utilisant la dérivation.


► Notons, pour tout x E JR*, f(x) = arctan(x) + arctan(l/x). Cette fonction est dérivable
sur JR*, et sur cet ensemble

, 1 1 1 O
f (x) = 1 +x 2 - x 2 x 1 + (1/x) 2 = ·

La fonction f est donc constante sur chacun des deux intervalles ]-oo, O[ et JO, +oo[. Puisque
l'on a f(l) = 2 x n/4 = n/2 et f(-1) = -2 x n/4 = -n/2, on en déduit que pour tout réel
x non nul, arctan(x) + arctan(l/x) = signe(x) 1.

Remarque. Rappelons une fois encore que l'implication f' = 0 =} f constante n'est valable
que sur un intervalle.

EXEMPLE 3.26. Prouvons la formule arctan(l /2) + arctan(l /5) = arctan(7 /9).
► Posons ex = arctan( 1/2) +arctan( 1/5). La fonction arctangente étant strictement croissante
sur JR, les inégalités 1/2 < 1, 1/5 < 1 et les deux égalités O = arctan(O),n/4 = arctan(l)
entraînent que O < ex< 2n/4 = n/2. D'après la formule d'addition de la tangente, tan( ex) =
1/2+1/5 7 . . (7/9) .
1_ 1110 = 9 , ams1 ex= arctan

Remarque. On retiendra que l'égalité ex = arctan( (3) est vérifiée si et seulement si ex


appartient à l'intervalle] - n/2, n/2[ et vérifie tan( ex) = (3.

EXEMPLE 3.27. On pose, pour x ~ 0, f(x) = arccos C~:). Étudions la fonction f en


répondant aux questions suivantes.
1. La fonction f est-elle bien définie ?
2. Justifier que tout réel positif x peut s'écrire sous la forme x = tan 2 (0/2) avec O ~ 0 < n.
3. Soit x ~ O. Simplifier f(x) en posant x = tan 2 (0/2) avec O ~ 0 < n.
► Attention aux ensembles de définition.
1. Oui, car pour tout réel x positif, 11 - xi ~ 1 + x donc )~: E [-1, 1], intervalle de définition
de l'arccosinus.
2. Soit x ~ O. Posons 0 = 2 arctan( vxl. D'après les variations de l'arctangente sur lR+, on
a O ~ 0 < 7t. De plus, vx = tan(0/2) d'où x = tan 2 (0/2).
3. Soit x ~ O. Posons 0 = 2arctan(vxl de sorte que x = tan 2 (0/2). Puisque:~:= cos(0)
et O ~ 0 < n, f(x) = arccos(cos(0)) = 0 = 2arctan(y'x).
III. APPLICATION À LA SUPERPOSITION DE SINUSOÏDES

Soient a et b deux nombres réels. On s'intéresse à la superposition de deux signaux sinusoïdaux


..... de même pulsation, c'est-à-dire finalement à une fonction de la forme 0 E lR H f(0) =
acos(0) + bsin(0).
Plaçons-nous par exemple dans le cas où b /= O. On remarque que 1 ✓a2a+bz l ~ 1. Posons
alors 80 = signe(b) x arccos( ✓ aza+\,2), de sorte que ✓ a2a+b2 = cos(0o) et ✓ ui'+bz = sin(0o).
Pour tout nombre réel 0

f(0) = J a1 + b 1 [cos(0 )
0 cos(0) + sin(0 0 ) sin(0)] = J a1 + b 1 cos(0 - 0 0 ).

La fonction f est donc une sinusoïde de même pulsation que ces deux composantes, seule
l'amplitude a changé et un déphasage 0 0 est apparu. Pour tout nombre réel c, l'équation
f(0) = c est équivalente à cos(0 - 0 0 ) = ✓ a2c+b2 , et admet donc des solutions si et seulement
si 1 ✓a2c+b2 I ~ 1.

EXEMPLE 3.28. On pose, pour tout nombre réel x, f(x) = 2sin(x) + 3cos(x). Étudions f
en répondant aux questions suivantes :
1. Tracer la courbe représentative de f.
2. Déterminer les ensembles f(x) = 1.
3. Étudier le signe de f sur l'intervalle [0,2n]. Résoudre sur lR l'inéquation f(x) < O.
► La fonction f est bien sûr définie sur R
1. Posons Xo = arccos(3/~) de sorte que sin(x 0 ) = Jl -9/13 = 2/~. Pour tout
nombre réel x, f(x) = ~[/4
sin(x) + cos(x)] k = ~cos(x - Xo). On en déduit la
courbe représentative de f.

Xo

2. Un réel x appartient à f(x) = 1 si et seulement si cos(x - x 0 ) = 1/~. Les solutions


de cette équation étant les nombres réels de la forme ± arccos ( 1/ ~ ) + x 0 + 2kn, k E Z,
l'ensemble des solutions est la réunion de arccos(l/~) +x 0 +2nZ et de -arccos(l/~) +
xo+lnZ.
3. Rappelons que Vx E JR, f(x) = ~cos(x - x 0 ) et remarquons que 3 / ~ > 0 =} x 0 E
[O, n/2[. La fonction f est donc positive sur [O, x 0 + n/2] U [3n/2 + x 0 , ln] et négative sur
[n/2+x0 , 3n/2+xo]. La fonction f étant ln-périodique, l'ensemble des solutions de f(x) < 0
est Y' = ukEZ]n/2 + Xo + lkn, 3n/2 + Xo + 2kn[.
67

IV. EXERCICES
rJl

3.1.

Étudier puis tracer les graphes des fonctions


3.6.

Prouver l'égalité suivante :


j
(,)
rJl
définies de fit dans fit par
4 arctan ( ~) - arctan ( ; )
2 9
7t

4 1
~
et ('")

3.7. a
On cherche à résoudre dans fit l'équation sui-
3.2. vante:
71
Étudier les variations sur fit et tracer le graphe arctan(2x) + arctan(x) = .
2
de la fonction f définie par
1. Montrer que si x est solution, alors nécessai-
Vx E fit , f(x) = sin(x) sin(2x). rement x vérifie l'équation 2x 2 + 1 = O.
2. Étudier la réciproque.

3.8.
3.3.

On se propose de simplifier la quantité


Tracer le graphe des fonctions définies par
1
1. x H arccos(cos(x))- arccos(cos(2x)).
2 arcsin (
1
!\ 2) - 2 arctan( x).

2. x x - . (
arcsm 1 + sin(x)) .
H 1. Pour quelles valeurs de x est-elle définie ?
2 2
2. Premième méthode de simplification. Utili-
3.4. ser la dérivation.
3. Deuxième méthode de simplification. Utiliser
On pose 1J
1
= arcsin ( \ v'S). Calculer
le paramétrage rationnel du cercle.

cos(4y) et en déduire la valeur de y.


3.9.
3.5.
On cherche à résoudre sur lR l'équation sui-
vante:
Soient a et b deux nombres réels positifs. Prou-
ver qu'il existe un unique c E fit tel que Sn
arctan(x-3) +arctan(x) +arctan(x+3) = .
4
arctan(u) -arctan(b) = arctan(c).
1. Prouver que x = 5 est solution.
Exprimer c en fonction de a et b. 2. Conclure.
Chapitre 4
LOGARITHME, EXPONENTIELLE,
FONCTIONS HYPERBOLIQUES

ORSQU'ON dispose de deux règles graduées R0 et R1, il est très facile de faire des additions

L approchées. Si l'on veut par exemple calculer 3, 8 + 5, 7 (ce que l'on pourrait aussi
faire mentalement bien sûr), il suffit de faire correspondre le O de la règle R0 avec la
graduation 3, 8 de R1, et de lire sur R1 la graduation correspondant à la graduation 5, 7 de
R0 . On constate que l'on trouve 9, 5, ce qui ne surprend personne.

0 2 3 4 5 6 7 8 9 10
1 11 11 11 11 11 11 1 11 1 1 1
0 1 2 3 4 5 6 7 8 9 1 1
10:

FIGURE 4.1. Une addition à la règle

Une question naturelle est alors de se de-


mander s'il existe un procédé analogue
pour faire des multiplications. La réponse a
une longue histoire. Les premiers éléments
étaient déjà connus d'Archimède, mais ils
furent pour la première fois complètement
mis en forme par John Napier, dit Neper,
qui construisit en 1614 la première table de
logarithmes.
John Napier (Neper)

L'idée est tout simplement d'observer que si l'on forme une suite géométrique de raison a,
et si on indexe chaque terme de la suite par son exposant, c'est-à-dire si l'on pose Xn = un,
pour n EN, alors le terme dont l'indice est la somme n+m est le produit des termes d'indices
net m
Xn+m = U n+m = Un U m = Xn Xm.
Cette correspondance se matérialise en termes de "règles graduées" de la manière suivante.

ao al al a3 a4 as ...
l l l l l l
0 1 2 3 4 5
012345···
îîîîîî···
ao a 1 az a3 a4 as ...
70

En suivant le même principe que pour les règles graduées, on voit sur cette juxtaposition
rJJ
Cl)
de suites que a 3 a 2 = a 5 .
~ La remarque que nous venons d'illustrer permet donc dans une certaine mesure de trans-
i:o
...;
former les sommes en produits. Mais elle est insuffisante, puisqu'elle se limite aux produits
de nombres qui sont des puissances entières de a. Les fonctions logarithme et exponentielle
permettent de pallier cette lacune, comme nous allons le voir dans ce qui suit.
Tout ce chapitre repose sur le fait qu'une fonction continue strictement monotone sur un
intervalle est une bijection de cet intervalle sur son image. Cette propriété fondamentale sera
démontrée au chapitre 25.

I. FONCTIONS LOGARITHME ET EXPONENTIELLE


Ce que nous venons de décrire reposait sur le choix d'un réel positif particulier a. La construc-
tion que nous allons donner privilégie un tel nombre, que l'on note e, auquel on a donné le
nom de nombre d'Euler.

I.1. Logarithme naturel


Commençons par une remarque fondamentale. Pour tout entier n E Z, la fonction

est continue, et par conséquent elle possède une primitive.


Si n =/- -1, on sait que la fonction rationnelle ]R~ -, lR, x H (n + n-
1xn+1, est une

primitive de In. En revanche, si n = -1 , la primitive ne peut plus être de la même forme.


Il se passe donc quelque chose lorsque n = 1. Loin d'être une simple remarque isolée, le
fait que nous venons de constater est à la base d'une très vaste construction mathématique.
La première manifestation de l'importance de ce fait singulier est qu'il permet de construire
une nouvelle fonction numérique, qui sera d'importance cruciale.

Définition 4.1. Le logarithme naturel (ou logarithme neperien)

ln : JR~ -, lR, x H lnx,

est l'unique primitive de la fonction L 1 : JR~-, lR, x H x- 1, qui s'annule en 1.

FIGURE 4.2. Le logarithme neperien


71

En d'autres termes,
x dt
lnx =
Jt
1
-,

Voici deux conséquences immédiates de cette définition.


◊ Le logarithme est une fonction de classe C • En effet, par définition, il est dérivable sur lR:'+-
00

et sa dérivée est la fonction x H 1/x, qui est de classe C00 •


1
◊ La fonction x H ln lxl est une primitive de x H x- sur JR*. C'est clair sur lR:'+-. Sur JR:_,
lxl = -x et la dérivée de x H ln( -x) est 1/x, par la règle de composition.

Proposition 4.2. Pour to-ut (x, y} E {R~J2, on a


1) ln(l) =0, 3) ln(x/y} =lnx-lny,
2) ln(xy}=lnx+lny, 4) ln{l/x}=-lnx.

PREUVE.

1) C'est la définition.
2) Soit y E lR:'+- fixé. Considérons la fonction f: x H ln x + ln y - ln(xy) définie sur lR:'+-. On a
f(l) = 0 et elle est dérivable, avec f'(x) = 0 pour tout x E lR:'+-. Comme lR:'+- est un intervalle,
f =0.
3) ln~ + ln y = ln ( ~ x y) = ln x.

4) C'est une conséquence de 1) et de 3).
La propriété 2) du théorème montre que le logarithme transforme la multiplication en
addition. Comme nous le verrons, en langage de théorie des groupes, la fonction ln de (lR:'+-, x)
dans (JR, +) est un homomorphisme. C'est ce que nous cherchions à réaliser en introduction.
Nous y sommes parvenus par un détour inattendu : au lieu de poursuivre l'idée des suites
géométriques, nous avons préféré construire une nouvelle fonction au moyen d'une intégrale.
Mais on prendra garde au fait que le logarithme transforme la multiplication en addition, alors
que les suites géométriques transformaient l'addition en multiplication (pour des puissances
entières). Les deux méthodes sont donc inverses. En fait, nous allons montrer maintenant que
le logarithme possède une fonction inverse, qui n'est autre que le prolongement d'une suite
géométrique bien choisie à des exposants variant sur la droite réelle tout entière.

Proposition 4.3,
1) La fonction ln est strictement 'croissante· sur R~.
2) lim .lnx=+oo.
x--t+oo
3) lûnlnx =: -'-oo.
x--tO+

PREUVE.

1) La dérivée du logarithme est strictement positive.


2) Comme ln est croissante, il suffit d'exhiber une suite réelle positive (UnlnEJ\! qui a pour
limite +oo et telle que la suite (ln (Un)lnEJ\! ait pour limite +oo. Prenons la suite de terme
général Un= 2n, n EN. On a limn-->oo ln (Un)= limn-->oo(nln2) = +oo car ln2 > O.

3) limx-->O+ lnx = limx-->+oo ln (x- 1 ) = -limx-->+oo lnx = -oo.
La fonction logarithme est donc continue et strictement croissante; nous savons que c'est
une bijection de son ensemble de définition sur son ensemble image, qui est R C'est ce que
nous allons maintenant exploiter.
72

...;

FIGURE 4.3. La fonction ln

1.2. Fonction exponen tielle


Pro}#~Ji:iont<t~finitio~ 4 ..4. -·.~ logaryth.me réalise une bijection de ai 1J:1tt' R. ~6/oncÊion
réciproqy,é es.t apperee exponentielle et nlJl,êe exp. Ainsi . .

,,
V X-€ R, 1n(expx) =x -
et
1, 'ewi/tmeUe ..çst .strictêmënt croiss~~'e~ et. dêri1Jàble dans R.
[on~tir;n fl.triViée, . Ëlle est ?ij;te' iJ:·,~·pr~r>rf;
.. . . . ' . .

PREUVE. On a vu que la fonction logarithme est continue, strictemen


t croissante et que ses
limites aux extrémités de son intervalle de définition JR~ sont -oo et +oo. Donc c'est une
bijection de JR~ sur R
De plus, le logarithme est une fonction dérivable dont la dérivée ne s'annule pas, donc
sa fonction réciproque exp est également dérivable. En appliquant la règle de dérivation des
fonctions composées à la première formule de (4.1), on trouve ex~x x exp'(x) = 1. On a donc
l'égalité exp'(x) = expx, pour tout réel x. ■

Remarquon s que puisqu'elle est définie comme la réciproque de la bijection ln: JR~ -) JR,
la fonction exponentie lle applique lR sur JR~. On préfère pourtant écrire exp : lR -) JR, en
gardant à l'esprit que expx > 0, pour tout x ER
Les propriétés du logarithme se complètent en propriétés correspond antes pour l'exponen-
tielle. La plus importante est certaineme nt la suivante.

:Proposîtion 4~5. Pour tout (x, y} E Jl.f2:, exp(x +y)= {expx)(explJ}.


PREUVE. Par définition,

ln(exp(x +y)) = x + y = ln exp x + ln exp y = ln ( (exp x)(expy ))


et la conclusion vient du fait que le logarithme est une bijection.

Les autres propriétés sont laissées en exercice; nous les rappelons dans le tableau suivant.
73

FIGURE 4.4. Les fonctions exp et ln

Les propriétés de ln et exp


1 1
ln(l) =0 ln lxl = - , x E JR*
X
lim lnx = +oo lim lnx = -oo
x------t+oo x----10+

ln(xy) =lnx+lny lnŒ) =lnx-lny


exp(O) = 1 exp'x = expx
limx--l+oo expx = +oo limx---->-oo expx = 0
exp(x +y)= exp(x) exp(y) exp(x - 11) = exp(x)
"' exp(y)

I.3. Exponentielle de base a. Le nombre e


Commençons par quelques rappels sur les puissances.

Exposant entier. Soit a un réel. Si p est un entier naturel, p 2 1, alors

aP =a·•• a et (4.2)
"-.,,-'
p fois

De plus on pose a 0 = 1. Cette définition implique la règle suivante


(4.3)

Ainsi, la définition d'une puissance de a avec un exposant entier est une question purement
algébrique. Elle ne fait intervenir qu'un nombre fini d'opérations élémentaires (multiplications
ou divisions).
74

Exposant rationnel. Soit q E N*. Alors, il est clair que la fonction <P : lR+ --, JR, x H xq est
rJl
11.) continue et strictement croissante. Comme <P(0) = 0 et limx-,+oo <P(x) = +oo, elle réalise une
~ bijection de lR+ sur lR+. Sa fonction réciproque est la racine q-ième
c:i
....
~ : lR+ --, lR, x H {l'x.
Si a > 0, par définition, {1/a est l'unique racine réelle positive de l'équation xq - a = O. On
la note aussi a"1
= ija.
Pour (p, q) E Z x N*, on vérifie que {1/aP = ijuP. On vérifie que, si (p ', q ') E Z x N* est tel
que p/q = p'/q', on a l'égalité {1/aP = W. Pour r E Q, avec r = p/q et (p, q) E Z x N*,
on peut donc poser
UT= {1/aP.
On vérifie facilement que cette définition pour les exposants rationnels prolonge celle pour les
entiers, c'est-à-dire que pour q = 1, on retrouve (4.2). De plus, on vérifie que la règle (4.3)
reste vraie pour des exposants rationnels.

Exposant réel quelconque. Quel sens donner maintenant à une expression comme 2v'.2?
Pour définir ax pour un exposant x réel quelconque, il est naturel d'exiger trois conditions :
1) le nombre ax doit dépendre continûment de x;
2) la règle ax+y = axa11 doit rester valable;
3) elle doit prolonger la définition pour les exposants rationnels.

Définition 4.6. Pour a E JR~, on pose

ax = exp(x ln a), Vx E lR. (4.4)


Nous allons montrer dans la proposition 4. 7 que cette définition vérifie les trois conditions
que nous avons exigées. Afin d'éviter toute confusion dans les preuves de ces deux proposi-
tions, nous réservons la notation ax pour les exposants rationnels x E Q et nous utilisons
provisoirement une autre notation pour la puissance généralisée. Nous écrirons pour a> 0

expu(x) = exp(xlna), xER (4.5)


Proposition 4. 7. Soit o. > 0. Alors,. la fonction exp a vérifie ies .trois conditi<J'M s~ivantr:s :
1) expa: R-+ lR est continue;
2) exp0 {x+y} =exp0 (x)expu{y), pour tout (i,y}E R2 ;
3) exp0 ( r) = ar, pour toùt r E Q.
PREUVE.

1) expu est la composée de fonctions continues.


2) expu(x+y) = exp((x+y) ln a) = exp(xln a+y ln a)= exp(xln a) exp(y ln a)= expu(x) expu(y).
3) On constate d'abord que expu( 0) = exp(0) = 1. Montrons maintenant que

V (x, p) E lR x Z, (4.6)
Si p ? 0, cela se démontre facilement par récurrence en utilisant la propriété 2). Considérons
maintenant le cas p < O. On a
75

donc expu(px) = (expu(x))P. Ainsi, l'égalité (4.6) est démontrée. En appliquant (4.6) deux
fois, on trouve pour tout (p, q) E Z x N*

Comme expa ( ~) > 0 et est racine de l'équation xP = uq, on obtient par définition d'une
puissance avec exposant rationnel

\l(p,q) E Z X N*, expu(*)=u!. (4.7)

Nous avons donc f(x) = expu x, pour tout x ER, et par conséquent f > O. ■

Nous admettrons maintenant la proposition suivante, qui repose sur les propriétés de la
droite réelle, que nous verrons au chapitre 21. Nous renvoyons le lecteur au chapitre 28 pour
une preuve.

Proposition 4.8. Sait f : R -+ R une fonction continue telle (JUè ·

f{x +y):: f(x)f(y). (4.8)


Alors de deux choses l'une :
1) soit f =0; 2) soit f > 0 et f = exp 0, avec a= f(l}.

Ces deux propositions étant démontrées, nous pouvons maintenant revenir à la notation
ax = exp( x ln u) de la définition 4.6, puisque les deux fonctions coïncident. Les règles suivantes
sont des conséquences directes de cette définition.

Propriétés des fonctions exponentielles


Pour tous a, b dans R~ et tous x, y dans R,

a0 = 1 (4.9)

(4.10)

Définition 4.9. Le nombre d'Euler e est le réel défini pare= exp 1 ou de manière équiva-
lente par ln e = 1. On dit encore que e est la base des logarithmes neperiens.

Avec cette définition, on a expe = exp et on peut donc écrire

expx =ex.

Pour tout a ER~, la fonction expu(x) = exp(xlnu) = ux est dérivable car composée de
fonctions dérivables. D'après la règle des fonctions composées, on a
76

Comme ax est positif, c'est le signe de ln a qui détermine la variation de exp a. Ainsi, x H ax
est strictement croissante si a > 1 et strictement décroissante si 0 < a < 1.
On déduit des limites de l'exponentielle que
...;

lim ax = {
x-H-oo
00

0
si a> 1
si0<a<l
et .
hm ax=
X------)-00
{o
00
si a> 1
si0<a<l.
Donc, pour tout a E ~"+- \{1}, la fonction exp a réalise une bijection continue de~ sur~"+--
Sa bijection réciproque lna est appelée le logarithme de base a. Il est caractérisé par
lnaX = Y
En prenant le logarithme naturel, cela équivaut à y ln a = ln x ou encore à
lnx
y=lnaX=--.
1na
Le logarithme de base a est donc simplement le logarithme naturel multiplié par une certaine
constante. La situation est donc encore plus simple que pour les puissances générales et ne
mérite pas une étude particulière.
a<l a>l

FIGURE 4.5. Les fonctions x H a X, x E R

Test 4.1. Test 4.3.


La fonction lna est-elle dérivable? Si oui, quelle Que pensez-vous de l'assertion suivante? Si
est sa dérivée? 0< a< b, alors ax < bx pour tout x ER.
Test 4.4.
Test 4.2.
Si O < a < b avec a et b non nuls, a-t-on
Calculer limx-Hoo logJ....X. l'inégalité lna x < lnb x pour tout x E R+?
10

I.4. Fonctions puissances


Dans la partie précédente, la variable des fonctions considérées était l'exposant. C'est la raison
pour laquelle ces fonctions étaient appelées exponentielles. Nous allons considérer maintenant
les fonctions puissances pour lesquelles l'exposant est fixé.
77

Définition 4.10. Pour tout réel a, on définit une fonction QJa de lll~ dans lll par

QJa(x) =exp(alnx).

On déduit de ce qui précède que

QJa(x) =exp(alnx) =exp(ln(xa)) =Xa.

La fonction QJa est appelée fonction puissance d'exposant a. On vérifie sans difficulté que les
fonctions puissances possèdent les propriétés rappelées dans le tableau suivant.

Propriétés des fonctions puissances


Pour tous a, b dans lll et tous x, y dans lll~,

QJo = 1 ln (xa) = aln x (xy)a = x°ya (4.11)


1
QJa O QJb = QJab QJ-a = QJa QJa+b = QJaQJb (4.12)

(cpa)' = UQJa-1 (4.13)

Compte tenu de ces propriétés, on obtient les courbes représentatives suivantes.

FIGURE 4.6. Les fonctions x H x"', x E IR:.~

Proposition 4.tî: Pô1J!t't~ut.Ol> 0,


funx.<X-;,
1<:....o+ .. .• 0 et {4;14)

PREUVE. On a lim ln x = -oo, donc lim xa = lim exp(cxln x) = lim exp-y= 0.


x------+O+ x------+O+ x---tO+ 1::1------+-oo
La deuxième limite s'en déduit par passage à l'inverse. ■
78

Proposition 4.12. Pour tout a E: Rt,

lirn lx - nlnxJ = +oo. (4.15)


x-.+oo
,_;
On en déduit que pour tous a E R et b E JR,

lim (bx+alnx)=+oo sib>ô et lim (bx+alnx.);;,-oo sih<O. (4.16)


J<-t+oo J<->+oo

PREUVE. Montrons la première assertion. L'idée est de comparer la fonction linéaire x et le


logarithme ln x avec la racine carrée y'x. On pose f(x) = x - 2ay'x et g(x) = a(2y'x - ln x).
Alors g'(x) = a(~-ll, donc g est croissante sur [1, oo[. Comme g(l) = 2a ~ 0, on a g(x) ~ 0
pour tout x ~ 1. D'où x - aln x = f(x) + g(x) ~ f(x) six ~ 1. Or, f(x) = x(l - ~) tend
vers oo, lorsque x----, oo, et on conclut. L'autre assertion s'en déduit facilement. ■

On peut en particulier écrire lim (~ - ln x)


X-)+OO (l
= +oo. Le logarithme est donc une fonction
à croissance très lente : toute fonction linéaire croissante (avec coefficient directeur aussi petit
que l'on veut) finit par l'emporter sur le logarithme.

Proposition 4.13. Pour tout a E lR et tout b E R,

lim x 0 ebx = +oo si b > 0 et lim x 11el>x = 0 si b <- O. (4.17)


x-H-œ x-,+oo

PREUVE. Posons -y(x) = xaebx_ Alors, ln-y(x) = aln x + bx et l'assertion se déduit de (4.16)
par composition par l'exponentielle. ■

On dit que l'exponentielle l'emporte sur toute puissance.

Proposition 4.14. Pour tous« et 13 dans R,

lim xa:(lnx)t1=+oo si«>Oet lim X"'{Inxt~o si«<O. (4.18)


x-; +oo X-t +oc,

PREUVE. Il suffit de poser -y = ln x et d'utiliser (4.17), ainsi que le résultat sur la composition
des limites. ■

On dit que le logarithme croît plus lentement que toute puissance, ou que les puissances
l'emportent sur le logarithme.

Test 4.5. Test 4.6.


Déterminer les deux limites suivantes Que vaut

lim xx et lim y'n. lim 2x(ln(x))-2007 ?


x~o+ n-JOO x->+oo

En conclusion de cette partie, nous pouvons maintenant montrer comment les fonctions
que nous avons introduites permettent de résoudre notre problème de calcul approché de
produits au moyen de règles graduées. C'est le principe utilisé dans les anciennes règles à
calculer, ancêtres mécaniques de nos calculatrices.
79

00
1 10 100 1000 10000 100000 (1.)

.§'
Ro 10 100 1000 10000 0
1 10000 ,e
(1.)

FIGURE 4.7. Une multiplication à la règle


i
00
.::0
p
u
.::
~
On dispose de deux réglettes R0 et R1, sur lesquelles une origine a été fixée. L'idée est
d'inscrire le nombre ,ox à la distance x de l'origine, pour une suite de x uniformément répartie, ~p
par exemple tous les millimètres. Alors, si l'on met en correpondance le 1 de la R0 avec une .::(1.)
division a= ,ox de R1 , et si on lit sur R1 le nombre correspondant à la division b = 1011 de R0 , .::0
on obtient le nombre 1ox+11 = 1ox1011 = ab. Sur la figure, nous avons effectué la multiplication ~
avec a= 79 ~ 10 1•9 et b = 708 ~ 102 •85 , et on obtient ab~ 104 •75 ~ 56234. L'opération Q,)
posée donne ab = 55932. On laisse au lecteur le soin de commenter, et en particulier de s
;S
critiquer le nombre de chiffres significatifs utilisés dans ce calcul. -~
"0.0
s
~
Il. FONCTIONS HYPERBOLIQUES ..d
u

La fonction exponentielle nous donne le moyen de paramétrer la branche d'hyperbole équila-


tère <fJ, graphe de la fonction x H 1/ x pour x > 0. l..
"

r
r,'

FIGURE 4.8. Les coordonnées des points de l'hyperbole

En effet, on montre que <fJ = {(e\ e-t) t E JR}. Cette branche d'hyperbole, après chan-
1

gement de coordonnées convenable, se transforme en la branche d'hyperbole Je d'équation


u 2 - v 2 = l. Le changement de coordonnées s'écrit u = (x + y)/2, v = (x -y)/2, il donne
lieu aux fonctions hyperboliques, qui vont paramétrer cette nouvelle hyperbole Je.
80

IL 1. Fonctions hyperboliques
Le sinus hyperbolique, le cosinus hyperbolique, la tangente hyperbolique et la cotangente hyper-
bolique sont
....;

ex - e-x ex- e-x


shx = , thx=---
2 ex + e-x'
ex+ e-x ex+ e-x
chx = , cothx= - - -
2 ex- e-X

Les fonctions sh et ch sont donc les parties impaires et paires de la fonction exponentielle.
Elles sont liées par la relation fondamentale

ch2 -sh 2 = 1. (4.19)

Cette relation montre en particulier que, pour tout t E ~, le point (ch t, sh t) est sur la branche
d'hyperbole J'f'.
Le tableau suivant résume les propriétés essentielles des fonctions hyperboliques. Les
preuves sont laissées au lecteur à titre d'exercice; elles sont presque immédiates.

f(x)=shx f(x) =chx f(x) = thx f(x) = coth x

Domaine ~ ~ ~ ~·
Image ~ [1,oo] l -1, 1[ ~ \ [-1, 1]

Parité impaire paire impaire impaire

limx-i±oo f(x) ±oo +oo ±1 ±1

1 1
f' chx shx - -2
ch 2 sh

En pratique, chaque formule sur les fonctions trigonométriques induit une formule équi-
valente sur les fonctions hyperboliques, qu'on obtient en remplaçant cos par ch et sin par
i sh. La preuve de cette règle sera donnée au chapitre 28. Mais il est en général très facile de
trouver directement ces formules par un calcul direct. Elles proviennent toutes des propriétés
de l'exponentielle.

EXEMPLE 4.15.
► La formule cos 2 + sin 2 = 1 devient ch 2 + (i sh )2 = 1, ou encore

ch2 -sh 2 = 1.

► La formule cos(2x) = cos 2 x-sin 2 x devient la formule ch(2x) = ch 2 x-i 2 sh 2 x, ou encore

On peut la vérifier directement.


81

La fonction ch La fonction sh

············•··························· ················_:;··;;;··-··-··---
.L
---- ...-:..::-::..:-:................ ········································

La fonction th La fonction coth

FIGURE 4.9. Les fonctions hyperboliques directes

11.1.1. Fonctions réciproques des fonctions hyperboliques

Les fonctions sh, th et coth sont continues et strictement monotones, elles sont donc bijectives
sur leur image et possèdent des fonctions réciproques. La fonction ch, en revanche, possède
deux branches monotones. On choisit toujours de prendre la réciproque de la restriction de
ch à JR+_ Les fonctions area sinus, area cosinus, area tangente et area cotangente sont les
réciproques des fonctions hyperboliques. On les note
argsh: lR-+ JR, argth: l - 1, H-+ lR,
argch: [1, oo[-+ [O, oo[, argcoth: ]-oo,-l[U]l,oo[-+ R

Contrairement aux fonctions réciproques des fonctions trigonométriques, les fonctions réci-
proques des fonctions hyperboliques ne sont pas de «nouvelles» fonctions. Elles s'obtiennent
comme composées de fonctions déjà connues.

PREUVE. Montrons la première formule.


y= argshx {=} x = shy {=} 2x = eY - e-Y {=} e 2Y-2xeY -1 = 0.
82

Ainsi, e11 est racine de l'équation du second degré Y2 - 2xY - 1 = O. Cette équation possède
rJJ deux solutions, x + Jx 2 + 1 et x - Jx 2 + 1. La dernière étant négative, elle ne peut pas être
~
O'.l
égale à e11 • Donc e11 = x + Jx 2 + 1, et on conclut en prenant le logarithme.
..... Montrons maintenant la formule pour argth .

eY - e-Y 1+ X
-y = argth x {=} x = coth -y {=} x = --- {=} xe 211 + x = e 211 - 1 {=} e 211 = - --,
eY + e-Y 1 X
-

et on conclut en prenant le logarithme. Les deux autres formules se démontrent de la même


manière. ■

La fonction argsh La fonction argch

-1

La fonction
argth
7 La fonction argcoth

FIGURE 4.10. Les fonctions hyperboliques réciproques

Test 4.7. liques qui correspond à la formule suivante sur


Trouver l'expression de la fonction réciproque les fonctions trigonométriques :
de ch sur l'intervalle ]IL en fonction de argch.
Test 4.8.
. . 2sm. (x+y)
smx+smy = - -
2
cos (x-11)
- -
2
.

Trouver la formule sur les fonctions hyperbo-


83

11.1.2. Étymologie

On a admis que les fonctions trigonométriques paramètrent le cercle trigonométrique 't1


d'équation u 2 + v 2 = 1, au sens où l'application

[0,2n[-, 't1clR2 , xH(u(x),v(x))=(cosx,sinx)

est une bijection. De la même manière, selon (4.19), on peut montrer que les fonctions hyper-
2
boliques paramètrent la branche d'hyperbole J"t' d'équations u 2 - v = 1, u ;::=: 0, au sens où
l'application
lR-, J"t'clR2 , xH (u(x),v(x))=(chx,shx)
est une bijection. Nous y reviendrons plus en détail au chapitre 28. Notons simplement ici que
cela justifie la terminologie fonctions hyperboliques.
Dans les ouvrages anglophones et allemands, on désigne leurs inverses par « area sinus
hyperbolicus » et « area cosinus hyperbolicus ». Cette terminologie est aussi intéressante.
V

T]

E,

FIGURE 4.11. Étymologie

Propositioa ,4. 11. Sôi~nt x € R et P le point de coordoiiné€$ (Up 1 Vp} = (ch x, sh x}. Alors
l'aire hachurée vaut Ill- ·
PREUVE. Nous suivons d'abord le cas de la figure, où le point Pest au-dessous de l'axe des
u, c'est-à-dire tel que x < O. Nous faisons d'abord un changement de coordonnées. On a

Y'{' : u 2 -v2 = 1 {=} (u-v)(u+v) = 1


84

où on a posé
r/J u-v u+v
V
r/J E,= ./2, T] = ./2.
~
i:o
Le point P a donc pour coordonnées

(E, p,T]p l=(chx-shx chx+shx)=(e-x ~ )


./2 , ./2 ./2',,/2.
L'aire du triangle OPQ est la même que celle du triangle OAB; en effet, pour passer de l'un
à l'autre, on multiplie la largeur par un certain facteur inverse de celui par lequel on multiplie
la hauteur. Ainsi, on obtient

OPAO = OQPAO - OPQ = OQPAO - OAB = BQPAB

= J: ~~ = 1 (1n ~ - l n ~ ) = - ; ,

ce qui donne le résultat pour x < O. On y ramène le cas x > 0, en utilisant la parité de ch et
l'imparité de sh. ■

En ce sens, on peut voir les fonctions hyperboliques comme fonctions d'une aire lxl, et
leurs inverses, les fonctions "area", redonnent cette aire .

Test 4.9. .Yt' : u 2 - v 2 = 1 ~ /:,T] = 1,


Pourquoi dans la preuve ci-dessus a-t-on utilisé
les racines carrées? Si on pose i:, = u - v et et les formules deviennent plus simples ! Com-
Tl =u-v, on a menter.

III. EXERCICES

4.1. 3. En déduire que lit E [O,n[,

Résoudre dans IF!. les équations suivantes :


1. lx+ 3x = 5;
2. 9x _y+½= y+f - 32x-1 _ où

4.2.

1. Prouver que \I u E [ 0 , 1 [, 4. Soit a E [ 0 , l ]. Prouver que pour tout


n ?, 1,
ln(l +u) ::; u::; - ln(l -u).
5. Prouver que lit E (O, n [,
2. Soit n ), 1 . Déduire de la question 1. que
pour tout réel t appartenant à[ 0 , n [,
85

4.3. 4.8.

Soit ex E lit Soit pour n E N *, f n la fonction Montrer que V ( x , 1J ) E] - 1 , 1 [ ,


définie par
f n : IR. --+ IR., X H n "'x e-nx_ + X1J ) .
argth( x) + argth (1J) = argth ( x+1J
1
1. Discuter la limite à x fixé, de la suite
(f n(x))n)l ·
2. Montrer que V n E N, fn admet un maxi-
4.9.
mum sur IR. que l'on notera Un-
3. Discuter la limite de la suite (unln)l· Dresser le tableau de variation et tracer la
courbe représentative de la fonction f définie
4.4. par

Justifier la dérivabilité sur IR. de g(x) = x 2 2x. x ch(x) - sh(x)


Étudier g, puis tracer le graphe de g sur IR.. f : IR. --+ IR., x H ch(x)

4.5.

4.10.
Résoudre ch(x) + 2sh(x) = 2 dans R
Soit a E R On cherche à résoudre dans IR.
4.6.
l'équation
Soient ( a, b) E IR. 2 et n E N. Simplifier les
sommes sh(x) +sh(u+x) +sh(2u+x) +sh(3u+x) = O.
n n
Sn= L ch(ku+b) et Ln= L sh(ku+b). 1. Trouver, en exploitant l'imparité du sinus
4.7. k=O k=O
hyperbolique, une solution évidente de l'équa-
tion.
Résoudre argch(x) = argsh(2 - x) dans R
2. Résoudre l'équation sur R
Chapitre 5
LE CORPS (C DES NOMBRES COMPLEX ES

A naissance des nombres complexes est intimement liée à la résolution des équations

L algébriques, celles du troisième degré en particulier. Diophante connaissait la méthode


de résolution de l'équation du second degré (sans toutefois employer les puissances ni
les radicaux qui sont des notations modernes). Au début du XVIe siècle, les mathématiciens
n'étaient guère plus avancés dans la résolution de l'équation du troisième degré que Diophante
ou les mathématiciens arabes.
Examinons un instant l'équation du second degré, par exemple (El : x 2 + 6x + 1 = O.
L'idée est de ne plus faire apparaître qu'une seule fois l'inconnue x dans (El en utilisant une
identité remarquable : comme x 2 + 6x + 1 = (x + 3l 2 - 9 + 1 = (x + 3l 2 - 8, l'équation est
équivalente à (x + 3l 2 - (2v12)2, c'est-à-dire à (x + 3 - 2v12)(x + 3 + 2v12l = O. Les solutions
de (El sont alors évidentes, elles valent -3 ± 2v12. Abordons à présent l'équation du troisème
degré, par exemple
(E'l : x 3 + 3x2 - 21x - 95 = O.
Essayons de reconduire la même idée. On a x 3 +3x 2 -21x-95 = (x+ 1)3-24x-96. La présence
du terme en x nous empêche de conclure à la manière du second degré. Toutefois, en posant
y = x + 1, l'équation (E'l équivaut à (E"l : y 3 - 24-y - 72 = 0 qui est plus simple. Les savants
restèrent longtemps démunis face à cette équation et il fallut attendre Scipion del Ferro pour
qu'une approche radicalement nouvelle soit proposée. Le mathématicien italien eut l'idée 1 de
chercher une solution de (E"l sous la forme y= u+v. On obtient (u+vl 3 -24(u+vl-72 = 0,
c'est-à-dire
u 3 +v 3 + 3u2v +3uv 2 -24(u+vl- 72 = 0,
ou encore u 3 + v 3 - 72 + (u + v)(3uv - 24l = O. Scipion del Ferro pensa à découpler cette
équation en deux autres : il remarqua que si u et v vérifient conjointement u 3 + v 3 = 72 et
u 3v3 = 83 = 512 alors y = u + v est solution de ( E"l. Notons (S l ce système d'équations. Il
faut bien comprendre la démarche de l'algébriste italien : (Sl implique (El, mais il ne s'agit
nullement d'une équivalence 2 , Scipion Del Ferro essaie de simplifier le problème, c'est-à-dire
qu'il ramène l'ordre trois à l'ordre deux. Étudions le système (Sl. Les nombres u et v sont
solutions de ce système si et seulement si u 3 et v 3 sont les solutions de l'équation de degré 2 :
X2 - 72X + 512 = 0 (*l. Le discriminant réduit de (*l est t1' = 362 - 512 = 28 2 . Les solutions
de cette dernière équation sont donc u 3 = 36 - 28 = 23 et v 3 = 36 + 28 = 4 3 . Le nombre
y = 2 + 4 = 6 est donc solution de (E"l puis le nombre x = y - 1 = 5 est solution de (E'l-
On peut alors achever la résolution de (E'l en mettant (x - 5l en facteur :

et (E'l admet une et une seule solution réelle à savoir 5.

1
Cette approche est souvent appelée à tort « méthode de Cardan ».
2
Si ($) n'admettait aucune solution, nous ne pourrions donc rien en conclure. Comme souvent en mathéma-
tiques, il s'agit d'une piste envisageable, d'un pari en quelque sorte.
88

Reconduisons tout ceci avec l'équation générale x 3 +px+ q = O. On pose x = u + v et on


obtient : u 3 + v 3 + (3uv + p )( u + v) + q = 0. Pour que cette égalité soit vérifiée, il suffit que
3
u 3 +v3 = -q et u 3v3 = -p 3/27. On recherche donc deux nombres ex= u 3 et f3 = v dont on
3
connaît la somme ex+ f3 = -q et le produit exf3 = -p /27 : ce sont les solutions de l'équation
.....;
y 2 + qy - p 3 /27 = 0, Scipion del Ferro obtint ainsi les formules (qui n'étaient bien sûr pas
écrites sous cette forme).

u3 = -q + Jq2 + 4p3/27 3 -q - ✓ q 2 +4p 3/27


etv= ,
2 2
et finalement,

Étudiant les travaux de Scipion del Ferro, Tartaglia fut troublé


par l'utilisation de la racine carrée dans le cas où le terme sous le
radical est négatif. Il observa que dans ce cas, le calcul ne peut pas
être achevé. En 1572, Bombelli publia un ouvrage d'algèbre dans
lequel il revint sur les équations algébriques. En étudiant l'équation
x3- 15x-4 = 0, il remarqua que la solution évidente x = 4 peut être
obtenue par les formules de Scipion del Ferro. Détaillons ses idées.
Soit (E 2 ) : x 3 - 15x - 4 = O. On pose x = u + v et on obtient :
(u+v) 3 - 15(u+v)-4 = 0, i.e. u 3 +v 3 -4+ (u+v)(3uv-15) = O.
3 3 33
Pour que cette égalité soit vérifiée, il suffit que u +v = 4 et u v = Tartaglia
3 3 3
5 = 125; les nombres u et v sont alors les solutions de l'équation
X2 - 4X + 125 = 0 (*) dont le discriminant réduit vaut cette fois-ci : b.' = -11 2 . L'équation
(*) n'a donc pas de solution, si on ne connaît pas les nombres complexes. Bombelli décide
néanmoins de continuer formellement les calculs,

x 2 -4x+ 125 = (x-2)2 + 121 = (x-2)2- ( llvCî)2 = (x-2+ llvCî)(x-2- llvCî).

Cette audace de Bombelli est l'acte de naissance des nombres complexes. L'expression yCî
3
apparaît comme un objet absurde qui plus tard s'écrira « i » (initiale du mot impossible).
On a ainsi u 3 = 2 - 11 yCî et v 3 = 2 + 11 yCî et donc x = {h - 11 yCî + {h + 11 yCî
est solution de ( E 2 ). Le résultat sous cette forme n'a évidemment aucun intérêt et il reste
encore à découvrir que

(2-vCî) 3 = 8-12vCî +6( vCî)2- (vCî) 3 = 8- llvCî -6 = 2- llvCî,

de sorte que l'on peut choisir u = 2 - R. De même, en remplaçant yCî par -vCT,
v = 2 + vCî et finalement, x = u + v = 4. En écrivant vCT, on est allé au bout des calculs
de Scipion del Ferro en trouvant la solution évidente 4, le « nombre » yCî disparaissant en
fin de parcours et n'ayant donc été qu'un outil intermédiaire, sans statut propre.
Bombelli considère alors les « racines carrées de nombres négatifs » comme des nombres
sophistiqués, des quantités qui n'existent pas mais sur lesquelles les calculs sont néanmoins
possibles. Ce nouvel objet yCî effraie, et va mettre du temps à s'imposer.

3
Il faut noter qu'aujourd'hui la notation.;=î n'a aucun sens car on ne sait pas si elle désigne le nombre i ou
le nombre -i, on n'écrit donc jamais .;=î.
89

1. DÉFINITION DES NOMBRES COMPLEXES


Revenons un instant à la naissance des nombres complexes. Comme l'atteste l'expression des
solutions de x 3 + px + q = 0, Bombelli manipulait les nombres imaginaires 4 à la manière
des nombres réels, c'est-à-dire en suivant les mêmes règles de calcul. Intéressons-nous plus
modestement aux équations algébriques de degré deux et voyons comment ces nombres en
permettent la résolution.
Considérons par exemple l'équation (El : z 2 - 4z + 5 = O. Si les règles de calculs sur
les réels s'étendent aux nombres imaginaires, nous pouvons raisonner de la sorte : (El est
équivalente à (z - 2l 2 + 1 = 0, puis en écrivant que 1 = -i2 , on obtient qu'un nombrez est
solution de (El si et seulement si (z - 2 + i)(z - 2 - il = O. Les seules solutions de (El sont
donc les nombres 2 ± i. Ce simple exemple est plus riche qu'il n'y paraît. Nous avons d'abord
utilisé l'identité remarquable (a+ b )2 = a 2 + 2 x a x b + b 2 . Quelles sont les règles de calculs
qui se cachent derrière cette formule? Tout d'abord, nous avons besoin de la distributivité de ID
la multiplication par rapport à l'addition afin d'écrire que ..d
(.)

(a+ b)2 = (a+ bl x (a+ bl = (a+ b) x a+ (a+ bl x b =(axa+ b x a)+ (b x a+ b x b).


Ensuite, il nous faut pouvoir regrouper a x b et b x a; cela nécessite l'associativité de
l'addition. Pour écrire que a x b + b x a= 2 x ( a x b l, nous avons recours à la commutativité
du produit. Finalement, 2 x ( a x b l = 2 x a x b fait appel à l'associativité du produit. Mais
revenons à (E) : on a ensuite factorisé l'expression grâce à une autre identité remarquable,
a 2 - b 2 = (a - b )( a + b) qui nécessite les mêmes règles que la précédente, et nous avons
conclu la résolution en utilisant l'équivalence « (Z 1 x Z2 = Ol {=} (Z 1 = 0 ou Z2 = Ol » qui
doit donc rester vraie pour les nombres imaginaires.
Avant de disposer d'une définition rigoureuse des nombres imaginaires (Gauss), les ma-
thématiciens se sont contentés de ce que nous venons de décrire : ils ont admis l'existence
d'un ensemble de nombres imaginaires qui contient les nombres réels et qui est muni de deux
opérations + et x prolongeant celles de lR et jouissant des mêmes propriétés : associativité,
distributivité, commutativité, etc. Définir au sens moderne (C reviendrait à construire à partir
des ensembles connus (donc lR ici) un nouvel ensemble 5 contenant JR, sur lequel il faudrait
alors définir deux opérations + et x vérifiant les bonnes propriétés. Tout cela sera fait dans
le chapitre sur la théorie des ensembles, nous nous contenterons ici d'énoncer les règles de
calculs valables dans (C.

4
Descartes emploie pour la première fois le mot imaginaire en 1637.
5
C'est la théorie des ensembles qui fixe les règles permettant de construire de nouveaux ensembles à partir
d'ensembles connus. Nous y reviendrons dans le cours d'algèbre.
6
Ces propriétés sont à considérer comme des règles de calcul et que nous détaillerons au paragraphe suivant.
90

1.1. Calculer dans CC


if)
Q)

~ I.1.1. Rappel des règles de calcul


O'.l
...;
Les propriétés de + et x évoquées dans la proposition précédente sont résumées ci-dessous.
Elles sont bien connues de tous et, au cours d'un calcul, nous les appliquons sans même en
avoir conscience.

Règles de calculs dans CC


1) Commutativité de + et x :

2) Associativité de + :

3) Associativité de x :

\f(z1,Zz,Z3) E C 3, Z1 X (z2 X Z3) = (z1 X Zz) X Z3.

4) 0 et 1 sont des éléments neutres pour + et x :


7

V z E C, z + 0 = 0 + z = z et 1 x z = z x 1 = z.

5) Tout élément z admet un opposé :

Vz E C, :3 z' E C tel que z + z' = z' +z = O.

L'opposé z' de z E C est unique. On le note -z.

6) Tout élément z non nul admet un inverse :


V z E C*, :3 z' E C tel que z x z' = z' x z = 1.

L'inverse z' de z E C* est unique. On le note !z .


7) Distributivité de x par rapport à +:
3
\f (z1, Zz, Z3) E C , Z1 (z2 + Z3) = Z1Z2 + Z1Z3.

Par exemple, pour calculer ( 1 + 2i )( 8 - 3i), il suffit de développer le produi1i-par distribu-


2
tivité, d'appliquer les règles ci-dessus et d'utiliser la relation i = -1, alors

(1 +2i)(8-3i) = 8-3i+ 16i-6i2 = 14 + 10i.

7
Ce sont d'ailleurs les seuls.
90

1.1. Calculer dans C


[/J
(1)

~ I. 1. 1. Rappel des règles de calcul


il'.l
....; Les propriétés de + et x évoquées dans la proposition précédente sont résumées ci-dessous .
Elles sont bien connues de tous et, au cours d'un calcul, nous les appliquons sans même en
avoir conscience.

Règles de calculs dans C

1) Commutativité de + et x :

2) Associativité de +:
\/ (z1, Zz, Z3) E (C
3, (z1 + Zz) + Z3 = Z1 + (zz + Z3).
3) Associativité de x :

V(z,,z2,Z3) E C 3, z, X (z2 X Z3) = (z, X Zz) X Z3.


4) 0 et 1 sont des éléments neutres7 pour+ et x :

\/ z E C, z + 0 = 0 + z = z et 1 x z = z x 1 = z.

5) Tout élément z admet un opposé :

\/ z E C, :3 z' E C tel que z + z' = z' + z = O.

L'opposé z' de z E C est unique. On le note -z.

6) Tout élément z non nul admet un inverse :

\/ z E C*, :3 z' E C tel que z x z' = z' x z = 1.


. 1
L'inverse z' de z E C* est unique. On le note - .
z
7) Distributivité de x par rapport à + :

Par exemple, pour calculer (1 + 2i)(8 - 3i), il suffit de développer le produit-par distribu-
tivité, d'appliquer les règles ci-dessus et d'utiliser la relation i 2 = -1, alors

(1 + 2i )( 8 - 3i) = 8 - 3i + 16i - 6i 2 = 14 + 1Oi.

7
Ce sont d'ailleurs les seuls.
Remarque. On résume ces sept propriétés en disant que (C muni des opérations + et x a
une structure de corps, et on parle du corps (C des nombres complexes. r/J

Notation. Afin d'alléger les notations, nous noterons les produits z 1 z2 au lieu de z 1 x z 2.
De même, pour z 1 E (Cet z 2 E C*, on notera z,/z2 ou encore~ z2
le nombrez, x (1/z2). Nous
1
0
(.)
r/J
utiliserons la convention usuelle d'exponentiation : pour tout nombre complexez non nul, z 0 i::
sera par convention égal à 1 ; pour tous z E (C et n ) 1, zn désignera le nombrez x • • • x z
(n fois). Pour tout z E (C* et tout n E N, on note z-n le nombre complexe (1/z)n. 1
r/J
<l)
Des propriétés de l'opération x découlent immédiatement les règles suivantes. Encore une 'O
fois, les propriétés des puissances sont les mêmes que sur lR. u
r/J

~
(.)

Règles d'exponentiation

1) Vz E C*, V(m, n) E Z 2,znzm = zm+n_ 3) V(z1,z2) E(C*) 2, Vn EZ,zfzz' = (z1z2)n. .d
ü
2) Vz E C*, V(m, n) E Z 2, (zn)m = zmn_

L'associativité de+ et x nous autorise à omettre les parenthèses dans des calculs du type
(2 + i) + 4i ou (2 xi) x 4i. On écrira simplement 2 + i + 4i et 2 xi x 4i. Plus généralement,
l'associativité nous permet d'adopter les notations suivantes.
Notation. Soit n E N*. Pour tous nombres complexes u 1 , Uz, ... , Un, on pose
n n
.L, uk = u 1 + u2 + · · · + Un et TI uk = u, X Uz x · · · x Un-
k=l k=l
Par exemple, on écrira
17
1 + 2 + 3 + · - · + 17 = L k.
k=l
Cette notation a l'avantage d'être condensée et d'expliciter la forme générale du terme sommé.
Nous consacrerons un chapitre à la manipulation de ces symboles.

1.1.2. Retour aux équations algébriques

Les nombres complexes sont nés de la résolution des équations algébriques. Nous avons déjà
remarqué à quel point la propriété « (Z 1Z 2 = 0 si et seulement si z, = 0 ou Z 2 = 0) » était
fondamentale lors de la résolution d'une équation du second degré. Par exemple, z 2 = -1
équivaut à z 2 -i2 = 0, c'est-à-dire (z-i)(z+i) = O. Arrivés à ce stade de la résolution, nous
appliquons la propriété évoquée ci-dessus pour affirmer que les seules solutions de l'équation
z 2 = - 1 sont ±i.

Comme nous allons le voir, cette propriété repose essentiellement sur l'existence d'un in-
verse pour la multiplication x.
PREUVE. Raisonnons en deux temps.
( {=) Soit z E <C. Comme Oz = (0 + 0 )z = Oz+ Oz, on a Oz = Oz - Oz = O.
(=}) Supposons que z1z2 = O. Alors, si z1-/- 0, (z1z2)/z1 = O/z1 = 0, d'où z2 = O. ■

EXEMPLE 5.3. L'équation z 2 - 2z + 2 = 0 équivaut à


2
z 2 - 2z + 2 = (z -1 )2 - 1 + 2 = (z-1 )2- i = (z -1 - il(z - 1 + i).

Les seules solutions de z 2 - z + 2 = 0 sont donc 1 ± i.

1.1.3. Forme algébrique d'un nombre complexe

Nous savons que tout nombre complexez s'écrit de manière unique sous la formez= o + ib
avec o et b réels : on prendra garde au fait que l'unicité du couple (o, b) n'est vraie que si on
impose o et b réels. En effet, puisque -1 = -1 + 0 x i = 0 + i x i, il n'y a plus unicité de
(o, b} lorsque o, b E <C. L'unicité dans le cas réel permet de définir sans équivoque les parties
réelle et imaginaire d'un nombre complexe.
Définition 5.4. (Parties réelle et imaginaire). Pour tout z E <C, il existe un unique
couple (x, y) de nombres réels tel que z = x+iy. Le nombre x est noté 9té(z) et appelé partie
réelle de z; le nombre y est noté Jm(z) et appelé partie imaginaire de z. L'écriture z = x+iy
s'appelle la forme algébrique de z.
3
En guise d'entraînement, écrivons le nombre complexe ex= (1 + iv'2) + 1 + 8i sous forme
algébrique: ex= (1 + 3(iv'2) - 6 - 2v'2i) + 1 + 8i = -4 + i(8 + v'2).

EXEMPLE 5.5. Calculons en fonction de n l'écriture sous forme algébrique du nombre


complexe in.
► Un rapide coup d'œil aux premiers termes (1, i, -1,-i, 1, i, etc.) nous incite à conjecturer
que in ne dépend que du reste den dans la division euclidienne par 4. Si ce reste vaut 0,
4
c'est-à-dire s'il existe m E N tel que n = 4m, alors in= (i )m =lm= 1. Si ce reste vaut 1,
4
i.e. il existe m E N tel que n = 4m + 1, alors in= (i )~ = 1~ = i. Si ce reste vaut 2, i.e.
4 2 2
il existe m E N tel que n = 4m + 2, alors in= (i )~ = 1~ = -1. Si ce reste vaut 3, i.e.
4 3
il existe m E N tel que n = 4m + 3, alors in= (i )~ = 1~ = -i.
3

45698 = (i4)11424i 2 = i 2 = -1. Il est clair


Remarque. Puisque 45698 = 4 x 11424 + 2, on a i
que d'une manière générale, puisque (in)nEN est 4-périodique, le calcul de in ne dépend que
du reste de n dans la division euclidienne par 4.
Les nombres complexes de partie réelle nulle sont appelés les imaginaires purs. L'ensemble
de ces nombres est noté i lR. = {i y, y E lR. }.

PREUVE. Soient z1 = 01 + ib1 et z2 = 02 + ib2 deux nombres complexes avec o 1, b 1, o 2, b 2


réels. Alors z1 + z2 = (o 1 + 02) + i(b1 + b2) avec o 1 + 02 et b1 + b2 réels, donc, par définition,
9te(z1 + z2) = 01 + 02 = 9te(z1) + 9te(z2) et Jm(z1 + z2) = b 1 + b2 = Jm(z 1) + Jm(z2). ■

Ce résultat est appelé propriété d'additivité des parties réelle et imaginaire sur <C; elle
s'étend par récurrence à un nombre fini de nombres complexes.
93

Test 5.1. Test 5.2.


Que pensez-vous de la propriété suivante : Que pensez-vous de la propriété suivante : r/J

~
V (À, z) E lR x C, Jm(Àz) = À Jm(z) ? P.
a0
(.)
r/J
e:
I.2. Représentation géométrique des nombres complexes
Les nombres complexes furent d'abord des intermédiaires de calcul sans statut propre. En 1799,
1r/J
(1)
'O
le danois Gaspard Wessel en proposa une interprétation géométrique. Refusant de considérer Ç,,)
ces nombres comme « impossibles », le mathématicien allemand Carl-Friedrich Gauss poussa
plus loin les idées géométriques de Wessel. ~
0
(.)

j
Dans tout ce qui suit, le plan est muni d'un repère orthonormé direct !!J! = (0, li, v). in
.d
ü
Définition 5.7. (Affixe d'un vecteur). Soit un vecteur w du plan de coordonnées (x, y)
dans la base (li, v). On lui associe le nombre complexe z = x + iy, appelé affixe de w. On
notera de manière condensée w(z) le vecteur d'affixe z.

M(x+iy) w(x+iy)
y -------- y --------

v v
0 li X 0 li X

Affixe d'un point Affixe d un vecteur


1

FIGURE 5.1. Interprétations géométriques des nombres complexes

Définition 5.8. (Affixe d'un point et image d'un nombre complexe). Soit M un
point du plan de coordonnées (x, y) dans !!J!. On lui associe le nombre complexe z = x + i y,
appelé affixe de M. Réciproquement, à tout nombre complexez = x + i y où x, y E IR, on
associe le point M du plan de coordonnées (x, y) dans !!J!, appelé image de z. On notera de
manière condensée M(z) le point d'affixe z.

L'interprétation géométrique de l'addition des nombres complexes est élémentaire. Soient


ex, (z,) et ex2(z2) deux vecteurs du plan. Le nombre complexe z 1 + z 2 est l'affixe du vecteur
ex, + ex2 : l'addition des nombres complexes correspond donc à l'addition des vecteurs.
Quant à l'interprétation de la multiplication x des nombres complexes, il nous faudra
attendre le paragraphe sur le prolongement de la fonction exponentielle à IC et la définition
des formes polaires pour la découvrir, le système de repérage cartésien étant mal adapté au
contenu géométrique de cette opération.

Il. LA CONJUGAISON ET LE MODULE

Au-delà des règles de calcul et des formules exposées jusqu'ici, nous allons définir dans les
pages qui suivent la très importante application de conjugaison.
94

[/J
Il)
[/J
rd
CO
,_;
I
I
I
I
I
I
I
I
I
if ŒÎ (zi)

0 ü

FIGURE 5.2. Interprétation géométrique de l'addition

ILL Conjugué z d'un nombre complexez


Définition 5.9. (Conjugaison). Soit z = x + i y E C où x et y sont réels. Le conjugué
de z, noté z, est le nombre complexe défini par z = x - i y.
D'un point de vue géométrique, les points M(z) et M'(z) sont symétriques par rapport
Hz correspond
à l'axe des abscisses (Ox). L'application de conjugaison définie sur C par z
donc à la symétrie par rapport à l'axe des réels (Ox).

M(z)
y -----------------~
1

v
0 'X
ù 1
1

-y -----------------~
M'(z)

FIGURE 5.3. Interprétation géométrique de la conjugaison

Reprenons les notations précédentes : puisque z = x + iy et z = x - iy, on a 2x = z + z


et 2iy = z - z d'où l'on tire sans peine les formules suivantes.

Application au calcul de 9le(z) et Jm(z)

z+z z-z
\:/ z E C, ~e(z) = -
2
- et Jm(z) = li"
1
,1
1
95 '
On déduit de ces formules (et même au-delà du calcul, de l'interprétation géométrique de
la conjugaison) la proposition suivante : r/J
~
!i
!
~
o.
Ptop~itiQ~f~lff~ ~~tt~lij~~•~i.:~J ~i•~j~'}t s
0
<:)
1) VzEC;iëR~z,#,2'~ . . 2)Vt.è(;,z~,.·.~t=-:-z: r/J
Cl)
~

"a
Mffi;;;~slé·1iié~~r1~.,,rtr',f•i~i,f.,.·_ §
r/J
Cl)
"Cl
(,)
r/J
e-
3) \>'{z1, z2) e C2;z1z2 =Z:t:Zz; 5) •· Vz1 ~C.Vz2·E"C*,z1/Z2 =z1/Iï- 0
<:)

~
PREUVE. Soient z 1 = o 1 + ib 1 et z2 = 02 + ib2 où o 1, 02, b,, b2 sont quatre nombres réels. l!Î
On a immédiatement z 1 = o 1 - ib 1 = o 1 + ib 1 = z 1, la proposition 1) est donc vérifiée. De ..d
ü
plus, z 1 + z 2 = (o 1 + o 2) + i(b 1 + b 2), ainsi z 1 + z2 = o, + 02 -ib1 -ib2 = z, + Zz. De même,
z 1z2 = (o 1o 2 - b1 b2) + i(o 1b2 + 02b1l, donc z,z2 = (0102 - b1 b2) - i(o, b2 + 02b1) = z1 z2,
ce qui démontre les propriétés 4) et 3). Prouvons la propriété 2) : soit z E (C*, d'après 3),
z x 1/z = z x 1/z = 1, d'où le résultat. Prouvons la propriété 5) : soient Z1 E (Cet Z2 E (C*.
D'après la propriété 3), z 1/z2 = z 1 x 1/z2 = z, x l/z2, et en appliquant la propriété 2),
zi/z2 = z,/zz. ■

EXEMPLE 5.12. Déterminons l'ensemble des points M(z) tels que~ soit réel.
► V z E (C \ {l}, z/(1 - z) E IR si et seulement si z/(1 - z) = z/(1 - z), i.e. z/(1 - z) =
z/(1 - z), soit encore z - zz = z - zz, et finalement z = z, c'est-à-direz E R L'ensemble
recherché est donc IR \ {1}.

Le résultat suivant, dont la preuve est élémentaire, nous permettra de définir le module
d'un nombre complexe.

PREUVE. Soit z = o + ib avec o, b E R Alors zz = (o + ib) (o -ib) = o 2 + b 2 ): O. ■

Ce petit calcul permet d'écrire sous forme algébrique le quotient de deux nombres com-
plexes, il suffit pour cela de multiplier dénominateur et numérateur de la fraction par la
quantité conjuguée du dénominateur : zi/z2 = z1z2/z2z2. Par exemple,

1-i 1-i
l+i l2+l2 -2-·

, . , . (i-1)3
EXEMPLE 5.14. Ecnvons sous forme algebnque le nombrez= (i + )2 + (i- lis·
3
► Puisque (i-1) 3 = (i- l)(i-1) 2 = 2+2i, (i-1) 5 = (2+2i)(-2i) = 4-4i; de plus
(i + 3) 2 = 8 + 6i. Ainsi z = (2 + 2i)/(12 +li)= (1 + i)(6 - i)/(6 2 + 1) = (7 + Si)/37.
96

II.2. Le module lzl d'un nombre complexez


r/J

!
....;
Définition 5.15. (Module). Pour tout z E C, on définit le module lzl du nombre complexe
z par la formule lzl = ,/zi. Si z =a+ ib avec a et b réels, lzl = ✓ a2 + b 2 . Si z = x E lR,
le module de x est égal à la valeur absolue de x, il n'y a donc pas conflit de notations.
Soit w un vecteur du plan d'affixe w = a+ ib, où a et b sont réels. D'après la définition
précédente, on a lwl = ✓ a 2 + b 2 , mais puisque ( a, b) sont les coordonnées de w dans le repère
orthonormé !3i, on a également ✓ a2 + b 2 = llwll, d'où lwl = llwll- La distance entre deux
points A(<X) et B(~) se calculera donc par la formule AB= 1~ - <XI, et, en particulier, si M
est un point du plan fYJ d'affixe z, on a lzl = OM : le module s'interprète donc comme une
distance.

M(z)

lzl

FIGURE 5.4. Interprétation géométrique du module

Pour tout nombre complexe w et tout réel r > 0, l'ensemble des points M d'affixe z tels
que lz-wl = r est donc le cercle de centre fl(w) et de rayon r. Notons que l'équation de ce
cercle lz - wl = r peut aussi s'écrire lz - wl 2 = r 2 , c'est-à-dire

EXEMPLE 5.16. En guise d'intermède géométrique, déterminons l'ensemble des nombres


complexes z tels que lz - 11 = lz + 1 + 3il.
► Soient A et B les points d'affixes 1 et -1 - 3i. Soit z E C, lz - 11 = lz + 1 + 3il si et
seulement si l'image M(z) de z vérifie AM= BM, i.e. M appartient à la médiatrice de [AB].

•Proposition· 5.17: (Ptopriêtêlrii11 môdule).


1) \/z E Cdzl ;;= 0 '4=}.z=O: 4} \:/z E::C,:Jm(z} ~ j:'.Ym(z}! ~Jzl.
2) Vz EC, If!= lzl. ; . . ·• lf),VzEÇ* ,_1/z ::::zÎ~12: •>:· .
3) Vz E.C,1'te-(z) ~ l!lte(z)l 1'1zf. 6) Vz EC,izl;;:1 ·~ z=l/z.

PREUVE. Soit z = a+ ib avec a et b dans JR. Alors lzl = ✓ a 2 + b 2 = J


a 2 + (-b )2 = lzl,
d'où la propriété 2). Prouvons la propriété 1) : si z = 0, alors on a immédiatement lzl = O. Si
lzl = 0, alors a 2 + b 2 = 0 donc a= b = 0 et ainsi z = O. Prouvons la propriété 3) : on a bien
sûr l9te(z)I =lai= ✓a2,,;; ✓a 2 + b 2 = lzl. La propriété 4) se démontre de même. Prouvons
2
la propriété 5) : on a vu au paragraphe précédent que 1/z = (a - ib)/(a 2 + b ) = z/lzl2.
Prouvons la propriété 6) : supposons que lzl = 1, alors d'après la propriété 5), 1/z = z.
Réciproquement, si 1/z = z, alors zz = 1 d'où lzl = ,/zi = 1. ■
97 :

EXEMPLE 5.18. Soit z E C. Prouvons que 9te(z) = lzl si et seulement si z E R+.


~
li

► Soit z E C. Prouvons l'équivalence en deux temps. ri)


(1.)

( {==) Soit z ER+· On a alors Jm(z) = 0 d'où lzl = 19te(z)I = J9te(z) 2 = 9te(z).
(==}) Réciproquement, supposons que 9te(z) = lzl. Alors 9te(z) 2 = iz/2 = 9te(z) 2 + Jm(z)2, is
0
d'où Jm(z) = 0 et donc z = 9te(z) = lzl est un réel positif. u
ri)

~
Test 5.3. Test 5.4. "a
0
i::
Prouver que Établir que ri)
(1.)
"Cl
z E iJE. si et seulement si iJm(z) = z. z ER+ si et seulement si !Re(z) = lzl. u
ri)
e,
0
u
j
Les propriétés 1) à 4) énoncées ci-dessus correspondent à des évidences géométriques, le 10
lecteur s'en convaincra en observant la figure 15.4. La proposition suivante précise le compor- ..d
tement du module vis-à-vis de la multiplication.
u

~~t~S:~fifÏ~~ ~it!fiit~(ijJ~~lg#}{',., ..... •· . > •. , . ?}~·


V(z1~zîfic2 ,tz,zil;;,1zlflz2l-
,1:) . '' 3}.·'rh1€'.C.,.ift'î;f;~;fi,11~1~~·
2J'v'z ~ c~.H/~? V!zl. . .. . . . . . . . . ..
PREUVE. Soient z1 = U1 + ib1 et Z2 = a2 + ib2 avec U1, b1, a2, b2 dans R. On a alors
z1z2 = (a1a2- b1b2) +i(a1b2 + b1a2), d'où
lz1z2l 2 = (a1a2 - b1 b2)2 + (a1 b2 + b1a2) 2
= afa~ + bfb~ - 2a1 a2b1 b2 + afb~ + a~bf + 2a1 a2b1 b2
= afa~ + bfb~ + afb~ + a~bf = (af + bf)(a~ + b~) = lz1/2iz2l 2.
Ainsi lz1z2I = lz1ilz2I et on a prouvé la propriété 1). Prouvons la propriété 2). Soit z E C*.
On a alors 11/z/2 = 1/(zz) = 1/lz/ 2, et donc 11/zl = 1/lzl. Montrons la propriété 3). Soient
z1 E (Cet z2 E C*. Puisque zi/z2 = z1 x 1/z2, on obtient en appliquant la propriété 1),
lzi/z2I = lz1lll/z2I, puis d'après la propriété 2), lzi/z2I = lz1I x 1/lz2I = lz1l/lz2I- ■

La propriété 1), équivalente à l'identité remarquable


(x2 + y 2)(z2 + t 2) = (xz -yt)2 + (yz + xt) 2,
est un premier pas dans l'interprétation géométrique du produit de deux nombres complexes.
Si Ü( a) désigne un vecteur du plan et z E C, on peut déduire de la proposition précédente
que le vecteur b d'affixe za est de norme 11 b 11 = 1zl · Wei 11-

Test 5.5. Test 5.6.


Résoudre dans (C l'équation 4z2 +8lzl 2 -3 = O. Résoudre dans (C l'équation z + z = lzl.

EXEMPLE 5.20. Déterminons l'ensemble des nombres complexes z tels que liz-11 = liz+ 11.
► Soit z E C, liz- 11 = liz + 11 si et seulement si li(z + i)I = li(z - i)I donc si et seulement
si lillz + il = lillz - il, c'est-à-dire lz +il= lz - il. Notons A et B les points d'affixes i et -i.
Soient z E (Cet M le point d'affixe z, liz - 11 = liz + 11 si et seulement si AM= BM donc
si et seulement si M appartient à la médiatrice de [AB] et par conséquent si et seulement
si z ER
Lr/l
(1)

~
o:i
Étudions, pour clore ce paragraphe sur les propriétés du module, le comportement de
celui-ci par rapport à l'addition.

..... Propositiôn$;21. (lnêga!ltê ti-iangttlâ.ire}. Soîent i1 .· et ~;1· dev.:v ri'()fnf>res cvmrtêxes;


1 J lz1 +zif ~ ;l~1l+lz2!-
2) tz1 + z2! = lzJI+ lzil sfet seulement si Zz = 0 oo 3). .E R+ tel que z1 =.Àzz;

PREUVE. Soient z1 et Zz dans C. lz1+z2I ~ lz1l+lz2I si et seulement si lz1+z21 2 ~ [lz1l+lz2IJ2,


ce qui est équivalent à l'inégalité (z1+z2Hz1 +z2) ~ lz11 2+2lz1llz2l+lz21 2, ou encore à l'inégalité
suivante:
2 2
lz11 2 + lz21 + 2 9te(z1z2l ~ lz11 + 2lz1llz2I + lz21 2,
c'est-à-dire à 9te(z1z2) ~ lz1llz2I- Puisque lz2I = lz2I, toutes ces inégalités sont également
équivalentes à 9te(z1z2) ~ lz1llz2I = lz1z2I- Et comme\::/ Z E C, 9te(Z) ~ IZI, la dernière
inégalité est vraie, donc par équivalence, la première aussi. Ceci achève la preuve du 1).
Passons au 2) : en reprenant la démonstration point par point, il y a égalité si et seulement si
9te(Z) = Z; cette dernière est (voir le test 5.4) équivalente à Z E lR+. Ainsi, lz1 +z2I = lz1 l+lz2I
si et seulement si z1z2 E lR+. Puisque pour Z2 =/. 0, z1 = [z1z2/lz21 2]z2, cette proposition est
équivalente à :3 À E lR+ tel que z1 = Àzz. ■

L'interprétation géométrique de l'inégalité triangulaire est immédiate une ligne brisée


est toujours plus longue qu'une ligne droite de mêmes extrémités.

_____ ,,/ iz2i


~ ..,,,
ai (z1)
iz1I

FIGURE 5.5. L'inégalité triangulaire sur C ou le plus court chemin entre deux points est
la ligne droite

EXEMPLE 5.22. Prouvons que Vz1,Z2 E C, llz1I- IZzll ~ lz1 -zzl.


► Puisque z1 = Z1 - Z2 + z2, l'inégalité triangulaire s'écrit lz1I ~ lz1 - z2I + lz2I et donc
lz1I - lz2I ~ lz1 - z2I- Les nombres z1 et Zz jouant des rôles symétriques, on a également
lz2I - lz1I ~ lz1 - z2I, d'où llz1I - lz2II ~ lz1 - zzl.

Remarque. Il faut savoir que si x et a ? 0 désignent des nombres réels, lxl ~ a si et


seulement si x ~ a et -x ~ a. La phrase « Z1 et Z2 jouant des rôles symétriques, etc. » doit
être comprise dans le sens suivant : z 1 et Z2 sont des variables muettes et indépendantes, donc
toute propriété prouvée pour (z 1, z2) le sera automatiquement pour (z2, z1).
99

III. L'EXPONENTIE LLE COMPLEXE

III.1. Acte I, rappels sur l'exponentielle réelle


Nous rassemblons dans ce paragraphe quelques rappels concernant la fonction exponentielle.
Nous reviendrons sur ces définitions et propriétés dans le chapitre sur les fonctions usuelles.
On suppose acquise l'existence de la fonction ln (le logarithme népérien) sur JO, +oo[, unique
primitive de la fonction x H 1/x sur JO, +oo[ s'annulant en 1.

Définition 5.23. (Exponentielle réelle). La bijection réciproque de la bijection définie


par ln :JO, +oo[H lR est appelée exponentielle. On la note exp: lR H]O, +oo[, x H ex.

Le logarithme transformant les produits en sommes, sa bijection réciproque effectue la


transformation inverse : l'exponentielle transforme les sommes en produits. l!)

Proposit:toil f>.24. f:&îûâtiÔn f-Oncliônnêlle del~ttponêntielle).


a
\t' (x, y) E R2, e"+Y = èe",
III.2. Acte II, représentation polaire d'un nombre complexe
Il existe deux modes usuels de repérage dans le
plan : les coordonnées cartésiennes et les coor-
M(z) données polaires. La première méthode est bien
connue et nous l'avons rappelée dans un pa-
ragraphe précédent. Détaillons à présent le re-
if 0 pérage par coordonnées polaires. Le plan 9
est supposé muni d'un repère orthonormé di-
0 i1
rect (0, ü, v). Un point M distinct de l'origine
est entièrement déterminé par la donnée d'un
nombre réel r-/- 0 et par la donnée d'une mesure
FIGURE 5.6. Coordonnées polaires d'angle 0 de la manière suivante : soit wl'unique
vecteur de norme 1 tel que (ü, w) = 0 [2nJ; M
est alors défini par 0M = rw. Un point M est
donc repéré selon ce mode par le couple (r, 0)
dont les composantes sont appelées les coordon-
nées polaires de M.

_\t l cuti011 Les coordonnées polaires


Si (r, 0) désignent les coordonnées polaires d'un point M -/- 0 relativement à (0, Ü)
dans le repère orthonormé direct (0, Ü, v), les autres coordonnées polaires du point M
sont les couples du type (r, 0 + 2kn) ou (-r, 0 + (2k + 1 )n) où k E Z.

Soit un nombre complexez non nul. Notons (r, 0) des coordonnées polaires du point M(z)
et (x, -y) les coordonnées cartésiennes dans (0, ü, v) du point M(z). D'après le cours de tri-
gonométrie, en notant H et K les projetés orthogonaux de M sur les axes (Ox) et (O-y), on a
100

x =OH= rcos(8) et y= OK= rsin(8). Puisque z = x + iy, on a lzl = Jx 2 + y 2 = lrl, d'où


rn la définition suivante.
J
,...;

Définition 5.25. (Forme polaire ou trigonométriq ue d'un nombre complexe). Pour


tout nombre complexez non nul, il existe 8 E lR tel que z = lzl(cos(8) + isin(8)). Une telle
écriture est appelée forme trigonométrique ou polaire de z.

Ainsi, pour déterminer la forme polaire d'un nombre complexez non nul donné, on com-
mencera par calculer lzl puis on recherchera 8 E lR tel que z/lzl = cos(8) +isin(8). On se
souviendra pour cela des valeurs particulières des lignes trigonométrique s (en n/2, n/3, n/6,
n/4, etc.) en s'aidant au besoin du cercle trigonométrique.

EXEMPLE 5.26. Écrivons sous forme polaire les nombres i, 1 + i et -1 /2 + ivS/2.


► On a immédiatement i = cos(n/2) + isin(n/2) car sin(n/2) = 1 et cos(n/2) = O. On a
11 +il= v2 et 1/vl. = cos(n/4) = sin(n/4), d'où 1 +i = vl.(cos(n/4) +isin(n/4)). Enfin,
puisque -1/2 = cos(2n/3) et \/S/2 = sin(2n/3), -1/2 + i\/S/2 = cos(2n/3) + isin(2n/3).

Les mathématiciens ont donné un nom particulier au nombre ~ ";,iv'3.


1

Définition 5.27. (Le nombre j). On pose j = cos(2n/3) + isin(2n/3) = -½ + i 1-

A(I)

FIGURE 5.7. Le nombre j

La raison de distinguer ce nombre de tous les autres est qu'il intervient en géométrie du
triangle : il est très utile pour l'étude des configurations équilatérales. Avant d'y revenir dans
le cours de géométrie, remarquons d'ores et déjà que

j2 = -1/2 - i\/S/2 = cos(4in/3) + isin(4n/3),

et qu'ainsi les points A(l), B(j) et C(j2) forment un triangle équilatéral. On prendra donc
garde à ne pas utiliser les lettres i et j comme noms de variable dans un exercice sur les
nombres complexes, elles sont réservées.
101

III.3. Acte III, le groupe 1U


r/J
On a vu apparaître géométriquement au paragraphe précédent la quantité cos(0) + isin(0).
Étudions le produit de deux quantités de ce type : soient 0, cp E JR,

(cos(0) +isin(0)l(cos(cp ) +isin(cp)) =


iu
r/J

(cos( 0) cos( cp) - sin( 0) sin( cp)) + i( cos( 0) sin( cp) + cos( cp) sin( 0)),

et d'après les formules d'addition du sinus et du cosinus, cette quantité est égale à

r/J
Cl)
"O
cos(0 + cp) + isin(0 + cp ). y
r/J

Vis-à-vis des imaginaires purs, la quantité cos(0) + isin(0) joue donc le même rôle que l'expo- ~u
nentielle réelle : elle transforme des sommes en produits, ce qui motive la notation suivante. j
tr.i
Définition 5.28. (Exponentielle d'un imaginaire). Pour tout 0 E JR, on pose ..ci
u
ern = cos(0) + isin(0).

Les formes trigonométrique s s'écriront désormais de manière condensée : z = lzlern. Ainsi,


par exemple, j = e 2ür/3 et j2 = e 4 i1r/3 _ De cette définition découle immédiatement les expres-
sions des fonctions sinus et cosinus à l'aide de l'exponentielle, connues sous le nom de formules
d'Euler.

:P~Î)~Îit>n . ~.~.,{~ulé!fd œûlér)~··.

'.~(J··;~;/~('1}i~ii1~~~·•.··
~~titin s.oof ~iKtJ{fto"ît~~Î~jJ "~fé~'ffJ)1E i 2;~tr~YJ ~tt1!~':
1

De sa démonstration en début de paragraphe, nous retiendrons que l'équation fonctionnelle


de l'exponentielle n'est ni plus ni moins qu'une écriture condensée des formules d'addition du
sinus et du cosinus.

PREUVE. Soit 0 E lR. Puisque ei9 = cos(0)-isin(0) = cos(-0) +isin(-0), on a ei9 = cm.
De plus, ei0-ie = e0 = 1 = ei0 e-rn, donc 1/eie = e-ie_ ■

Test 5.7. Test 5.8.


Déterminer les conjugués des nombres suivants : Écrire sous forme polaire les quatre nombres
e-i 1 - ern complexes
1 + i' j' 1 + ei0 · ±v13 ± 3i.

Les règles précédentes vont nous permettre de calculer la forme polaire de la somme de
deux nombres complexes de module 1. Cette méthode est connue sous le nom de factorisation
par l'arc moitié.
102

Factorisation par l'arc moitié


Soient 0, cp E R D'après les propriétés de l'exponentielle,
,_;

d'où ern + eicp = 2 cos( (0 - cp) / l)ei(e+cpl/2 .

Il faut remarquer que cette dernière écriture n'est pas toujours la forme polaire du nombre
eie + eicp puisque la quantité cos((0- cp) / 2) peut être négative. Cette méthode s'adapte sans
peine aux expressions du type ± 1 ± ei6 •

EXEMPLE 5.32. Écrivons sous forme polaire IX= ein/4 + elin/5 et f3 = 1 + ein/4 _
4
► Factorisons par l'angle moitié. On a IX= 2cos(23n/40)e in/ o mais cos(23n/40) < O.
33

On écrit donc, IX= 2cos(23n/40 + n)e in/ 0+in = 2cos(63n/40)e in/ o_ De même, on écrit
33 4 73 4

que f3 = einf (ein/B + e-in/ ) = lcos(n/8)ein/B, et c'est fini puisque cos(63n/40) > 0 et
8 8

cos(n/8) > O.

Nous reviendrons sur cette technique dans un paragraphe consacré à la trigonométrie.


Remarquons déjà que l'écriture trouvée ci-dessus de eie + eicp permet de prouver les deux
formules de factorisation suivantes :

cos(0)+cos(qi)=2cos ( -e-qi)
- cos (e+qi)
- - . .
,sm(0)+sm(qi)=2cos - - sm (e+qi)
(e-qi). - -.
2 2 2 2

Il suffit pour cela d'égaler les parties réelles et imaginaires des deux membres.

PREUVE. Soit pour tout entier naturel n, HR(n) la proposition eine = (ei0)n. HR(O) est
banale puisque e 0 = 1. Supposons HR(n) vraie. Alors, d'après l'équation fonctionnelle de
l'exponentielle, ene+e = en°e 0 = (ei0)nei0 = (ei0)n+ 1 . La formule est donc acquise pour
n E N d'après le principe de récurrence. On remarque pour conclure que la formule est vraie
pour des exposants négatifs puisque e-ine = eine = (ei6 )n = (ei6 )n = (e-i0)n. ■

Rappelons que l'écriture eine = (ei0)n est une formulation condensée de l'égalité

(cos(0) + isin(0))n = cos(n0) + isin(n0).


On retiendra aussi de cette formule que l'écriture sous forme polaire d'un nombre complexe
est particulièrement adaptée au calcul de ses puissances.

EXEMPLE 5.34. Calculons IXn pour IX= 1 t'{3 et n E N.


► Écrivons IX sous forme trigonométrique: IX= ,rz:7~~.
= 2 112 ein/ll_ On conclut en appliquant
la formule de Moivre, IXn = 2nlleinn/l2_
103

Test 5.9. Test 5.10.


Écrire sous forme polaire ex = - 1 + ein I 3 . Déterminer les entiers n tels que jn f/. IR.

Puisque e2in = eiO, la fonètion exponentielle, définie sur iIR, n'est pas injective. Nous
terminerons ce paragraphe par une proposition qui précise ce défaut d'injectivité de l'expo-
nentielle.

PREUVE. Pour tous 0,cp E IR, ei8 = éP équivaut à (cos(0),sin(0))


.
(cos( cp), sin( cp)),
c'est-à-dire 0 = cp [2 7C]. ■

L'ensemble des nombres complexes de module 1 correspond géométriquement au cercle de


centre O et de rayon 1. Les mathématiciens ont convenu de le noter 1U. u:i
..d
u
Définition 5.36. (1U). On pose 1U = {z E CI lzl = 1} = {ern,e E IR}.

IIl.4. Acte IV, arguments d'un nombre complexe non nul


Définition 5.37. (Argument d'un nombre complexe non nul). Soit un nombre com-
plexez non nul. Tout réel e tel que z = lzl ei8 est appelé un argument de z.

Définition 5.38. (Argument principal d'un nombre complexe non nul). Soit z E
C*. L'unique réel e E ] - n, n] tel que z = lzl ei8 est appelé l'argument principal de z. On
le note arg(z).

D'un point de vue géométrique, siboint M désigne l'image de z -=/= 0, tout argument
0 de z est une mesure de l'angle (Ü, OM), l'argument principal correspondant à la mesure
principale.

lzl

v 0

0 il

FIGURE 5.8. Argument d'un nombre complexe non nul

Connaissant un argument du nombre complexe non nul z, on peut facilement obtenir tous
les autres arguments de z de la manière suivante :
103

Test 5.9. Test 5.10.


Écrire sous forme polaire ex = -1 + e i7I / 3 . Déterminer les entiers n tels que jn <f: R UJ

Puisque e 2i7I = ei0 , la fonction exponentielle, définie sur illl, n'est pas injective. Nous
terminerons ce paragraphe par une proposition qui précise ce défaut d'injectivité de l'expo- i
nentielle.
18
PREUVE. Pour tous e, cp E Ill, ei0 ei<P équivaut à (cos(0),sin(0))
.
(cos ( cp), sin ( cp)),
UJ
~
0
UJ
c'est-à-dire 0 = cp [2n]. ■ e-
8
L'ensemble des nombres complexes de module 1 correspond géométriquement au cercle de ~
centre O et de rayon 1. Les mathématiciens ont convenu de le noter lU. in
..d
ü
Définition 5.36. (lU). On pose lU = {z E C l lzl = 1} = {ei0, 0 E Ill}.

III.4. Acte IV, arguments d'un nombre complexe non nul


Définition 5.37. (Argument d'un nombre complexe non nul). Soit un nombre com-
plexe z non nul. Tout réel 0 tel que z = lzl ei0 est appelé un argument de z.

Définition 5.38. (Argument principal d'un nombre complexe non nul). Soit z E
C*. L'unique réel 0 E ] - n, n] tel que z = lzl ei0 est appelé l'argument principal de z. On
le note arg(z).

D'un point de vue géométrique, si9oint M désigne l'image de z "# 0, tout argument
0 de z est une mesure de l'angle (Ü, OM), l'argument principal correspondant à la mesure
principale.

lzl

v 0

0 ü

FIGURE 5.8. Argument d'un nombre complexe non nul

Connaissant un argument du nombre complexe non nul z, on peut facilement obtenir tous
les autres arguments de z de la manière suivante :
104

PREUVE. La proposition découle immédiatement de l'équivalence prouvée dans le paragraphe


précédent ei0 = eiq, {=} e = cp [27t]. ■

La notion d'argument est la clef de l'interprétation géométrique du produit de deux


....;
nombres complexes. La proposition 5.40 achèvera d'éclaircir ce point obscur.

i1:1t ~:~t1t~t~tf~t..
11 5
~

21:miflli:il:= -~(f:ûI21CJ:
leJ:es ~1•. et zi ~on n1Jl.s, ·. ; >. . (i · •· .·.
. ·. 3) aig(i1/z~} !!Ê ~g{z.1) ~,~{~;J~~J2t~,.>
4) \fn E Z,arg(zf) = narg{z1}(2tt:J.

PREUVE. Soient z 1 et z 2 deux nombres complexes non nuls, que l'on écrit sous forme po-
laire, ZJ = r1eiarg(z,J et Zz = r2eiarg(zzl. On a z1z2 = r1r2ei(arg(z,J+arg(zzll_ Ainsi, d'après la
proposition précédente, arg(z1 z2) = arg(z1) + arg(z2) [2n]. Puisque 1/zz = (1/r 2Je-iarg(zzl,
arg(1/z2) = -arg(z2) [2n]. Appliquons ce qui précède: zi/z2 = z1 x l/z2, d'où finalement
arg(zi/z2) = arg(z 1) + arg(l /z2) = arg(z 1) -arg(z2) [2n]. Par une récurrence immédiate, on
prouve à partir de la formule 1) que \fn E N,arg(z1) = narg(z1) [2n]. On conclut alors en
utilisant le 2). ■

Test 5.11. Test 5.12.


2 Exprimer e±inI 3 en fonction de j et j 2 .
Calculer un argument de Cl'. =j - j.

Nous sommes maintenant en mesure d'interpréter géométriquement la mystérieuse défi-


nition du produit de deux nombres complexes.

Interprétation géométrique de la multiplication


Soit z 0 E (C*. Soit ëi un vecteur du plan d'affixe z =/. O. Quel est l'effet de la multiplication
~r z 0 sur ëi? Puisque arg(zo z) = arg(z) + arg(zo) [2 7t] et que lzozl = lzollzl, le vecteur
b d'affixe z 0z s'obtient par la composée d'une homothéthie de centre O de rapport lzol
et une rotation de centre O et d'angle arg(z 0 ). Géométriquement parlant, l'application
de multiplication par z 0 =/. 0, définie par z H z 0 z, est donc une similitude directe de
centre O d'angle arg(z0 ) et de rapport lzol-
M( iz)

M(z)

En particulier, la multiplication par ei0 correspond à une rotation de centre O et d'angle


8, et la multiplication par un réel à une homothétie de centre O.
105

III.5. Acte V, prolongement de l'exponentielle à CC


Définition 5.41. (Exponentielle complexe). Vz E rc, on pose ez = e'.Re(zlei'.lm(zl.

Le lecteur se persuadera qu'il s'agit de la seule manière de prolonger l'exponentielle à


l'ensemble (C en une fonction vérifiant l'équation fonctionnelle bien connue V (z 1 , z 2 ) E <(:::2,
ez1 +z2 = ez1 ez2 •

PREUVE. Soient z 1 et z2 dans rc. Par définition, ez1 +z2 = e!R<lz, +z2lei'.lm[z, +z2 l, d'où par addi-
tivité des parties réelle et imaginaire, ez1 +z2 = e'.Re(z, l+'.Re(z2 lei'.lm(zi l+iJm(z2 l. Puis on applique
deux fois l'équation fonctionnelle de l'exponentielle (celle déjà prouvée pour les réels et les
imaginaires purs), ez1+z2 = e!R,[zile%(z2 leiJm(z,Jei'.lm(z2 l. On utilise alors les règles de calcul
I!)
sur (C pour obtenir, eZJ +z2 = e!Re[z, lei'.lm(z, le!Re[z2 lei'.lm[z2 ), Et finalement, d'après la définition ..d
de l'exponentielle, ez1 +z2 = ez, ez2. ■ u

On prouve à partir de cette proposition et par une récurrence immédiate, que pour tout
nombre complexez et pour tout entier naturel n, (ez)n = e=.

~ S.4:b(Piiôpri{Jtë&.de h.,.ùrientiêtl.è). PtJ'àr tm,,t nt>mbre:ttmnpÎe:tè Z/.


1>"
. .. . . . '.il) }J~z";"e-:z; . .

PREUVE. Soit z E rc. On a ez-z = e O = 1 = eze-z, ainsi ez =/ 0 et 1/ ez = e-z, ce qui prouve


les propriétés 1) et 4). De plus, fez[ = [e'.Re(zlei'.lm(zl[ = [e!Re(zl[[ei'.lm(zl[ = e!Re(z) car [ei'.lm(zl[ = 1
et e!Re(zJ E IR+, d'où la propriété 2). On en déduit immédiatement la propriété 3) puisque
ez = [ez[ei'.lm(zl_ De même, on en déduit la propriété 5) puisque
ez = e!R,(zle-Dm[zJ = e!Re(zJ-iJm(zJ = ez. ■

Les propriétés 2) et 3) de la proposition 5.43 peuvent être résumées par la phrase suivante :

ez = e!R,(z) ei'.lm(z) est une écriture sous forme polaire de ez.

On en déduit immédiatement la proposition 5.44.

P~positJon; 5.«::~(~i>dtêitê')dê l1éXpo~êntiélfe)( V{Z1' t2) E IC1 / éZ1 ·~· e'Zf'si èt


séulemêrit si i7te(zt) =9letzz}etJm{zù :s 1m.(zi)!.ê1tl
Ce résultat permet de résoudre les équations du type ez w où w E (C*. En effet,
écrivons w sous forme polaire, w = rei0 = ein(rJ+rn. L'équation ez = w est alors équivalente à
91e(z) = ln(r) et Jm(z) = 0 [2n].

EXEMPLE 5.45. Résolvons dans rc les équations e 2 = -7, e2 = -2i et e 2 = 1 + i.


► Puisque -7 = e 1nl 7J+in, l'équation ez = -7 admet pour solutions les nombres de la
forme ln(7) +in+ 2ink, avec k E Z. De même -2i = eln(Z)+für/z, l'équation ez = -2i
admet pour solutions les nombres de la forme ln(2) + 3in/2 + 2ink, avec k E Z. Puisque
1 + i = vllei,r/4 = e'n[v'Zl+i,r/4, l'équation ez = 1 + i admet pour solutions les nombres de la
forme ln( vil)+ in/4 + 2ink, avec k E Z.
106

La proposition suivante établit que la fonction exponentielle atteint toutes les valeurs
sauf O. Nous avons déjà remarqué la non-injectivi té sur C de l'application exponentielle au
cours des paragraphes précédents, ce qui nous empêche de définir une fonction logarithme sur
...; C* (qui serait la fonction réciproque de l'exponentielle) .

P~$}~~i;.~;4§~:l/4P}l~f4!~t!~~t~~,ijfilit~~itli·H.C}J;§'..~t~,~:~1~
PfMl: Btlll'j~tfé,·.~ml. î~gp étàn;t ~ieJtC*;' ..... :<,t. ;)~:;··•
PREUVE. Puisque l'exponentielle ne s'annule jamais, son image est contenue dans C*. Réci-
proquement, soit z E C*. Écrivons z sous forme polaire: z = rem avec r > 0 et 0 E R On a
alors z = eln(T)+ie et donc z appartient à l'image de l'exponentielle. ■

IV. NOMBRE S COMPLEXES ET TRIGONOMÉTRIE


L'exponentielle complexe est un outil puissant en trigonométrie, son efficacité résidant dans
son équation fonctionnelle, comme nous allons le constater dès le premier paragraphe.

IV.1. Comment retrouver une formule de trigonomé trie oubliée?


Revenons un instant à la démonstratio n de l'équation fonctionnelle vérifiée par l'exponen-
tielle. Nous avions remarqué que l'égalité eiaeib = ei(a+bl n'est ni plus ni moins qu'une écri-
ture concise des formules d'addition du sinus et du cosinus. On pourra donc, en cas d'oubli,
retrouver ces formules en passant par l'exponentielle. Quant aux formules de factorisation,
elles peuvent se démontrer ou se retrouver facilement à partir du nombre complexe eiP + eiq
factorisé par l'arc moitié.

EXEMPLE 5 .4 7. Retrouvons la formule de factorisation de sin( p) + sin( q).


► Soient p et q deux réels. Puisque sin(p) + sin( q) = Jm ( e ip + eiq) et
eip + eiq = ei(p+q)/2[ei(p-q)/2 + e-i(p-q)/2] = 2cos((p - q) / 2)ei(p+q)/2,

On a sin(p) + sin(q) = 2cos((p - q) / 2) sin((p + q) / 2).

Dans le cas de la somme sin(p )+cos( q), on partira de cos( q) = sin(n/2-q) afin d'appliquer
la même méthode. Nous reviendrons sur le calcul des sommes trigonométriques.

IV.2. Superposi tion de sinusoïdes


La solution générale de l'équation x" + w2x = 0 d'un oscillateur libre (qui se retrouve par
exemple en électronique ou en mécanique, comme on le verra dans le chapitre sur les équations
différentielles) s'écrivant
t Ha cos(wt) + b sin(wt),
il est intéressant d'étudier les expressions du type

a cos(x) + b sin(x), où a et b sont réels.


107

Posons z = a+ i b que nous écrivons sous forme trigonométrique z = reie avec r ? 0 et


0 E R Puisque a cos(x) + b sin(x) = 9le(zeix), on a a cos(x) + b sin(x) = r 9le(ei(x-0 l) r/J

et donc

EXEMPLE
a cos(x) + b sin(x) = r cos(x - 0) = J
a 2 + b 2 cos(x - 0).

5.48. Résolvons dans lR l'équation v'3 cos(x) + sin(x) = 1.


ij
► Posons z = vJ+i = 2ein/6 . Pour tout x réel, v'3cos(x)+sin(x) = 29le(eixe-in/ 6 ), et ainsi
v'3 cos(x) + sin(x) = 2 cos(x - n/6). L'équation s'écrit alors cos(x - n/6) = 1/2 = cos(n/3) 8
r/J
et admet pour solutions les nombres de la forme n/2 + 2kn et ceux de la forme -n/6 + 2kn, ~
avec k E Z. w
r/J
e-
8
j
V. ÉQUATIONS ALGÉBRIQUES in
..d
ü
Comme nous l'avons rappelé en ouverture de ce chapitre, les nombres complexes sont nés
de la théorie des équations algébriques. Seule la résolution générale des équations de degré
deux figure au programme. Il faut cependant savoir (cf. l'introduction historique) qu'il existe
des méthodes générales de résolution des équations de degré trois (cf. les travaux de Scipion
del Ferro) et quatre (cf. Ferrari et plus tardivement Lagrange). Après de nombreux échecs
concernant l'ordre cinq, Évariste Galois prouva au début du XIX• siècle qu'au-delà de l'ordre
quatre, il n'existe aucune formule générale permettant de calculer les racines d'un polynôme
à l'aide de radicaux.

V.1. Racines carrées d'un nombre complexe

PREUVE. Soit w un nombre complexe non nul. Écrivons w sous forme polaire : w = rern
avec 0 E lR et r > O. L'équation z 2 = w s'écrit donc z 2 - ( y'rei0/l)2 = 0, c'est-à-dire
(z-y'rei8 / 2)(z+ y'rei8 / 2) = O. Cette équation admet exactement deux solutions: les nombres
y'reie/2 et -y'reie/2_ ■

La technique employée dans cette démonstration ne permet pas de déterminer la forme


algébrique d'une racine carrée. Il reste à décrire une méthode pratique d'extraction des racines
carrées. Recherchons, par exemple, les racines carrées de w = 8 + 6i. Pour tous réels x et
-y, (x + i-y) 2 = w si et seulement si x2 - -y 2 + 2ix-y = 8 + 6i, d'où x 2 - -y 2 = 8. De plus,
l(x +i-y)2j = x 2 +-y 2 = lwl = 10. On a donc x 2 = 9 et -y 2 = 1, c'est-à-dire x = ±3 et -y= ±1.
Puisque 2x-y = 6, x et -y sont de même signe. Ainsi, (3 + i) 2 = (-3 - i) 2 = 8 + 6i. Il faut
bien comprendre l'esprit de ce calcul : on sait qu'il existe deux couples de réels (x, -y) tel que
(x+i-y)2 = w (d'après la proposition 5.49); on trouve 4 valeurs possibles de (x, -y) ((±3, ± 1));
on en rejette 2 après examen du signe de 2x-y = Jm( w) : les deux couples qui restent sont
nécessairement les solutions au problème, il n'y a aucune vérification à entreprendre.
108

Extraction des racines carrées de w E C


On recherche une racine carrée z = x + i -y de w, avec x et -y réels.
2
...;
o On commence par calculer x et -y 2 qui sont solutions du système linéaire suivant,

x 2 --y 2 = ry{e(w)
{ x 2 +-y 2 = lwl

◊ On en déduit quatre couples (x, -y) solutions, et puisque 2x-y = Jm( w), on ne retient
que les deux couples (x, -y) tels que le signe de xy soit celui de Jm( w).

On se gardera d'appliquer cette méthode dans le cas où w est un nombre réel. Les racines
carrés de w sont alors évidentes, égales à ±y'u! si w est positif et à ±iJfwî si w est
négatif.

Signalons une variante de cette méthode (mais qui ne manque pas de lourdeur) : on
substitue dans l'équation x 2 - -y 2 = ry{e(w) la valeur de -y calculée par lx-y = Jm(w); on
obtient alors une équation bicarrée en x, que l'on peut résoudre.

EXEMPLE 5.50. Extrayons les racines carrées de w = -8 - 6i.


► Soit z = x + i-y une racine carrée de w. Alors x 2 - -y 2 = ry{e( w) = -8 et x 2 + -y 2 = lwl =
v'lOO = 10, d'où x2 = 1 et -y 2 = 9. Puisque lx-y= -6 < 0, on obtient, 1 - 3i et -1 + 3i.

Test 5.13. Test 5.14.


Extraire les racines carrées de 1 ± i. Extraire les racines carrées de 5 - 12i.

V.2. Équations algébriques du second degré à coefficients dans (C

~ôp~tioil ·s:sï..(~utiondêséqt,.âtîotis du séëviitfâ:éiré}. S<Jieni à, li etc trois


o.
J!l01li.?njs e(ifn~S•te4 '}Ûe a # $oit 6 une racine ca~ âu discrimino:nt C . .• . ..
'A= b2:....4a,c de l'équation {E} : az2 + bz+c = O.

'v•z' € é,•tli4+lrz
. ..
:+.~ =a(z ~ ~h+ S)' (~:_ ~b ...
. ~ . ~
6
.)'. ··

PREUVE. Écrivons (E) sous forme canonique

Vz E C, az2 + bz + c = a[(z + b/la) 2 - b 2 /4a 2 + c/a]

i.e. Vz E C, az2 + bz+ c = a[(z+ b/2a)2-L'l/4a2]; soit ô une racine carrée de !1. L'équation
az2 + bz+c = 0 est équivalente à (z+ b/2a) 2 - (6/la) 2 = 0, c'est-à-dire (z+ b/2a+f>/la)(z+
b/2a- 6/2a) = O. ■
109

Résolution de az2 + bz + c = 0 où a E (C*


rfJ

o Calcul du discriminant ~ = b 2 - 4ac.


◊ Extraction d'une racine ô de~ (& 2 = ~).
-b+& -b-ô
o Les racines de l'équation sont données par z 1 = ~ e t z2 = ~ -
iu
rfJ
~

1
rfJ
Cl)
On remarquera que la méthode de résolution sur C est la même que sur :IR, la seule différence "Cl

intervenant au moment du calcul d'une racine carrée du discriminant ~, qui existe toujours u
rfJ
sur C alors que les réels strictement négatifs n'ont aucune racine carrée réelle. ~
u
2
EXEMPLE 5.52. Résolvons dans C l'équation z - (1 + i)z + 2 + 2i = O.
j
► Le discriminant de l'équation est égal à~= (i+ 1)2-4(2+2i) = -8-6i = (l -3i) (voir
2 in
3 1 3 ..d
l'exemple 5.50) d'où les racines de l'équation, z 1 = l+iil- i = 1 - i et z2 = l+, 2 + i = 2i. ü

On déduit des expressions z 1 = -~;0 et z2 = -~;0 de ci-dessus que la somme des racines
de (E) vaut s = z 1 + z 2 = -~ et que leur produit est égal à z,z2 = ~;;:f = ~ = ~-
Ces égalités sont appelées relations coefficients-racines et sont à connaître parfaitement ; elles
seront généralisées dans le cours sur les polynômes.

Relations coefficients-racines

Soient a -/- 0, b et c trois nombres complexes. Les racines z, et z2 de l'équation az2 +


bz + c = 0 vérifient les relations
b C
z 1 +z2=-- et z,z2=-.
a a

Pri'.>poiiti<>~. tsJSS. .Soientp et s deûinombres çomple~es.. ùs.s~ul$nmnôreeicofüple:tes Zt


=
et. i 2 qui vérifients z1 +z2 et p = z 1i2 sonHesracines du. trinQmè z2 - sz +P = O.
PREUVE. D'après les relations coefficients-racines, les racines z 1 et z2 de z 2 - sz + p = 0
vérifient les égalités s = z 1 + z2 et p = z1z2. Réciproquement, soient z, et z2 vérifiant ces
relations. Ces deux nombres sont racines du trinôme (z - z,)(z - z2) qui n'est autre que
z 2 - ZZ2 - z,z + Z1Z2 = z 2 - (z, + Z2)z + Z1Z2 = z 2 - sz + p. ■

V.3. Racines n-ièmes de l'unité


Définition 5.54. Soit n E N*. Une racine n-ième de l'unité est un nombre complexez tel
que zn = 1.

Pré)position 'iùss: Pàur toût n Ê N>nonnûl," il 1Wiste''~àétê111,ent n ·mcînêi'n:ittriês ·de.


l'unité, les wk =e ik:rc/n pour O :;;; k ~ n -
2 l, où w = e2infn.
110

PREUVE. Soit z E C*. Écrivons z sous forme polaire: z = reie avec r > 0 et 0 E R zn = 1
si et se'lllement si rn = 1 et eine = 1, c'est-à-dire r = 1 et n0 = 0 [2n], c'est-à-dire il existe
m E Z tel que z = ei0 avec 0 = 2mn/n. Effectuons alors une division euclidienne de m par
.... n : m = qn + k avec O ~ k < n. Ainsi z = e 2k7r/n+Ziq7r = e 2ik7r/n_ ■

Cette proposition permet le calcul effectif des racines n-ièmes de l'unité sous forme d'ex-
ponentielle.

EXEMPLE 5.56. Montrons que les racines cubiques de l'unité sont 1, j et j2.
► En effet, les racines cubiques de l'unité sont données par e 0 = 1, e 2i7r/3 = j et e 4 i7r/3 =
( e2i7r/3)2 = j2.

On peut également tirer de la proposition précédente des renseignements sur la configu-


ration géométrique des images des n racines n-ièmes de l'unité. Puisque pour tout O ~ k ~
n - 1, wk est de module 1 et d'argument principal 2 ~7[,les images des racines n-ièmes de
l'unité wk sont réparties régulièrement sur le cercle unité : elles forment un polygône régulier
à n côtés en partant du point d'affixe 1. Par exemple, dans le cas n = 5, les points d'affixes
1, e 2i7r/S, e4i7r/S, e6i7r/S et e 8i7r/S sont les sommets d'un pentagone régulier inscrit dans le cercle
unité.
w

n=3, w=j n=S, w=elin/5

FIGURE 5.9. Racines n-ièmes de l'unité et polygônes réguliers à n côtés

EXEMPLE 5.57. Puisque e 2i7r/ 4 = ei7r/Z = i, les racines quatrièmes de l'unités sont l ,i, i 2 =
-1, i 3 = -i. Puisque e 2i7r/G = ei7r/ 3 , les racines sixièmes de l'unité sont 1, w = ei7r/3 , w 2 =
j, w3 = -1, w4 = j2, ws = e-i7r/3_

wn - 1 e2ni7r/n - 1 e2i7r - 1
PREUVE. Puisque w =/= 1, 1 + w + · · · + wn-l = - -- = =0. ■
w- 1 w- 1 w- 1
La proposition 5.58 possède une interprétation géométrique simple : l'isobarycentre du
polygône régulier dont les sommets sont les images de 1, w, ... , wn-l est l'origine O.
111

Propriétés des racines n-ièmes


◊ Périodicité.

La suite (wm)mEN est n-périodique. En effet, Vm E N,wm+n = wmwn = wm. Par


exemple, la suite ( jm )mE N commence par la séquence 1, j, j2, 1 , j, j 2 , 1, j, etc.

◊ La somme des racines n-ièmes de l'unité est nulle.

Dans des calculs où intervient une racine n-ième w, on tirera parti de ces deux propriétés.
Par exemple lorsque n = 5 et w = e2 i.rr/S, le calcul de la quantité u = (w + w 4 ) (w 2 + w 3 )
ici
commence par un développement du produit u = w 3 + w 4 + w 6 + w 7 ; on simplifie alors ..d
la somme en exploitant la 5-périodicité de (wm)mEN: puisque w 5 = 1, on a w 6 = w et ü
w 7 = w 2 . Ainsi u = w + w 2 + w 3 + w 4 et de l'égalité 1 + w + • • • + w 4 = 0, on déduit que
u = -1.

EXEMPLE 5.59. On pose (3 = e 2i.rr/7, A = (3 + (3 2 + (3 4 et B = (3 3 + (3 5 + (3 6 . Calculons


A+ B et AB puis déduisons-en les expressions de A et B à l'aide de radicaux.
► Puisque A+ B est la somme des racines septièmes de l'unité sauf 1, A+ B = -1. De plus,
AB = 3 +A+ B = 2. Les nombres A et B sont donc les racines de l'équation z 2 + z + 2 = 0,
c'est-à-dire (-1 ± i\!7)/2. Puisque Jm(A) = sin(4n/7) + sin(2n/7) -sin(n/7) > 0, A=
(-1 +iv7)/2 et B = (-1-iv7)/2.

Au-delà de la proposition 5.58, si z 0 désigne une racine n-ième de l'unité autre que 1, on
zn-1
a également 1 +Zo+···+z-:;,- 1 = O. En effet, z 0 -/= 1 donc 1 +zo+···+z-:;,- 1 = - 0- - = O.
Zo- 1

V.4. Racines n-ièmes d'un nombre complexe


Comme pour les racines n-ièmes de l'unité, on a la définition suivante.

Définition 5.60. Une racine n-ième de <X E C est un nombre complexe z tel que zn = <X.

La connaissance des racines n-ièmes de l'unité permet de donner toutes les racines n-ièmes
d'un complexe (non nul) dès que l'une d'elles est connue.

PREUVE. Si Zo = <X, l'équation zn = <X est équivalente à zn = zô, i.e. (z/Zo)n = 1. D'où les
solutions de l'équation: zo, ZoW, ... , zown- 1 , en posant w = e 2i.7t/n_ On conclut la démonstra-
tion en remarquant qu'un tel Zo existe toujours, si z = rei.0 avec r > 0 et 0 E :IR, Zo = y'rei.0/n
convient. ■

On retiendra la méthode suivante de détermination des racines n-ièmes de <XE C*.


112

ffJ
Calcul des racines n-ièmes de <X -/=- 0
Cl)

! o Rechercher une racine n-ième particulière z 0 en écrivant <X sous forme trigonométrique.
....; o L'équation zn = <X est équivalente à zn = z 0, i.e. (z / zo ln = 1, i.e. z / Zo est une
racine n-ième de l'unité.
o Les racines n-ièmes de <X sont donc z 0 , z 0 w, ... , z 0wn-l où w elin/n_

EXEMPLE 5.62. Déterminons les racines cubiques de - 1.


1
► Puisque (ein/3 l 3 = ein = -1, les racines cubiques de -1 sont ein/ 3 , jein/3 et j2ein/3 _

Les images des racines n-ièmes de <X E C * sont les sommets d'un polygône régulier à n
côtés circonscrit au cercle de centre O et de rayon yÎ<xÎ. On déduit sans peine des résultats
précédents que la somme des racines n-ièmes de <X est nulle.

EXEMPLE 5.63. Soit n E N*. Résolvons dans C l'équation (z - 1ln+ (z + 1 ln= O.


► Puisque 1 n'est pas solution, l'équation est équivalente à 1 + (~:: f
= 0, i.e. (~=:ln = -1.
Commençons par déterminer les racines n-ièmes de - 1 : puisque (e in/n ln = - 1 , les racines
n-ièmes de -1 sont les nombres ein/nelikn/n = e(lk+l)in/n avec O ,( k ,( n - 1. Un nombre
z est donc solution si et seulement si il existe k ,( n - 1 tel que

Z+ 1_ (2k+l)in/n
--1-e ,
z-
i.e. (1 - e(lk+l)in/n)z = -(1 + e(lk+l)in/nl. Puisque Vk ,( n - 1, 1 - e(lk+l)in/n f= 0, les
solutions sont les nombres,
1+ e(2k+l)in/n .
_ e(lk+l)in/n = -icotan((2k + l)n/n), 1 ,( k ,( n -1.
1

Remarque. On retiendra de cet exercice qu'il faut justifier avec soin l'équivalence des équa-
tions étudiées et prendre garde à la division par O. Le lecteur aura reconnu une factorisation
par l'arc moitié à la dernière ligne, au numérateur et au dénominateur.

VI. EXERCICES

5.1. 5.2.

Onposew=l+i. Résoudre dans C les équations suivantes :


1. (3+i)z2 -(8+6i)z+25+5i=0;
1. Extraire les racines carrées de w.
2. iz2 + (4i-3)z+i-5 = 0;
2. En déduire les expressions à l'aide de radi- 3. z 2 - Sz + 4
+ 1Oi = 0 ;
caux de cos(n/8) et sin(n/8).
4. (1 -5i)z2 - (20 +4i)z+ 61 + 7i = 0;
5. z 6 -2cos(0)z3 + 1 = 0 où 0 E IR.
113

5.3. 5.9.

Simplifier la somme suivante : Écrire sous forme algébrique les nombres com-
plexes suivants :
(i+ 1) 4 + (i-1) 5
1. 7
(i+ 1)
(i+ 1) 6 + 16(i-1) 3
2. 9
(i+ 1)
5.4. j129 + i1457
3. ï147
Calculer (1 + i )7 de deux manières. En déduire
ij+j2
les valeurs des sommes
4. (1 + j)7'

(~) - (~) + (:) - (~) et 5.10.


l.Q
.d
Soient a et b de module 1 tels que a =/= ±b. ü
(~) - (;) + (;) - (;). 1 +ab
Prouver que --b- E JR, et montrer que pour
a+
tout z E C
5.5. z+abz-(a+b) ..,,
E tJN..
a- b
On pose w = v'3 + i. Déterminer n E Z tel que
wn ER Même question avec wn E ilR.
5.11.
5.6.
Soient n ~ 2 et z1, zz, ... , Zn appartenant à
Prouver que C*. Prouver que

\ia, b E C, lai+ lbl ::;; la+ bl + la - bl.

Étudier les cas d'égalité. avec égalité si et seulement si


arg(z1) = arg(zz) = ... = arg(Zn),
5.7.

Après avoir prouvé que 'v Z E C \ {l},


5.12.
4 1
~ ~ =(Z+l)(Z-i)(Z+i)
1 Soit 0 E lR et ze = -sin(20) +2icos 2 (0).
= z 3 +z 2 +z+ 1 1. Déterminer le module et un argument de ze.
On discutera en fonction des valeurs de 0.
résoudre dans C l'équation suivante :
2. Déterminer l'ensemble des nombres réels 0
3 2
z-2i) (z-2i) (z-2i) =O tels que Izel = Ize - 11.
( z+ 2t. + z+ 2·t + z+ 2·t + 1 .
5.13.
5.8.
Résoudre dans C les équations suivantes :
Soit w une racine septième de l'unité distincte
de 1. Simplifier le nombre 1. ez + e-z = 1 ;
2. ez + e-z = li.
w w2 w3
<X=- 2
- - + -4- + - - -6
1+ w 1+ w 1+ w · 5.14.
114

22
2. En déduire les solutions dans IC de
UJ
1. Calculer la somme S = .[_ sin(kn/23).

~
Ill
...;
k=O

11
(z+~)n =1.
Z-l
2. Endéduirelavaleurde S' = .[_ sin(kn/23).
3. Soit 0 E fi: tel que 0 =/= 0 [2n/n]. Résoudre
k=O
dans IC l'équation
11
3. En déduire S" = .[_ 1w 2k - 11 où l'on a z+
( z-1
1) n = eine.
posé w = ein/ 23 _
4. En déduire les solutions dans IC de l'équation

5.15. z+l)n +(z-l)n


(z-l z+l =2cos(n0).

~ ~) n =
On traitera le cas général : 0 E fi: sans aucune
1. Résoudre dans IC l'équation (; 1. restriction.
Chapitre 6
SYMBOLES [ ET TT

OMMENÇONS ce chapitre dédié aux calculs de sommes et de produits par une petite

C digression sur les symboles de l'algèbre. Les notations que nous connaissons et mani-
pulons quotidiennement sont apparues entre le XVe et le XVIIe siècle. Les lettres p
et m (des initiales des mots italiens piu - plus - et mena - moins) utilisées pour l'addition
et la soustraction disparurent peu à peu au XVIe siècle, laissant la place aux notations + et -
introduites par l'allemand Johann Widmann en 1489.

Les signes = et >, < se sont d'abord imposés


en Angleterre dans les travaux de Robert Recorde
et Thomas Harriot au XVIe siècle avant d'être adoptés
par l'ensemble des savants européens. William Ough-
tred employa le signe x pour la multiplication au
XVIIe siècle. Gottfried Wilhelm Leibniz préféra utili-
ser le point ( ·) pour noter les produits, le symbole x
pouvant être confondu avec l'inconnue x. Le Français
François Viète fut à l'origine de l'emploi des lettres
a, b,c, etc., pour les inconnues (vers 1591) et René
Descartes fixa la notation algébrique moderne en uti-
lisant les lettres a, b, c, etc., pour les constantes ou
les données d'un problème en réservant x, y, z, etc.,
pour les inconnues. Descartes fut également l'inven-
teur de la notation exponentielle des puissances François Viête
a 2 , a 3 , etc.

Le mathématicien suisse Leonhard Euler est à l'origine de la notation des sommes à l'aide
du symbole L La paternité du symbole TT pour signifier produit est très controversée. Certains
historiens l'attribuent à Carl Friedrich Gauss au XVIIIe siècle alors que d'autres remontent au
XVIIe siècle en la personne de René Descartes.

1. CALCULER AVEC LE SYMBOLE .L

1. 1. Règles de calcul
Soient (Un)nEN une suite de nombres complexes et p ~ q deux entiers naturels. Afin d'alléger
l'écriture des formules, la somme Up + Up+i + · · • + Uq est notée
q

Up +Up+l + ·· · +uq = L_ Uk.


k=p

Dans la pratique, le terme uk est donné par une formule, ce qui rend l'écriture des sommes
à l'aide du symbole r: plus précise que les trois petits points précédents. Par exemple, pour
116
n

r/J
tout entier naturel n ;:: 1, on notera la somme des n premiers entiers non nuls L k au lieu
Il) k=l
de 1 + 2 + · · · + n.
~
...;
Dans l'expression précédente, l'indice k est muet, c'est-à-dire qu'on peut le remplacer par
n'importe quel autre indice
n n

Sn= L Uk= L Ue.


k=0 f=O

Cette somme ne dépend que de la valeur de n. Toute expression simplifiée de Sn ne compor-


n
tera donc plus la lettre k. Ainsi, la somme Sn = L 1 vaut n + 1 car on effectue les n opérations
k=O
suivantes : 1 + · · · + 1 (le 1 figurant n + 1 fois).

Il est important de savoir compter le nombre d'indices intervenant dans une somme. On
q
retiendra que pour tous entiers naturels p :( q, la somme L. uk comporte q - p + 1 termes.
k=p
Il suffit d'observer le schéma suivant :

______
...._
q entiers

(p -1)..., 'p- , , - -q' .


p - 1 entiers q-(p-1) entiers

28
On dénombre, par exemple, 27 termes dans la somme 4 + 6 + 8 + •• • + 56 = L 2k.
k=2

Test 6.1. Test 6.2.


Calculer la somme Soit n E N*. Écrire à l'aide du symbole r la
2006
somme suivante :
S= L 1.
Sn = 1 + 3 + 5 + 7 + · .. + 777.
k=1789

Les règles suivantes sont élémentaires et à connaître par cœur. Elles se démontrent par
récurrence sur le nombre de termes sommés en appliquant les règles de calcul usuelles sur les
nombres complexes.
117

En particulier, on déduit des deux dernières règles que, pour tout nombre réel 0 et tout
entier naturel n, i::
t
~ cos(k0) = 9le ( ~ eike) et ~ sin(k0) = Jm ( ~ eike)- l,.J
rfJ
CL)

ô
.c
Ce résultat est essentiel pour le calcul des sommes trigonométriques.
1co
I.2. Changements d'indices ..ci
ü

Une somme possède de nombreuses écritures à l'aide du symbole L Considérons par exemple
S = 6 + 8 + 10 + 12 + ••• + 28. On a
14 13 15
S = L 2k L (2k + 2) L (2k -
= = 2)
k=3

et l'on peut continuer à décaler ainsi les indices.

Plus généralement, examinons le cas de la somme suivante :


n

Sn= L Uk+l·
k=O

On a bien sûr Sn= U1 +u2 + · · · + Un+l, d'où


n n+l
Sn = L Uk+l = L. Uk.
k=O k=l

Cette manipulation s'appelle un changement d'indice; on peut l'effectuer sans justification


particulière. En cas de difficulté, on procédera comme dans la méthode suivante.

Changement d'indice
Effectuons le changement de variable C= k + 1 dans la somme suivante :

Lorsque k décrit le n+ 1-uplet (0, 1, ... , n), Cdécrit le n+ 1-uplet (1,2, ... , n+ 1), d'où

L'indice Cétant muet, on préfère écrire

cela évite l'inflation du nombre de variables.


118

Les exemples précédents consistaient en des décalages d'indices. Signalons dès maintenant
un autre type de changement de variable, qu'on pourrait qualifier de symétrie.
n n
..; EXEMPLE 6. 2. Interprétons et prouvons la formule .L. k = .L. (n - k) .
k=O k=O
► Il s'agit de prouver que

Uo + UJ + · · · + Un-1 +Un= Un+ lin-1 + · · · + UJ + Uo,

égalité banale par commutativité de l'addition. On justifiera cette égalité de la manière


suivante : effectuons le changement de variable C = n - k. Lorsque k décrit le n + 1-uplet
(0, 1, ... , n - 1, n), € décrit le n + 1-uplet (n, n - 1, ... , 1, O), d'où
n n n
.L_k= .L_(n-€) = .L_(n-k).
k=O k=O

q
Rappelons que l'écriture L uk n'a de sens que pour p ::;;; q. On sera vigilant lorsqu'un
k=p
changement d'indice renverse l'ordre des indices (cf. l'exemple précédent).

Test 6.3. Test 6.4.


Compléter l'égalité Soit n ~ 2. En posant e= n - k, établir que
n •
.L_ Uk+2 = .L_ Uk. n-1 ( ) n-1 ( )
k=3 k=• 6 tan ~: =
6 cotan ~: .

I.3. Télescopage dans une somme


Soient (un)nEN une suite de nombres complexes et n un entier naturel. On remarque sans
peine la simplification suivante :
n
Sn= .L_ (uk+l -uk) = (u1 - Uo) + (u2 -U1) +···+(Un -Un-1) + (Un+l -Un) = Un+l -Uo.
k=O

Celle-ci est qualifiée de simplification par télescopage. On peut en donner une preuve à l'aide
d'un changement d'indice. On a en effet, par linéarité
n n n
.L_ (Uk+1 - Uk) = .L_ Uk+1 - .L_ Uk.
k=O k=O k=O

Effectuons alors, dans la première somme, le changement d'indice € = k + 1. On obtient


n+l n n+l n
Sn= .L. Uf - .L_ uk = .L_ uk - .L_ uk = Un+1 - Uo.
f=l k=O k=l k=O
119

On visualise ce télescopage de la manière suivante.


t=
t;
Simplification par télescopage L--1
<Il

~
,.c
-u,,
+ U,,+1 - U,,+1
+ U,,+2 - U,,+2
1cc
+ U,,+3 - U,,+3 .ci
Pour tous entiers naturels p ~ q, on a ü

q
+uq-1 -Uq-1
+uq -Uq
L_ (Uk+l - Uk) = Uq+l -Up.
k=p
+uq+l

Test 6.5. Test 6.6.


Soient 4 ,;;; p ,;;; q. Simplifier la somme Soient 4 ,;;; p :'( q. Simplifier la somme
q-1 q-1
,L_ (Uk+l - Uk_i), .L. (u~+l -uLil-
k=p-3 k=p-3

Une simplication par télescopage ne nécessite aucune justification particulière.

EXEMPLE 6.3. Calculons L.~=l k x k! à l'aide d'un télescopage.


► Comme, pour tout entier naturel k non nul k x k! = (k + 1 - 1) x k! = (k + 1)! - k!,
(k!lk;,,i est une suite primitive de (k x k!h;:,1, on a donc Sn= (n + 1)! -1.

Le télescopage nous offre une piste pour le calcul explicite de certaines sommes. Afin de
n
simplifier .L. uk, on peut rechercher une suite (vklkEN telle que, pour tout entier naturel k,
k=O
Uk = vk+l -vk, On dit que (vklkEN est une suite primitive de (uk)kEN·

Suites primitives
Pour simplifier une somme Sn= L~=O uk, on peut rechercher une suite primitive (vk)kEN
de (uk) kEN, ie telle que pour tout k E N, uk = vk+ 1 - vk. On a alors
n n

Sn= L_ Uk = L_ (vk+l -Vk) = Vn+l -Vo.


k=O k=O
120

Le terme suite primitive n'est pas innocent, il fait écho à la théorie des intégrales.

EXEMPLE 6.4. Calculons la somme des n premier entiers naturels non nuls.
► La formule
...;

(k + 1 )2 - (k + 1) k2 - k
----2------2-=k

nous fournit une suite primitive de (k)kEN: la suite de terme général k(~-ll. On a donc, pour
tout entier naturel n non nul
Sn= t
k=l
k = n(n/ 1).

Il. SÉRIES ARITHMÉTIQU ES ET GÉOMÉTRIQUE S


-j.

IL 1. La formule de la série arithmétique


Rappelons qu'une suite (UnlnEN est dite arithmétique lorsqu'il existe un nombre complexer
tel que \fn E N, Un+i - Un = r. Ce nombrer est appelé la raison de la suite (unlnEN· On a
alors 1 , pour tout entier naturel n, Un= uo + nr.
q q q
Soient p :( q et S = .[_ uk. Comme S = .[_ uk = I:.
Up+q-k, on a,
k=p k=p k=p
q q q
2S = L uk + L.
Uq+p-k = L(
uk + Uq+p-k),
k=p k=p k=p
et que, pour tout entier naturel k,

uk +uq+p-k = uo + kr+ (uo + (p + q - k)r) = (uo +pr) + (Uo + qr) = Up +uq,

on a
q q
2S = L (uk + Uq+p-k) = L (Up + Uq) = (q -p + 1)(Up + uq),
k=p k=p
d'où la formule suivante.

Formule de la série arithmétique


La somme des termes consécutifs d'une suite arithmétique est donnée par la formule :

premier terme + dernier terme


nombre de terme(s) x
2

1
Cette formule se prouve à l'aide d'une récurrence élémentaire.
121

II.2. La formule de la série géométrique


Une suite (UnlnEN est dite géométrique lorsqu'il existe un nombre complexe T tel que \in E
N, Un+1 = ru,,_. Ce nombre Test appelé la raison de la suite (UnlnEN· On a alors 2 , pour tout
entier naturel n, u,,_ = u 0 rn.
q

Soient p :,;; q. On cherche à calculer S = L uk.


k=p
◊ Si T = 1, la suite (UnlnEN est constante et l'on a immédiatement S = ( q - p + 1 )Up.
◊ Si T -/= 1, on a
q q q
S - rS = Luk - L
ruk = L(
uk - ruk),
k=p k=p
et, pour tout entier naturel k, uk - TUk = (rk - yk+l )u0 , ainsi
q
(1 -r)S = u 0 L (rk-rk+1) = u 0 (rP -rq+l) = UoTP(l -Tq-p+l) = Up(l -Tq-p+1),
k=p

d'où
Tq-p+l -1
S=Up----
r-1
Le lecteur mémorisera cette formule en se souvenant de la formule suivante.

Formule de la série géométrique


La somme des termes consécutifs d'une suite géométrique de raison -/= 1 est donnée par
la formule:
raison nombre de termes_ 1
premier terme x
raison- 1

On dénombre, par exemple, 5543 termes dans la somme 12458 + 12459 + • • • + 126000 , et 218
dans la somme 5 123 + 5 125 + ... + 5 455 + 5457 _

EXEMPLE 6.5. Ecrivons sous forme algébriques= (1 -i) 13 + (1 - i) 14 + • .. + (1 -i) 28 .


= 64(i-1) 28-t--:- 1 = -64.255 x (1 +i) ' soit
16 1
► On as= (1 -i) 13 (l-t)_
1-t-1
- = (1 -i) 13 (-Zt)~-l
-1
s =-16320(1 +i).

Test 6.7. Test 6.8.


Écrire sous forme algébrique Écrire sous forme algébrique

s = i22 + i24 + i26 + ... + i46.

2
Cette formule se prouve à l'aide d'une récurrence élémentaire.
122

11.3. Factorisation de an - bn
La formule de la série géométrique permet de factoriser l'expression an - bn .
....;

PREUVE. La formule est banale lorsque b est nul et a= b. Supposons b non nul et a -1- b.
On a alors

d'après la formule de la série géométrique. On conclut en multipliant membre à membre


par a- b. ■

On peut également démontrer cette formule en développant le second membre et en re-


connaissant un télescopage.

Factorisation de an - bn
Le lecteur retiendra que la factorisation de an - bn par a - b s'obtient en additionnant
tous les termes de la forme a kbe avec k+f = n-1. Ainsi, sans même recourir au symbole
r (source d'une perte de temps pour les petites valeurs den), on obtient

Test 6.9. Test 6.10.


Soit n EN. Etablir que 7 divise (n + 7) 5 - n 5. Factoriser a 5 + b 5 par a+ b.

III. LA FORMULE DU BINÔME

Nous avons déjà remarqué la validité des identités remarquables sur C. La formule du binôme
de Newton, qui généralise ces identités, est également valable sur C. Commençons notre exposé
par quelques rappels sur les cœfficients binomiaux.

Définition 6. 7. (Cœfficients binomiaux). Pour tous O ~ k ~ n, on pose (~) = k!(;~kJ!.

Cette définition n'est évidemment pas la meilleure, car il n'apparaît pas d'emblée que ces
cœfficients sont des entiers. La bonne définition de ces cœfficients relève de la combinatoire :
(~) est par définition le nombre de choix possibles de k objets parmi n, sans ordre. Par
exemple, avec cette définition il est clair que (~) = 3.
123

Dans la pratique et pour de petits indices k ::::;; n, plutôt que d'évaluer les factorielles de
la définition ci-dessus, on calcule les cœfficients du binôme de proche en proche à l'aide de la
relation de Pascal.

PREUVE. Comme
n-1) (n-1)! x k+ 1 = (k+ l)(n-1)! c.o
..cl
( k - k!(n-1 - k)! k+ 1 (k+ l)!(n-1 ~ k)! u
et
n-1) (n-1)! x n-k-1 _ (n-k-l)(n-1)!
( k+l - (k+l)!(n-2-k)! n-k-1 - (k+l)!(n-1-k)!'
(k+l-n-k-l)(n-1)! _ n! _ ( n )
on a
n-1)
( k +
(n-1) _
k+l - (k+l)!(n-2-k)! - (k+l)!(n-k-1)! - k+l . ■

Pour effectuer ce calcul, on adoptera la présentation suivante du tableau des cœfficients


du binôme, appelée triangle de Pascal bien qu'elle fût connue des mathématiciens arabes et
indiens du Moyen Âge.

triangle de Pascal

2
3
4
n-1)
( k+l

(k:1)

Le cœfficient (~) est situé au croisement de la n-ème ligne (à partir du haut) et de la


k-ème diagonale montante (à partir de la gauche) et se calcule en sommant les deux
cœfficients qui l'encadrent «supérieurement».

Ainsi, la septième ligne du triangle de Pascal est égale à


1 6 15 20 15 6 1

et ainsi de suite.

La formule du binôme généralise les identités remarquables bien connues

(a+ b )2 = a 2 + 2ab + b 2 et (a+ b )3 = a3 + 3a2 b + 3ab 2 + b3

à une puissance entière quelconque n.


124

PREUVE. Soient a et b deux nombres complexes. Soit, pour tout entier naturel n, HR(n) la
r/J proposition suivante :
s
Cl)

1
...;

o HR(O) est banalement vraie.

o Prouvons que \fn E N, HR(n) =} HR(n + 1) : soit n E N; supposons HR(n) vraie. On a


alors

(a+ b)(a + b)n =(a+ b) f_ (~) akbn-k = a f_ (~) akbn-k+ b f_ (~) akbn-k
k=O k=O k=O

= f_ (~) 0 k+lbn-k + f_ (~) akbn+l-k.


k=O k=O

(a+ b)n+l = f (k:


k=l
l)akbn+l-k+ f_ (~)akbn+l-k
k=O

= t, (k:l)akbn+l-k+ (:)an+l + t, (~)akbn+l-k+ (~)bn+l

= bn+l +t, [(k: 1


) + (~)] akbn+ 1-k+ 0 n+1.

HR(n + 1) est vraie et la formule est donc acquise d'après le principe de récurrence. ■

Nous démontrons cette formule une seconde fois (et de manière bien plus élégante) dans
le paragraphe consacré aux produits.

.L. (4n)
4
n
EXEMPLE 6.10. Soit n EN. Calculons la somme k ik.
k=O
► D'après la formule du binôme,

f(
k=O
4
;)ik= (1 +i) 4 n= ((1 +i}2J2n= (2iJ2n= (4i 2 )n= (-4in_

Le triangle de Pascal permet de calculer rapidement les cœfficients binomiaux et donc


d'obtenir rapidement le développement de (a+ b)n lorsque la valeur de l'exposant n est
petite.
125

Développement de (a+ b )n
t::
Il suffit d'utiliser la n + 1-ième ligne du triangle de Pascal sur laquelle on lit les n + 1 tî
w
cœfficients (~), 0 ~ k ~ n apparaissant dans la formule du binôme. On multiplie chacun rfJ

d'entre eux par akbn-k et on additionne les résultats afin d'obtenir l'identité souhaitée.
Par exemple, grâce à la septième ligne du triangle de Pascal 1 6 15 20 15 6 1, nous
obtenons en un éclair la formule 1

..d
ü

IV. SOMMES ET PRODUITS TRIGONOMÉTRIQUES

IV .1. La linéarisation
Linéariser un produit de fonctions trigonométriques f(x) = sinn(x) cosm(x) consiste à écrire
f(x) sous la forme d'une somme de fonctions du type

x H Àcos(kx) + µsin(kx), avec À etµ réels.

EXEMPLE 6.11. Linéarisons le produit sin(x) cos 2(x).


► Pour tout x réel,

sin(x) cos2(x) = ((eix - e-ix) / 2i)((eix + e-ixi / 2)2 = ;i [e3ix _ e-3ix + eix _ e-ix]
2isin(3x) + 2isin(x) 1 [. ( ) . ( )]
= Si = 4 SII1 3X + SII1 X .

La méthode de linéarisation employée ci-dessus se généralise sans peine à un produit


quelconque.

Linéarisation par passage sur (C

Pour linéariser l'expression f(x) = sinn(x) cosm(x), on procèdera comme suit.


o Ecrire f(x) en fonction de eix et e-ix en utilisant les formules d'Euler.
o Développer les parenthèses aux puissances m et n en utilisant la formule du binôme.
Dans le cas de petits exposants, on utilisera avec profit le triangle de Pascal.
o Développer le produit des deux parenthèses.
o Regrouper les exponentielles conjuguées et appliquer à nouveau (mais en sens inverse)
les formules d'Euler.
126

La linéarisation d'un produit de fonctions trigonométriques permet de l'intégrer et de


le dériver plus facilement. Nous reviendrons sur ce sujet dans le cours d'analyse, le lecteur
retiendra que l'intégration des fonctions f(x) = sinn(x) cosm(x), lorsque m et n sont des
...; entiers pairs, commence par une linéarisation de f .

n/2
EXEMPLE


6.12. Calculons l'intégrale I
Pour tout x réel
=
I
0
cos 2(x) sin 4 (x)dx.

4 2 = (eix-e-ix) 4 (eix+e-ix)2 _ _!__( 2ix_ -2ix)2( ix_ -ix)2


( sin(x)) ( cos(x)) (li) 4 22 - e e e e
64
= ~ ( (e4ix _ 2 + e-4ix) ( e2ix _ 2 + e-2ix)

= ~ (e6ix + e-6ix - 2 e4ix - 2 e-4ix - e2ix - e-2ix + 4)


1
( cos(6x) - 2 cos(4x) - cos(2x) + 2).
32

Ainsi, I =fi[¼ sin(6x) - ½ sin(4x) - ½ sin(2x) + 2x];12 = fi.


Nous verrons dans le cours d'analyse réelle que la linéarisation permet également de calculer
avec élégance les dérivées successives d'un produit de fonctions trigonométriques.

IV.2. Calculs de sommes trigonométriques


Les sommes trigonométriques apparaissent en physique dès qu'interviennent des phénomèmes
périodiques. La théorie des séries de Fourier, au programme de la deuxième année, étudie la
possibilité d'écrire sous forme d'une somme trigonométrique des fonctions périodiques; dans
ce cadre, il faudra manipuler avec virtuosité les sommes trigonométriques (simplifications,
majorations, minoration, etc).

EXEMPLE 6.13. Prouvons la formule


1
S = cos(0) + cos(20) + • • • + cos(80) =- où 0 = 2n/17.
2
► S est la partie réelle de I: = ei0 + e 2i0 + · · · + e 8i9. Puisque ei0-=/= 1, on peut appliquer la
formule de la série géométrique et

- i9 ( ei9 )8 - 1 i.9e16in/17 - 1
I: - e e'·e - 1 =e e'·e - 1
Puisque 16n/ 17 = 7î - 7î / 17, on a e 16in/l? = -e-i7r/ 17 . Ainsi,
-1 _ -in/17 -1 _ -in/17 -1-ein/17
L _ 2in/17 e _ Zin/17 e
-e ef2n/17_1 -e ein/ 172isin(n/17) 2isin(n/ 17)
i + icos(n / 17) - sin(n/ 17)
2sin(n/17)

et donc S = SJlc(I:) = -1 / 2.
127

Les principales formules apparaissant dans les calculs de sommes trigonométriques sont la
formule de la série géométrique et celle du binôme de Newton.

EXEMPLE 6.14. Calculons la somme

T = t (!)
k=O
cos(kn/3).

► Posons u = .L.!=0 (~) eikrr/ 3, de sorte que T = Dte(u). En appliquant successivement les
formules de Moivre du binôme puis en factorisant par l'angle moitié,

L. (!) (eirr/3 Jk = ( 1 + eirr/3 )6 = ei6rr/6( eirr/6 + e-irr/6 )6,


6
u =
k=O

ainsi u = -2 6 cos6(1t/ 6) = -2 6( v'3 / 2 )6 et donc T = -27.

Test 6.11. Test 6.12.


Calculer Calculer
11
S= I:_cos
(k1t)
12 .
k=O

IV.3. Les polynômes de Tchebychev


Il existe deux familles de polynômes (UnlnEN et (TnlnEN, appelées respectivement polynômes
de Tchebychev de première espèce et de seconde espèce, vérifiant :

'v'n E N, 'v'0 E IR , cos(n0) = În(cos(0)) , sin(n0) = sin(0)Un(cos(0)).

Nous démontrerons ce résultat général dans le chapitre consacré aux polynômes et nous
contenterons d'indiquer sommairement la méthode.

Calcul des polynômes de Tchebychev


On cherche à calculer le n-ième polynômes de Tchebychev de première espèce.
o On part de l'égalité cos(n0) = Dte( eine ).
o On applique la formule de Moivre enie = ( cos(0) +i sin(0) )n. On développe alors la
puissance par la formule du binôme.
o On isole sa partie réelle. En remplaçant sin2 par 1 - cos2 , on obtient Pn·

Mettons cette technique en œuvre pour n = 5.


128

EXEMPLE 6.15. Déterminons un polynôme T5 tel que \18 E JR,cos(58) = T5 (cos(8)).


rJJ
► V 8 E lR , cos(58) = 9te ( e5i0) = 9te (( cos(8) + i sin(8) )5 ) . Or
~
Cil
.... (cos(8) + i sin(8)) 5 = (isin(8)) 5 + 5 cos(8) (isin(8)) 4 + 10 (cos(8)) 2 (isin(8)) 3
+ 10 (cos(8) )3 (isin(8)) 2 + 5 (cos(8)) 4 isin(8) + (cos(8))5,
d'où 9te ((cos(8) +i sin(8)) 5 ) = cos5 (8) + 5 cos(8) sin4 (8) -10 cos 3 (8) sin2 (8).
Ainsi

cos(58) = cos5(8) + 5 cos(8) (1 - cos2(8)) 2 -10 cos 3(8) (1 - cos2(8))


= 16 cos5 (8) -20 cos 3 (8) + 5 cos(8)
Le polynôme défini par Vx E lR, P5 (x) = 16x5 - 20x3 + Sx répond donc à la question.

Le lecteur retiendra qu'il lui faut impérativement connaître le calcul des puissances de i
et savoir écrire la formule du binôme pour les petites valeurs den avec la rapidité de l'éclair
(en utilisant le triangle de Pascal) ! Le calcul des polynômes de Tchebychev ne lui posera alors
aucun problème. Nous montrerons dans un chapitre consacré aux polynômes l'unicité des
polynômes de Tchebychev de. première et seconde espèce.

Test 6.13. Test 6.14.


Calculer les polynômes To, T,, Tz et Î3. Calculer les polynômes Uo, U 1, U2 et U3.

V. LES SOMMES DOUBLES

V .1. Notations
Nous avons traité dans les paragraphes précédents la sommation de nombres rangés dans une
suite. Il existe pourtant un autre cas de figure très courant en mathématiques, celui où les
nombres sont rangés dans un tableau 3 • Soit donc (ai,i) où 1 ~ i ~ n et 1 ~ j ~ p un
tel tableau de nombres complexes. L'indice i désigne la ligne (numérotation de haut en bas
den ligne(s)) et j la colonne (numérotation de gauche à droite de p colonne(s)) du tableau
contenant le nombre ai,i· Par exemple, dans le cas où n = 3 et p = 5

a,,, a,,2 a,,3 a,,4 a,,s


a2,1 Uz,z az,3 Uz,4 az,s
a3,1 [ a3,2) a3,3 a3,4 a3,s -, ligne 3
1
colonne 2

On adaptera sans peine cette représentation au cas où les indices i et j prennent la valeur 0,
le seul effet étant un décalage de la numérotation des lignes des colonnes : la colonne repérée
par l'indice j = 3 sera la quatrième, la ligne repérée par l'indice i = 6 sera la septième, etc.

3
Que nous appellerons plus loin dans le cours une matrice.
129

Soit L1 un ensemble de couples (i, j) avec 1 ~ i ~ n et 1 ~ j ~ p. La somme de tous les


nombres Ui,i du tableau tels que (i, j) E L1 est notée

L
(i,j)EL1
ai,j•

Par exemple, pour n = 3 et L1 = { (1, 2), (2, 3), (2, 2), (3, 3)}

L ai,î = a,,2 + a2,3 + a2,2 + a3,3. cci


..d
(i,j)EÀ u
Lorsque n = p = 3 et L1 = { (i, j) 1 1 ~ i < j ~ n}, les seuls termes du tableau sommés sont

et ainsi L Ui,i = L ai,î = a,,2 + a,,3 + a2,3. La notation


(i,j)EL1 l ,;;i<j,;;3

L..
' U··
1,,J

étant plus compacte que celle utilisant l'ensemble L'.1, elle est plus souvent employée dans les
problèmes et les exercices. Par exemple, lorsque p = n, les sommes

L ai,î et L U·.
i,J
l~i,j~n

désignent respectivement la somme de tous les éléments du tableau et la somme de tous les
éléments ai,i du tableau tels que 1 < j ~ i ~ n.

D'une manière générale, on commencera par visualiser les éléments du tableau que l'on
doit sommer avant d'écrire quoi que ce soit.

V.2. Sommer en lignes, sommer en colonnes


Revenons un instant à la somme de tous les éléments du tableau,

L
1,;;i,;;n,1,;;j,;;p
Ui,j•

On peut la calculer en sommant d'abord les lignes puis en sommant les n résultats obtenus,
ainsi p

.L_Ui,j
i=l
]-
'----v---"
somme de la ligne i
Mais on peut aussi la calculer en sommant d'abord les colonnes puis en sommant les p résultats
obtenus, ainsi
n
.L_Ui,j
i=l
]-
'----v---"
somme de la colonne j
130

Ce procédé, appelé interversion des sommes en lignes et en colonnes, se généralise bien


sûr à d'autres types de sommes. Considérons par exemple la somme

.... s= L Ui,j·
l~j<i~n

Commençons par visualiser les termes correspondants du tableau suivant :

* * * * * * *
a2,1
* * * * * *
U3,1 U3,2
* * * * *
* * * *
i=i+l--+ Uj+l,1
~J * * *
i=n--+
* *
Un,1 Un,2 (an,i] Un,n-1
*
l
colonne j

Fixons une colonne d'indice j compris entre 1 et n - 1. La somme des termes ai,i d'indices
(i, j) appartenant à ~ et situés sur la j-ième colonne du tableau vaut
n

L
i=j+l
ai.i•

La somme de toutes les colonnes vaut donc

n n-1 [ n ]
L ai,î=L, ai,i. L
(i,j)ELI. j=l i=j+l

Mais on peut également sommer d'abord en lignes. On s'inspire alors du tableau suivant :

* * * * * * *
a2,1
* * * * * *
U3,1 U3,2
* * * * *
ligne i --+
* * * *
1 ai,1 J (ai,H)
* * *
* *
Un,1 Un,2 Un,i-1 On,n-1
*
l l l
i=l i=2 j=i-1

Fixons une ligne d'indice i compris entre 2 et n. La somme des termes ai,i d'indices (i, j)
appartenant à~ et situés sur la i-ième ligne du tableau vaut
i-1
L_Ui,i·
i=l
131

La somme de toutes les lignes vaut donc

[ i-1 ]
L
n

(i,j)EL'.
ai,i = L L
n

i=2 j=l
ai,i .

Ces manipulations ne nécessitent aucune justification particulière, les deux tableaux n'ont été
donnés que pour mieux éclairer le lecteur. Dans la pratique, les interversions s'effectuent en
toute simplicité. co
.d
ü
EXEMPLE 6.16. Calculons Sn= .L. i-;-.
l;;;i(j;;;n J
► Fixons une colonne d'indice j compris entre 1 et n. La somme des termes figurant sur la
j-ième colonne vaut
i i 1 i . . j(j + 1) j +1
L =-;-Li= J x - 2 - = -2-·
i=l)
7
Ji=l

On a donc
, ! __ ~ j + 1 __ ! ~ . = n( n + 3)
Sn = L · L 2 2L J 4
l;;;i;;;j;;;n J j=l i=2

en utilisant la formule de la série arithmétique.

Dans cet exemple, sommer en lignes aurait été une maladresse car ces dernières sont beau-
coup plus difficiles à simplifier. On réfléchira donc toujours avant d'opter pour une méthode
de calcul. Notons pour conclure que l'on peut sommer de bien d'autres manières (par exemple
en diagonale), il faudra donc être astucieux et choisir le calcul le plus concis possible.

Test 6.15. n i • •
Compléter les interversions suivantes :
3. L L_Ui,j = L_Ui,j = L L_Ui,j•
i=l j=l •
n n • •
n n • •
1. L L_Ui,j = L_Ui,j = L L_Ui,j•
4. L L_Ui,j = L_Ui,j = L L_Ui,j•
i=l i=l •
..
i=l j=i

n-1 n
Test 6.16.
2. I:. I:. ai,j = L Ui,j = LL Ui,j• Soit n E N*. Calculer L ij.
i=l j=i+l • j=e i=• l~i,j~n

V.3. Développement d'un produit de sommes


Développer un produit de sommes fait appel à la propriété de distributivité de l'addition sur
la multiplication des nombres complexes.
132

PREUVE. Démontrons le 1). Calculons l'expression


r/J
V

! L. Uibj
l!Çi~n,l~j~p
...;
:pêil en sommant en colonnes. Soit j un indice de colonne fixé entre 1 et p. La somme des termes
o.. de la j-ième colonne vaut
n n n
où /\ = L. ai est indépendant de j.
i=l

La somme totale vaut donc


p p

L, uibi = L, /\bi = /\ L, bi.


j=l j=l

Pour le 2), commençons par appliquer le 1)

On conclut alors en regroupant dans la dernière somme aiai + UjUi = 2aiai pour i -1- j et en
imposant i < j afin de ne compter qu'une seule fois ce double produit. ■

VI. LES PRODUITS FINIS

Soient (Un)nEN une suite de nombres complexes et p :( q deux entiers naturels. Le produit
Up X l.Lp+l X ... X Uq est noté

rr
q
Up X l.Lp+l X · · · X Uq = Uk.
k=p

De nombreuses remarques concernant les sommes restent valables pour les produits : indices
muets, changements d'indices, etc. Le télescopage prendra par contre la forme suivante : pour
une suite (un)nEN de termes non nuls, on a

Les fonctions logarithme et exponentielle permettent d'ailleurs (après quelques précautions


d'usage) de passer des produits aux sommes et réciproquement.

Test 6.17. Test 6.18.


45 79
2k + 1
Simplifier le produit fI k k l . Simplifier le produit fI lk _ l.
k=S + 1=29
133

Les règles de calcul suivantes sont élémentaires et à connaître parfaitement.

Rè~lfl èUS. Pour tous nombre complex~ {1; et tout réel a., toutes suites de nombres complexes
(On}ttê~'et fbn.}n.eN, èt tous èntîers naturel.s p ~ q, on a, lortrquèles e:tprèSsionssai'lfantes
ont un sens:

:\} n~ll)tO]t~
~i .•· ..
(n<lk). x(nbtt) ;
k=p k=p é
q;. :·· . n
2) Iltax'.tt) = uq-p+l Il Xk;
k=p.. . k=l

3) I1e~=eCt •Y:
k=p.
0

Test 6.19. Test 6.20.


Que pensez-vous de la formule suivante Simplifier

Examinons à présent un produit fini de sommes finies à deux termes.

Développement de (a1 + b1)(a2 + b2) ···(an+ bn)


On développe (a 1 + b1 )( a2 + b2) · · · (Un+ bn) par distributivité de la multiplication sur
l'addition. On obtient une somme de termes du type x1x2 ... Xn où chacun des Xi vaut
ai ou bi, On dénombre zn termes de ce type dans le développement par distributivité
de ci-dessus car on a le choix pour chacune des n parenthèses ( ai + bd entre ai et bi,

On peut alors retrouver facilement la formule du binôme. Rappelons que (~) est le nombre
de choix possibles de k objet(s) parmi n.

EXEMPLE 6.19. Démontrons la formule du binôme.


► Soient a et b dans (C et n E N*. Appliquons la méthode précédente : en développant le
produit ( a+ b )n = (a+ b) · · · (a+ b), on obtient des termes du type a kbn-k avec O :( k ~ n,
l'indice k correspondant au nombre de parenthèse(s) du produit (a+ b) •••(a+ b) pour
lesquelles on a choisi a. Puisqu'on dénombre (~) choix possibles de k parenthèse(s) parmi
n, on obtient
134

VII. EXERCICES

6.1. 6.6.
...;
n 1 Calculer les sommes suivantes :
Calculer la somme An= L. lk cos(kn/3).
k=l 1. .I:.
1 ~i,j~n
max(i,j). 4. .I:.
l~i<j~n
i.

6.2.
2. .I:.
l~i,j~n
ij. 5. .I:.
1~i<j::5;n
ij.
Calculer
(1 + j2)27 + (1 + j2)28 + ... + (1 + j2)429_
3. .I:.
l~i~j~n
li-il-

6.7.
6.3.
Soient XE R et n EN. Simplifier le produit

1. Montrer que pour a et b réels strictement


positifs donnés, on a

arctan( a) - arctan( b) = arctan ( 1a+-ab


b) •
6.8.

n.!!~oo f_ arctan ( k2 + ~+1) ·


2. Calculer
k=l 1. Calculer f
k=l
ln ( cos ~) où a E ]O, 7î[.
2
6.4.

Soient n ~ 1 et w
2. Déterminer n.!!1.foo f_ ln ( cos 2~).
= e 2in/n_ k=l
1. Soit m E N. Simplifier la somme
6.9.
1 +wm+w2m+··•+w(n-l)m_

2. Soit z E IC. Simplifier la somme Soient n E N et 0 E R.


n

s(z) =
n-1
L (z+wk)n. 1. Simplifier la somme Dn(0) L eike_
k=-n
k=O 2. Simplifier la somme

6.5.

Calculer la somme suivante :


4

S = L, cos ( (2k + 1) ~ )- REMARQUE - Les fonctions Dn et Fn sont


k=O appelées n-ième noyau de Dirichlet et n-ième
noyau de Féjer.
Deuxièm e partie
j
STRUCTUR ES FONDAME NTALES

ANS cette partie nous allons introduire trois type de structures algébriques : les groupes,

D les anneaux, et les corps, dont les applications mathématiques sont très distinctes.
Il est assez difficile de définir le mot structure pris isolément. De manière générale,
décrire la structure d'un objet revient à trouver des manières de le simplifier, de le découper
en parties significatives, et d'indiquer comment ces parties s'assemblent entre elles pour re-
construire l'objet initial. Ce faisant, on est inévitablement conduit à décrire les relations que
ces parties entretiennent les unes par rapport aux autres, et ces relations prennent en retour
plus d'importance que les parties elle-mêmes. Ayant réalisé cette description, il devient alors
possible de percevoir des ressemblances entre objets distincts et de les décrire de manière
parfaitement formalisée.
Donnons un premier exemple, celui des deux dessins suivants, que l'on peut imaginer
représenter des guirlandes.

l
Il est clair que les deux guirandes se ressemblent. Leur structure commune peut être décrite
par la suite de six instructions : 1 bas +, 2 bas -, 3 haut +, 4 bas -, 5 haut +, 6 bas -. Le
chiffre désigne la position sur un axe des abscisses, le mot bas ou haut la position sur l'axe
des ordonnées, et le signe indique une couleur (différente dans les deux cas). Le fait que la
forme des décorations (disques ou triangles) ne soit pas la même dans les deux guirlandes n'a
en fait aucune importance.
Venons-en maintenant à notre sujet, celui des structures algébriques. Considérons un en-
semble E. Une loi de composition interne sur E est une application de E x E dans E. C'est
donc une manière d'associer à tout couple de E un élément de E bien défini. On désigne en
général les lois par des symboles opératoires, comme+, x, o, o, EB, 0, etc. Si un couple (a, b)
d'éléments de E est donné, et si EB est la loi de composition interne, on note alors a EB b
l'élément associé au couple ( a, b ). Une structure algébrique est un ensemble muni de une ou
plusieurs lois de composition internes. On peut décrire une loi interne par ce que l'on appelle
une table de composition de la forme suivante

EB A B C
A A B C
B B C A
C C A B

où l'ensemble sous-jacent est E = {a, b, c}, et où l'on inscrit l'élément x EB y à l'intersection de


la ligne repérée par un élément x et de la colonne repérée par l'élément y. Il est clair que si
l'on change A en 01, B en 0 2 et C en 0 3 dans l'ensemble de la table, la loi et ses propriétés
n'en sont pas modifiées. Le terme structure algébrique se trouve donc ainsi justifié : la loi ne
dépend pas des objets sur lesquels elle opère.
136

o La structure de groupe. Il s'agit d'une structure de la forme (E, o ), où E est l'ensemble


et o la loi, pour laquelle o vérifie un certain nombre de propriétés. Plutôt que de les énumérer,
donnons un exemple de portée générale. Considérons un ensemble A, et notons E l'ensemble
de toutes les bijections de A dans A. Il existe une loi de composition naturelle sur E, la
composition o des applications. Si f et g sont dans E, l'application f o g est définie par
(f o g)(x) = f(g(x)), pour tout x E A. Si I désigne l'application identique de A, on aura

Iof=fol=f

pour tout élément f de E. On dit que I est l'élément neutre de la structure. Si f- 1 est la
bijection réciproque de f, on aura f o f- 1 = f- 1 of= I.
On dit que f- 1 est l'élément symétrique de f, sa composée avec f doit donner l'élément
neutre. Enfin, si f, g, h. sont trois éléments de E, on aura ( fo (go h.)) (x) = ( (fo g) oh.) (x) pour
tout x de A, ce qui montre que f o ( g oh.) = (f o g) oh.. On dit que la loi o est associative. Nous
venons ainsi de décrire les trois propriétés requises pour qu'une loi de composition munisse
un ensemble d'une structure de groupe.
Montrons-en une application. Soit (E, 0) un groupe, dont l'élément neutre sera noté e. On
considère l'équation suivante entre éléments de E

a0x=b

où l'inconnue est x, et où a et b sont donnés dans E. Alors on peut utiliser les propriétés
de la loi 0 pour montrer qu'elle possède une unique solution. En effet, composons les deux
termes de l'égalité par l'élément symétrique de a, que l'on note u- 1 . On obtient l'égalité
u- 1 0 (a 0 x) = u- 1 0 b. L'associativité de 0 permet de calculer le premier membre :
u- 1 0 (a 0 x) = (u- 1 0 a) 0 x = e 0 x = x. On a donc finalement obtenu x = u- 1 0 b,
l'équation est résolue, elle possède une unique solution.
Chacun reconnaît là la méthode de résolution des équations ax = b entre nombres ra-
tionnels par exemple, lorsque a -1 O. Cela n'a rien d'étonnant, puisque ((Ql*, •) est un groupe
(on suppose b -1 0 dans ce cas). L'intérêt de l'introduction de cette idée de structure est
qu'elle montre clairement que la résolution des équations entre bijections d'un ensemble est
exactement similaire à celle des équations entre rationnels non nuls. Là encore, peu importe
la nature des objets, seuls interviennent leurs rapports, codés de manière convenable. On no-
tera aussi que comme (Z, +), ((Ql, +) sont des groupes, les équations s'y résolvent de la mème
manière, ce qui est bien connu.
Les groupes seront introduits et analysés dans les chapitres 9 et 10. Le complément du
chapitre 10 donnera une première présentation des relations entre la notion de groupe et
l'analyse des symétries des objets, qui lui est intimement liée.
o La structure d'anneau. La structure d'anneau est une évolution de celle de groupe. Un
anneau est un ensemble muni de deux lois de composition interne, qui satisfont une liste de
propriétés. Là encore, plutôt que de les énumérer, nous considérerons un exemple significatif,
celui de l'anneau (Z, +, •), où + est l'addition usuelle et · la multiplication. Nous avons déjà
signalé que (Z, +) est un groupe, commutatif (ce qui signifie que la somme de deux nombres
ne dépend pas de l'ordre dans lequel on effectue l'addition). De plus, la loi • est associative,
commutative, et satisfait une égalité de compatibilité relative à l'addition, la distributivité

(X + y) · Z = X · Z + y · Z.
Il faut noter que le domaine d'application des anneaux est nettement moins universel que
celui des groupes. En effet, l'existence conjointe d~ deux lois de composition impose l'existence
137

préalable d'objets assez riches. Il n'y a pas par exemple de structure naturelle d'anneau sur
l'ensemble des bijections d'un ensemble. En revanche, il existe des structures d'anneau sur les
ensembles usuels de nombres Z et (Q), et aussi lR comme nous le verrons ((Q) et lR ont même
des structures plus riches) ainsi que sur les espaces d'applications linéaires que nous verrons
dans la partie III et sur les espaces de polynômes que nous verrons dans la partie II.
L'idée d'anneau est le cadre naturel où se développent les notions de type arithmétique, par
exemple celle de divisibilité. Donnons d'abord l'exemple des entiers relatifs, qui correspond à
l'arithmétique classique, comme elle est présentée depuis les classes primaires. Si u et b sont
des entiers, on dit que a divise b, et on note a I b, lorsqu'il existe un entier n tel que na= b.
Il est équivalent de dire que b est un multiple de a. On peut traduire cette idée de divisibilité
de manière ensembliste: pour u E Z, on note uZ = {un In E Z} l'ensemble des multiples de
a. Dire que a divise b est donc équivalent à dire que b E uZ, et donc encore que bZ C aZ.
Cette remarque met en évidence l'intérêt des ensembles de la forme aZ. Il intervient là un fait
essentiel, à savoir que de la structure de ces ensembles il est possible d'abord de retenir deux
traits saillants ce sont d'abord des groupes commutatifs, qui vérifient de plus la propriété
suivante
\fm E Z, \ic E aZ, me E uZ.
Une partie d'un anneau vérifiant ces deux propriétés s'appelle un idéal de l'anneau. Consi-
dérons maintenant un idéal quelconque de Z, il est alors possible de montrer qu'il est néces-
sairement de la forme aZ (c'est une conséquence de l'existence de la division euclidienne).
En d'autres termes, les deux traits que nous avons mis en relief suffisent à caractériser les
ensembles uZ. Cette propriété n'est pas valable dans tous les anneaux; lorsqu'il la possède,
un anneau est dit principal.
Montrons un exemple d'utilisation. Si a et b sont des entiers, on peut toujours considérer
l'ensemble aZ + bZ. On voit facilement que c'est un idéal de Z. Il existe donc un élément
c E Z tel que cZ = aZ + bZ. Comme a E uZ + bZ, et b E uZ + bZ, on voit que c I u et c I b.
Il en résulte que c est un diviseur commun à u et b. Si maintenant d est un diviseur commun
à u et b, alors on voit que aZ C dZ et bZ C dZ, donc que cZ = aZ + bZ C dZ d'où l'on
déduit que d I c. Il en résulte que c est le plus grand (au signe près) diviseur commun à u et
b, soit c = pgcd (a, b). Mais comme c E cZ, c E uZ + bZ, donc il existe deux entiers u et v
tels que c =au+ bv, c'est le théorème de Bézout.
Tous ces résultats peuvent être montrés de manière élémentaire dans Z. Nous avons ce-
pendant fait un grand pas en avant, puisque nous avons en fait prouvé qu'ils sont de portée
beaucoup plus générale : ils sont valables dans tout anneau principal.
Nous verrons au moins un autre exemple fondamental d'anneau principal, il s'agit de celui
des polynômes. Un polynôme est une expression de la forme a0 + u 1X + · · · + unXn que nous
définirons plus précisément au chapitre 13. Il est possible d'additionner et de multiplier deux
polynômes, on obtient ainsi une structure d'anneau sur lequel existe aussi une division eucli-
dienne, l'anneau est donc aussi principal. L'arithmétique des polynômes, c'est-à-dire l'étude
de leurs propriétés de divisibilité, est donc dans une large mesure identique à celle des entiers.
Là encore, les objets diffèrent, mais leurs relations sont les mêmes.

◊ La structure de corps. Un corps est un anneau (K, +, ·) dans lequel la multiplication


munit K \ {O} d'une structure de groupe (où O est le neutre de l'addition). Cette structure
est en fait un enrichissement assez naturel de la structure d'anneau, pourvu que l'anneau soit
intègre (c'est-à-dire tel que si le produit de deux éléments est nul, l'un des deux éléments doit
être nul). En effet, on construit à partir de tout anneau intègre ce que l'on appelle son corps
des fractions exactement de la même manière que l'on construit (Q) à partir de Z. L'utilisation
138

de la notion de corps est permanente et fondamementale en algèbre linéaire, c'est aussi la


structure de base de de la droite réelle, et de l'ensemble des nombres complexes.
Outre ces applications fondamentales, l'intérêt majeur de la notion de corps apparaît par
exemple dans l'étude des propriétés de résolubilité des équations polynomiales, qui formalisent
les idées initiales d'Évariste Galois, qui a été le principal inventeur de la théorie des groupes.
La boucle est donc bouclée ...
Chapitre 7
ENSEM BLES, APPLIC ATIONS ET
,,.
STRUCT URES ALGEBR IQUES

'INTÉRÊT des mathématiciens pour la notion d'ensemble date de la seconde moitié du

L XIXe siècle, en particulier en vuede répondre à des questions posées par la notion
d'infini. Pour donner une idée du type de problème qui se pose immédiatement,
imaginons que l'on écrive sur une ligne la liste des nombres entiers naturels, et sur la ligne
suivante la liste des doubles des mêmes nombres, disposés comme suit
012345 6 7 8 9 1011
0 2 4 6 8 10 12 14 16 18 20 22

Il semble clair que les deux listes doivent avoir le même «nombre» d'éléments. Mais par
ailleurs la seconde liste n'est autre que la première à laquelle on a ôté un élément sur deux.
Elle doit donc en avoir deux fois moins que la première. Ce paradoxe apparent est une propriété
spécifique des ensembles infinis.
Georg Cantor découvrit de plus des infinis successifs, c'est-à-dire comptant strictement
plus d'éléments les uns que les autres. Cantor et Frege furent les premiers à jeter les bases
d'une théorie des ensembles initialement destinée à rationaliser l'usage de ces différents infinis.
Quelques logiciens, parmi lesquels Bertrand Russell, ont mis en évidence les limites de cette
théorie 1 . Il s'est avéré que l'on ne peut effectuer sans précaution n'importe quelle opération
sur les ensembles. Une théorie axiomatique des ensembles fut dès lors forgée.
Nous nous limiterons ici à une présentation très intuitive des différentes notions de théorie
des ensembles nécessaires pour la suite de cet ouvrage, et reviendrons un peu plus en détail
sur ces problèmes dans le cours de L2.

1. LA NOTION D'ENSEMBLE
Les résultats fondamentaux que nous allons introduire seront énoncés sous forme de règles.

I. 1. Théorie naïve et axiomatique des ensembles


D'un point de vue naïf, un ensemble est une «boîte» virtuelle contenant des objets appelés
éléments. Il faut bien comprendre que seule l'appartenance des objets à la boîte importe : il n'y
a aucune hiérarchie (aucun ordre) entre les différents éléments d'un ensemble. Les ensembles
sont traditionnelleme nt notés au moyen d'une lettre de l'alphabet. Par exemple, N désigne
l'ensemble des entiers naturels.
Définition 7 .1. Soient E un ensemble et x un objet. L'énoncé x E E signifie « x appartient
à E », « x est un élément de E », « E contient x » ou encore « x est dans E ». On écrira
x (j. E pour signifier que E ne contient pas l'objet x.

1
Voir le célèbre paradoxe de Russell exposé ci-dessous.
140

On représente communément les ensembles au moyen de diagrammes de Venn, qu'ils per-


mettent de visualiser facilement. Nous y reviendrons dans le paragraphe concernant les opé-
rations sur les ensembles.

FIGURE 7.1. Diagramme de Venn représentant E = {x, y, z}


,_,
,_,

t
o.
Remarque. Un ensemble est la donnée d'objets sans ordre. Par exemple, les ensembles de
lettres {a, b} et {b, a} sont les mêmes. Il faut également noter qu'un ensemble ne compte aucun
doublon. Ainsi {a, b, a}= {a, b}.

Définition 7.2.
1) On note 0 et on appelle ensemble vide l'ensemble qui ne contient aucun élément.
2) On appelle singleton tout ensemble contenant qu'un seul élément.
3) On appelle paire tout ensemble contenant deux éléments exactement.

Ainsi, {a, a} est un singleton, l'ensemble des solutions complexes de z 2 = -1 est une paire
et l'ensemble des solutions réelles de x 2 = -1 est vide.

E? {x € Xfl){x)}
~tfo,JJ'ff't;:f~i~~l>iê d~ x-dans X te' qüê l){i'}~l;,J irlctitè··· l~ânt•1>{iY.îYÎ
Par exemple, résoudre une équation (algébrique, différentielle, etc.) revient à passer d'une
écriture de l'ensemble des solutions en compréhension à une écriture en extension.

EXEMPLE 7.4. On peut définir en extension ou en compréhension l'ensemble 1U des racines


3
cubiques de l'unité

où j = e2in/3.
Au-delà d'une simple énumération, on peut aussi définir en extension un ensemble au
moyen d'une formule. C'est ce que l'on fait lorsqu'on définit un ensemble par une description
de ses éléments : « E est l'ensemble des objets de la forme ... ». Ainsi, l'ensemble E des
nombres de la forme n 2 + 1 où n est un entier naturel peut s'écrire E = {n2 + 11 n E N}. Il
est clair que E s'écrit en compréhension E = {m EN l :3n EN, m = n 2 + l}.
141

Test 7.1. Test 7.2.


Écrire en extension et en compréhension l'en- Écrire en extension et en compréhension l'en-
semble des entiers naturels divisibles par 4. semble des racines n-ièmes de l'unité.

Les rudiments que nous venons d'exposer ne suffisent pas à bâtir une théorie sans faille,
la raison essentielle étant que, contrairement à l'intuition ordinaire, un ensemble ne peut pas
être n'importe quelle collection d'objets. C'est le philosophe Bertrand Russell qui ébranla le
premier la théorie «naïve» de Cantor et Frege à l'aide de son célèbre paradoxe : notons E
l'ensemble de tous les ensembles et considérons A le sous-ensemble de E formé des ensembles
qui ne se contiennent pas eux-mêmes. Si A E A alors, par définition de A, A r/. A, ce qui est
absurde. De même, si A rf. A alors, par définition de A, A E A, ce qui est également absurde 2 !
Afin d'éviter les paradoxes de la théorie naïve des ensembles, les mathématiciens ont construit
une théorie axiomatique des ensembles qui fixe des règles plus précises. Loin d'entrer dans
les détails de cette théorie, nous nous contenterons d'un bref aperçu. En premier lieu, il n'y
a plus d'objet mais un certain nombre d'ensembles dont on postule l'existence. Un corpus
de règles, les axiomes de la théorie, permettent alors de construire de nouveaux ensembles
à partir des ensembles précédents et de tous les ensembles déjà construits par cette théorie.
Il s'agit finalement d'un jeu de mécano abstrait aux règles très précises. Tous les énoncés
qui suivent peuvent être établis à partir des postulats de la théorie des ensembles. Il faut les
considérer comme des règles.

Dêfinition 7.5. Soient E et F deux ensembles. On écrira F C E et l'on dira que « F


est un sous-ensemble de E » ou encore que « F est une partie de E » pour signifier que
tous les éléments de F sont contenus dans E. La proposition F C E est donc synonyme de
Vx, (x E F) 4 (x E E).

Puisque la proposition3 Vx E 0, (x E E) est vraie, on a 0 C E : l'ensemble vide est


contenu dans n'importe quel ensemble E. Par transitivité de l'implication logique, l'inclusion
est une relation transitive : pour tous les ensembles A, B et C, les inclusions AC B et B C C
entraînent A C C.

Dêfinition 7.6. Deux ensembles E et F sont dits égaux lorsqu'ils ont les mêmes éléments,
c'est-à-dire \:lx, (x E E) # (x E F).

Il est donc possible de prouver directement l'égalité de deux ensembles par un raisonnement
par équivalence. En toute généralité, on peut également prouver que E = F en deux temps :
d'abord Vx, (x E E) =} (x E F) puis Vx, (x E E) =} (x E F). Ce principe de démonstration
est appelé règle de la double inclusion.

2
Russell en donnera lui-même une version plus imagée, le paradoxe du barbier : un barbier décide de couper
la barbe à tous les habitants de la ville qui ne se rasent pas eux-mêmes. Se coupe-t-il lui-même la barbe ?
3 Plus généralement, la proposition Vx E 0, p(x) est toujours vraie. En effet, son contraire :lx E 0, non(p(x))
est faux puisque 0 est vide.
142

EXEMPLE 7.8. Prouvons les égalités suivantes


1) {zEC*lz=z2}={1,j,j 2}; 2) {nENl3divisen2}=3N.
► L'égalité du 1) peut se démontrer par équivalence. En effet, soit z E C*. Il existe alors
r E JR~ et 0 E lR tel que z = rei.8 .

z = z2 # re-i.8 = r 2e 2i.8
# r = r 2 et - 8 = 20[2n]
# r = 1 et 0 = O[2n/3]
# z = l,j ou j2.

D'où l'égalité des deux ensembles.


► Prouvons l'égalité du 2) par double inclusion. Notons E = {n E N 13 divise n 2 }.
o Soit n E 3N \ N. Il y a deux cas à envisager : n est de la forme 3m + 1 ou 3m + 2, avec
m EN. Dans le premier cas, n 2 = 9m2 + 6m + 1 n'est pas divisible par 3 et dans le second
cas, n 2 = 9m2 + 12m+4 n'est pas divisible par 3. Nous avons donc prouvé par contraposition
que (n E E) =} (n E 3N), c'est-à-dire E C 3N.
o Réciproquement, il est clair que (n E 3N) =} (3 divise n 2 ) et donc que 3N CE.

Test 7.3. Test 7.4.


Écrire en extension l'ensemble Soient a ,;;; b deux réels. Prouver par double
inclusion que

[a,b] = {(1-7'.)a+Àb, À E (0, 1]}.

1.2. Opérations sur les ensembles


1.2.1. Produit cartésien d'ensembles

Il s'agit maintenant de définir la notion de couple et de la généraliser. Un couple (x, y) est la


donnée de deux objets x et y dans un certain ordre. Il faut donc distinguer le couple (x, y)
(énumération ordonnée) de la paire {x, y}= {y, x} (énumération sans ordre).
Remarque. On peut donner une définition plus rigoureuse du couple (x, y) à l'aide de
la notion de paire : on décide de définir (x,y) par {{x},{x,y}}. Cette définition permet de
distinguer le couple (x, y) du couple (y, x) et de l'ensemble {x, y} correspondant à la donnée
des objets x et y sans ordre.

En partant des couples, on peut définir par récurrence sur n la notion de n-uplet (x 1, •.. , Xn)
qui la généralise.

Définition 7.9. Soient E1 et E2 deux ensembles. Le produit cartésien de E1 par E2 est par
définition l'ensemble E1 x E2 des couples (xi, x2) tels que xi E E1 et X2 E E2. On adoptera la
convention E1 x E2 = 0 lorsque l'un des deux ensembles E1 ou E2 est vide.

On peut représenter le produit cartésien E1 x E2 dans un repère du plan en faisant figurer


les éléments de E1 sur l'axe des abscisses et ceux de E2 sur l'axe des ordonnées. Par exemple, la
figure 7.2 représente le produit cartésien {1, 2, 3} x {a, b} qui est par définition égal à l'ensemble
de couples { (1, a), (1, b), (2, a), (2, b), (3, u), (3, b)}.

b • • • (3, b)

a • • •

2 3

FIGURE 7 .2. Représentation cartésienne de {1, 2, 3} x {a, b}

Cette définition se généralise à n ensembles E 1, E2, ... , En.


Définition 7.10. (Produit cartésien) Soient E1, E2, ... , En n ensembles. Le produit car-
tésien n

IJEk
k=l

est par définition l'ensemble des n-uplets (x,, X2, ... , Xn) tels que \fk E {l, ... , n}, xk E Ek.
On adoptera la convention E 1 x ... x En = 0 lorsqu'il existe 1 ~ i ~ n tel que E, = 0.

Test 7.5. Test 7.6.


Soient A et B deux ensembles non vides, A' C A Soient A et B deux ensembles non vides. Les
et B' C B. Que pensez-vous de l'inclusion sous-ensembles de A x B sont-ils nécessairement
A' X B' CA X B? de la forme A' x B' avec A' C A et B' c B ?
On pourra utiliser l'exemple de la figure 7.2.

1.2.2. Réunion et intersection

Dans la règle précédente, il n'est pas fait mention d'un ensemble E contenant A et B.
Cependant, dans la pratique, les mathématiciens travaillent avec un ensemble Ede référence,
dont ils manipulent des sous-ensembles. Le résultat suivant généralise la notion de réunion.

Ainsi, la proposition a E LJ X est équivalente à il existe X E E tel que a E X.


XEE

"lifp;iiilible}tl'ITné JJiJ,r · l'#


'.êfB ëhm le note AnB.
144

Aet B AUB AnB

FIGURE 7.3. Les opérations vues sur les diagrammes de Venn

EXEMPLE 7.14. Soient A et B deux ensembles tels que An B = AU B. Montrons que


A=B.
► Comme AC AUB = AnB C B, on a AC B. Comme A et B jouent des rôles symétriques,
on a également B C A. Ainsi, A = B par double inclusion.

::r~t~';~Q~•,èlfj~.(~fbèfi~
NJfê.f/f·<Sùît!,c~b- ë~~tnltti-~ vide dont ltisllé't1'ïe'nts.sont des ense!lt-blés., ll ~a;iàt~:'lffl
1Jûi ri,,fiennênt à to~ lès élé~ts de Ê. et on le

;X/i;E .

En particulier, (XE nxEE X si et seulement si pour tout X dans E, (XE X.


Les règles suivantes sont intuitivement claires. Nous nous contenterons de prouver la
huitième règle.

PREUVE. Prouvons par exemple que An (BUC)= (An B) U (An C).


o Comme B C BUC, on a An B C An (BUC). On prouve de même que An Cc An (BUC).
On a donc (An B) U (An C) c An (Bu C).
o Soit x E An (BU Cl, c'est-à-dire x E A et x E B U C. Il y a deux cas à envisager.
Cas 1 : x E A et x E B. On a alors x E A n B.
Cas 2 : x E A et x E C. On a alors x E A n C.
Dans les deux cas, on a x E (An B) U (An C), d'où An (Bu C) c (An B) U (An C). ■

Définition 7 .17. Deux ensembles A et B sont dits disjoints lorsque A n B = 0.

Autrement dit, deux ensembles sont disjoints si et seulement si ils n'ont aucun élément en
commun.
Test 7.7. Test 7.8.
Calculer l'intersection des ensembles Les ensembles

A= {k/2n (k, n) E Z x N} et B = Z.
1 A={r+a,(r,a)EQx(IR\Q)} et B=Q

sont-ils disjoints ?

1.2.3. Différence de deux ensembles et complémentaire


Définition 7.18. Soient A et S deux ensembles.
1) On appelle différence de A et S l'ensemble des éléments de A qui n'appartiennent pas à
S. On le note A \ S.
2) On appelle différence symétrique de A et S l'ensemble des éléments de AU S qui n'ap-
partiennent pas à An S. On le note A~S.

Définition 7.19. Soient ACE. On appelle complémentaire de A dans E l'ensemble E \ A.


On le note CEA ou encore, s'il n'y a pas d'ambiguité sur l'ensemble E considéré, Ac.

A\B

FIGURE 7.4. Les opérations vues sur les diagrammes de Venn, suite et fin

~qpositî.on 'f;20. Soiênt t ûn en8e1TJ,bl~,·A ~B. ~~~ti~;~nîMel,é i, tJiiii. iJ.lrlr:i/


[ . .{ÂJ11J)e -::;N'· U B'\ . 2..'(..fi}é:}tj'~'Â:èfiiif'~ ;;:c\' 'Y;.,;;'F;:~;/t '.

PREUVE.

1) Procédons par double inclusion.


o Prouvons que (An S)c c Ac Use. Soit x E (An S)C. Alors x if. An S. Il y a deux cas
à envisager : soit x if. A, alors x E Ac et donc x E Ac Use ; soit x E A et donc x if. S,
c'est-à-dire XE se C Ac use.
◊ Prouvons que Ac U SC c (An S )C. Soit x E Ac Use. Il y a deux cas à envisager : soit x E Ac
et dans ce cas x if. A, donc a fortiori x if. An Set x E (An S)c. L'autre cas s'étudie selon le
même principe.
2) En appliquant le point précédent aux ensembles définis par A'= Ac et S' = SC, on obtient
Au s = (AC n scie, donc, par passage au complémentaire, (Au sic= Ac n se. ■
146

EXEMPLE 7.21. Pour tous sous-ensembles A et B d'un ensemble E, on définit la différence


r/J
Cl) symétrique de A et B par AL'lB = (An Be) U (Nn B). Montrons que AL'l(BL'lC) = (AL'lB)L'lC.

1§ ► On a AL'l(BL'lC) = (N n (BL'lC)) u (An (BL'lC)c). Or,

'8
.2 et

(BL'lC)c = [(Ben C) u (B n ccW = (Ben C)c n (B n cc)c

J =[(Bu cc) n Be) u [(Bu cc) n C) = (Cc n Be) u (B n C).

Cl)
Ainsi, An (BL'lC)C = (An cc n Be) u (An B n C) et donc

~
Cette expression étant invariante par permutation des ensembles A, B et C, on a en particulier
AL'l(BL'lC) = CL'l(AL'lB). De plus, il est clair que CL'l(AL'lB) = (AL'lB)L'lC (en toute généralité
EL'lF = FL'lE). D'où AL'l(BL'lC) = (AL'lB)L'lC.

Test 7.9. Test 7.10.


Soient A et B deux parties d'un ensemble E. Soient A et B deux parties d'un ensemble E.
Simplifier A \ (E \ B). Exprimer CE,A x Ben fonction de A, B, CEA et
CEB.

I.3. L'ensemble des parties d'un ensemble


Définition 7.22. L'ensemble des sous-ensembles d'un ensemble E est noté Y'(E).

EXEMPLE 7.23. Déterminons Y'(E) pour E = {0, 1}.

1 ► Les parties de E sont 0,{O},{l}etE, d'où Y'(E) = { 0,{O},{1}, E}.

D'une manière générale, afin de n'oublier aucun sous-ensemble de E, on déterminera Y'(E)


en recherchant les parties de E ne contenant aucun élément, puis un élément, deux éléments
et ainsi de suite.

Test 7.11. Test 7.12.


Calculer 9"(9-'(E)) pour E = {O, l}. Soit E un ensemble. Déterminer

LJ
XEffe(E)
X et n
XEffe(E)
X.
1.4. Recouvrements et partitions
Définition 7.24. Soit A un ensemble et soit E un ensemble de parties de A. On dit que E
est un recouvrement de A ou encore que les éléments de E recouvrent A lorsque A= X. LJ
XEE

FIGURE 7.5. X= {{l,2},{1,3,4},{5},{6}} est un recouvrement de {1,2,3,4,5,6}

Définition 7.25. Une partition d'un ensemble E est un ensemble X dont les éléments sont
non vides, recouvrent E et sont deux à deux disjoints.

Toute partition d'un ensemble E est donc un recouvrement de E mais la réciproque est
fausse, comme l'illustre l'exemple de la figure 7.5 : les parties {l, 2} et {1, 3, 4} ne sont pas
disjointes. Par contre, l'ensemble X décrit à la figure 7.6 est une partition de E = {1, 2, 3, 4, 5, 6}.

FIGURE 7.6. X= {{1,2},{3,4},{5},{6}} est une partition de {1,2,3,4,5,6}

EXEMPLE 7.26. On note 2N (resp. 2N + 1) l'ensemble des entiers naturels pairs (resp.
1 impairs). L'ensemble {2N,2N + l} est une partition de N.

Test 7.13. Test 7.14.


Quel est le nombre maximal d'éléments d'une Même question avec minimal.
partition de l'ensemble
E={l,2,3,4}?

II. APPLICATIONS ET FONCTIONS

D'un point de vue naïf, une application d'un ensemble A vers un ensemble B est la donnée
pour tout élément a. de A d'un unique élément b de B, correspondance que l'on note a. H b.
148

w
V

A
2 3

FIGURE 7.7. Graphe d'une application de A dans B

Par exemple, on peut définir une application de A = {1, 2, 3} dans B = {u, v, w} par les
~
o..
correspondances 1 Hu, 2 H w et 3 H v. On peut la représenter à la manière des fonctions
numériques usuelles sin,cos, etc., par la figure 7.7.
Cette notion empirique peut être formalisée au moyen des ensembles : l'application pré-
cédente est entièrement définie par la donnée de l'ensemble Ç = {(1, u), (2, w), (3, v)} appelé
graphe.

ILL Graphes
Définition 7.27. (Graphe). Soient E et F deux ensembles. On appelle graphe de E dans F
tout sous-ensemble Q de E x F.

Cette notion de graphe est trop générale pour définir une application de A dans B. Par
exemple, pour A= {l, 2, 3} et B = {u, v, w}, le graphe Ç = {(1, u), (1, v), (2, w)} ne permet pas
de faire correspondre à l'élément 1 de A un unique élément de B, puisque les couples (1, u)
et (1, v) appartiennent à Ç. De plus, comme 3 n'est la première composante d'aucun couple
du graphe, on ne peut faire correspondre aucun élément de B à l'élément 3 de A : tous les
graphes ne définissent pas des applications.

Définition 7.28. (Graphes applicatifs et graphes fonctionnels). Un graphe Q de E


dans F est dit
1) fonctionnel lorsque pour x E E, il existe au plus un -y dans F tel que (x, -y) E Ç,
2) applicatif lorsque pour x E E, il existe un unique -y dans F tel que (x, -y) E Ç.

Définition 7.29.
1) On appelle application de E dans F tout graphe applicatif Q de E dans F.
2) On appelle fonction de E dans F tout graphe fonctionnel Q de E dans F.
Dans la pratique, une application ou une fonction Ç de E dans Fest notée à l'aide d'une
lettre, par exemple f, selon le principe suivant : pour tout élément x de E, en cas d'existence,
l'unique élément -y de F tel que (x, -y) E Ç est noté f(x) et appelé image de x par f. La seule
différence entre les notions de fonction et d'application de E dans Fest que certains éléments
de E peuvent ne pas avoir d'image par une fonction. On appelle ensemble de définition d'une
fonction f : E --+ F l'ensemble des éléments de E ayant une image par f. Signalons que les
conventions peuvent ici différer légèrement suivant les auteurs ou le contexte. Nous verrons
dans la partie «Analyse» qu'elles n'y sont pas exactement les mêmes, et qu'il y est usuel de
ne pas distinguer entre fonction et application.
Définition 7.30. Soit f: E-. F une application. Pour tout x dans E, f(x) est appelée image
de x par f. Pour tout y dans F, en cas d'existence, tout x dans E tel que y = f(x) est appelé
antécédent de y par f.

On peut représenter une application f : E -. F de plusieurs manières : la première consiste


à utiliser des diagrammes de Venn fléchés, où chaque flèche joint un élément x de E à son
image f(x) dans F.

FIGURE 7.8. Diagramme de Venn fléché

La deuxième est de représenter le graphe Ç dans un repère, à la manière des courbes


représentatives d'une fonction numérique.

b
a

-t---+----e--+----+ E
2 3

FIGURE 7.9. Le graphe de f vu dans E x F

II.2. Exemples d'applications


11.2.1. Composée de deux fonctions ou applications
Définition 7.31. Soient E, F et G trois ensembles, f: E-. F et g : F-. G deux applications.
L'application définie de E dans G, qui à x E E associe g (f (x)), est notée g o f et appelée
composée de g et f.

EXEMPLE 7.32. Soient f : IR -. IR et g : IR -. IR les applications définies par f(x) = ex


2
et g(x) = x 2 . Les fonctions f o g et go f sont définies de IR dans IR par (f o g)(x) = ex et
(go f)(x) = e 2x.

La composition des applications est associative, c'est-à-dire que l'on peut parenthéser
indifféremment f o go h en (f o g) oh ouf o (go h) sans que cela ne change le résultat.
150

PREUVE. Soit x E E. On a

((f o g) o h)(x) = (f o g)(h(x)) = f(g(h(x))) = f((g o h)(x)) = (f o (go h))(x).

D'où (f o g) oh= f o (go h). ■

Définition 7.34. Pour f : E -t E et n E N, on définit par récurrence tn par t 0 = idE et,


pour tout n ? 1, fn = fn- l o f.

Test 7.15. Test 7.16.


Calculer f o g et g o f pour f et g de IR dans IR Soit f : IR* --1 IR* définie par f( x) = 1/x. Que
définies par f(x) = x + sin(x) et g(x) = x 2 . vaut fn pour n E N ?

11.2.2. Familles indexées et suites


Définition 7.35. Soient E et I deux ensembles. On appelle famille d'éléments de E indexée
par l toute application de I dans E.

Une famille f: I -t E d'éléments de E indexée par I est souvent notée (fdiEh où fi= f(i)
pour tout i dans I.

Définition 7.36. Soit E un ensemble. On appelle suite d'éléments de E toute famille d'élé-
ments de E indexée par N, autrement dit toute application de N dans E.

De même, plutôt que u : N -t E, on note de préférence une suite sous forme indexée
(Un)nEN·

11.2.3. Fonctions indicatrices


Définition 7.37. Soient E un ensemble et A une partie de E. On note ][A la fonction
indicatrice de A définie de E dans {O, 1} par

Il est clair que deux parties A et B de l'ensemble E sont égales si et seulement si ][A= l! 8 .
Plus généralement, on a AC B si et seulement si h '.:( l!B. L'intérêt des fonctions indicatrices
d'ensembles est donc de ramener des raisonnements ensemblistes tels que la double inclusion
à du calcul. La proposition suivante est un simple dictionnaire traduisant les opérations sur
les ensembles en termes de fonctions indicatrices. Nous n'en démontrerons que la troisième
formule.
151

PREUVE. Notons f = llAus et g = llA + lis - llAlls. Soit x E E. Il y a quatre cas à envisager.
Cas 1 x E A et x (j B. On a alors llAus(x) = llA(x) = 1 et lls(x) = 0, d'où f(x) = g(x).
Cas 2 x E A et x E B. On a alors llAus(x) = llA(x) = lls(x) = 1, d'où f(x) = g(x).
Cas 3 x E B et x (j A. On a alors llAus(x) = lls(x) = 1 et llA(x) = 0, d'où f(x) = g(x).
Cas 4 x (j A et x (j B. On a alors llAus(x) = llA(x) = lls(x) = 0, d'où f(x) = g(x). Comme
Vx E E, f(x) = g(x), on a f = g. ■

Les fonctions indicatrices permettent de prouver certaines inclusions par un calcul pure-
ment algébrique.

EXEMPLE 7.39. Redémontrons que pour toutes parties A, B et C d'un ensemble E, on a


A~(B~C) = (A~B)~C.
► On a ll(MSJLlC = h + lis + lie - 2l1Alls - 2l1Allc - 2llsllc + 4l1Allsllc- On remarque que
cette dernière expression est invariante par permutations de A, B, C, d'où en particulier
ll(MSJLlC = ll(MCJL'.A· Or, (B~C)~A = A~(B~C), d'où ll(MSJLlC = llM(SLlCJ et donc
(A~B)~C = A~(B~C).

Les fonctions indicatrices ont également des applications au dénombrement.

Test 7.17. Test 7.18.


Simplifier les expressions ][l et ][A][N. Calculer ][MS en fonction de ][A et ][s,

11.3. Restrictions, corestrictions et prolongements


Définition 7.40. Soient f: E -1 F une application et AC B. On appelle restriction de f à
A et l'on note fiA l'unique application g: A -1 F définie pour tout x dans A par g(x) = f(x).

Il est parfois commode de restreindre l'ensemble d'arrivée d'une application f : E -1 F.


Cela n'est pas toujours possible : pour restreindre l'ensemble d'arrivée à une partie B de F,
il faut s'assurer que f est à valeurs dans B, c'est-à-dire pour tout x dans E, f(x) E B.
Définition 7.41. Soit f : E -1 F une application à valeurs dans B C F. On appelle cores-
triction de f à B et l'on note fis l'unique application g : E -1 B définie pour tout x dans E
par g(x) = f(x).
À l'inverse de l'opération de restriction, on peut prolonger une application f: E -1 F à un
ensemble Q contenant E.
Définition 7.42. Soient f: E -1 F une application et E CO. On appelle prolongement de
f à Q toute application g: Q -1 F qui coïncide avec f sur E, c'est-à-dire telle que 9IE= f.

On ne parlera pas en général du prolongement d'une application f, mais d'un prolongement.


Certains prolongements sont cependant plus intéressants que d'autres. Par exemple, on peut
prolonger à IR la fonction définie de IR* dans IR par sin(0)/0 d'une infinité de manières : il
suffit de fixer arbitrairement la valeur de f(O). Comme sin(0)/0 tend vers 1 lorsque 0 tend vers
0, le prolongement g de f défini par g(O) = 1 a l'avantage sur tous les autres d'être continu4
sur IR.

4
C'est d'ailleurs ce qu'on appelle le prolongement par continuité de f en O.
152

Test 7.19. Test 7.20.


rJl
On reprend l'exemple de la figure 7.8. On pose On reprend l'exemple de la figure 7.8.On pose

1
A = {1, 2}. Décrire f!A, A= {1,3},B = {2,3},C = {a} et D = {a,b}.
Que pensez-vous de flx? fi~ ? fi~? fil? ?

'2
-8
rJl
Il.4. Images directes et réciproques

J Une application f : E -, F est définie point par point. On peut considérer plus généralement
l'action de f sur certaines parties de E. Par exemple, lorsque E = F est un ensemble de points
et f une transformation géométrique de E, f(A) est une figure de E : la transformée par f de
la figure A.
Définition 7.43. Soit f: E-, F une application.
1) Pour tout AC E, on note f(A) = {f(x), x E A} l'image directe de A par f.
2) Pour tout B c F, on note f- 1 (B)= {x E E, f(x) E B} l'image réciproque de B par f.
Autrement dit, l'image réciproque f- 1 (B) est l'ensemble des éléments de E dont l'image
est dans B. La figure 7.10 montre que f(A) n'est pas vide dès que A-/= 0, alors que l'on peut
avoir f- 1 (B} = 0 pour B-/= 0.

f
----+

FIGURE 7.10. Images directes et réciproques

EXEMPLE 7.44. Notons f l'application définie de IR dans IR par f(x) = x 2 .


► On lit immédiatement sur le tableau de variation de f les égalités suivantes
1) f(lR)=Il~+; 6) f- 1([-4,4[)=]-2,2[;
2) f([-3,2])=[0,9]; 7) f-l(f([0,1]))=[-1,1];
3) f([-3,3]) = [0, 9];
1
4) f-1([9, 10]) = [-v'10,-v'9] U [v'9,v'10]; 8) f(f- ([-1,4])) = [0,4];
5) f- 1([-5,-3]) =0; 9) f(f- 1(JR_)) ={0}.

Test 7.21. Test 7.22.


Soit f : E -, F une application. Que pensez-vous Soient f : E -, F une application et A c E.
des égalités f- 1(F) = E? f(E) = F? Établir que AC f- 1(f(A)).

Pour toute application f de E dans F, il est immédiat que l'inclusion AC B C E entraîne


f(A) C f(B). De même, AC B CF implique f- 1 (A) C f- 1 (8).
153

PREUVE.

1) Raisonnons dans les deux cas par double inclusion.


o On a AC AUB, donc f- 1 (A) c f- 1 (AUB). On prouve de même que f- 1 (B) C f- 1 (AUB).
Ainsi, f- 1 (A) uf- 1 (B) c f- 1 (AUB). Soit x E f- 1 (AUB). On a alors f(x) E AUB, c'est-à-dire
f(x) E A ou f(x) E B, i.e. XE f- 1(A) ou XE f- 1(B).
o On a AnB CA, donc f- 1 (AnB) C f- 1 (A). On prouve de même que f- 1 (AnB) C f- 1 (B).
Ainsi, f- 1 (AnB) c f- 1 (A)nf- 1 (B). Soit x E f- 1 (A)nf- 1 (B). On a alors f(x) E A et f(x) E B,
c'est-à-dire f(x) E An B et finalement x E f- 1 (An B ).
2) o Puisque A C AU B, on a f(A) C f(A U B). De même, f(B) C f(A U B) et donc
f(A) Uf(B) C f(AUB). Soit y E f(AUB). Il existe alors x E AUB tel que y= f(x). Six E A,
y= f(x) E f(A) C f(A) U f(B). De même dans le cas où x E B.
o On a An B c A et An B c B, donc f(A n B) c f(A) et f(A n B) c f(B). Ainsi
f(A n B) C f(A) n f(B). ■

Image d'une intersection


On n'a pas nécessairement égalité f(An B) = f(A) nf(B) comme en témoigne l'exemple
suivant : E = {0, 1}, A = {0}, B = {1} et f : E ----, E définie par f(0) = f(l) = 0, où
f(A n B) = 0 et f(A) n f(B) = {0}.

Définition 7.46. Soit f: E----, F une application. Pour tout élément y de F, on appelle fibre
de f au-dessus de y le sous-ensemble f- 1 ({y}) de E formé par les antécédents de y par f.

E F
,j 4 •
•3
• 1 2•

f
l l l
F • • • •
a b C d
Définition de f Fibres de f

FIGURE 7.11. Représentation d'une application par ses fibres

Cette notion permet une nouvelle représentation des applications. f : E ----, F est entièrement
définie par la donnée de ses fibres f- 1 ({-y}), y E F. Lorsque Fest un sous-ensemble de :IR, les
fibres de f sont aussi appelées les niveaux de l'application f.
154

EXEMPLE 7.47. Soit f: {-2, -1, 0, 1, 2, 3}--+ IR l'application définie par la formule f(n) =
rn
CL) cos(2nn/3). Déterminons les niveaux de f. Puisque l'image de f vaut B = {-1/2, 1}, pour
tout y E Be, la fibre de f au-dessus de y est vide. De plus, on a clairement

1
..srn On peut donc représenter de la sorte l'application f

i
i.......... 1• •3

-2• •O

-1/2 0 1/2
l l
---------+------+ lR

Test 7.23. Test 7.24.


Soient f : E --t F une application et B C F. Déduire de la question test précédente une nou-
Montrer que llf-1 (Bl = llB of. velle preuve des égalités du 1) de la proposition
7.45.

11.5. Injectivité, surjectivité et bijectivité


Définition 7.48. Une application f: E--+ F est dite
1) injective lorsque \f(x, y) E E2 , f(x) = f(y) =} x =y;
2) surjective lorsque \fy E F, :3x E E , y = f(x);
3) bijective lorsqu'elle est injective et surjective.

E F E E F

Injective, non surjective Non injective, surjective Bijective

FIGURE 7.12. Les notions d'injectivité, surjectivité et bijectivité d'une application vues
sur un diagramme de Venn fléché

EXEMPLE 7.49. Toute application de IR dans IR strictement monotone est injective. Mais
la réciproque est fausse : f : (0, 2] --+ IR définie par x E (0, 1[ H x et x E [1, 2] H 3 - x est
injective mais pas monotone sur [O, 2].
Test 7.25. Test 7.26.
L'application f définie de C dans C par la for- Soit f : E --; F une bijection. Décrire les fibres
mule f(z) = z2 + 1 est-elle surjective ? Injec- de f.
tive?

Les définitions de l'injectivité et de la surjectivité données ci-dessus à l'aide de symboles se


traduisent aisément en toutes lettres : une application f : E ---+ F est injective si et seulement
si lorsque f prend une valeur de F, elle ne la prend qu'en un seul point de E. De même, une
application f : E ---+ F est surjective si et seulement si f prend toutes les valeurs de F. La
conjonction de ces deux notions étant la bijectivité, une application f : E ---+ F est bijective si
et seulement si f prend toutes les valeurs de F, à chaque fois en un seul point de E. On en
déduit la proposition suivante.

L'injectivité et la surjectivité sont conservées par composition. Pour plus de précision, on


consultera les résultats suivants.

PREUVE.

1) Soient x et x' dans E tels que (go f)(x) =(go f)(x'). On a alors g(f(x)) = g(f(x')), donc
f(x) = f(x') par injectivité de g. Puis, par injectivité de f, x = x'. Ainsi, go f est injective.
2) Soit z E H. Puisque g est surjective, il existe 1J E F tel que z = g(1J). Comme f est
surjective, il existe x dans Etel que 1J = f(x). Ainsi, z = (go f)(x) et go f est surjective.
3) Tout découle du 1) et du 2). ■

11.6. Bijection réciproque d'une bijection


Définition 7.52. Soit f: E---+ F une bijection. Pour tout 1J dans F, l'unique antécédent de
1J par f est noté x = f- 1 (1J). L'application f- 1 : F ---+ E qui à 1J associe son unique antécédent
dans E par f est appelée la bijection réciproque de f.

Par exemple, pour tout point O du plan !Y et pour tout réel 0, la rotation de centre 0
et d'angle 0 est une bijection de !Y dans !Y de bijection réciproque la rotation de centre
0 et d'angle -0.
156

. \11 (']11 i(J]J Retour sur la notation f- 1( B)


La notation f- 1 prête à confusion car elle est également employée pour désigner la
bijection réciproque de l'application f lorsque celle-ci est bijective. Si B est une partie,
dans le cas où f est bijective, la notation f- 1 (B) est ambiguë : s'agit-il de l'image
directe de B par l'application f- 1 ou de l'image réciproque de B par f? En fait, on
prouve facilement que ces deux ensembles coïncident.

PREUVE. L'application f o g est injective en tant que composée d'injections et surjective en


tant que composée de surjections. De plus, d'après la proposition 7.33, on a (gof)o(f- 1 og- 1 ) =
go (f o f- 1 ) o g- 1 =go g- 1 = idtt. ■

Test 7.27. Test 7.29.


Soient f et g deux bijections de E dans E. Justi- Soit f : E --, F une bijection. Pour tout ensemble
fier que fogof- 1 og- 1 est bien définie, bijective B C F, la notation f- 1 ( B) est a priori ambigüe
et calculer sa bijection réciproque. car elle peut être entendue de deux manières :
Test 7.28. l'image réciproque de B par f ou l'image directe
de B par f- 1 . Lever cette ambiguïté.
Soit f: E--, F une bijection. Que vaut f- 1 ({y}),
pour 1-J dans F ?

Il. 7. Ensembles d'applicatio ns


Définition 7.54. Soient E et F deux ensembles. L'ensemble des applications de E dans F
est noté fE_

Cette notation sera justifiée dans le chapitre sur le dénombrement. Anticipons de quelques
pages : si E et F sont des ensembles respectivement à p et n élément(s), fE est un ensemble
à nP élément(s). La notation fE permet donc de retenir cette formule.

EXEMPLE 7.55. Toute suite de réels étant une application de N dans JR, l'ensemble des
1 suites de nombres réels sera noté ]RN_ L'ensemble des applications de lR dans lR est noté JRIR_

Définition 7.56. L'ensemble des bijections de E dans F est noté pg(E, F). Lorsque F = E,
on note plus simplement pg(E, E) = 6(E). Une bijection de E dans E est également appelée
une permutation de E.

Test 7.30. Test 7.31.


Soit f : E --, F une bijection. Montrer que l'ap- Soient E, F et G trois ensembles. Les ensembles
plication 'JI définie de 6(E) dans 6(F) par E(FGJ et (ff)G sont-ils égaux?
Ver E 6(E), 'Jl(cr) = focrof- 1 est une bijection.
III. LOIS DE COMPOSITION SUR UN ENSEMBLE

Nous allons généraliser dans ce qui suit la notion d'opération. Prenons un peu de recul
2
l'addition + des entiers naturels peut être considérée comme une application de N dans N,
qui à (n, m) associe le résultat de l'opération n +met vérifie certaines propriétés telles que
la commutativité (pour tous met n dans N, n+m = m+n), l'associativité (pour tous m, n
et p dans N, m + (n + p) = (m + n) + p), etc. Ainsi, après un examen minutieux de sa
2
démonstration, l'identité remarquable ( a + b )2 = a2 + 2ab + b repose sur la distributivité
de x par rapport à+, de la commutativité de x et de l'associativité de +.

(a+ b )2 = (a+ b) x (a+ b) = (a+ b) x a+ (a+ b) x b par distributivité de x sur +


= a x (a + b) + b x (a + b) par commutativité de x
= (a x a+ a x b) + (b x a+ b x b) par distributivité de x sur +
= a2 + 2a x b + b 2 par associativité de + et commutativité de x.
On en conclut que cette identité remarquable sera valable sur n'importe quel ensemble E
muni de deux opérations o et* (jouant respectivement les rôles de + et x dans l'exemple de
ci-dessus) vérifiant les mêmes règles de calcul que+ et x sur N (associativité, commutativité,
etc.). L'intérêt d'une étude générale de la notion d'opération sur des objets x,y,z, etc. est
donc de saisir ce qui ne dépend que de leurs relations et non de leur nature (nombres, vecteurs,
etc.).

IIl.1. Définitions et exemples


Définition 7.57. Soit E un ensemble non vide. On appelle loi de composition sur E toute
application'!' de E2 dans E.

Notation. Plutôt que 'l'(x, y), on note souvent le résultat de l'opération'!' de x par y à l'aide
d'un symbole, par exemple*, à la manière de l'addition+ et de la multiplication x usuelles
'!'(x, y)= X*lJ·

Définition 7.58. On appelle magma tout ensemble E non vide muni d'une loi de composition
interne*· On le note (E,*).

EXEMPLE 7.59. Soit E un ensemble. On note E = .':Jù(E) et pour tous les éléments A et
B de E, on pose A!iB = (An Be) U (Ac n B) E E. On définit ainsi une loi de composition
1 interne sur E.

À la manière des tables d'addition et de multiplication de notre enfance, on peut définir


une loi de composition par la donnée d'une table dans laquelle figurent tous les résultats des
opérations x * y pour x et y variant dans E. Ce tableau est parfois appelé table de Cayley de
la loi *·

1 * Il a b C 1 · · · 1

a U*U U*b U*C ...


b b*a b*b b*C ...
C C*U C*b C*C ...
158

EXEMPLE 7.60. Dressons la table de Cayley de la loi Li sur E = Y'(A), où A= {O, l}.
Cl)
<Il
► On a E = { 0,{O},{l}, E} et il est clair que Vx E E, xLi0 = 0Lix = x et xLix = 0. De plus,

i
.a
Cl)
ELi{O} = {O}LiE = {1}, ELi{l} = {l}LiE = {O} et {O}Li{l} = E. On en déduit la table suivante

1 Li
0
{O}
Il 0
0
1 {O}
{O}
1 {1}
{1}
1 E
E
{1}
1

j {1}
{O}
{1}
0
E
E
0 {O}

i E E {1} {O} 0

111.2. Propriétés d'une loi de composition


D'une manière générale, effectuer des opérations successives sur un ensemble E à l'aide d'une
loi de composition * soulève quelques problèmes. Par exemple, il faut avoir conscience que
l'expression x *y* z n'a aucun sens car on peut l'interpréter de deux manières différentes :
(x * y) * z ou x * (y * z), ces deux éléments de E n'ayant aucune raison en général d'être
égaux. L'écriture a 2 définie par a 2 = a* a ne pose aucun problème au contraire de la forme
exponentiée an pour n ?: 3, qui n'a aucun sens car on ne sait pas s'il faut calculer an-l * a
ou a* an-T_ La notion d'associativité permet de lever cette difficulté 5 . Au-delà de cette
première difficulté, on prendra garde aux réflexes dus à la pratique exclusive du calcul dans
<C ou IR : l'égalité (a* b )2 = a 2 * b 2 n'est pas vérifiée en général. En effet, par définition
(a* b) 2 = (a* b) * (a* b) et rien a priori nous autorise à regrouper ces termes en a 2 * b 2 , à
moins que la loi * ne soit associative et commutative.

Définition 7.61. Soient* une loi de composition sur E et e E E. On dit que


1) * est commutative lorsque \:/(x, y) E E2 , x *Y =y* x,
2) * est associative lorsque V(x, y, z) E E3 , x *{y* z) = (x *Yl * z,
3) e est un élément neutre pour* lorsque \:/x E E, x * e = e * x = x.

Les lois + et x définies sur IR ou C sont associatives, commutatives et admettent O et 1


pour éléments neutres respectifs.

Test 7.32. Test 7.33.


Le produit vectoriel des vecteurs de l'espace à Soit E un ensemble. Quelles sont les propriétés
trois dimensions est-il commutatif ? Associa- de la loi ~ sur &(E) ?
tif ? Admet-il un élément neutre ?

PREUVE. Soient e 1 et e 2 , deux éléments neutres de *· On a alors e 1 = e 1 * e2 = e2 . ■

5
Il semble d'ailleurs que l'associativité soit le minimum requis pour espérer des règles de calcul simples.
159

Définition 7.63. On appelle monoïde tout ensemble E muni d'une loi de composition
interne * associative et admettant un élément neutre.

EXEMPLE 7.64. (N,+), (lR,+), (JR, x), (C,+) et (C, x) sont des monoïdes d'éléments
neutres respectifs 0, 0, 1, 0 et 1. Pour tout ensemble E, (EE, o) est un monoïde 6 d'élément
neutre idE. Pour tout ensemble E, (.9(E),~) est un monoïde d'élément neutre 0.

Définition 7.65. Soient (M,*) un monoïde de neutre e, a E Met n EN. On définit par
récurrence afü par a 0 = e et pour tout n?:: 1, a*n =a* afü-l. On note plus simplement an
lorsqu'il n'y a pas d'ambiguité sur la loi*·

L'associativité de la loi* nous permet donc d'écrire que pour tous entiers met net tout
élément a du monoïde M, on a an+m = Un* am.

Ill.3. Régularité et inversibilité


Il s'agit de généraliser la notion d'inverse bien connue pour l'addition et le produit des nombres
complexes : on dit que z E (C admet un inverse pour + lorsqu'il existe z' E (C tel que
z + z' = z' + z = 0 ; on dit que z E (C admet un inverse pour x lorsqu'il existe z' E (C tel que
z x z' = z' x z = 1 . On sait que tout nombre complexe z admet un unique inverse pour +
appelé son opposé et noté -z. De même, tout nombre complexe non nul z admet un inverse
pour x noté 1/ z.

Définition 7.66. Soit E un ensemble muni d'une loi de composition* et admettant un


élément neutre e. Un élément x de E est dit
1) inversible à gauche lorsqu'il existe y E E tel que y * x = e. Un tel élément y est appelé
un inverse à gauche de x pour la loi *,
2) inversible à droite lorsqu'il existe y E E tel que x *Y = e. Un tel élément y est appelé un
inverse à droite de x pour la loi*,
3) inversible lorsqu'il existe y E E tel que y * x = x * y = e. Un tel élément y est appelé un
inverse de x pour la loi*·

On prendra garde à ce que l'existence d'un inverse à droite et d'un inverse à gauche
n'implique pas l'existence d'un inverse en général. L'unicité d'un éventuel inverse n'est pas
assurée en général. On parlera donc d'un inverse et non de l'inverse d'un élément x.

EXEMPLE 7.67. Soit E = {a, b, c, d} muni de la loi* définie par la table de Cayley suivante

1 * Il a I b I c I d 1
a a b C d
b b a a C
C C a C a
d d a b d

L'élément a est neutre pour*· L'élément d est inversible à droite (car d * b = a) et à gauche
(car c * d = a) mais pas inversible. L'élément b admet deux inverses : b (car b * b = a) et
c (car b * c = a et c * b = a).
160

P:r!)~tion J'.68; Sdît{f./;i.J un inlinfltdè, Six€. 'f. a;dmèt tin-invets~~$fiatii~ij'[~


S- < C ' - -- ~ - 3-•~

unique.
PREUVE. Notons e l'élément neutre de E. Soient y 1 et Y2, deux inverses de x pour*· On a
alors Y1 *X= e, d'où (Y1 *X) *Y2 = C*Y2 = Y2, puis Y1 * (X*Y2) = Y2, par associativité de*·
CommeX*Y2=e,onay1=Y1*e=y2. ■

La notion de régularité permet de généraliser à une loi * quelconque le raisonnement


suivant : pour tout x réel non nul, V(a, b) E JR. 2, (ax = bx) =} (a= b).

Définition 7.69. Soit (E, *) un magma. Un élément x de E est dit régulier à gauche pour*
lorsque V(y1, Y2) E E2, X*Y1 = X*Y2 =} Y1 = Y2· On définit de même la régularité à droite.
Un élément x est dit régulier lorsqu'il est régulier à droite et à gauche.

Autrement dit, un élément x est régulier à gauche pour la loi * si et seulement si on peut
simplifier toute égalité à gauche par x.

EXEMPLE 7. 70. Dans N2 muni de la loi (n, m) * (n', m') = (nn', mm'), l'élément (1, 0)
n'est pas régulier à gauche car (1,0)*(2,3) = (1,0)*(2,5) et (2,3) i- (2,5). Par contre,
(1, 1) est régulier à gauche. De plus, (1,0) n'est pas régulier à droite et (1, 1) est régulier à
droite donc régulier dans (N 2 ,*).

L'exemple le plus important d'élément régulier est celui des éléments inversibles d'un
monoïde (M,*).

PREUVE. Soient e le neutre de M, x un élément inversible de M, y et y' deux éléments de


M tels que X*Y = X*Y'· On a alors x- 1* (X*Yl = x- 1* (x*y') puis, par associativité de*,
(x- 1 *X) *Y= (x- 1*X) *Y', d'où e *Y= e*y' et donc y= y'. L'élément x est donc régulier
à gauche. On prouve suivant la même démarche que x est régulier à droite. ■

En particulier, pour tout élément inversible x d'un monoïde (M,*), l'égalité y = z est
équivalente à x- 1 *Y = x- 1 * z.

Test 7.34. Test 7.35.


Soient (M,*) un monoïde et a un élément in- Soient (M, *) un monoïde, c E M et a et b
versible de M. Résoudre dans M l'équation deux éléments inversibles de M. Résoudre dans
a* x = b pour tout b dans M. M l'équation a* x * b = c.

IV. RELATIONS BINAIRES SUR UN ENSEMBLE

On rencontre souvent en mathématiques des propositions du type « les objets x et y ont la


propriété Pen commun» ou encore de type comparatif« x ~ y, AC B, etc.». Une relation
binaire généralise cette situation à un ensemble E quelconque.

Définition 7. 72. Soit E un ensemble non vide. Une relation binaire sur E est la donnée
d'une partie R de E2.
161

Notation. On note x'Ry plutôt que (x, y) ER, et l'on dit que x et y sont en relation.

EXEMPLE 7. 73. On peut définir une relation sur ~ 2 par x'Ry si et seulement si y -x E ~+,
que l'on notera simplement x ~y.De même, pour tout ensemble E, on peut définir la relation
d'inclusion sur Y'(E) par ARB si et seulement si A C B, que l'on notera plus simplement
A C B. De même, sur ~iw., on définit la relation ~ par f ~ g si et seulement si pour tout
réel x, f(x) ~ g(x).

Les relations binaires sont classées en fonction de leurs propriétés.

Définition 7.74. Une relation R sur E est dite


1) réflexive lorsque \/x E E, x'Rx,
2) symétrique lorsque \/(x, y) E E2, x'Ry
# y'Rx,
3) 2
antisymétrique lorsque V(x, y) E E , x'Ry et y'Rx # x = y,
4) transitive lorsque V(x, y, z) E E3, x'Ry et y'Rz =} x'Rz.

EXEMPLE 7. 75. Voici quelques relations en vrac.


► Soit R la relation définie sur N2 par (n, m ).%'( n', m') si et seulement si n ~ n' et
m ~ m'. Cette relation est clairement réflexive, antisymétrique et transitive.
► La relation C sur Y'(E) est de même réflexive, antisymétrique (c'est le principe de double
inclusion) et transitive.
► La relation définie sur ~ par x'Ry si et seulement si x 2 = y 2 est réflexive, symétrique et
transitive.
► La relation définie sur ~ par x'Ry si et seulement si x 2 = y 2 + 1 n'est ni réflexive, ni
symétrique, ni transitive.
► Pour n :;:: 2, la relation définie sur ~n par (x1, ... , Xn)R(y1, ... , Ynl si et seulement
si :ll ~ k ~ n tel que xk ~ Yk est réflexive, mais pas symétrique, ni antisymétrique,
ni transitive. En effet, (0, ... , 0)R(l, ... , 1) mais on n'a pas (1, ... , 1 )R(O, 0, ... , 0) (la
relation n'est pas symétrique) ; (1, 0, ... , 0)R(0, 1, 0, ... , 0) et (0, 1, 0, ... , 0)R(l, 0, ... , 0)
mais (1, 0, ... , 0) -:/- (0, 1, 0, ... , 0) (donc la relation n'est pas antisymétrique). De
plus, on a (1,0, ... ,0)R(0,l,0, ... ,0) et (0,1,0, ... ,0)R(l/2,-1, ... ,-1) mais pas
(1,0, ... ,0)R(l/2,-1, ... ,-1 ).

Test 7.36. 4) Sur E = 1R2, (x1,x2)R(-y1,'Y2) si et seule-


Préciser les propriétés des relations binaires ment si 112-111 =x2-x1.
suivantes:
1) Sur E = JR, x'R:y # x2 + 1 = -y 2 + 1 ; Test 7.37.
2) Sur 9"(E), A'R.B # Ac Be; Soit E un ensemble. Existe-t-il des relations bi-
3) Sur 9"(E), A'R.B # AllB c A; naires sur E antisymétriques et symétriques ?

IV.1. Relations d'équivalence


Les relations d'équivalence permettent de coller ensemble certains éléments d'un ensemble
donné afin d'obtenir un nouvel ensemble.
162

IV.1.1. Généralités
rJJ
Définition 7. 76. On appelle relation d'équivalence sur E toute relation binaire réflexive,
symétrique et transitive.

1
<El
rJJ
EXEMPLE

7. 77. Voici quelques illustrations.
La relation d'égalité= sur E est une relation d'équivalence.
► La relation ,S:: sur lR n'est pas une relation d'équivalence car elle n'est pas symétrique.
j ► La relation définie sur lR par xRy si et seulement si x 2 = y 2 est une relation d'équivalence

~ sur R
Définition 7. 78. Soit x un élément de E muni d'une relation d'équivalence R. On appelle
classe d'équivalence de x, et on note x, l'ensemble des éléments y en relation avec x, c'est-
à-dire y E x si et seulement si xRy.

EXEMPLE 7. 79. On reprend l'exemple de xRy si et seulement si x 2 = y 2 sur R La classe


d'équivalence de x 0 E lR est clairement x 0 = {-x0 , x 0 }. Dans le cas de la relation d'égalité sur
E, la classe d'équivalence de x 0 est {x0 }.

Pour tous les éléments x et y de E, on a xRy si et seulement si x = y. Puisqu'une relation


d'équivalence est toujours réflexive, on a \/x E E, x E x.

IV.1.2. Ensemble quotient

Une relation d'équivalence permet de regrouper les éléments d'un ensemble E partageant une
même propriété pour former un nouvel ensemble appelé ensemble quotient de Epar R. C'est
un outil très puissant en algèbre, permettant par exemple de définir de nouveaux ensembles :
nous construirons dans ce qui suit Z à partir de N, puis (Q à partir de Z en utilisant les
relations d'équivalence.
Définition 7.80. On appelle ensemble quotient de Epar la relation d'équivalence R, et on
note E/R, l'ensemble des classes d'équivalence de E modulo R.

EXEMPLE 7.81. La relation associée à une application de E dans F.


Pour toute fonction f E FE, la relation associée à f, définie sur Epar xRy si et seulement
si f(x) = f(y), est une relation d'équivalence qui généralise la troisième illustration de
l'exemple 7.77, ainsi que l'exemple 7.79. La classe d'équivalence de x est la fibre f- 1({f(x)})
de f au-dessus de f(x). L'ensemble quotient de Epar Rest donc l'ensemble des fibres de f
on a regroupé au moyen de R les éléments de E ayant la même image par f.

PREUVE. Puisque pour tout x dans E, x Ex C LJ y, on a E C LJ C, l'inclusion réciproque


yEE CEE/'R
étant claire. De plus, pour tout C 1 = x 1 et C2 = x2, on a C 1 n C 2 =/- 0, ce qui implique que
:3z E E tel que zRx1 et zRx2 et par symétrie et transitivité de R, x1Rx2 d'où C 1 = C2.
Ainsi, les classes d'équivalence de E par la relation R sont deux à deux disjointes, d'où
le résultat. ■
EXEMPLE 7.83. La relation définie sur N2 par (n, mlR(n', m'l si et seulement si m = m'
est une relation d'équivalence et les classes d'équivalence de N2 par R sont les ensembles
.:J
Ek = N x {k}, pour k E N.
Ce résultat admet une réciproque : étant donnée une partition X d'un ensemble E, on
peut lui associer la relation définie par xRy si et seulement si :JE' E X tel que x E E' et
y E E'. Rest une relation d'équivalence et l'ensemble quotient de Epar R vaut E/R = X.

PREUVE. Soit X E E/R. Par définition de l'ensemble quotient E/R, il existe x E E tel que
X= x = 7t(xl. L'application 7t est donc surjective. ■

Test 7.38. Test 7.39.


Soit 7î : E ---, E/R la surjection canonique. Que dire d'une relation d'équivalence n sur un
Que vaut n-1 (E/R)? Que vaut n-1 ({x}) pour ensemble E dont la surjection canonique 7î est
xEE? bijective?

IV.2. Relations d'ordre


Définition 7.85. On appelle relation d'ordre sur E toute relation binaire réflexive, anti-
symétrique et transitive. On note traditionnellement ~ une relation d'ordre et on dira que
(E, ~l est un ensemble ordonné pour signifier que E est muni de la relation d'ordre ~-

EXEMPLE 7.86. Voici quelques illustrations.


► La relation ~ est une relation d'ordre sur R
► La relation de divisibilité définie sur N* par n I m si et seulement si n divise m est une
relation d'ordre.
► La relation d'inclusion C sur &(El est une relation d'ordre.

Définition 7.87. Une relation d'ordre ~ sur E est dite totale lorsque \l(x, Yl E E2 , x ~ y
ou y ~ x. On dit alors que l'ensemble (E, ~l est totalement ordonné.
Autrement dit, l'ordre ~ est total lorsque deux éléments quelconques de l'ensemble E sont
comparables au moyen de la relation ~-

EXEMPLE 7.88. L'ensemble (N, ~lest totalement ordonné. Ce n'est pas le cas de l'ensemble
ordonné (&(El, cl lorsque E possède plus de deux éléments. En effet, en notant a et b deux
éléments distincts de E, les parties {a} et {b} ne sont pas comparables par l'inclusion.

Définition 7.89. Soient (E, ~l un ensemble ordonné, F une partie non vide de E et x E E.
On dit que
1) x est un majorant de F ou encore que x majore F lorsque \If E F, f ~ x,
2) x est un minorant de F ou encore que x minore F lorsque \If E F, x ~ f,
3) x est un plus grand élément de F lorsque x E F et x est un majorant de F,
4) x est un plus petit élément de F lorsque x E F et x est un minorant de F.
164

EXEMPLE 7.90. Explorons diverses situations.


en ► Dans ((0,2(, :,;;), F = (0, 1 [ est minorée par O et majorée par 1 ; 0 est un plus petit élément

1
de F, mais F n'admet pas de plus grand élément.
► Dans (Y'(E),c) où E = {O, 1}, F = {0,{O, 1}, E} est minorée par 0 et majorée par E qui
sont respectivement le plus petit et le plus grand élément de F.
]
..sen

1.....
..... PREUVE. Il s'agit d'une conséquence immédiate de l'antisymétrie de ~ : soient m1 et m2
deux plus petits éléments de F. Comme m2 E F, on a m1 ~ mz. Comme m1 E F, on a
également m 2 ~ m1. Ainsi, m1 = m2 par antisymétrie de~- ■

On peut donc parler du plus petit du plus grand élément d'un ensemble, lorsqu'il existe.

Définition 7.92. On dit qu'une partie A non vide d'un ensemble ordonné (E, ~) admet
une borne supérieure lorsque l'ensemble .,,f{A des majorants de A est non vide et admet un
plus petit élément. Ce dernier est alors unique : on l'appelle borne supérieure de A et on le
note sup(A).

Remarque. Il y a unicité de la borne supérieure en cas d'existence d'après la proposition


7.91. On définit de même la borne inférieure de A -/= 0, en cas d'existence, comme le plus
grand élément de l'ensemble mA des minorants de A.

EXEMPLE 7.93. Continuons d'explorer les relations :,;; et C.


► Dans ((0,2(,,s;;), l'ensemble des majorants de E = (0,2( est vide. E n'admet donc pas de
borne supérieure. Par contre, l'ensemble des majorants dans E de F = (0, 1 [ est .,,f/F = (1, 2(
et admet donc un plus petit élément égal à 1 : sup(F) existe et vaut 1. L'ensemble des
minorants de F' = JO, 1] dans E est {O} et admet donc un plus grand élément qui vaut O :
inf(F') existe et vaut O.
► Dans (Y'(E),C) où E = {O, 1}, l'ensemble des majorants de F = {{O},{l}} est {E} et
admet donc un plus petit élément valant E : sup(F) existe et vaut E. De plus, l'ensemble
des minorants de F dans E vaut { 0} et admet donc un plus grand élément valant 0 : ainsi,
inf(F) existe et vaut 0.

Test 7.40. Test 7.42.


Soient (E, ~) un ensemble ordonné et F une Dans (91'(E), C) pour E = {O, 1, 2}, on pose
partie de E. Que dire de sup(F) lorsque F admet F = {{l},{2}}. Existence et calcul éventuel de
un plus grand élément x ? inf(F) et sup(F).
Test 7.41. Test 7.43.
Donner l'exemple d'un ensemble ordonné (E, ~) Dans (]1,3],::::;), on pose F1 =]1,2l,F2 =]1,3(
et d'une partie F de E tels que F admette un et F3 =] 1, 3]. Existence et calcul éventuel de
plus grand élément, une borne inférieure mais inf(Fil et sup(Fil pour i E {l, 2, 3}.
pas de plus petit élément.
Définition 7.94. Soit (E, *, ~} un magma ordonné. On dit que ~ et* sont compatibles à
gauche (resp. à droite) lorsque pour tous x, y et z dans E, x ~ y =} z * x ~ z * y (resp.
x ~ y =} x * z ~ y * z). On parle de compatibilité lorsqu'il y a compatibilité à gauche et à
droite.

EXEMPLE 7.95. La relation~ sur lR est compatible avec l'addition car, pour tous réels x, y
et z, (x ~ z) # (x + z ~y+ z) mais pas avec la multiplication. En effet, pour tous réels x, y
et z ~ 0, (x ~ z) # (x x z?: y x z).

lltb~tiê>n 7.96. Soit fE, *, ~} Un magma ordonné ; ~·et* sont compo,tibl~;'~.~f !Je,:ul~~,
,frient$i:°;'., . :.. ,. . .. •.i+·.· .. . .
4
V{x,y,z,t)EE , (x~y et z~t)=}{X*Z~Y*t)

PREUVE. ( {=) Soient x, y et z dans E tels que x ~ y. Puisque ~ est réflexive, z ~ z et donc
x * z ~ y * z et z * x ~ z * y : ~ et * sont compatibles.
(==}) Supposons ~ et * compatibles. Soient x, y, z et t dans E tels que x ~ y et z ~ t. Par
compatibilité à droite, on a x * z ~ y * z. Par compatibilité à gauche, on a y * z ~ y * t.
Par transitivité de ~' on a donc x * z ~ y* t. ■

V. LES ENSEMBLES N, Z ET Q
Comme nous l'avons remarqué dans les parties précédentes, la théorie des ensembles est en
quelque sorte un mécano permettant de construire de nouveaux ensembles à partir d'ensembles
connus et au moyen de règles fixées. Cela suppose l'existence d'un ensemble de départ7 à partir
duquel tous les autres peuvent être construits. Cet ensemble premier est l'ensemble N des
entiers naturels. Dans cette partie, nous allons voir comment utiliser le passage au quotient
pour construire les ensembles Z et IQ à partir de N.

V.1. L'ensemble N des entiers naturels


Rappelons que, pour toute relation d'ordre ~ définie sur un ensemble E, on note x < y la
propriété x ~ y et x =/. y pour (x, y) E E2 .

Définition 7.97. (Axiomes de Peano). (N, ~) est un ensemble ordonné vérifiant les
propriétés suivantes
1) N admet un plus petit élément noté O.
2) L'ordre~ est total sur N.
3) Tout entier n admet un unique successeur noté n + 1.
4) Tout entier n =/. 0 admet un unique prédécesseur noté n - 1.
5) Le principe de récurrence. Soit, pour tout n dans N, HR(n} une propriété dépendant de
n. Si HR(O) est vraie et si, pour tout n E N, l'implication HR(n) =} HR(n + 1) est vraie,
alors HR(n) est vraie pour tout n dans N.

7
C'est-à-dire dont on postule l'existence.
166

On appelle « successeur de n » le plus petit petit élément de l'ensemble des majorants


stricts den, c'est-à-dire n + 1 = min({k E Nlk > n}). En particulier, 1 désigne l'unique

1
successeur de O. On définit de même le prédécesseur d'un entier n non nul par n - 1 =
max({k ENI k < n}). On vérifie que (n -1) + 1 = n pour tout n non nul et (n + 1) -1 = n
pour tout n dans N.
]
-9 EXEMPLE 7.98. Prouvons que \ln EN, (n + 1) -1 = n.
r/J
► Soit n dans N. Commençons par remarquer que, pour tout entier naturel k, k < n + 1
équivaut à k :( n. L'implication ({=) est claire. Prouvons (===}) . Si k > n alors k ~ n + 1
J car k est un majorant strict de n donc il est minoré par le successeur de n, qui est n + 1.
C'est la contraposée de (===}) .
Ainsi {k E N Ik < n + 1} = {k E N Ik :( n} et donc

(n + 1) -1 = max({k ENI k < n + l}) = max({k ENI k :( n}) = n.

PREUVE.

1) Notons, pour tout n dans N, HR(n) la proprosition suivante : toute partie de N contenant
au moins un entier k tel que k :( n admet un plus petit élément. Prouvons cette propriété
par récurrence sur n. L'hypothèse HR(0) est vraie car si E C N contient 0, on a 0 = inf(N) =
inf(E). Soit n EN. Supposons HR(n) vraie et considérons un ensemble E contenant au moins
un élément k :( n + 1. Si on peut choisir k tel que k :( n, E admet un plus petit élément
d'après HR(n). Si ce n'est pas le cas, k = n + 1 et tous les éléments x de E vérifient x > n :
on an+ 1 = inf(E) d'où HR(n + 1 ). L'hypothèse HR(n) est donc vraie pour tout n dans N
par récurrence. Soit alors E C N non vide. Il existe n E E et donc, d'après HR(n), E admet
un plus petit élément.
2) Pour tout n dans N, notons HR(n) la proprosition suivante : toute partie de N non vide
et majorée par n admet un plus grand élément. Prouvons cette propriété par récurrence sur
n. L'hypothèse HR(0) est vraie car la seule partie non vide de N majorée par 0 est E = {0}
et max(E) = O. Soit n ~ O. Supposons HR(n) vraie et considérons une partie E de N non
vide et majorée par n + 1. Sin majore E, E admet un plus grand élément d'après HR(n). Si
ce n'est pas le cas, n + 1 E E et majore E ainsi max(E) = n + 1, d'où HR(n + 1) est vraie.
L'hypothèse HR(n) est donc vraie pour tout n dans N par récurrence. Soit alors E C N non
vide et majorée. Il existe n EN tel que n majore E et donc, d'après HR(n), E admet un plus
grand élément.
3) Cette propriété découle immédiatement du fait que tout élément de N admet un successeur.

Il reste à définir les opérations + et x sur N.


Définition 7.100.
1) PourtoutndansN, onposen+O=n, et\fmEN*, n+m=(n+m-1)+1.
2) Pourtoutn dansN, onposenx0=0, et\fmEN*, nxm=(nx (m-l))+n.
167

Les axiomes de Peano assurent que ces deux lois sont bien définies sur N. On notera plus
simplement nm le produit n x m. Les propriétés de ces deux lois se vérifient par récurrence
sur les entiers m et n, nous nous contenterons de les énoncer.

Pl'opoeiti<>n.,'1.1-0l. ,(N,+;~.),vêrifie les propriétés StJ,iVantett:


1.}JN;+) ~f fi~, x} sont <iles m<>noïde1feommutatifs d'lléments ~~tros ~tifs o' et 1:
~) .M Îi,i )( ls't ~isîrioûtive sur'+ :
V(n., ni, p} e;-N·l, n(m PJ :::i nm+ ~li/ +
3) Les opérâtior1,S+ et x sont compatibles avec la relation d'ordre,,,;;;,

V.2. Construction de Z à partir de N


Dans N, l'équation x + n = m n'a pas toujours de racine. L'ensemble Z peut être vu comme
une extension naturelle de N dans laquelle ce type d'équation possède toujours une solution.

Définition de Z. Le point de départ de la construction de Z à partir de N est simple : une


observation attentive de la figure 7.13 en est à l'origine. On identifie (on« colle») les couples
(n, m) de N2 appartenant à une même diagonale parallèle à la première bissectrice définie par
n = m. On définit ensuite O par la diagonale passant par (0, 0), 1 par la diagonale passant
par (1, 0), -1 par la diagonale passant par (1, 0), etc. Cette «identification» cache en fait
un passage au quotient.

• • • • ,, • JI ,,,•
• • • .,,.✓ , , , ' , .... ,"_,,,,' , . , JI
,' , ,' •✓
, • ,' ,'

.•

,/' ,'

,'
,,/ ,,•'
,.,, ,•'
,'

,/'
, ,' ,11'

_,., ,' ,' _,., ,'_,., ,'_,., ,'_,.


,
,,' ,.:'
,•'" ,.,, ,•

,,.,,. ,,'
,,' ,,' , ,/

•'--:,---:,,•
,/ ,--:::-< ,--<-<---- .
_,,• / ,,,. ,,,. . .
•' ,----,,---,,,--
•' .,
•' •'
:,,---
. .. .. ..
FIGURE 7.13. Construction de Z à partir de N

Définissons sur N2 la relation suivante

(n, m)R(n', m') si et seulement si n + m' = n' + m.


Cette relation est clairement réflexive et symétrique. Soient (n,m),(n',m') et (n",m")
dans N2 tels que (n, m)R(n', m') et (n', m')R(n", m"), c'est-à-dire n + m' = n' +met
n' + m" = n" + m'. On a donc, par superposition de ces deux égalités puis simplification,
n+m" = n" +met donc (n, m)R(n", m") : Rest transitive et il s'agit donc d'une relation
d'équivalence sur N 2 . Notons Z = N2 /R.
168

Définition de la loi + sur Z. Pour toutes les classes z = (n, m) et z' = (n', m'), on
pose z + z' = (n + n', m + m'). Cette définition est correcte car indépendante des représen-
tants (n,m) et (n',m') des classes z et z'. En effet, si z = (n 1,m1) et z' = (n;,m;l, on a
n 1 + m = n + m 1 et n; + m' = n' + m 1, d'où n 1 + n; + m + m' = n' + n + m1 + m;
et donc (n+n',m+m') = (n 1 +n;,m1 +m;). On vérifie sans peine que+ est associative
et commutative sur Z et que 0 = (0, 0) est un élément neutre pour + sur Z. En identifiant
(n,0) et n EN, on a N C Z, l'addition sur N coïncidant avec celle sur Z puisque, pour tous
les entiers naturels n et m, (m, 0) + (n, 0) = (n + m, 0). Tout élément z = (m, n) admet un
opposé (n, m) noté classiquement -z.

PREUVE. L'unicité est claire. Soit z E Z. Il existe (k, f) E N2 tel que z = (k, f). Si k ~ e, on
az = e e,
(k- e, 0) = k- EN. Si k < on a z = (0, f - k) = -(E - k) avec E- k EN. ■

Définition de la loi x sur Z. Pour toutes les classes z = (n, m) et z' = (n', m'), on pose
z x z' = (nn', mm'). On prouve que cette définition est correcte en démontrant qu'elle est
indépendante des représentants de z et z' choisis. De plus, on prouve sans peine que cette
définition prolonge la multiplication sur N à savoir que, pour tous entiers naturels m et n,
(m,0) x (n,0) = (mn,0).

Définition de la relation d'ordre :( sur Z. Pour tout couple (n, m) appartenant à Z 2 ,


n :( m si et seulement si m - n E N. De cette définition découlent immédiatement les
propriétés suivantes de la relation :(.

Propoisition~ '1.1()3.. ·fi, ~)•· est anènsemble totalement ordonné.

V.3. Construction de Q à partir de Z


Il s'agit de construire 8 (Q). On nous apprend dans les classes élémentaires que les nombres
rationnels sont les quotients p/q d'entiers relatifs avec q cf. O. De plus, p/q = p'/q' si et
seulement si p q' = p 'q. Nous allons donc définir (Q) comme un quotient de Z x Z* par la
relation d'équivalence définie par pq' = p'q.

Construction de (Q). Pour tous couples (p, q) et (p', q') de Z x Z*, on note (p, q)R(p', q')
si et seulement si pq' = qp'. On vérifie sans peine que Rest une relation d'équivalence sur
Z x Z*. On note (Q) = Z x Z* /R l'ensemble quotient de Z x Z* par R. On peut considérer que
Z C (Q) en identifiant p E Z avec (p, 1) . Tout élément (p, q) de (Q) est noté !.
Définition de la loi+ sur (Q). Soient r = (p, q) et r' = (p', q') deux nombres rationnels.
On pose r + r' = (p q' + p 'q, q q '). On vérifie que la loi + est bien définie car indépendante
des représentants des classes r et r' choisies. De plus, on montre que la loi + est associative et
commutative et qu'elle prolonge l'addition sur le monoïde (Z, +), c'est-à-dire que, pour tous

8
Anticipons un peu le cours sur les anneaux : la construction ici exposée de iQ) à partir de Z est généralisable à
n'importe quel anneau intègre. C'est ce qu'on appelle la construction d'un corps de fractions, nous y reviendrons
dans le complément du même nom.
entiers relatifs pet q, (p, 1) + (q, 1) = (p + q, 1).

Définition de la loi x sur (Q). Soient T = (p, q) et r' = (p', q'). On pose r+r' = (pp', qq').
On vérifie que la loi x est bien définie car indépendante des représentants des classes T et r'
choisies. De plus, on montre que la loi x est associative et commutative et qu'elle prolonge la
multiplication sur Z, c'est-à-dire que, pour tous pet q dans Z, (p, 1) x (q, 1) = (pq, 1). On
établit sans peine que tout élément T = (p, q) non nul est inversible pour x d'inverse r- 1 = ~-

Proposition 7.104. Pô1fr tout r EQ, ü éXisté {p, q) €Z x N* telque r '= %,

PREUVE. Soit TE (Q), il existe (p, q) E Z x Z* tel que T =~-Si q > 0, le résultat est acquis.
Sinon, q < 0 et T = ~ = =~. Le résultat est donc acquis puisque q > O. ■

Définition de la relation d'ordre ~ sur (Q). Pour tout couple (r1, T2) appartenant à (Q) 2,
on écrit T1 = (p1, q1) E Z x N* et T2 = (p2, q2) E Z x N*, et T1 ~ T2 si et seulement
si p2q1 - pi q2 EN. De cette définition découlent immédiatement la propriété suivante.

Proposition t.105~ {Q, ~)est un ênsemble totaleménfomànné.

Remarque. Comme nous l'avons vu, les constructions de Z et (Q) s'effectuent sans peine à
partir d'un passage au quotient pour une relation d'équivalence définie par un nombre fini
d'opérations arithmétiques (voir l'utilisation de + et x dans les définitions ci-dessus). La
construction de lR à partir de (Q) s'avère beaucoup plus délicate et ne sera exposée qu'au
chapitre 21.

VI. EXERCICES

7.1. 2. Prouver que f est injective si et seulement


si pour toute partie A de E, A= f- 1(f(A)).
Soient E un ensemble et A, B, C trois sous-
ensembles de E tels que 7.4.
AUB = AnC, BUC= BnA et CUA = CnB.
Soit f : E ---, F une application.
Montrer que A = B = C. 1. Soit B c F. Prouver que f(f- 1(B)) c B.
2. Prouver que f est surjective si et seulement
7.2.
si pour toute partie B de F, f(f- 1(B)) = B.
Soient E un ensemble, A et B deux parties de
E. Discuter et résoudre l'équation 7.5.

Soit E un ensemble.
1. Trouver une injection de E dans 9"(E).
2. Établir qu'il n'existe aucune surjection de E
7.3. dans 9"(E).

Soit f : E ---, F une application.


1. Soit A C E. Prouver que A c f- 1 (f(A)).
170

7.6. 3. On pose, pour tout (A, B) E 9(E) 2 ,


[/J

Soient A, B et C trois ensembles. Comparer sup(A, B) = sup({A, B})

1
'2
..8 et
X= (AnB) u (B ne) u (CnA) et
inf(A, B) = inf({A, B}).
a. Justifier ces définitions. On exprimera
[/J y= (Au B) n (Bu C) n (Cu A).
sup(A, B) et inf(A, B) en fonction des sous-
ensembles A et B à l'aide des symboles U et

J 7.7.
n.
b. Montrer plus généralement que toute par-
tie non vide ff de (9-"(E), c) admet une borne
Soient I et J deux ensembles, (Ai,il(i,j)ElxJ une inférieure et une borne supérieure que l'on ex-
famille d'ensembles. plicitera à l'aide de ff en utilisant les symboles
1. Établir que net u.

unAi,j c nuAi,j• 7.9.


iEljEJ jEJiEl

2. Prouver à l'aide d'un contre-exemple qu'il On définit une relation binaire sur N2 par
n'y a pas toujours égalité des deux ensembles.
3. Établir que les deux ensembles sont égaux
lorsqu'on a en plus, pour tous couples (i,j) et
(i',j') de I x J,
1. Prouver que ~ est une relation d'ordre sur
if= i' =} Ai,i n Ai',i' = 0. l'ensemble N2 .
2. L'ordre est-il total ?
7.8. 3. On pose A= {(p,p), p EN} et

Soit E un ensemble. B = {(2, lOP), p EN}.

1. Montrer que la relation d'inclusion notée C Les parties A et B de (N 2 , ~) sont-elles majo-


est un ordre sur 9-"(E). rées ? Possèdent-elles un plus grand élément ?
2. L'ordre est-il total ? Une borne supérieure ?
COMPLÉMENT 1. EN TRAVERSANT UNE RIVIÈRE

Le loup, la chèvre, le chou et le passeur

La notion de relation d'équivalence est l'outil qui permet de coller ensemble les éléments
d'un ensemble que l'on souhaite regrouper sous le même nom. Nous en verrons de nombreux
exemples dans le cours de Licence et cela n'a rien d'étonnant : c'est une notion qui traverse
les mathématiques toutes entières. Il existe cependant bien d'autres façons de relier des objets
entre eux.
Les graphes sont les objets mathématiques qui modélisent la notion la plus générale de
relation sur un ensemble. Nous allons ici nous intéresser plus particulièrement aux notions
d'arbre et d'arborescence et nous verrons comment elles permettent de résoudre efficacement
des problèmes d'optimisation.

1.1. Un problème amusant


Partons d'un problème concret, posé souvent comme devinette.

Un passeur doit transporter une chèvre, un loup, un chou d'une rive à l'autre d'un
fleuve. Malheureusement, sa barque est trop exiguë pour transporter plus d'un objet ou
animal à la fois. De plus, il ne fait aucun doute que si la chèvre est laissée sans sur-
veillance en présence d'un chou, l'immonde animal peu vergogneux dévorera l'innocent
crucifère, et c'est bien laid. De même, si le loup est laissé seul avec la chèvre, comme
le dit la fable, il la mangera, et c'est bien normal. À l'inverse, le loup, hostile à tout
régime végétarien, ne toucherait au chou pour rien au monde. On admet enfin - et ce
n'est pas le moins incroyable de l'histoire - que le passeur maîtrise la situation et que
les deux animaux ne cèderont jamais à leurs instincts en sa présence. Comment doit-il
procéder pour amener les trois passagers à bon port ?

Modélisons le problème. Désignons par les lettres P, C, c, L respectivement le passeur, la


chèvre, le chou et le loup. Appelons A la rive de départ et B la rive de destination. Le passeur
peut faire autant d'allers et retours qu'il veut entre A et B, du moment qu'il n'abandonne
jamais Cet c, ou Cet L sans surveillance. Un état d'avancement du problème est la répartition
de P, C, c, L entre A et B quand P est à quai sur l'une des deux rives. Si par exemple la
chèvre est en A et le passeur, le chou et le loup sont en B, alors on associe à A le mot Cet à
B le mot PcL. Les états possibles sont donnés par le tableau suivant.

A C L c cL 0 PcL PcC PCL PC PCcL


B PcL PcC PCL PC PCcL C L C cL 0

On a exclu les mots Cl, Cel et Cc qui ne sont pas compatibles avec les instincts de Cet
de l. Puisque les états de B se déduisent de ceux de A par passage au complémentaire, on
représente l'état du problème par l'état de A. On a donc 10 états possibles : C, L, c, cL, 0,
PcL, PcC, PCL, PC et PCcL. La question est de savoir si l'on peut passer de PCcl à 0. Pour
cela, on décompose tout voyage du passeur en trajets élémentaires, correspondant à une seule
traversée du passeur entre A et B.

On dira que deux mots sont en relation s'il est possible de passer de l'un à l'autre
par un trajet élémentaire.
Par exemple, les mots C et PC sont en relation car si seul C est en A, alors P,c,L sont en B et
il suffit que P revienne à vide en A pour obtenir le mot PC. Pour chacun des 10 mots, nous
allons dresser la liste des mots qui sont en relation. On peut s'aider des deux observations
suivantes.

Règle 7.106.
Dew: mots w1 et w2 sont en relation si· et seulement si Wz et w1 •· t.e sont:
Deux mots sont en relation si seulement si l'un des deux mots contient P, .et l'autrè. non.

La première règle exprime le fait que la relation est symétrique. La seconde règle traduit
le fait qu'il existe une partition de l'ensemble des 10 mots possibles en deux sous-ensembles :
A 1 = {Pel, PcC, PCl, PC, PCcl} et A 2 = {C, l, c, cl, 0}; et qu'il n'existe pas de mots en
relation au sein d'un même sous-ensemble. On dit que la relation est bipartie.
On représente la relation par le schéma suivant. Les 10 mots possibles sont associés à 10
points du plan. On trace un arc entre deux points si les mots afférents sont en relation. Il est
inutile d'orienter les arcs puisque la relation est symétrique. On obtient ainsi un graphe, dont
les 10 points sont les sommets et les arcs sont les arêtes. Si le graphe contient beaucoup de
sommets et d'arêtes, il n'est pas possible en général de le schématiser avec toutes ses arêtes
deux à deux disjointes. Pour éviter toute ambiguïté, on convient de choisir des arcs respectant
les deux règles suivantes.

Règle 7.107.
Les arcs ne se coupent qu'en un nombre fini de points.
Si plusieurs arcs se coupent en un même point, alor.s leurs droites tangentes en ce point sont
deux à deux disjointes.

PcL C

PcC L
PCL C

PC cL

PCcL 0

FIGURE 7.14. Un graphe modélisant le problème du passeur

Dans notre problème de passeur, on obtient donc le graphe (biparti) donné par la fi-
gure 7.14. Les mots en relation avec un mot donné se lisent alors sur le dessin du graphe. Par
exemple, C est en relation avec PcC, PCL et PC : ce sont les mots reliés par une arête à C
sur le schéma. Il est important de comprendre que ce graphe a été obtenu sans préjuger de la
solution: nous avons dessiné a priori tous les arcs possibles issus de chaque sommet. Nous ne
cherchons donc pas à deviner pour l'instant quel est le meilleur enchaînement de traversées
possibles.
Examinons de plus près ce graphe. La propriété de bipartition se lit immédiatement sur la
figure: il se traduit par le fait que les deux colonnes de 5 points, représentant A 1 et A 2 , n'ont
aucune arête interne. Toute arête issue de la première colonne est incidente à un sommet de
la seconde colonne et inversement, toute arête incidente à la seconde colonne est issue de la
première colonne. Il suffit donc de dresser pour chaque mot de A 1 la liste des mots de A2 en
relation pour connaître, en retour, pour chaque mot de A 2 , la liste des mots de A1 en relation.

Le problème du passeur peut maintenant être reformulé : il s'agit de trouver un chemi-


nement dans ce graphe de PCcL à 0. Les solutions peuvent en effet se donner sous la forme
d'un mot w 1 ... Wk, formé des états successifs pris par la rive A entre chaque trajet élémen-
taire, avec w 1 = PCcL et wk = 0. Chaque mot wi est ainsi un sommet du graphe et pour
1 :::;: i :::;: k - 1, WiWi+l est une arête du graphe. On appelle chaîne tout mot 9 w 1 ... Wk qui
vérifie ces deux dernières conditions. Le nombre k- 1 est sa longueur: c'est le nombre d'arêtes
comptées avec répétition qu'utilise la chaîne.

PCL

PCcL cL PcL

FIGURE 7.15. Le même graphe disposé différemment

Une relation n'a pas une représentation graphique unique : elle dépend du choix de la
position des sommets dans le plan et plus encore du tracé des arcs. Par exemple, la figure 7.15
représente la même relation. Chaque figure a son avantage. La figure 7.14 met en évidence que
le graphe est biparti. À la figure 7.15, il est presque évident que notre problème a exactement
deux solutions avec k minimal.
(PCcL) (cL) (PcL)(L)(PCL)(C)(P C)(0) ;
(PCcL) (cL) (PcL)( c) (PcC) (C) (PC) (0).
Il faut un minimum de 7 trajets élémentaires pour que le passeur amène C, c, L sur la rive B.

1.2. Un algorithme de calcul des distances


On peut bien sûr trouver ces deux solutions empiriquement, en tâtonnant, mais ce n'est guère
satisfaisant. En outre, comment montre-t-on que k = 7 est bien minimal? Pour un problème
formellement analogue, mais avec beaucoup plus de sommets (comme, par exemple, pour
trouver un chemin de longueur minimale entre deux villes sur un réseau ferroviaire, ou entre
deux stations de métro, etc.), il est préférable de procéder méthodiquement.
Pour cela, on définit la distance d'un sommet w du graphe au sommet PCcL par la longueur
minimale d'une chaîne joignant PCcL à w. On la note d(w). On convient évidemment que
d(PCcl) = O.
De plus, comme cL est adjacent à PCcL (on entend par là que cL et PCcL sont reliés par
une arête), il est clair que d(cl) = 1 et CL est le seul sommet à distance 1 de PCcL. Tous les

9
Pour distinguer les sommets des chaînes et les sommets dans les chaînes, il sera commode d'utiliser un paren-
thésage. Ainsi, par exemple, (PC)(cL) désigne la chaîne formée d'une seule arête entre les deux sommets PC
et cL, alors que PCcL désigne le sommet correspondant au cas où P, c, C, L sont sur la rive A.
autres sommets sont donc à distance au moins 2 de PCcL. Or, PcL est adjacent à cL. On en
déduit que
2 :S d(Pcl) :S d(cl) + 1 = 2.
Ainsi, d(Pcl) = 2 et Pel est le seul sommet à distance 2 de PCcL. En procédant de proche en
proche, on peut donc calculer la distance de tout sommet au sommet PCcL. On étiquette alors
chaque sommet w du nombre d(w), ce qui donne la figure 7.16. Il en résulte que d(0) = 7 et
qu'il faut bien un minimum de 7 trajets élémentaires au passeur pour amener C, c et L sur la
rive B.
C
L
C

PC cL

PCcL o 0

FIGURE 7.16. Le graphe étiqueté par les distances au sommet PCcL

Donnons un cadre général à la méthode employée. Abstraitement, un graphe G = (V, E)


est la donnée d'un ensemble de sommets V= {w1, ... , Wn} et d'un ensemble E d'arêtes définies
par des mots 10 wiwi. L'algorithme A.1 a pour entrée un sommet quelconque w 0 de G et pour
sortie les distances de chaque sommet à Wo.

Algorithme A.1 de calcul des distances


Étape 1 : On pose dw0 (wo) = 0, Sw0 = {wo} et v* := Wo.
Pour chaque sommet VE V\Sw0 , on pose dw0 (v) := oo.
(*) Tant que Sv* -/- V et que dw0 ( v*) < oo, on effectue les étapes 2 et 3.
Étape 2 : Pour chaque arête v*x E E,
si dw0 (x) = oo, on pose dw0 (x) = dw0 (v*) + 1.
Étape 3 : On choisit y E V\Sv* tel que
dw0 (Y) = min{ dw0 (v) V jt Sv*};
1

on pose Sy = Sv* U {y}, puis v* := y.

Proposition 7.108.
L'algorithme A.1 de calcul des distances s 1ardte après un nômbre fi:ni d'opéro.tions.,

PREUVE. En effet, soit n le nombre de sommets. Alors l'étape 1 nécessite 1 + 1 + (n-1) + 1 =


n + 2 opérations. L'étape 2 nécessite autant d'opérations que le sommet v* a d'arêtes, soit au
plus n - 1 opérations. L'étape 3 compte 3 opérations. Les étapes 2 et 3 sont répétées autant

10
On convient que l'on a toujours i # j, ce qui signifie que le graphe ne contient pas de boucle, c'est-à-dire
d'arête reliant un sommet à lui-même. De plus, on identifie les mots WiWj et WjWi, qui reprêsentent donc la
même arête, ce qui signifie que le graphe est non orienté.
de fois qu'il est possible d'ajouter un sommet à l'ensemble variable Sv*, soit n fois. On a donc
au plus n + 2 + n x (n - 1 + 3) = n 2 + 3n + 2 opérations, ce qui montre que l'algorithme
s'arrête bien. ■

Ptoposition··7.1{n). 'SÎ>ît dWo ·: V'~NIJ{oo} la'jrmcti<m.oonsfroite par. l'algorithme ··A:~1 et


smtv EV; Si dwc,{v) :hoc,, itlors il n'èxistépas de èhaf:rtè entré Wo et v. Si ~(v) < oo,
alors dwo(v} êst'la distu,',,i,ce'dè v àwo. . .
PREUVE. Soit v E V un sommet quelconque. Notons d(v) la distance de w 0 à v, avec
la convention que d(v) = oo s'il n'existe pas de chaîne entre Wo et v, et montrons que
d(v) = dw0 (v).
o Si dw0 (v) = oo, alors la définition de l'algorithme montre que dw0 (v') = oo pour tous les
sommets adjacents à v. On en déduit de proche en proche que tous les sommets v' qui peuvent
être reliés à v vérifient aussi que dw0 (v') = oo. Cela montre en particulier que v ne peut être
relié à w 0 par une chaîne puisque dw0 ( wo) = 0 < oo.
o Supposons maintenant de dw0 (v) < oo. Il s'agit de montrer que dw0 (v) :S d(v), l'autre
inégalité étant évidente puisque l'algorithme fournit facilement une chaîne entre Wo et v de
longueur dw0 ( v). Soit v 0 •.• vk une chaîne quelconque satisfaisant Vo = w 0 et vk = v. Le
lemme 7.110 appliqué à X = Vj et w = Vj-1 montre que dw0 (vj) :S dw0 (vj-il + 1 pour
1 :S j :S k. On en déduit que

Comme cela est vrai pour toutes les chaînes joignant w 0 et v, la définition de la fonction d
montre que dw0 (v) :S d(v), ce qu'il restait à démontrer. ■

J.,~~ 7.110. .. . . ·. . ·
Soit dw0 : V-+NU{oo}lafonction définiepar l'algorithme A.1.0n suppose que dwo{w) < oo
et que wx E E. Alors dWo(x) :S: dWo(w) + 1.

PREUVE. On définit une relation d'ordre sur Sw en posant pour V1, Vz E Sv

V1 :S V2 si et seulement si Sv, C Sv,.

On obtient ainsi une relation d'ordre total sur Sw dont w 0 est le plus petit élément et w le
plus grand : les sommets de Sw sont en effet ordonnés par ordre d'apparition dans la variable
v*. De plus, la fonction dw0 est croissante pour cette relation d'ordre. En effet, pour v 1 < v 2
consécutifs dans Sw, montrons que dw0 (vi) :S dw0 (vz). On a l'alternative suivante.
o Soit on a déjà dw0 (v2) < oo au moment où v* = V1, ce qui signifie que

◊ Soit dw0 ( Vz) = oo au moment où v* = V1, ce qui signifie que dw0 ( Vz) = dw0 ( V1) + 1 quand
l'algorithme s'arrête.
Dans les deux cas, dw0 (v1) :S dw0 (v2l, ce qui montre la croissance de dwo·
Montrons enfin l'inégalité de l'énoncé. Soit Vmin le plus petit sommet de Sw tel que VminX E
E. Alors par définition de l'algorithme, dw0 (x) est construit quand S = Svm•n' ce qui entraîne
que dw0 (x) = dw0 (Vminl + 1. Or, Vmin ~ W, donc dw0 (Vminl ~ dw0 (w). Il en résulte bien que
dw0 (x) ~ dw0 (w) + 1, comme annoncé. ■

Remarque. Si toutes les distances d(v) sont finies, on dit que le graphe est connexe. Cela
signifie que l'on peut joindre n'importe quel sommet à Wo par une chaîne. Autrement dit, il
est possible de se déplacer sur le graphe de n'importe quel sommet w à n'importe quel autre
sommet w' en suivant des arêtes. Il suffit en effet de suivre une chaîne de w à w 0 , puis de
suivre une chaîne de w 0 à w'.

1.3. Temps de calcul


À la proposition 7.108, nous n'avons pas donné de définition mathématique de la notion d'opé-
ration. La raison est qu'il n'en existe pas d'universelle. Il faut en effet entendre par opération
toute tâche exécutable en un temps sensiblement semblable pour toutes les opérations en jeu
dans l'algorithme. La définition d'une opération dépend donc des moyens techniques dont on
dispose, et de l'idée que l'on se fait de leurs performances.
Par exemple, dans la proposition 7.108, on a choisi d'appeler opération toute assignation
d'une variable ou, dans l'étape 3, tout choix de y.
On considère en effet qu'assigner une valeur à une variable, avec un test éventuellement
au préalable, prend sensiblement toujours le même temps. En revanche, que le choix de y soit
compté pour une seule opération est moins légitime. Il faut en effet comparer au plus n som-
mets pour choisir y. Il serait donc plus correct d'estimer le temps de calcul de y à n fois celui
d'une assignation d'une variable, auquel cas l'algorithme compterait plus vraisemblablement
au plus n+2+n(n-1 +n+2) = 2n 2 +2n+2 opérations sensiblement de même durée. Pour
éviter de rentrer dans ce genre de discussion, on préfère ne considérer que le comportement
asymptotique du nombre d'opérations : dans notre cas, il existe une constante C > 0 telle
que pour tout graphe den~ 1 sommets, le nombre d'opérations est majoré par Cn 2 . On dit
que le temps de calcul est en O(n 2 ) (voir le chapitre 25 pour une définition de la notation de
Landau).

1.4. Recherche algorithmique d'une chaîne minimisante


Nous avons montré qu'un minimum de 7 trajets élémentaires sont nécessaires au passeur
pour amener C, c, L à bon port. Pour répondre complètement à la question posée, il reste
à expliquer comment on peut construire une chaîne de longueur 7 joignant PCcL à 0, sans
avoir besoin de la deviner en regardant le graphe.
Or, on sait que d(0) = 7. Cela signifie qu'il existe une chaîne (PCcl)v 1v 2 ... v 6 (0) dans le
graphe. En particulier, v 6 est adjacent à 0 tel que d(v 6 ) = 6. Ici le choix est forcé: v 6 = PC.
Plus généralement, pour tout sommet v # PCcL, il existe un sommet p(v) adjacent à v tel
que
d(p(v)) = d(v) - 1.
Donc en partant de 0 et en itérant l'application p, on obtient une succession de sommets
pk(0) = p(pk- 1 (0)), pour 1 ~ k ~ 6 avec la convention que p 0 (0) = 0. Comme par
construction d(pk(0)) = 7 - k, on a p 7 (0) = PCcl. Ainsi, la chaîne

(PCcl)p 6 (0) ... p(0)(0)

est minimisante. Dans notre exemple, on a trouvé exactement deux chaînes minimisantes
L -1-~> \ PCL

~~
\c PC 0
~~-
PCcL cL PcL

FIGURE 7.17. Les deux arborescences de racine PCcL

Dans le cas du problème du passeur, on obtient deux arborescences dessinées à la fi-


gure 7.17. L'alternative traduit le choix de -y E { PcC,PCL } auquel on doit procéder à
l'étape 3 de l'algorithme A.2 quand v* = C. On retrouve les deux chaînes de longueur mini-
male (PCcL) (cL) (PcL) (c) (PcC) (C) (PC)( 0) et (PCcL) (cL) (PcL) (L) (PCL) (C) (PC)( 0).
Chapitre 8
DÉNOMBREMENT

1. ENSEMBLES DE MÊME CARDINAL


D'un point de vue intuitif, le cardinal d'un ensemble est son nombre d'élément(s). Il faut bien
comprendre que ceci ne constitue en aucun cas une définition car le nombre d'élément(s) d'un
ensemble est une notion précisément fondée par le cardinal.
Notation. Pour tout entier naturel n non nul, on note Nn = {l, 2, ... , n}.

Définition 8.1. (Relation d'équipotence) Soient E et F deux ensembles. On dit que E


et F sont équipotents, ou qu'ils ont le même cardinal, lorsqu'il existe une bijection de E dans
F. On note alors E ~ F.

Proposition 8.2. La œlatîon tl'ÎffU,i-potenc.e ést une relation d'6juwàlence.

PREUVE. Soit E un ensemble. L'identité de E réalisant une bijection de E dans E, on a E ~ E


la relation ~ est réflexive. Soient E et F deux ensembles tels que E ~ F et cp une bijection de
E dans F. Comme cp- 1 est une bijection de F dans E, on a aussi F ~ E : la relation ~ est
symétrique. Soient E, F et G trois ensembles tels que E ~ F et F ~ G. Notons cp 1 une bijection
de E dans F et cpz une bijection de F dans G. Puisque cpz o <p1 est une bijection de E dans G,
on a E ~ G : la relation~ est transitive. L'équipotence est donc une relation d'équivalence. ■

Remarquons avant d'aller plus loin que la terminologie relation d'équivalence est ici abusive
car il faudrait la définir comme une relation binaire sur un ensemble des ensembles qui n'existe
pas ! Cela est bien sûr sans conséquence car nous n'utiliserons dans tout ce qui suit que les
propriétés de réflexivité, de symétrie et de transitivité de cette relation.

li. ENSEMBLES FINIS


Définition 8.3. (Ensemble fini) Un ensemble E est dit fini lorsqu'il est vide ou qu'il existe
un entier naturel n ~ 1 tel que E ~ Nn,

Une bijection cp de E dans Nn n'est autre qu'une numérotation des éléments de E : à


tout élément de e de Eon associe un numéro cp(e) qui lui est propre entre 1 et n. Forts de
cette définition, nous sommes tentés d'appeler cardinal de E l'entier n tel que E ~ Nn. Une
telle définition est cependant incorrecte car nous n'avons pas établi l'unicité d'un tel entier
naturel n.

II.1. Définition du cardinal


Les lemmes suivants ont pour but d'établir, en cas d'existence, l'unicité d'un entier n ~ 1 tel
que E ~ Nn et de fonder ainsi rigoureusement la définition du cardinal de Epar card (E) = n.
180

Lemmf:l 8.4. Soientn ei m dew;~tiersnritureijtÛ,rÙnuls. Alors il existe.une injection de


rJJ Nn daµs Nm si et seulement si n ~ m.

1
-g
..s
PREUVE. Raisonnons en deux temps.
(-;==) Si n ,,;; m, Nn C Nm et l'application d'inclusion de Nn dans Nm définie par i : x ---+ x
est clairement injective .
rJJ
(==}) Raisonnons par récurence sur n): 1. On note HR(n) l'hypothèse suivante : Pour tout
j entier naturel non nul m, l'existence une injection de Nn dans Nm implique que n ,,;; m.
L'hypothèse HR(l) est vérifiée car n = 1 ,,;; m. Soit n): 1. Supposons HR(n) vérifiée. Soit cp
~ une injection de Nn+l dans Nm. Envisageons plusieurs cas :
◊ Si cp(n + 1) = m, alors m): 2 car si on avait m = 1, on aurait cp(n + 1) = cp(l) = m donc
n + 1 = 1 par injectivité de cp, ce qui est absurde car n =/ O. De plus, la restriction <rlNn est
une injection de Nn dans Nm-l, et donc, d'après HR(n), on an,,;; m - 1, d'où n + 1 ,,;; m.
◊ Si cp(n + 1) < m, notons T la permutation de Nm qui échange les éléments cp(n + 1) et m,
c'est-à-dire l'application de Nm dans lui-même définie par

T(m) = cp(n + 1 ), T( cp(n + 1)) = m et T(k) = k pour k (/. {m, cp(n + 1)}.

L'application T est bijective car vérifie T o T = idNm. L'application cp' = T o cp est une injection
(en tant que composée d'injections) de Nn dans Nm vérifiant cp'(n + 1) = m. On est donc
ramené au cas précédent d'où n + 1 ,,;; m.
◊ Dans tous les cas n + 1 ,,;; met HR( n + 1) est donc vérifiée. ■

Lemme· 8.'5. Soientrt et m d(Jff/,8 W~ Alors Nn ~Nt!( sî et sèulement si n == m.

PREUVE. Si m = n, on a clairement Nn ~ Nm (il suffit de choisir l'identité de Nn)- Réci-


proquement, si Nn ~ Nm, il existe une bijection de Nn dans Nm, donc a fortiori une injectlion
de Nn dans Nm, d'où n,,;; m. Puisqu'il existe également une bijection de Nm dans Nn, on a
également m ,,;; n. Ainsi m = n. ■

Proposition 8.6. (Cardinal d'un ensemble fini) Soit r. un énsèmt>le fin0i6n vide.· ft
exi.$te v.n.unique ent~er rw,tu~ln tel que E,... Nn. On le note n.= card (EL n = IEI, ou #{E},
et on l'appellè èlirdinillde t:Pur con11ention, on pose cari:I(0) =ô. . ...

PREUVE. Soient n et m deux entiers naturels non nuls tels que E ~ Nn et E ~ Nm. Soient
<r1 une bijection de E dans Nn et <pz une bijection de E dans Nm. L'application cp 1 o cp 21 est
alors une bijection de Nm dans Nn et donc, d'après le lemme précédent, m = n. ■

Cette démonstration peut être résumée avec le diagramme suivant :


181

Il.2. Calculer des cardinaux


La proposition suivante découle immédiatement de la définition du cardinal. Elle est essentielle
au fondement de tout dénombrement digne de ce nom.
11::

Pl'o-posîtfoif 8;7. ·Soîe'lit f. êt f deu:c ensirmbies tels quèE ;...• F. S(E èst;fini ~rSf également
~~~~ . .
1
,(1.)
Cl
oci
PREUVE. En effet, si E = 0 alors F ~ E entraîne F = 0. Si E =f. 0, en posant n = IEI, E ~ Nn ..d
u
d'où, par transitivité de la relation~, F ~ Nn, donc Fest fini et IFI = n = IEI. ■

Comment énumérer les éléments d'un ensemble?


Dans la pratique, pour calculer le cardinal d'un ensemble F, on peut rechercher un
ensemble fini Ede cardinal répertorié, c'est-à-dire connu (voir les exemples précédents et,
plus loin dans ce chapitre, le cas des arrangements et des combinaisons), et équipotent
à E. On peut dès lors envisager trois types de preuves :

o une démonstration rigoureuse passant par la détermination d'une bijection de E dans


F (ou l'inverse);

◊ on cherche deux injections de E dans F et de F dans E ;

◊ l'esquisse d'une preuve qui consiste à construire un élément de Fen faisant un certain
nombre de choix et à en déduire, après recensement de toutes les posibilités, la valeur
de IFI. '

Examinons de plus près cette alternative.

EXEMPLE 8.8. Soit n un entier naturel non nul. Calculons le cardinal de l'ensemble défini
par F ={(n 1,n2) ENI n, +n2 = n}.
► Un calcul rigoureux mais laborieux: l'application définie par 1!': F--, Nn, f(n1, n 2) = n 1+
1 est une bijection de F sur Nn+l · En effet, puisque pour tout (n,, n2) E F, n2 = n-n 1 ~ 0,
on a O :( n 1 :( n d'où f(n1, n2) E Nn+l : l'application f est donc bien définie. De plus,
celle-ci est surjective, car, pour tout k E Nn+ 1 , k = f (k - 1 , n - k + 1). Il est clair que f est
injective car si f(n 1, n 2) = f(n\, n~), on a n 1 = n\, d'où n 2 = n-n 1 = n-n\ = n~ et donc
(n,,n2) = (n\,n~l- Ainsi, Fest fini et IFI = Nn+l =n+ 1.
► Un calcul heuristique mais élégant : un élément (n,, n2) de F étant entièrement défini par
le choix d'un entier n 1 entre O et n, on a IFI = n + 1.

Un des premiers résultats à établir est que tout sous-ensemble F d'un ensemble fini E est
fini avec IFI :( IEI- On commence par prouver les résultats pour les parties de l'ensemble Nn.

PREUVE. Prouvons le résultat par récurrence sur n = IEI. Notons HR(n) la proposition
suivante : toute partie de Nn est finie de cardinal inférieur à n. L'hypothèse HR(l) est claire
182

car les seules parties de N1 sont 0 et N 1. Soit n ~ l. Supposons HR(n) vraie et soit Fun
r/J sous-ensemble de Nn+l· Si F C Nn, Fest finie et !FI ~ n ~ n + 1 d'après HR(n). Sinon,
n+ 1 E F et l'on pose F' = F\ {n+ 1}. Si F' = 0, F = {n+ 1} est finie de cardinal 1 ~ n+ 1.

1
]
..8
Si F' =f. 0, F' est une partie non vide de Nn et, d'après HR(n), il existe p ~net une bijection
cp: F'----, Np. L'application g: F----, Np+l définie par gJp = f et f(n+ 1) = p + 1 est clairement
une bijection de F dans Np+ 1 • Ainsi F est finie de cardinal IFI = p + 1 ~ n + 1, d'où HR( n + 1) .
r/J Le résultat est donc acquis par récurrence sur n E N*. ■

j Ce lemme va nous permettre de prouver le résultat annoncé ci-dessus. Ajoutons que les
È
Cl)
fonctions indicatrices interviennent également dans le cadre du dénombrement. Elles per-
mettent quelques calculs de cardinaux.

·Prop~itton s:,u:Jè,atttm ~,r~dJDâtâ Pattfe defâ rcinâi6niiilëfî~~1If~~


un sous~~êmblê d'ùn efl,stmble fin.i't'. Alors A ëstfin'i et .•· .; t.·I•.)::A·~/:';/;

lAf= :L tAJx) ' âveè ta conv~tiori .[ Jl"A..fxJ= (t .


xEE xE0 . .

PREUVE. o Commençons par prouver que A est fini. Si E = 0, le résultat est clair. Sinon,
notons n = IEI et f une bijection de E dans Nn. L'application g = flF : F----, Nn est injective
en tant que composée d'injections. On a donc F ~ g(F). D'après le lemme 8.9, la partie g(F)
est finie de cardinal m ~ n. Ainsi, par transitivité de ~, A ~ Nm et A est finie de cardinal
IAl=m~n.

o Si A= 0, l'égalité est banale. Si A =f. 0, il existe un entier naturel net une bijection cp
de A dans Nn. Puisque Vx E Ac,lIA(x) = 0, on a
n n

par bijectivité de <p. ■

Proposition 8.11. Soient A c B dem ensembles finis.· Alors !Al·~ ft3f, De plus, A = 13 si
èt seulèment si JAi = !BI. · (
PREUVE. Il suffit d'appliquer la formule précédente et de remarquer que A C B équi~aut à
h ~ lis. Le cas d'égalité découle de l'équivalence A = B si et seulement si ][A = lis. '· ■

II.3. Dénombrement et applications


Proj)ositiqn 8,12. Soient E et F deux ensembles finis et f.: E ----, F une appliœtion. Alors
1) sif estinJJctjue; lf(tJf = fEJetJÊ!~ 1ft, . . ..
2) si f est surjectiue, !FI .~ IEI,
·=
3) si ltl. ·fFl, f .· est inj.eètivè sièi/~ülement si f. ëst S'#rfeêiive si êt; sen.Iëm~Iit; si f est
bijective.
183

PREUVE.

1) La corestriction fi~(El étant une bijection, on a jf(E)I = jEj. Comme f{E) C F, on en déduit
que IEI ::;;; IF/.
2) Soit g : F -l E la fonction qui à tout élément -y de F associe un antécédent de -y par f.
Cette application est bien définie car f est supposée surjective. Il est clair que g est injective
donc, d'après le 1), IFI ::;;; IEI.
3) Le seul résultat non banal à montrer est que les hypothèses IEI = IFI et f injective impliquent
que f est surjective. Or, f(E) C F et jf(E)I = IEI par injectivité de f, d'où lf{E)I ::;;; IFI et donc
f(E) = F d'après la proposition 8.11. ■

Cette propriété permet de simplifier certaines démonstrations de bijectivité.

III. OPÉRATIONS SUR LES CARDINAUX FINIS

Les résultats qui suivent exposent quelques calculs classiques de cardinaux.

Ill.1. Cardinal d'un complémentaire


Proposition 8.13'. ~diéritA c:.E deux ensem~les, E étant fini _Alors 1Acl est fini et l'on a
!Ac! = !El - !Al.
PREUVE. L'ensemble Ac est fini en tant que sous-ensemble de l'ensemble fini E. Comme
ITN = 1- [A,on a

xEE xEE xEE xEE


EXEMPLE 8.14. Soient A et B deux ensembles finis. Montrons que l'ensemble A\ Best fini
de cardinal IAI - IA n Bj.
► Par définition, A\ B est le complémentaire de An B dans A. Ainsi, d'après la proposition
8.13, A\ B est fini de cardinal IA \BI= IAI - IA n BI.

III.2. Cardinal d'une réunion d'ensembles


LemPJ.è 8.15. Soient A et B deu::è ensembles finis et disjoints. Alors AU B est fini et
]Au BI=:: !Al+ !BI.
PREUVE. Si l'un des ensembles A ou B est vide, le résultat est banal. Dans le cas contraire,
soient net m dans N, cp 1 et cp 2 deux bijections respectivement de A dans Nn et de B dans
Nm. On note cp l'application de AU B dans Nn+m définie par

XE AH (j)1{x), XE B H cpz(x) +n.


L'application cp est bien définie car A et B sont disjoints. Il est clair que cp est une bijection
de AU B dans Nn+m· L'ensemble AU Best donc fini de cardinal IAI + IBI. ■
184

On étend sans peine 1 ce résultat à une réunion finie d'ensembles disjoints.

Prop0$ltion 8.16. Soient A1, •.• , Ap sont p ensembles <Jeux à de'll,fl; <Jisjoints, ori a

On déduit de cette formule le calcul dans le cas général du cardinal de la réunion de deux
ensembles.

Proposition/ $.l7. Poor tQus enlembles finis" A et B, lo: ré-ûnior,, AIJ B eit itn epstmble
fini et !AüB! =!Al+ !BI~ IAn BI~

PREUVE. On a AU B =AU (B \ A) avec A et B \ A disjoints. L'ensemble B \ A est


fini en
tant que sous-ensemble de l'ensemble fini B. Ainsi, d'après le lemme 8.15, AU B est finie et

IA u BI = IAI + IB \ Al = IAI + IBI - IA n BI.


Cette formule se retrouve sans peine à l'aide d'un diagramme de Venn.

FIGURE 8.1. Le calcul de IA U BI vu sur un diagramme de Venn

Test 8.1. Test 8.2.


Retrouver ce résultat à l'aide des fontions indi- Soient A et B deux ensembles finis. Montrer que
catrices. A~B est fini et calculer son cardinal en fonction
de ceux de A et B.

Le calcul du cardinal d'une intersection finie quelconque d'ensembles fini/4ffectu e par


récurence à partir de la formule exposée ci-dessus. La généralisatio n de eétte formule est
parfois appelée formule du crible ou formule de Poincaré. Commençons par examiner le cas
de trois ensembles.

1
Par récurrence.
185

EXEMPLE 8.18. Trouvons une formule analogue pour IA U BU Cl lorsque A, B et C sont


finis.

► Posons E = A U B U C. Comme E = A U (B U C), on a

IEI = IAI + IB u Cl - IA n (Bu C)I = IAI + IBI + ICI - IB n Cl - l(A n B) u (An C)I
= IAI + IBI + ICI - IB n Cl - [IA n BI+ IA n Cl - IA n B n Cl]
= IAI + IBI + ICI - IB n Cl - IA n BI - IA n Cl + IA n B n Cl

Une récurrence sans difficulté permet de généraliser la première partie de la proprosition


8.17 : une réunion finie d'ensembles finis est finie. La formule du cardinal est également
généralisable à n ensembles.

Pi;-O{l~tio1;1 $.19~ (Forlllllle de Poincaré), Soient At. Ai, ... A,. n ~ l efl,Semble(s)
·n-
fini(s). Alors LJA1c est fini et
k==l

PREUVE. Notons A la réunion des Ak pour 1 :( k ( n. Cet ensemble est fini (voir la
remarque précédant l'énoncé de la proposition 8.19).D'après les lois de De Morgan

et donc
n n n
1 - lIA = ]IN = rr
k=l
][At = rr [1 - hJ
k=l
= 1 + L.r-11 k
k=l

d'où
n n

][A= L (- l)k-1 L li~, ... lIA,k = L (-1 t-1 L ITA,, n...nA,k.


k=l l~i1< ... <ik(;n k=l l::;;i1< ... <ik~n

Ainsi,
n

XEE xEE k=l


n n
= L_(-l)k-l L L_lIA,,n ...nA,Jx) = L_(-l)k-l L
IAi, n ... nAikl.
k=l l,(i1 <... <ik,(n xEE k=l l,(i1 <... <ik,(n


186

Test 8.3. Test 8.4.


Ecrire la formule de Poincaré pour n = 4. Calculer le cardinal de AL\BL\C en fonction de
cerne de A, B et C supposés finis.

III.3. L'équation aux classes et ses applications


Proposition 8.20. Si &1 est une partiti(J'11, finie d.'un ensemble E en ensemble(s} fini(s}
alors E est fini et
IEI= _LIXL
XE!7'

PREUVE. Si 9 est vide, alors E = 0 et la formule est acquise. Dans le cas contraire, notons
9 = {A 1 , •.• , Ap}- Comme les ensembles Ai sont deux à deux disjoints de réunion E, E est
fini et l'on a
p

IEI = L. IAkl = L. IXI.


k=l XE!Y'

Corolltdrè 8.21:. (ltguatfon aux classes) .. Soit. E oo emèml>lK.fitz,inus.11/i rl'uturrelrttion


d'équivalente 'R. Alors l'ensemble quotientE/'R de Epar 'Restjini et

IEI= .[_.!XI;
XEE/R,

EXEMPLE 8.22. Dans une ville comptant 300000 habitants, dont chacun possède entre 0
et 10000 cheveux, il existe au moins 30 habitants ayant le même nombre de cheveux.
► On définit sur l'ensemble E des habitants la relation R : Avoir le même nombre de
cheveux. Il s'agit clairement d'une relation d'équivalence. Raisonnons par l'absurde : si les
classes d'équivalences de E étaient toutes de cardinal au plus 29, on aurait d'après l'équation
aux classes,

300000 = IEI = L_ IXI ( 29 x IE/RI ( 29 x 10001 = 290029


XEE/R

ce qui est absurde.

Corollaire 8.23. (Lemme des Bergers) Soient E ·et F deux ensembles, E étant fini) et
f: E -4 f une application. Alors

IEt=I:. 1r1 t{y})!.


l,1€f

PREUVE. Il suffit d'appliquer l'équation aux classes pour la relation d'équivalence R associée
à f sur E. ■

L'appellation lemme des bergers provient de la situation suivante un berger ne voyant


que les pattes de ses moutons pourra déterminer le nombre d'animaux en divisant le nombre
de pattes par quatre.

/
187

Test 8.5. Test 8.6.


Donner les ensembles E et F ainsi que l'applica- Soient E fini et f : E ----, F. Comparer le nombre
tion f dans le cas du berger et de ses moutons ? de fibres non vide(s) de f et IEI.

III.4. Cardinal d'un produit cartésien


Proposition 8.24. Soient E tt F deux e11,Sembles fini,s. A,lor.sl'ensemblëE x F .est fini et
IE XFI = !El X !Fi. . .
PREUVE. Si E ou F est vide, E x F = 0 par définition et la formule est vraie. Dans le cas
contraire, notons F = {f 1, ••• , fp} et posons, pour tout k E Np, Ek =Ex {fk}- Il est clair que les
ensembles Ek forment une partition de Ex F. De plus, pour tout k dans Np, Ek est équipotent
à E. Il suffit de considérer la bijection 'Jlk définie de E dans Ek par 'Jlk(x) = (x, fkl- Ainsi, Ek
est fini de cardinal IEI. L'ensemble E x Fest donc fini et
p

IE X FI = L. IEkl = PIEi = IEI X lfl.


k=l

Ce résultat s'étend sans peine par récurrence sur n à un produit cartésien fini d'ensembles
finis E1, ... , En : E 1 X ... X En est fini et de cardinal IE 11 x ... X IEnl- Ainsi, pour tout ensemble
E fini et tout entier naturel n non nul, En, l'ensemble des n-uplets d'éléments de E, est fini
de cardinal IEln.

III.5. Cardinaux des ensembles de fonctions


Proposition8.25. Soient E et F deux ensembles finis. L 1ensemble des applications de E
dans F est de cardinal JfEI = ff!1EI. ·
PREUVE. On note n = IEI, p = IFI et E = {e1, ... , en}- Soit 'Ji l'application définie par
'Ji: FE--+ P, f H 'Jl(f) = (f(ei), ... , f(en)).
◊ 'Ji
est bijective : en effet, pour tout n-uplets y = (1J1, ... , 1Jnl d'éléments de F, il existe une
unique application f telle que 'Jl(f) =y.Elle est définie par \fi E Nn, f(et) = 1Ji·
◊ Puisque Pest fini de cardinal lfln, FE est fini de cardinal IFIIEI_ ■

On comprend à présent pourquoi la notation FE est appropriée elle est adaptée au calcul
du cardinal de l'ensemble FE.
Lemme. 8.26. ·. Soient E et F deux ensembles finis non mdes de même cardinal n. Alors
l'ensemble bi(E, F) des bijections de E dans F et l'ensemble 6E des permutations de E sont
éqûipotents.

PREUVE. Soient cp 1 et cp 2 des bijections de E et F sur Nn. L'application cp = cp 11 o cp 2


est une bijection de F dans E. Notons alors 'Ji l'application définie de .'?6'(E, F) dans 6E par
'Ji( f) = cp o f. Cette application est clairement bijective de bijection réciproque définie par
'Jl- 1 (g) = cp- 1 o g. D'où .'?6'(E, F) ~ 6E- ■

Ainsi, sous les hypothèses précédentes, on a 6E ~ 6f.


188

Proposition 8.27. Soit E Un ensemble fini de cardinàl n. EN•\ L'ensemble des permuta•
twns de E/èstfiii, de ~nat n!. . .• ....

PREUVE. Démontrons la propriété par récurrence sur n. Pour tout n E N*, notons HR(n)
la proposition suivante : pour tout ensemble E de cardinal n, l6EI = n!.
o HR(l) est banale car la seule permutation d'un ensemble à 1 élément est l'identité.
o Soit n ;;;:, 1. Supposons HR(n) vraie. Soit alors E un ensemble de cardinal n + 1. Notons
E = {e 1, ... , Cn+i} et, pour tout k entre 1 et n + 1, Fk l'ensemble des permutations f de E
vérifiant f(en+il = ek. Il est clair que les ensembles Fk pour k variant de 1 à n + 1 forment
une partition de 6E. On a donc
n+l

l6EI = L, IFkl-
k=l

Notons E' = E \ {en+i} et Ek = E \ {ed. Une fonction f de E dans E appartient à Fk si et


seulement si la fonction notée f définie de E' dans h par f(x) = f(x) réalise une bijection de
E' sur Ek. L'application
'Ji: Fk-, &iJ(E', Ek), f Hf
est donc une bijection. Ainsi, IFkl = l&iJ(E', Ek)I = l6E'I d'après le lemme 8.26. Or, d'après
HR(n), IE'I = n!. On a donc l6EI = (n + 1) x n! = (n + 1)!. ■

Remarque. On retrouve sans peine ce résultat de la manière suivante. Pour déterminer une
permutation de Nn, il faut commencer par choisir l'image de u(l) : on dénombre n choix
possibles. Puis il faut déterminer u(2) parmi Nn \ {u(l)} (car on doit avoir u(l) cf. u(2) par
injectivité de u), ce qui représente n- 1 choix. On continue ainsi de suite pour u(3), ... , u(n).
Finalement, on dénombre n x (n-1) x ... x 1 = n! permutations de Nn. Ce calcul est à retenir
et on n'hésitera pas à le reconduire même s'il n'est pas aussi rigoureux que la démonstration
de la proposition 8.27.

On déduit du lemme 8.26 et de la proposition 8.27 qu'il existe exactement n! bijections


d'un ensemble E à n éléments sur un ensemble F à n éléments.

IIl.6. Cardinal de 9(E)

Propositiôn 8.28. $Ôîtf. un. ensemble fini de cardinal n E N. Alors .9(E) ·est fini de
cardinal zn. .
PREUVE. Si E = 0, c'est-à-dire sin= 0, le seul sous-ensemble de E est 0, d'où lg'J(E)I =
1 = 2n. Si E cf. 0, notons E = {e1, ... , en}- Soit alors

◊ L'application 'Ji est injective car si 'Jl(A) = 'Jl(B) = (y 1, ... , 1Jnl pour A et B dans g'J(E),
en notant I le sous-ensemble (éventuellement vide) des indices 1 ~ i ~ n tels que 11i = 1 , on
a A= B = {e,, i E I}.
◊ L'application 'Ji est surjective. En effet, si X = (h, ... , inl E {O, l}n, notons I l'ensemble des
indices 1 ~ i ~ n tels que j, = 1. On a clairement 'Jl({eh, i E I}) = X.
◊ L'application 'Ji est donc une bijection, puisque {O, l}n est fini de cardinal 2n, g'J(E) est fini
de cardinal 2n. ■
189

IV. ARRANGEM ENTS ET COMBINAIS ONS


5
IV .1. Arrangemen ts et listes Ë
Définition 8.29. Soient k et n deux entiers naturels. On appelle arrangement de k éléments ~
g
parmi n toute application injective de Nk dans Nn. ,(1)
Ci
Puisque que la donnée d'une application injective de Nk dans un ensemble E revient à 00
..d
choisir k éléments de E avec ordre, un arrangement de k éléments parmi n peut être défini ü
comme un k-uplet d'éléments de E sans répétition.
Définition 8.30. On appelle k-liste d'éléments de E tout k-uplet d'éléments de E sans
répétition.
La proposition suivante rapelle le résultat bien connu sur le dénombrement des k-listes.
&i>pÜ$ittblr ~3l:
0 ~Mm~·/J'aira ngemmtsde k élhn'ênftf ~ i , ,i ~fit'•.

A~ i=() si k> n, · At= (n ~\.}! = n{n .i..1 }: .. {n~k +l) · si k ~ n.

PREUVE. Discutons en fonction des valeurs de k.


o Si k > n, il n'y a aucun arrangement de k éléments parmi n d'après le lemme 8.4.
o Supposons que k ~ n. Dans ce cas Nk C Nn. Notons dk,n l'ensemble des injections de Nk
dans Nn. Soit '!1 l'application définie par
'!1 : 6r,n --t dk,n, f H '!1( f) = flr,k •
'!1 est bien définie car toute restriction d'une application injective est injective. L'application '!1
est surjective : toute injection i de Nk dans Nn peut être complétée en une bijection de Nn, il
suffit pour cela de choisir une bijection de Nn \Nk sur Nn \ i(Nk), ce qui est possible puisque les
deux ensembles ont le même cardinal n - k. Grâce à ce raisonnement, on peut même affirmer
que, pour tout i E d;, la fibre '!1- ({i}) a le même cardinal que 86'(Nn \ Nµ, Nn \ i(Nk)),
1

c'est-à-dire l6Nn \Nkl = (n - k)!. Ainsi, d'après le lemme des bergers,

l6r,kl = .L. 1
1'!1- ({i})I = .L. (n - k)! = (n - k)!ldk,nl,
iEdk,n iEdk,n

Remarque. À la manière du calcul de l6nl, au-delà de la démonstration rigoureuse à l'aide


d'une bijection détaillée ci-dessus, on retiendra le raisonnement suivant. Pour construire une
application injective de Nk dans Nn, on commence par choisir l'image de 1 parmi n valeurs :
on dénombre n choix possibles. Puis on choisit l'image de 2 parmi n - 1 valeurs : il y a n - 1
choix possibles. Ainsi de suite jusqu'au choix de l'image de k parmi n - k + 1 éléments : on
en dénombre n - k + 1. Ainsi, A~ = n( n - 1) ... (n - k + 1) = (n'.:':~l!.

EXEMPLE 8.32. Calculons le nombre d'injections f de N 10 dans N 12 vérifiant la propriété


«net f(n) ont la même parité».
► L'ensemble étudié est en bijection avec l'ensemble produit Eµ x Ei où Ei est l'ensemble des
injections de {2, 4, 6, 8, 1O} dans {2, 4, 6, 8, 10, 12} et Ei l'ensemble des injections de {1, 3, 5, 7, 9}
2
dans {l, 3, 5,7, 9, 11}. Son cardinal vaut donc (A~)2 = 6! .
190

Test 8.7. l'ensemble suivant


Calculer le nombre d'injections de l'ensemble
des jours de la semaine S = {1, 2, 4, 5, 6, 7} dans

IV. 2. Combinaiso ns
Nombre de combinaisons de k éléments parmi n.
Définition 8.33. Soient n et k deux entiers naturels. On appelle combinaison de k objets
parmi n toute partie à k éléments d'un ensemble de n objets.

Proposition 8~34. Le nombre de comlJi:naisom;_ de l1 objets parmi n vaut

PREUVE. Plaçons-nous dans le cas où p ~ n. Notons 9-'p(E) l'ensemble des parties de E à p


éléments et 2"p,n l'ensemble des p-listes d'éléments de E. Soit ':l1 l'application définie par

':l1: 2"p,n--) 9-'p(E), l H ':l1(l) = l,


où l désigne la partie de E formée des composantes de la liste L L'application ':l1 est clairement
surjective et, pour toute partie F à p élément de E, la fibre '!1- 1 ({F}) contient pl éléments
correspondant aux pl permutations possibles des éléments de F. Ainsi, d'après le lemme des
bergers,
12"p,nl = .L. l'l1- 1 ({F})I = L pl= pll.9-'p(E)I,
FE.'J'p (El FE.'J'p (El

et comme 12"p,nl = Ap,n, on a 19-'p(E)I = p!(:;'~pl!. ■

EXEMPLE 8.35. Combien de droites du plan peut-on tracer à partir de 13 points trois à
trois non alignés ?
► Il y a autant de droites que de couples de points sans ordre parmi 13 points; ainsi, on
dénombre (7) = 13 ; 12 = 78 droites.

Proposition "8.36.{Formtlle du binôme). PôÜr·uJiA$ nêrnirrês romplties ·.q:· etb(tout


entiern,

PREUVE. En développant le produit (a+ b)n ={a+ b) ... (a+ b), on obtient des termes
du type akbn-k avec O ~ k ~ n, l'indice k correspondant au nombre de facteurs du produit
(a+ b) ... (a+ b) pour lesquelles on a choisi a. Puisqu'on dénombre(~) choix possibles de k
facteurs parmi n, on obtient


191

EXEMPLE 8.37. Simplifier, pour tout n dans N, la somme Sn='[; 2k-l3n-k+l (~).

► On a

Proposition sl38. {Propri~tés des coefficients du binôme).


'lJ S'ymêtnè déS ~oefficient$ : ~ft~l,VO~'lé~ n-l, {~ = (,,.~J:
1

2) Relation de Pascal ; 'IJt. ~· 1, Vô ~ k ~ n. - 1,. {n;1) +(~:;!} = (1c:1).

3-) Somme : imU:r tout n é N, i:. (i):.::: 2n: .·


k=O.,

PREUVE.
2
1) On a clairement (n::J = (n-k)!(,:'~(n-k))! = (n-~)!k! = (;).
2) La formule est banale pour n = O. Soit O ~ k ~ n - 1. Notons Ek l'ensemble des parties
de Nn à k + 1 éléments, Fk l'ensemble des parties à k + 1 éléments de Nn qui contiennent n et
F( l'ensemble des parties à k + 1 éléments de Nn qui ne contiennent pas n. Il est clair que Ek
est la réunion des deux ensembles disjoints Fk et F(. De plus, IFkl = (n~l) et IF(I = (;:;D car
Fk est en bijection avec l'ensemble des parties à k éléments de Nn-1 (sin~ 2, sinon 0) et F(
est en bijection avec l'ensemble des parties à k + 1 éléments de Nn-1 (sin~ 2, sinon 0).
3) Il suffit d'appliquer la formule du binôme,

Cette relation permet le calcul de proche en proche des coefficients binomiaux, la disposi-
tion correspondante des coefficients étant appelée triangle de Pascal.

2
3 3
4 6 4
5 10 10 5
(n~l) (n-1)
k+l
(k~l)

2
Voir la question test 8.8 pour une preuve plus belle.
192

Test 8.8. coefficients du binôme.


Soient n E N et E un ensemble à n éléments.
Test 8.9.
Pour tout O ~ k ~ n, on note d'k l'ensemble des
parties de E à k éléments. Établir que l'applica- Soit n E N. Quel est le plus grand des coeffi-
tion de 'l': d'k--, dn-k définie par 'l'(A) = Ac cients (~) ? On distinguera les cas n pair et n
est une bijection. En déduire la symétrie des impair en écrivant n = 2m ou n = 2m + 1.

IV.3. Récréations binomiales


Le lecteur se rapportera avec profit au chapitre sur les symboles I et TT avant d'aborder ce
paragraphe.

IV.3.1. Parcours dans le triangle de Pascal

Sommes des coefficients binomiaux d'indices pairs et impairs.


Notons Pn = L. G~) In= L. (2k: l).
o,;;zk,;;n
et
o,;;Zk+l,;;n
Comme

Pn+In=f (~)=(l+l)n=2n Pn -In= f (~) (-1 =(1 - 1) =0,


k=O
et
k=O
)k

on a Pn =In= 2n-l _
Sommes en colonnes.
Pour tous n et p dans N, on a f_ (n: k) =(n:: 11). Cette formule se prouve par
k=O
récurrence sur p EN. Elle est banale pour p = O. Si elle est vraie au rang p, on a

~ (n+k)
k=O n
=t (n+k)+(n+p+l)
n
k=O
=(n+p+l)+(n+p+l)
+1 nn
=(n+p+2)
n+1 n

d'après la relation de Pascal.

IV.3.2. La formule de Vandermonde

Démontrons de deux manières différentes la formule de Vandermonde,

Par un dénombrement.
Soient E 1 et E2 deux ensembles disjoints à n éléments. Dénombrons l'ensemble des parties à
n éléments de E = E 1 U Ez. Puisque IEI = 2n,
il y en a (~). Parmi elles, il y a les parties
k
qui contiennent exactement éléments de E 1 et
2
n-k
éléments de E2 où O:( k:( n:
on en
dénombre(~) x (n~J = (~) car (~) = (n~J- Ainsi,
193

Par la formule du binôme et les polynômes.


Notons, pour tout nombre réel x, P(x) = (1 + x) 2n. Calculons le coefficient de xn dans P(x)
de deux manières différentes. D'après la formule du binôme,
i
\/x E JR, P(x) = L2n (2; )xk, i
k=O •V
Cl
le cc.efficient recherché vaut donc (2,:'). De plus, pour tout réel x, CX)
..d
P(xHl +x)"(l +x)"~ (t (:)x•)' L
1,:;i,j,:;n
(n) (n) x'
i j
•+·
J
ü

= ~ (t (:) (k~i) )xk.

Le coefficient de xn dans P(x) vaut donc

d'où la formule.

IV.3.3. Calcul de la somme Sn= L.


o,:;3k,:;n
G~)
Notons Sn = L' n) et i· = e 2i7î/3. On a alors ,
( 3k
o,:;3k,:;n

(1 + l)n+ (1 +j)n+ (1 +j2)n = f. (~)(1


k=O
+l+j2k)

Or, si k est de la forme k = 3m, 1 + jk + j2k = 3 ; si k est de la forme 3m + 1, 1 +? + j 2k =


1 + j + j2 = 0 et si k est de la forme k = 3m + 2, 1 +? + j 2k = 1 + j2 + j = O. Ainsi
(1 + l)n + (1 + j)n + (1 + j2)n = 3Sn et donc, puisque 1 + j2 = 1 + j et 1 + j = -j2,
3Sn = 2n + 29îe[(l + j)n] = 2n+ 2(-l)n9îe[j 2n] = 2n + 2(-l)ncos(4nn/3).

Remarque. L'idée principale (à retenir !) est que les racines n-ièmes de l'unité (avec n ?:
2) permettent d'extraire d'une somme de monônes donnée la somme des monônes dont la
puissance divise l'entier n.

V. QUELQUES DÉNOMBREMENTS CLASSIQUES

V.1. Anagrammes et formule du multinôme


Proposition 8s39. Le nombre d'anagrammes d'un mot à n lettres comportant i1 fois ta
lettre A 1, ... , Îm fois ta lettre Am est
ni
194

PREUVE. Construisons un mot à n lettres comportant i1 fois la lettre A 1, ... , im fois la


lettre Am, Commençons par choisir les i 1 positions de la lettre A 1 : il y en a (~). Puis, les
i2 positions possibles de la lettre A2 : on en dénombre (n~i1 ). Et ainsi de suite jusqu'aux
(n-(i, +i~+im-il) positions possibles de la lettre Am. On dénombre donc au total
n!

1 EXEMPLE 8.40. On dénombre 3 ~i! = 1260 anagrammes du mot Mississippi.

Proposition 8.41. (Formuledumultinôme) Soiento1, ... ,ctmEC etnE'flf. AlOFs

PREUVE. Développons cette expression par distributivité. On dénombre n m termes de la


forme ae 1 ae, ... aen avec les rk dans {1, ... , m}. Après regroupement des puissances, l'expres-
sion est donc égale à la somme des termes du type ai'
x ... x a~ avec i 1 + ... + im = n. Or,
à (i1, ... , iml fixé tel que i1 + ... + im = n, on dénombre ~ t1 .... lm.
termes du développement
,
egaux a' a i11 x ... x am
im . ■

Cette formule généralise la formule du binôme. En effet, lorsque m = 2, on retrouve

EXEMPLE 8.42. Déterminons le coefficient de a 2bc dans le développement de (a+ b + c) 4 .


1 ► D'après la formule du multinôme, le coefficient vaut Z!~il! = 12.

V.2. Combinaisons avec répétitions


Le principe.
Il s'agit de déterminer le nombre de manières différentes de choisir k objets parmi n avec
d'éventuelles répétitions. Par exemple, il y a 10 combinaisons avec répétitions de 3 éléments
de l'ensemble {1, 2, 3} :

1, 2, 3 ; 1, 1, 2 ; 1, 1, 3 ; 1, 2, 2 ; 2, 2, 3 ; 1, 3, 3 ; 2, 3, 3 ; 1, 1, 1 ; 2, 2, 2 ; 3, 3, 3.

Contrairement aux combinaisons, le dénombrement à l'aide des parties de l'ensemble formé par
les n objets n'est plus possible puisqu'un ensemble n'admet aucun doublon. Ainsi {1, 1, 2} =
{1, 2}. Il nous faut donc modéliser mathématiquement le choix de k éléments avec répétitions
dans un ensemble E = {e1, ... , en} à n éléments. Soit un tel choix. Notons Xi le nombre de
fois que l'élément ei a été choisi. On a alors X1 + ... + Xn = k. Réciproquement, à tout
195

n-uplet (x 1, ... , Xn) E Nn vérifiant x1 + ... + Xn = k, on associe un unique choix de k élé-


ments parmi e 1, ... , en défini par : e;, est choisi X;, fois. Il s'agit donc de dénombrer l'ensemble
E~ = {(X1, ... , Xn) E Nn : X1 + ... + Xn = k }.

Dénombrement de E~.
On peut représenter un n-uplet de E~ = { (x1, ... , Xn) E Nn : X1 + ... + Xn = k} à l'aide
de bâtons et de boules. On place et matérialise à l'aide de bâtons I n boîtes qui contiennent
chacune des boules•· Dans la première boîte, on place X1 boules, dans la deuxième X2 boules,
et ainsi de suite jusqu'à la dernière boîte où l'on place Xn boules. Par exemple, l'élément
(2, 1, 0, 3, 1) de E~ est représenté par la figure suivante

I • • I • 1 1 • • • I • 1-

L'ensemble E~ est en bijection avec l'ensemble des figures ainsi obtenues. Or, construire une
telle figure revient à placer n - 1 bâtons I et k boules • entre les deux bâtons I extrêmes, ce
qui revient à choisir la position des k boules parmi n + k- 1 emplacements possibles, d'où

EXEMPLE 8.43. Dénombrer l'ensemble des dominos de taille 2 x 1.


► Il s'agit de calculer le nombre de combinaisons avec répétitions de 2 chiffres parmi les 7
suivants : 0, 1, 2, 3, 4, 5 et 6. Il y a donc (7+;-1) = @ = 28.

V.3. Un peu de physique statistique


Le système Y' étudié est un gaz composé de n molécules. Chaque molécule peut se trouver
dans p niveaux d'énergie différents. On appelle micro-état du système Y' la donnée d'une
fonction
f: Nn----+ Np
qui associe son niveau énergie à chaque particule. Une statistique de Y' est la donnée d'une
partie Q C .9(N:n) \ {0} dont les éléments sont appelés macro-états du système Y' et sont
deux à deux disjoints, c'est-à-dire n'ont pas deux à deux deux de micro-états en commun.

Statistique de Maxwell-Boltzmann.
On considère que toutes les molécules sont discernables deux à deux, et qu'ainsi un macro-état
est composé d'un seul micro-état. Tous les microétats sont possibles, c'est-à-dire que l'on a
Q = {{f} f E N:n }. Ainsi
1

Statistique de Bose-Einstein.
Les molécules sont indiscernables et on regroupe dans le même macro-état des fonctions f et
g telles que, pour tout nombre k dans Nn,

c'est-à-dire que l'on ne distingue pas deux systèmes ayant les mêmes nombres de molécules
au niveau d'énergie k, pour tout k dans Np. Tous les micro-états sont possibles, c'est-à-
dire que Q est une partition de N:n. Pour dénombrer 0, il faut donc calculer toutes les
196

manières différentes de remplir p niveaux d'énergie avec n particules; il s'agit par conséquent
de combinaison avec répétitions, d'où

Statistique de Fermi-Dirac.
Dans ce cas les particules sont indiscernables, chaque niveau d'énergie étant occupé par au
plus une molécule. Les micro-états sont donc les injections de Nn dans Np et l'on regroupe en
un seul macro-état des injections ayant la même image. Dénombrer Q revient alors à calculer
le nombre de parties à n éléments parmi p. Ainsi
......
......

V.4. Obtention d'une formule de récurrence


Soit n ? 1. On dispose d'un damier Dn de taille 2 x n et de n dominos de taille 2 x 1. On
se propose de calculer le nombre de pavages possibles de Dn par les n dominos. Notons En
l'ensemble des pavages du damier Dn,

FIGURE 8.2. Exemples de pavages du damier DG

Notons Un ce nombre. Il est clair que u 1 = 1 et U2 = 2. Soit alors n? 3. L'ensemble En


est la réunion disjointe de l'ensemble E1 des pavages du damier se terminant par la figure 1
et de l'ensemble E2 des pavages du damier se terminant par la figure Ill. L'ensemble E est en
1
bijection avec En-1 et E2 avec En-2· On a donc

On peut démontrer par de l'algèbre linéaire que cette relation de récurrence et les condi-
tions initiales u 1 = 1, u 2 = 2 impliquent que

\in EN* = Js+3(1 +Js)n-1 + Js-3(1-Js)n-1


' Un 2)5 2 2Js 2

VI. ENSEMBLES INFINIS

VI.1. Cardinaux infinis


La notion d'ensemble infini n'est pas immédiate. On dit que deux ensembles A et B ont
le même cardinal lorsque A ~ B. Cette définition, dont les conséquences (définitions d'un
ensemble fini, du cardinal d'un tel ensemble, etc.) ont déjà été étudiées dans les paragraphes
précédents, reste valable dans un cadre plus général. Il faudra cependant prendre garde à ce
que la notion générale de cardinal ne suit pas les mêmes règles que les cardinaux finis. Par
197

exemple, 2N est un sous-ensemble strictement contenu dans N, pourtant Net 2N ont le même
cardinal : l'application f: N---, 2N, f(n) = 2n est clairement une bijection de N dans 2N. De
même, [0, 1] est strictement contenu dans [0, 2] mais l'application g : [0, 1] ---, [0, 2], g(t) = 2t
est une bijection de [0, 1] dans [0,2].

VI.2. Dénombrabilité
Définition 8.44.
1) Un ensemble A est dit dénombrable lorsque A~ N.
2) Un ensemble est dit au plus dénombrable lorsque A est fini ou dénombrable.
Autrement dit, un ensemble A est infini dénombrable si et seulement si on peut dénombrer
ses éléments en comptant 0, 1, 2, ... C'est-à-dire, si on peut écrire les éléments sous la forme
d'une suite injective qui n'oublie aucun élément
A= {ao, a1, a2, ... }.
Nous admettrons que tout sous-ensemble d'un ensemble dénombrable est au plus dénom-
brable ou, de manière équivalente, que tout ensemble qui contient un sous-ensemble non
dénombrable est non dénombrable.
EXEMPLE 8.45.
o L'ensemble Z des entiers 0, 1, -1, 2, -2, ... est dénombrable. En effet tout le monde com-
prend les « trois petits points» que nous venons d'écrire. Il est superflu d'expliciter davantage,
mais si on insiste :

sin est pair


sin est impair

o L'ensemble lR des nombres réels est non dénombrable.


Nous allons utiliser une preuve conçue par Cantor. Supposons par l'absurde que lR est dénom-
brable. Alors l'intervalle [0, 1[, un sous-ensemble de .IR, est également dénombrable : [0, 1[=
{ao, a1, a2, ... }.
Tout réel possède une écriture décimale. On peut donc écrire une liste de tous les éléments
de [O, 1 [, dans leurs écritures décimales

no= 0, Uoo Uo1 ao2 .. .


a1 =0,a10U11 a12 .. .
Uz = 0, a20 Uz1 a22 .. .

où les au, (k, €) E N2 , sont des chiffres entre O et 9. On définit pour tout chiffre a

si a =/- 1,
si a= 1.

Dans la liste, on considère maintenant la suite des chiffres diagonaux akk· Si dans cette suite
on remplace chaque chiffre akk par akk, on obtient le nombre décimal
198

b étant un nombre réel dans [O, 1 [, il doit figurer dans la liste, c'est-à-dire b = ak pour un
certain k E N. Cela est une contradiction : le k-ième chiffre après la virgule de ak est akk,
mais le k-ième chiffre après la virgule de b est akk, et akk -=p akk·

Remarque. Le raisonnement précédent est valable car le développement décimal de b est


unique, ce que nous établirons dans le chapitre 23.

Prôposition·8.46. Une uniôn Jénombrable iJfêMernblêSàênoinlinîblès est âlnombrable..


- PREUVE. Soit J un ensemble d'indices dénombrable et soit {AiliEJ une famille d'ensembles
dénombrables. Pour pouvoir prendre l'union UiEJ Ai nous supposons que tous les Ai sont des
sous-ensembles d'un même ensemble.
Nous dénombrons J = Oo, j1, h, ... } et Ai = {aio, ail, ail, ... }, où les « ... » peuvent s'arrêter
si l'ensemble est fini. On écrit tous les éléménts des Ai dans une matrice infinie

aioo aio 1 aio2 ...


Ui,O Ui, 1 Ui,2 •..
Ujzo Ujz 1 Uiz2 • · ·

qu'on dénombre selon le schéma suivant


....
. .
..

. ...
. .
..

... .

Si on arrive à un élément qu'on a déjà compté, on passe au suivant, de même si on arrive


à un emplacement vide (ça peut se passer si Jou Ai sont finis). Si le processus s'arrête l'union
est finie ; sinon elle est infinie dénombrable. ■

EXEMPLE 8.47. L'ensemble !QI des rationnels est dénombrable.


► En effet, il est l'union

Ce résultat devrait vous susprendre, vu que lR est non dénombrable et que tout nombre
réel peut être approché arbitrairement par une suite de rationnels !

Proposition 8.48. · Un produ.it fini dte'll$.embles iléntYinJ>rables estden()mlJrable.


199

PREUVE. Considérons d'abord le cas de deux ensembles. Soient A= {ao,a 1,a2, ... } et
B = {b 0 , b 1, b2, ... } dénombrables.
On écrit tous les éléments du produit A x B

( ao, bol ( ao, bi} ( ao, b2l .. .


(a1,bol (a1,b1l (a1,b2l .. .
(a2, bol (a2, b1 l (a2, b2l ...

En dénombrant comme dans la preuve de la proposition 8.46 on voit que A x B est


dénombrable.
Par définition A x B x C = (A x Bl x C, donc le cas général suit par récurrence sur le nombre
de facteurs. ■

EXEMPLE 8.49.
o Pour tout naturel n l'ensemble Qn est dénombrable.
o Le sous-ensemble Q(NI de QN constitué des suites quasi nulles (tous termes nuls à partir
d'un certain rang) est dénombrable.
Pour preuve, considérons pour n E N l'injection suivante

Alors
Q(N) = LJ ln(Qnl
nEN
et on conclut avec la proposition 8.46.
o QN est non dénombrable.
En effet, pour tout nombre réel a il existe une suite dans QN qui converge vers a. Deux suites
qui convergent vers deux réels distincts sont forcément distinctes. Donc dans QN il y a au
moins autant d'éléments 3 que dans R Or, on sait que lR est non dénombrable.

Test 8.10. Test 8.11.

On dénombre Q+ = UnEN' { ~ 1 m E N} par Quelle remarque faites-vous à un étudiant qui


la méthode de la preuve de la proposition 8.46. écrit l'ensemble infini des nombres complexes
Quels sont les premiers 10 rationnels dénom- comme C = {z1,z2,z3, ... } ?
brés?

3
Ce résultat n'est pas fondé dans l'état de nos connaissances. Il se démontre à l'aide du théorème de Cantor-
Bernstein.
200

VII. EXERCICES
rJJ

1 8.5.
8.1.

Justifier que, sur toute planète de l'univers Démontrer l'égalité suivante


'g
..8 contenant plus de deux pays, il existe toujours
rJJ deux pays ayant le même nombre de voisins.

J 8.2.

Soit E un ensemble fini de cardinal n E N. 8.6.


Dénombrer les ensembles suivants
Soit (unlnEN une suite de nombres rationnels.
Existe-t-il une bijection (j) : N -) N telle que
1. .0"i={(A,B)E[9J(EJ21AcB}.
(ucp(nJln;;,o soit croissante?
2. dz={(A,B)E[9J(EJ2IAUB=E}.
8.7.

L'ensemble des suites rationnelles stationnaires


8.3. est-il dénombrable?

Dénombrer les surjections d'un ensemble à n+ 1 8.8.


éléments sur un ensemble à n éléments.
On appelle point fixe d'une permutation a de
8.4. Nn tout élément ide Nn tel que a(i) = i. Pour
tout k ::;; n, on note également hn,k le nombre
Calculer les sommes suivantes de permutations de Nn admettant exactement
k points fixes et on pose hn = hn,o.
1. Justifier que ¾,k = œ)¾-k•
2. En déduire que
Chapitre 9
LA STRUCTURE DE GROUPE

ES premières traces de la théorie des groupes remontent aux travaux de 1832 d'Évariste

L Galois qui ne furent publiés qu'après sa mort, en 1846. Lors de son étude des équations
algébriques, le jeune mathématicien s'intéressa particulièrement aux permutations de
l'ensemble des racines d'un polynôme. Il mis en évidence de nombreuses propriétés de ce qui
est de nos jours appelé le groupe symétrique à n éléments et noté 6n.

Vers la même époque, Augustin Cauchy s'intéressa égale-


ment à cette structure. L'ensemble de la communauté scien-
tifique pris conscience de l'importance de la notion de groupe
au travers des nombreuses applications à la géométrie mises
en évidence au cours du XIXe siècle. Dans la seconde moitié
du XIXe siècle et jusqu'au début du XXe siècle, la notion de
groupe actuelle vit le jour après les mises au points succes-
sives de mathématiciens comme Cayley, Weber, Frobenius ou
encore Burnside. Les groupes ont permis de donner un sens
plus précis à la notion de symétrie (un carré possède plus de
symétries qu'un losange : le groupe des isométries d'un carré
possède plus d'éléments que celui d'un losange). Cette théorie Évariste Galois
suscite encore de nos jours de nombreux travaux. Ajoutons en-
fin que la théorie des groupes possède de nombreux champs d'application : la cristallographie
en chimie, la physique des particules, la géométrie différentielle et la théorie de la relativité,
la physique quantique, etc.

1. DÉFINITION DES GROUPES


Définition 9.1. On appelle groupe tout ensemble (G, *) muni d'une loi de composition
interne vérifiant les trois propriétés suivantes :
1) la loi * est associative;
2) ( G, *) possède un élément neutre e ;
3) tout élément de G est inversible pour la loi*·

Autrement dit, un groupe est un monoïde ( G, *) dont tous les éléments sont inversibles.
On dit parfois que * est une loi de groupe sur G pour signifier que ( G, *) est un groupe.

On peut tirer plusieurs conséquences de cette définition : l'élément neutre est unique
et chaque élément g admet un unique inverse noté g- 1 . Puisque l'inversiblité implique la
régularité, tous les éléments d'un groupe (G,*) sont réguliers pour la loi*·
202

Régularité
rJJ

1
'2
..8
Tous éléments d'un groupe ( G, *) sont réguliers à droite et à gauche, c'est-à-dire, pour
tous éléments x, 1J et g de G

rJJ

J Nous renvoyons le lecteur au chapitre 7 pour les justifications correspondantes.

EXEMPLE 9.2. Voici quelques exemples de groupes rencontrés au cours des chapitres pré-
cédents. Le lecteur est renvoyé au chapitre 7 pour les justifications correspondantes.
► (Z, +) et (<Ql, +), où + est l'addition usuelle des nombres rationnels.
(
► <Ql*, x), où x la multiplication usuelle des rationnels.
(
► C*, x), où x la multiplication usuelle des nombres complexes.
► (6(E),o), où E est un ensemble et 6E l'ensemble de ses permutations.
► (g'l(E),~), où E est un ensemble quelconque, g'J(E) l'ensemble de ses parties et ~ la
différence symétrique définie par \f(A, B) E g'l(E), A~B =(AU B)/(A n B).

Définition 9.3. On dit qu'un groupe (G, *) est commutatif, ou abélien, lorsque la loi * est
commutative sur G. On dit que dew.: éléments x et 1J d'un groupe (G, *) commutent lorsque
X *Y= 1J *X.

On peut également définir un groupe au plus dénombrable par une table de Cayley 1 .On
prendra garde à ce qu'une loi interne quelconque (donc une table de Cayley quelconque) ne
définisse pas en général une loi de groupe. Par exemple, la table suivante

* a b c
a a b c
b c a b
c b c a

ne définit pas une loi de groupe sur l'ensemble E = {a, b, c} car la loi de composition* associée
n'admet aucun élément neutre.

Test 9.1. versible d'inverse 11 ? Si (E, *) est un groupe,


(Z*, x), où x est la multiplication usuelle des peut-on en déduire que x- 1 = 11 ?
entiers, est-il un groupe ? Test 9.4.
Les tables de Cayley suivantes définissent-elles
Test 9.2.
des lois de groupes ?
Comment lit-on immédiatement sur sa table de a b c a b c d
Cayley qu'un groupe est abélien ? a a a a a a b C d
1. b a b b 3. b b a d C
C a b C C d C b a
Test 9.3. d C d a b
a b C

Dans un monoïde (E, *) de neutre noté e, on a b C a


2. b a b
a x * 11 = e. Peut-on en déduire que x est in-
C
C a b C

1
Voir page 157
203

On peut facilement construire de nouveaux groupes à partir de deux groupes (G 1, *) et


{G2,o) par produit direct des lois de composition* et◊.

Proposition 9.4. (Groupe ptoduitJ Siirient (G1 ;*let fGt, o} dètJ:i; {trouipl],$; L'ensemble
G1 x G2 mtmi de là loi de composition ® suivante ·

'iCX1t1C.2} ® (Vh:Y2Ji=: {x1 *"21 Yt()_Yz)

est un groupe appelé groupe produit des (G1, *} et.fG2,<>}~ .··


oi
PREUVE. Notons ei le neutre de Gi pour i E {1, 2}. Il est clair que e = (e1, e2) est un .d
élément neutre pour la loi® et que, pour tout (x 1,x2) E G1 x G2, (x1,X2) est inversible u
d'inverse (x11,x21). Il reste à justifier l'associativité de®· Soient (x1,x2),(Y1,Y2) et (z1,z2)
dans G1 x G2. On a alors

(x1, x2) ® [(y1, Y2) ® (z1, z2)l = (x1, x2) ® (Y1 * z1, Y2 o z2) = (x1 * (Y1 * z1), X2 ◊(Yi◊ z2))
= ((x1 *Yi)* z1, (x2 oy2) o z2) = (x1 *Yi, X2 oy2) ® (z1, z2)
= [(x1, x2) ® (Y1, Y2)l ® (z1,z2)
d'où le résultat. ■

On généralise cette construction à n EN* groupes (Gk, ®k), où 1 ~ k ~ n, en posant

sur l'ensemble produit G 1 x ... x Gn. Lorsque tous les groupes Gi sont égaux à un même
groupe G, on note plus simplement Gn le groupe produit obtenu.

EXEMPLE 9.5. Déterminons la table de Cayley du groupe produit (Ui, 0) où U2 = {-1, 1}


est le groupe multiplicatif des racines carrées de l'unité dans IC.
► Il suffit d'un peu de patience et de quelques calculs.

® ( 1, 1) (1,-1) (-1, 1) (-1,-1)


(1, 1) ( 1, 1) (1, -1) (-1, 1) (-1,-1)
(1,-1) (1, -1) (1, 1) (-1,-1) (-1, 1)
(-1, 1) (-1, 1) (-1,-1) ( 1, 1) (1,-1)
(-1,-1) (-1,-1) (-1, 1) (1, -1) ( 1, 1)

L'associativité de la loi* permet de définir les puissances d'un élément g par gn = e pour
n = 0 et Vn), 1, gn = g * gn- 1, puis gn = (g- 1)-n pour tout n < 0 (voir le chapitre sur les
structures algébriques).

PropÔ$itlt>n 9lâ Soit{G.i}·im·~pe.


l) 'Pè>Uf Ùl,Ufi;X etf{/(!ii$ GrJXr* 11J-rl~:y71 *,c1 ,
2)· Pm,,rtous.~•.~i·g ilàrii(S,:1,J ~tti>üfndtm$Z, {«~f*g*O:}n::::;0~1 grt:*O.~ *
3) Po~r toùt (n,m} Ë: zi et tout g ÊG} g~·hn:~ gn*g"\ .
4) Si deux éléments g et g' du groupe (G,*) commutent, alors, pour tout entier relatif n,
(g * g'Jn = gn*gtu.
.
204

PREUVE. On note e le neutre de ( G, *).


rn
Cl) 1) La propriété est immédiate car, par associativité de la loi*
âl
...,
i:::
Cl) (y-1 *X-1) * (x*y) = Y-1 * (x-1 *X) *Y =y-1 * C*Y = Y-1 *Y= e

'O
i::: et de même (X*Y) * (y-1 *X-1) = e.
.8 2) Soient a et g dans G. Prouvons par récurrence sur n EN la propriété HR(n)
rn
~ (a- 1*g*a)n = a-1*9n*a. La propriété HR(0) est banale car, par convention, \/x E G, x 0 = e.
B
t.> Soit n EN. Supposons HR(n) vérifiée. On a alors
È
(/) (a-1 * g * a)n+t = (a-1 * g *a)* (a-1 * g * a)n = (a-1 * g *a)* (a-1 * 9n* a).
::i
Cl)
Puis, par associativité de *,
i (a-1 * g * a)n+t = a-1 * g(*a* a-1) * 9n* a= a-1 * gn+l * a.

Pour n < 0, on a, par définition, (a-1 * g * a)n = ((a- 1 * g * a)- 1)-n, or, d'après la première
propriété, l'inverse de a-1*g*a vaut a- 1*9*U. La formule découle alors de l'étude précédente.
3) La propriété se démontre facilement par récurrence sur n en appliquant la propriété 1).
4) Idem. ■

Définition 9.7. Lorsqu'un groupe (G,*) est fini, IGI est appelé l'ordre de G.

Par exemple, le groupe des racines n-ièmes de l'unité lUn est un groupe d'ordre n, pour
tout entier naturel n non nul.

Test 9.5. Test 9.6.


Soient 9 et 9' appartenant à un groupe (G,*) Soient (G,*) un groupe et 91, 92, ... , 9n dans
et qui commutent. Montrer que 9-1 et 9' com- G. Exprimer l'inverse de 91 * ... * 9n à l'aide
mutent puis que 9-1 et 9 1- 1 également. des inverses 9t1.

1. 1. Translations d'un groupe


Définition 9.8. Soient ( G, *) un groupe et a E G. On note la et Ra les applications de G
dans G définies respectivement par

\/gEG, la(g)=a*g et Ra(g)=g*a.

la est appelée translation à gauche par a et Ra translation à droite par a.


Les translations à gauche et à droite sont des bijections de G dans G : il est clair que les
applications la et Ra admettent respectivement la-1 et Ra-1 pour bijections réciproques.
On déduit de la bijectivité de la et Ra que la table de Cayley d'un groupe vérifie la
propriété suivante : chaque élément du groupe ne figure qu'une seule fois dans chacune des
lignes et des colonnes 2 . La réciproque est fausse comme le prouve la table suivante

2
C'est ce qu'on appelle un carré latin.
205

* a b c
a a b c
b c a b
c b c a

qui est un carré latin mais dont nous avons déjà montré qu'elle ne définit pas une loi de groupe
sur {u, b, c} (voir page 202).

II. Sous-GROUPES

IL 1. Définition et caractérisations
Un sous-groupe d'un groupe ( G, *) est une partie H de G qui, munie de la loi induite par celle
de G, est un groupe. Par exemple, les sous-ensembles {e} et G d'un groupe (G,*) (de neutre
e) sont des sous-groupes. Il s'agit en quelque sorte des sous-groupes extrêmes 3 de (G,*), on
les appelle les sous-groupes triviaux de (G, *). Notons que cette définition des sous-groupes
impose en premier lieu que H soit stable par *, c'est-à-dire que pour tous x et y dans H,
x * y E H, pour que * restreinte à H soit une loi interne. Dans la suite, on convient de noter
par le même symbole la loi de G et la loi induite sur une partie de G.

Définition 9.9. Soient ( G, *) un groupe et H C G. On dit que H est un sous-groupe de G


lorsque H est stable par* et que (H, *) est un groupe.

Continuons notre raisonnement. Un sous-groupe (H, *) est en particulier un monoïde


l'associativité de la loi * sur H découlant de l'associativité de * sur G, cette propriété se
résume à l'existence d'un élément neutre eH, qui pourrait être distinct a priori du neutre eG
de G. Mais on a en fait égalité, comme le montre le lemme suivant.

Lênune 9.l~.. Stiit l-t un}oîtS-~upe de {G,*), Alors eH =eG et les inverses d'un élément
dé h dâns les groùpes (H, *) et (G, *) coïncident.

PREUVE. On a eH = eH * eG car eG est le neutre de ( G, * ), or eH = eH * eH d'où eH * eG =


*
eH eH; par régularité de eH, on aboutit à eG = eH. On en déduit encore par régularité de
* que l'inverse d'un élément h de H dans le groupe (H,*) coïncide avec l'inverse de h dans
(G,~. ■

On retiendra les caractérisations suivantes des sous-groupes d'un groupe (G, *) donné.

Prdpœiti<Jn '9;11, {Câractêrisatlons des so1.1&-groupes). Soient (G, *) ûn groupe et un


sous-ensemble H C: G. Alors l-t est un sous-groupe de (G, *} si .et seulement si les conditions
f,quivalentes suiva;1tes sont vérifiées : .· . ... ....
1) H ·10, H est àtal>le par;, efpar passage dl'inverse;
2)H f,. 0 ~t'v'(x,y}E H1,x""1 *1JE H;

3
Respectivement le plus grand et le plus petit sous-groupes de ( G, *) au sens de l'inclusion.
206

PREUVE. Notons e le neutre de G. Commençons par prouver que les deux conditions sont
équivalentes.
1) =} 2). Soient x et y dans H. Puisque H est stable par passage à l'inverse, x- 1 E H et comme
H est stable par*, x- 1 *Y EH.
2) =} 1). Comme H =/=- 0, H contient au moins un élément u et donc e = u- 1 *U EH. Soient
alors x et y dans H. On a x- 1 = x- 1 * e E H donc H est stable par passage à l'inverse. De
plus, X*Y = (x- 1 )- 1 *Y EH car y et x- 1 appartiennent à H : H est stable par*·
D'après le lemme 9.10, ces deux conditions sont nécessaires pour que (H,*) soit un groupe.
Réciproquement, lorsque la propriété 1) est vérifiée, il existe ho E H. Comme h 01 E H et que
H est stable par la loi*, on a eG = ho* h 01 EH. L'ensemble (H, *lest donc un monoïde dont
tous les éléments sont inversibles : il s'agit d'un groupe. ■

On retiendra la méthode suivante de caractérisation des sous-groupes d'un groupe donné .

..\Ihhoclc Prouver que H est un sous-groupe de G


Une partie H d'un groupe donné ( G, *) est un sous-groupe de ( G, *) si et seulement si

H=/=-0 et \i(x,y)EH 2 ,x-1 *yEH.

EXEMPLE 9.12.
► 1IJ = {z E C : lzl = l} est un sous-groupe de (C*, x). En effet, 1IJ CC*, 1IJ =/=- 0 car 1 E 1IJ
et, pour tous z et z' dans 1IJ, on a lz'z- 1 I = lz'l/lzl = 1/1 = 1 donc z'z- 1 E 1IJ.
► Pour tout entier naturel n non nul, l'ensemble 1Un des racines n-ièmes de l'unité est un
sous-groupe de (1IJ, x ). En effet, 1Un C 1IJ (toute racine n-ième de l'unité est de module 1),
1Un =/=- 0 car 1 E 1Un et, pour tous z et z' dans 1Un, on a (z'z- 1 )n = z'n/zn = 1/1 = 1 donc
z'z- 1 E 1Un.
► Plus subtil : l'ensemble r = UnEN· Un de toutes les racines de l'unité est un sous-groupe
de (1IJ, x). En effet, r c 1IJ, r =/=- 0 car 1 Er. Soient z et z' dans r. Il existe alors net m dans
N* tels que zn = 1 et z'm = 1. En particulier, (z'z- 1 )mn = z'mnz-mn = (z'm)n(zn)-m = 1
donc z'z- 1 E 1Umn Cf.

Proposition 9;13. Soit {G, *)· un groupe. Toute intersection dé stJus-groupes.de (G,*}·est
un sous-groupe de {G, *).

PREUVE. Soit (HïliEI une famille de sous-groupes de (G, *). Posons K = niEI Hi. L'ensemble
K est non vide car il contient le neutre e de ( G, *) : en effet, pour tout i dans I, Hi est un
sous-groupe de ( G, *) donc contient le neutre e. Soient x et y dans K. Pour tout i dans I, x
et y appartiennent au sous-groupe Hi donc x- 1 * y E Hi d'où x- 1 * y E K. L'ensemble K est
donc un sous-groupe de ( G, *). ■

En revanche, les réunions de sous-groupes ne sont pas toujours des sous-groupes.

EXEMPLE 9.14. Soient H et K deux sous-groupes de (G,*). Alors HUK est un sous-groupe
de ( G, *) si et seulement si H C K ou K c H.
► Il est clair que les inclusions H C K et K C H entraînent chacune que H U K est un
sous-groupe de ( G, *). Prouvons la réciproque par contraposition. Supposons que H (/_ K et
207

K <t- H, c'est-à-dire qu'il existe h EH n Kc et k E K n He. L'élément h* k n'appartient pas à


HUK. En effet, si h*k EH, il existerait h' dans H tel que h*k = h' et donc k = h- 1 *h EH,
ce qui est absurde. On prouve de même que h * k 9'. K. Ainsi, h E H U K, k E H U K, mais
h * k 9'. HU K : HU K n'est pas stable par * et n'est donc pas un sous-groupe de ( G, * ).

Terminons ce paragraphe en remarquant que le dernier sous-groupe de l'exemple 9.12, r,


est la réunion de sous-groupes 1Un pour n dans N*. r est tout de même un sous-groupe de
(C*, x) car cette réunion est filtrante, c'est-à-dire que, \i(n, m) E (N*) 2 , il existe4 p E N* tel
que 1Un U 1Um C 1Up.
cri
Test 9.7. Test 9.8.
Le complémentaire d'un sous-groupe d'un
ë5
Soit (HnlnEN une suite de sous-groupes d'un
groupe ( G, *) est-il un sous-groupe ? La dif- groupe (G,*) telle que lin E N, Hn C Hn+l·
férence symétrique de deux sous-groupes Établir que UnEN Hn est un sous-groupe de
d'un groupe ( G, *) est-elle un sous-groupe de (G,*l-
(G,*)?

II.2. Sous-groupe engendré par une partie


Proposition 9.15. Soient {G; *) un groupe et S c G. n existe un plus petit· sous-groupe
(au sens de l'incl'itSionf de {G·,*) contenant S·: il s'agit de l'intersection des sous-!J'f'(Yll,pes de
(G, *}. contenant S.

PREUVE. Notons Y l'ensemble des sous-groupes de (G, *) contenant S. Y est non vide car il
contient G. Posons alors H = nxEY X. Comme, pour tout X dans Y, S c X, on a S c H. De
plus, en tant qu'intersection de sous-groupes, H est un sous-groupe de (G,*). Il s'agit bien du
plus petit au sens de l'inclusion, car si K est un sous-groupe quelconque de (G,*) contenant
G' on a K E y et donc H = nXES" X C K. ■

Notation. Le sous-groupe engendré par S est noté (S). Dans le cas où S = {a}, on le note
de préférence (a).

Définition 9.16. On dit qu'un groupe ( G, *) est engendré par S C G lorsque G = (S).

Une telle partie S est alors appelée une partie génératrice de ( G, *). On dit aussi que S
engendre le groupe ( G, *).

EXEMPLE 9.17. Soit (G,*) un groupe de neutre e. Il est clair que (0) = {e} et (G) = G.
De même, (e) = {e}. En outre, si a E G vérifie a 2 = e, on a clairement (a) = {e, a}. Nous
généraliserons d'ailleurs cette égalité dans l'exemple 9.19.

Proposition u~Ht ·Sait S· unè partie non vide d'un groupe {G,*). On a

{S) = {xr* ... *Xnln EN* et \t'k E Nn., x1c ES ou xk1 ES}.

4
On a vu que l'entier p = mn convient.
208

PREUVE. Notons S' = { x, * ... * Xnl n E N* et Vk E Nn, Xk ES ou xk 1 ES}. Parce que


00 le groupe (S) est stable par * et le passage à l'inverse, et contient S', on a clairement par

l
récurrence sur n que x, * · · · * Xn E S' pour tous xk dans G tel que xk E S ou xk 1 E S.
Autrement dit, on a S' C (S). Il suffit d'établir que S'est un sous-groupe de (G,*) contenant
S pour montrer l'inclusion réciproque (S) C S'. Il est clair que S' contient S et donc que
S' -/- 0. Soient x et y dans S' : il existe n et m dans N* et x,, ... , Xn, y,. ... , Ym tels que
..s
00 pour tout i dans Nn et tout j dans Nm, Xi E S ou xi 1 E S, Yi E S ou y 11 E S et vérifiant
~ X= x, * ... *Xn et y= y,* ... *Ym· On a alors

1
- avec pour tout i dans Nn et tout j dans Nm, Xi ES ou xi 1 ES, y 11 ES ou Yi= (y 11 )- 1 ES
d'où X*Y_, ES'. ■

EXEMPLE 9.19. Ainsi, pour tout groupe (G,*) et tout élément g appartenant à G, on a
(g)= {gn, n E Z}. Appliquons cette formule au sous-groupe lU4 = {-1, 1, -i, i} de (C*, x ).
o On a clairement (1) = {1 }. Comme 1/ - 1 = -1, on a (-1) = {-1, 1}.
o Comme i 2 = -1, i 3 = -i, i 4 = 1, 1/i2 = -1 et 1/i 3 = i, on a (i) = {1, -1, i, -i} = 1U4 .
o De même, (-i )2 = -1, (-i)3 = i, (-i )4 = 1, 1/ (-i )2 = -1 et 1/ (-i )3 = -i, on a (-i) =
(i) = {l, -1, i, -i} = lU4.

Définition 9.20. Un groupe (G, *) est dit monogène s'il existe a E G tel que G = (a). Un
tel élément a de G est dit générateur de ( G, *). On dit aussi que a engendre g.

EXEMPLE 9.21. Voici une liste d'exemples et de contre-exemples de groupes monogènes.


► (Un, x} est monogène car (voir le paragraphe sur les équations algébriques du chapitre
??) Un= {e2ikn/nl k E Z} = (e2in/n).
► (Z, +} est monogène car Z = (1).
► (Z 2
+) n'est pas monogène. Soit (n, m) E Z 2 . Si m + n-/- 0, le sous-groupe ((n, m)) ne
,
contient pas le couple (-1, 1) de Z 2 . Sin+ m = 0, le sous-groupe ((n, m)) ne contient pas
(0, 1) . Dans tous les cas, on a donc ( (n, m)) /c Z 2 . Ce résultat se généralise sans peine à
(ZP, +), pour tout entier naturel p ? 2.

Test 9.9. Test 9.10.


Dans le groupe (&(El,~) où E = {O, l}, on note Le groupe (Z, +) est-il monogène ?
a= {O} et b = {l}. Déterminer les sous-groupes
suivants:
(ci) , (b) , ({a, b}) , (0) , ({0, a}) , (E).

II.3. Le théorème de Lagrange


Le résultat suivant est un théorème fondamental en théorie des groupes le cardinal d'un
sous-groupe H d'un groupe fini (G,*) divise le cardinal de G.
209

Tb~me,ft.2t {~ng~fSoie,:,,fè{G,'.i}~n grou,it finietJ-t ~ -,om•gnmpe de G. Alors


l'ordre âe H divûie l'ordre;de G.
PREUVE. Soit R la relation définie sur G par x R y si et seulement si x * y- 1 E H.
◊ R est une relation d'équivalence sur G. En effet, comme pour tout élément x de G, x * x- 1 =
e E H (car H est un sous-groupe de G), R est réflexive. De plus, comme H est stable par
passage à l'inverse, pour tous x et y dans G, (x*y- 1 EH)=} ((x*y- 1 )-1 = y *x-1 EH).
La relation R est donc symétrique. Soient x, y et z dans G tels que x R y et y R z. Comme
X*z- 1 = (x*y- 1 ) * (y *z-1 ) et H est stable par*, on a X*z-1 EH d'où xRz: Rest
transitive.
cri
◊ La classe de y est l'ensemble des x E G tels que x * y- 1 E H. Il s'agit donc de l'ensemble
{h * y Ih E H} que nous noterons plus simplement Hy. Il est clair que deux classes Hy et Hz a
sont équipotentes car R11 -,u: Hy ~ Hz est une bijection. En particulier, Hx et He= H sont
de même cardinal. L'équation aux classes s'écrit donc

IGI = L IXI = IG/RI X IHI.


XEG/R

Ainsi IHI divise IGI. ■

Remarque. Pour tout y dans G, le sous-ensemble Hy est appelé la classe à gauche de y


modulo H, il s'agit de la classe d'équivalence de y pour la relation d'équivalence R décrite
dans la preuve ci-desssus. Nous aurions pu tout aussi bien utiliser les classes à gauche yH
qui sont les classes d'équivalences de la relation R' définie sur G par x R' y si et seulement
si x- 1 *Y E H. Bien entendu, si Gest abélien, on a yH = Hy. Ces relations d'équivalence
sont au fondement de la notion de groupe quotient qui sera illustrée dans le complément du
même nom.

Test 9.11. Test 9.12.


Soient (G,*) un groupe fini d'ordre net a E G Soit (G,*) un groupe d'ordre trois. Montrer
tel que a 2 = e et a i= e. Montrer que n est un qu'il existe a E G tel que G = (a).
entier pair.

Il.4. Description des sous-groupes additifs de Z


Le théorème suivant décrit tous les sous-groupes additifs de Z. Il est essentiel en arithmétique,
comme nous le verrons dans la suite.

Pi,-oposition 9.-23. Les 8C'US-groui,es de (Z, +) sont les sou.tHnsembles de la forme nZ où


nEN.
PREUVE. Soit G un sous-groupe de (Z, +). Si G = {O}, l'entier n = 0 convient. Si G -/- {O},
G contient au moins un entier mo non nul. Quitte à changer mo en son opposé -mo, qui
appartient également à G car G est un sous-groupe de (Z, +), on peut supposer que G contient
un entier naturel strictement positif. L'ensemble G n N* est donc un sous-ensemble non vide
de N, il admet par conséquent un plus petit élément que l'on note n. Comme n E G, on
a (n} = nZ c G. Réciproquement, soit k E G. Effectuons la division euclidienne de k par
n -/- 0 : il existe un couple d'entiers relatifs (q, r) tel que k = qn + r et O ::;; r < n.
210

Comme k E G et qn E nZ c G, on ar = k-qn E G, et comme r ;?:! 0, on a r E G nN. Mais


alors, on a nécessairement r = 0 car si ce n'était pas le cas, on aurait r E G n N*, ce qui est
absurde car r <net min(G n N*) = n. Ainsi, r = 0 et k = qn E nZ d'où G c nZ. ■

Test 9.13. Test 9.14.


Le sous-ensemble H = 2Z n 3Z est un sous- Établir que, pour tous met n dans N, mZ = nZ
groupe de (Z, +}. Il est donc de la forme si et seulement si m = n.
H = mZ avec m EN. Que vaut m?

(l)

~ III. MORPHISMES DE GROUPES


Lorsque deux ensembles G1 et G2 sont respectivement munis de lois de compositions * et
o, certaines applications de G1 dans G2 jouent un rôle particulier : celles qui respectent les
structures (G 1,*) et (G2,ol, et qui sont appelées des morphismes.

IIl.1. Définitions et exemples


Définition 9.24. Soient (G 1,*) et (G2,o) deux groupes. On dit qu'une application
cp: G1 --+ G 2 est un morphisme de groupe lorsque

V(g, g') E Gi, cp(g * g') = cp(g) o cp(g').

EXEMPLE 9.25. Voici divers exemples issus des cours d'algèbre et d'analyse.
1) La fonction exponentielle exp : (C, +) --+ (C*, x) est un morphisme de groupes car

V(z, z') E C 2, exp(z + z') = exp(z) x exp(z').

2) La fonction f: (~, +)--+ (1U, x) définie par f(t) = eit est un morphisme de groupes car

V(t, t') E ~ 2, f(t + t') = ei(t+t'l = eit x eit' = f(t) x f(t').

3) Le logarithme népérien ln : (~'+-, x) --+ (~, +) est un morphisme de groupes car

V(x, x') E (~'t-)2, ln(xx') = ln(x) + ln(x').

4) Soit k E Z. La fonction g: (Z,+)--+ (Z,+) définie par g(n) = kn est un morphisme de


groupes car

V(n, n') E Z 2, g(n + n') = k(n + n') = kn + kn' = g(n) + g(n').

On peut en fait montrer que tous les morphismes de (Z, +) dans lui-même sont de la
forme décrite au 4) de la proposition précédente. Le résultat suivant précise la propriété
des morphismes annoncée plus haut, « respecter» les structures de départ et d'arrivée : un
morphisme envoie le neutre du groupe de départ sur le neutre du groupe d'arrivée et l'inverse
de l'image d'un élément x est égale à l'image de l'inverse de l'élément x.
211

Propo,ition.!J:.~6; .soihf::(ûi;*)".4 (G1,ofu1t~~de.greüp~; On note e1 ete2


les élé.men.ts neufres respectifs lé G1 ;et G2. . . Q)

Î) _'f'{eÙ ~~2- • · · . · · 2) Vx e G'1•,i{x~1} =q,{"}-'1 •


lQ)
'O

PREUVE. Comme e 1 * e 1 = e 1, on a cp(e1) o cp(ei) = cp(ei) = cp(e1) * e2, et, par régularité,
cp(e 1) = e 2. Soit alors x E G 1. On a cp(x) o cp(x-1) = cp(x * x- 1) = cp(ei) = e2 et donc
cp(x-1) = cp(x)-1. ■
1
ÈrJ)

j
Avant de décrire leurs propriétés, nous allons éclairer la définition des morphismes sous
un nouvel angle. Soient (G 1 ,*) un groupe et G 2 un ensemble au plus dénombrable. D'une
manière générale, pour toute application cp : G 1 -, G2, on définit l'image par cp d'une table
de Cayley T de ( G 1, *) par la table T' obtenue en inscrivant case après case l'image par cp de
la case correspondante de T. On obtient ainsi une loi de composition interne ◊ sur cp (G 1)
on dit que l'on a transporté 5 la loi * de G1 sur cp ( G il par cp.


*

Si cp est injective, le lecteur vérifiera sans peine que o est loi de groupe sur l'ensemble cp ( G 1).
Supposons maintenant l'ensemble G2 muni d'une loi de groupe•· Il est clair que la restriction
de T' à cp (G il est une table de Cayley de ( cp (G 1), •) si et seulement si pour tous Xi et Xj dans
G 1, on a cp (Xi* Xj) = cp (xd • cp (Xj), c'est-à-dire si et seulement si les lois o et • coïncident sur
cp ( G1), soit encore si et seulement si cp est un morphisme de groupes de ( G 1, *) dans ( G2, •).

* •
cr(xd

Un morphisme de ( G 1, *) dans ( G2, •) est donc une application cp : G 1 - , G2 qui transporte


la loi de * de G 1 sur la loi • du sous-groupe ( cp ( G1), •) de ( G 1, •). On comprend mieux le
choix du terme morphisme, qui vient du mot grec morphê signifiant forme, pour décrire de
telles applications.

Test 9.15. Test 9.16.


Soit ( G, *) un groupe abélien. Montrer que Soit (G,*) un groupe. On suppose que l'appli-
l'application f : ( G, *) --; ( G, *) définie par cation f : { G, *) --; {G, *) définie par f (x) = x- 1
f(x) = x- 1 est un morphisme. est un morphisme de groupes. Établir que {G, *)
est abélien.

5
Voir l'exercice 9.2 pour de plus amples informations sur le transport d'une loi par une application.
212

111.2. Noyau et image d'un morphisme de groupe


Définition 9.27. Soit cp: (G1,*)-----, (G2,o) un morphisme de groupes. On appelle noyau
de cp et l'on note Ker(cp) l'ensemble cp- 1({ez}), où e 2 désigne le neutre de (G 2,o). Ainsi

EXEMPLE 9.28. Calculons les noyaux des morphismes de l'exemple 9.25.


1. Le noyau de exp est Ker (exp) = 2irrZ car, d'après le cours sur les nombres complexes,

exp(z) = 1 si et seulement si z E 2irrZ.

2. D'après ce qui précède, le noyau de f vaut Ker (f) = 2rrZ.


3. Comme ln(x) = 0 si et seulement six= 1, on a Ker (ln) = {l}.
4. Si k = 0, on a Ker (f) = Z. Sinon, on a clairement Ker (f) = {O}.

Définition 9.29. Soit cp : ( G 1 , *) -----, ( G 2 , o) un morphisme de groupes. On appelle image


de cp et l'on note lm(cp) l'ensemble cp(G 1). Ainsi

Phlj;>Ôst~ '9~. i 1i1Atiûé •ët lé 1i91Jlil,tt ,Umf morphisme dé Jlf(Jùpe q> : ( G1, *} -½ ( G2 , <>)
son(raijîêèlïti~ritJèi"~ûs--}1Nûpeiîfè (G2.◊} étf-G'f~ :t.'}:'," ... .. . .. .• . .. . .
PREUVE. Raisonnons en deux temps.
o Ker ( cp) f.
0 car e 1 E Ker ( cp). Soient x et y dans Ker ( cp). On a

cp(x*y- 1) = cp(x) o cp(y- 1) = cp(x) o cp(y)- 1 = e2 o e21 = e2


donc X*Y- 1 E Ker(cp). Ainsi Ker(cp) est un sous-groupe de (G1,*).
o Comme e 2 = cp(e 1) E lm ( cp ), on a lm ( cp) f. 0. Soient alors y et y' dans lm ( cp) : il existe
x et x' dans G 1 tels que y = cp(x) et y'= cp(x). On a donc y' oy-1 = cp(x') o cp(x)- 1
cp(x') o cp(x- 1) = cp(x' * x- 1) E lm ( cp ). Ainsi, lm ( cp) est un sous-groupe de ( G2, o ). ■

Rappelons la notation des classes à droite (voir la remarque suivant le théorème de La-
grange 9.22) : y H = {yx Ix E H} = {z E G Iy- 1 * z E H}. En reprenant les notations de la
proposition précédente, la connaissance d'une (éventuelle) solution particulière x 0 de l'équa-
tion cp(x) = a, où a E G2, permet la résolution complète de l'équation.

P~t>wn 9.31.:.s~.? rrt6rpltisme!lé !JT<lll,~;·q>•·•:•i{~,.*} "4•{G2,◊), <t.€<G2 et


Xo ,EGi';)tet !fUe q>( ~) :;:z; èl, A;.lorsj'~118.~~le des sqlûti<in(s) ;ç, E ·G1 ·dè f!équation 'P{X} .~,J1
~(é!J«tfi ' . . . .
•.;{x ëG\fq1(l*xa 1
) à;li2}""' Xô'Kef'ffl~Kffl' {(;}Xb.'
PREUVE. L'égalité cp(x) = U est équivalente à cp(x)( cp(xoll- 1 = Cz, c'est-à-dire à cp(X*xo 1) =
e2, ou encore à x E Ker(cp)x 0 . Comme cp(x) = a équivaut également à (cp(x 0 JJ- 1cp(x)
cp(x01 * x) = e 2, l'ensemble des solution(s) est également égal à x 0 Ker ( cp ). ■

Ce résultat est à rapprocher de la résolution des équations différentielles linéaires dont on


connaît une solution particulière.
213

.Pr(g)nsition 9.32. ·. Soit qf~ {Gi, f },"fd.·{G;a,:~),/w,:fu~~Klé"~pèS.?:


l)•··cp•• 'ist•i<njiÛi/stêt.sêûleii\ifü:•if{~{r,}·&iîei}/ôù't'I fil~sï~~)fi~;;~dêi(G{,*t{''; •· ,·.·
2)· w 'est·sùrjecÛf sîàseulêfuë:nt.sH:m êq,J=Gz.
PREUVE.

1) Supposons cp injectif. Soit x E Ker(cp}. Comme cp(e1} = e2, on a cp(x} = cp(e 1) donc,
par injectivité de <p, on a x = e 1. Ainsi Ker ( cp} = {e 1}. Réciproquement, supposons que
Ker(cp} = {e1} et soient x et y dans G1 tels que cp(x} = cp(y}. On a alors cp(x*y-1) = e 2 et
X*1J-T E Ker(cp} = {e 1}, d'où X*1J-l = e 1 , puis x =y.L'application cp est par conséquent
cri
injective. .d
ü
2) La proposition est claire et valable pour toute application cp de G1 dans G2 qu'il s'agisse
d'un morphisme ou non. ■

On en déduit la méthode suivante.

Prouver l'injectivité d'un morphisme de groupes


Dans la pratique, pour établir qu'un morphisme f: (Gi,*l -, (G2,o} est injectif, on
montre que son noyau est réduit à l'élément neutre du groupe de départ, ce qui revient
à prouver que l'équation f(x) = e 2 admet dans G 1 l'unique solution x = e 1 .

111.3. Isomorphismes de groupes


Considérons les groupes (&,i"(E}, L'.1}, où E = {O, 1}, (U4 , x} et (U~, @} dont les tables de Cayley
sont rappelées ci-dessous 6 .

L1 . 0 {O} {l} E X -1 i -i
0 0 {O} {1} E 1 1 -1 i -i
{O} {O} 0 E {1} -1 -1 1 -i i
{l} {1} E 0 {O} i i -i -1 1
E E {l} {O} 0 -i -i i -1

et

@ ( 1, 1} (1,-1) (-1, 1) (-1,-1)


(1, 1} ( 1, 1} (1,-1) (-1, 1) (-1,-1)
(1,-1) (1,-1) ( 1, 1} (-1,-1) (-1, 1)
(-1, 1) (-1, 1) (-1,-1) ( 1, 1} (1,-1)
(-1,-1) (-1,-1) (-1, 1) (1, -1} ( 1, 1}

Après un minutieux examen de ces trois tableaux, on s'aperçoit que le premier et le troi-
sième sont identiques à un changement de nom des éléments près. Quitte à écrire 0 au lieu
de (1, 1), {O} au lieu de (1,-1), {1} au lieu de (1,-1) et Eau lieu de (-1,-1), on obtient

6
Voir l'exemple 9.5.
214

effectivement la même table. On dit que les deux groupes (&'(El,~) et (lU~,0) ont la même
structure de groupe 7 . Puisqu'un tel changement de notation revient à définir une bijection
cp : lU~----, &'(El par

cp((l,1))=0, cp((l,-1))={0}, cp((-1,1))={1}, cp((-1,-l))=E={0,1},

l'identité de ces deux structures de groupes se traduit par l'existence d'une bijection du premier
ensemble dans le second qui transporte la première loi sur la seconde, autrement dit une
bijection qui est de plus un morphisme de groupes.

Définition 9.33. On appelle isomorphisme de groupes tout morphisme de groupe bijectif.


On dit que deux groupes (G1,*) et (G 2,o) sont isomorphes lorsqu'il existe un isomorphisme
de (G1,*) dans (G2,o).

Un isomorphisme de groupes de (G1,*) dans (G2,•l est donc une bijection <p: G,----, G2
qui transporte la loi* de G 1 sur la loi• de G 2. En algèbre, c'est la notion d'isomorphisme qui
formalise l'idée de structure. L'étymologie est d'ailleurs claire, le préfixe iso signifiant même
et morphisme étant issu du grec qui signifie forme. Nous prouverons dans l'exemple 9.34 qu'il
est impossible de transporter la loi 0 de (1U~, 0) sur la loi x de (1U4 , x) : ces deux structures
de groupes ne sont pas isomorphes.
Un isomorphisme de (G1,*) dans (G 2,o) transforme donc une table de Cayley de (G 1 ,*)
en une table de Cayley de ( G 2, o) terme à terme et traduit donc bien l'idée d'une même
structure de groupe.
Revenons un instant aux trois structures de groupes (&'({O, 1}),~), (1U4 , x) et (1U~,0)
décrites ci-dessus.

EXEMPLE 9.34. Les groupes (&'(El,~) et (lU~,0) sont isomorphes pour IEI = 2 mais ne
sont pas isomorphes à (1U4 , x).
► Montrons plus généralement que, pour tout entier naturel n ~ 1, les groupes (&'(El,~) et
{U2, 0) sont isomorphes, où E est un ensemble de cardinal n. Soient e 1, ... , en les éléments
de E et <p: (&'(El,~)----, (1U 2,0) défini par

On a vu dans le chapitre 7 que, pour toutes parties A et B de E, [AL'.B = [A+ ITs - 2[A[B et
donc
(1 - 2[A)(1 - 2[s) = 1 - 2[A - 2[s + 4[A[B = 1 - 2[AL'.B
ainsi cp(A~B) = cp(A) 0 cp{B) : l'application <p est un morphisme de groupe. Il est clair que
Ker {<p) = {0} donc <p est injective. Comme l&'(E)I = l1U 2I = 2n, <p est bijective. Les deux
groupes sont donc isomorphes.
► Raisonnons par l'absurde en supposant l'existence d'un isomorphisme <p : (1U4 , x) ----,
(lU~, 0 ). Comme cp(i2) = cp(i) 2 = (1, 1), on a cp(-1) = (1, 1). Or cp(l) = (1, 1) car <p est un
morphisme de groupes. On a donc -1 E Ker ( <p) -/- {1 }, ce qui est absurde.

7
D'une manière générale, le terme de structure est employé en mathématiques lorsque l'on ne s'intéresse qu'aux
relations qu'ont les éléments d'un ensemble les uns par rapport aux autres indépendamment de leur nature.
215

Test 9.17. Test 9.18.


V
Montrer que l'application f : (Z, +) --, (2Z, +) Soient (G1,*l et (Gz,o) deux groupes finis de o..
::l
définie par f(n) = 2n est un isomorphisme de même ordre net f: (G1,*l--, (Gz,o) un mor-
groupes. phisme de groupes tel que Ker {f) = {e,}. Éta- ~
V
"O
blir que f est un isomorphisme.

IV. ÜRDRE D'UN ÉLÉMENT


J
j
cri
..ci
Proposition 9.35. Soient(G, *} un gr;oupe, g E G ft cp-9 :JZ, +)--4 GJ'appli.catipn d~finie ü
par q, 9 {n) = g'\ L'Applicatiûn q,9 est un morphîsme de gfuupê et îl emte un unique n EN
tel que Kèr (q, 9J = nZ. Lorsque cet entier n est non nul, on dit que g est d'ordre fini et on
note w(g) ou ofg) = n tet entier appelé ordre de g. Lorsque n = 0, OfJ, dit flUe g ,est d'ordre
infini.

PREUVE. Soient net n' dans Z. On a cp 9 (n * n') = gnn' = gn ◊ gn' = cp 9 (n) o cp 9 (n').
L'application cp 9 est donc un morphisme de groupes et Ker ( cp 9 ) est un sous-groupe de (Z, +) :
d'après la proprosition 9.23, il existe n E N tel que Ker ( cp 9 ) = nZ. ■

Considérons un élément g d'ordre fini égal à n. Comme Ker ( cp 9 ) = {k E Z, gk = e} = nZ,


n est le plus petit entier naturel non nul k tel que gk = e. Dans la pratique, si on détermine
un entier naturel k non nul tel que gi -/- e pour 1 ( j ( k- 1 et g k = e, on peut affirmer que
w(g) = k.

EXEMPLE 9.36. Voici quelques illustrations de cette méthode.


► Dans tout groupe ( G, *), il existe un unique élément d'ordre un, l'élément neutre. En effet,
e 1 = e donc w(e) = 1. Réciproquement, soit x un élément d'ordre un. On a alors x = x = e.
1

► Dans (Z, +), tous les éléments m-/- 0 sont d'ordre infini car le morphisme de (Z, +) dans
(Z, +) défini par f(n) = nm est injectif. Seul O est d'ordre fini (valant 1 car O est le neutre
de (Z,+)).
► Dans le groupe multiplicatif 1U4 = {-1, 1, i, -i} des racines quatrièmes de l'unité, w(l) = 1
2
(en tant que neutre du groupe), w(-1) = 2 car (-1) 1 -/- 1 et (-1) = 1, w(-i) = 4 car
(-i)k -j. 1 pour tout 1 ( k ( 3 et (-i) 4
= 1, w(i) = 4 car (i]k-j. 1 pour tout 1 ( k ( 3 et
(i)4 = 1.
► Dans le groupe (9(E),L'-.) où E = {O, 1}, comme \ig E 9(E), gL'-.g = 0 = e, tous les
éléments distincts de e = 0 sont d'ordre deux et l'ordre de e = 0 vaut 1.

Pour tout élément d'ordre fini égal à n d'un groupe (G,*), on a (g) = {gkl O ( k ( n-1}
avec gn-l-/- e, ainsi w(g) = n = l(g)I.

êorollairè'9.37~ Sig;esfv.rï i!limênl il1drdrefini égal à n d'ungroupè!G,*}~ alors w{g} =


n = l{g)I.

Un isomorphisme de groupe traduisant une structure commune, l'ordre d'un groupe est
un invariant d'isomorphisme.

EXEMPLE 9.38. Soient f: (G 1 ,*)----, (G 2 ,o) un isomorphisme de groupes et x E G 1. Alors


1 est d'ordre fini si et seulement si f(x) est d'ordre fini et, dans ce cas, w(f(x)) = w(x).
x
216

► Comme pour tout entier naturel k, (f(x)Jk = f(xk), on a (f(x)Jk = e2 si et seulement


si f(xk) = e 2 et, comme f est un isomorphisme, on a Ker (f) = {e 1}. Ainsi f(x)k = e 2 si et
seulement si xk = e 1. D'où Ker ( cpx) = Ker ({pf(xJl avec les notations de la proposition 9.35
x et f(x) ont donc le même ordre (fini ou infini).

PREUVE. C'est une conséquence immédiate du théorème de Lagrange puisque (g) est un
sous-groupe de G de cardinal w(g) (voir le corollaire 9.37). ■

En particulier, dans tout groupe fini (G, *), on a Vg E G , glGI = e.

V. EXERCICES

9.1. c. Épater vos parents et vos amis en construi-


sant une loi de groupe sur ] - 1, 1[.
Les lois * définies sur les ensembles E suivants
par 9.3.
1. E = R, x * -y = x + -y - x-y ;
2. E = R x R+, (xi, -y,)* (x2, 112) = (x1x2, -y,l; Soient ( G, *) un groupe dont l'élément neutre
3. E = R 2, (x1,-Y1l*(X2,1J2l = (x1x2,1J1-112); est noté e et a, b E G. Soit n ;,: 1. Montrer que
(b * a)n = e si et seulement si (a* b)n = e.
4. E=.9(R),x*-y=xn-y;
5. E=.9(R),X*1J=XU-y; 9.4.
sont-elles des lois de groupe ?
Soit (G, *) un groupe tel que V g E G, g 2 = e.
9.2. 1. Montrer que ( G, *) est abélien.
2. G est-il d'ordre fini ?
Soient ( G, *) un groupe, E un ensemble et
f : G ---, E une bijection. On pose, pour tous
X, -y E E, 9.5.

Soient ( G, *) un groupe dont l'élément neutre


est notée et a, b,c E G.
1. Prouver que (E, ◊) est un groupe.
1. On pose x = aba- 1. Calculer xn pour tout
2. Montrer que (E, o) et ( G, *) sont isomorphes. n E Zen fonction de bn, a et a- 1.
3. Applications. 2. On suppose dans cette question que b 6 = e
a. Prouver que E =] - 1, +oo[ muni de la loi et ab = b 4 a. Montrer les égalités b 3 = e et
ab= ba.
x-y+x+-y-2
xo-y = 3. On suppose ici que a 5 = e et aba- 1 = b 2.
3
Montrer que b 31 = e.
est un groupe isomorphe à (R"t-, x). 4. Établir que
b. Pour tous réels x, -y, on pose
a3 = b2
b3 = c2
{ c3
= al
Montrer que (R, *) est un groupe isomorphe à
(R,+).
9.6. 9.7.
.::J
Soit A une partie non vide de (C* stable par le Soient (G,*) un groupe et Z(G) l'ensemble des
produit et finie, de cardinal n. éléments g de G qui commutent avec tous les
éléments de G, c'est-à-dire tels que
1. Prouverque'r/aEA, an=l.

2. En déduire que A = Un, où Un désigne le


Montrer que Z(G) est un sous-groupe de (G,*)-
sous-groupe multiplicatif des racines n-ièmes de
l'unité. REMARQUE - La lettre Z vient du mot al-
lemand Zentrum. oi
6
COMPLÉMENT 1. LES GROUPES QUOTIENT

Comment rendre injectif un homomorphisme

Nous avons déjà rencontré à plusieurs reprises la notion de relation d'équivalence. La donnée
d'une relation d'équivalence sur un ensemble E se ramène à celle d'une partition de E, c'est-
à-dire d'une partie d de 9(E) formée par des sous-ensembles non vides de E, deux à deux
disjoints, et dont la réunion est égale à E. En effet, si une relation d'équivalence est donnée,
ses classes d'équivalence forment une partition de E, alors que si une partition d de E est
donnée, on définit une relation d'équivalence !Jè sur E en posant x/Jè-y si et seulement six et
-y appartiennent au même élément de la partition d.

1.1. L'idée de quotient


1. On peut aller encore plus loin, et identifier entre eux les éléments d'une même classe d'équi-
valence, c'est d'ailleurs la raison d'être de ces relations. On forme alors un nouvel ensemble,
celui des classes d'équivalence, que l'on peut voir comme l'ensemble obtenu après qu'on ait
décidé de ne pas distinguer les éléments d'une même classe, ce qui revient à «regrouper» ces
éléments en un seul point. L'ensemble ainsi obtenu s'appelle l'ensemble quotient de E par la
relation!%, et se note E/!%. Il existe toujours une surjection de E sur E/!Jè, l'application qui
à un élément x de E associe sa classe, on l'appelle la surjection canonique de E sur E//Jè, on
la notera en général 7t. Il faut bien comprendre que l'ensemble E//Jè est un nouvel ensemble,
constitué de nouveaux éléments, en d'autres termes, il faut «oublier» que les éléments de
E//Jè sont des parties de E, et les considérer comme des points dans le nouvel ensemble ob-
tenu. Étant donné un point a de E/R, on revient alors à la partie de E qu'il représente en
considérant n-1 ({a}).
2. Le meilleur exemple d'utilisation de ces idées est certainement celui qui consiste à « rendre
injective» une application qui ne l'est pas. On considère une application f d'un ensemble
E dans un ensemble F, et on cherche à former une application injective qui « ressemble le
plus possible» à f. Pour cela, on modifie l'ensemble de définition de f de telle manière que f
définisse de manière naturelle une nouvelle application sur ce nouvel ensemble, et que cette
application soit injective. Pour cela on définit sur E une relation 8lt par

Il est clair que !Jèf est une relation d'équivalence. En effet, elle est évidemment réflexive et
symétrique, et si x/Jèf-y et-y/Jèfz, alors f(x) = f(-y) et f(-y) = f(z), donc f(x) = f(z) et X!%tz,
elle est donc transitive. La classe d'équivalence d'un élément x de E pour 8lt est l'ensemble
des éléments -y de E qui vérifient f (-y) = f {x). Les classes d'équivalence sont donc les parties
de E formées par les éléments ayant la même image par f.
3. Par exemple, si E = {1, 2, 3,4, 5, 6} et F = {a, b, c, d}, et si f: E-----, Fest l'application définie
par
f(l) = a, f(2) = c, f(3) = b, f(4) = c, f(5) = a, f(6) = c
les classes d'équivalence de !Jèf sont

Ea = {1, 5}, Eb = {3}, Ec = {2, 4, 6},


et l'ensemble quotient est E/&t' = {E 0 , Eb, Ec}- On peut alors introduire une nouvelle applica-
tion f, de E / 3€ dans F, définie par

Il est clair que cette application est injective. Elle est construite de manière naturelle à partir
de f: à une classe d'équivalence donnée elle associe la valeur prise par f sur tous les éléments
de cette classe.
4. Raisonnons maintenant de manière plus formelle. Considérons une application f d'un en-
semble E dans un ensemble F, notons comme auparavant &t'f la relation qu'elle définit sur
E, et Q = E/&t't l'ensemble quotient. La surjection canonique de E sur Q sera notée 'TC; si
x E E, n(x) est donc la classe de x, c'est un élément de Q. On voit que l'application 'TC vérifie
n(x) = n(y) si et seulement si f(x) = f(y).
Il est alors possible de définir une application f de Q dans F de la manière suivante :
soit a E Q, il existe x E Etel que n(x) = a, on pose f(a) = f(x). Cette définition est bien
légitime, puisque si y E Y vérifie la condition n(y) = a, on aura f(y) = f(x), donc cette valeur
ne dépend pas du point dans l'image inverse de a par 'TC. On dit que f passe au quotient sur
E/&t'f, et que f est l'application quotient de f.
Il est possible d'aller encore un peu plus loin. On vérifie facilement que pour que f passe
au quotient comme nous venons de le faire, il suffit que l'égalité n(x) = n(y) implique l'égalité
f(x) = f(y). L'équivalence n'est en fait pas nécessaire.
Notre but dans ce complément va être de faire une construction analogue lorsque l'ensemble
est muni d'une structure de groupe, et lorsque l'application considérée est un morphisme vers
un autre groupe.

1.2. Groupe quotient modulo un sous-groupe distingué


Soit ( G, •) un groupe, de neutre e. Soit H un sous groupe de G. On dit que H est distingué
lorsque pour tout 9 E G, les ensembles 9 · H = {9 · h I h E H} et H · 9 = {h · 9 1 h E H}
1 1
sont égaux. Il revient au-même de dire que H = 9 · H · 9- = {9 · h · 9- h E H}. On vérifie
1

1
facilement que pour que H soit distingué, il faut et il suffit que pour tout 9 E G, 9- H- 9- C H.
Dans ce qui suit nous omettrons le · pour alléger les notations.
Si H est un sous-groupe de G, on peut définir une relation d'équivalence sur G de la
manière suivante
2 1
\1(91,92) E G , 91&€92 si et seulement si 919 2 EH.
1 1
La relation 3€ est clairement réflexive, elle est symétrique car si 919 2 E H, alors 929 1 =
1
(919 21)-1 E H puisque H est un sous-groupe, et elle est transitive car si 9 19 2 E H et
1 1 1
92931 EH, alors 9193 = (9192 )(9293 ) EH puisque H est un sous-groupe.
On note G/H l'ensemble quotient de G par&€, et n la surjection canonique de G sur G/H.
On voudrait munir G/H d'une structure de groupe naturellement reliée à celle de G. Il faut
donc définir sur G/H une loi 0 convenable. On est tenté d'opérer de la manière suivante : si
a et b sont des éléments de G/H, on met en évidence des élements 9 0 et 9b de G tels que
n(9 0 ) = a et 7C(9b) = b. Alors il est possible de considérer le produit 9a9b et de le projeter
par 7t: pour obtenir un élément de G/H. On voudrait alors poser ab= n(9 0 9b), mais il faut
1 1
pour cela que l'élément 1t:(9 0 9b) soit indépendant du choix de 9 0 E n- ({a}) et 9b E n- ({b}).
Cette propriété n'est pas vraie en général, mais elle l'est si H est un sous-groupe distingué
de G. En effet, si g~, 9a et g~, 9b sont des éléments de G vérifiant n(g~) = n(ga) = a et
n(g~) = 7t(9b) = b, on a g~g;;- 1 EH et g~g;;- 1 EH, donc
1 1 1 1
g~g~( 9a9b)-l = g~g~gb g~ E g~Hg~ = g~g~ H = H.

où l'avant-dernière égalité provient du fait que H est distingué, et la dernière du fait que
g~g;;- 1 EH et H sous-groupe. Donc n(g~g~) = 7t(9a9bl-
Ainsi, on peut donc définir une loi 0 sur G/H. Pour la comprendre de manière un peu plus
directe, identifions une classe d'équivalence, élément de G/H, au sous-ensemble de G qu'elle
définit. Alors on remarque que la classe d'équivalence d'un élément g de G s'écrit simplement
Hg, puisque dire que f~ g équivaut à fg- 1 E H ce qui est encore équivalent à l'existence de
h E H tel que eg- 1 = h, soit e= hg E Hg. Comme H est distingué, on a aussi la possibilité
d'identifier Hg et gH.
Il s'agit donc de définir l'opération g 1 H 0 g2H, et ce que nous avons montré plus haut est
simplement qu'il est légitime de poser

En d'autres termes, si l'on note 7t la surjection canonique de G sur G/H, on obtient

n(g) 0 n(h) = n(gh).


L'opération 0 que nous venons de définir s'appelle la loi quotient sur G/H. Nous avons
maintenant un premier résultat.

Pr<>P®tloii 9'.4Ôt'Jt'vèc'lêj·,wt~tit>.~ précé-denieSifG/H~ 0) ·est un gnnipe et 1t: G-4. G/H


est un homomorphisme surjêct[f
PREUVE. L'élément neutre de 0 este= n(e). En effet, pour a E G/H, six E n- 1 ({a})
e 0 a = n( e) 0 n( x) = n( ex) = n( x) = a par (**). De même a 0 e = a. Le symétrique de
n(g) est clairement n(g- 1 ). Enfin, on vérifie facilement l'associativité de 0. La propriété de
morphisme de 7t provient de (**), et 7t est toujours surjective. ■

Il nous reste à étudier l'effet du passage au quotient sur les morphismes de groupe.

1.3. Morphismes et quotients


Soient (G, ·) et (K, o) deux groupes de neutres eG et eK, et cl> un homomorphisme de G dans
K. Comme dans l'introduction de ce complément, nous voudrions « rendre cl> injectif »par un
procédé canonique. Nous savons qu'un morphisme est injectif si et seulement si son noyau est
réduit à l'élément neutre. Il est donc naturel de considérer le noyau Ker cl>, qui est un sous-
groupe de G, comme nous l'avons déjà vu. Vérifions d'abord une propriété supplémentaire.

PREUVE. Soit g E G. Alors, si k E Ker cl>

ce qui montre que gkg-1 E Ker cl>, donc que g Ker cpg-1 C Ker cl>, et Ker cp est distingué. ■

Nous arrivons maintenant au résultat principal de ce complément.


Thêôrême 9.42. (Factorisatïon:(fes JBOpthismes)~ .Soient( G, ·1. et . {K, o }. deux gro:upes
di neutres eG et ei<, et q, un homomorphisme de G dans K. Alors ♦ passe au quotient sur
(G/fKèt q,),0), etl'applicatiOJI; quotient~: G/(Kenp) ➔ K est un morphisme injectif

PREUVE. L'application cp passe au quotient. En effet, si g et e sont dans une même classe
d'équivalence de G/(Ker cl>), ge- 1 E Ker cp, donc il existe k E Ker cl> tel que g = fk, donc

cp(g) = cp(fk) = cp(e) o cp(k) = cp(f) o eK = cp(f).


1
Réciproquement, on voit de la même manière que si cp(g) = cp(f), alors ge- E Ker cp. Il en
résulte bien que cp _passe au quotient.
Montrons que cp est un morphisme. Soient a et b des éléments de G/ (Ker cp), et soient
9a E 7C 1({a}), 9b E 7C 1({b}). Alors

<Î>( a 0 b) = <Î>(n(g 0 ) 0 7C(9b)) = <Î>( 7C(9a9bl)


= cl>(9a9b) = cp(ga) o cp(gb) = <Î>(a) o <P(b).
Enfin, l'injectivité provient directement de notre étude préliminaire, puisque la relation asso-
ciée à Ker cp est exactement la relation des fibres de cp. ■
Chapitre 10
J
LE GROUPE SYMÉTRIQUE 6

ERMUTER n objets signifie les ranger dans un certain ordre. Née de considérations

P combinatoires, la notion de permutation n'a commencé à devenir un objet d'étude qu'à


l'aube du xrxe siècle. Comme nous l'avions déjà remarqué dans le chapitre 9, l'histoire
des permutations est indissociable de l'avènement de la structure de groupe. L'intérêt des
mathématiciens pour les permutations est lié au rôle central qu'elles jouent dans la résolution
des équations algébriques 1 .
Depuis la Renaissance, aucune avancée majeure n'avait été faite en la matière. En par-
ticulier, l'équation du cinquième degré demeurait une énigme. En 1770, Lagrange publia un
mémoire sur la résolution des équations de degré trois et quatre. Il retrouva les formules de
Cardan et de Ferrari par une nouvelle et prometteuse approche. C'est du côté des symétries
liées à des permutations qu'il chercha un moyen de ramener la résolution d'une équation de
degré n à celle d'équations de degré strictement inférieur. Il remarqua qu'en notant Xi, x2, X3
les solutions de l'équation x 3 +px+ q = 0, l'expression

ne prend qu'au plus deux valeurs <X et f3 lorsque l'on permute des six manières possibles
les racines x1, X2 et x 3 . Il put alors ramener la résolution d'une équation de degré trois à
la résolution d'une équation du second degré et d'un système linéaire de 3 équations à 3
inconnues pour le détail des calculs.. Lagrange réussit à étendre cette technique au degré
quatre mais prouva qu'elle ne pouvait être adaptée au cas d'équations de degré n ?:: 5. En
1799, le savant italien Ruffini annonça que l'équation algébrique du cinquième degré n'est pas
résoluble, c'est-à-dire qu'on ne peut trouver (à la manière des équations de degré 1, 2, 3 et
4) une expression des racines d'un polynôme P de degré cinq au moyen de radicaux2 et en
fonction des coefficients de P. Bien qu'infructueuses, les tentatives de démonstration de Ruffini
furent l'occasion de nombreux développements concernant les permutations. Abel démontra
la non-résolubilité de l'équation de degré cinq en 1824 en basant son argumentation sur les
permutations.

Après un premier mémoire sur l'utilisation des permutations dans la résolution des équa-
tions algébriques, Cauchy publia en 1844 un ouvrage majeur où pour la première fois les
permutations furent étudiées comme un sujet à part entière. En 1831, Galois fut le premier
mathématicien à comprendre que la résolubilité des équations algébriques est reliée à la struc-
ture d'un certain groupe de permutation qui lui est associé.

1
C'est-à-dire une équation de la forme P(x) = 0 où Pest un polynôme à coefficients dans lR ou IC. Le degré de
P est appelé le degré de l'équation.
2
C'est-à-dire au moyen de racines.
224

En 1849, le mathématicien anglais Arthur Cayley publia un


article sur les permutations dans la lignée des travaux de Cau-
chy. Il revint sur le sujet dans ses quatre articles de 1878
sur les groupes en montrant notamment que tout groupe peut-
être considéré comme un sous-groupe d'un groupe de permuta-
tion3.
A.-L. Cauchy
(1789-1857)

1. PERMUTATION S D'UN ENSEMBLE À n ÉLÉMENTS


Rappelons que, pour tout entier naturel non nul n, Nn désigne l'ensemble {l, ... , n}.

1.1. Les groupes 6(E) et 6n

Notation. Pour un ensemble E, on noté 6(E) l'ensemble des bijections de E dans E. On


note 6n = 6(Nnl- Une bijection cr: Nn---+ Nn est aussi appelée permutation.
Les propriétés des applications bijectives de E dans E et de la loi de composition o sur
6(E) prouvées dans les chapitres précédents peuvent être résumées comme suit.

PropositiQn 10.1 . . Pour tout ensemble E non'Vide, (6{E},oJ est ungrou,:pe.<En 1}flrticulier,
pour tout entier n ~ t t rtim nul1 ( 6n, o} ·.~ un !Jl"(J'JJ!Jie 0,ppeié le urm1;pe sym,étrique Îl 7o~
n. Le cardin0,l5 de~·ti,t égt;l'ành

Le résultat suivant justifie que l'étude des groupes 6(E) se résume à celle des groupes de
permutations 6n.

PropositiOIJ, 10,2. ·Pour: to'/4 ense,mble E 4e cardî'IUÛ :n,,·lçs, ~~ 6{E} et :6"' sqnt ·i@-
morphes. · · · · ·

PREUVE. Puisque E et Nn sont équipotents (par définition du cardinal), il existe une bijection
f : E ---+ Nn. Soit alors '!' l'application définie par

'!': 6(E) ---+ 6n, cr E 6(E) H '!'( cr) = f o cr o f- 1.


Il est évident que '!' est bien définie et qu'elle est bijective d'inverse 'V E 6n H f- 1 o -v o f.
Prouvons qu'il s'agit d'un morphisme de groupes. Soient cr 1 et cr2 dans 6E. On a

'!'(cr 1 o cr2 ) = f o (cr 1 o cr2 ) o f- 1 = f o (cr 1 o (idE) o cr2 ) o f- 1 = f o (cr 1 o (f- 1 of) o cr2 ) o f- 1
= (f o cr 1 o f- 1 ) o (f o cr2 o f- 1 ) = '!'(cri) o '!'(cr2 )

par associativité des deux lois o.


3
Plus précisément, si [G[ = n, G est isomorphe à un sous-groupe de 6n.
4
La lettre 6 est un « s » gothique majuscule.
5
Attention à ne pas s'emmêler dans le vocabulaire : {6n, o) est le groupe symétrique d'ordre n mais son ordre
(c'est-à-dire son cardinal) vaut n!.
225

Test 10.1. Test 10.2.


Écrire les tables de Cayley des groupes (62, o) Soit n ), 3. Prouver que le groupe (Sn, o) n'est
et (63, o). Quels sont les sous-groupes de pas abélien.
(63,0)?

I.2. Le théorème de Cayley


Les groupes offrent de nombreux exemples de permutations. Par exemple, nous avons prouvé
dans le chapitre 9 que les translations à gauche l 9 : G ----+ G, définies pour 9 E G par 0
....
Vx E G, l 9 (x) = 9 * x, sont des permutations de l'ensemble G.
6
Théorème 10.3. (Cayley). Boit (G,*} un groupe d'ordrert.:'llemte u11,"s~-gt6~'G1
de (Gn., o} isom<}fPhe à G.

PREUVE. Comme IGI = n, on déduit du paragraphe précédent l'exisence d'un isomorphisme


'l1: (6G,o) ----+ (6n,o). Soit alors <D: (G,*) ----+ (6n,o) l'application définie sur l'ensemble
G par <1>(9) = 'l1(l 9 ). Puisque dans un groupe donné, toute translation à gauche est une
permutation, <D est bien définie. Prouvons que <D est un morphisme de groupes injectif. Soient
91 et 92 deux éléments de (G,*)- On a
<D( 91 * 92) = 'l1(l 9 ,*92 ) = 'l1(l 91 ol 92 ) = 'l1(l 91 ) o 'l1(l 92 ) = <D( 91) o <1>(92)
où l'on a utilisé la propriété de morphisme de 'l1 : <D est donc un morphisme de groupes. De
plus, 9 E Ker(<D) si et seulement si <1>(9) = 'l1(l 9 ) = idNn, c'est-à-dire l 9 E Ker('l1). Or 'l1
est un isomorphisme, donc Ker ('11) = {idd puis l 9 = idG. En notant e le neutre de ( G, *),
on a en particulier que l 9 (e) = idG(e) = e et donc 9 * e = 9 = e. Ainsi Ker (Cl>) = {e} et Cl>
~~Œfil ■

Tout groupe peut donc être vu comme un sous-groupe d'un groupe de permutation les
groupes de permutations sont finalement les groupes dont la structure est la plus complexe.

I.3. Notation matricielle des permutations


Plutôt qu'un diagramme de Venn fléché ou qu'une définition point par point, on représente
une permutation cr de Nn = {1, ... , n} sous la forme d'une matrice de taille 2 x n, c'est-à-dire
à l'aide d'un tableau à deux lignes et n colonnes : sur la première ligne figurent les éléments
1 , ... , n de Nn et sur la seconde ligne leurs images par la permutation cr
1 2 ... k ...
cr= ( cr(l) cr(2) ... cr(k) ... cr(n)
n) ·

Par exemple, la permutation cr de N3 définie par cr(l) = 2, cr(2) = 3 et cr(3) = 1 sera notée

123)
Cf= ( 231 .

Grâce à cette notation, les puissances de cr (pour la loi o) se calculent facilement. Ainsi,

cr2 = ( 123) et cr3 = ( . , etc.


123) = id
312 12 3
226

Test 10.3. Test 10.4.


Écrire sous forme matricielle la permutation cr On reprend les notations du test précédent.
de Ns définie par 'v'k E Ns , cr(k) = 6 - k. Calculer cr2 . Que vaut cr- 1 ?

Définition 10.4. Soit u E 6n- On appelle support de u l'ensemble des entiers k E Nn tels
que u(k) -/- k. On note cet ensemble Supp( u). On appelle point fixe de u tout élément k de
........,
<Il

;:l
c.;
Nn tel que u(k) = k. L'ensemble des points fixes de u est noté Fix(u) .

2 Autrement dit, l'ensemble Supp( u) est le complémentaire dans Nn de l'ensemble des points
û5 fixes de CJ : Supp(u) = Fix(u)C, ou de manière équivalente, Fix(u) = Supp(u)C.

i CIJ

1.4. Action de ( cr) sur Nn


Une permutation CJ de Nn étant fixée, nous allons définir une relation d'équivalence sur Nn
associée à CJ et qui permettra de décrire la manière dont CJ agit sur Nn.

Proposition 10.5._ . La relàtion binaire R définie sur Nn par


x'R.y si èt seulement si 3k Ë Z, y~ o-k(x)
est une relation· d'équivalence.

PREUVE. Rest une relation d'équivalence sur Nn. En effet, comme x = u 0 (x) = id(x), x R x
et Rest réflexive. Soient x et -y dans Nn tels que x R-y : il existe k dans Z tel que -y = uk(x).
On a alors x = u-k(-y) d'où -yRx : la relation Rest symétrique. Soient x,-y et z dans Nn
tels que x R -y et -y R z : il existe k et m dans N tels que -y = uk( x) et z = um(-y). Ainsi,
z = uk+m( x) et x R z car k + m E N : la relation R est transitive. ■

Définition 10.6. La classe d'équivalence de x E Nn pour R est appelée l'orbite de x pour


l'action de (u) et notée O (x). Ainsi,

Le lemme suivant prouve que l'on a également

ce qui est utile lors du calcul pratique d'une orbite.

Lemme _10.7. Soient rr E ~n, x ety dans Nn tels qu'il existe k E Z tel que y = rrk(x,}.
Alors il existe m EN tel que y= um(x).

PREUVE. Le seul cas à traiter est celui où k < O. (6n,o) étant un groupe d'ordre n!, on a
un!= idNn et donc u-kxn! = idNn· Ainsi -y= uk(x) = u-kxn!+k(x). On conclut en remarquant
que k(l -n!)?:, O. ■

On peut également utiliser la division euclidienne de k par n! pour démontrer ce résultat.


Les orbites étant des classes d'équivalence, deux orbites de l'action de ( u) sur Nn sont égales
ou disjointes.
227

EXEMPLE 10.8. Voici quelques illustrations.


► Pour tout x E Fix(<T), O(x) = {x}, et pour tout x E Supp{<T), {x} C O(x), l'inclusion
étant stricte.
► Pour <T = 0n g), on a 0(4) = {4}, 0(3) = {3} et 0(1) = 0(2) = 0(5) = {1,2,5}.

Test 10.5. Test 10.6.


Soit Soit
123 4 5) 12345)
CJ= ( 54321 . cr= ( 35412 ·

Calculer les orbites de Ns pour l'action asso- Calculer les orbites de Ns pour l'action asso-
ciée. ciée.

1.5. Cycles et transpositions de 6n

Définition 10.9. Soit n ~ 2. On dit qu'une permutation c de Nn est un cycle lorsque


la relation d'équivalence associée admet une unique orbite non réduite à un point. Cette
propriété est équivalente à l'existence de p ~ 2 et u 1 , •.• , Up dans Nn deux à deux distincts
tels que

L'entier p est appelé longueur du cycle c et noté C( c).

Notation. Le cycle défini précédemment est noté c = (a,, Uz, ... , up).

On dit qu'un cycle c réalise une permutation circulaire des éléments de son support. La
figure suivante illustre cette terminologie.

FIGURE 10.1. Lep-cycle c =(a,, ... , Op)

EXEMPLE 10.10. La permutation <T = (Hf~~) est un cycle de 6 5 car elle n'admet
qu'une seule orbite O = N5 . En revanche, la permutation <T = ( ! l ~ ~ ~) n'est pas un cycle
1

car admet elle deux orbites non réduites à un point, 0(2) = {2, 3} et 0(1) = {l, 4, 5}. On a
<T = (1,4,5,2,3).
228

Avec les notations précédentes, on a donc Fix( c) = {a 1, ... , av? et

Ce dernier résultat est généralisable à tout élément x de supp(c) : Supp(c) = {ck(x) k EN}.
1

Le lemme suivant regroupe trois résultats importants sur les cycles de 6n,

liemmeltl.n. Soiènt 1Î ~ 2, V ~ Z ètj ={ah~ .·._i41p) uii cycle. deJStù . .


1l Puur toute peri'µTJt(l.tipn cr, croc o <r"'1 es.t éga(a~ c11clec fcr(a1) aJa;}J•. •.
2), Vx ESUP1>(c) 1S,~pp(c} ={ck(x) !kEN}:#ft.îÎt~,."ap}.. · .. .
3).~'onl~ d'un cyde.:e de (~n, oJ vàuH{c) == ISµf)p(c}k
4) V,c E Supp(e), C= (x;c{x}, ••. ,ct<cH(xH~

PREUVE.

1) Comme (croc o cr-1)(x) = x si et seulement si c( cr-1(x)) = cr-1(x), ie x E cr(Supp(c)c) et


puisque, pour tout k tel que 1 ~ k ~ p - 1, (croc o cr-1)( cr( ak)l = cr(c( ak)) = cr( ak+il et
(croc o cr-1)( cr( avll = cr(c(avl) = cr( ai), croc o cr-1 est égal au cycle (cr( a 1) ... cr(ap)).
2) Soit x E Supp(c). Notons S = {ck(x) lk E N}. Comme il existe k 0 ~ p - 1 tel que
x = cko(ai), on a SC Supp(c). Réciproquement, a 1 = cP-ko(x) donc Supp(cr) CS.
3) Soit p = t( c) ~ 2 et c = (a 1, ... , Op). On a c P = idNn. De plus, pour tout 1 ~ k ~ p - 1,
ck(ai) = ak+ 1 # 01 donc ck # idNn· On en conclut que w(c) = t(c).
4) Ce résultat est une conséquence immédiate de la propriété 2). ■

Définition 10.12. Une transposition est un cycle de longueur deux.

Les transpositions de 6n sont donc les permutations de la forme T = (i, j) avec i et j dans
Nn tels que i /. j.

Proposition 10.13. Dem cycles de 8n. dont le!; sâppoflifsont àiiijoinU.'ii:Î'inmütè/lt

PREUVE. Soient C1 = (01, 02, ... , ap) et C2 = (b1, b2, ... , bm) deux cycles de 6n dont les
supports sont disjoints. Soit x E Nn, Six (/. Supp(c1) U Supp(c2l, alors (c 1 o c 2)(x) = x =
(c2oc 1)(x). Six E Supp(ci), comme ni x ni c 1(x) n'appartiennent à Supp(c 2), on a c 2(c 1(x)) =
C1(x) = c1(c2(x)). De même, pour x E Supp(cz), on a c2(c1(x)) = C1(c2(x)) = c2(x). Ainsi
C1 o C2 = C2 o C1. ■

Test 10.7.
Test 10.9.
Compléter la permutation suivante de N6 de
manière à obtenir un cycle. Soient n ), 3 et a, b, c trois éléments deux à
deux distincts de Nn. Calculer

CY=
123 4 5 6
( 26473??.
7) c, = (a, b)(b, c)(a, b).

Test 10.8.
Test 10.10.
Calculer dans (66, o) le produit
Que dire d'une permutation de 6n n'admettant
(3, 4 )( 4, 5)(2, 3 )(1, 2)(5, 6)(2, 3 )( 4, 5)(3, 4 )(2, 3). qu'une seule orbite O ?
On écrira indifféremment (1, 2)o(l, 2, 3) ou (1, 2)(1, 2, 3) la composée de deux cycles donnés
de 6n. Une composée de permutations est souvent appelée produit de permutations.
-=.J
Il. DÉCOMPOSITIONS D'UNE PERMUTATION
Cl)
o.
II.1. Décomposition en produit de cycle(s)

Prc:,positiQn 10~14. Tome pèrmut6twn de Sn. se décompose de manière 11,nique {à l'ordre


!
j
des facteur:i près) en ·im produit de cycles de sùppor!s deux à d,eiJ:1: disjoints. , ci
.....
..d
PREUVE. Raisonnons en deux temps. u
o Existence : Nn étant fini, il existe un nombre fini m d'orbite(s) non réduite(s) à un point
pour l'action de (cr) sur Nn. Si m = 0, cr = idNn et la décomposition est finie. Si m ~ 1,
notons ces orbites O(xi), ... , O(xml et C,, ... , Cm leurs cardinaux respectifs (qui sont donc
supérieurs ou égaux à 2). On a clairement

les cycles étant de supports deux à deux disjoints.


◊ Unicité : supposons que cr se décompose en produit de cycles disjoints. Il existe alors
a,, a2, ... , Um dans Nn et P1, ... , Pm des entiers supérieurs ou égaux à 2 tels que

c, Cm

les m supports étant deux à deux disjoints. Il est alors clair que, pour tout k dans {1, ... , m},
on a
Supp(ck) = {ak, cr(ak), ... , crPrl (ak)} = O(ak), cklorakl= crlo(ak)
et les 0( ak) pour 1 ::,; k ::,; m sont exactement les orbites non réduites à un points de
l'action de (cr) sur Nn. On déduit de ces résultats que les cycles ck sont uniques à permuta-
tions près et leurs supports sont les orbites de Nn pour la relation d'équivalence R sur Nn
associée à cr. ■

On retiendra de cette démonstration la méthode pratique de décomposition d'une permu-


tation cr donnée en produit de cycles à supports disjoints.

Décomposer <Y E 6n en produit de cycles

Une permutation cr = ( ~, i ::: )


~ est donnée sous forme matricielle.
2
o On trouve le premier cycle en calculant l'orbite de 1 : c 1 = (1, cr(l), cr (1 ), ... ).
o Si cr=/= c,, on choisit le plus entier k compris entre 1 et n n'appartenant pas à l'orbite
de 1 et on calcule son orbite : c 2 = (k, cr(k), cr 2(k), ... ).
◊ Ainsi de suite jusqu'à épuisement des orbites.
230

EXEMPLE 10.15. Décomposons la permutation cr = (l H j ~ B) en produit de cycles à


supports disjoints.
► Calculons l'orbite 0(1) de 1 sous l'action de (cr). Comme cr(l) = 4, cr= 7, cr(7) = 2, cr(2) =
3 et cr(3) = 1, on a 0(1) = {1,4,7,2,3}. Calculons l'orbite 0(5) de 5 sous l'action de (cr).
Comme cr(5) = 6 et cr(6) = 5, on a 0(5) = {5, 6}. Ainsi cr= (1, 4, 7, 2, 3)(5, 6).

La connaissance de la décomposition d'une permutation en produit de cycle permet de


nombreux calculs tels que celui des puissances itérées de la permutation cr.

EXEMPLE 10.16. Calculons cr2006 où cr est la permutation de l'exemple 10.15.


► Puisque les cycles (1, 4, 7, 2, 3) et (5, 6) commutent (leurs supports sont disjoints), on a

cr2006 = (1, 4, 7, 2, 3)2006(5, 6)2006_

On a (1, 4, 7, 2, 3) 5 = idNs (car l'ordre d'un cycle est égal à sa longueur, voir le lemme 10.11)
et (5, 6) 2 = id, donc, comme 2006 = 5 x 401 + 1, on a

cr2006 = (1,4, 7,2,3).

La connaissance d'une décomposition en produit de cycle(s) de support(s) disjoint(s) per-


met également le calcul de l'ordre d'une permutation dans le groupe (6n, o). La proposition
suivante suppose connue la notion de ppcm. Le ppcm de n entiers n'est autre que leur plus
petit commun multiple dans N*.

Proposition 10.17. Soit o-. = c1 o •.• o Cm avec m;;;, 1 et oit, les Ci sent des cycles de
supports deux à deux disjoints. Alors l'ordre àe <T vautppcm(t(c1}, ... ,ffcm)).

PREUVE. Puisque les cycles commutent à deux (leurs supports sont disjoints), on a, pour
tout entier naturel k, crk = c} o ... oc~. Comme le support de cf est contenu dans Supp( cd,
crk = id si et seulement si pour tout q entre 1 et m, c~ = idNn, ce qui équivaut à f(cq) divise
k (voir le lemme 10.11 : l'ordre de c dans le groupe (6n,o) vaut f(c)). Ceci est équivalent
à k est un multiple commun des f(cq). Le plus petit k tel que crk = id est donc le plus petit
des multiples communs des nombres e(cql, ie o( cr) = ppcm(f(ci), ... , €(cm)). ■

Test 10.11. Test 10.12.


Soit Soit
123 45) 123 4 5 6)
CY= ( 31254. CY= ( 635124 .
Décomposer c, en produit de cycles de supports
disjoints et en déduire c,2°07 . Calculer l'ordre de c, dans le groupe (66, o).

II.2. Décomposition en produit de transposition(s)

Proposîtion 10.18; Toute permutation de 6n. se décompose en un produit de transposi-


tion(s).
PREUVE. D'après la proposition 10.14, il suffit de vérifier que tout cycle se décompose en un
produit de transposition(s). Soit p ~ 2 et a1, ... , av dans Nn. On a
.:J
En effet, on vérifie facilement que Vh E {l, ... , p - 1}, ( a 1, az) o · · · ( av-1, av)( ak) = ak+ 1,
(ai, az) o · · · (av-i. avHav) = a1 et 1:/x (/. Supp(u), u(x) = x. ■

On retiendra cette démonstration qu'il faudra reproduire à chaque décomposition en pro-


duit de transposition d'une permutation CJ.
ci
......

Décomposer cr E 6n en produit de transpositions ë5


Une permutation CJ = ( ~1 ~ ::: ~ ) est donnée sous forme matricielle.
o On décompose CJ en produit de cycles à supports disjoints.
o On décompose chacun des cycles grâce à la formule suivante :

Contrairement à la décomposition en produit de cycles de supports disjoints, il n'y a plus


unicité. Par exemple, on a (1, 2, 3) = (1, 2)(2, 3) = (1, 2)(1, 2)(1, 2)(2, 3) car (1, 2) 2 =id.Mais
on a également (1, 2, 3) = (1, 3)(1, 2).

EXEMPLE 10.19. Décomposons la permutation de l'exemple 10.15 en produit de transpo-


sitions.
► Comme CJ = (1,4,7,2,3)(5,6) et (1,4,7,2,3) = (1,4)(4,7)(7,2)(2,3), on a directement
u = (1, 4)(4,7)(7, 2)(2, 3)(5, 6).

Test 10.13. Test 10.14.


Soit Soit
1234) 123 4 5 6)
cr= ( 3421 · cr= ( 356124 ·
Décomposer cr en produit de transpositions. Décomposer cr en produit de transpositions.

Il.3. Quelques systèmes générateurs de 6n


D'une manière générale, on dit qu'une partie (ou qu'une famille) S d'un groupe (G,*) est
génératrice lorsque (S) = G, c'est-à-dire si tout élément g de G se décompose en un produit
1
du type g = x1 * ... Xm où Xi E S ou x; ES. Une telle partie peut s'avérer intéressante pour
calculer des images d'éléments de G par un morphisme de groupes q:>: (G,*)-+ (G',•). Le
morphisme q:> est entièrement défini par les images des éléments de S, les q:i(s) E G' pour
s ES.

Pi-âf>d$ltîontmj0. Soît 1'.) Zt LesJurnûlèl stîvant~.sont yénêmtncés ·dé Sn:··.


il {U,Z},(:l,3); ..
2}
r=J{i.iH};~ t:< j ~ nl; ..· ·. .. .. . .
3) {{l,2}; fl ,3}; .•..,{l,n:l}.
.,(k, k+ 1}, ... , (n:.... }, n)};
.
232

PREUVE.

1) Puisque toute permutation se décompose en produit de transposition(s), l'ensemble T des


transpositions de 6n est une partie génératrice de (6n, o).
2) Soient 1 ~ i < j ~ n. On vérifie sans peine que (i,j) = (1,i)(l,j)(l,i). Comme les
transpositions engendrent 6n, la famille proposée est bien génératrice de 6n.
3) Soient 1 ~ i <j ~ n. On a

(i, j) = (i, i + 1)(i + 1, i + 2) · · · (j - 2, j - 1Hi - 1, j)(i - 2, i - 1 Hi - 3, i - 2) ... (i, i + 1),


d'où le résultat, puisque les transpositions engendrent 6n. ■
(1)
Il existe bien sûr beaucoup d'autres familles génératrices du groupe 6n.
~ Test 10.15. Test 10.16.
Établir que {(1 , 2), ( 1 , 2, 3)} est une partie géné- Le groupe (6n, o) contient-il une partie géné-
ratrice du groupe (6 3, o). ratrice à un élément ?

III. LA SIGNATURE D'UNE PERMUTATION

Dans tout ce qui suit, on suppose n ?: 2.

III.1. Inversions d'une permutation

Définition 10.21. Soient n ?: 2 et u E 6n. On appelle inversion de u tout couple (i, i) de


N~ tel que i < i et u( i) > u(j). On note I (u) le nombre d'inversions de u.

EXEMPLE 10.22. Déterminons le nombre d'inversions de u = (J ~ f j ~).


1 ► On a 5 > 2, 5 > 1, 5 > 3, 5 > 4 et 2 > 1 : on dénombre 5 inversions.

Définition 10.23. On appelle ensemble de paires de Nn tout sous-ensemble P de Nn \


{(i, i) 1i E Nn} tel que \l(i, j) EN~, (i, j) E P ou (exclusif) (j, i) E P.

Par exemple, {( 1, 2), (3, 1 )(2, 3)} et {(2, 1), (3, 1)(3, 2)} sont deux ensembles de paires de
N3 et, pout tout n?: 2, P = {(i,j) 11 ~ i < i ~ n} est un ensemble de paires de Nn. Plus
généralement, un ensemble de paires de Nn contient n(n - 1)/2 éléments. Si P et P' sont
deux ensembles de paires de Nn, on a clairement

TI li-il= TI li' -i'I.


(i,j)EP (i',j')EP'

et
Lemme 10.24. Soient n ·~ 2 o- E Sn. Soit P un ensemble de paires ile Nn. Pour tout
couple {i, j) d'éléments de Nn, on note Sa-(i,j) = (<r(i), o-{j)).
1) L'ensemble Su(P) est ûn ensembt~ dê!paires dé Nn;
n u7~î).
0

2) 011/â r1 fi:_n 7 ,-1} 1(o'}

it.nes., 1P1 n:,j)eP •.


233

PREUVE.

1) Par surjectivité de cr, pour tout (i', j') EN~, il existe i et j dans Nn tels que i' = cr(i) et
j' = cr(j). Par injectivité de cr, on a donc i -# j si et seulement si i' -# j '. Sous cette hypothèse,
comme (i,j) E Pou (exclusif) (j,i) E P, (i',j') E Su(P) ou (exclusif) (j',i') E Su(P). On en
déduit que Su(P) est un ensemble de paires de Nn.
2) Puisque Su(P) et P sont deux ensembles de paires de Nn, les valeurs absolues des deux
produits du 2) sont égales. De plus, tout couple (cr(i), cr(j)) de Su(P), le signe de cr(i) - cr(j)
est l'opposé de celui de i - j si et seulement si (i,j) ou (j,i) est une inversion, le premier
produit diffère donc du second d'un facteur multiplicatif égal à (-1) I(rrl. ■
ci
,-<

On en déduit la formule suivante. ..d


u
F'r<>p(?l!litfon 10.25~ Soientl\. ~ 2etu E (Sn, Alors, èn notant 1( ô') le nombre d'inverstpn5
pÔ'll,r ,·tm,,t .ensemble
âe G~' --;>_·,
)- ' ,· - _-
d.e paireiP; de Nn, . . . .. .

PREUVE. Il suffit d'appliquer le lemme 10.24 à un ensemble de paires P de Nn quelconque


et au cas particulier de {( i, j) , 1 ,s; i < j ,s; n}. ■

III.2. La signature par les inversions puis comme morphisme


Définition 10.26. Soient n? 2 et cr E 6n. On pose f( cr) = (-1 )1lrrl, ce nombre est appelé
signature de cr.

10.27. Calculons la signature de cr= (1 Hg


EXEMPLE n = 1.
1 ► Comme > 1, 4 > 3, 6 > 3 et 6 > 5, on dénombre 4 inversions, d'où f( cr)
2

D'une manière générale, toute transposition T de 6n est de signature -1.

T= ( 12 ... ~-1 ~~+1 ... ~-1 ))+1 ...


12 ... i-1 p+l ... J-1 iJ+l ... n
n).
En effet, si T = (i j) avec i < j, les inversions de la permutation T sont

(i, i + 1), (i, i + 2), ... , (i, j), (i + 1, j), (i + 2, j), ... (j - 1, j)

et on en dénombre (j - i) + (j - i - 1) = 2(j - i) - 1.

Proposition 10.28. Soit n ~ 2.


1) Vappticàtion e: (6n,o) ~ ({-l,1}, x) définie par ê(cr) = (-l)Ilo-l est un morphisme de
. groupes.
2) Il n'existe rue
deux morphismes de groupes E : ( 6n,;} -1 {{-1, 1}, x ), le morphisme
· trivial (identiquement égal à 1) et la signature E. · · ·
234

PREUVE. Posons P = {(i,j), 1 ,,:; i < j,,:; n}.


1) Soient cr et cr' dans 6n. On a

( ') = TI
f(YO(J
(crocr')(j)-(crocr')(i)
j-i
(i,j]EP

= TI (cr(cr',°_ll - ~(~'(i)) x TI cr'(j!- ~'(i)


(i,j)EP cr(J)-cr(i) (i,j)EP J-1,
cr(j') - cr(i') TI cr'(j) - cr'(i) ( ) ( ')
TI
(i',j')ESu,(P)
-----X
j'-i'
(i,j)EP
..
J -1,
=fO"fCY

d'après la proposition 10.25.


2) Soit f : (6n,o)-, ({-1, l}, x) un morphisme de groupes. Soient 1,,:; i < j,,:; n. Comme
(1,i)(l,j)(l,i) = (i,j), on a f((i,j)) = f((l,j))f((l,i)) 2 = f((l,j)). On prouve de même que
f( (i, j)) = f( ( 1 , i)) et donc f( (i, j)) = f( ( 1 , j)) = f( ( 1 , i)). Si la valeur commune des f( ( 1 , i))
est 1, <p (( i, j)) = 1 et donc <p = 1, puisque les transpositions engendrent 6n. Sinon, pour
toute permutation (i, j), on a f( (i, j)) = - 1 et donc <p = f puisque les morphismes <p et f
coïncident sur les transpositions qui engendrent 6n. ■

Une décomposition en produit de cycle(s) ou de transposition(s) permet de calculer la


signature d'une permutation cr.

Proposition 10.29.
-
Soit
--:
n .~- 2.
- - - -.
- -
1) La signature d 'undransposition 't de 15n. vaut -1.
2) Bi <1 = 't1 o ..• o 'tm où les 'tt sont des tmnspositions, on a e( cr) :;::::{-l}m..
3) La signature d'un cycle a E 6n vaut (-l)f<0 l--+.

PREUVE.

1) Voir la justification à la page 233.


2) La signature étant un morphisme de groupes, f(cr) = TI;;'= 1 f(-rk) = (-l)m d'après ce qui
précède.
3) Tout cycle cr= (a 1, ... , ap) de longueur p se décompose en un produit de p -1 transpo-
sitions : cr= ( a 1, a 2 )( a 2 , a 3) ... ( ap-l, ap), d'où f( cr) = (-1 )P-l. ■

Regroupons en guise de conclusion les trois manières de calculer la signature d'une per-
mutation cr .

.\IN liucle Calcul de E (cr)


o Calculer le nombre d'inversion(s) N de cr: der)= (-l)N.
o À partir d'une décomposition de cr en produit de permutations plus simples (c'est-à-
dire de signature facile à calculer) en utilisant la propriété de morphisme de la signature.
On pourra par exemple décomposer cr en produit de cycles à supports disjoints ou encore
en produit de permutations.
235

Test 10.17. Test 10.18.


La partie {(1, 3, 2), (1, 2, 3)} est-elle génératrice Calculer la signature de
du groupe ( 63, o) ?
123456)
cr= ( 542163 ·

III.3. Le groupe alterné 2tn


6
Définition 10.30. Soit n ~ 2. On appelle groupe alterné d'ordre n le sous-ensemble 21n
des permutations u E 21n de signature 1.

Comme la terminologie groupe alterné le laisse deviner, (21n, o) est un sous-groupe du


groupe symétrique d'ordre n.

PREUVE. Comme 21n = Ker (c) et E est un morphisme de groupes, (21n, o) est un sous-groupe
de (6n, o). Soit 'T une transposition quelconque de 6n. L'application 'l',, : 21n ----, 21~ définie
par 'l',,(u) ='Tou. L'application 'l',, est bien définie car, pour tout CY E 21n, 'T o CY E 6n et
E('To u) = E('T)E(u) = -1 x 1 = -1 et donc 'l',,(u) E 21~. L'application 'l',, est clairement
1
bijective de bijection réciproque 'l',,----1 : 21~----, 21n définie par 'l',,----1 (u) = 'T- ou. Ainsi l21nl =
121~1 et donc l21nl = 1
6znl = 1f. ■

Test 10.19. Test 10.20.


Dresser la table de Cayley de (sil3,o). ~ est-il un sous-groupe de 6n ?

IV. EXERCICES

10.1. 10.2.

Soient n ? 2 et cr1, cr2 les cycles définis par Soit n ? 2. Déterminer le centre Z de ( 6n, o),
c'est-à-dire l'ensemble des permutations cr'
telles que

cr1=(1,2) et crz=(l,2, ... ,n).


Ver E 6n, cr o cr' = cr' o cr.

Calculer crfcr2cr,m et crfcr1 CTzm pour tout en-


tier naturel m.

6 est un « a » gothique majuscule.


La lettre Ql
236

10.3. 10.6.

Soient n ~ 2, c1 et Cz deux cycles de 6n. Dé- Soient n ~ 2 et <J la permutation de Nn définie


terminer une condition nécessaire et suffisante par
pour que ces deux cycles soient conjugués dans <1(k) = n + 1- k.
6n, c'est-à-dire
Décomposer <J en produit de cycles de supports
disjoints. En déduire la signature de <J.

..... 10.4 .
..... 10.7 .
Soit <JE 610 définie par
Soit n ~ 2. Déterminer les éléments <J de
123 4 5678910) (6n, o) vérifiant <J2 = idll!n.
<J= ( 3571089146 2 .

1. Décomposer en produit de cycles disjoints,


<J 10.8.
puis en produit de transpositions.
2. Calculer la signature de <J. 1. Montrer que deux cycles qui commutent ont
3. Quel est l'ordre de <J dans 610 ? des supports égaux ou disjoints.
2. Deux cycles qui commutent et qui ont le
10.5. même support sont-ils nécessairement égaux ?

Soit n ~ 2. Montrer que S = {-r, c} où 10.9.


-r=(l,2) et c={l,2, ... ,n)
Le groupe 64 contient-il un élément d'ordre 6?
est une partie génératrice de 6n.
COMPLÉMENT 1. GROUPES ET SYMÉTRIE

Du triangle équilatéral au jeu de pile ou face

Dans ce complément nous allons décrire quelques applications fondamentales de la notion de


groupe. L'une de ces applications est même à l'origine de son invention par Évariste Galois,
vers 1830, il s'agit de l'étude de l'effet des permutations des racines d'une équation polynomiale
sur des quantités bien choisies. Nous ne pourrons pas décrire la méthode introduite par Galois
pour montrer que l'équation du cinquième degré ne possède pas de solution générale (un
terme qu'il faut au préalable soigneusement définir), mais nous détaillerons une méthode de
résolution des équations du troisième degré, due à Lagrange et Vandermonde, qui met en
relief l'importance de l'idée de permutation des racines. Auparavant, nous montrerons sur
quelques exemples comment on peut définir la notion fondamentale d'action d'un groupe sur
un ensemble, et sa relation avec l'idée générale de symétrie. Nous terminerons ce complément
par une application de l'idée de symétrie au monde physique, en analysant la notion de hasard
associée au jeu de pile ou face, ou au jeu de dés.
En termes un peu vagues, mais qu'il est bon de garder présents à l'esprit, l'idée générale
que nous allons détailler est la suivante. On s'intéresse à l'étude de certains objets et à
leur modification sous l'effet de certaines transformations. L'ensemble des transformations
considérées forme un groupe. L'ensemble de tous les objets obtenus à partir d'un même objet
en lui appliquant toutes les transformations du groupe s'appelle l'orbite de l'objet sous l'action
du groupe. Les objets qui ne sont pas modifiés par le groupe des transformations sont dits
symétriques, ou invariants, sous ce groupe de transformations. Cette invariance renseigne sur
la structure de l'objet considéré, qu'elle permet d'analyser. Plus généralement, dans le cas où
un objet n'est pas invariant, on essaye de décrire son orbite au moyen d'un petit nombre de
paramètres, qu'on appelle des invariants, et qui renferment aussi beaucoup d'informations sur
la structure de l'objet et ses rapports avec le groupe de transformations considéré.
Nous conseillons au lecteur de revenir à ce passage en italique, dont le sens peut lui paraître
à première vue un peu opaque, lorsqu'il aura lu ce complément où beaucoup d'exemples seront
donnés.

1.1. Symétries des fonctions d'une variable réelle

Nous allons commencer par montrer sur quelques exemples bien connus, liés à l'étude des
fonctions de lR dans IR, ce que nous entendons par les mots transformation, invariance et
symétrie, et en quoi l'existence de symétries permet de mieux comprendre un objet.
1. Les fonctions paires et impaires. Une fonction f : lR ---1 lR est dite paire lorsque
f(x) = f(-x) pour tout réel x, et impaire lorsque f(x) = -f(-x) pour tout réel x. Si l'on sait
qu'une fonction f est paire ou impaire, il suffit donc de connaître ses valeurs en tous les points
de JR- (par exemple) pour la connaître entièrement. La parité et l'imparité d'une fonction ont
des traductions immédiates en termes de graphes. Si f est une fonction paire, les graphes

g+ = {(x, f(x)) x E JR+}


1

de sa restriction à JR- et JR+ sont images l'un de l'autre par la symétrie par rapport à l'axe
des ordonnés. Plus précisément, si Y' est la symétrie de JR 2 définie par Y'(( x, y)) = (-x, y),
alors Y'(Ç-) = g+ et Y(Ç+) = g-. De même, si f est impaire, les graphes g- et g+ sont
images l'un de l'autre par la symétrie par rapport à l'origine : si 'ifo est la symétrie définie
par 'ifo((x, 11)) = (-x, -11), alors 'ifo(Ç-J = g+ et 'ifo(Ç+) = g-. Dans les deux cas, comme le
graphe Ç de f est la réunion g-ug+, la donnée de g- (ou de g+) permet donc de reconstituer
immédiatement le graphe total.

g- g+ g+

g-

FIGURE 10.2. Graphes d'une fonction paire et d'une fonction impaire

Si on ne se pose plus le problème de construire le graphe total à partir d'une restriction,


mais plutôt d'analyser ses propriétés, on est conduit à présenter les remarques précédentes
d'une manière légèrement différente. On voit que le graphe Ç d'une fonction paire est invariant
par l'application Y, c'est-à-dire que Y(Ç) = Ç. En effet, Ç = g- U g+ et

De même, le graphe d'une fonction impaire est invariant par 'ifo : 'if0 (Ç) = Ç.
Une telle propriété d'invariance par une application «simple» s'appelle une symétrie.
Cette terminologie se trouve ici justifiée par le fait que les deux applications Y et 'if0 sont
précisément ce qu'il est convenu d'appeller respectivement une symétrie axiale (ou encore
une réflexion) et une symétrie ponctuelle. Mais le cadre dans lequel la notion de symétrie
se développe naturellement ne se limite pas à ces simples exemples, comme nous allons le
montrer dans ce complément.
2. Fonctions périodiques. L'étude des fonctions d'une variable réelle nous donne aussi
d'autres exemples un peu plus complexes. Soit f une fonction de lR. dans R Une période de
f est un réel T qui vérifie f(x + T) = f(x) pour tout réel x. Clairement O est toujours une
période de f. Si Test une période de f, on dit que f est T-périodique
Si f est une fonction T-périodique, son graphe Ç est invariant par la translation de JR. 2
définie par 'tT: (x,11) H (x + T,11). En effet, si (x,11) E Ç, par définition 11 = f(x) et
donc 11 = f(x + Tl, donc (x + T, 11) E Ç, soit 'tT(X, 11) E Ç, ce qui montre que 'tT(Ç) C Ç.
Réciproquement, il suffit de remarquer que f est aussi (-T)-périodique, ce qui montre que
't_T(Ç) C Ç par le même raisonnement. Enfin, on voit immédiatement que 't-T = (-rTJ- 1 ,
donc (-rT)- 1 (Ç) C Ç, donc Ç C 'tT(Ç) par composition à gauche par 'tT- On a donc montré
l'invariance annoncée : 'tT(Ç) = Ç.
Bien que la translation 'tT ne soit pas une symétrie au sens géométrique du mot, on dit
encore que la propriété d'invariance précédente traduit une symétrie du graphe Ç.
Comme pour les fonctions paires et impaires, cette symétrie est utilisée lors de l'étude
des fonctions périodiques. Pour étudier complètement une telle fonction, il suffit en effet de
l'étudier sur un intervalle de la forme [O, T[, où Test une période (que l'on choisit en général
minimale). En effet, si on connaît le graphe Ç0 de la restriction de f à [O, T[, on en déduit le
graphe Çn de sa restriction à [nT, (n + 1 )T[ (où n E Z*) au moyen de la translation 'tnT· Le
graphe total s'obtient enfin par réunion de tous les graphes Çn·
3. Le point commun. Dans les deux paragraphes précédents, nous avons constaté une
propriété d'invariance d'un graphe par une application (une «symétrie»), et utilisé cette
propriété pour reconstituer ce graphe en connaissant seulement l'une de ses parties.
Une remarque très importante est que si un graphe Q est invariant par une application f,
que nous supposerons bijective de JR. 2 dans JR. 2 , alors il est encore invariant par toute composée
fn pour n EN* (rappelons que tn est l'application obtenue en composant n fois l'application
f). Montrons-le par récurrence. Nous savons que f(Q) = Q. Supposons que fn(Q) = Q, alors

ce qui prouve l'assertion. De même, on voit facilement que f- 1 (Q) = Q en composant l'égalité
g = f(Q) à gauche par f- 1 . Convenons de noter t 0 = Id, et f-n = (f- 1 )n pour n E N*.
Nous avons donc ainsi défini l'application tn pour tout n E z. On vérifie immédiatement que
fn(Q) = g pour tout n E Z.
Nous sommes donc amenés naturellement à considérer toutes les applications tn, n E Z, au
lieu de la simple application f, toutes ces applications sont en effet des symétries du graphe,
et peuvent servir à en réduire l'étude. Dans le cas des fonctions paires et impaires, nous avons
en fait les égalités

yzn = Id, y2n+1 = Y';


ce qui masque la généralité de l'étude, puisque nous ne voyons intervenir que deux applications.
Mais dans le cas des fonctions périodiques

et dans ce cas la possibilité de restreindre l'étude à l'intervalle borné [O, T[ exploite l'existence
de cet ensemble infini {(-rT)n In E Z} de symétries, puisque 9n = (-rT)n(Qo) pour n E Z, ce
qui permet de reconstituer le graphe total.
4. Un premier aperçu sur le groupe des bijections d'un ensemble. Pour unifier les
deux cas de figure que nous venons de rencontrer, et en montrer la généralité, nous allons
maintenant utiliser le vocabulaire de la théorie des groupes.
Soit E un ensemble non vide, et soit 6(E) l'ensemble de toutes les bijections de E dans
E. Le couple (TT(E), o), où o est la loi de composition des applications, est alors un groupe.
D'abord la loi o est interne : la composée de deux bijections est une bijection. L'application
identique IdE (qu'on notera simplement Id s'il n'y a pas de confusion possible) est l'élément
neutre de E. Le symétrique d'une bijection f est son inverse, qu'on note f- 1 . Enfin la loi de
composition est toujours associative : si f, g, h sont trois bijections de E, et six E E

ho (go f)(x) = h((g o f)(x)) = h(g(f(x))) = ho g(f(x)) = (ho g) o f(x),

ce qui montre que ho ( g o f) = (ho g) o f puisque x est arbitraire. On reconnaît bien là les
propriétés que doit vérifier une loi de groupe.
Comme précédemment, si n est un entier > 0, la composée de n applications égales à f
est notée fn, et on note enfin f-n l'application (f- 1 )n. On pose par convention t 0 =Id.Pour
tout n E Z, la notation tn est donc bien définie.
Soit f E TT(E). Par définition, le sous-groupe de 6(E) engendré par f est le plus petit sous-
groupe de 6(E) qui contient f, on le notera< f >. Il est facile de voir que< f >= {fn In E Z}.
En effet, le sous-groupe engendré par f contient ldE, f, et f- 1 (puisqu'il contient f et est un
sous-groupe), et donc aussi fn pour n E Z, donc {fn I n E Z} C< f >. On vérifie d'autre
part facilement que l'ensemble {fn In E Z} est un sous-groupe de S(E), l'inclusion précédente
montre donc qu'il est égal au sous-groupe engendré par f.
On peut maintenant généraliser ce que nous avons vu pour les graphes au cas de parties
quelconques de l'ensemble E. On dit qu'une partie A de E est invariante par une application
f E TT(E) si f(A) = A. On voit alors par récurrence que fn(A) = A pour tout n EN*. En
effet, f(A) = A et si fn(A) = A, alors fn+l (A) = fn o f(A) = fn(f(A)) = fn(A) = A. De
1
même, en appliquant f- 1 aux deux membres de l'égalité f(A) = A, on voit que A= f- (A),
1
donc A est invariant par f- . Il en résulte que f-n(A) = A pour n E N*. On voit donc que
fn(A) = A pour n E z. En conséquence, si une partie A de E est invariante par une bijection
f E TT(E), elle est invariante par tout élément du sous-groupe< f >; en d'autres termes tout
élément de < f > est une symétrie de A.
Il faut maintenant expliquer comment reconstruire A à partir de la donnée de ses symétries
et de l'un de ses sous-ensembles, comme nous l'avons fait pour les graphes. Il n'y a pas de
méthode générale pour le faire, mais on peut cependant en donner une idée assez claire. Bien
que les éléments de < f > laissent A globalement invariante, ils peuvent modifier des parties
de A : il se peut, comme nous l'avons vu pour les graphes, que f(B) -=/ B pour une partie B
de A. On cherche alors une partie B telle que la réunion UhE<f>h(B) = A, et on veut de plus
que cette partie B soit « la plus petite possible» pour exploiter au maximum la donnée des
symétries. C'est exactement ce que nous avons fait dans le cas des graphes.
Ceci explique pourquoi, en général, si une partie B de E est donnée, il est important de
considérer toutes les images h(B) pour h E< f >. L'ensemble formé par toutes ces images
s'appelle l'orbite de B suivant f. On voit que cette orbite est un sous-ensemble de l'ensemble
9(E) des parties de E. Dans le cas des fonctions paires ou impaires, l'orbite du sous-graphe
9- était l'ensemble {9-, 9+}, dans le cas des fonctions périodiques l'orbite du sous-graphe 90
2 2
était Wn I n E Z}. Ce sont bien des sous-ensembles de l'ensemble 9(JR ) des parties de JR. .
Dans les deux cas, la réunion de toutes les parties contenues dans l'orbite donne le graphe
entier, que nous avons donc ainsi reconstruit.
Bien entendu, les exemples que nous avons cités sont trop simples pour que les idées de
théorie des groupes que nous avons introduites soient réellement efficaces ou intéressantes.
Mais les généralisations qu'elles permettent ont montré depuis deux siècles qu'elles sont en
réalité extrêmement profondes, et nous allons en voir quelques-unes dans ce qui suit.
Pour conclure, donnons encore un exemple de fonction élémentaire dont le graphe possède
des symétries intéressantes, la fonction partie entière E : lR --, R Rappelons que pour tout
réel x, la partie entière E(x) de x est l'unique entier vérifiant E(x) :S x < E(x) + 1. Il est
facile de vérifier que E n'est ni paire, ni impaire, ni périodique. Cependant, le graphe 9 de
2
E est invariant par l'application X de JR. 2 dans JR. définie par x(x, y) = (x + 1, y+ 1). En
effet, si x E JR, E(x + 1) = E(x) + 1 puisque E(x) + 1 est un entier et vérifie les inégalités
E(x) + 1 :S x+ 1 < E(x) +2. Si (x, y) E 9, y= E(x), donc y+ 1 = E(x+ 1) et on en déduit que
(x + 1, y+ 1) = x(x, y) E 9, ce qui montre que x(9) c 9. Réciproquement, si (x, y) E x(9),
soit (a, b) = (x - 1, y - 1). Comme y = E(x), on vérifie que b = E(a), ce qui montre que
(a, b) E 9, donc 9 c x(9). Il en résulte bien l'égalité x(9) = 9.
Là encore, le graphe 9 est invariant par toutes les applications du sous-groupe <X>, et
on voit qu'il suffit de se restreindre à l'étude de E sur [O, 1[, puisque si 90 est le graphe de
E [o,i[, alors
1

Dans ce qui précède, nous nous sommes limités au cas où les symétries de l'objet que nous
considérions étaient obtenues par composition d'une seule application. La pratique montre que
c'est très insuffisant, comme nous allons le voir en étudiant le cas d'un triangle équilatéral.
Mais la force des idées de théorie des groupes que nous avons introduites est qu'elles s'adaptent
à cette nouvelle situation sans aucune modification.

1.2. Les symétries d'un triangle équilatéral


Dans cette partie, nous noterons P = JR.2 et nous appellerons plan euclidien le couple (P, d),
où d est l'application de P x P dans lR définie par

L'étude détaillée des propriétés de P, et des propriétés plus générales de géométrie euclidienne,
sera traitée dans le cours de L2. Il suffit ici de savoir que le plan euclidien est le modèle ma-
thématique pour le plan muni de la notion de distance qui nous est familière. En effet, si dans
un plan physique nous traçons deux axes faisant entre eux un angle droit et si nous prenons
sur chacun d'eux la même unité de longueur, ce plan se trouve ainsi muni de coordonnées;
ces coordonnées sont telles que la distance mesurée entre deux points est alors donnée par la
fonction d.

ile B

FIGURE 10.3. Un triangle équilatéral et ses médianes

Dans le plan euclidien P, considérons un triangle équilatéral T = {A, B, C}. Si ~ est une
droite qui n'est pas une des médianes de T, et si Y est la réflexion par rapport à~, on voit sans
peine que Y(~) /.~-En termes usuels, le triangle n'est pas symétrique par rapport à~- Il est
alors facile de voir que l'orbite de~ sous l'action de Y contient exactement deux éléments :
('.)y(T) = {T,Y(T)}. Nous reviendrons dans la suite sur le problème général des orbites, et
allons nous concentrer ici sur l'étude des applications de P dans P qui laissent le triangle T
invariant. II faut immédiatement signaler que nous n'envisagerons pas toutes ces applications,
il y en aurait beaucoup trop et ce ne serait pas très intéressant. Nous nous limiterons aux
isométries du plan, c'est-à-dire aux applications qui préservent la distance entre deux points
de P. II est clair que les réflexions, les rotations et les translations sont des isométries de P,
et un théorème général, que nous verrons dans le cours de l2 montre que toutes les isométries
s'obtiennent comme composées de réflexions, de rotations et de translations.
Il y a manifestement trois réflexions qui laissent le triangle invariant, ce sont les réflexions
par rapport aux médianes. Nous noterons YA, Ys, Yc, les réflexions par rapport aux médianes
passant par A, B et C respectivement. On peut les représenter symboliquement par leur effet
sur les points A, B, C de la manière suivante

AHC) AHB)
5"8 : B H B , Y'c: B HA .
( CHA ( CHC

Il est clair que si deux applications du plan laissent le triangle T invariant, leur composée
le laisse aussi invariant (c'est l'analogue de ce que nous avons vu pour les graphes). Il est par
ailleurs clair que la composée de deux isoméries est encore une isométrie : en effet, si f et g
sont deux isométries, et si a et b sont deux points de P

d(g o f(a), go f(b)) = d(f(a), f(b)) = d(a, b)

donc g o f est aussi une isométrie.


Les applications obtenues en composant Y'A, Y's, Y'c sont donc des isométries qui laissent
T invariant, elles entrent dans le cadre de notre étude. On vérifie facilement que

AHC)
Y'A o Y'c : B HA .
( CHB

Ces deux applications n'entrent pas dans la liste des symétries que nous avons considérées.
Pour les identifier, nous allons faire appel au théorème fondamental suivant, que nous verrons
dans le cours de 12.
Une isométrie du plan est entièrement déterminée par les images de trois points non ali-
gnés.
En d'autres termes, puisque les points A, B, C sont non alignés, si f et g sont deux iso-
métries du plan telles que f(A) = g(A), f(B) = g(B) et f(C) = g(C), alors elles sont égales,
c'est-à-dire que f(M) = g(M) pour tout point M du plan.
Or si O est le centre du triangle T, et si /Jè+ et fJè_ sont les rotations de centre O et d'angles
br/3 et -2n/3 respectivement, il est clair que les images des points A, B, C par /Jè+ et par
Y'A o 5"8 sont égales, et de même les images de A, B, C par fJè_ et par Y'A o Y'c sont égales.
On en déduit que

Nous avons jusqu'à maintenant omis de parler de la plus simple des isométries, l'identité du
plan, que nous noterons Id. Il est clair qu'elle laisse T invariant, elle entre donc aussi dans
notre cadre. Il aurait d'ailleurs été impossible de l'oublier, puisqu'on vérifie par exemple que
Y'A o Y'A = Id, ou encore que /Jè+ o !]è_ = Id.
Nous disposons donc maintenant de 6 isométries différentes qui laissent le triangle T inva-
riant : Id, Y'A, Y's, Y'c, !Jè+, fJè_. Là encore, il est convenu d'appeler chacune d'entre elles une
symétrie de T, bien que seules Y'A, 5"8 , Y'c soient des symétries au sens usuel.
La question naturelle est maintenant de savoir si nous avons identifié toutes les isométries
laissant T invariant. C'est encore le théorème fondamental précédent qui fournit la réponse.
Une isométrie du plan est entièrement déterminée par les images qu'elle associe aux points A,
B et C. Il y a donc autant de telles isométries que de bijections de l'ensemble T = {A, B, C}
dans l'ensemble T. Nous savons qu'il existe 3! = 3 x 2 = 6 bijections de T dans T. Par ailleurs,
comme nous l'avons vérifié, les isométries Id, Y'A, Y's, Y'c, !Jè+, fJè_ déterminent, en restriction
à T, 6 bijections distinctes. Nous avons donc ainsi trouvé toutes les isométries du plan euclidien
P qui laissent l'ensemble T invariant.
Il est très tentant de résumer notre discussion précédente par un tableau récapitulatif. No-
tons î(T) = {Id,YA,Ys,Yc,fl+,fl_} l'ensemble des isométries précédentes. Comme nous
l'avons déjà signalé, si deux isométries laissent T invariant, leur composée est aussi une iso-
métrie qui laisse T invariant. Elle appartient donc à l'ensemble §(Tl, donc la composition
des applications est une loi de composition interne dans î(T). Il est donc possible de dresser
une table de la forme suivante.

0 Id Yc fl+ ,?l_
YA Ys
Id Id Yc fl+ fl_
YA Ys
YA YA Id fl+ ,?l_ Ys Yc
Ys Ys ,?l_ Id fl+ Yc YA
Yc Yc fl+ fl_ Id YA Ys
fl+ fl+ Yc YA Ys fl_ Id
,?l_ ,?l_ Ys Yc YA Id fl+

Dans cette table, nous avons écrit dans la case située à l'intersection de la ligne repérée
par une isométrie f, et de la colonne repérée par une isométrie g, leur application composée
f o g, qui est bien entendu aussi dans î(T). Il est clair que cette table examine toutes les
compositions possibles des applications de î(T). Nous invitons le lecteur à vérifier à la main
l'exactitude de cette table en examinant toutes les composées possibles.
Nous avons déjà remarqué que la composée de deux applications de î(T) est une appli-
cation de î(T). De même, l'inverse d'une application de î(T) est encore une application
de î(T). On peut le vérifier sur la table, ou encore remarquer que l'inverse d'une isométrie
de Pest une isométrie de P, et que l'inverse d'une application qui laisse T invariant laisse T
invariant.
Nous avons donc démontré que î(T) est un sous-groupe du groupe des bijections (TT(P), o)
de l'ensemble P.
Nous allons voir dans ce qui suit que ce fait est général. Mais arrêtons-nous un instant
encore sur la table précédente, et cherchons les sous-groupes de (§(Tl, o ). Ce sont les parties
/ C î(T) pour lesquelles la composition est une loi interne, et qui contiennent les inverses
de chacun de leurs éléments. Un petit raisonnement, joint à l'examen de la table, permet de
trouver tous les sous-groupes de (î (T), o).
1) Il y a d'abord les sous-groupes triviaux {Id} et î(T).
2) Il y a ensuite trois sous-groupes à deux éléments {Id, YA}, {Id, Ys}, {Id, Yc}. Il est bien
sûr possible de donner une table de composition pour ces sous-groupes.

0 Id YA 0 Id Ys 0 Id Yc
Id Id YA Id Id Ys Id Id Yc
YA YA Id Ys Ys Id Yc Yc Id

On peut d'ailleurs remarquer qu'ils se ressemblent étrangement. En termes de théorie des


groupes, on dit qu'ils sont isomorphes.
3) Il y a enfin un sous-groupe à trois éléments {Id,fl+,fl_}.

0 Id fl+ ,?l_
Id Id fl+ fl_
fl+ fl+ ,?l_ Id
,?l_ ,?l_ Id fl+
Il n'y a pas d'autres sous-groupes de (î(T),o) que ceux que nous venons de présenter.
Pour le voir, il suffit de remarquer que si un sous-groupe contient à la fois un élément de
l'ensemble {YA, YB, Yc} et un élément de l'ensemble{.~\,,%'_}, alors il est égal à l'ensemble
î(T) entier. Nous en laissons la vérification au lecteur.

1.3. Le groupe des bijections, orbites et invariance


Nous allons maintenant introduire quelques définitions formelles destinées à éclairer et unifier
les exemples que nous avons décrits, en nous plaçant dans le cadre le plus simple et le plus
intuitif.
On considère un ensemble E. On note 6(E) l'ensemble de toutes les bijections de E dans
E. Lorsque E est un ensemble fini, 6(E) est fini lui aussi, et son nombre d'éléments est n! si
n est le nombre d'éléments de E. Si E est infini, 6(E) est infini.
La composition des applications o est une loi de composition interne dans 6(E) : la com-
posée de deux bijections de E dans E est clairement une bijection de E dans E. De plus, elle
est associative, elle possède un élément neutre Id, et tout élément possède un inverse, puisque
par définition si f E TT(E), f o f- 1 = f- 1 of= Id. La structure (TT(E), o) est donc un groupe.
Soit G un sous-groupe de 6(E). On va chercher à décrire «l'effet» du sous-groupe G sur
l'espace E. Pour cela, pour tout élément x de E, on introduit le sous-ensemble de E formé par
tous les éléments f(x) obtenus lorsque f varie dans G, que l'on appelle orbite de x suivant G,
et que l'on note O (G, x). De manière plus formelle, on pose donc pour x E E
O(G,x) ={f(x) f E G}.
1

L'exemple le plus simple de sous-groupe de 6(E) est G = {Id}. Pour tout élément x de E, on
a dans ce cas O (G, x) = {x}, ce qui traduit le fait que G ne modifie pas l'ensemble E. Il y a
donc autant d'orbites que de points dans E.
Le cas opposé est celui où G = TT(E). Alors pour tout x dans E, 0 (G, x) = E. En effet, si
1J E E, on peut définir l'application fxy de E dans Epar fx11 (x) = 1}, fx11 (y) = x, et fx 11 (z) = z
si z (/:. {x, y}. Cette application f xy est clairement une bijection de E, donc f xy E G. Comme
f xy (x) = 1J, on voit que 1J E O ( G, x), ce qui montre que E C O ( G, x), puisque y est arbitraire.
Comme O (G, x) est un sous-ensemble de E, on en déduit que O (G, x) = E. Il y a donc dans
ce cas une seule orbite, qui est l'ensemble E lui-même.
Bien entendu, comme nous allons le voir, les cas intéressants sont ceux pour lesquels le
sous-groupe G choisi est propre, c'est-à-dire différent des deux cas triviaux {Id} et 6(E). On
peut dans tous les cas établir une propriété très importante des orbites. Notons D l'ensemble
formé par toutes les orbites des points de E. Alors les éléments de D réalisent une partition
de E, au sens où
1) une orbite est toujours non vide
2) deux orbites distinctes sont disjointes
3) la réunion de toutes les orbites est égale à E.
Pour montrer ces propriétés, il suffit d'établir l'existence d'une relation d'équivalence sur
E dont les classes d'équivalence sont exactement les orbites suivant G. On sait en effet que les
classes.d'équivalence forment une partition de l'ensemble sur lequel la relation d'équivalence
est définie. Pour cela, on introduit la relation R sur E définie par
V(x, y) E E2 , x R 1J si et seulement si il existe f E G tel que y= f(x).
Cette relation R est une relation d'équivalence sur E. Pour voir qu'elle est réflexive, notons
que l'application identique Id est dans G (puisque c'est l'élément neutre de 6(E)) et vérifie
x = Id( x), donc x R x. Elle est symétrique, puisque si x et 11 sont des éléments de E vérifiant
x R 11, il existe une application f E G telle que 11 = f (x), et donc x = f- 1 (11), mais f- 1 E G
puisque G est un sous-groupe, donc x R 11- Enfin, elle est transitive, puisque si x, 11, z dans
E vérifient 11 R x et z R 11, il existe deux applications f et g dans G telles que 11 = f (x) et
z = 9(11), donc z =go f(x), mais go f E G puisque G est un sous-groupe, ce qui montre que
z R x, ce qui termine la preuve.
Les classes d'équivalence de R sont les orbites suivant G. En effet, si x E E, l'orbite
0 (G, x) est exactement l'ensemble des éléments de E qui s'écrivent 11 = f(x) pour f dans G,
c'est donc l'ensemble des points 11 de E tels que 11 R x, soit la classe d'équivalence de x.
Nous venons donc de voir que l'effet de G sur E se traduit par une partition de E en
orbites. Mais un élément x E E étant donné, il est aussi intéressant de considérer l'ensemble
des éléments f de G qui laissent x invariant, c'est-à-dire tels que f(x) = x. On définit ainsi le
stabilisateur de x par
Stab(x) = {f E G I f(x) = x},
c'est donc une partie de G. Nous allons voir que le stabilisateur de x est un sous-groupe de G.
D'abord clairement Id E Stab(x). Soit f dans Stab(x). Alors de l'égalité f(x) = x on déduit
que
x = f- 1 (f(x)) = f- 1 (x)

et donc que f- 1 E Stab(x). Si maintenant f et g sont deux éléments de Stab(x), on obtient


go f(x) = g(f(x)) = g(x) = x, donc go f E Stab(x), ce qui montre que go f est dans Stab(x).
Il en résulte bien que Stab(x) est un sous-groupe de G.
Nous avons donc deux manières de considérer l'effet du sous-groupe G : la première consiste
à étudier comment il modifie les points de E, ceci conduit à la notion d'orbite, qui est une
partie de G ; la seconde consiste à étudier les propriétés d'invariance des points de E et conduit
à la notion de stabilisateur d'un point, qui est un sous-groupe de G.

Avant d'aller plus loin, remarquons que ce qui vient d'être dit s'étend sans difficulté au cas
des parties de E. En effet, si P est une partie de E, et si f E G, on définit de manière usuelle
f(P) = {f(x) x E P} CE. On peut alors définir l'orbite de la partie P suivant G
1

0 (G, P) = {f(P) f E G}.


1

Il faut bien noter que O (G, P) est une partie de l'ensemble &(E) de toutes les parties de E,
puisque chaque élément f(P) est une partie de &(E), alors que l'orbite d'un point x de E est
une partie de E. On peut montrer exactement de la même manière que pour les points de E
que les orbites {O (G, P) P E &(El} réalisent une partition de &(E).
1

On définit aussi le stabilisateur de P par

Stab(P) = {f E G I f(P) = P}.

Le stabilisateur d'une partie est donc l'ensemble des bijections de G qui la laissent invariante.
C'est ce stabilisateur que nous avons déterminé dans le cas du triangle équilatéral, lorsque G
est le sous-groupe de 6(P) formé par les isométries euclidiennes.
Les notions ainsi définies pour les parties prolongent les précédentes, puisqu'on note im-
médiatement que six E E, Stab({x}) = Stab(x), et que l'orbite du singleton {x} est l'ensemble
de tous les singletons formés par les éléments de O ( G, x).
Là encore, l'effet d'un sous-groupe G sur les parties de E s'étudie à deux niveaux, d'une part
l'orbite d'une partie renseigne sur les modifications induites par G, alors que le stabilisateur
d'une partie décrit ses propriétés d'invariance suivant G.
Terminons par une remarque pour inviter le lecteur à imaginer d'autres constructions
à partir des mêmes idées. Nous venons de décrire l'effet d'un sous-groupe de 6(E) sur les
parties de E ; tout ce qui a été dit se transpose sans aucune modification au cas des parties
de E à nombre d'éléments fixé. Soit en effet n E N*, et soit D"n(E) l'ensemble des parties
à n éléments de E. Si f E $6(E), et si P E D"n(E), alors f(P) E D"n(E). En conséquence,
il est possible de définir l'orbite de P suivant un sous-groupe G de 6(E), qui est une partie
de D"n(E), et l'ensemble des orbites suivant G réalise une partition de D"n(E). On pourrait
aussi examiner l'effet de G sur les n-uplets d'éléments de E, en posant f(x1, Xz, ... , Xn)
(f(xi), f(xz), ... , f(xnll, et on peut ainsi imaginer de multiples situations analogues.

1.4. Qu'est-ce qu'une géométrie?

Nous allons maintenant montrer comment les idées que nous avons évoquées dans les parties
précédentes s'appliquent naturellement à la définition de la notion de géométrie.
Il existe dans les constructions mathématiques de nombreux exemples d'ensembles E et de
sous-groupes de 6(E) dont la structure est très bien connue. Donnons-en quatre.
• Les espaces vectoriels E pour lesquels il est particulièrement intéressant de considérer le
sous-groupe GL(E) de 6(E) formé par toutes les applications linéaires bijectives de E dans E.
• Lorsque E = lRn, avec n 2': 1, on peut définir la distance de deux éléments x = (x 1, ... , Xn)
et 1J = (x1, ... , 1:Jnl de lRn par

et on peut considérer le sous-groupe de 6(1Rn) formé par toutes les applications de GL(JRn)
qui préservent la distance entre deux points, c'est-à-dire des applications f E GL(lRn) pour
lesquelles d(f(x), f(11)) = d(x, 11) pour tous points x et 1J de lRn. Ce sous-groupe est noté
0 (JRn) et est appelé groupe des isométries linéaires euclidiennes de ]Rn_
• On peut aussi considérer le sous groupe de 6 (JRn) formé par toutes les applications de
O(JRn) dont le déterminant dans la base canonique de ]Rn est égal à 1. Ce sous-groupe est
noté SO(lRn), c'est le groupe des isométries linéaires euclidiennes directes de lRn.
• Plus généralement, on peut considérer le groupe Isom(JRn) formé par toutes les bijections
(pas forcément linéaires) de ]Rn dans ]Rn qui préservent la distance d. Il est donc plus gros
que O(lRn), c'est le groupe des isométries affines euclidiennes de ]Rn_ On peut montrer qu'une
telle isométrie est la composée d'une isométrie linéaire et d'une translation.
Ces exemples de groupes sont très bien compris, la structure de leurs éléments est « facile
à décrire». Nous limitons là notre liste, mais les exemples sont encore très nombreux.

Examinons maintenant quelques questions traditionnelles en géométrie élémentaire dans le


plan : définition des longueurs, définition des angles, caractérisation des triangles rectangles,
propriétés des carrés, etc. Nous avons vu comment définir des longueurs en introduisant la
distance entre deux points de P = JR 2 comme fonction de leurs coordonnées. La définition des
longueurs entraîne ensuite la construction de divers groupes, dont nous retiendrons le plus
gros, Isom(P). Rappelons que tout élément de Isom(P) est la composée d'une reflexion, d'une
symétrie, et d'une translation.
Nous avons vu comment étudier l'effet d'un sous-groupe de 6(P) sur les parties de P, par
l'intermédiaire de la notion d'orbite. On peut même ici aller un peu plus loin, et se limiter à
certaines parties spécifiques, comme par exemple celles de cardinal fixé.
Dans ce cadre, l'idée de géométrie peut elle-même être généralisée : il suffit de considérer
d'autres ensembles, et d'autres groupes, comme par exemple ceux de la liste que nous avons
commencée plus haut. C'est là l'idée originale de Felix Klein, que nous retrouverons souvent
dans la suite.

1.5. Les groupes en action


Nous avons vu l'intérêt de l'étude du groupe des bijections d'un ensemble, et de ses sous-
groupes. Dans de nombreuses situations cependant, on ne travaille pas directement avec les
bijections d'un ensemble, mais on dispose d'un groupe qui agit « à distance» sur cet ensemble.
C'est ce que nous allons illustrer dans cette partie au moyen d'un exemple qui nous sera utile
par la suite.
Nous noterons Nn = {l, 2, ... , n} et 6n = TT(Nn) l'ensemble des bijections de Nn dans Nn
Le groupe (6n, o) est appelé groupe symétrique de Nn, son cardinal est n!.
Donnons nous un ensemble F, et considérons maintenant l'ensemble des fonctions de en
dans F, que nous noterons §. Des éléments cr de 6n et f de§ étant donnés, il est possible
de définir une fonction g de § par

Cette fonction g sera notée cr * f. On voit donc apparaître une « loi de composition ex-
terne » entre les éléments de 6n et les fonctions définies sur en. Avant d'aller plus loin,
notons que cette idée permet de mettre en évidence des propriétés naturelles des fonctions de
§. Par exemple, on dit qu'une fonction f de§ est symétrique lorsque

pour tout (x 1, ... , Xn) E en et tout cr E 6n- Ceci traduit le fait qu'elle garde la même valeur
lorsque ses variables sont permutées de manière arbitraire. Avec notre nouvelle notion, une
fonction f est symétrique si et seulement si cr* f = f pour tout cr E 6n.
Cherchons maintenant quelles sont les propriétés de cette loi de composition externe *·
On voit d'abord que Id* f = f pour toute fonction f de § (Id désignant toujours la bijection
identité de Nn)- Ensuite, si cr et T sont donnés dans 6n, et f dans§, et si (x 1, ... , Xn) E en

Pour exprimer le second membre, posons 1Jk = X"(kJ pour 1 ::; k ::; n. On obtient alors

[cr* (T* f)l(x1, ... , Xn) = (T* f)(y1, ... , Yn) = f(Y-r(l), ... , Y-r(n))
= f(XCJ(-r(l)), ... , XCJ(-r(n))) = [( cr o -r) * f](x1, ... , Xn).
Comme cette égalité est vérifiée pour tout (x 1, ... , Xn) E en, il en résulte l'égalité des applica-
tions cr*(T*f) et (cro-r)*f. Pour tout élément cr E 6n, on considère maintenant l'application
<D" de § dans § définie par

Montrons que <D" est une bijection de §. Pour cela, il suffit de mettre en évidence une
application 'l' : § ---, § telle que 'l'o <D" = <D" o 'l' = Id.9". On voit que l'application 'l' = <D cr'
convient. En effet
donc <D " 1 o <Do- = Id.fi<, et on raisonne de même pour <D" o <D" 1 .
Nous avons donc en fait construit une application <D de 6n dans l'ensemble des bijections
6(ff) : il suffit de poser <D( cr) = <De, pour tout cr E 6n. Cette application <D est un morphisme
du groupe (6n, o) dans le groupe (TT( ff), o), comme le montrent les propriétés que nous venons
d'établir.
Cet exemple va nous servir de motivation pour la définition suivante.

Définition 10.32. Soit ( G,@) un groupe, et soit E un ensemble. Une action de G sur E est
un morphisme de G dans le groupe des bijections 6(E).

C'est précisément cette définition qui modélise l'idée d'action « à distance» que nous
cherchions. Le groupe G n'est plus supposé être un sous-groupe de 6(E), mais il est simplement
envoyé dans 6(E) par un morphisme. Soit <D : G---, 6(E) un tel morphisme. Alors pour g E G,
<D(g) est un élément de 6(E), et six E E, (<D(g))(x) est à comprendre comme le transformé
de x par l'action de l'élément g. Pour cette raison, on note

g *X= (<!J(g))(x).

On voit qu'on retrouve la notation précédente pour l'action de 6n sur ff.


Nous avons déjà rencontré sans le dire de telles actions. En effet, lorsque G est un sous-
groupe de 6(E), l'injection canonique de G dans 6(E) est un morphisme de (G,o) dans
(6(E), o ), que l'on peut noter <D, ce qui permet de faire entrer tout ce que nous avons dit pré-
cédemment dans le cadre des actions de groupes sur un ensemble. Avec la notation précédente,
on aura
hx=f(x)

pour f E G et x E E. Bien entendu, dans ce cas, il s'agit d'une formalisation inutile, elle
n'ajoute rien à ce que nous avons déjà dit. Mais par exemple lorsqu'on envisage l'effet de G
sur les parties de E, comme nous l'avons fait, nous somme déjà en présence d'une véritable
action de groupes, puisque G n'est plus un sous-groupe de 6(.9(E)). On a dans ce cas

hP =f(P)

pour P E &(E) et f E G. Enfin, dans le cas des parties de cardinal fixé, ou des n-uplets,
l'action se définit de manière analogue.
Terminons cette partie en généralisant à notre nouvelle notion d'action de groupe l'idée
d'orbite et de stabilisateur.

Définition 10.33. Soit (G,@) un groupe, et soit E un ensemble. Soit <D une action de G
sur E. On note g * x = (<D(g))(x) pour g E G et x E E. Pour x E E, on pose

O(G,x) ={g*xl g E G}, Stab(G,x) ={g E G 19*X=x}.

On dit que O (G, x) est l'orbite de x sous l'action de G, c'est une partie de E, et que
Stab( G, x) est le stabilisateur de x.

On montre exactement comme nous l'avons fait plus haut que les orbites suivant l'action
de G forment une partition de E, et que Stab(G, x) est un sous-groupe de G.
1.6. L'équation de degré trois et les résolvantes de Lagrange
La formule de résolution de l'équation du second degré est très simple et bien connue. Nous
avons aussi rencontré la formule de Cardan, qui permet la résolution de l'équation du troisième
degré. Il est aussi possible de donner des formules explicites pour la résolution de l'équation
du quatrième degré. Il se pose donc naturellement la question de l'existence de formules
générales permettant la résolution des équations polynomiales de degré quelconque. C'est à
Niels Abel et surtout à Évariste Galois que l'on doit la preuve qu'il est impossible de trouver
une formule générale de résolution pour les équations de degré supérieur ou égal à 5. La preuve
de Galois a marqué un tournant dans l'histoire des mathématiques, c'est en effet la première
fois que l'idée de groupe est apparue et a été utilisée de manière systématique. Il s'agissait
en l'occurence d'analyser l'effet des permutations des racines sur certaines quantités pour en
déduire la non-existence de formules de résolution.
Nous ne pourrons pas décrire ici la totalité de la méthode de Galois, nous la rencontrerons
de nouveau dans la suite du cours. Mais il est déjà possible, et fructueux, d'utiliser les idées
mises en place dans les parties précédentes pour analyser l'existence et la structure d'une
formule de résolution des équations du troisième degré. Cette méthode est due à Lagrange et
Vandermonde, et diffère notablement de celle de Cardan.
Commençons auparavant par examiner la résolution bien connue de l'équation du second
degré. Considérons donc deux complexes b et c, et cherchons à résoudre l'équation

x 2 + bx+c = 0,
où le coefficient de x 2 a été choisi égal à 1, ce qui ne restreint pas la généralité. On écrit
traditionnellement le trinôme sous forme canonique, ce qui conduit rapidement à la solution.
Nous voulons ici indiquer une méthode plus adaptée à une généralisation. Pour cela, nous
allons remarquer qu'il est possible de calculer la somme et le carré de la différence des racines
au moyen des coefficients b etc de l'équation. En effet, si x 2 + bx + c = (x - ri)(x - r 2), on
voit par identification que r 1 + r2 = -b et r 1r 2 = c, on obtient donc

r1 + r2 = -b et (r1 - r2) 2 = (r1 + r2J2- 4r1r2 = b 2 -4c.


Soit d l'une des racines carrées de b 2 - 4c. Alors r, - Tz = d ou r 1 - r 2 = -d. Il en résulte
que l'ensemble des solutions est donné par

{ r,, r2} = { ½[r1 + r2 + (r1 -r2)l, ½[r, + r2 - (r 1 -r2)l} = {½[-b + dl, ½[-b - d] },

et on retrouve bien les formules usuelles (nous avons utilisé la notation ensembliste pour éviter
l'ambiguité due à la numérotation des racines).
Cette méthode de résolution a deux clés principales. La première est la possibilité de
calculer les expressions r, + r2 et (r 1 - r 2)2 en fonction des coefficients du trinôme. Le point
essentiel est que ces calculs ne font intervenir que des sommes et des produits des coefficients b
etc, et des constantes explicitement connues. Ces expressions sont donc des «polynômes» en
les coefficients b et c, nous allons en donner une définition précise dans ce qui suit.
La seconde clé est la possibilité de retrouver les racines au moyen des deux expressions
précédentes. Pour cela, il est nécessaire d'extraire une racine carrée, celle de l'expression
polynomiale b2 - 4c. L'ensemble des solutions est donc obtenu à partir des coefficients de
l'équation au moyen de sommes, produits, produits par des constantes, et extraction d'une
racine carrée.
Nous allons voir comment généraliser cette approche au cas des équations de degré 3,
en séparant la partie de la résolution qui ne fait intervenir que des calculs polynomiaux en
fonction des coefficients de l'équation, et celle qui conduit à l'expression finale des solutions,
qui repose sur l'extraction de racines de degré convenable. C'est dans la première partie que
la notion de symétrie va s'avérer cruciale.
1. Les fonctions symétriques des racines. Soit n E N*. Une fonction polynôme sur en
est une fonction P de en dans e définie par

L
(k1 ,... ,kn )EN
k1 kn
fi(k1 ,... ,kn)Xl · · · Xn

où N est une partie finie de Nn, et où les coefficients a(ki ,... ,knl sont dans C. Par exemple, la
fonction définie par P(x 1 , x 2 , x 3 ) = 3xfx~x1 + 8ix1x~X3 + Sx~x~xi est une fonction polynôme
sur e3 .
Il faut voir ici les fonctions polynômes sur en comme les fonctions « les plus simples »,
au sens où elles ne font intervenir que des sommes et produits de variables et de constantes
explicitement connues, et ne requiert pas d'extraction de racines (ou de fonctions plus com-
plexes).
On dit qu'une fonction polynôme sur en est symétrique lorsque cHP = P pour tout cr E 6n.
Il est possible de montrer que pour que P soit symétrique, il faut et il suffit que cr(N) = N
pour tout cr E 6n, et que fi(a(ki), ... ,a(knll = fi(k, ,... ,knl pour tout (k1, ... , kn) EN. Par exemple,
la fonction définie par P(x1, x2, x3) = xfx~+xfxi+x~xi est une fonction polynôme symétrique
sur e3 .
Une classe très importante de fonction polynômes symétriques apparaît lors de l'étude des
équations polynomiales dans C. Considérons l'équation

(E)

où ak E e pour O::; k < n. On sait qu'elle possède n racines complexes (comptées avec leur
multiplicité), que nous noterons ri, ... , Tn. Il est donc possible d'écrire l'égalité

Un développement du deuxième membre et une l'identification des coefficients, dont nous


laissons le soin au lecteur, conduit aux égalités suivantes

= -an-1
r1 + r2 + · · · + Tn
r1r2 + r1r3 + · · · + Tn-JTn = Un2
r1r2r3 + r1r2r4 + · · · + Tn-2Tn-1Tn = -Un-3

On voit que les premiers membres de ces égalités définissent des fonctions polynômes symétri-
ques. Plus précisément, introduisons les fonctions polynômes .s 1 , ... Sn sur eN définies par les
expressions
.51 (X1, ... , Xn) = XJ + X2 + · · · + Xn,
.52(X1, ... , Xn) = X1X2 + X1X3 + · · · + Xn-JXn,
.53(X1, ... , Xn) = X1X2X3 + X1X2X4 + · · · + Xn-2Xn-1Xn,
On voit facilement que s 1, ... Sn sont symétriques. On les appelle fonctions polynômes symé-
triques élémentaires sur en. Leur importance dans notre problème de résolution des équations
polynomiales vient d'un remarquable théorème, dû à Newton, dont voici l'énoncé.
Soit P une fonction polynôme symétrique sur en. Alors il existe une fonction polynôme <l>
sur en telle que

Nous ne démontrerons pas ici ce théorème, mais nous nous limiterons à montrer son
intérêt dans notre problème. Revenons à l'équation (E), et considérons une fonction polynôme
symétrique P sur en. Une question importante, comme nous le verrons, est de calculer la valeur
de Pau point (r 1, ... , rn) E en formé par les racines de (E) (on notera qu'il est inutile de
spécifier l'ordre dans lequel les racines sont énumérées, puisque le polynôme est symétrique).
Nous avons remarqué que les valeurs des fonctions SJ, ... ,sn au point (r1, ... ,rn) ont des
expressions très simples en fonction des coefficients de l'équation

Il résulte alors immédiatement du théorème de Newton qu'il existe une fonction polynôme 1Jl
sur en telle que
P(r1, ... , rn) = 1Jl( ao, ... , Un~il•
Il faut voir là que la valeur prise par P sur le n-uplet(r1, ... , rn) formé par les racines de
l'équation peut être exprimée de manière polynomiale au moyen des coefficients de l'équation,
c'est-à-dire en ne faisant intervenir que des sommes et produits de ces coefficients. De plus,
il est possible dans la pratique de calculer le polynôme 1Jl. Pour simplifier, nous ne nous
préoccuperons pas du problème du calcul effectif de 1Jl dans ce qui suit.
2. L'équation du troisème degré. Nous pouvons maintenant mettre en application les idées
générales qui précèdent et envisager le problème de la résolution de l'équation du troisième
degré. Considérons donc une équation de la forme

x 3 +px+ q =0 (T)
ce qui ne restreint pas la généralité, puisque toute équation du troisième degré se ramène à
cette forme par un changement d'inconnue de la forme x----, x + IX. Notons r 1, r 2 , r 3 les racines
de cette équation.
Nous allons considérer la fonction polynôme sur e 3 définie par

u(x1,x2,X3) = (x1 +ix2+fx3) 3


où j = (1 -iv13)/2 est une racine cubique de l'unité. Nous allons étudier l'orbite de u suivant
l'action* du groupe symétrique 6 3 sur les fonctions de e 3 . Il faut auparavant introduire une
notation pour les éléments de 63, que nous avons d'ailleurs déjà rencontrés. On pose

1 H2)
21H1)
H3 (1H3)
( 3H2 , 2H 2 ,
P1 : Pz : p3: 2H 1 ,
3H1 ( 3H3

C+ : 21 H2)
H 3 , c_ :
(12 H3)
H 1
( 3H1 3H2
Étudions maintenant l'action de 6 3 sur u et v.
1) On sait que Id *U = u.
3
2) C+*U(X1,X2,x3) =U(Xc+(1J,Xc+(2),Xc+(3)) =u(x2,X3,X1) = (x2+jx3+j2x,)
= (j2(x1 + jxz + j2x3))3 = (x1 + jxz + j2x3) 3 = u(x1, X2, X3)
donc c+ * u = u.
3) c_ * U = (C+ )2 * U = C+ * ( C+ * U) = C+ * U = U
donc c_ *U = u.
3
4) Pi* u(x1, x2, X3) = u(xp 1 (1), Xp 1 (2), Xp 1 (3Jl = u(x1, X3, x2) = (x1 + jx3 + i2x2) .
3
Cette expression est nouvelle, nous noterons v(x1, X2, X3) = (x1 + jx3 + i2x2) .
3
5) P2*U(X1,X2,x3) =U(Xpz(l),Xpz(2),Xpz(3)) =u(x3,X2,X1) = (x3+jx2+i2x1)
2 3
= (j2(x1 + jx3 + i2x2))3 = (x1 + jx3 + j x2) = v(x1, Xz, x3),
donc Pz*U=V.
2 3
6) p3*U(X1,X2,X3) =U(Xp3(l),Xp3(2),Xp3(3)) =u(x2,X1,X3) = (xz+jx, +j x3)
3 3
= (Hx1 + jx3 + i2x2)) = (x1 + jx3 + i2x2) = v(x1, X2, X3),
donc p3 * u = v.
Il en résulte donc que l'orbite de u suivant l'action* est l'ensemble {u, v}. Cette remarque
est cruciale, elle va nous permettre de former des fonctions polynômes symétriques qui vont
nous donner les solutions de l'équation (T). Remarquons auparavant que l'on peut décrire
aussi très simplement l'orbite de v suivant*·
Considérons les fonctions polynômes S et P sur C 3 définies par

Alors si CJ E 6 3, nous avons deux possibilités : soit CJ * u = u et CJ * v = v, soit CJ * u = v


et CJ * v = u. Il en résulte que

CY*S = (CY*U) + (CY*V) =u+v = s, CY* p = (CY*U)(CJ*V) =UV= p

et les fonctions polynômes S et P sont donc symétriques.


En vertu du théorème de Newton et de son corollaire, il est donc possible d'exprimer
les valeurs S(r1, r 2, r 3) et P(r1, r 2, r 3) de manière polynomiale en fonction des coefficients de
l'équation (T). Nous ne chercherons pas ici à calculer ces polynômes (ce qui est possible),
nous les supposerons explicitement connus. Il est donc possible de calculer s' = S(r 1, r 2, r 3) et
iJ = P(r 1, r2, r3) en fonction de pet q au moyen de sommes et produits.
Il en résulte donc que -Q, = u( r 1, r2, r3) et\) = v( r1, r2, r3) sont les racines de l'équation du
second degré
z2 - s'z + iJ,
que l'on sait évidemment résoudre. Il en résulte que -Q, et\) peuvent être exprimés en fonction
de p et q au moyen de sommes, produits, et extraction de racine sarrées. Plus exactement,
comme nous l'avons remarqué, c'est l'ensemble {-Q,, \)} qui peut être explicité de cette manière.
Il nous reste donc à voir comment exprimer les racines r1, r 2, r 3 en fonction de îl, \}_ C'est
encore Lagrange qui donne la méthode la plus achevée pour résoudre ce problème. L'idée,
astucieuse, est de remarquer que la fonction polynôme w définie par

est symétrique. On en laisse la vérification au lecteur. Il est donc possible d'exprimer w( r 1, r 2, r 3)


en fonction de p et q en n'utilisant que des sommes et des produits, là encore, nous ne ferons
pas le calcul explicite.
Alors il est facile de montrer que l'ensemble des racines de l'équation Test

{Hx +t+ ~), ½(x+ jt + i:), ½(x +jt + i:)}.


Ceci termine notre exposé la méthode de résolution des équations de degré 3 suivant Lagrange
et Vandermonde. Nous laissons au lecteur le soin d'expliciter les calculs des polynômes ex-
primant les fonctions symétriques des racines en fonction des coefficients, notre but ici était
surtout de montrer le rôle joué par les permutations de racines dans la recherche de formules
de résolution. Comme nous l'avons indiqué, ces idées sont les bases à partir desquelles Galois
a construit la notion de groupe que nous utilisons aujourd'hui. Les idées de Galois seront
développées dans les cours de L2 et L3.

1. 7. Hasard et symétrie : pile ou face et jeu de dés

Nous terminons ce complément par un exemple d'utilisation de la notion de symétrie en phy-


sique. Nous voulons montrer sous quelles hypothèses le jeu de pile ou face donne des issues
équiprobables, au sens où un grand nombre de tirages aboutit à des nombres approximative-
ment égaux de résultats pile et de résultats face. On attribue souvent ce fait à la complexité
du mouvement de la pièce lorsqu'elle est lancée, ou à celle des rebonds sur la table sur la-
quelle elle rebondit. Nous allons montrer qu'il n'en est rien, et que la seule cause de cette
équiprobabilité est à chercher dans les conditions initiales du tirage. En d'autres termes, c'est
au joueur et à son ignorance des conditions du mouvement de la pièce qu'il faut attribuer le
caractère aléatoire du jeu de pile ou face. Notre méthode s'adapterait aussi au cas du lancer
de dés, mais nous nous limiterons au jeu de pile ou face pour ne pas alourdir la présentation.
Nos raisonnements comporteront une partie de formalisation intuitive, qu'il sera facile de
rendre rigoureuse dans la suite du cours, et qui n'influe aucunement sur la validité de nos
arguments
1. Aire, volume et hasard. Nous avons d'abord besoin d'une formalisation de la notion de
hasard, que nous allons illustrer par un exemple. On considère un grand champ rectangulaire,
sur lequel une rangée d'arbres est plantée le long d'une des lignes médianes. Cette ligne
délimite deux demi-terrains A et B. On choisit un jour de grand vent, qu'on suppose souffler
par bourrasques et tourbilloner de manière imprévisible, dans toutes les directions. Une feuille
se détache d'un arbre voisin et tombe sur le terrain. On s'accorde à dire que la probabilité
qu'elle tombe sur chacun des demi-terrains est la même. Une manière d'illustrer cette idée
de probabilité est que si un très grand nombre de feuilles se détachent au même moment, on
s'attend à en retrouver la moité d'un côté et l'autre moitié de l'autre côté du terrain.
Deux arguments nous conduisent à cette conclusion : le vent est imprévisible et tourbillone
dans toutes les directions, et les deux parties du terrain ont la même forme et la même aire.
Nous pouvons d'ailleurs généraliser cette hypothèse : sur le terrain sont délimitées deux zones
de formes totalement arbitraires et de même aire (donc égale à la moitié de celle du terrain),
alors la conclusion restera valable.
On voit donc que l'analyse de cette expérience contient deux niveaux : l'un d'eux est
l'égalité des deux aires des parties concernées, ce fait est totalement indépendant des conditions
de l'expérience, et par ailleurs parfaitement vérifiable. L'autre est le caractère désordonné des
mouvements de l'air tourbillonnant. Ce dernier est très difficile à préciser complètement et
pratiquement impossible à tester expérimentalement, néanmoins l'issue de l'expérience ne fait
de doute pour personne.
Ce que nous voulons montrer dans cette partie est que le jeu de pile ou face comprend lui
aussi deux niveaux d'interprétation, de même nature que ceux qui précèdent; il s'agit d'une
part de la main de l'homme qui lance la pièce, et d'autre part du mouvement propre de la pièce
(trajectoire dans l'espace et multiples rebonds sur la table). Il n'est pas clair a priori de savoir
si le caractère aléatoire que l'on attache à cette expérience provient de l'un ou l'autre de ces
niveaux, ou des deux simultanément. Nous allons voir que la symétrie de la pièce montre que
son mouvement propre n'apporte rien à ce caractère aléatoire, qu'il convient donc d'attribuer
entièrement à l'indétermination du lancer. Dans cette expérience, le rôle du vent est joué par
la main du joueur.
Pour cela, nous allons montrer que les conditions initiales de lancer peuvent être divisées
en deux parties exactement de même «volume» (qu'il faudra définir convenablement), l'une
conduisant au résultat pile, l'autre au résultat face. Ces deux parties ne seront pas explicite-
ment connues (aucune expérience ne permettrait d'ailleurs de les déterminer complètement).
C'est la seule symétrie de la pièce par rapport à la tranche qui nous permettra de conclure.
La notion de volume que nous ferons intervenir est une petite généralisation de celle de l'aire,
nous n'en donnerons pas une construction complète (ce que nous pourrons faire dans la suite
du cours) mais elle sera suffisante pour notre propos.
2. La pièce. Pour simplifier notre étude, nous supposerons que la pièce est un cylindre de
révolution, dont la hauteur est très petite par rapport au diamètre, parfaitement symétrique
par rapport à son plan médian (c'est-à-dire le plan perpendiculaire à l'axe de révolution
passant par le centre de la pièce). Elle ne comportera donc pas les dessins usuels portés par
le côté pile et le côté face, car elle ne serait alors plus symétrique. Nous noterons r le rayon
du cylindre. Pour distinguer ces deux côtés, nous supposerons seulement qu'ils portent deux
couleurs différentes, par exemple rouge pour pile, et bleu pour face. Mais nous continuerons
à les désigner par pile et face.
Une pièce réelle n'étant pas exactement symétrique par rapport à son plan réel, notre
étude n'est donc qu'une approximation de cette réalité. Mais il s'agit sans aucun doute d'une
très bonne approximation.
3. Les conditions initiales du lancer. Pour simplifier, nous supposerons que la pièce est
lancée sans tourner sur elle-même. Nous pourrions aussi tenir compte des mouvements de
rotation, l'analyse serait un peu plus complexe, mais sa conclusion serait inchangée.
Nous devons donc définir sous cette hypothèse la condition initiale du mouvement. Il faut
d'abord définir la position initale de la pièce. Nous supposerons l'espace muni d'un repère qui
nous permet de l'identifier à IR 3 (par exemple les axes sont portés par les arêtes entre deux
murs et ces murs et le plancher d'une même salle). Nous supposerons que la pièce tombe sur
le sol, représenté dans notre repère par P = {(x,y,z) E IR 3 I z = O}, alors que la salle est
située au-dessus: S = {(x,y,z) E IR 3 z?: O} (nous supposons la salle infinie et ne nous
1

préoccuperons pas des murs, comme il est d'usage en physique).


Le centre G de la pièce doit être repéré par ses coordonnées dans le repère. Nous suppo-
serons que ce centre est initialement à une certaine hauteur, plus grande que son rayon, pour
que toutes les orientations de la pièce dans l'espace soient possibles. On suppose donc que
GE Ç, avec Ç = {(x,y,z) E IR 3 I z?: p} et p > r.
Il faut ensuite définir l'orientation de la pièce. Nous allons pour cela utiliser la notion
de vecteur usuelle en physique. On convient de munir la pièce d'un vecteur u de longueur
unité, issu de G, orthogonal à la pièce, et sortant du côté face. Si la pièce est disposée dans
la salle, la donnée de G et de ce vecteur u définissent complètement la position du plan
médian de la pièce. Par translation, si l'origine de ce vecteur est ramenée à l'origine O du
repère, son extrémité est un point de la sphère SS de rayon 1 centrée en O. Réciproquement,
si on se donne un point G et un point m de la sphère SS, la position de la pièce est complè-
tement définie si on convient que Om = u.
Mais la position du centre de la pièce et la donnée du vecteur u ne suffisent pas complète-
ment à déterminer la position de la pièce, seulement celle de son plan médian. En effet, ces
deux données étant fixées, il est encore possible de faire tourner la pièce autour de son axe,
par exemple d'un angle 7L Cette rotation ne change ni G, ni u, mais elle correspond à une
position différente pour la pièce. Cependant, comme nous avons supposé que la pièce est un
cylindre de révolution parfait, ces deux positions différentes sont physiquement indiscernables.
Il est donc possible d'oublier simplement ce problème, et de considérer que la position initiale
de la pièce est parfaitement déterminée par la donnée de G et de u. Nous reviendrons sur ce
point à la fin de notre raisonnement.
Ce qui précède montre donc que l'espace des positions initiales de la pièce est le produit
Ç x SS. Il faut maintenant spécifier la vitesse initiale de la pièce. Pour cela, comme nous avons
exclu les mouvements de rotation, il suffit de définir la vitesse initiale du point G, ce qui est
possible au moyen d'un vecteur V E JR. 3 . Ceci montre que l'espace des conditions initales du
lancer est le produit C = Ç x SS x JR. 3 .

3. Pile ou Face. Nous voulons maintenant décrire les sous-ensembles P et :F de C qui


conduisent aux résultats pile ou face respectivement. Plus précisément, nous souhaiterions
d'abord déterminer l'ensemble P CC tel que si la pièce est lancée avec une condition initiale
dans P, elle s'immobilise sur le sol (après un mouvement éventuellement extrêmement com-
pliqué) avec son côté pile au-dessus, et de même l'ensemble :F C C donnant lieu à un tirage
face. Nous voulons ensuite construire une notion de «volume» raisonnable sur l'espace des
conditions initiales C, pour lequel les parties P et :F sont de même volume.
C'est ici que le rôle de notre hypothèse de symétrie de la pièce prend tout son sens. En
effet, nous ne sommes pas capables de déterminer explicitement les parties P et :F 7 , mais
cela ne sera pas utile.
Fixons un point G E Ç et un vecteur vitesse v E JR. 3 . Supposons que le point m de SS
soit tel que la condition initiale (G, m, v) soit dans P, et examinons la condition initiale
(G, -m, v). Elle s'obtient à partir de la première par simple retournement de la pièce (pile
devient face et face devient pile). C'est précisément ici que nous allons utiliser notre hypothèse
de symétrie. Oublions un instant que les côtés de la pièce portent deux couleurs différentes, et
considérons-là comme un simple cylindre. Alors la donnée du centre G, de la direction de l'axe
du cylindre, et de la vitesse initiale, déterminent un unique mouvement pour le cylindre. En
conséquence, si nous revenons à notre pièce à deux côtés, si la donnée ( G, m, V) donne lieu à
un mouvement conduisant à une issue face par exemple, alors la donnée ( G, -m, V) donnera
lieu à l'issue pile, et réciproquement.
Introduisons maintenant les partie PG,v (resp. :FG,v) de SS formée de tous les points
m tels que la condition initiale (G, m, V) donne lieu au résultat pile (resp. face), et notons
Y l'application de SS dans SS définie par Y(m) = -m. Alors PG,V U :FG,v = SS, et le
raisonnement que nous venons de faire montre que Y(PG,v) = :FG,v, et Y(:FG,v) = PG,V·
Le fait remarquable est qu'il n'est aucun besoin de connaître ces parties pour arriver à cette
conclusion, seule la symétrie de la pièce intervient dans notre raisonnement. Ces parties sont
d'ailleurs extrêmement complexes.

7
Cela semble hors de portée des théories actuelles, la notion de choc étant l'une des plus difficiles à modé-
liser correctement, de même que celle de roulement sur une surface, et ces deux problèmes interviennent
crucialement pour décrire le mouvement de la pièce en contact sur le sol.
Munissons maintenant la sphère de la notion intuitive d'aire qui nous est familière (elle
est d'ailleurs utilisée en physique sous le nom d'angle solide), notons À(A) l'aire d'une partie
A C S. Il est clair que l'application Y' conserve les aires, au sens où À(Y'(A)) = À(A).
Il en résulte que

l'aire correspondant au résultat pile est donc égale à l'aire correspondant au résultat face.
Une construction mathématique permet maintenant de construire un « volume » ;\ sur
l'espace des conditions initiales C = g x SS x IR 3 , qui correspond à l'intuition physique de
volume dans IR 3 , et que nous pouvons valablement utiliser pour mesurer le caractère aléatoire
de notre expérience (comme l'aire dans notre exemple de la feuille transportée par le vent).
Nous reverrons cette notion de volume (qui s'appelle une mesure) dans le cours de 13. Pour
3
une partie AC C de la forme A= A 1 x A2 x A3, avec A 1 C Q, A2 CSS, A3 C IR , le volume
A(A) de A sera donné par

où vol est le volume usuel des parties de IR 3 .


Notons maintenant P (resp. :F) la partie de C formée par toutes les conditions initiales
(G, m, V) donnant lieu au résultat pile (resp. face). Alors, notre raisonnement de symétrie et
la construction du volume généralisé ;\ conduisent au résultat

A(P) =A(F).

Nous avons donc terminé notre démonstation. L'espace des conditions initiales contient
deux parties complémentaires P et :F de même volume (généralisé), inconnues du joueur, et
extrêmement complexes. C'est l'ignorance du joueur jointe à la très grande complexité de ces
deux parties qui le conduit à utiliser des conditions initiales également disposées dans ces
deux parties, lors d'un grand nombre de tirages, conduisant ainsi à notre conclusion d'équi-
probabilité des deux tirages.
Terminons par une question. Nous avons négligé le problème de la rotation de la pièce
autour de son axe, comment utiliser le raisonnement précedent pour en tenir compte ?
Chapitre 11
ANNEAUX ET CORPS

I. LA STRUCTURE D'ANNEAU
La structure de groupe peut être enrichie d'une seconde loi de composition. Par exemple, sur
le groupe (Z, +) est également définie une multiplication.

I.1. Généralités et exemples

Définition 11.1. Un anneau est un ensemble (A,+,o) muni de deux lois de compositions
internes telles que :
1) (A,+) est un groupe abélien de neutre noté OA;
2) (A, o) est un monoïde d'élément neutre noté 1A;
3) La loi◊ est distributive à gauche et à droite par rapport à+, c'est-à-dire

'v'(x,y,z)EA 3 , xo(y+z)=xoy+xoz et (y+z)ox=yox+zox.


La loi de groupe d'un anneau est traditionnellement notée additivement + ; pour la loi
+, l'inverse d'un élément a s'écrira donc -a et les puissances de
a seront notées na (n E Z),
la notation un étant réservée aux puissances 1 pour la loi o. Un anneau (A,+,o) est dit
commutatif lorsque la loi o est commutative.
Notation. On note A* l'ensemble A\ {OA}- On dit que A* est l'ensemble des éléments non
nuls de A.

EXEMPLE 11.2. Nous avons rencontré de nombreux anneaux dans le cours d'algèbre.
► Les ensembles Z et Q, pour l'addition et la multiplication usuelles, est un anneau. Voir le
chapitre 7 pour les justifications calculatoires.
► Il en est de même de (]R., +, x), (C, +, x ).
► Pour tout ensemble E, (Y'(E), ~, n) est un anneau commutatif (rappelons que Y'(E)
désigne l'ensemble des parties de E et~ la différence symétrique). En effet, on a déjà prouvé
que ( Y' (E), ~) est un groupe abélien de neutre 0, que la loi n est associative sur Y' (E)
d'élément neutre E. Il reste à montrer la distributivité de n sur ~- Soient A, B et C trois
parties de E. Utilisons les fonctions indicatrices

Or, [(MB)ti(MCl = [MB + [Mc - 2[MBnMC = [MB + [Mc - 2ITMsnc- Ainsi [M(MC)
IT(MBJti(MC), et donc An (B~C) =(An B)~(A n C).
► IRrn:. est muni de deux opérations + et x qui définissent une structure d'anneau pour
toutes fonctions f et g de IR dans IR, on pose, pour tout t réel,

(f + g)(t) = f(t) + g(t) et (f X g)(t) = f(t)g(t).

1
Voir le chapitre 7 pour le détail des diverses conventions et la définition de un.
260

rJJ Les vérifications sont immédiates et laissées au lecteur.


Q)
► ]RN est muni de deux opérations + et x qui définissent une structure d'anneau : pour
toutes suites u = (unlnEN et v = (vnlnEN de lR, on note u + v = w et u x V= t, où pour

1
,.8
rJJ
tout n EN,
Wn = Un+ Vn et tn = UnVn,
Encore une fois, les vérifications consistent en des calculs élémentaires reposant sur la struc-
j ture d'anneau de (JR, +, x).

~ À la manière du produit direct de deux groupes, on peut définir une notion d'anneau
produit. Les vérifications sont purement calculatoires et laissées au lecteur.

Proposition 11.3. Soient (A1,EB1,®Ù et(A2,$z,®Î) dewc anneaux:·L'ense1nbie (A.1 x


Az,EB,®) -où les lois EB et® sont définiesparV{a1,azJ~i1"1s;<~z, ~{_!tt,.ai)~cAt:;)(j-tz,

(a1, ci2) EB {«{, ai} ~ (n1 ~.l ~j, 0:2:EBz tlz} et .(t11 ,a.zt®Jai,~~l =(~1 ~1 ni,ni ~zJ2)
est un anneau.
Cette proposition se généralise à n anneaux (A1, EE11, 01 ), ... , (An, EEin, 0n) par les formules

(ai, ... , un) (fi (a;, ... , a~l = (a1 EEl1 a;, ... , Un EEin a~l
et
(ai, ... , Un) 0 (a;, ... , a~)= (a1 01 a;, ... , Un 0n a~l-
En particulier, si (A,+, x) désigne un anneau et n un entier naturel non nul, An peut être
ainsi muni d'une structure d'anneau.

1. 2. Calculs dans un anneau


Pour tout élément a d'un anneau (A,+,o), on a ao (OA +OA) = aoOA = aoOA + aoOA d'où
a o OA = OA, par régularité de a◊ OA dans le groupe additif (A,+). On prouve de même que
OA o a = OA. Plus généralement, l'existence d'une seconde loi de composition sur le groupe
(A,+) et ses propriétés de distributivité et d'associativité enrichissent les règles de calcul déjà
exposées dans le chapitre sur les groupes.

Pr9positionll.4~ (ltègles dè caléul dans µuanneau) Scit.(A;+;~J ~nanneaù,


l}VaEA, a◊OA=·OA~Cl=◊A; 3)J-:-1A)<:>·{-lA}=lA. . . .
2) VaEA, h--lA}◊a=.-<î. · 4) V{o.,a1}EA2 , (~a}oG'=Haob.1}.

PREUVE.

1) La propriété a déjà été prouvée ci-dessus.


2) On aOA = (lA+(-lA))oa = lAoa+(-lA)oa = a+(-lA)oa et donc (-lA)oa = -a.
3) On a OA = (-lA) o (lA + (-lA)l = (-lAl o lA + (-lAl o (-1Al = -lA + (-lAl ◊ (-lAl
et donc (-1 Al o (-1 Al = 1A·
4) On remarque que OA =(a+ (-allo a'= ao a'+ (-al o a' d'où (-a) o a'= -(ao a').

Il faudra prendre garde à la loi o la structure d'anneau n'implique pas la régularité d'un
élément a quelconque pour la loi o.
À la régularité pour ◊
261
.
Il peut exister des éléments non réguliers pour la loi ◊ d'un anneau (A,+,◊). Par
exemple, dans l'anneau produit (&':2,œ,@l, on a (1,0) x (1, 1) = (1, 1) x (1,0) = (1,0)
alors que (1, 1) =/- (1,0).

Pour tous éléments x 1 , ...

n
, Xn dans A, on notera

n
--
..d
ü
L, Xk = X1 + · ·· + Xn et IJxk=X1◊···◊Xn­
k=l k=l

Ces expressions étant bien définies par associativité des lois + et ◊. La distributivité de ◊ sur
+, ainsi que l'associativité de +, permet d'écrire sans ambiguïté que, pour tous net m dans
N*, tous X1, ... , Xn, Yi, ... , Ym dans A

L
1:(i:(n , 1:(j:(m
Xi◊Yi·

L'ensemble des règles de calcul dans un anneau (A,+,◊) permet d'établir que la formule du
binôme est valable dans A pour des éléments a et b qui commutent. Nous nous contenterons
de l'énoncer, la preuve suivant point par point celle exposée dans le chapitre 6.

PtopÔèifiÔÏi 1L5. 'Soiént'a ëtb deÏt:c ilêrnents. qui commùteni t!.':Un a~t_îèf}t, +,<>f
Alors, pour ëntier naturefrt,

Test 11.1. Test 11.2.


La factorisation Que dire d'un anneau (A,+, x) dans lequel
n-1 lA = OA?
an-bn=(a-b )o .[_(akobn-l-k)
k=O
est-elle en général valable dans un anneau
(A,+,o)?

II. SOUS-ENSE MBLES REMARQUA BLES D'UN ANNEAU

Nous étudierons trois sous-structures importantes dans les anneaux : les sous-anneaux, le
groupe des éléments inversibles et les idéaux. Les deux dernières structures sont particulière-
ment importantes quand on cherche à faire de l'arithmétique sur un anneau.
262

II.1. Les sous-anneaux d'un anneau


Définition 11.6. Soient (A,+, o) un anneau et B une partie de A. On dit que B est un
sous-anneau de A lorsque B muni des opérations + et o est un anneau et que 1A= 18 .

Cette définition impose en premier lieu que les restrictions des lois + et o à B soient
internes sur B. Remarquons dès maintenant que la condition 1A = 1s n'est pas superflue
par exemple, ({OA},+, x) est un anneau mais pas un sous-anneau de (A,+,o).

Proposition 11.7. Une partie B d'un anneau {A,+:◊) est ,an sous-anneau de A
si et seulement si
1) 1;,.EB. 2}V{b,'b1fEBi,b..:;.b'EB etb~tie.13,

PREUVE. Les conditions 1) et 2) sont clairement nécessaires. Réciproquement, suppo-


sons ces deux propriétés vérifiées. On sait que B c/- 0 car B contient 1A et la condition
V(b, b') E B2, b - b' E B implique que (B, +) est un sous-groupe additif de (A,+). La pro-
priété V(b, b') E B2, bob' E B prouve que B est stable par o, ce qui achève la démonstration
car la distributivité de o par rapport à+ et l'associativité de o sur B découlent de la structure
d'anneau (A,+,o). Enfin, on laisse au lecteur le soin de vérifier que lA = 18 . ■

On retiendra cette caractérisation des sous-anneaux d'un anneau (A,+, o) donné.

Prouver que Best un sous-anneau de (A,+,o)


Une partie B de A est un sous-anneau de (A,+, o) si et seulement si

lA E B et V(b, b') E B2, b - b' E B et bob' E B.

EXEMPLE 11.8. L'ensemble Z[i] = { a+ib, (a, b) E Z 2} est un sous-anneau de (C, +, x).
► On a 1 = 1 + 0 xi donc 1 E Z[i]. Soient z 1 et z2 dans Z[i]. Il existe a 1, b 1, a2 et b 2 dans
Z tels que z1 = a1 + ib1 et z2 = a2 + ib2. On a alors

et comme a 1 - a2, b1 - b2, a, a2 - b1 b2 et a1 b2 + a2b1 appartiennent à Z, Z1 - z2 E Z[i] et


Z1Z2 E Z[i].

Z[i] est appelé le sous-anneau des entiers de Gauss. Il est utile en arithmétique.

Test 11.3. Test 11.4.


L'ensemble 2Z = {2n, n E Z} est-il un sous- L'ensemble Z[i v'll = {a + ibv'l, ( a, b) E Z 2}
anneau de (Z,+, x)? est-il un sous-anneau de (C,+, x)?
263

II.2. Le groupe des unités d'un anneau

fffi~!,~!'l!:s~~}~~.,;);4èff~f!~A~~ê~~l~-~t•ri"1~r~'ti~i~n,êiu
PREUVE. Soient x et y dans A x. Comme (A,◊) est un monoïde, on sait que xoy est inversible
pour◊ d'inverse y- 1 ◊x- 1 , ainsi Ax est stable par la loi◊. Comme (A,+,o) est un anneau,
la loi de composition interne induite par ◊ sur A x est associative. Le sous-ensemble A x est
non vide car il contient 1A qui est l'élément neutre de (A x , ◊). De plus, pour tout x dans A x,
x- 1 E Ax car x- 1 est inversible d'inverse x. Le monoïde (A,o) est donc un groupe. ■

Les éléments inversibles d'un anneau (A,+, o) sont parfois appelés les unités de (A,+,◊).
On ne confondra pas les ensembles A* et A x respectivement ensemble des éléments non nuls
de A et ensemble des unités de A.

EXEMPLE 11.10. Voici quelques exemples.


► Le groupe des unités de l'anneau (Z,+, x) est zx = {-1, 1}. En effet, n E zx si et
seulement si il existe m E Z tel que nm = 1, ce qui impose lnl ,,;; 1 et donc n = -1, 1 ou O.
Il est clair que seuls 1 et -1 sont des unités de (Z,+, x).
► Le groupe des unités de l'anneau (JR, +, x) est ]Rx = JR*.
► Pour tout ensemble E, le groupe des unités de l'anneau (9ù(E),~,n) est le sous-groupe
trivial ({E}, n).

Test 11.5. Test 11.6.


Que pensez-vous des inclusions Quelles sont les unités de l'anneau produit
Ax cA* et A* cAX? (Z 2 ,+, x)?

II.3. Les idéaux d'un anneau


Définition 11.11. Soient (A,+,o) un anneau et I C A. On dit que I est un idéal de
(A,+,o) lorsque
1) (I,+) est un sous-groupe de (A,+); 2) \l(a,i)EAxl, aoiEletioaEl.

Les sous-ensembles {OA} et A d'un anneau (A,+,◊) sont toujours des idéaux, appelés
les idéaux triviaux de (A,+,◊). Si A est commutatif, pour tout a E A, l'ensemble aA =
{a◊ a' 1 a' E A} est clairement un idéal de A. Il faut connaître l'exemple fondamental de
l'anneau (Z,+, x).

EXEMPLE 11.12. Les seuls idéaux de l'anneau (Z, +, x) sont les sous-ensembles de la forme
mZ, avec m E N.
► Un idéal Ide (Z, +, x) étant en particulier un sous-groupe, il existe m EN tel que I = mZ.
Il suffit donc de prouver que les sous-groupes additifs mZ sont des idéaux. Soient n E Z et
a E mZ : il existe k E Z tel que a = km et donc an = na = knm E mZ. L'ensemble mZ
est donc un idéal de (Z, +, x ).
264

:Pfo~itk•i111::ta.·.Si>i.ent Ir eH2. •;ultffaw: d1flfi,:tmnBàùJ A.,+1;{>). • ; , · ·


~fl!!;l/ll/JJt~]f1.;~+'iIIlWJîY'is'Û.lif#JiZJ;îfji;~;
.· ·•· · •· .••·•···.······.,,.i~;f 1

PREUVE.

1) I 1n lz est un sous-groupe additif de (A,+) en tant qu'intersection de sous-groupes additifs


de (A,+). Soient a E A et i E I1 n Iz. Comme I1 et lz sont deux idéaux de (A,+, o), aoi E I1,
aoi E 12, ioa E 11 et ioa E 12. Ainsi aoi et ioa appartiennent à 11 n Iz et 11 n 12 est un
idéal de (A,+,o).
2) L'ensemble 11 + lz est non vide car il contient OA + OA = OA. Soient i et i' dans I1 + Iz.
Il existe (i1,i\) E If et (iz,i 2) E I~ tels que i = i1 + iz et i' = i\ + i 2. On a donc, par
commutativité et associativité de la loi +, i-i' = (i1 - i,) + (iz - i 2) E I 1 + I2 car i1 -i\ E I 1
puisque I 1 est un sous-groupe de (A,+), et de même iz - i 2 E Iz_ Soit alors a E A. Comme
aoi = a◊ (i 1 +iz) = aoi 1 + aoi 2, aoi 1 E 11 puisque 11 est un idéal de (A,+,o), et de
même a◊ iz E Iz, on a a◊ i E I 1 + Iz. On prouve de même que i ◊ a E I 1 + Iz. ■

Test 11.7. Test 11.8.


Que dire d'un idéal I contenant 1A ? Quels sont les idéaux de l'anneau (A,+, o) qui
sont également des sous-anneaux de A ?

III. MORPHISMES D'ANNEAUX


Définition 11.14. Soient (A,+,o) et (B,*,•) deux anneaux. Une application cp: A--, B
est morphisme d'anneaux lorsque
1) cp: (A,+)--, (B,*) est un morphisme de groupes;
2) \f(a, a') E A 2 , cp(ao a')= cp(a) • cp(a');
3) cp(lA) = h.

Remarque. Contrairement aux morphismes de groupes, la propriété 3) ne découle pas des


deux premières. Par exemple, l'application nulle de A dans B, qui à tout élément de A associe
0 8 , vérifie 1) et 2) mais pas 3).
Un morphisme d'anneaux étant en particulier un morphisme de groupes, le noyau d'un
morphisme d'anneau est bien défini.

Proposittôtf 11~;1;5. Lè n6yà11,• à 'foi'.môrphisme ·â'tirîinèâux:fij ':{A;+~<>} 4 fS\*,'tf êst .1,m


idêal de.A. .
PREUVE. On sait déjà que Ker ( cp) est un sous-groupe de (A,+,◊). Soit i E Ker( cp) et
a E A. Puisque cp(a ◊ i)= cp(a) * cp(i) = cp(a) * OA = OA, a◊ i E Ker(cp ). On prouve de
même que io a E Ker(cp), d'où le résultat. ■

Un isomorphisme d'anneaux est un morphisme d'anneaux bijectif. On déduit des propriétés


des morphismes de groupes qu'un morphisme d'anneaux cp : A--, Best injectif si et seulement
si Ker ( cp) = {OA}.
265

Test 11.9. Test 11.10.


Prouver que l'image d'un morphisme d'anneaux Le noyau d'un morphisme d'anneaux cp: A--, B
cp : A--, B est un sous-anneau de B. n'est pas toujours un sous-anneau de A. Trou-
ver un contre-exemple simple.

IV. ARITHMÉTIQUE DANS UN ANNEAU INTÈGRE ......


......
..d
ü
IV.1. Divisibilité dans un anneau intègre
On prendra garde à ce que l'équation a◊ x = 0 dans un anneau (A,+, o) peut admettre
d'autres solutions que x = 0A même lorsque a E A*. Autrement dit, on ne ne peut pas
simplifier par a en général !
Définition 11.16. Soit (A,+,◊) un anneau. Un élément a de A est appelé un diviseur de
zéro si a 1- 0A et s'il existe a'/. 0A tel que a◊ a'= 0A ou a'◊ a= 0A,

EXEMPLE 11.17. Dans l'anneau produit (Z 2 ,EB,®), on a (1,0) ® (0, 1) = (0,0). Les élé-
1 ments (1, 0) et (0, 1) sont donc des diviseurs de zéros de cet anneau.
Définition 11.18. On appelle anneau intègre tout anneau vérifiant les trois propriétés
suivantes :
1) (A, +,o) est commutatif;
2) 1A/.0A;
3) (A,+,o) n'admet aucun diviseur de zéro.
Autrement dit, un anneau (A,+,◊) est intègre si et seulement s'il est commutatif, s1
1A /. 0A et si
\f(a, b) E A 2 , (ao b = 0A) =}(a= 0A ou b = 0A).
Par exemple, (Z, +, x), (Q, +, x) et (JR, +, x) sont intègres, ce qui n'est pas le cas de l'anneau
produit (Z 2 ,EB,®).
Dans un anneau intègre, on note plus simplement l'opération◊ de manière multiplicative
au moyen du symbole x par analogie avec (Z, +, x ). On notera même ab le produit a x b
afin d'alléger les démonstrations.
Définition 11.19. Soient (A,+, x) un anneau intègre, a et b deux éléments de A. On dit
que a divise b dans A s'il existe c E A tel que b = ac. On note alors a I b et l'on dit de
manière équivalente que b est un multiple de a.
Proposition 11.20. Dans un anneau intègre (A,+, x), (a.lb et .bJn} stet seulement si
3u E Ax tel que a. = bu. · · · ··
PREUVE. Raisonnons en deux temps.

( {=) est clairement vraie.

(===}) Il existe a' et b' dans A tels que a = ba' et b = ab', d'où a = ab'a' et donc
a(lA- b'a') = 0A. Comme (A,+, x) est intègre, on en déduit que a= 0A ou b'a' = 1A. Si
a= 0A, on ab= ab'= 0A, Si a 1- 0A, on a a'b' = b'a' = 1A, donc a' et b' appartiennent à
Ax et donc :lu E Ax tel que a= bu. ■
266

Test 11.11. Test 11.12.


L'anneau (Z:1'1,+, x) est-il intègre? Un élément inversible d'un anneau (A,+,o)
peut-il être un diviseur de zéro ?

IV.2. Structure d'idéal et arithmétique


Sans entrer dans les détails de la théorie des anneaux, nous allons donner quelques pistes
permettant de comprendre en quoi la notion d'idéal est fondamentale en arithmétique. On
considérera un anneau intègre (A,+, x). La remarque fondamentale est que, pour tout a E A,
l'ensemble aA = {au' j a' E A} des multiples de a est clairement un idéal de A. L'ensemble
des multiples communs à deux éléments a et b de A est donc égal à aA n bA. C'est un idéal
de (A,+, x) en tant qu'intersection d'idéaux de (A,+, x ). Il est facile de prouver que a j b est
équivalent à bA C aA. Essayons de rechercher un diviseur de b « incassable » par division.
Cela revient à déterminer une suite d'idéaux de la forme

Dans ce cas, on commence par trouver un diviseur d1 de b, puis un diviseur d2 de d 1, etc.


Les suites croissantes (pour l'inclusion) d'idéaux joueront donc un rôle fondamental dans la
décomposition par division des éléments de A. Si le processus s'arrête, c'est-à-dire lorsque l'on
aboutit à des inclusions qui sont en fait des égalités, par exemple \ln?: n 0 , dnA = dnoA, on
sait 2 que dn et dno diffèrent multiplicativement d'une unité u de A. Ainsi dn sera un diviseur
«incassable» de b. On remarque également que la connaissance des unités est un préalable
à toute forme d'arithmétique sur un anneau.

Définition 11.21. Un anneau (A,+,o) est dit principal lorsque les trois propriétés sui-
vantes sont vérifiées :
1) (A,+,o) est commutatif;
2) lAIOA;
3) tous les idéaux de (A, +,o) sont de la forme aA, avec a dans A.

EXEMPLE 11.22. (Z, +, x) est principal d'après l'exemple 11.12. Les seuls idéaux de l'an-
1 neau (IR,+, x) sont les idéaux triviaux {O} et IR, (IR,+, x) est donc principal.

L'anneau principal intègre est un bon cadre pour fonder une arithmétique, car il permet
de définir simplement des notions de pgcd et ppcm 3 . Nous verrons dans la suite de cet ouvrage
que l'anneau des polynômes à coefficients dans IR ou C est un anneau principal intègre.

V. LA STRUCTURE DE CORPS
Définition 11.23. Un corps est un ensemble (K, +, x) muni de deux lois de compositions
internes telles que
1) (K,+, x) est un anneau commutatif 4 ; 3) (K*, x) est un groupe.
2) lK ?"OK;

2
Voir la proprosition 11.20.
3
Respectivement plus grand diviseur commun et plus petit multiple commun.
267

Un corps est donc un anneau commutatif (K, +, x) dont tous les éléments non nuls sont
inversibles pour x et tel que 1K -=fa OK.

EXEMPLE 11.24. (Q,+, x), (lR,+, x) et (C,+, x) sont des corps. (Z,+, x) n'est pas un
1 corps car, par exemple, 2 n'est pas inversible dans Z pour la multiplication usuelle x.

PREUVE. La loi x étant commutative et 1K -=fa OK, il suffit de prouver que (K, +, x) n'admet
aucun diviseur de zéro. Soient x et y dans K tels que xy = OK. Supposons x -=fa OK, alors x
--
..d
u
est inversible et x- 1 (xy) = x- 1OK = OK. Ainsi (x- 1x)y = 1KY = y = OK et (K, +, x) est bien
w~. ■

Un sous-ensemble l d'un corps (K, +, x) est appelé un sous-corps de K lorsque (l, +, x) est
un corps. On déduit sans peine des résultats sur les sous-anneaux la caractérisation suivante
des sous-corps.

On retiendra cette caractérisation des sous-corps d'un corps (K, +, x) donné.

Prouver que Lest un sous-corps de (K, +, x)


Une partiel de K est un sous-corps de (K, +, x) si et seulement si

Test 11.13. Test 11.14.


Un sous-corps L d'un corps (K, +, x) est-il un Soient n ~ 2 et (K, +, x) un corps. L'anneau
sous-anneau de l'anneau (K, +, x) ? produit (Kn, EB, @) est-il un corps ?

VI. EXERCICES

11.1. On rappelle la notation usuelle j = e2in/3 et on


pose
Montrer que Q[i] = {u + ib, (u, b) E Q} est un
sous-corps de C.
1. Montrer que Z[j] est un sous-anneau de
11.2.
(<C,+, x). Est-ce un sous-corps de (<C,+, x)?
2. Vérifier que \:/z E Z[j] , lzl 2 E N.

4
Dans Je ca.s où la loi x n'est pa.s commutative, la structure (K, +, x) est appelée un corps gauche.
268

3. Déterminer l'ensemble U6 des racines 11.6.


sixièmes de l'unité. On exprimera ces racines
en fonction de j. Montrer que tout anneau intègre fini (A, +, o)
et commutatif est un corps. On pourra remar-
4. Montrer que Z[W = U6. quer qu'à x E A* fixé, l'application -y H x o -y
est une bijection de A* dans lui-même.

11.7.

11.3. Soit E un ensemble fini et A= 9"(E).


..... 1. L'anneau (A, L\, n) est-il intègre ?
..... Montrer qu'un morphisme d'anneaux entre
deux corps est nécessairement injectif. 2. Soit I un idéal de A.
a. Établir que

11.4. v'XEI, WcX, YEI

Montrer que l'ensemble des suites d'entiers re- et


latifs constantes à partir d'un certain rang est V(X, Y) E 12 , X U Y E 1.
un sous-anneau de zN (voir l'exemple 11.2). b. En déduire qu'il existe une partie F de E telle
que I = 9"(F).
11.5. c. Étudier la réciproque.
3. On suppose dans cette question que E est in-
Déterminer le groupe des inversibles de l'anneau fini. Montrer que le sous-ensemble I de A formé
Z[iv'l] (voir le test 11.4). des parties finies de E n'est pas un idéal de la
forme 9"(F) avec F C E.
COMPLÉMENT 1. UN AUTRE CORPS

Deux plus deux font zéro, mais deux fois deux font trois

Nous allons définir une structure de corps sur l'ensemble des entiers naturels! Dans un certain
sens, cette structure est la plus simple possible. En effet, à chaque fois que nous aurons le
choix dans la définition d'un produit et de la somme de deux entiers donnés, nous prendrons
systématiquement la plus petite valeur permise. Le plus étonnant est que l'on obtienne par
un procédé aussi simple une structure aussi riche. On peut voir ce corps comme un bijou des
mathématiques, que seul un maître artisan a su ciseler. Notre construction s'inspire en effet
très largement de celle des nombres «surréels», inventés par le mathématicien anglais John
Conway, et plus particulièrement du chapitre 6 du livre intitulé On numbers and games5 .
On ne peut qu'encourager le lecteur à se procurer cet ouvrage, qui contient bien d'autres
merveilles.
Bien évidemment, on se doute que les opérations que nous allons définir ne sont pas les
additions et multiplications usuelles. Pour bien les différencier, nous noterons nos nouvelles
opérations 0 et EB. Il faudra être attentif et oublier nos habitudes de calcul dans (N, +, ·).

1.1. Un corps à quatre éléments


Nous allons expliquer par des exemples ce que nous entendons par structure « la plus simple
possible». Nous donnerons une définition formelle des lois 0 et EB ultérieurement.
1. L'addition. N'ayant encore défini aucune somme, nous n'avons donc aucune contrainte
pour choisir la valeur de OEB O. Conformément à notre principe de simplicité, on choisit donc
la plus petite valeur possible et nous posons

oœo =O.
Si on veut que (N, EB) soit un groupe, on vient de décider que O est son élément neutre. On
pose donc n EB O = 0 EB n = 0 pour tout n E N. Considérons maintenant la somme 1 EB 1. La
seule valeur interdite est 1. En effet, si 1 EB 1 = 1, on pourrait additionner à chaque membre
de l'égalité l'opposé de 1 (pour la loi EB), noté el. On aurait donc
0 = (el) EB 1 = (el) EB (1 EB 1) = ((e 1) EB 1) EB 1 = 0 EB 1 = 1,
ce qui est impossible. En revanche, la valeur zéro est libre. Fidèle à notre principe, nous posons

1 EB 1 = O.

De même,
2 EB 1 ::/= 0 car sinon, on aurait 2 EB 1 = 1 EB 1, puis 2 = 1 en simplifiant par 1.
2 EB 1 ::/= 1 car sinon, on aurait 2 = 0 en simplifiant par 1.
2 EB 1 ::/= 2 car sinon, on aurait 1 = 0 en simplifiant par 2.
La première valeur libre est 3. Nous posons donc en retenant notre souffle

1 EB 2 = 2 EB 1 = 3.

5
J.H. Conway, London Mathematical Society Monographs, No. 6. Academic Press, 1976, 238 p.
On considère ensuite la somme 2 EB 2.
2 EB 2 =/- 2 car sinon, on aurait 2 = 0 en simplifiant par 2.
2 EB 2 =/- 3 = 1 EB 2 car sinon, on aurait 2 = 1 en simplifiant par 2.
Mais les valeurs O et 1 sont libres. On choisit la plus petite possible en posant

2 EB 2 = O.

Enfin, si on veut que (N, EB) soit un groupe abélien, les choix de 2 EB 3 et de 3 EB 3 sont forcés.
En effet

2 EB 3 = 2 EB (1 EB 2) = 1 EB (2 EB 2) = 1 EB O = 1;
3 EB 3 = (1 EB 2) EB (1 EB 2) = (1 EB 1) EB (2 EB 2) = 0 EB O = O.

Pour résumer, on peut dresser la table d'addition pour les sommes que nous avons calculées.

EB 0 1 2 3
0 0 1 2 3
1 1 0 3 2
2 2 3 0 1
3 3 2 1 0

TAB. 11.1. table d'addition des entiers n ~ 3.

On observe que la loi EB est stable sur l'ensemble N4 = {O, 1, 2, 3}. De plus, cet ensemble, muni
de la loi interne définie par EB, est un groupe abélien, ce qui justifie a posteriori nos choix.
Pour voir cela, il suffit par exemple de considérer l'application <p : N4 -+ 71,/271, x 71,/27!, définie
par
cp(O) = (O, 0) ; cp(l) = (1, O) ; cp(2) = (0, 1) ; cp(3) = (1, 1).
On remarque en effet que <p est bijective et on laisse au lecteur le soin de vérifier que
cp(x EB y)= cp(x) + <p(y).
Les axiomes de groupe se vérifient alors sur (N4 , EB) en les transportant à l'aide de <p dans le
groupe (7!,/27!, x 71,/271,, + ).

2. La multiplication. Comme O est l'élément neutre de (N, EB), si on veut que (N, EB, 0) soit
un corps, on a pour contraintes que
Vn EN, 00n=n00 =0;
V(n, m) E N2, (n =/- 0 et m =/- 0) # n 0 m =/- O.
Ainsi, seule la valeur O est interdite pour le produit 1 0 1. On pose donc

Cette relation montre que l'on a choisi 1 pour élément neutre de la multiplication. On pose
donc 1 0 n = n 0 1 = n pour tout n E N. Nous en déduisons un corrolaire intéressant. Le
lecteur attentif a pu en effet noter que l'on a 1 EB 1 = 2 EB 2 = 3 EB 3 = O. Il est naturel de se
demander si n EB n = 0 pour tout n E N. La réponse est oui, sous réserve que (N, EB, 0) soit
au moins un anneau. En effet, pour n EN, on a
n EB n = (1 0 n) EB (1 0 n) = (1 œ 1) 0 n = 0 0 n = O.
Cela signifie que dans le groupe (N,EB), tout entier est son propre opposé! On a donc

VnE N, n=en.
Il en résulte que pour tous n, m EN, on a
(nEB m) 20= (nEBm) 0 (nEB m) = (nEB m) 0 (ne m) = n 20 e m 20 = n 28 EB m 20 .
Autrement dit, l'application cl>: N-----, N définie par cp(n) = n 20 = n 0 n est un morphisme
de groupe pour la loi EB.
Considérons le produit 2 0 2.
20210 car sinon, on aurait 2 = O.
20211 car sinon, on aurait 328 = (2 EB 1)28 = 228 EB 1 = 1 EB 1 = 0, puis 3 = O.
20212 car sinon, on aurait 2 0 (2 0 1) = 0, puis 2 = 1 ou 2 = O.
On choisit donc la plus petite valeur possible et on pose

Enfin, les produits 2 0 3 et 3 0 3 sont forcés par nos choix précédents. En effet

2 0 3 = 2 0 (1 Ell 2) = (2 01) Ell (2 0 2) = 2 Ell 3 = 1 ;


3 0 3 = (1 Ell 2) 28 = 1 Ell 228 = 1 Ell 3 = 2.

Pour résumer, on peut dresser la table de multiplication que nous venons de définir.

0 0 1 2 3
0 0 0 0 0
1 0 1 2 3
2 0 2 3 1
3 0 3 1 2

TAB. 11.2. table de multiplication des entiers n ~ 3.

Ici, on observe que N4 = {0, 1, 2, 3} est stable pour la loi 0 et que (N4 \ {0}, 0) est un groupe.
Pour voir ce dernier point, il suffit de considérer l'application lj, : {1, 2, 3}-----, Z/3'11, définie par
lj, ( 1 ) = Ï, lj, (2) = 0 et lj, (3) = 2, de noter que lj, est bijective et de vérifier que

Ainsi, la structure de groupe de (Z/3Z, +) se transporte sur l'unique structure de groupe


(N4 \ {0}, Ell) qui fasse de lj, un isomorphisme de groupes. Comme nous étudions en détail
les lois Ell et 0 sur N dans la partie suivante, nous laissons au lecteur le soin de vérifier la
compatibilité des deux lois et nous notons que (N 4 , EB, 0) est un corps. En fait, c'est même
l'unique corps de cardinal 4, à isomorphisme de corps près, mais nous ne le démontrerons pas.
3. Méthode générale de construction des tables. Dans les deux parties précédentes,
nous avons donné le principe qui permet de définir deux lois internes Ell et 0 sur N. Toutefois,
les tables d'addition et de multiplication semblent fastidieuses à dresser. En fait, pour faire
des calculs dans (N,EB,0), il suffit d'appliquer les deux régles suivantes, très faciles à retenir
par leur similarité, et que nous montrerons ultérieurement.

R~l~. ït.~'f;
....· > . • ,
A4dition: •···· .·..... •..... ,
$i x~:}h ~t1fÎI <2nl #r~ X$lÎ. ·•·•estitf;omme >
ùsuellex·fy,'~ais
·•
i{i:l,;t.
Multîil,ication :
Six =2!2,"} èt si y <x, àlors 'lC(!)îJ'eSt·liiproduit usuèZ.xy,·mais-x©x Sx./2:. · =
Le lecteur devra être vigilant pour vérifier que nous n'utiliserons pas cette méthode de calcul
dans les preuves avant d'avoir établi les propriétés de (N, œ, 0). Bornons-nous ici à montrer
que ces deux règles permettent effectivement de faire tous les calculs souhaités, une fois que
sera connue la structure de (N, œ, 0 ). Nous supposons donc ici, et seulement ici, que (N, œ, 0)
est un anneau.
Rappelons que tout entier n EN peut s'écrire sous la forme

n = 2"'1 + •••+ 2'""


avec IX1 > · · · > ixp ~ 0 des entiers uniquement déterminés. C'est l'écriture en base 2 de
l'entier n. Or

La règle 11.27 de l'addition montre donc de proche en proche que

n = 2"'1 œ (2"'2 + ---+ 2'"") = --- = 2"'1 œ 2"'2 œ --- œ 2'"".

- En appliquant les axiomes de commutativité et d'associativité de l'addition, une somme


quelconque se ramène au calcul des sommes de la forme 2"' œ2 f3, ce que donne précisément la
règle 11.27 de l'addition. Concrètement, pour deux entiers net m, il suffit de les décomposer
en base 2 et d'éliminer les puissances de 2 en doublet. Par exemple

14 œ 12 = (8 + 4 + 2) œ (8 + 4) = 2.

On a éliminé 8 = 2 3 et 4 = 2 2 .
- Pour calculer un produit, on utilise les axiomes de commutativité, d'associativité du produit
et la distributivité sur l'addition. On se ramène ainsi à calculer des produits de la forme 2n02m.
Notons ap = 22P pour tout p EN. En décomposant n = 2"'1 + · · • + 2<Xi>, on otient donc par
un raisonnement analogue à celui de l'addition

d'après la règle 11.27 de multiplication. Le produit 2n02m s'en déduit aisément. Par exemple

1s06= (8œ4œ2œ 1) 0 (4œ2)


= ((204) œ4œ2œ 1) 0 (4œ2)
= ((3 04) œ2œ ll 0 (4œ2)
= (3 0420 ) œ (204) œ4œ (20 3 04) œ 220 œ2
= (3 06) œ8œ4œ4œ3œ2
= (3 0 (2œ4)l œ8œ4œ4œ 1 œ2œ2
=lœ12œ8œ4œ4œ1œ2œ2
=lœ8œ4œ8œ4œ4œ1œ2œ2
=4.

On a utilisé dans ce calcul le fait que 228 = a~0 = 3 et 428 = af0 = 3 • 2 = 6.

1.2. Parties sous-définissantes


Nous allons formaliser la méthode exposée dans la partie précédente. L'idée est de choisir pour
valeur d'un produit ou d'une somme le premier entier permis.
Définition 11.28. Soit n EN. On dit qu'une partie t?) C N sous-définit n si elle vérifie les
deux propriétes suivantes :
1) n \l' t?);
2) 'v'm<n, mE (?)_

Notation. Dans tout ce qui suit, on note pour tout entier naturel n

Y'(n) = {m ENI m < n}

l'ensemble de ses prédécesseurs.


Tout entier naturel n est donc sous-défini par Y'(n). On peut, si on veut, ajouter à Y'(n) des
entiers m > n, mais pas m = n. On notera qu'une partie t?) sous-définit n si et seulement si
n \l' t?) et s'il existe une partie (?)' C t?) qui sous-définit n. Cette terminologie vient de ce que
l'on peut retrouver n à partir de (?). En effet

n = min (N \ (?)) .

Notation. Pour toute partie AC N, on note ppne(A) = min(N\A) le plus petit non élément
de A. On convient que ppne(N) = oo.

4. Définition par récurrence de la loi Ef). Nous allons définir une loi additive en nous
efforçant de garantir la régularité des translations, qui est une propriété très importante
d'une loi de groupe : on veut que n EB p-/- n EB q et que p EB n-/- q EB n pour tous les couples
d'entiers (p, q) tels que p -/- q. Bien sûr, il suffit d'imposer ces conditions seulement pour
p < q, puisque les rôles de p et q sont symétriques.

Définition 11.29. Soient n et m deux entiers naturels. La somme n EB m est le plus petit
des entiers différents des entiers de la forme n' EB m ou n EB m', avec n' < n et m' < m.
Autrement dit

n EB m = ppne({n' EB m In' E Y'(n)} U {n EB m' 1 m' E &'(ml}).

En pratique, on construit la table d'addition de proche en proche : la somme n EB m est


calculable si on connaît déjà toutes les entrées n EB m' , m' < m et toutes les entrées n' EB m,
n' < n, au-dessus de l'entrée cherchée dans la même colonne ou à gauche sur la même ligne.
La valeur de la somme nEBm est le plus petit entier qui n'y figure pas. On retrouve notamment
que
0 EB O = ppne(0) = 0,
Oœ 1 =ppne({O}) = 1 = 1 œo,
1 EB 1 = ppne{O EB 1, 1 EB O} = ppne({l}) = 0, etc.

Pro:poaitiôri 11;30, >p(J'llftaut {n,p, q)E N3, on a

PREUVE. Soit n, p, q trois entiers naturels tels que p -/- q. Les rôles de p et q étant symé-
triques, on peut supposer que q < p. Par définition,

t?) = {n' EB p I n' < n} U {n EB p' 1 p' < p} sous-définit n EB p.


On remarque que nEBq E ~- Comme nEBp est non élément de~, il en résulte que nEBp -/- nEBq.
On a donc montré que si nEBp = nEB q, alors p = q. La réciproque étant évidente, la première
équivalence est démontrée. La seconde se démontre de la même manière. ■

PREUVE. Par définition, ~ = {n' EB m In' E 9(n)} U {n EB m' 1 m' E 9(m)} sous-définit
n EB m. De plus, on a 9(m) C ~met 9(n) C ~n, donc

~ C {n EB m' 1 m' E ~m} U {n' EB m I n' E ~n}. (11.1)

Or, la proposition 11.30 montre que nEBm !/. {nEBm' m' E ~m} car m
1 !/. ~m- De même, on
an EB m !/. {n' EB m I n' E ~n} car n !/. ~n- Il en résulte que

n EB m !/. {n EB m' 1 m' E ~m} U {n' EB m I n' E ~n}. (11.2)

Comme la partie ~ sous-définit l'entier n EB m, les conditions (11.1) et (11.2) montrent que
{n EB m' 1 m' E ~m} U {n' EB m I n' E ~n} sous-définit l'entier n EB m, ce qui prouve notre
assertion. ■

PREUVE. Nous allons vérifier que pour (n, p, q) E N3

nEB0=0 ; nEBm=mEBn nEBn=0 nEB (p EB q) = (nEBp) EB q.

► Élément neutre.
On raisonne par récurrence sur n EN. On a déjà vu que 0œ0 = O. Soit n E N\{0}. On suppose
que pour tout k < n, on a k EB 0 = k. Alors, par définition, la partie {n' EB 0 In' < n} U 0 =
{n' 1 0 ~ n' ~ n-1} sous-définit n EB O. Il en résulte que n EB 0 = ppne{0, 1, ... , n-1} = n.
► Commutativité.
On raisonne par récurrence sur N = n + m. On a bien n EB m = m EB n pour n = m = O. Soit
N E N\ {0}. On suppose que pour tout (p, q) E N2 tel que p + q < N, on a p EB q = q EBp. Soit
net m deux entiers tels que n+m = N. Alors pour n' <net m' < m, on an' EBm = mœn'
et n EB m' = m' EB n par hypothèse de récurrence. Il en résulte que
{n' EB m In' E 9(n)}U{nEB m' m' E 9(m)} 1

= {m EB n' 1 n' E 9(n)} U {m' EB n I m' E 9(m)}.


Le terme de gauche sous-définit n EB m et celui de droite, m EB n. On en déduit que n EB m =
mEBn.
► Élément opposé.
On raisonne par récurrence sur n E N. On sait que 0 EB 0 = O. Soit n E N \ {0}. On suppose
que pour tout k < n, on a k EB k = O. D'après la proposition 11.30, il s'ensuit que k EB p -/- 0
pour tout 0 :( k :( n - 1 et pour tout p -/- k. Donc 0 i {k EB n I k < n}. Comme cette dernière
partie définit n EB 0, on en déduit que n EB n = O.
► Associativité.
On raisonne par récurrence sur N = n+p+q. Pour N = 0, on a bien 0 = 0EB(0EB0) = (0EB0)EB0.
Soit N E N \ {0}. On suppose que r EB (s EB t) = (r EB s) EB t pour tout (r, s, t) E N 3 tel que
r + s + t < N. Soit n, p, q trois entiers tels que n + p + q = N. Par définition, les parties
E1pœq = {p' EB q I p' < p} U {p EB q' 1 q' < q} et E1nE!lv = {n' EB p In'< n} U {n EB p' 1 p' < p}
sous-définissent pEBq et nEBp respectivement. La proposition 11.31 et l'hypothèse de récurrence
montrent que
{n' EB (p EB q) n' < n} U {n EB m I m E E1pœq}
1

= {n' EB (p EB q) 1 n' < n} U {n EB (p' EB q) 1 p' < p} U {n EB (p EB q') 1 q' < q}


= {(n' EBp) EB q In'< n}U{(nEBp') EB q I p' < p}U{(n EBp) EB q' q' < q} 1

= {m EB q I m E E1nEllp} U {(n EB p) EB q' q' < q} 1

sous-définit n EB (p EB q) comme (n EB p) EB q, ce qui démontre l'égalité de ces deux entiers. ■

Nous sommes maintenant en mesure de prouver la règle 11.27 d'addition. Nous avons déjà
montré que n EB n = 0 pour tout n E N dans la proposition précédente.
Pri,p~1tîô~,1.1~ss.; P~i~lli;til'\:: Nif;1it\ît<z~~~lôri i 4 (t) i ;;.<2~,+,i; · ·
PREUVE. On raisonne par récurrence sur le couple ( a, n), pour l'ordre lexicographique de
N2 . Pour a = 0, il est immédiat que 1 EB 0 = 1. Soit a ~ 1 et soit 0 :( n < 2a. On suppose
que pour tout couple (b, m) tel que 0 :( b < a et m < 2b, ou tel que b = a et m < n, on
a 2b EB m = 2b + m. Ainsi, il est facile de voir que cette hypothèse entraîne que, pour tout
m<2a,
m = 2a1 + · · · + 2av = 2a1 EB · · · EB 2av,
où a> a1 > !Xz > ··· > <Xp ~ 0 sont uniquement déterminés et correspondent à l'écriture de
men base 2.
a-1 a-1
Écrivons m = L. mk2k et n = L. nk2\ avec mk, nk E {0, 1} pour 0 :( k <a.Alors
kaa-0 kaa-0
a-1 a-1 a-1
m EB n = ffi(mk2k EB nk2k) = ck2k = E9 L.
ck2k par hypothèse de récurrence,
k=O kaa-0 kaa-0

_ { 1 si (mk, nk) = (1, 0) ou si (mk, nk) = (0, 1),


avec ck - 0 si (mk, nk) = (0, 0) ou si (mk, nd = (1, 1).

On en déduit que m EB n < 2a. Notons Nza = {k 1 0 :( k < 2a}. Comme l'application
Nza -, Nza : m H m EB n est injective et que N2a est un ensemble fini, cette application est
bijective et en particulier
{m EB n I m < 2a} = {0, 1, ... ,2a - 1}.
De plus, l'hypothèse de récurrence montre que pour m < n, on a 2a EB m = 2a + m. Aussi
{2a EB m 10 :( m < n} = {2a,2a + 1, ... ,2a + n -1}.
En résumé,
2a EB n = ppne({0, 1, ... , 2a - 1} U {2a, 2a + 1, ... , 2a + n - 1})
= ppne{0, ... , 2 a + n - 1}
=2a+n.
On obtient ainsi la relation souhaitée au rang suivant, ce qui démontre la proposition. ■

5. Définition par récurrence de la loi 0. Nous allons définir une loi multiplicative en
nous efforçant de respecter la propriété 6 principale d'un anneau intègre : on veut que (ne
n') 0 (mem')-/- 0 sin-/- n' et m-/- m'. Comme dans le cas de l'addition, on peut se borner
par symétrie à ne considérer que les couples (n', m') tels que n' <net m' < m. Dans toute
la suite, on supposera dans les formules que la loi 0 est prioritaire sur EB.

Définition 11.34. Soient n et m deux entiers naturels. Le produit n EB m est le plus petit
entier différent des entiers de la forme n' 0 m EB n 0 m'en' 0 m', avec n' < n et m' < m.

n0m =ppne{n' 0mEBn0 m'en' 0m' n' E Y'(n) et m' E Y'(m)}.


1

On retrouve n 0 0 = ppne(0) = 0 = 0 0 n. On vérifie immédiatement par récurrence sur


n E N que n 0 1 = ppne{n' 0 1 n' < n} = ppne{O, 1, ... , n - 1} = 1 0 n = n, etc.
1

PREUVE. Soit n, p, q trois entiers naturels tels que p -/- q et n-/- O. Les rôles de pet q étant
symétriques, on peut supposer que q < p. Mais par définition, la partie
çg ={n' 0p EBn0p' en' 0p' n' <net p' < p}
1

sous-définit n 0 p. On remarque que n 0 q = 0 0 p EB n 0 q e O 0 q E çg car O < net


q < p. Comme n 0 p (/. Ç;g par définition, il en résulte que n 0 p -/- n 0 q. On a donc montré
que si n 0 p = n 0 q, alors p = q. La réciproque étant évidente, la première équivalence est
démontrée. La seconde se démontre de la même manière. ■

On en déduit une extension de la définition du produit, qui se démontre exactement comme


la proposition 11.31.

Proposttiôn- 1:1'.:i6é; Soi,ent .·n •. et m'deux entiê'ts ~iuretset .~iê,.N•Ji(~miC .·N de'tl$
parties qùi sous:.âéfini~ent n etm, respictivément, AfÔi-Sc • . . .
· · ·. r . t •· ,.
{n 0 m EB n. 0 m. en 0 ni I m
.J , €· !.îtm.....et ·n i',€ Jî7n.}' Sl'JYts~d~jln1,t
'·\/ •. . .· ..·.
ll: 0 m;

~êînë tfit7:
t•etîsernüÎ,.fN) inùhi/<le~ lois œ' et e; ·e~t ûn antifau îri:~; d/iÜiiil lé ~tnnM/1:

PREUVE. L'intégrité de N découlera immédiatement de la proposition 11.35 une fois les


autres axiomes vérifiés. On a vu que n 0 1 = n pour tout n EN. Il reste à vérifier que pour
(n,p,q) E N3

p0q=q0p n0(pEBq)=n0pEBn0q n0(p0q)=(n0p)0q.

6
Dans toute formule, on peut employer indifféremment les signes Ell ou 8 car Sn = n pour tout n E N. On
gardera parfois les signes 8 en souvenir de la formule d'origine dans un anneau quelconque.
La commutativité et l'associativité de 0 se démontrent par des récurrences analogues à celles
de l'addition - c'est un bon exercice pour le lecteur que de les rédiger avec soin. Concentrons-
nous sur la distributivité de la multiplication par rapport à l'addition.
On raisonne par récurrence sur N = n + p + q. Pour N = 0, on a bien O0 (0 EB 0) = 0 0 0 =
0 = 0 0 0 EB O0 O. Soit N > O. On suppose que r 0 (s EB t) = r 0 s EB r 0 t sir+ s + t < N.
Les trois parties
ÇJn0 p ={n' 0p EBn0p' en' 0p' n' <net p' < p},
1

ÇJn0 q = {n' 0 q EB n 0 q' en' 0 q' n' <net q' < q} et


1

çgpEllq = {p' EB q I p' < q} U {p EB q' 1 q' < q}


sous-définissent n 0 p, n 0 q et p EB q respectivement. De plus, d'après la proposition 11.36,

ÇJ = {n' 0 (p EB q) EB n 0 r en' 0 r In' E 9(n) et r E çgpE!lq}

sous-définit n 0 (p EB q). Pour r = p' EB q, l'hypothèse de récurrence permet de développer

n' 0 (p EB q) EB n 0 r en' 0 r = n' 0 p EB n' 0 q EB n 0 p' EB n 0 q en' 0 p' en' 0 q


= n' 0p EBn0p' en' 0p' EBn0 q.
En inversant les rôles de p et q, on obtient

n' 0 (p EB q) EB n 0 (p EB q') en' 0 (p EB q') = n' 0 q EB n 0 q' en' 0 q' EB n 0 p.

On a donc montré que


{n' 0 (p EB q) EB n 0 r en' 0 r In'< n, p' <pet r = p' EB q} = {s EB n 0 q I s E çgn0p};
{n' 0 (p EB q) EB n 0 r en' 0 r In'< n, q' < q et r = p EB q'} = {n 0 p EB s I s E çgn0q}-
Pour résumer, on a établi que

ÇJ = {s EB n 0 q I s E çgn0p} U {n 0 p EB s I s E çgn0q}.

Le membre de gauche sous-définit n 0 (p EB q) et celui de droite sous-définit n 0 p EB n 0 q


d'après la proposition 11.31. Il en résulte que n 0 (p EB q) = n 0 p EB n 0 q, ce qui prouve la
distributivité et conclut la démonstration du théorème. ■

1.3. L'ensemble N muni des lois EB et 0 est un corps


Nous abordons la partie la plus technique de ce complément. Bien que toujours aussi élé-
mentaires, les preuves qui suivent sont pénibles. Il faut s'accrocher, car le résultat en vaut la
peine! Rappelons que l'on note Np= {k 10 :( k < p} et Un= 2rzni pour (p,n) E N2 et que
pour tout x E N, on note x 28 = x 0 x sa puissance carrée.

i.è'~~~;tî.sj;·• . -_____-__ _ _ __ _ ___ _ _ _ •- _.._-_-


$Qit tt ~-O:Si Nan e~ stable . . pour là loî 0, alors {N~,
.

PREUVE. Il s'agit de vérifier que tout élément O < x < Un est inversible dans Nan. Or,
l'application Îx : Na\ {0} -1 Na\ {0} définie par Îx(-Y) = x 0 -y est injective d'après la
proposition 11.35. Comme l'ensemble Na \{O} est fini, l'application Îx est donc aussi surjective.
Notamment, il existe x 0 E Na\ {0} tel que Îx(x 0 ) = 1, ce qui montre que x a pour inverse le
nombre Xo E Na. ■
L~~•l:lAlS. $Qif;1},J;:N,. Si.N<i,i ·e,t .tm cufP.avalo'.l's,.:,
v{x'., 1:1} eNi> x 0 a'n. <irv ~o~+ïk . .. .
a~ . .limemfJre•àe àrottf~t f~-altâvicîJs Ôfhati6~Wsuèllis"itê.~;1&n JHi~ié~Vi'âppli~·
cation
..
·•· '••·.: («, fii ·i,.,nt0a.tt $ . p ·est·. ûn'iitmîo'f'/iffisifiê!41éi'flrovi1m'IJ•âdJ
A.· :~a.,.· '. ;_;•..N•·. Gn+t • ' . . ·. '
TJtifs> ·

PREUVE.
► Il est immédiat que A est un morphisme de groupes. Soit (x, y) E N~n tel que A(x, y)= O.
Alors, six cf. 0, on aurait
X0 Un EB 1J = 0 #Un= x- 1 01},
où x- 1 serait l'inverse de x dans N a-n· On aurait donc Un E Nan, ce qui est absurde. Ainsi
x = 0, puis y = 0 0 0 0 x = O. Le noyau de A est donc nul : le morphisme de groupe A est
injectif et donc bijectif car Nan est un ensemble fini.
► De plus, une récurrence facile sur x montre que x0 Un ( XUn- En effet, six'< x et u < Un,
alors x 0 u 0 u 0 x' E Nan. Si on suppose que x' 0 Un ( x'un, alors
X1 0 Un EB X 0 U 0 U 0 X1 ( X1 Un+ Un - 1 = XUn - 1.
On en déduit que
x0 Un ( ppne{x' 0 UnEBX0 ue u0x' 1x' < xu < Un} ( ppne{k 10 ( k ( XUn -1} = XUn.
On a donc A(x, y)= x0 UnE&Y ( XUn +y< Un pour tout (x, y) E Nan. Comme l'application
A est bijective, l'égalité s'ensuit. ■

$eil)t {:t~?~· stiPJ7ô~ê11•e Niii ,~st: .'Lffl •cûtps 'ét ([ite '/liiur iéutx
. $.i;i~.f.;fdti'

PREUVE.
► On note cp : N --+ N : x H x 20 . On a vu que cp(x E& y) = cp(x) EB cp(y). Comme on a
immédiatement cp(x 0 y) = cp(x) 0 cp(y) et cp(l) = 1, on en déduit que cp est un morphisme
d'anneaux. Notons que cp(x) = 0 # x 20 = 0 # x = O. Ainsi, cp est un morphisme injectif.
De plus, comme Nan est un corps par hypothèse, l'application cp induit un isomorphisme de
corps cp : Nan --+ Nan. Nous venons donc d'établir que pour tout l3 E Nan, le polynôme
X2 EB l3 E Nan [X] a une racine double. Autrement dit, tout élément de Nan a une unique racine
carrée.
► Par hypothèse, on peut définir 1j,,: Nan --+ Nan/2 en posant lj,,(x) = x 20 E& x. De plus,

x 20 œx = y 20 œy# x 20 e y 20 œx e y= O # (x œy) 0 (x e y) œ (x e y)= o


# (x E& y EB 1 ) 0 (x 0 y) = 0 # y = x ou y = x EB 1.

Chaque point de l'image de 1j,, : Nan --+ Nan/2 a donc exactement deux antécédents. Il en
résulte que 1j,, est surjective. Autrement dit, {x 20 EB x 0 ( x < un} = {k 0 ( k < un/2}.
1 1
Ainsi, tout polynôme de la forme X2 EB X EB f3 avec O ,::; f3 < Un/2 a ses deux racines dans le
corps Nan·
► Pour résumer les deux points précédents, pour tout couple (ex, /3) < (1, un/2) dans l'ordre
lexicographique de N2, le polynôme X2 EB exX EB f3 a toutes ses racines dans Nan. Comme
Un r/. Nan, on en déduit que a~0 EB ex 0 Un EB f3 -=/ 0, soit encore a~0 -=/ ex 0 Un EB /3. Mais
ex 0 Un EB f3 = exun + f3 prend exactement toutes les valeurs 0, 1, ... , Un+ ( Un/2 - 1) quand
( ex, /3) décrit l'ensemble des couples d'entiers tels que ( ex, f3) < (1, Un/2). Donc
2 Un_3
Un0 ): Un+
2 - 2un.
► Par hypothèse, le polynôme X 2 EB X EB Un/2 n'a pas de racine dans Nan. Aussi il n'est pas
de la forme (X - b) 0 (X - &') = X 2 0 (b EB &')X EB b 0 &',avec(&,&') E N;n. Autrement dit,

V(&,&') E N~n' X EB ~n c/ 0(& EB &')X EB b 0 &'.

D'après le lemme 11.39, on en déduit que UnEB 0ï -=/ (bEBb')0Un0b0b' pour tout (b, b') E N;n.
Donc a~0 = ppne{(b EB &') 0 Un 0 b 0 &' 1 b < Un, &'<un},::; Un EB ,.., ce qui démontre, par
double inégalité, l'identité annoncée. ■

PREUVE. Nous allons montrer par récurrence sur n EN la propriété suivante.

Nan estuncorpsetVxENan, x 28 EBx< ~n- (Hn)

► Pour n = 0, on a a 0 = 2. Il est immédiat que N2 = {O, 1} est stable par multiplication et


que x 2 EB x = 0 pour x = 0 ou x = 1. N2 est bien un corps d'après le lemme 11.38.
► Soit n E N. On suppose que (Hnl est satisfaite et on montre (Hn+il- Soit z et z' deux
entiers dans Nan+i. D'après le lemme 11.39, les nombres z et z' ont une écriture unique sous
la forme z = ex 0 Un EB f3 et z = ex' 0 Un EB f3 ', avec ( ex, ex', /3, /3 ') E N!n. On calcule le produit
z 0 z' = ex0 ex' 0 a~0 EB /3 0 /3' EB (ex 0 /3' EB ex' 0 f3)un
= ex 0 ex' 0 ( Un EB 0ï) EB /3 0 /3 1 EB ( ex 0 /3' EB ex' 0 f3) Un
= ex 0 ex' 0 Un EB ex 0 ex' 0 ,.. EB f3 0 f3 1 EB ( ex 0 f3 1 EB ex' 0 f3) Un.
On a en effet a~0 = Un EB Un/2 d'après (Hn) et le lemme 11.40. Il s'ensuit que z 0 z' < Un+l,
ce qui montre la stabilité de Nan+i et donc que Nan+i est un corps par le lemme 11.38.
De plus,
a
z 28 EB z = (ex28 EB ex)un EB ex 0 ex' 0 n EB (/3 28 EB /3 ).
2
On vérifie aisément que tous les termes de cette somme sont dans Nan, sauf le premier qui est
strictement inférieur à ( ~n )un=
2
i'
= 0 ''.t' , ce qui termine la preuve de (Hn+l ). ■

Remarque. N est l'union sur n EN des corps finis Nan, de cardinal 2( 2nl_ On peut facilement
en déduire (voir la preuve du lemme 11.40) que tout entier admet dans (N, EB, 0) une unique
racine carrée. Par exemple, v'2. = 3 comme le montre le tableau 11.2. On imagine que les
pythagoriciens auraient adoré vivre dans un monde modélisé par (N, EB, 0).

Le corps (N, EB, 0) possède une autre propriété remarquable. Comme tout entier admet
une racine dans ce corps, les esprits vifs auront peut-être conclu que tout polynôme de degré
à coefficients dans N admet une racine. En effet, il est bien connu que tout polynôme de la
forme
P = aX 2 + bX+c
avec a-/- 0, admet pour racine

-b ± ✓b 2 -4ac
X± = ------,2:-a_ __

Signalons ici que les opérations sont effectuées dans le corps (N, Ell, 0). On devrait donc plutôt
écrire que l'on s'attend à ce que P ait pour racine

b Ell ✓b 28 - 4 0 a 0 _c
Xo = ____ 2_0_•_a_ _ _ (11.3)

Cette formule a un sens car 2 et a sont non nuls, de sorte que le produit 2 0 a est non nul
et donc inversible. Pourtant, cette formule n'est pas correcte. En effet, quand on regarde la
démonstration de la formule des racines du binôme de Newton, on se rend compte que le
facteur 2 du dénominateur n'est pas donné comme tel, mais qu'il résulte de la somme de deux
monômes dans le développement du polynôme

Ainsi, le chiffre 2 résulte de la somme 2 = 1 + 1. Mais dans notre corps, 1 EB 1 = O. Donc


la formule (11.3) n'est pas correcte, ce dont on se rend facilement compte sur des exemples.
Considérons ainsi le polynôme
P1 =X 2 +X+ 1
à coefficients dans le corps N2 = {O, 1}. Tout élément de ce corps admet une racine. Pourtant,
P,(O) = P,(1) = 1, avec les règles de calcul de (N,EB,0). On en déduit qu'il n'existe pas de
formule du type de (11.3) pour calculer une racine du polynôme P. En revanche,

P 1 (3) = 328 Ell 3 EB 1 = 2 EB 3 EB 1 = 2 EB (2 EB 1) EB 1 = (2 Ell 2) EB (1 EB 1) = O.


Donc P, admet une racine dans N4 = {0, 1, 2, 3}. Peut-être qu'alors dans le corps N4, tout
polynôme du deuxième degré admet une racine? La réponse est non, comme le montre par
exemple le polynôme
P2 = X2 + 3X + 1,
car P2(0) = 1, P2(1) = 3, P2(2) = 3 EB 1 EB 1 = 3, P2(3) = 2 EB 2 EB 1 = 1. Donc P2 n'a pas de
racine dans N4.
En revanche, un petit calcul montre que P2 (13) = 10 EB 11 EB 1 = O. Comme la somme des
racines est égale à 3 et que 13 EB 3 = 14, on a aussi P2(14) = O. Ainsi, le polynôme P 2 n'a pas
de racine dans N4 , mais il a ses deux racines dans N 16 . C'est en fait général.

Proposition 11.42. Pour .tout entier n ~. 0, on peut trouver un pal'!)n~e d,u J~if,J,,e
degré. i.coeffic~ dans le. corps Nan so,ns mcine ~tiSN'iln, .·~ tow, jkil~111,e d~/Îf~~'IJ}~
degré (I; coeffiéiènts dans Nan 0, ses racin,:s dans Nu..+1, . .. . . 'k •

Nous ne démontrerons pas ce dernier énoncé car nous ne disposons pas de l'outil permettant
de traiter cette question, c'est-à-dire la théorie de Galois, que nous verrons en troisième année.
En somme, N est le « plus petit » corps qui contient N2 et tel que tout polynôme du deuxième
degré à coefficients dans N admet ses racines dans N. On dit que N est quadratiquement clos.
Chapitre 12
ARITHMÉTIQUE DANS Z

1. DIVISIBILITÉ DANS L'ANNEAU (Z, +,X)

Rappelons que l'ensemble aZ est défini par aZ = {ak Ik E Z} et que, pour tous entiers relatifs
a et b, on pose

Nous utiliserons à plusieurs reprises le résultat suivant, démontré dans le chapitre 11.

'l'~~ 12:.l. ·. Les;iàéaua;4e l'arinm1!; (Zi+, xî s.QJit 'e:eokte:ment ·les M;i~'éensêmolê.~fle


Z d.e lfl,form,e;mZ où m EZ..

Plus précisément, pout tout idéal I de l'anneau (Z, +, x), il existe un unique m E N tel
que I = mZ.
Bien que déjà définie dans le chapitre 11 sur un anneau intègre quelconque, nous rappelle-
rons dans ce qui suit la relation de divisibilité sur l'anneau (Z, +, x) ainsi que ses principales
propriétés.

I.1. La relation de divisibilité sur Z


Définition 12.2. Soit (a, b) E Z 2 . On dit que a divise b, ou que b est un multiple de a, et
l'on note a I b lorsqu'il existe q E Z tel que b = aq.

Ainsi, 0 est divisible par n'importe quel entier relatif et le seul entier relatif divisible par
0 est O. Les seuls diviseurs dans Z de 1 sont -1 et 1. Pour tous entiers relatifs a et b, on a
clairement a I b si et seulement si bZ C aZ.
Remarque. La relation de divisibilité est réflexive et transitive mais pas antisymétrique sur
Z : en effet, a I b et b I a si et seulement si a= ±b.

Notation. D'une manière générale, nous noterons ~a, ,... ,am l'ensemble des diviseurs communs
à des entiers relatifs a 1 , ... , Um donnés. Ainsi, ~a désigne l'ensemble des diviseurs de a et donc
~a, ,... ,am = ~a, n ... n ~Um. On note de même Aa, .... ,am l'ensemble des multiples communs
à des entiers relatifs a 1, ... , am donnés. Ainsi, Au, .... ,am = Aa, n · · · n Aam. L'ensemble Au
sera de préférence noté aZ.

Deux entiers ont les mêmes diviseurs si et seulement s'ils sont égaux ou opposés. Nous
utiliserons à plusieurs reprises ce résultat élémentaire.

PREUVE. Si ~a = ~b, alors a E ~a = ~b donc a I b. On prouve de même que b I a d'où


a= ±b. La réciproque est claire. ■
282

Test 12.1. Test 12.3.


:3 Montrer que sur Z, a Ib et b I a si et seulement Prouver que a I b si et seulement si bZ C aZ.

i
si a= ±b. Test 12.4.
Test 12.2. Soit n E N*. Montrer que 9 I 1on - 1.
La relation de divisibilité est-elle une relation
.2 d'ordre sur N ?
rn

1
~ I.2. Le théorème de la division euclidienne
Le théorème de la division euclidienne est une mise en forme de la division enseignée et
pratiquée dans les petites classes, celle que l'on pose de la manière suivante

701 4
400
----
175
301
280 ams1 701 = 4 x 175 + 1.
21
20

Théô~e ti~i;l;,(DiviMi:,ne~t:lie~): S~nt a~ Z et b è ~- Jl ê$i[!te un uiJ,iq't!,e


CfJuple ('g ;r}E zt tel11ue a ;.:.; b(f +T et O~r. <P:.1/e ,i. ,stc. 1/tt;IX,~fl,t âf!Milà_
di~O'R-,eticlidJetfn, ~t',l,JKl,r v ,rtJ;t~r,è&iappelê lij; . ~.àafliS . 'Vi~M?n ew;lûl~ne
dea,~bIJ' ·

PREUVE. Procédons en deux temps.

o Commençons par prouver l'unicité d'un couple (q, r) tel que a = qb + r et O ( r < b
soient deux couples (q 1, r 1) et (q 2, r 2) vérifiant ces conditions. Alors a= q 1b+r 1 = q 2b+r2,
d'où r2 - r1 = b(q, - q2); ainsi b divise r2 - r,. Puisque O ( r2 < b et O ( r1 < b, on en
déduit que -b < r 2 - r 1 < b. Le seul multiple de b dans ] - b, b [ étant 0, on a r 2 = r 1.
Puisque r2 -r, = b(q, - q2) = 0 et b cp 0, q, = q2.

o Soit E = {k E Z I kb ( a}. Cet ensemble est une partie non vide et majorée de Z : si a? 0,
0 E E et a majore E (car b? 1); si a< 0, a E E et O majore E. L'ensemble E admet donc
un plus grand élément q. On a donc qb ( a< ( q + 1)b et en posant r = a - bq, on a bien
0 ( r < b. ■

Remarque. On peut même préciser que si a EN, le quotient q dans la division euclidienne
de a par b est un entier naturel. En effet, si a ? 0, on a vu au cours de la preuve précédente
que q = sup(E) et que O E E. On a donc q = sup(E) ? O.
On déduit de l'unicité dans le théorème précédent que b I a si et seulement si le reste dans
la division euclidienne de a par b est nul.
283

Test 12.5. Test 12.6.


Poser la division euclidienne de 644532 par 56. Soit n E N. Écrire la division euclidienne de
n 3 + n 2 + 2n + 1 par n + 1.

I.3. Application aux systèmes de numération


L'idée la plus simple pour représenter un entier naturel est d'utiliser un même symbole répété
plusieurs fois. On peut ainsi énumérer la liste des premiers entiers naturels non nuls : 1, 11,
111, 1111 ... Cette méthode élémentaire se révèle très vite coûteuse en bâtons et en temps ! À la
manière des Romains, on peut tenter quelques économies en regroupant 5 bâtons en un seul
symbole V ou signifier 10 bâtons par la lettre X. Au cours des siècles, les mathématiciens
ont élaboré divers systèmes de numération, c'est-à-dire de représentation des entiers naturels.
Le mieux connu des lecteurs est certainement le système décimal : un entier naturel n est
représenté par son chiffre des unité ao, des dizaines a,, etc. jusqu'à un chiffre Œm (chiffre
des milliers si m = 3, des millions si m = 6, des milliards si m = 9, etc.). On note alors
n = Um ... u 1 u 0 ou plus rigoureusement n = Um ... a,uo 10 afin de se souvenir qu'il s'agit des
chiffres den dans le système décimal pour lequel la base vaut b = 1O. Plus généralement, pour
tout entier b ? 2, on peut écrire n en base b, c'est-à-dire déterminer des chiffres a 0 , ••. , Um E
{O, 1, ... , b -1} tels que

n = ao + a, b + U2b 2 + ... + Umbm, ce que l'on écrira n = Um ···a, Uob-


La proposition suivante prouve ce résultat et établit l'unicité des chiffres a 0 , a 1, ... , Um de n
en base b.

J?rôp~~~Ï;î.~ : $iï~ntJi€fu~\~f~,\i ~·• .lt•tlJjÎSte JJ,1J. . Utiift},e ~ti~· tt~l.ll\et:«n,


u~qae;.m.':tJ',;~e.t ~~illi, ••. ;a;,).tf'.e~.apfJM~Jffl,(111,t à,{0, l,~.•. ,1>-:-- lJ. tels,f[ttiJ
;;·+ 0}6f êi21, -f-...,>+ a.nibn:t'. ~t~~i- Ô,
i 2

iil~Wif~~~i{,S-~:.,a,~~•·Onditq.¾i,'0i/i'<i.·Mue,~dn,
PREUVE. Notons r 0 le reste et q 0 le quotient dans la division euclidienne den par b, puis,
\ln? 1, notons rn le reste et qn le quotient dans la division euclidienne de qn-l par b. D'après
la remarque de la page 282 sur la division euclidienne, on sait que les deux suites (rnlnEN et
( qnlnEN sont à valeurs dans N.
o Unicité : les ai sont uniques car, en cas d'existence, on a clairement Vk ~ m, ak = rk et
Vk? m + 1, rk = O. L'entier m est donc le plus grand entier naturel k tel que rk cf. O.

o Montrons par l'absurde qu'il existe un entier n 0 pour lequel qll-0 = O. Si ce n'était pas le
cas, on aurait pour tout n? 0, qn = bqn+l + fn+l avec O ( fn+l d'où bqn+l ( qn et comme
qn+l > 0 et b ? 1, qn+l < qn. La suite ( qn)nEN serait donc strictement décroissante ce qui
est absurde car il s'agit d'une suite d'entiers naturels.
◊ Existence : soit n 0 le plus petit entier naturel tel que q11-0 = O. On a alors, pour tout
0 ( k ( no, qk = bqk+T +rk et q11-0 = 0 d'où n = r 0 +r1b +r2b 2 + ... +r11-0b11-0. Le nombre
r11-0 n'est pas nul car q11-0-l = bq11-0 + r11-0 = r11-0 et q11-0-l cf. 0 par définition de n 0 • ■
284

EXEMPLE 12.6. Écrivons n = 10043 10 en base 2.


► On a successivement 10043 = 2 x 5021 + 1, 5021 = 2 x 2510 + 1, 2510 = 2 x 1255,
1255 = 2 X 627 + 1, 627 = 2 X 313 + 1, 313 = 2 X 156 + 1, 156 = 2 X 78, 78 = 2 X 39,
39 = 2 x 19 + 1, 19 = 2 x 9 + 1, 9 = 2 x 4 + 1, 4 = 2 x 2, 2 = 2 x 1 et 1 = 2 x 0 + 1. Ainsi
n = 10043 10 = 10011100111011 2 .

Écriture d'un entier n en base b


On applique la méthode par divisions successives décrite à la proposition 12.5.

et ainsi de suite jusqu'à obtenir qno = O.

Test 12.7. Test 12.9.


Écrire n = 10011 10 en base 3. Écrire 3n en base 3 où n = 21001 3 sans aucun
calcul !
Test 12.10.
Test 12.8.
Écrire n = 110011 2 en base 6.
Écrire n +m en base 4 où n 31231 4 et
m = 20123 4 .

Il. LA RELATION DE CONGRUENCE SUR Z


Définition 12. 7. Soit n E Z. On définit sur Z la relation = de congruence modulo n par

On écrit alors que « a est congru à b modulo n ».

Lorsque n est nul, la relation de congruence modulo n coïncide avec la relation d'égalité
sur Z. Un entier relatif m est divisible par n si et seulement si m = 0 [n). Si q et r désignent
respectivement le quotient et le reste dans la division euclidienne de a par b -1- 0, on a a= r [b)
mais également a = r [q). On retiendra plus précisément le lemme suivant.

Lén:ünt:i :12.8, ~ ii,~ r[l>J âv'eclt e Nf •et O~ ,-:< 11, aJbrs T:~est le. ~të dàns la diwnon
eucli.die:nne ~ a paib.

PREUVE. Il existe q E Z tel que a = bq + r avec O ~ r < b, donc, d'après le théorème


de la division euclidienne, q et r sont respectivement le quotient et le reste dans la division
euclidienne de a par b. ■
285

11.1. Calculs de congruence


Proposition 12:9:fii'rêltJ.tii>il/J.etongroence modulon est une relation•d'éqÛivàlence.

PREUVE. Comme Va E Z, a - a = 0 est divisible par n, a = a [n] : = est réflexive. Il est


clair que n I a - b si et seulement si n I b - a, d'où a= b [n] si et seulement si b = a [n] : =
est symétrique. Si a = b [n] et b = c [n], on a aussi a = c [n] car c - a = c - b + b - a est
divisible par n en tant que somme de deux entiers divisibles par n : = est transitive. ■

C'est la transitivité de la relation d'équivalence « = [n] » qui justifiera les séquences du ~


......
type a= 10 = 2 = -2 [4] dont la conclusion est a= -2 [4]. ..d
ü

Ptop~~u't2,lftt•~i1\cj. Z~kP•tô~ e~tièrif~~~~l,~î,C etJ1:~Js~;J~··;;t/'


è;
i) a,~ \,'(nY~t iÙnl ~ ac eb:d(n] / . 3) ·a= b [nt~ Vic E i, hi\sitbftl.Ji'
2) a~ bîn'.J eh si dfn,}~ à,+c '= b+ d.l.Jt}; 4} «i;;;.b {n),=} Vk EN'\ C11c,S'$lil!i;[n};1

PREUVE.

1) Supposons que a= b [n] etc= d [n]. Comme ac - bd= c(a - b) + b(c - d) et que n
divise a - b etc - d, n divise aussi ac - bd, donc ac= bd [n].
2) Supposons que a = b (n] et c = d [n]. Comme a + c - (b + d) = ( a - b) + (c - d) et que
n divise a - b etc - d, n divise aussi a+ c - (b + dl, donc a+ c = b + d [n].
3) C'est un cas particulier del) avec c = d = k.
4) La propriété se démontre sans peine par récurrence sur k EN* à partir du 1). ■

Les congruences évitent bien des lourdeurs et permettent d'aboutir à des résultats d'arith-
métique avec beaucoup d'élégance. Écrire a = b [n] évite le recours à une variable entière
k : il existe k E Z tel que a = b + kn. Par exemple, on pourra utiliser les congruences afin
de déterminer le chiffre des unités d'un grand nombre : sin = am ... a1ao 10 , c'est-à-dire
n = ao + a 1 10 + ... + am 1om, on a n = ao (1 0].
77
EXEMPLE 12.11. Déterminons le chiffre des unités de 7( l_
► Il faut commencer par étudier le comportement des puissances de 7 modulo 10 : on a
successivement 72 = -1 [10] et 74 = 1 [10]. On aura donc tout intérêt à poser la division
77
euclidienne de 77 par 4 : 77 = 4q+r avec 0 ,,;; r < 4. En effet, 7( l = 74 q+r = (74 )q?T = ?T [1 0]
4
car (7 ) q = 1q = 1 (1 0]. En fait, seule la valeur de r importe. Il suffit donc de considérer les
2 7
puissances de 7 modulo 4 : 72 = 1 [4] et donc 76 = (7 ) 3 = 13 = 1 [4], d'où 7 = 7 = 3 [4].
77
On a par conséquent r = 3 puis 7( l = 7 = -7 3 = 3 [10]. Le chiffre des unités de 7( 77 l est
donc 3.

Les congruences permettent également de prouver des résultats par récurrence.

EXEMPLE 12.12. Montrons que Vn EN, 712 4" +5.


4
► Raisonnons par récurrence sur N. Soit, pour n EN, HR(n) la proposition 2 " + 5 = 0 [7].
HR(0) est vraie puisque 2 + 5 = 7. Prouvons que pour tout n :;::: 0, HR(n) implique
40
4
HR(n + 1 ). Soit n E N; supposons HR(n) vraie, c'est-à-dire 24 " = 2 [7]. Puisque 2 "+' =
(2 ") , on a 2 "+' = 2 [7] = 2 [7]. D'où 2 "+' + 5 = 0
4 4 4 4 4
[7] et HR(n + 1) est vraie. D'après le
principe de récurrence, on a Vn E N, 2 4
" + 5 = 0 [7].
286

Test 12.11. Test 12.12.


<Il
Montrer que 10 6
= 1 [7]. Quel est le chiffre des unités de 312 ?

1
-g
..8
II.2. Application aux critères de divisibilité
<Il
~
Pro~~t~1f2:ltk Soit.n· =,•ttm.; :'ttfdb 1ô- tJn â altmi · ·..··. . .·. •
~ !} ·J'fp,.~ ~. .!et11ênt 1-L~ (;;Jo,2,.t,·6, tJ, ~) .ffn,sifît ~~~.ai 9:lqe *.,,;-tr Ltrmt
i a) lin. si et ~ulem.en.tsi. 31 ~ -f-, .,+ Uni,
- S) 41 n si et eeul~mimt si 4 l 0.1 ao- 1e, ••·· _6} t'ît~si ef~~~ents,Jlltt~1-:.~1+:./.r
t-..:=1~m.tt1WF' r:•; · ,✓• l:•r :I,it?.::
4) Sltt siet~ntJâô;~;il ~··llt>='S/

PREUVE. Commençons par écrire que n = a0+ lOa1 + ... + UmlOm.


1) Puisque 211 Ok pour tout k ) 1, n = a 0 [2) et donc n = 0 [2) si et seulement si a 0 = 0 [2],
d'où le résultat puisque a 0 E {0, 1, ... , 9}.
2) Comme 10 = 1 [3), on a lOk = 1 [3) pour tout k dans N. Ainsi, n = a 0 + 01 + ... +am [3)
et donc n = 0 [3) si et seulement si a 0 + a1 + ... +am= 0 [3).
3) Comme 41100, 411 Ok pour tout entier k ) 2. Ainsi n = a 0 + 1Oa 1 [4) et donc n = 0 [4) si
et seulement si a1ao 10 = 0 [4).
4) Comme 5 l 1O, 5 l lOk pour tout entier k ) 1, ainsi n = a 0 [5] et donc n = 0 [5) si et
seulement si ao = 0 [5) c'est-à-dire a 0 = 0 ou 5 puisque ao E {O, 1, ... , 9}.
5) Comme 10 = 1 [9), on a 1Ok = 1 [9) pour tout k dans N. Ainsi, n = a 0 + a 1 + ... +am [9)
et donc n = 0 [9) si et seulement si a 0 + a 1 + ... +am= 0 [9).
6) Comme 10 = -1 [11), on a lOk = (-1 Jk [11) pour tout k dans N. Ainsi, n = a 0 - a 1 +
... + (- 1) mam [11) et donc n = 0 [11) si et seulement si ao - a 1 + ... + (- 1) mum = 0 [11).

Test 12.13. Test 12.14.


L'entier n = 5445541 est-il divisible par 3 ? 4? Soit n = Um ... a 1ao 10 un entier divisible
5? 11? par 11. Montrer qu'il en est de même pour
n' = aoa1 ... am 10 .

III. LES NOTIONS DE PGCD ET DE PPCM
III.1. PGCD de deux entiers relatifs et algorithme d'Euclide

1>rôwsttft»;t.î2~1~.··•.•so~ûf,r a~:.a~~'*:··.n. ~fé!JJtef,ihf~ftiiili~I~


aZ. +,bZ_ ~.- mZ~ ~t f'Atîet" m. estt1.ppêlfié' PGl1EJ;.Jtiplît,skjmft4.~-~
m.·=
h. Oit le '11{,!te m ~ pged(ii,l>f oÎt àÀb:· Ainait . . . . . . . .

3(u,v} E'll-, aAb ==au+bv.


287

PREUVE. L'ensemble aZ + bZ est un idéal de (Z, +, x) en tant que somme de deux idéaux
de (Z, +, x), d'où l'existence d'un unique entier naturel m tel que aZ + bZ = mZ. ■ N
rJl

L'appellation PGCD mérite d'être éclaircie. Elle sous-entend deux propriétés : al\ b est ~
un diviseur de a et b, et il s'agit du plus grand (au sens de la relation d'ordre de la divisibilité 1 (l)

sur N) des diviseurs entiers naturels communs à a et b. La proposition suivante résume ces g
•(l)

1
deux propriétés.

P\'Ôl)O$itiii)n 12.l,5. &rient a èt b .®ris z. IJ11, e,itier retati}d est. 'Un dîrMfur .commun de
aetbsi~ ~ulement.si,d•inAo,.,Atitremtmi dit, S,4 çy,~.~ai\'lt, .... c-i
......
..d
ü
PREUVE. Raisonnons en deux temps.
(4==) Il suffit de prouver que a J\ b divise a et b. Comme aZ + bZ = (a J\ b )Z et que aZ et
bZ sont contenus dans aZ + bZ, on a aZ C (aAb)Z et bZ C (aAb)Z, ce qui signifie que
aAblaet aAblb.
(===}) Supposons que d divise a et b. Comme ( a J\ b )Z = aZ + bZ, il existe (u, v) E Z 2 tel
que a/\b = au+ bv : d divise donc également a/\b. ■

EXEMPLE 12.16. Voici quelques calculs de PGCD.


► Pour tout a dans Z, 0/\a = lal, en particulier 0A0 = O.
► Puisque !116 = {± 1, ±2, ±3, ±6} et !118 = {± 1, ±2, ±4, ±8}, on a 6 A8 = 2.
► De même, puisque !117 = {± 1, ±7}, on a 6 A7 = 1 et 8 A7 = l.
► Plus généralement, pour tout entier naturel n, nA(n + 1) = l. En effet, un diviseur
commun den et n + 1 divise nécessairement n + 1 - n = 1, d'où !::1n n !::1n+l = {± 1}.

Test 12.15. Test 12.16.


Calculer 2A3, 12A22, 14A49 et 13A3. Soient (a, b) E Z 2 et d dans N. On suppose
qu'il existe (u,v) E Z2 tel que d = au+ bv.
A-t-on d = a/\ b ? Que peut-on dire de d ?

L'algorithme d'Euclide permet de calculer le PGCD de deux entiers relatifs par divisions
euclidiennes successives. Il est fondé sur le lemme suivant.

LeJûmé'Îl~t'f'~'· ~t!ièrtf cr ~· (ll!.flmint ef t le reste dâiUs la 'di't!iitun ·êùtltdîenf{t dt Jl · ptJ,r


b E<N*. Alôr'sâ Ab ;, bÂT: ·· · · · ·· · · •. ·
PREUVE. Soit d un diviseur commun à a et b. Puisque r = a-bq, d est un diviseur commun
à r et b. Réciproquement, si d est un diviseur commun à r et b, comme a= bq + r, d est un
diviseur commun à a et b. On a donc !::1a,b = !::1b,r et il en résulte bien que a/\ b = b /\ r en
vertu de la proposition 12.15. ■

Pr6posilkmt2.tti. (Algorithùîe d'Euclide). $oient a et b deù:J; en,tiers naturels.a.vec

~i~ . •···.t~<~.tifn~fttiitWt'ilJ;/:;::1::?{i.~~fi}
On <t âliirl âXb ± no-1. . .
1' . . .
ftl~~t!it:rt
1
Voir la remarque de la page 281.
288

PREUVE. Les nombres r 0 , r 1 et r 2 sont bien définis car b # O. Supposons construits les
nombres ro, r1, ... , rn-1 où n;;,: 3. D'après le théorème de la division euclidienne, si rn-l # 0,

1
on peut effectuer la division euclidienne der n-2 par r n-1 dont le rester n vérifie 0 :::;; r n < r n-l ·
On remarque alors qu'il existe nécessairement un plus petit rang n 0 pour lequel rno = 0 car
sinon la suite (r nlnEN* serait bien définie, à valeurs dans N et strictement décroissante, ce qui
-g est absurde. D'après le lemme 12.17, pour tout 1:::;; k:::;; no, a Ab= rk-l Ark = rno-1 Arno=
..8
U) rno-1 /\0 = rno-1 · ■


[/)
Calcul du PGCD par l'algorithme d'Euclide
On cherche le PGCD de a et b. On peut toujours supposer b > O. On note r 0 = a,
r 1 = b. Il existe un rang n 0 pour lequel, pour tout entier naturel n tel que Vn0 ;;,: n;;,: 2,
rn le reste dans la division euclidienne de rn-2 par rn-1 est bien défini, avec rno = O.
Comme pour tout entier naturel n tel que 2 :::;; n :::;; no, r n-2 /\ r n-1 = r n /\ r n-1, on a
a/\ b = rno-1 /\ rno = rno-1 A0 = rno-1 ·

aAb est le dernier reste non nul dans l'algorithme d'Euclide

EXEMPLE 12.19. Calculons 61542A6514.


► Il suffit de poser les divisions successives

61542 16514 6514 2916 682


12~6 16!2 11~8
2916 9 682 188 118

188
70
ri1
118
48 1 ~o
70
22 1 ~8
48
4 12;
22
2
rs
et comme 4 = 2 x 2 + 0, on a 61542A6514 = 2.

Test 12.17. Test 12.18.


Calculer 424/\68 par l'algorithme d'Euclide. Soit n EN*. Calculer (Sn - 1) /\ (sn+l - 1).

III.2. Entiers premiers entre eux et relation de Bézout


Définition 12.20. a et b sont premiers entre eux lorsque a/\ b = 1, c'est-à-dire lorsque
leurs seuls diviseurs communs dans Z sont ± 1.

'l'hêb~e ·1:i.ft;:'(~~~)> D~ èn~r~ ~lôtîfs û êt. b sa,,,f,~rri;,et; :mitré ·•·~flg:


si lit seuletn$t si.if ~fë(u,v}E'l.4 tfef~ o.ù.+"W\h=;î.

PREUVE. Procédons en deux temps.


(==}) Puisque a/\ b = 1, on a aZ+bZ = Z et donc 1 E aZ+bZ, d'où l'existence de (u, v) E Z 2
tel que au + bv = 1.
289

({=) S'il existe (u, v) E .:;E;2 tel que au+bv = 1, on a 1 E aZ+bZ = (aAb)Z et donc a Ab 11.
Cela impose que a/\ b = 1 et donc que a et b sont premiers entre eux. ■

Une relation du type 1 = au+ bv (avec u et v dans Z) est appelée une relation de Bézout
pour les entiers premiers entre eux a et b. On peut facilement obtenir une telle égalité à l'aide
de l'algorithme d'Euclide : en notant To = a, T1 = b, T2 le reste dans la division euclidienne
de r 1 par r 0, ... , Tk (resp. qk) le reste (resp. le quotient) dans la division euclidienne de Tk-1
par Tk-2, ... , et en notant n 0 l'entier où l'algorithme d'Euclide s'arrête, i.e. Tno = 0, on a
Tno-l = UA b = 1. De plus, 1 = Tno-1 = Tno-2-Qno-1Tno-3 d'où l'on tire un relation de Bézout

a-
C'I
1 = <Xn,i-2Tno-2 + f3no-3Tno-3· Or on a Tno-2 = Tno-3 - Qno-2Tno-4 d'où l'on tire une nouvelle
relation de Bézout 1 = <Xn,i-3Tno_3 + f3no-4Tno-4, et ainsi de suite jusqu'à a= bq2 + T2 d'où
l'on tire une relation de Bézout de la forme 1 = aoa + f3ob,

EXEMPLE 12.22. Montrons que les entiers 157 et 24 sont premiers entre eux et trouvons
une relation de Bézout les reliant.
► Appliquons l'algorithme d'Euclide.

157 ~ 24 l!i_ 13 l!_!_ 11 l2-


13 6 1 11 1 1 2 1 1 1 1 5

Le dernier reste non nul dans l'algorithme d'Euclide étant égal à 1, les deux nombres sont
bien premiers entre eux. On a successivement

1 = 11-2x5, 1 =11-(13-ll)x5=6xll-5x13, 1 =6x(24-13)-5x13=6x24-llx13,

1= 6 X 24 - 11 X ( 157 - 6 X 24) = 72 X 24 - 11 X 157.


Ainsi, 72 x 24 - 11 x 157 = 1.

:\Ié'tliodc Obtention d'une relation de Bézout


Effectuer l'algorithme d'Euclide à partir de To = a et T1 = b, Tk-1 = QkTk-l + Tk
jusqu'au rang n 0 où Tno = O. Comme aAb = 1, on sait que Tno-1 = 1. Partir alors de
1 = Tno-2 - Qno-JTno-3 en utilisant les calculs de l'algorithme d'Euclide afin d'obtenir
une relation de Bézout entre Tk et Tk-l jusqu'à celle reliant To = a et r 1 = b.

Test 12.19. Test 12.21.


Trouver une relation de Bézout entre 5 et 7. Trouver une relation de Bézout entre 21 et 43.
Test 12.20. Test 12.22.
En déduire une relation de Bézout entre 5 2 et Montrer qu'il existe (u, v) E z2 tel que
7, 5 et 72 puis 5 2 et 72. 8u+ llv = 7.

Soient a 1, a 2 et b trois entiers relatifs tels que b A a 1 = b A a 2 = 1 . Il existe alors un


quadruplet d'entiers relatifs (u, v, w, x) tels que ua 1 + vb = wa2 + xb = 1, d'où

et donc b A (a, a2) = 1. Par une récurrence immédiate, on en déduit la généralisation suivante.
290

>Proposl~ 12.D.: , SiittJ,to..,; . •• ,fiiïtctt b'~Z,] ~~,V}c; ~ .Ttvrli~ti"';;k l1A(il[8


bA{a1;. ,tln} =t ·
Les quotients de a et b par leur PGCD sont deux entiers premiers entre eux.

Prôpôsittîiti'.24. 7.fhient . ô.. et. '&'.flti~ Z; 2avéi;:'{ùili} ~tOfOr:,•ôit i~ttfav~ 4Nb"t?Î Wti
écrira ~ dn",'puis b ~ db" f.tue1d o1,1''} èZ ; Alors à:'AbI. == J~ . . .. . ...

PREUVE. Comme aZ + bZ = (a/\ b )Z, il existe (u, v) E Z 2 tel que d = au + bv et donc


d = d(a'u+b'v). Comme (a,b) cf. (O,O), d est non nul et donc on a a'u+b'v = 1 et
a'Ab'=l. ■

Le lemme de Gauss est un résultat élémentaire mais très utile en arithmétique, comme
nous le verrons dans le paragraphe consacré à l'équation diophantienne du premier ordre.

PropÔ$itio1\ll•~~ (Lêtnfue dê Gâ\lSS). Soît{a;t,;c:)è'Z3 iif~e:cr1bt~~;â).}i, 6; L


A'lor.s a Ic: . .

PREUVE. Puisque albc, il existe a' E Z tel que be= aa'. Comme a/\b = 1, il existe
2
(u, v) E Z tel que au+ bv = 1. On a donc c = acu + bcv = a( eu+ a'v) et donc a I c. ■

On déduit de la proposition 12.23 et du lemme de Gauss la généralisation suivante : si


a/\bk = 1 pour tout k ~net alb1 ... bnc, alors al c.

PREUVE. Comme 01 lb, il existe q1 E Z tel que b = a1q1. Puisque UzAa 1 = 1 et azlb, on
déduit du lemme de Gauss que 021 q1 et donc que 01021 b. ■

On en déduit le résultat suivant par une récurrence évidente sur l'entier m EN*.

Pti>I,?051t1rm 1i.2r. $Ôièntc:t1,411 <Ja.n$t'~~ ~~,. tJOiii ti,ti:t{llè.~t#(iiftant


(l~. ~ }
=1 et <td b: .4!Qrs at'.«2.:,. om;jb~ · · · · · ·
i ;,,j, flil\t¾ · ·· · · · · · · ·

III.3. PGCD d'un nombre fini d'entiers relatifs


Le PGCD définit une loi de composition sur Z qui est manifestement commutative. Le
lemme suivant prouve que cette loi est associative, ce qui ouvrira la porte à une définition par
récurrence du PGCD den~ 2 entiers relatifs.

PREUVE. On sait que .'.z7a,b,c = .'.z7a n .'.z7b n .'.z7c- Or, on a vu que .'.z7a,b = .'.z1a n .'.z7b = .'.z7a/\b
et donc .'.z7a,b,c = .'.z1a/\b n .'.z7c = .'.z1(a/\b)/\c· Mais on a également .'.z7a,b,c = .'.z7a n (.'.z7b n .'.z7c) =
.'.z7an .'.z7b/\c = .'.z7a/\(b/\c)· D'où .'.z1a/\(b/\c) = .'.z7(a/\b)/\c et donc (a/\ b) /\C = a/\ (b /\C ), d'après
le lemme 12.3 de la page 281. ■

Pour un nombre fini d'entiers relatifs a 1 , ... , Un, on peut donc définir sans ambiguïté le
PGCD de ai, Oz, ... , Un par 01 /\Oz/\··· /\Un- On démontre sans peine par récurrence que
291

.Pu 1 n · · · n .Pun = .Pu 1 , ••• ,un. On peut également montrer par récurrence à partir de la définition
du PGCD que
u1Z + u2Z + · · · + UnZ = (u1 /\Uz/\ · · · /\Un)Z.
Ainsi, il existe (u1, ... , Un) E zn tel que

Définition 12.29. Des entiers relatifs u 1 , ... , Un sont dits premiers entre eux dans leur
ensemble2 lorsque leurs seuls diviseurs communs sont ± 1, c'est-à-dire u 1 /\ · • • /\ Un = 1. c--i
.....
Cette propriété est équivalente à l'existence d'une relation de Bézout 6
U1U1 + UzUz + ... + UnUn = 1.

On peut obtenir une telle relation de proche en proche.

EXEMPLE 12.30. Déterminons une relation de Bézout reliant les entiers 6, 10 et 15.
► On a 6 /\ 10 /\ 15 = (6 /\ 10) /\ 15 = 2 /\ 15 = 1. Les trois entiers sont donc premiers entre
eux. On a 2 x 6 - 10 = 2. Il suffit alors de trouver une relation de Bézout entre 2 et 15
15 - 7 x 2 = 1. Ainsi,

15-7x (2x6-10) =1 =-14x6+7x 10+1 x 15.

Test 12.23. Test 12.24.


Des entiers premiers entre eux deux à deux Étudier la réciproque.
sont-ils premiers entre eux ?

III.4. PPCM d'un nombre fini d'entiers relatifs


Comme pour le PGCD, on commence par définir le PPCM de deux entiers.

J>l'Ôp1$lim!Jl2;ft;t·~t)ièfÎt'~)ttlYi~Ztll ~te·:>ttri ~nMf :en:iet'; ·. ..·


aZ n bZ.;;:. mZ. Cet entier .m:· est a:èpeli Je PPCM, le pùii petit f!n'IJftiple ·coril
ôn le note m =p:petli(a, h} ou nt;::,;:; av b. . >

PREUVE. L'ensemble uZ n bZ est clairement un idéal de l'anneau (Z, +, x) d'où l'existence


d'un unique entier naturel m tel que uZ n bZ = mZ. ■

Comme dans le cas du PGCD, la terminologie PPCM signifie deux propriétés u vb est
un multiple de u et de b, et il s'agit du plus petit multiple au sens de la relation d'ordre de la
divisibilité 3 sur N des multiples entiers naturels communs à u et b. La proposition suivante
résume ces deux propriétés.

2
On dit parfois premiers entre eux sans préciser dans leur ensemble.
3
Voir la remarque de la page 281.
292

f/J

1
'2
..8
PREUVE. Le résultat découle immédiatement de l'égalité aZ n bZ = (av b )Z.

De la connaissance d'un des deux nombres a/\ b ou av b découle celle de l'autre. La


proposition suivante éclaire les liens entre le PGCD et le PPCM de deux entiers relatifs .

PrÔpositiôii 12:33. Pt11.tr ttius eritiërs a: et b J{Ô' Ah}fà vb f;, ltibt,' ·


f/J

1 PREUVE. Notons d = a/\ b et m = av b. Les cas où a = 0 et b = 0 étant banals, on suppose


a et b non nuls. On a a = da' et b = db' avec (a', b') E Z 2 tel que a'/\ b' = 1. Puisque
a = da' divise m, il existe ex E Z tel que m = da' ex. Comme b = db' divise m = da' ex
et d -=/ 0, b' divise a' ex. Or, a'/\ b' = 1, donc d'après le lemme de Gauss, b' 1ex et il existe
~ E Z tel que ex= b'~ d'où m = da'b'~, c'est-à-dire da'b' 1 m. Puisque da'b' =ab'= b'a
est clairement un multiple commun de a et b, ml da'b' et donc m = dla'b'I. Ainsi, labl =
d 2 1a'b'I =dm= (aAb)(a vb). ■

Le PPCM définit sur Z 2 une loi de composition commutative et associative, ce qui permet
la définition du PPCM den entiers relatifs a 1, ... , Un par a1 v a2 v ... v Un.

Test 12.25. Test 12.26.


2 Existe-t-il deux entiers relatifs a et b tels que
Justifier que la loi définie sur Z par le PPCM
est associative. a/\b=3etavb=87

IV. NOMBRES PREMIERS


Définition 12.34. Un entier naturel p est dit premier lorsque p ~ 2 et que ces seuls
diviseurs dans N sont 1 et p.
D'un point de vue intuitif, un nombre premier est un entier naturel incassable par division.
Par exemple, les nombres 2, 3, 5, 7, 11, 13, 17, 19 et 23 sont premiers. Un nombre entier non
premier est dit composé. Le crible d'Ératosthène est un algorithme élémentaire (mais peu
performant !) permettant de dresser la liste des nombres premiers inférieurs ou égaux à un
entier naturel n donné.

Le crible d'Ératosthène
On écrit la liste des n premiers entiers naturels non nuls, on élimine 1, les multiples de
2, puis les multiples de 3, etc. jusqu'aux multiples du plus grand entier inférieur 4 à y'rt.

1 ~ [J] 4 ~ 6 [Z] 8 9 10 OJJ 12 [U] 14 15


16 (Izl 18 [li) 20 21 22 ~ 24 25 26 27 28 [l2] 30
illJ 32 33 34 35 36 lm 38 39 40 @Il 42 @Ji 44 45
46 [1Zl 48 49 50 51 52 ŒJl 54 55 56 57 58 ~ 60
[fil] 62 63 64 65 66 ffiZl 68 69 70 [ZIJ 72 (ZJ] 74 75
76 77 78 [li] 80 81 82 ~ 84 85 86 87 88 ~ 90
91 92 93 94 95 96 (2zJ 98 99 100

Les nombres qui restent sont les nombres premiers inférieurs ou égaux à n.
293

IV.1. L'ensemble P des nombres premiers


Lemm:é.12.35; · Tout entier naturel n ~ 2 admet au moîns un diviseur premier.

PREUVE. Soit n ) 2. Notons E l'ensemble des diviseurs de n qui sont des entiers naturels
supérieurs ou égaux à 2. Comme n E E, E est une partie non vide de N. Soit k le plus petit
élément de E. Comme k E E, k In. Montrons que k est premier par l'absurde. Si ce n'était
pas le cas, k admettrait un diviseur 1 < k' < k et on aurait donc k' n d'où k' E E et 1

k' < inf(E) = k, ce qui est absurde. ■


(N
.....
.d
ü

PREUVE. Raisonnons par l'absurde en supposant l'existence d'un nombre fini m de nombres
premiers, notés P1, ... , Pm· Posons alors N = P1 x pz x ... x Pm+ 1. L'entier N admet au
moins un diviseur premier que nous noterons p. Par hypothèse, il existe i :( m tel que p = Pi·
Ainsi, Pi divise N et Pl x pz x ... x Pm, donc p divise également N -p1 x pz x ... x Pm= 1,
donc Pi= 1, ce qui est absurde car 1 n'est pas un nombre premier. ■

Démontré à la fin du XIXe siècle, le théorème des nombres premiers précise la répartition
asymptotique des nombres premiers parmi les entiers : le nombre n( n) de nombres premiers
inférieurs à n peut être estimé par l'équivalent n(n) ~ ln(nl. On déduit de cette estimation
que le n-ième nombre premier, noté Pn, vérifie Pn ~ nln(n) (voir le chapitre 25 pour la
définition des équivalents et leur maniement}.

IV.2. Le théorème fondamental de l'arithmétique


Le théorème fondamental de l'arithmétique affirme que tout nombre entier se décompose en un
produit de nombres premiers, cette décomposition étant ultime car les nombres premiers sont
incassables par division. Par exemple, 22869 = 11 x 11 x 3 x 3 x 3 x 7, puis en regroupant les
nombres premiers apparaissant plusieurs fois dans cette décomposition, 22869 = 3 3 x 7 x 11 2 .
Le théorème fondamental précise de plus que cette décomposition est unique à permutation
près des facteurs.

LemIAe 12~;17• .. Soient p un nombre premier et a E Z. Alors p A a = 1 si et seulement si p


ne di'()Ù;è pas a. · · ·
PREUVE. Raisonnons en deux temps.
(==}) Cette implication est claire.

(p ) Soit k un diviseur commun à a et p. Puisque p est premier et que k divise p, k = ± 1


ou k = ±p. Puisque p ne divise pas a, on a k = ±1, d'où p/\a = 1. ■

î>~opt,4t1Qn ·1i.:JS~. (Leinmê dtËÙclidê) . .Soient l' u~ nombre .prpmier eJ (a, b) E Z2 .tel
que plàb. Alors pl a ou plb.

4 On se limite aux diviseurs y'n car si k ,c:;; n est composé, il s'écrit n = n1n2 et l'un des deux nombres n et
1
n2 est nécessairement inférieur à y'n.
294

PREUVE. Soit p un nombre premier divisant ab. Si p I a, le résultat est acquis. Sinon, d'après
rIJ
Cl)
le lemme 12.37, p /\a= 1 et, d'après le lemme de Gauss, on a p I b. ■

On peut généraliser ce lemme par récurrence : si un nombre premier p divise un produit

1 ~L:;~~~;t~1;~~~~~:~;~t~;tl:'~-~~W. sqtt:un;~.~~t•··.
'2
rIJ
a, x ... x am, alors il existe 1 ::( i ::( m tel que p I ai.

~ ,(Pmc,~r Pr des
cOÛples (1'1' ~lh •.. llÙ ~. sont norrî6~. ~-,nif;1;s' w,· <,

les 1Xi sont da etttJers ti<itîtreiinon nuls tels <}tl,e .


c:.,
. ..• .
~

PREUVE. Raisonnons en deux temps.


o Existence. Raisonnons par récurrence sur n? 2. Notons HR(n) la proposition suivante
« Pour tout entier naturel 2 ,;( k ::( n, il existe un entier m EN, un m-uplet de nombres pre-
miers deux à deux distincts (p,, ... , Pml et un m-uplet d'entiers naturels non nuls (ex,, ... , exm)
tels que k = TT~, p:k. » HR(2) est banalement vraie car 2 est un nombre premier. Soit n? 2.
Supposons HR(n) vérifiée. D'après le lemme 12.35, le nombre n+ 1 admet au moins un diviseur
premier p. Comme n+lp
est un entier inférieur ou égal à n, on peut appliquer HR(n) : il existe
un entier m E N, un m-uplet de nombres premiers deux à deux distincts (p 1 , ••• , Pml et un
m-uplet d'entiers naturels non nuls (ex 1, ••. , exml tels que n; 1 = TT;;'=, p:k, et par conséquent
n + 1 =px TT;;'=, p:k : HR(n + 1) est donc vraie.
o Unicité. Supposons que n s'écrive

k=l
n = rr
m

k=l
p:k = rr
m'
qek

avec les Pi et qi premiers deux à deux distincts, met m' dans N* ainsi que les exk et les f3e-
Soit 1 ::( k ::( m. Puisque exk? 1, Pk In, donc d'après le lemme d'Euclide, il existe 1 ::( C::( m'
tel que Pk I qe et donc, puisque ce deux nombres sont premiers, Pk = qe. On a ainsi prouvé
que
{p,, ... ,Pm} C {q,, ... ,qm,}.
Les deux décompositions jouant des rôles symétriques, on a aussi {q,, ... , qm,} C {p 1, ... , Pm}-
Puisque ces deux ensembles sont de cardinaux respectifs m' et m, on a m = m'. Notons
K+ = {k 11 ::( k ::( m, exk > f3k} et K_ = {k 11 ::( k ::( m I f3k > exk}- On a alors 5

k=l
rr
m

p~ = rr
m

k=l
Ptk ==}
kEK+
rr p~ -f3k = rr
kEK-
Ptk -CXJc

et comme K+nK_ = 0, on déduit de ce qui précède que l'un des ensembles K+ ou K_ est vide.
0 na done TT kEK+ pk""-l3k = 1 ou TT kEK- pk'3k -CXJc = 1, ce qm. ent rame
' K + = K _ = 0 car tout
nombre premier est supérieur ou égal à 2. Ainsi, \fk E Nm, exk = f3k, ce qui achève de prouver
l'unicité (à permutation près) des couples (pi, ex,), ... , (Pm, exml décrits dans l'énoncé. ■

Cette décomposition de n est appelée décomposition de n en produit de facteurs premiers.

5
Rappelons la convention n k E 0 Œk = 1.
295

IV.3. La p-valutation sur N


Définition 12.40. Soient p E P et n E N*. On note 'Yp(n) l'exposant de p dans la dé-
composition de n en produit de facteurs premiers. Ce nombre est appelé la p-valuation de
l'entier n.
On déduit du théorème fondamental de l'arithmétique que, pour tout n E N*, il n'existe
qu'un nombre fini de nombres premiers p tels que 'Yp(n) ? 1 et l'on peut écrire
n = Il v"'p(n)

pEP

car ce produit ne compte en fait qu'un nombre fini de termes différents de 1. Cette écriture a
l'avantage d'être intrinsèque : elle évite le recours à l'indice met aux exposants <Xk-

Lemmê 12.4f.'V(ni,n) E (N*F mlnsi et sêulemenîsi 'v'p t:tP, v~(ml'<v;tnî:


PREUVE. Il est clair que la condition \lp E P, 'Yp(m) ~ 'Yp(n) est suffisante pour que ml n.
Réciproquement, supposons que min. Soit p EN un diviseur premier de m. Comme p"'p(ml
divise flqEP q"'q (nl et que \lq E P \ {p }, p"'v (ml A q"'q (nl = 1, on déduit du lemme de Gauss
que p"'v(ml lp"'v(nl, ce qui impose que 'Yp(m) ~ 'Yp(n). ■

On déduit immédiatement de ce lemme un moyen de calcul du PGCD et du PPCM de


deux entiers à partir de leur décomposition en produit de facteurs premiers.

Proposltion 12.42( Soient a et b dansN \{O, l}. Alors


0/\b ~·npmln{-Yp(a},Yp{bl). et «vb = flpmax.(vp.{<l),'Vp{b))_.
pEP pê,l>

V. L'ÉQUATION DIOPHANTIENNE DU PREMIER DEGRÉ


Il s'agit de résoudre dans Z l'équation ax+ b-y = c d'inconnues x et y, les entiers a, b, c étant
fixés.
Proposition 12.43; Soient (a, b} € Z2 avec (a, b) :f= (0,0) etc E Z, ;Alt1fs l'éq~atfon
ax + by = c admet au moins Une solution si et seulement si a Ab le. ·

PREUVE. Supposons que l'équation admette une solution (x, y). Comme a Ab divise a et
b, a Ab I ax + b-y = c d'où le résultat. Réciproquement, supposons que a Ab I c. Écrivons
d = a Ab, a = da', b = db' et c = de' où a', b' et c' appartiennent à Z. On sait que
a' Ab' = 1. Comme ( a, b) /= (0, 0), d f O et l'équation est équivalente à a'x + b'-y = c'.
Comme a' Ab'= 1, il existe (u,v) E Z 2 tel que a'u+ b'v = 1, donc a'uc' + b'vc' = c' et le
couple (x, y)= (uc', vc') est une solution particulière de l'équation ax + b-y = c. ■

Remarquons que la connaissance d'une solution particulière notée (xo, -y 0 ) de l'équation


a'x + b'-y = c' (voir la preuve donnée ci-dessus) permet la détermination de toutes les autres
solutions de l'équation. En effet, (x, y) est une solution si et seulement si a'x + b'-y = c =
a'xo + b'-yo, i.e. a'(x - xo) = b'(-Yo -y). Puisque a' Ab'= 1, cette égalité équivaut, d'après
le lemme de Gauss, à l'existence de k E Z tel que x - x 0 = kb' et -y 0 - y = ka'. L'ensemble
des solutions est donc

Y= {(x0 + kb',-y 0 - ka') lk E Z}.


296

Résolution de l'équation ax + by =c
◊ Si aAb ne divise pas c, l'équation n'admet aucune solution.
◊ Si aAblc, écrire d = aAb, a= da', b = db' etc= de' avec a',b' etc' dans Z.
L'équation est équivalente à a'x + b'y = c'.
1. On commence par rechercher une solution particlière (x 0 , y 0 ) en exploitant une rela-
tion de Bézout entre a' et b'.
2. Résoudre l'équation en écrivant qu'un couple (x, y) est solution si et seulement
si a'x + b'y = a'x 0 + b'y 0 , i.e. a'(x - x 0 ) = b'(y 0 - y). On applique ensuite le lemme
..... de Gauss (on a a' Ab'= 1) pour conclure que les solutions sont les couples d'entiers de
.....
la forme (xo + kb', Yo - ka') avec k E Z.

EXEMPLE 12.44. Résoudre dans Z 2 l'équation 3x + 2y = 5.


► Comme 3 x 1 +2 x (-1) = 1, on a 3 x 5+2 x (-5) = 5. Un couple (x, y) d'entiers est donc
solution si et seulement si 3x + 2y = 3 x 5 + 2 x (-5), c'est-à-dire 3(x - 5) = 2(-5 - y).
Puisque 2A3 = 1, on déduit du lemme de Gauss que (x,y) est solution si et seulement si il
existe un entier relatif k tel que x - 5 = 2k et -5 - y = 3k. L'ensemble des solutions de
3x + 2y = 5 est donc { (5 + 2k, -5 - 3k) k E Z}. 1

Test 12.27. Test 12.28.


Résoudre 2x - 3y = 1. Résoudre 2x + 3y = 2.

VI. LES ANNEAUX (Z/nZ, +, x)


Définition 12.45. On note Z/nZ l'ensemble quotient de Z par la relation d'équivalence
« être congru modulo n ».

On notera classiquement x la classe de congruence modulo n de l'entier naturel x.

PREUVE. Commençons par prouver que ces deux définitions ont un sens. Soient x, x', y et y'
dans Z tels que x = x' et y= y'. Pour que la définition x +y= x + y ait un sens il s'agit de
vérifier 6 que x + y = x' +y'· C'est bien le cas puisque x = x' [n] et y = y' [n] implique que
x+y = x' +y' [n]. De même, le produit x x y est bien défini puisque x = x' [n] et y= y' [n]
implique que xy = x'y' [n]. Il reste à vérifier que ces deux lois confèrent à Z/nZ une structure
d'anneau commutatif (ces calculs sont laissés aux soins du lecteur). ■

L'anneau Z/nZ n'est pas intègre en général. Par exemple, 2 x 2 = 0 dans Z/4Z, alors que
2#0.

6
Autrement dit, il s'agit de justifier que x +y est indépendant des représentants x et y des classes x et jJ.
297

:E>ropœitîOÙl.2.4'1-.•S 'l,itl\~N.~~téiJ.•HUitum ~$ool~~:f···


1) (i/n:Z,+,xJestun~; 3) n~t~îêr..
2){2Vn:Z,-h x) est intègre; ·
PREUVE. Démontrons la chaîne d'implications 1)=} 2), 2)=} 3) et 3) =} 1).
1) =} 2). Un corps est toujours intègre car tout élément non nul est inversible donc régulier
pour la loi x.
2) =} 3). Prouvons cette implication par contraposition. Supposons n non premier : il existe c-i
.....
alors n 1 et n 2 dans {2, ... , n - 1} tels que n = n 1n 2 . Ainsi, n = 0 = n1n 2 , mais comme n ..d
ü
ne divise ni n 1 ni n 2 , n 1 cf. 0 et n 2 cf. O. L'anneau (Z/nZ, +, x) admet donc des diviseurs de
zéro et par conséquent n'est pas intègre.
3) =} 1). Supposons n premier. Il suffit de prouver que tout élément non nul de Z/nZ est
inversible pour x. Soit k E {1, ... , n - 1}. Puisque n ne divise pas k et que n est premier,
kAn = 1. Il existe donc (u, v) E Z 2 tel que uk+vn = 1 et donc uk + vn = uk = ku = î. La
- --1
classe k est donc inversible dans l'anneau (Z/nZ, +, x) et son inverse vaut k = u. ■

On a en fait montré ci-dessus un résultat plus précis.

7
On déduit de cette caractérisation des inversibles de Z/nZ le petit théorème de Fermat .

•rr~~;!~-~,t1f~i!::.!i~rtm~'~F~rniàf)' Sl>îê?i{p:c~~•'i(1~ 1{~;:f\f!;~~~W~~Jt,


nfpJ. Deplus,sipAti=J,:rtl".:"' s,lfp}, · •· ·· · · ·. '" ; · :·:· •·

PREUVE. Puisque p est premier, Z/pZ est un corps. Ainsi (Z/pZ*, x) est un groupe d'ordre
p - 1. On a donc, pour tout IX E Z/pZ*, IXp-l = Î et donc IXP = IX. Cette dermière égalité
est encore valable en IX= O. Ainsi, pour tout k E N, on a ffP = n, c'est-à-dire nP = n [p]. Si
p /\ n = 1, on sait que n E Z/pZ* et donc n:v- 1 = î, c'est-à-dire nv- 1 = 1 [p]. ■

Test 12.29. Test 12.30.


Calculer s'il existe l'inverse de 12 dans Z/7Z. Déterminer le groupe multiplicatif (Z/lOZ)x.

7
Le grand théorème affirme que l'équation xn +yn = zn n'admet aucune autre solution entière pour n ~ 3 que
les solutions évidentes pour lesquelles xyz = O. Le mathématicien Andrew Wiles a démontré ce théorème en
1994, après dix années de recherches solitaires et presque secrètes, mais aussi dans le prolongement de quatre
siècles d'efforts de nombreux mathématiciens.
298

VII. EXERCICES

12.1. 2. En déduire que

Résoudre l'équation 7x - 111) = 6.

12.2.
12.6.
Résoudre dans Z le système de congruences
X= 2 [3], X= 3 [5].
On note Mn = zn - 1 pour tout entier naturel
n.
12.3. 1. Établir que Mn premier =} n premier.
2. Justifier que M 11 n'est pas premier.
On pose Un= sn+6n pour tout n E N. Calculer
Un+l /\Un.
12.7.
12.4.
Soit n E N. L'entier n 4 + 4 est-il premier ?
Montrer que pour tout n E Z, n( n + 1 )( 8n + 1)
est divisible par 6. 12.8.

12.5. On note n = pf1 ••• p~m où les Pi sont pre-


miers et deux à deux distincts et les cx.i dans
Soient u, m, n dans N* avec u ? 2. On se pro- N*. Combien n admet-il de diviseurs dans N ?
pose de calculer d = (un - 1) /\ ( u m - 1) .
1. Soit r le reste dans la division euclidienne de 12.9.
n par m. Établir que
Un=UT[um-1]. Résoudre dans Z 3 l'équation 2x + 31J + Sz = 1.
COMPLÉMENT 1. QUELQUES JEUX

Jeu de Nim et autres misères

Le jeu de Nim est très ancien et il en existe de nombreuses variantes. Dans la plupart des
jeux, la règle stipule que le gagnant est celui qui force son adversaire à ne plus pouvoir jouer.
Par exemple, aux échecs, le perdant est celui dont le roi est mis en échec sans qu'il ait le
moindre coup autorisé pour pallier l'échec. C'est somme toute naturel si on considère qu'un
joueur est d'autant plus en difficulté qu'il a moins d'options à sa disposition, et à plus forte
raison quand il n'en a plus du tout!
Le jeu de Nim renverse cette logique. Il fait partie de la classe des jeux dits « de misère» qui
considère au contraire que le joueur perd quand il est le dernier à pouvoir jouer.

1. Le jeu à une pile. Ce jeu se pratique à deux selon les règles suivantes. On dispose
sur une table une rangée d'allumettes. Un coup consiste à retirer de la rangée une, deux ou
trois allumettes. Le joueur qui retire la dernière allumette perd. Existe-t-il une stratégie pour
gagner à coup sûr ?
Représentons notre jeu par un graphe. Les sommets sont les positions possibles du jeu,
c'est-à-dire ici le nombre d'allumettes. C'est donc un graphe dont les sommets sont indexés
par N. On relie ensuite un sommet n, à un sommet n2 par une flèche (orientée) s'il existe
un coup permettant de passer de n 1 à n2 allumettes. Autrement dit, on définit un ensemble
d'arêtes E C N 2 par la condition
(n 1, n 2) E E # (n 1 = n 2 + 1 ou n 1 = n 2 + 2 ou n 1 = n 2 + 3).
On obtient ainsi un graphe orienté dont la figure représente un graphe partiel. Le lecteur
attentif aura noté que nous n'avons pas représenté toutes les flèches qui existent entre les
points 0, ... , 13, mais nous avons conservé celles qui sont significatives pour notre étude.

FIGURE 12.1. Graphe partiel du jeu de nim à une pile

On observe que le joueur qui jouerait à partir d'une rangée formée d'une unique allumette
est perdant. On dira que le sommet 1 est perdant. Mais alors, les sommets 2, 3 et 4 sont
gagnants puisqu'il existe des flèches joignant ces sommets au sommet 1. Un joueur devant
jouer à partir de la position 2, 3 ou 4 peut ainsi mettre son adversaire dans la position 1
perdante. En revanche, les trois coups possibles à partir de 5 mènent tous à des positions
dont nous venons de montrer qu'elles sont gagnantes. Le sommet 5 est donc perdant et il
s'ensuit que 6, 7 et 8 sont gagnants, etc. On peut donc étiqueter chaque sommet du graphe en
leur attribuant le statut de gagnant ou de perdant et on se convaincra facilement que chaque
triplet de sommets disposés verticalement dans notre figure sont gagnants, alors que chaque
sommet au contact de deux « losanges » sont perdants.
L'ensemble des sommets perdants est appelé le noyau du graphe. Tout joueur sait qu'il a
intérêt à connaître le plus de sommets possibles d'un tel noyau. Par exemple, les problèmes
d'échecs du type « les blancs jouent et gagnent en n coups» que l'on trouve dans la presse
sont des exercices où l'on demande de démontrer que l'on peut mettre l'adversaire dans le
noyau 8 en un seul coup et que ce dernier ne pourra résister que sur n - 1 coups.
Cette idée de noyau est peut-être mieux illustrée par une autre façon de schématiser le
jeu de Nim. Imaginons une bande de cases, infinie à droite. Le jeu débute en plaçant un jeton
sur l'une des cases. Un coup consiste à déplacer le jeton sur la gauche, dans la direction où
la bande a une extrémité finie, de une, deux ou trois cases. Le joueur qui déplace le jeton sur
la première case de la bande a gagné. Il est facile de se convaincre que ce jeu de bande et le
jeu de Nim sont éqivalents. Le numéro de la case occupée par le jeton peut en effet tout aussi
bien désigner le nombre d'allumettes sur la table.

■ 11 ■ 11 ■TI:.11 ■ 11.
FIGURE 12.2. Une bande semi-infinie

Les cases hachurées sont les cases perdantes. En effet, si un joueur doit jouer alors que
le jeton est sur l'une de ces cases, il ne peut pas déplacer le jeton jusqu'à la case hachurée
suivante. En revanche, le joueur adverse peut toujours contrer le coup en ramenant le jeton
sur une case hachurée. Comme la première case est perdante, toutes les cases hachurées sont
bien perdantes et les cases complémentaires sont gagnantes.
Dans ce schéma, le noyau est l'ensemble des cases en position 1, 5, 9, 13, etc. Ce sont les
positions obtenues à partir de la position 1 en ajoutant un multiple entier de 4. C'est donc
l'ensemble {n 1 :lp EN, n = 1 + 4p} = (1 + 4Z) n N, soit encore l'ensemble des représentants
positifs de la classe de 1 dans le groupe Z/4Z. La démonstration que cet ensemble est bien le
noyau repose sur le résultat facile suivant, appliqué au cas n = 4.

Proposition 12.50. Soit n~2 et p ~ 1 dans N. On a alora l'alternative suivante :


1) si p ~ 1[n], alors il existe un entier q tel que 1 ~ q ~ n- 1, q < p et p - q = 1[n);
=
2) si p l[n], alors pour tout entier q tel que 1 ~ q ~ n-1, on a p- q ~ l[n].

PREUVE. 1) On suppose que p ~ l[n]. Notons p la classe de p dans le groupe (Z/nZ, + ).


On a alors les équivalences suivantes, pour tout q E Z/nZ,
p-ëf = î {:}q=p-Î {:}q=p-1.
Soit q le plus petit représentant dans N de la classe p - 1. Alors, q ~ p - 1 car p - 1 est
un représentant de p -1. D'autre part, q E {O, 1, ... , n -1} car ce dernier ensemble contient
exactement le plus petit représentant positif de chaque classe de Z/nZ. Enfin, q -/= 0 car
sinon, on aurait p - 1 = 0, soit encore p = Î, ce qui est contraire à l'hypothèse sur p. Ainsi,
q satisfait toutes les conditions exigées dans le premier cas.
2) On suppose que p = 1[n] et que 1 ~ q ~ n - 1. Alors, n + 1 - q représente dans Z/nZ la
classe n + 1-q = Î -q = p-q = p - q. Or, 2~n+ 1-q ~n. Les classes possibles de p-q
sont donc 2, 3, ... , n - 1 et 'iï = 0, mais non la classe î, ce qui démontre le second cas. ■

8
Le graphe du jeu des échecs est toutefois légèrement plus compliqué à définir parce que l'ensemble des coups
possibles à partir d'une position de l'échiquier dépend de la couleur du joueur.
Supposons que l'on débute avec N allumettes et que l'on en retire de 1 à n - 1 par coup.
Si N =f=- 1[n], le premier joueur retire N-1 modulo n allumettes au premier coup, puis pare tous
les coups en retirant n - q quand son adversaire en retire q. Comme le nombre d'allumettes
décroît strictement, le jeu se termine quand le second joueur doit jouer et perdre avec une
seule allumette sur la table. Si au début N = 1[n], les rôles sont inversés.
2. Le jeu à plusieurs piles. On dispose cette fois plusieurs rangées d'allumettes sur une
table. Un coup consiste à retirer un nombre quelconque d'allumettes, mais au moins une dans
la rangée de son choix. Un joueur gagne s'il retire la dernière allumette.
Comme dans le cas du jeu à une pile, notre analyse va reposer sur un groupe. Cette fois,
il s'agit de (N,EB) que nous avons introduit dans le complément du chapitre 11. Rappelons
brièvement comment il est défini. Étant donnés deux entiers n1 et nz, on les décompose en
base 2, c'est-à-dire sous la forme
n 1 = 2«1 + 2«2 + • • • + 2"" et n 1 = 213 1 + 2132 + • • • + 213P',
avec a 1 > a 2 > • • • > <Xp~O et (3 1 > (3 2 > · · · > (3p, ~ O. On définit alors n1 EBnz comme la
somme des puissances de 2 qui figurent dans l'une des décompositions à l'exclusion de l'autre.
Autrement dit, on calcule la somme habituelle, après avoir éliminé les puissances qui figurent
dans les deux décompositions à la fois. Par exemple,
7EB 14 = (1 +2+4) EB (2+4+8) = 1 +8 = 9.
On a éliminé les puissances 2 et 2 2 . Le lecteur vérifiera - ou se reportera au complément du
chapitre 11- que l'on définit bien ainsi un groupe (N,EB) commutatif, d'élément neutre O et
qu'il possède en outre la propriété remarquable, mais immédiate, que n EB n = 0 pour tout
nEN.

~roposition t2.;i;J. . . $oit (nt, n2, ~ .. , 11.p) € (N \ {0})1'. On pose N =h1 E9 • · • $11.p. On a
alors l'alter;native suivante. ·
l) Si N =/= :O, alors il existe un entier ko tel que 1 ::;; k ::;; 1' et N E9 n.ko < ~.
2) SiN =0, alorspoùrl ::;;k::;; 1' etO~n{, < nk, on an1E9·· •n.1c.-1E9niE9n1c.+1 · • ·E9np =/= O.
PREUVE. 1) On suppose que N =/= O. Soit 2° la plus grande puissance qui figure dans la
décomposition de N en base 2. Par hypothèse, il existe un entier k 0 , avec 1 :S k 0 :S p, tel que
2° figure dans la décomposition de nko sous la forme

Soit fo le rang, dans l'ordre décroissant, de l'exposant a parmi ceux de cette décomposition.
Autrement dit, on a
<X1 > · · · > <Xjo =a> <Xj0 +1 • · • > <Xm ;::=: O.

Par définition de a, dans la somme N EB nko, la puissance 2° est éliminée, contrairement aux
puissances 2<>i avec j > fo. Il en résulte que

N EBnko::;; 2«1 + · · · +2"io+ 1 +2a-l + · · · +2+ 1::;; 2«1 + · · · +2"io+ 1 +2°-1 < nko.

2) On suppose que N = O. Soit n( < nk. Il s'agit de montrer que N EB nk EB n( =/= O. En effet,

N E9 nk E9 n( = (n, E9 · · · E9 nk E9 · · · E9 np E9 nk) E9 nk E9 n( = n1 E9 · · · E9 nk E9 · · · E9 Ttµ EB n(,


avec la convention habituelle que tout symbole portant un chapeau est en fait invisible dans
la formule. On a utilisé ici la commutativité de l'addition, puis son associativité et le fait que
nk EB nk = O. Comme N = 0, il s'agit donc de montrer que nk EB nt=/- O. Or, si nk EB nt = 0,
alors nk = nk EB (nk EB n() = (nk EB nk) EB nt = nt , ce qui est impossible car nt < nk. ■

Si N =/- 0 au début du jeu, alors le premier joueur calcule la somme N EB nk pour chaque
rangée jusqu'à rencontrer ko tel que N EB nko < nko· Il retire alors dans cette rangée autant
d'allumettes que nécessaire pour qu'elle n'en ait plus que N EB nko. La somme totale donne
maintenant N EB nko EB n 0 EB EBn1 EB · · · EB nko EB · · · EB Tt.p = N EB N = 0.Le second point
de la proposition 12.51 montre que l'adversaire ne peut maintenir N = O. Il suffit donc au
premier joueur de parer chaque coup en ramenant la somme à zéro. Comme le nombre total
d'allumettes décroît strictement, le jeu finit par s'arrêter, et ce n'est possible que lorsque
N = 0, c'est-à-dire après un coup du premier joueur, qui est donc le gagnant. Si N = 0 au
début, les rôles sont inversés.
Remarque. Et si un joueur perd en retirant la dernière allumette? Si N =/- 0 au début du
jeu, le premier joueur joue comme plus haut, tant que sa tactique donne au moins une rangée
de plusieurs allumettes. Que doit-il jouer quand ce n'est plus le cas? Gagne-t-il toujours?
Chapitre 13
POLYNÔMES À UNE INDÉTERMINÉE SUR
LE CORPS lK == :IR OU (C

'HÉRITAGE mathématique grec se résume à l'arithmétique et à la géométrie. Certes,

L quelques savants (comme Diophante) ont abordé la résolution des équations, mais
sans aucun recours au symbolisme et en faisant systématiquement reposer leurs tra-
vaux sur des considérations géométriques.

La naissance de l'algèbre date de l'époque médiévale arabe,


période où les mathématiques se sont progressivement déta-
chées de l'influence de la géométrie : au IX •après J.-C. le sa-
vant Al-Khwarizmi jette les bases de cette nouvelle branche
des mathématiques dans son Abrégé du calcul par restauration
et comparaison, à l'origine du mot Al-jabr 1 , algèbre. Il fallut
cependant attendre l'époque de Claude Viète et de René Des-
cartes pour que se développe le calcul littéral sur les inconnues
x, y, etc. Dès cette époque, les savants recherchent les rela-
tions existant entre les coefficients d'un polynôme et ses racines.
Ces développements aboutirent à l'invention des nombres com-
plexes (cf. Bombelli, Gauss, etc.), au théorème fondamental de
l'algèbre (d'Alembert, Gauss, etc.) et aux travaux d'Evariste
Galois sur les groupes de permutation et la résolubilité des Lagrange
équations algébriques.

Seule figure à notre programme la résolution générale des équations de degré deux. Il faut
cependant savoir qu'il existe des méthodes générales de résolution des équations de degré
trois (pour un aperçu des idées de Scipion del Ferro) et quatre (Ferrari et plus tardivement
Lagrange). Après de nombreux échecs concernant l'ordre cinq, Abel et Galois prouvèrent,
au début du XIX •siècle, qu'au-delà de l'ordre quatre, il n'existe aucune formule générale
permettant de calculer les racines d'un polynôme à l'aide de radicaux2 •

1. L'ALGÈBRE IK[X]

I.1. Nécessité des polynômes

Une expression de la forme Po+ p,x + p2x 2 + · · · + PnXn où n E N a un sens lorsque les
variables Pk (0 ::,; k ::,; n) et x appartiennent à un anneau (A,+, x ). Mais quel sens précis
faut-il donner au mot «expression» ? La réponse la plus immédiate est de définir cette

1
Ce mot signifie littéralement « remplissage ou réduction d'une fracture». Chez Cervantès, le mot algebrista
désigne un rebouteux.
2
Abel traita le cas de l'ordre cinq et Galois celui des équations de degré quelconque n:;,, 5.
304

«expression» comme l'application q> de A dans A telle que, pour tout élément x de A,
cp(x) = p 0 +p 1x+p 2x 2 + ... +PnXn; ce type de fonction est appelée une fonction polynomiale
à coefficients dans A de la variable x. Cette première approche s'avère en fait incomplète.

Plaçons-nous un instant dans le cas où l'anneau A est le corps lFz = Z/2Z = {O, î}, et
2 3
considérons les fonctions polynomiales de lF 2 dans lF 2 définies par f(x) = x +x et g(x) = x +x.
Puisque On = 0 et În = Î pour tout entier naturel non nul n, ces deux fonctions coïncident sur
JF 2 . Une affirmation telle que f est de degré 2 et g de degré 3 n'a donc aucun sens puisque f = g.
Cependant, les formules définissant f et g sont effectivement différentes. La définition d'une
expression du type précédent comme une fonction de lFz dans lF2 est donc insuffisante car elle
ne permet pas de distinguer entre les deux formules. Cette remarque permet de cerner l'intérêt
- de la notion de polynôme : différencier une expression du type précédent de la fonction qu'elle
définit.

Nous allons introduire dans ce chapitre la notion générale de polynôme à coefficients dans
le corps lR ou C, et verrons que dans ce cas, il est possible d'identifier un polynôme à la fonc-
tion polynomiale qui lui est associée. L'ensemble des définitions de cette partie sont cependant
généralisables à n'importe quel corps (JK, +, x ). L'exemple précédent prouve qu'il faut alors
distinguer les notions de polynôme et de fonction polynomiale. Les développements récents
de la cryptologie3 utilisent les propriétés des polynômes à coefficients dans un corps 1K fini,
cadre dans lequel cette distinction n'est pas gratuite.

Dans tout ce qui suit, 1K désigne le corps lR ou C. Dans l'esprit du mécano de la théorie des
ensembles, nous allons construire l'ensemble des polynômes à coefficients dans 1K à partir des
ensembles dont nous disposons. L'objectif de ce premier paragraphe est de définir un polynôme
comme une suite (PnlnEJI! d'éléments de 1K nulle à partir d'un certain rang4 : :3no E N, Vn;;::
n 0 , Pn = O. Le polynôme correspondant à l'expression x 3 + x sera (O, 1, 0, 1, 0, ... ) et celui
correspondant à x 4 - 2x + 1 sera (1, -2, 0, 0, 1, 0, ... ), les points de suspension signifiant que
la suite stationne à la valeur O. Il restera alors à définir trois opérations sur les polynômes,
celles correspondant aux calculs suivants :

et 3(x3 + x) = 3x3 + 3x.

I.2. La notion de polynôme


Définition 13.1. On appelle polynôme à coefficients dans 1K toute suite P = (PnlnEN nulle
à partir d'un certain rang. On note JK(Nl l'ensemble de ces suites.

Une suite nulle à partir d'un certain rang est également appelée une suite presque nulle.

3
Étymologiquement science du secret, la cryptologie est la science du codage et du décodage de données, une
discipline à mi-chemin entre les mathématiques et l'informatique. Les cryptologues sont nos amis : c'est grâce
à eux que nous pouvons effectuer en toute sécurité des transactions bancaires sur internet.
4
Rappelons que l'ensemble IK/1 des suites d'éléments de 1K a été défini dans le chapitre sur les structures
algébriques.
305

Pibpt:>slti,l~tionj,.3~2. Po,ur tous. P := ·{fJn.:fneN E JK!N}; .Q · =·{qtt)l\EN E JK(N) et


À e'.l(;:on posé ·· ·· ·
P +Q =JPn + et À• P = (ÀPn}:neN•
(fn~N

Ces de'//$ ppémtions âéfini,ssent respeètivemoot une loi interne et externe à domaine d'opé-
rateurs K sur JK(N).
PREUVE. Il existe n1 et nz tels que 'v'n > n1 , Pn = 0 et 'v'n > nz , qn = 0 et donc, en posant
n3 = max(ni, nz), 'v'n > n3, Pn+qn = 0 et donc P+Q E JK(NJ_ De même, 'v'n > n1, ÀPn = 0,
donc À • P E JK(Nl. L'ensemble JK(Nl est donc stable par la loi + et la loi externe à domaine
d'opérateurs 1K sur JK(NJ_ ■

On note plus simplement ÀP au lieu de À· P lorsqu'il n'y a pas d'ambiguïté.

pose
n
P X Q = (CnJneN où \in E N , Cn = :L PkQn""-k•
k=-0

Lo. loi x ainsi définie est· interne sur JK(Nl.

PREUVE. Il existe deux entiers n1 et nz tels que 'v'n > n1 , Pn = 0 et 'v'n > nz , qn = O.
Posons n3 = n1 + nz. Soit n > n3. On a Cn = L~=O Pkqn-k· Pour tout O ~ k ~ n, si
k > n1, on a Pk = 0; si k ~ n1, n - k? n-n1 > nz, donc qn-k = 0, ainsi Cn = 0 et donc
(cnlnEN =PX Q E JK(N)_ ■

On notera plus simplement PQ le polynôme P x Q. Nous regroupons dans la proposi-


tion suivante l'ensemble des règles de calcul sur les polynômes. Toutes les vérifications sont
élémentaires et laissées au lecteur.

Proposition 13.4. (JKCNJ, +, •, x J est une K-algèbre associative, commutative et unitaire,


c'est-àrdire :
1). (JKCNl, +, x} est un anneau commutatif;
2)· {K,{Nl,+, •)··est un K-espàee vectt>riel 5 , c'est-à-dire
(a) (J;lNl,+)est un groupe abélien;
{b) \f(À; µ) E K2 1 \fP E Jt(CN) , (À+µ}• P =À~ P + µ · P;
{c)\i;\ EK, VfP,Q}E{K<NlJ2 , À'. {P + Q}=À· P+À · Q;
(d) \fP E JK!Nl , l , P := P;
=
{e) V(X, µ) E K2 , \iP E K<NL, À · {µ., P) (;l,µ) · P;
3) \i(À, µ) E K2 , \i(P, Q) E {JK(N})2 , (À· P) X (µ. • Q} = (Àµ}; (P X Q).

Ajoutons que les éléments neutres pour les lois+ et x sont respectivement égaux à (0, ... )
et (1, 0, ... ). L'anneau (JK[X), +, x) étant commutatif, la formule du binôme de Newton y est
valable en toute généralité.

5
La structure d'espace vectoriel est à la base de l'algêbre linéaire. Le lecteur pourra se rapporter aux chapitres
correspondants mais leur étude n'est pas indispensable à la lecture des pages qui suivent.
306

P~iqa:<1à~5:(Formule du binôme). ,P:ourt:ausP. etQ dans KIX] etrvdansN♦,


o'nâ:

Les méthodes de démonstration sont exactement les mêmes que dans le cas complexe
une récurrence est possible mais la manière la plus élégante est basée sur la combinatoire6 •

Test 13.1. Test 13.2.


Soient les polynômes P = (0, 1, 2, 3, -1, 0, ... ) On reprend les notations du test précédent.
et Q = (-1,2,3,0, ... ). Calculer P+Q. Calculer PQ.

I.3. De l'inclusion 1K. c IK.[X]

Proposition 13.6. L'application i : K -t K(N) définie par i(a:} = (a:, 0, . .. ) est un mqr-
phisme de corps injectif 7 •

PREUVE. Soient ex et 0 dans K Par définition des opérations sur ][<:(!'Il, on a

(cx,0, ... ) + w,o, ... ) = (ex+ 0,0, ... ) et (cx,0, ... ) x (0,0, ... ) = (cx0,0, ... )

d'où i(cx) +i(0) = i(cx+ 0) et i(cx) x i(0) = i(cx0). De plus, i(l) = (1,0, ... ) = lK1"1-
L'application i est donc un morphisme d'anneaux. On conclut que i est injective en remarquant
que 8 Ker (i) = {O}.

L'image i(K) du c<;>rps li( par le morphisme injectif i est un corps isomorphe à li(, ses
éléments sont appelés les polynômes constants. Dans tout ce qui suit, on identifiera via i les
corps li( et i(K), ce qui revient à identifier un polynôme constant et son unique coefficient.
On écrira donc li( C K[X]. En particulier, l'élément neutre (1, 0, ... ) pour la loi x est égal à
1 et l'élément neutre (O, ... ) pour la loi + est égal à O.

I.4. L'indéterminée X. Degré et valuation d'un polynôme


L'écriture sous forme de suite presque nulle d'un polynôme est très lourde à manipuler 9 . Le
recours à l'indéterminée X, qui n'est autre qu'un polynôme particulier, permet d'alléger à la
fois les raisonnements et les calculs.
Définition 13. 7. On note X l'unique élément de li( (Nl dont le seul terme non nul est celui
d'indicel et vaut 1, c'est-à-direX=(0,1,0, ... ).

6
Voir la page 190 du chapitre 8 pour une preuve détaillée.
7
Rappelons qu'un morphisme de corps est un morphisme d'anneaux entre deux corps.
8
En fait, on peut prouver plus généralement que tout morphisme de corps est injectif.
9
Voir les difficiles calculs de produits du test 13.2.
307

.\ttcutiun L'indéterminée X
w
;:l
Dès que le contexte fait intervenir l'anneau OC[X], la lettre majuscule X est une nota- 0

tion réservée (au même titre que la lettre i des nombres complexes). On n'écrira donc ê1i
Il
JAMAIS des phrases du type « en posant X= ... » qui n'ont aucun sens! Autrement ~
dit, il ne faut pas confondre l'indéterminée X avec l'inconnue x. rJJ
e-
0
<:)

On rappelle la convention 10 X0 = 1 et la définition des puissances de X par récurrence :


pour tout entier naturel k, Xk+ 1 = X x Xk. On prouve sans peine par récurrence le lemme
suivant.

Lemme 13.8, Pour tout k E N*, Xk = ( ~ , 1, 0, •.. }.


J::Joïs
Les polynômes de la forme .\Xk où k E N et À E ][( sont appelés des monômes.
Notation. Soient (PnlnEJ\I E = O.
Il existe un entier naturel no tel que Vn > no , Pn
s
rJJ
][((NJ_
On pose ,o
no
f
-too
L PkXk = L PkXk.
k=O k=O ('<')
......
Cette notation a l'avantage d'éviter le recours à l'entier no et d'alléger en conséquence les
..d
démonstrations. ü

Il en résulte que pour tout (n, m) E N2 , on a xn · xm = xn+m_ Cette relation justifie a


posteriori la définition 15.3 du produit qui peut se résumer par la formule

Bien-sûr, la définition du produit n'a pas été faite au hasard ...

Proposition 13.9. Soit p = {Pn)Tl€N E JKN. Alors,

Les nombres Pk sont appelés les coefficients de P.

PREUVE. D'après le lemme et la notation définie ci-dessus, pour tout P = (pk)kEIK E ][((Nl,
+oo
on a P = .L. pkXk. ■
k=O

Remarque. Dans le langage de l'algèbre linéaire, cette proposition signifie que la famille
de polynômes (XnlnEJ\I est une base du OC-espace vectoriel OC[X]. Nous l'appellerons la base
canonique de ][([X].

10
Valable dans n'importe quel anneau.
308

Identification des coefficients


On déduit de la proposition précédente un résultat bien connu : deux polynômes sont
égaux si et seulement si ils ont les mêmes coefficients, c'est-à-dire, pour toutes suites
presque nulles (PnlnEN et ( qnlnEN
+oo +oo
I:. Pkxk = I:. qkxk {=} 'v'k E N , Pk = qk.
k=O k=O

......
...... L'usage de l'indéterminée X achève de formaliser la notion intuitive de polynôme que nous
avons décrite dans l'introduction.

A.t tc11tio11 Notation JK[X] de la OC-algèbre des polynômes

La notation IKY"l de l'ensemble des polynômes sur le corps 1K est désormais caduque.
Nous noterons désormais lK[X] cet ensemble.

Soit un polynôme P = (PnlnEN non nul; de manière équivalente


+oo
p= L. PkXk # o.
k=O
Posons E = {k EN I Pk # 0}. Puisque la suite (PnlnEN est non nulle, E est non vide. Comme
cette suite est presque nulle, E est une partie majorée 11 de N. E admet donc un plus petit et
un plus grand élément (respectivement notés met n) en tant que partie non vide et majorée
de N. On a donc m ~net
P = PmXm+ · · · +PnXn.
Définition 13.10. Soit P E lK[X]. Si P = 0, on pose deg (P) = -oo et val(Pl = +oo. Si
P = (PnlnEN n'est pas nul, on note deg (Pl (resp. val(Pl) le plus grand (resp. petit) entier
naturel n tel que Pn # O. Les entiers deg (Pl et val(Pl sont respectivement appelés degré et
valuation du polynôme P.

EXEMPLE 13.11. Déterminons le degré et la valuation de P =(X+ 1l 5 - 1 - X5 .


► D'après la formule du binôme, on a

ainsi val(P) = 1 et deg (Pl = 4.


Le choix des conventions deg (0l = -oo et val(0) = +oo est loin d'être arbitraire. Il permet
d'éviter les cas particuliers dans les théorèmes qui suivent, moyennant quelques conventions.
On posera désormais +oo + (+oo) = +oo et, pour tout entier naturel n, n + (+oo l =
(+oo l + n = +oo. On posera également -oo + (-oo l = -oo et, pour tout n E N, n + (-oo l =
(-oo l + n = -oo.

11
En effet, si Pn = 0 dès que n), n 0 , l'entier n 0 est un majorant de E.
309

Définition 13.12. Soit P un polynôme non nul, de degré n ~ O. Ils 'écrit de manière unique
P =Po+ · · · + PnXn avec Pn =fa O. Le coefficient Pn est appelé coefficient dominant de P. Un
polynôme est dit unitaire lorsque son coefficient dominant vaut 1.
u
g
ê1i
La proposition suivante rassemble les principales propriétés du degré et de la valuation. Il
Nous ne démontrerons que la formule deg (PQ) = deg (P) +deg (Q), les autres résultats étant ::ai:
r/J
faciles à établir. e-
0
CJ
Proposition 13;13. Soient P et Q dans K[X].
l)deg{PQ}Fdeg{P)+deg(Q } et va.lf PQ} =va.lWl+val(Q};
2) deg {P +QJ~ max(deg (P),deg{Q}} et val(P+Q)~ mîn(vàl(P),val{QJ}.
3) Sideg(P}#=deg{QJ, on adêg(P+Q} =mâx(deg(P},deg(Q)).
4) Si val(P} i-val(Q}, on a val{P + Q} = min(val(P), val(Q}).
=
5). 'r/A E K* , deg{ÀP} deg {P). etval(ÀP) = val(P).

PREUVE. Il est facile de prouver que les propriétés sont vraies lorsque P = 0 ou Q = O.
Par exemple, si P = 0, PQ = 0 et donc 1) est vérifiée puisque l'on a convenu de l'égalité
-oo = -oo + deg (Q) pour deg (Q) = -oo ou deg (Q) EN. Plaçons-nous dans le cas où Pet
Q sont non nuls. Notons n 1 = deg (Pl, deg (Q) = n2 et n3 = n, +nz. Reprenons les résultats
de la proposition-définition 13.3 de la page 305. On a vu que pour n > n 3, Cn = O. De plus
n,+n2

Cn3 = L, Pkqn1+n2-k·
k=O

Pour k < n,, on an, + n2 - k > n2 donc qn1+ni-k = O. Pour k > n,, on a Pk = O.
Ainsi Cn3 = Pn, qn2 =fa O car Pn, =fa O et qn2 =fa O. Ainsi deg (PQ) = n3 = n, + n2 et donc
deg (PQ) = deg (P) + deg (Q). ■

On retiendra facilement les formules exprimant deg (PQ) et val(PQ) en visualisant le


produit PQ de la manière suivante, si P = I:,~=m pkXk et Q = I:,~~m' qkXk, on a

où les pointillés désignent une somme de monômes de degré compris strictement entre m+m'
etn+n'.

Test 13.3. Test 13.4.


Que dire du produit de deux polynômes uni- Que dire de la somme de deux polynômes uni-
taires ? taires ? Que dire de leur différence ?

PREUVE. o IK[X] est intègre : soient Pet Q dans IK[X]. Comme deg (PQ) = deg (P)+deg (Q),
on a (deg (P) ~ 0 et deg (Q) ~ 0) ===} deg (PQ) ~ 0 donc (P =fa O et Q =fa 0) ===} PQ =fa 0, d'où
le résultat.

12
Rappelons que la notation Ax désigne le groupe des éléments inversibles d'un anneau (A,+, x) donné.
310

o Calcul de IK.X : un polynôme P appartient à lK.X si et seulement si il existe Q E IK[X]


rfJ tel que PQ = 1. Comme deg ( PQ) = deg (P) + deg ( Q) = deg ( 1) = 0, cette égalité impose

1
deg (P) = deg (Q) = 0 et donc P E IK*. Inversement, si P E IK*, on a clairement P E IK[X]x.
Ainsi IK[X] x = IK*. ■

'2
..s
rfJ
Définition 13.15. Soit n EN. L'ensemble des polynômes de degré inférieur ou égal à n est
noté IKn[X].
1
Ê Nous démontrerons dans les chapitres d'algèbre linéaire que IKn[X] est un sous-espace
(/)
vectoriel de IK[X].

B
~ Il. OPÉRATIONS USUELLES SUR LES POLYNÔMES

Au-delà des opérations usuelles+, x et l'opération externe du corps 1K sur IK[X], on peut définir
de nouvelles opérations sur les polynômes : la composition, l'évaluation et la dérivation.

II. 1. La composition des polynômes

Définition 13.16. Soient P et Q deux polynômes de IK[X]. Si P = 0, on pose Po Q = O. Si


P -1- 0, on note n? 0 son degré et l'on écrit P sous la forme P =Po+ p1X + ... + PnXn. On
pose alors Po Q =Po+ P1Q + ... + PnQn, avec la convention Q 0 = 1. Le polynôme Po Q
est également noté P(Q).
Par exemple, si P = X3 - X+ 1, on a P(X 2 ) = (X 2 ) 3 - (X 2 ) + 1 = X6 - X2 + 1.

Atte11tiu11 La notation usuelle P = P(X)


Lorsque Q = X, on a P(Q) =Po Q = Po +p1X + ... +pnXn =Pet on peut donc écrire
que P(X) = P.

Les propriétés de la composition sont rassemblées dans la proposition suivante dont la


preuve (élémentaire) est laissée au lecteur.

Proposition 13.17. La composition des polynômes vérifie les propriétés suivantes :


1) elle est associative : V{P, Q,RJ E K[XJ3 , Po (Q o R} = (Po Q} oR; ·
2) 'v'(P, Q, R) E K{X] 3 , v?I. E K , (P + ÀQ) o R =Po R + i\( Q o R);
3) V(P, Q, R) E K[X] 3 , (PQ} o R = {Po R)( Q o R).

EXEMPLE 13.18. Calculons le polynôme Q(X) = P(X + 1) pour P(X) = X3 - X2 - X+ 1.


► Comme P(X) = (X - 1)(X 2 - 1) = (X - 1)2(X + 1), on a

Q(X) = P(X + 1) =(X+ 1 - 1)2(X + 1 + 1) = X2 (X + 2) = X3 + 2X 2 .


311

Test 13.5. Test 13.6.


Calculer Q = P(X + 1) - P(X) pour P = X3. On reprend les notations du test précédent.
Quel sont le degré et la valuation de Q ? Calculer les polynômes R = Q(X + 1) - Q(X),
puis S = R(X+ 1)- R(X).

II.2. L'évaluation et les fonctions polynomiales


...
Définition 13.19. Soient P E OC[X] et a E OC. Si P = 0, on pose P(a) = O. Si P =f. 0, en ~
Il)
notant n son degré et P =Po+ P1X + ... + PnXn, on pose P(a) =Po+ P1U + ... + PnUn. ,Il)

L'application P: li(----, li( définie par P(x) = P(x) est appelée Jonction polynomiale associée
au polynôme P. 1
,Il)
"O
.s
Remarque. Pour tout polynôme P = I::: PkXk avec (Pkhoi presque nulle, on a clairement
0
§
+oo ,(lj

P(a) = L Pka\ s
rJJ

,o
k=O
.§,
cette dernière somme étant finie. ~
c,'.i
On dit également que le nombre P( a) est la valeur de P en a. Évaluer P en a signifie .....
calculer le nombre P (a). .d
ü

Proposition 13.20. $oiênt aE JI( e.tea: K[XJ -t K définie parea{Pl = P(a). L'application
ea, appelée opérateur d'éwl~o:tion en a, vérifie les propriétés suivantes :
1) 'V'{P, Ql eK[XJ2, 'ea{Pç Q}""' 8Q(o}(P) = P(Q(a)}.
2) V(P;Q} € lf\[X}2 ; 'vA È K , {P+ 1'Q)(u1= P(a} + :\Qfak
3J V{P/Q) E: KiXJ1 , èaf'PQJ e<1(P)e4 (Q) ~ P{a)Q(a).
=
PREUVE. Nous nous contenterons de prouver le 2), les autres démonstrations sont faciles et
laissées au lecteur. Ecrivons P = I:::
0 PkXk et Q = I:::
0 qkXk. On a

(P+ÀQ)(u) = (~(Pk+qÀk)xk)r a) = ~(Pk+Àqk)uk= ~pkak+ ~Àqkuk


+oo +oo
= L pkak+À L qkak = P(a) +ÀQ(a).
k=O k=O
Ces calculs sont justifiés par les propriétés usuelles des sommes puisque toutes les sommes
apparaissant dans la démonstration sont finies. ■

Remarque. Nous avons appris à évaluer les polynômes de OC[X] sur les éléments de li( mais
on pourrait tout aussi bien les évaluer sur tout élément d'un anneau contenant li( (comme par
exemple OC[Xl). On comprend maintenant le rôle de l'indéterminée X. La notation X symbolise
la capacité de l'indéterminée à être remplacée dans un polynôme par n'im~orte quel élément
d'un anneau contenant OC. On peut ainsi voir la proprosition 13.17 comme, une conséquence
de la proposition 13.20.
312

Test 13.7. Test 13.8.


rJl
Soient P et ~ans K[X). Dans chacune des Soient P et Q dans K[X). Dans chacune des

1
~

expressions P x Q et P x Q, préciser le sens du expressions Po Q et Po Q, préciser le sens du


symbole x. Comparer les deux fonctions. symbole o. Comparer les deux fonctions.
]
,.8
rJl
Il.3. La dérivation

1 Définition 13.21. Soit P un polynôme à coefficients dans K Si deg (Pl ~ 0, on pose P' = O.
Sin= deg (Pl ~ 1, P s'écrit de manière unique P =Po+ P1X + · · · + PnXn et l'on pose
P' = p 1 + 2pzX + · · · + npnxn-l _ Le polynôme P' s'appelle le polynôme dérivé de P.

Remarque. Autrement dit, pour tout polynôme P = .L.;:0 PkXk avec (pklkEN presque nulle,
on a
+oo +oo
P' = L kpkxk-l = I:.(e + llPr+1Xf.
k=l f=0

Par exemple, le polynôme dérivé de P = X4 - 6X 3 + 2 vaut D(Pl = P' = 4X 3 -18X 2 . Il est


clair qu'un polynôme P E ][{[X] vérifie P' = 0 si et seulement si P est constant, c'est-à-dire
P E OCo[X] = K

Test 13.9. Test 13.10.


L'application D : K[X) --+ K[X) est-elle injec- Déterminer la fibre o-1 ({X}) de D au-dessus
tive ? surjective ? de X.

Proposition 13.22.- Sait D : JK[XJ ---4 K[X] définie par D{P} P'.
1) D est une applica.tiôn linéaire;• c'ést~à:--âire

Y(P, Q) E K[XJ 2 , VA E K , D(P + ÀQ} = D(P) + ÀO(Q).


2) D est une dérivation 13 surl'anneau (OC[X],+, x}, ie
V(P, Q) E K[XJ 2 , D(PQ} = D(P)Q + PD(QJ,
3) Pour to'US n EN* et P E K[X], (Pny; nP'pn-t ..
4) Pour to'US polynômes P et Q dans K[Xl, on a (Po Q)' ·::;;;. Q1{P 1 q Q).

PREUVE. Soient p = .L.;:oPkXk et Q = .L.;:oqkXk.


1) Pour tout À E OC, on a P + "'AQ = .L.;:0 (pk + ÀqklXk d'où
+oo +oo +oo
D(P + "'AQl = (P + "'AQl' = I:. k(Pk + "'Aqklxk-l = I:. kpkxk-1 + L kqkxk-1
k=l k=l
= P' +"'AQ' = D(Pl +"'AD(Ql.

13
Une dérivation sur un anneau (A,+, x) est une application li : A -l A vérifiant la propriété suivante:
\/(a, b) E A 2 , li(ab) = ali(b) + li(a)b, appelée identité de Leibniz. On peut prouver qu'üexiste une unique
dérivation li sur IK[X] qui est linéaire et vérifie li(X) = 1 : il s'agit de O. ·
313

2) D'après la définition du produit sur JK[X], on a


u
::l
0
ês'l
Il
~
ainsi, rtJ

(PQ)' = t n( ~pkqn-k)xn-l = ~ npoqnXn-l + % (%k npkqn-kxn-l)


~u

~
Q,)
,Q,)

1
=voQ' + % Pk(%k(n- k+ k)qn-kxn-l)
,Q,)
"O
=voQ' + % Pk(%k(n- k)qn-kxn-l) + % kpk(%k qn-kxn-l) .s
§
,c,j
=poQ'+ %Pk(~eqfxH+k) + %kpk(~qfXHk-l)
s
rtJ

<O
1 1
=voQ'+ %vkxk(~eqfxt- ) + %kpkxk- (~qtxt) E,
~
+oo +oo C".Î
......
= PoQ' + L PkXkQ' + L kpkxk-lQ = PQ' + P'Q. .ci
ü
kcèl k=l
3) La formule découle d'une récurrence élémentaire en appliquant le 2).
4) Comme Po Q = L~o pkQ\ on déduit de la linéarité de D que
+oo +oo +oo
D(P O Q) = L_ PkD(Qk) = L_ kpkQ'Qk-l = Q' L_ kpkQk-l = Q' X (P' 0 Q)
k=O k=l k=O
où l'on a appliqué le 3) afin de calculer D(Qk).

Att('lltiou Dérivée formelle et dérivée analytique


Nous venons de construire une notion de dérivation formelle et purement algébrique des
polynômes à coefficients dans :IR ou C, c'est-à-dire sans faire appel à des passages à la
limite, à des taux d'accroissement, etc. Cependant, dans le cas où P E JR[X], la dérivée
de la fonction polynomiale P associée à P est bien définie et notée (P) '. Il est clair que
cette fonction est la fonction polynomiale ~iée ~ poly~ôme dérivé D(P) = P' de P.
Ainsi, pour tout polynôme P E JR[X], on a D(P) = P' = (P)'.
Remarque. Nous ne savons pas encore dériver des fonctions de la variable complexe.
Dans tout ce qui suit, seule la dérivée formelle de P E C[X] aura un sens.

L'itération de l'opération de dérivation permet de définir des polynôme1:1 dérivés de tout


ordre entier. '
314

Définition 13.23. Pour tout k E N*, la composée D k = Do ... D (k fois) est bien définie et
pour tout polynôme P E JK[X], on note p(kl = Dk(P) et on l'appelle polynôme dérivé d'ordre
k de P.
On adoptera la convention D 0 = idoc[XJ· Ainsi, VP E JK[X] , p(Ol = P. On notera souvent
P" au lieu de p(ll_ Par exemple, pour P = X4 - 5X 3 + 4X + 1, on a successivement P' =
4X 3 - 15X2 + 4, P" = 12X2 - 30X, p( 3 l = 24X - 30, p( 4 l = 24 et, pour tout entier k )! 5,
p(kl = O. Par une récurrence facile, on prouve la formule suivante.

EXEMPLE 13.24. Soient n EN, u E 1K et P = (X - a)n. On a alors

Vk > n, p(kl = 0 et Vk ,( n, p(kJ = n! (X - u)n-k_


(L)
(n-k)!
1
Test 13.11. Test 13.12.
Soit n ;;,, 1. Quel est le polynôme dérivé d'ordre Soient P E lK[X] et Q = P(X 2 ). Calculer les
(n-1) de xn+l? polynômes Q(kl pour 1 ~ k ~ 3 en fonction des
polynômes dérivés de P.

L'identité de Leibniz (PQ)' = P'Q + PQ' se généralise à un ordre n quelconque de la


manière suivante.

Proposition 13.25. (Formule de Leibniz). Pour tous polynômes P etQ dans JK[X] et
tout entier naturel n, on a

PREUVE. Soit, pour tout entier naturel n, HR(n) la proposition suivante :

'ef(P, Q) E JK[X] 2 , (PQ)(n} = f_ (~) p(k}Q(n-k}_


k=O

◊ HR(O) est claire.

◊ Prouvons que \ln E N, HR(n) ---+ HR(n + 1) soit n E N ; supposons HR(n) vraie. On a
alors, pour tous P et Q dans JK[X],

(PQ)(n+l} = [(PQ)(nl] 1 = ( t (~)p(k}Q(n-k})


1

= t( (~)p(k}Q(n-k})
1

= f_ (~) (p(k+l}Q(n-k} + p(k}Q(n+l-k})


k=O

par linéarité de la dérivation et d'après l'identité de Leibniz. Or


315

et ainsi

(PQ)(n+l) = f (k: ,)p(k)Q(n+l-k) + f_ (~)p(k)Q(n+l-k)


t, (~)
k=<J

t,
k=l

= (k: l) p(k)Q(n+l-k) + (:) p(n+l) + p(k)Q(n+l-k) + (;) Q(n+l)

= Q(n+l) + t, [ (k: ,) + (~)] p(k)Q(n+l-k) + p(n+l)_

Or, d'après la relation de Pascal, (k::,) + (~) = (n~1), d'où

HR(n + 1) est vraie et la formule est donc acquise d'après le principe de récurrence. ■

Le lecteur aura remarqué que la preuve de la formule de Leibniz est en tout point similaire
à la démonstration de la formule du binôme.

EXEMPLE 13.26. Retrouvons la formule de Vandermonde (voir page 192) à l'aide de la


formule de Leibniz.
2
► Soient n EN et P = xn. Comme, P = X n, on a (P )(nl = ((2n)!/n!)Xn. De plus, pour
2 2

tout entier k compris entre O et n, p(kl = (n!/(n - k)!Jxn-k et p(n-kl = (n!/k!)Xk. On


déduit donc de la formule de Leibniz l'égalité suivante :
2 2

(2n)!Xn= ( ~ (n) n! )xn=n!(~ (n) )xn


n! L k (n-k)!k! L k
k=O k=O

et donc, après division par xn =/= 0 (rappelons que l'anneau JK[X] est intègre),

Proposition 13.27. (Formule de Taylor pour les polynômes). Pour tous n E N,


P E Kn[X] et a E K, on a

PREUVE. Un polynôme p de 1Kn[X] s'écrit p =Po+ p,X + ... + Pnxn. Par linéarité de la
dérivation, pour tout k entre O et n, on a

d'où, après évaluation en a


316

et donc

n p(kl(a) k n (1 n C! f-k k)
L
k=O
~ ( X - a ) = L k!L_Pe(C-k)!u (X-a)
k=O f=k

= t (t
f=O
Pe (C _c~)!k! uf-k(X - a)k)
tve(t
k=O

= G)af-k(X-a)k) = tve(X-a+a)e
n
::::i

où l'on a appliqué la formule du binôme à l'avant-dernière ligne. ■

Test 13.13. Test 13.14.


Pour tous P E K[X] et a E K, déduire de la Écrire la formule de Taylor en a = 0 pour le
formule de Taylor que polynôme P = (X+ 1)5 . Quelle formule retrouve-
n (kl( ) t-on ainsi ?
P(X + a) = L P k! a Xk.
k=O

III. ARITHMÉTIQUE DANS IK[X], ACTE I


Nous allons définir sur JK[X] une arithmétique analogue à celle des entiers relatifs. Le point
de départ sera bien sûr la définition de la notion de divisibilité et la mise en évidence d'une
division euclidienne sur JK[X]. Comme dans Z, nous constaterons que les notions de pgcd et
de ppcm sont intimement liées à la description des idéaux de l'anneau JK[X], qui elle-même
découle de l'existence d'une division euclidienne sur JK[X].

III.1. Divisibilité dans l'anneau (OC[X], +, x)


Définition 13.28. Soient A et B dans JK[X]. On dit que A est divisible par B, que B divise
A ou encore que A est un multiple de B lorsqu'il existe Q E JK[X] tel que A= BQ. On note
alors BI A.

Ainsi, X4 + X est divisible par X et X3 + 1 mais également par le polynôme X + 1 puisque


X4 +X= (X+ 1)(X 3 - X2 + X). L'ensemble des multiples d'un polynôme P E JK[X] est noté
PJK[X] = {PQ I Q E JK[Xl}. La proposition AI B est équivalente à BJK[X] C AJK[X].

EXEMPLE 13.29. Pour tout n EN, x 2n+l + 1 est divisible par X+ 1.


► En effet,
2n
xzn+l + 1 = xzn+l - (-1 )2n+l =(X+ 1) L. (-1 )kx2n-k_
k=O
317

Notation. D'une manière générale, nous noterons ~A, ,---,Am l'ensemble des diviseurs com-
muns à des polynômes A 1, ... , Am donnés. En particulier, ~A désigne l'ensemble des u
diviseurs de A et donc ~A,, ... ,Am = ~A, n ... n ~Am· On note de même .,,f(A,, ... ,Am
g
êl
l'ensemble des multiples communs à des polynômes A 1, ... , Am donnés. On a donc claire- Il
ment .,,f/A, ,.. ,,Am = .,,f/A, n ... n .,,f/Am. L'ensemble .,,f/A sera de préférence noté AlK[X]. ~
r/J

~
Test 13.15. Test 13.16. (.)

Établir que AI B ~ BK[X] c AK[X]. Montrer que X+ 31 X3 + 27.

Lemme 13.~0. ~oient A et B dans JK[Xl. Alors AI B et BI A si et seulement si 3À E K* tel


que A;= ÀB .. JJew; tels, polynômes sont dits associés. On notera alors A ~
B. La relation
.~. est clairement une relation d'équivalence sur K[X].
PREUVE. S'il existe À E OC* tel que A= ÀB, alors on a clairement AI B et BI A. Réciproque-
ment, si AIB et BIA, il existe (Q1,Q2) E lK[X]2 tel que A= Q,B et B = QzA. Ainsi,
A= Q 1Q2A. Si A= 0, on a B =A= O. Si A-=/= 0, puisque OC[X] est intègre, on a Q 1Q2 = 1

et donc Q 1 E OC[X]x = OC* : on peut écrire que Q 1 = À E OC* et A= ÀB.

Si B divise A et A-=/= 0, alors deg (B) ::,:; deg (A). En effet, il existe un polynôme Q E OC[X]
tel que A= BQ d'où l'égalité deg (A)= deg (B) + deg (Q) et, comme on a clairement (A-=/=
0) =} ( Q -=/= 0 et B -=/= 0), deg ( Q) ;): 0 et donc deg (B) ::,:; deg (A).

III.2. La division euclidienn e sur OC[X]


Il existe sur l'anneau OC[X] une division euclidienne analogue à celle de (Z, +, x ). Elle est au
fondement de l'arithmétiqu e des polynômes. Effectuer la division d'un polynôme A par un
2
autre polynôme B non nul revient à écrire A sous la forme A= BQ+ R avec (Q, R) E lK[X]
et deg (R) < deg (B). La proposition suivante établit l'existence et l'unicité de ce couple
(Q, R) ; examinons, avant d'en donner la preuve générale, l'exemple de la division euclidienne
de A = X2 - 2X + 1 par B = X - 3. On commence par rechercher un monôme Q 1 tel que
deg (A - Q, B) < deg (A) : Q1 = X convient. Puis on détermine un monôme Q 2 tel que
deg (A- Q1B - Q2B) < deg (A- Q1B) : Q2 = 1 convient. Puisque deg (A- Q 1B- Q 2B) <
deg (B), la division est terminée. On pose la division euclidienne sur lK[X] de la manière
suivante.

X'2- ZX + 1 1 X- 3
- (X - 3X) X+1
= X+ 1 ainsi X2 - 2X + 1 = (X+ 1 )(X - 3) + 4.
(X-3)
= 4

Proposition 13.31. Soient A ei B dans K{X] i.ivéc B -f 0: Il existe un unique couple de


polynômes (Q, R) de K'.fXl tel que
A= BQ+ R et deg(R) < deg(B).

Les polynômes Q et R sont respectivement appelés quotient et reste dans la divisi<>n eucli.._
dienne ·de•A par B.
318

PREUVE. Raisonnons en deux temps.


r/J
o Unicité de (Q, R) : soient (Q1, Ri) et (Qz, R2) deux couples de polynômes de IK[X] tels que
A= BQ 1 + R1 et A= BQ2 + R2, avec deg (Ri) < deg (B) et deg (R2) < deg (B). On a donc

1
..Si
r/J
BQ1 + R1 = BQ2+ R2, d'où l'égalité B(Q1 - Q2) = R2- R1 et donc deg (B) +deg (Q1 -Q2) =
deg (R2 - R1 ). Raisonnons par l'absurde : si deg (Q1 - Q2) ~ 0, puisque deg (B) ~ 0, on a
alors deg (R2 - R1) =/- 0 et deg (R2 - Ri) ~ deg (B). Ceci est absurde, car deg (R1) < deg (B) et
deg (R 2) < deg (B) impliquent que deg (R2 - Ri) ~ max(deg (R,),deg (R2)) < deg (B). Ainsi
i Q 1 = Q2, puis R1 = A - BQ, = A- BQ2 = Rz.

i o Existence de (Q, R) : raisonnons par récurrence sur le degré de A. Notons m = deg (B) ~ 0
et B = bmXm + • • • + b 0 avec bm =/- O. Soient n un entier naturel et HR(n) la propriété
suivante : pour tout polynôme A de degré inférieur ou égal à n, il existe un couple (Q, R) de
polynômes à coefficients dans 1K tels que A= BQ+ R et deg (R) < deg (B). L'hypothèse HR(0)
est vraie : en effet, A = a0 E !K. Sim~ 1, on pose Q = 0 et R =A; si m = 0, on pose
Q = a 0/b 0 et R = O. On a bien dans tous les cas A= BQ+R et deg (R) < deg (B). Soit n ~ O.
Supposons HR(n) vérifiée. Soit A un polynôme de degré n+ 1 : A= nn+lxn+l +· · ·+a,X+a0 .
Sin+ 1 < m = deg (B), il suffit de poser R = A et Q = O. Sin+ 1 ~ m = deg (B), posons
A 1 = A- (an+i/bm)xn+l- mB. On a deg (A 1) ~ n, donc d'après HR(n), il existe un couple
de polynômes (Q 1, R1) tels que A, = Q 1B + R1 avec deg (R,) < deg (B). Posons R = R, et
Q = Q 1+(an+i/bm)Xn+ l-m_ On a bien A= BQ+R et deg (R) < deg (B). L'hypothèse HR(n)
est donc vraie pour tout n dans N par récurrence sur n. ■

Le lecteur aura reconnu l'étape fondamentale de la division euclidienne : rechercher un mo-


nôme Q 1 tel que deg (A-BQ 1) < deg (A). Lorsque n+ 1 ~ m, le monôme (an+i/bm)Xn+l- m
fait l'affaire car

(an+1/bm)xn+l- mB = nn+lxn+l + termes de degré inférieur ou égal à n.

L'unicité dans la division euclidienne sur IK[X] permet d'affirmer qu'un polynôme B =/- 0
divise A si et seulement si le reste dans la division euclidienne de A par B est nul.

EXEMPLE 13.32. Effectuons la division euclidienne de A= X4 +X 2 +X+2 par B = X2 -3.


► En adoptant la notation décrite ci-dessus,

X4 + x 2 + x + 2 x 2 -3
(X4_3x2) xz+4
4X 2 +X+ 2 ainsi A= (X 2 + 4)8 +(X+ 14).
(4X 2 - 12)
x+ 14

Parmi les exemples fondamentaux de division euclidienne, on retiendra l'exemple de la


division d'un polynôme P par X - a, où a est un élément de K

EXEMPLE 13.33. Cherchons le reste dans la division euclidienne de P E JK[X] par X - a,


où aEK
► Il existe un unique couple (Q, R) E JK[XJ2 tel que P = (X- a) Q + R et deg (R) < 1. Comme
deg (R) < 1, R est une constante que l'on calcule en évaluant les deux membres de l'égalité
P = (X- a)Q +Rena. On obtient R = P(a).
319

Cette méthode peut être adaptée au calcul du reste dans la division euclidienne de P par
(X - a)2. Il faudra dans ce cadre faire appel à la dérivation.

EXEMPLE 13.34. Déterminons de deux manières le reste R dans la division euclidienne


d'un polynôme P E JK[X] par B = (X - a) 2 où a E K
► Il existe Q E IK[X] et R = 1XX + f3 E IK 1 [X] tels que P = (X - a)2Q + IXX + [3. On en
déduit, après évaluation en a, que P(a) = 1Xa+ [3. De plus, P' = 2(X- a)Q + (X- a)2Q' + IX
et donc, après évaluation en a, on obtient IX= P'(a) d'où R = P'(a)X + P(a) - aP'(a) =
P(a) + (X- a)P'(a).
► D'après la formule de Taylor en a, pour n = deg (P) (on peut supposer n 'ç 2 car sinon
Q=0etR=P) ,

n (kl( ) n p(k)( )
P= _L p k!a (X-at=P(a)+ P'(a)(X-a)+ (X-a)2_L Trx-aik- l.
k=O k=2

On en déduit, par unicité dans la division euclidienne, que R = P(a) + P'(a)(X - a).

Test 13.17. Test 13.18.


Effectuer la division euclidienne du poly- Calculer le reste dans la division euclidienne de
nôme A= 2X5 - 4X3 + 7X 2 - lSX + 13 par A= X4 + X par B = (X - 1) 2 en utilisant la
B = X3 -4X+2. formule de Taylor.

III.3. Division selon les puissances croissantes


Revenons à la division euclidienne d'un polynôme A par un polynôme B non nul. Lorsque
ce dernier est de valuation nulle, on peut adapter le principe de la division en commençant
par éliminer les termes de plus bas degré de A. Par exemple, pour

A = 3X5 + 2X + 2X + X et B = X + 1,
4 3 2

X2 + 2X 3 + 2X4 + 3X 5 1+ X
(x2 + X3l xz+x3
X3 + 2X4 + 3X5 ainsi A= (X 2 + X3)B + X4(1 + 3X).
(X3 + X4)
X4 + 3X5

Contrairement à la division euclidienne, on peut continuer à diviser indéfiniment :

X2 + 2X 3 + 2X 4 + 3X 5 l+X
(Xl +X3)
xz+x3+x4
X3 + 2X4 + 3X5
(X3 + X4) ainsi A= (X 2 + X3 + X4)B + X5 (2).

2X5
320

Propositiôn ·13.36. '(Division 'Selon ·Jes puissance& eroiesantes} Srnënt,A, et' B -dans
'1l
11.l ll{[X] tels que vâl{Bl ~ 0 et n EN: ll exîsteufi u~#Juè CQUJle de polyMmes(CbR) à 'coeffe~
] cients dans.KfX] tels que A= BQ +xn+tR et deg {Q) ~ n. ·
1
]
PREUVE. Raisonnons en deux temps.

..8 ◊ Unicité. Soient ( Q 1, Ri) et ( Q2, R2) deux couples de polynômes de OC[X] tels que A =
'1l
1:::
BQi + xn+lRi et deg(Qd,.:;; n pour i E {1,2}. On a alors B(Q1 - Q 2) = xn+ 1(R 2 - R1) et
donc val(Q 1 -Q2) = n+ 1 +val(R2- Ri) > n. Comme Q1 -Q2 =/= 0 implique val(Q1 -Q 2) ,.:;;
~
deg (Q 1 - Q2) ,.:;; n, on a nécessairement Q 1 = Q 2 puis xn+l (R1 - R2) = O. L'anneau OC[X]
È
[/) étant intègre, on en déduit que R1 = R2.
◊ Existence. Raisonnons par récurrence sur n E N*. Notons HR(n) l'hypothèse suivante :
pour tous polynômes A et B de OC[X] tels que val(B) = 0, il existe un couple (Q, R) E OC[X]2
tel que A= BQ +xn+ 1R et deg (Q),.:;; n. Notons B = b 0 + • • • + bvXP. Comme val(B) = 0, b 0
n'est pas nul. L'hypothèse HR(0) est vraie. En effet, notons A= ao + a1X + · · · + UmXm. Le
polynôme A- (a 0 /b 0 )B est de valuation au moins égale à 1, il est donc de la forme XR avec
RE OC[X]. Le couple ((ap/b 0 ), R) convient donc. Soit n?: O. Supposons HR(n) vraie. Soient
A et B deux polynômes de OC[X] tels que val(B) = O. D'après HR(0), il existe (Q 1, R1 ) E OC[X] 2
tel que A = BQ 1 + XR1 et deg (Qi) ,.:;;: O. D'après HR(n), il existe (Q2, R2) E OC[X]2 tel
que R1 = BQ2 + xn+ 1R2 et deg (Q2) ,.:;; n. On a donc A = BQ1 + X(BQ2 + xn+ 1R2) =
B(Q 1 + XQ 2) + xn+2R2 avec deg (Q 1 + XQ 2) ,.:;; n + 1. L'hypothèse HR(n + 1) est donc vraie
et le résultat est acquis par récurrence. ■

Cette division est utile pour décomposer des fractions rationnelles et calculer des dévelop-
pements limités 14 .

III.4. Congruences polynomiales


Définition 13.36. Soit P E OC[X]. On définit sur OC[X] la relation = de congruence modulo
P par
V(A, B) E OC[X] 2 , A= B [P] {=} P A- B. J

On écrit alors que « A est congru à B modulo P ».


Lorsque P est nul, la relation de congruence modulo P est la relation d'égalité sur OC[X].
On remarque aussi que M est divisible par P si et seulement si M = 0[P]. Si Q et R désignent
respectivement le quotient et le reste dans la division euclidienne de A par B =/= 0, on a
A= R[B] mais également A= R[Q]. On retiendra plus précisément le lemme suivant, dont la
démonstration facile est laissée au lecteur 15 .

=
Lemme.13.37; SfA R[B] a:vet B E K[XJ \ {O} et d!i!g(R} < deg{Bl, alors Rest le reste
dans la division euclidienne de A par B.
Le résultat suivant est donné sans démonstration. Le lecteur adaptera sans peine la preuve
donnée dans le chapitre d'artihmétique dans Z au cas des polynômes.

Proposition 13.38. La· relation de congruence modulo· P est une relation d'équivalence.

14
Voir les chapitres 14 et 28.
15
Elle suit point par point la preuve du lemme analogue sur Z décrit page 284
321

L'ensemble des règles de calcul sur les congruences est consigné dans la proprosition sui-
vante dont la preuve, laissée au lecteur, est en tout point analogue au cas des entiers relatifs.

Proposition 13.39. Soit P E K[XJ. Pour to'US polyn6mes A, B, C et D :


1) A= B [P] et CE D !Pl =} ACE BD [Pl<; 3) A= B [Pl =} YQ E KIXJ , QA = Ql;S [P] ;
2} As B[PJ et C = D[PJ =} A+C = B+D[Pl; 4) A= B[P] =} 'v'k EN* , Ak =Blè[P].

Test 13.19. Test 13.20.


Que pensez-vous de l'équivalence Montrer que

A= B [X] {=} A(O) = B(O) ? A= B [P] et C = D [P] =} AC = BD [P].

IIl.5. Descriptio n des idéaux de IK[X]


Comme nous l'avons déjà remarqué dans le chapitre consacré aux entiers relatifs, la structure
d'idéal joue un rôle central en arithmétique . On peut appréhender l'importance des idéaux en
remarquant que dans un anneau (A,+, x), l'ensemble aA = {axlx E A} des multiples de a
est un idéal de A. Donc, l'ensemble aA n bA des multiples communs à deux éléments a et
b de A est un idéal de A en tant qu'intersectio n d'idéaux. De même l'ensemble aA + bA =
{au+ bv, (u, vl E A 2} est encore un idéal de A en tant que somme de deux idéaux de l'anneau
A. Ces simples remarques montrent bien l'importance de la notion d'idéal dans un anneau.
En particulier, la description des idéaux d'un anneau A sera un préalable incontournab le à
tout développeme nt arithmétique .

Test 13.21. Test 13.22.


Soient P et Q dans K[X]. Établir que les en- Soient P et Q dans K[X]. Établir que
sembles PK[X], QK[X] et PK[X] n QK[X] sont
des idéaux de l'anneau K[X]. PK[X] + QK[X] ={PU+ QV 1 (U, V) E K[XJ2}

est un idéal de K[X].

Proposition 13.40. L'anneau (K[X], +, x) est principal, c'est-àrdire que ses idéaux sont
exactement les sous-ensembles de la forme
PK[XJ = {PQ I Q E K[X]} où P E K[XJ.

PREUVE. Soit I un idéal de l'anneau (JK[Xl,+, xl. Si I = {O}, on a clairement I = OJK[X].


Supposons I -/- {O} et notons E = {deg (Pl I P E I \ {O}}. E est une partie non vide de N et
admet donc un plus petit élément n 0 . Soit alors Po E I tel que n 0 = deg (Pol- Montrons
que I = P 0lK[X] par double inclusion. Puisque P 0 E I et I est un idéal de (JK[X], +, x l, pour
tout polynôme P de JK[X], on a P0 P E JK[X]. Ainsi P0 JK[X] C I. Réciproquem ent, soit P E I.
Effectuons la division euclidienne de P par Po-/- 0 (en effet, deg (Pol = n 0 EN). Il existe un
couple (Q, Rl tel que P = QPo + R avec deg (Rl < deg (Pol= n 0 . Comme QP 0 E I et PEI,
on a R = P - PoQ E I. Mais on ne peut avoir R-/- 0 car sinon RE I \ {O} et donc deg (Rl ): no

car no= min(E), c'est absurde. Ainsi R = 0 et P = QP 0 E P0 JK[X].
322

Remarque. Ce raisonnement sera valable plus généralement dans un anneau euclidien,


UJ
CL)
c'est-à-dire un anneau (A,+, x) sur lequel il existe -v: A\ {0}-----, N telle que, pour tous a E A
et b E A*, il existe (q, r) E A 2 tel que a= bq + r et r = 0 ou -v(r) < -v(b). Dans le cas des

1
'O
i::
.s
polynômes, -v = deg .

UJ III.6. La notion de PGCD


~C)
Commençons par énoncer et prouver un lemme, qui est une simple remarque, mais dont nous
~ ferons grand usage dans tout ce paragraphe consacré aux pgcd.

Lemme 13.41. Pour tous P et Q dans K[X], ~P = ~Q si et seulement si P ~ Q.


PREUVE. Si P ~ Q, on a clairement :Zlp = :ZlQ. Si :Zlr = :ZlQ; on a en particulier PI Q et
QI P d'où P ~ Q. ■

III.6.1. PGCD et algorithme d'Euclide

Proposition-définition 13.42~ Soient P et Q dans K[XJ. Il existe ùn polyn{Jme DE K[X]


tel que PK{X] + QK[X] = DK[X]. Si P = Q = 0, D = O. Sinon, on peut choisir D unitaire
et ce choix est unique. Dans tous les cas de figure, le polyn{Jme D est appè{é pgcd de P et Q
et noté PAQ.

PREUVE. L'ensemble PJK[X] + QJK[X] est un idéal de JK[X], voir le test 13.22. D'après la
caractérisation des idéaux de JK[X], il existe D E JK[X] tel que PJK[X] + QJK[X] = DJK[X]. Si
P = Q = 0, on a clairement D = O. Sinon, par exemple si P -f. 0, D -f. 0 car P = 1 x P+0 x Q E
DJK[X]. Puisque DJK[X] = D1lK[X] si et seulement si D ~ 01, un tel polynôme D est unique
si l'on impose que son coefficient dominant soit égal à 1. ■

Le pcgd porte bien son nom : pour (A, B) -f. (0,0), AAB est un diviseur de A et B, et
il s'agit du diviseur unitaire de plus grand degré parmi les diviseurs communs à A et B. La
proposition suivante résume ces deux propriétés.

Proposition 13.43. Soient A et B dans K[X]. Un polyn{Jme D est un diviseur commun de


A et B si et seulement si Dl (AAB). Autrement dit, ~An 9fs =~AAS·.
PREUVE. Raisonnons en deux temps.
({cc=) Il suffit de prouver que A/\ B divise A et B. Comme AJK[X] + BJK[X] = (A/\ B)JK[X] et
AJK[X] et BJK[X] sont contenus dans AJK[X] + BJK[X], on a AJK[X] C (AAB)JK[X] et BJK[X] C
(A AB )JK[X], ce qui signifie (A AB) 1 A et (A AB) 1 B.
(==}) Supposons que D divise A et B. Comme (AAB)JK[X] = AlK[X]+BlK[Xl, il existe (U, V) E
JK[X]2 tel que A/\ B =AU+ BV, donc D divise également A/\ B. ■

Il est clair que, pour tous polynômes A, B et C de JK[X], on a (AC)/\ (BC) ~ (A/\ B) C.
EXEMPLE 13.44. On a (X- 1) /\ (X 2 - 1) = X- 1 car X- 1 est le diviseur unitaire de plus
2
1 grand degré de X - 1 et qu'il divise X - 1.

L'algorithme d'Euclide permet de calculer le pgcd de deux entiers relatifs par divisions
euclidiennes successives. Il est fondé sur le lemme suivant.
323

LeJi:IJn.e-lS'.4,t;. Sôient Q et R le quotient et le reste dans la division euclidienne de A par


'B el{[X}:(Ators AAB = B /\R. u
:l
0
PREUVE. Soit D un diviseur commun aux polynômes A et B. Puisque R =A-BQ, D est ê!l
un diviseur commun à R et B. Réciproquement, si D est un diviseur commun à R et B, comme Il
A = BQ+ R, le polynôme D est un diviseur commun à A et B. On a donc bien A/\ B ~ B /\ R ~
rJJ
d'après le lemme 13.41, et comme ces deux polynômes sont unitaires, A/\ B = B /\ R. ■
~
(.)

Ce raisonnement est classique : puisque le pgcd est le diviseur unitaire de plus grand
degré de l'ensemble ÇJ?A,B des diviseurs de A et de B (pour B i- 0), on a A/\ B = B /\ R si et
seulement si Çl,1A,B = Çl?B,R·
Proposition 13.46. (Algorithme d'Eudide) Soient A et B i- 0 deux polynômes. On
note Ro = A, R1 = B. R existe ·un·entier no #' 2 pour lequel le reste Rn dans la division
~
euclidienne de Rn-i par Ri.-1 est défini \in~ no avec Rno =O. On a alors AAB Rnc~1-
PREUVE. Les polynômes R0 , R1 et R2 sont bien définis car B i- O. Supposons construits
les polynômes R0 , Ri, ... , Rn-l où n ? 3. D'après le théorème de la division euclidienne, si
Rn-l i- 0, on peut effectuer la division euclidienne de Rn-2 par Rn-1 et le reste Rn vérifie
0 ~ deg (Rn) < deg (Rn-1 ). On remarque alors qu'il existe nécessairement un rang n 0 pour
lequel Rno = 0, car sinon la suite {deg (RnllnEN* serait bien définie, à valeurs dans N et
strictement décroissante, ce qui est absurde. D'après le lemme 13.45, pour tout 1 ~ k ~ no,
A/\B = Rk-1 /\Rk = Rno-1 /\Rno = Rno-1 /\0 ~ Rno-1· ■

:\IHhode Calcul du pgcd par l'algorithme d'Euclide


On cherche le pgcd de A et B. On peut toujours supposer 16 B i- O. On note R0 = A,
R1 = B. Il existe un rang n 0 pour lequel, pour tout entier naturel n tel que n 0 ? n? 2,
Rn le reste dans la division euclidienne de Rn-2 par Rn-1 est bien défini, et Rno = O.
Comme pour tout entier naturel n tel que 2 ~ n ~ no, Rn-2 I\ Rn-1 = Rn I\ Rn-1, on a
A/\ B = Rno-1 /\ Rno = Rno-1 /\0 ~ Rno-1.

A/\B est associé au dernier reste non nul dans l'algorithme d'Euclide

EXEMPLE 13.47. Calculons (X 5 -X4 +X 3 -X 2 +X-l)A(X 2 -1).


► Appliquons l'algorithme d'Euclide.
xs - X4 + x3 - x2 + x - 1 x2 - 1
1----------
3
(XS - X ) X3 - X2 + 2X - 2
-X4 + 2X 3 - X2 + X - 1
(-X4+Xz)
2X3 - 2X 2 + X - 1
(2X 3 -2X)
-2X 2 + 3X- l
(-2X 2 +2)
3X-3

16
Car si B = 0, on a directement A/\ B ~ A.
324

D'où X5 - X4 + X 3 - X2 + X - 1 = (X 3 - X 2 + 2X - 2)(X 2 - 1) + 3X - 3 puis (X5 - X4 +


X - X2 + X -1) A(X 2 - 1) = (X 2 - 1) A(3X - 3). Comme X 2 - 1 = i(3X- 3)(X + 1), on
3

obtient (X 5 - X4 + X3 - X 2 + X - 1) /\ (X 2 - 1) = X - 1.

L'algorithme d'Euclide permet de justifier que le pgcd de deux polynômes A et B à coeffi-


cients réels ne dépend pas du corps de base lR. ou C.

Proposition l.~.48. Le pegd. à~ 'deux, polyn/Jmes de R[X] ·esf,;égal ··au_· pgcd dê êes deu:r;
polyiiOmes ,xinsidérés commé éléments de CfXl. . . . .. ·•
......
......
Cl)
PREUVE. Soient A et B dans JR.[X] avec B =/= O. Notons Q et R le quotient et le reste dans la
~ division euclidienne de A par B dans JR.[X]. Comme A= BQ+ R avec (Q, R) E C[X] tels que
deg (R) < deg (B), on constate que la division euclidienne de A par B dans C[X] est la même
que dans JR.[X]. Comme l'algorithme d'Euclide ne repose que sur la division euclidienne, la
proposition en découle. ■

Test 13.23. Test 13.24.


Calculer Calculer

(X 3 + X2 +X+ 1) /\(X+ 1). (X 4 + X3 - 3X 2 - 4X - 1) /\ (X 3 + X 2 - X - 1).

III.6.2. Polynômes premiers entre eux deux à deux

Définition 13.49. Deux polynômes A et B sont dits premiers entre eux lorsque leurs seuls
diviseurs communs sont les constantes non nulles, autrement dit lorsque A/\ B = 1.

EXEMPLE 13.50. Pour tous a et b dans OC, (X- a)/\ (X- b) = 1 si et seulement si a=/= b.
► Prouvons(=}) par contraposition: si a= b, on a (X-a) A(X-b) =X-a=/= 1. Prouvons
l'implication ({cc=) . Soit D un diviseur commun à X - a et X - b. Comme D divise aussi
X- b - (X- a)= a - b cf. 0, D est une constante non nulle. Ainsi (X - a) A(X- b) = 1.

Proposition 13.51. (BezQut). Soient A et B dàns K[X}. Alors AAB =l si et seulemen,t


si 3(U1V} E KfX) 2 ., UA + VB = 1. . .

PREUVE. Procédons en deux temps.


(=}) Puisque AAB = 1, on a AIK[X] + BIK[X] = IK[X] et donc 1 E AIK[X] + BIK[X] d'où
l'existence de (U, V) E IK[X]2 tel que AU+ BV = 1.
({cc=) S'il existe (U, V) E IK[X]2 tel que AU+ BV = 1, on a 1 E AIK[X] + BIK[X] = (A/\ B )IK[X]
et donc A/\ B 11 , ce qui impose A/\ B = 1, et donc que A et B sont premiers entre eux. ■

Comme dans Z, une égalité du type AU+ BV = 1 s'appelle une relation de Bezout.
L'algorithme d'Euclide permet de déterminer des relations de Bezout sur IK[X].
325

Pour obtenir une relation de Bezout


Effectuer l'algorithme d'Euclide à partir de R0 = A et R1 = B, Rk-1 = QkRk-1 + Rk
jusqu'au rang n 0 où Rno = O. Comme A AB = 1, on sait que Rno-1 ~ 1. Partir alors de
1 ~ Rno-2 - Qno-l Rno-3 en utilisant les calculs de l'algorithme d'Euclide afin d'obtenir
une relation de Bezout entre Rk et Rk-1 jusqu'à celle reliant Ro = A et R1 = B.

EXEMPLE 13.52. Prouvons que (X 4 - 1) A (X 3 + 2) = 1 et déterminons une relation de


Bezout correspondante.
► Appliquons l'algorithme d'Euclide.

X3 +2 -2X-1
- (X 3 + (l/2)X 2 )
-(1/2)X 2 + (1/4)X-1/8
x44-1 1 xx3 +2 -(1/2)X 2 +2
- (X +2X) - (-(1/2)X 2 - (1/4)X)
-2X-1 (1/4)X+2
- ((1/4)X + 1/8)
15/8

On a~= X3 +2-(-2X-1)(-(1/2)X 2 + (1/4)X-1/8) et -2X-1 = X4 - 1-(X)(X3 +2).


Ainsi
2
l: =X 3 +2-(X 4 -1-X(X 3 +2))(-(1/2)X +(1/4)X-l/8),

doù 1 = (X 4 - 1 )fs((l/2)X 2 - (1/4)X+ 1/8) + (X 3 +2)fs(-(1/2)X 3 + (1/4)X 2 - (1/8)X+ 1 ).

Test 13.25. Test 13.26.


Trouver une relation de Bezout entre les poly- Trouver une relation de Bezout entre les poly-
nômes X - 1 et X+ 2. nômes X + 1 et X2 - 2X + 1.

Soient A1,A 2 et B trois polynômes tels que BAA1 = BAA2 = 1. Il existe alors un
quadruplet de polynômes (U, V, W, Z) tels que UA1 + VB = WA2 + ZB = 1 d'où

(UA 1 + VB)(WA2 + ZB) = 1 = (UW)A1A2 + (VWA2 + ZUA1 + VZ)B


et donc BA (A 1A 2 ) = 1. Par une récurrence immédiate, on en déduit la généralisation suivante.

Prop0$ition 13.53. . Soient A1, ... , An et B dans K[X] tels que \lk. E Nn , B AAk = 1.
Altfrs B X{A1 • .c.An) 1.= . .

EXEMPLE 13.54. Prouvons que, pour tous a i- b dans Il{ et tout (n, m) E N2, on a
(X-u)nA(X- b)m = 1.
► Puisque ai- b, on a (X-a) A(X- b) = 1 (voir l'exemple 13.50 de la page 324). On déduit
de la proposition 13.53 que (X - a)n /\ (X - b) = 1 puis que (X - u)n A (X - b )m = 1.

Les quotients de A et B par leur pgcd sont deux polynômes premiers entre eux.

Prôpœitiôn 13,55~ SoiëntA et 'Sdans·K[Xl, âvec {A,8) yh (0,0}. On noteD == AAB et


on écrïtA =DA1 pttis B:::: DB1 avec (A1,B1) E K[X]2. Alors A, AB1 = 1.
326

PREUVE. Comme AIK[X] + BIK[X] = DIK[X], il existe (U, V) E IK[XJ2 tel que D = AU + BV
et donc D = D(A 1U+ BiY). Comme (A, B)-/- (O, O), D-/- 0 et l'on a A 1U+ B1V= 1, et donc
A1 AB1 = 1. ■

Proposition 13.56.. (L~nunede Gauss) .. Soient A, s· et C dans . K[XJ.


Alors {AAB = 1 et A(BC) =} {Al C).

PREUVE. Puisque Al BC, il existe A 1 E IK[X] tel que BC = AA1. Comme AAB = 1, il existe
(U, V) E IK[X]2 tel que AU+ BV = 1. On a donc C = ACU + BCV = A(CU + A 1V) et donc
AIC. ■

On déduit de la proposition 13.53 et du lemme de Gauss, la généralisation suivante si


AI\ Bk= 1 pour tout k:,;;; net AI B1 ... BnC alors AI C.

Lemme 13.57. Soient A1 ,A2 et B dans KfX] tels qùe A1 AA2 = 1, A1 IB et A2I B. Alors
A1A2IB.

PREUVE. Comme A11 B, il existe Q1 E IK[X] tel que B = A1Q1. Puisque A2AA1 = 1 et
A21 B, on déduit du lemme de Gauss que A21 Q1 et donc que A1A21 B. ■

On en déduit le résultat suivant par une récurrence évidente sur l'entier m EN*.

Proposition 18.58. Soient A 1, A2, ..• , Am et B dans K{X] · tels que, pour tout (i, jJ E N~
vérifianti-j. j, AiAAi = 1 et Atl B. Alors A1A2 .•. Ami B.

III.6.3. Polynômes premiers entre eux dans leur ensemble

Comme dans le cas des entiers relatifs, on prouve sans peine que le pgcd définit une loi
associative sur IK[X], ce qui donne un sens au pgcd P1 I\ ... I\ Pn d'un nombre fini n ), 1 de
polynômes Pi, ... , Pn de IK[X].

Définition 13.59. On dit que des polynômes A 1, ... , An sont premiers entre eux dans leur
ensemble lorsque A1 I\ ... AAn = 1.

On prouve par récurrence à partir de la définition du pgcd que

En particulier, il existe des polynômes U 1, ... , Un dans IK[X) tels que

Comme dans le cas de deux polynômes, A1 I\ ... AAn = 1 si et seulement si il existe une
relation de Bezout entre les Ai, c'est-à-dire s'il existe des polynômes U 1, ... , Un dans IK[X]
tels que A1 U1 + ... +AnUn= 1.
327

111.7. PPCM d'un nombre fini de polynômes

Ptt>positi~ftîlitk »îl3:6U~ SoientP et Q •·dam K{XJ; Il e:mte un ~lyr,,&ne ME)l{{Xj


tel que PK{Xlr}QJC{Xj ,::'M][{IX}. Si PJO et Q #= 0, tm peùt êhoisir Munitaire et crncfwix
est unique. Si P·=O. Ort Q . =0, on note M = O. Dans· tous les· cas,· M est appelé le· ppcm de
P etQ ehiotéPvQ~ ·

Comme dans le cas du pgcd, la terminologie ppcm signifie deux propriétés : pour A et B
non nuls, A vB est un multiple de A et de B, et il s'agit du multiple unitaire de plus petit
degré commun à A et B. La proposition suivante résume ces deux propriétés.

Proposition 13.61. Büîent A et B doos K[X]. Un pglyrromeM est un multiple <mnmun de


A et B si et seulement :SiAvB IM. · · ·

PREUVE. Le résultat découle immédiatement de l'égalité AOC[X] n BOC[X] = (A vB)OC[X]. ■

Comme dans le cas des entiers relatifs, on prouve que pour tous polynômes A et B non
nuls, c(A /\ B )(Av B) = AB où c désigne le coefficient dominant de AB. On en déduit que
le ppcm de deux polynômes à coefficients réels considérés comme éléments de lll[X] coïncide
avec le ppcm de ces mêmes polynômes considérés comme éléments de IC[X]. En particulier,
si A/\ B = 1, alors Av B ~ AB. On prouve également sans peine que, pour tous polynômes
A, B et C dans OC[X], (AC) v (BC) ~ (A vB)C.

2 2 2
EXEMPLE 13.62. On a (X 2 -9) v (X +5X+6) = (X -9)(X+2) car X -9 = (X-3)(X+3),
2
1 X +5X+6= (X+3)(X+2) et (X-3)A(X+2) = 1.

Le ppcm définissant une loi de composition associative sur OC[X], on définit par récurrence
le ppcm A 1 v ... v An d'un nombre fini n ;;?; 1 de polynômes A 1, ... , An de OC[X].

Test 13.27. Test 13.28.


Calculer (X 6 - 1) v (X3 - 1). Calculer (X 2 + 1) v (X 3 + 1).

IV. RACINES D'UN POLYNÔME


17
Définition 13.63. Soient P E OC[X] et ex dans K On dit que ex est une racine de P lorsque
P(cx) = 0, autrement dit lorsque ex est un zéro de la Jonction P: OC--+ OC.

Une équation de la forme P(cx) = 0 où P E OC[X] est appelée une équation algébrique sur
K Elle est dite de degré n EN lorsque deg (P) = n. Le lecteur est renvoyé au chapitre sur les
nombres complexes où il trouvera la méthode générale de résolution des équations algébriques
de degré deux sur C.

17
Le terme «racine» provient d'une analogie avec un arbre : les cœfficients sont les branches de l'arbre, les
racines sont la partie souterraine, cachée du polynôme.
328

IV.1. Généralités
,îf~liÎJZt(Uf S~~t P € K[XJ .tt 4•E IC Alors a
s(~+~f~. · · · · · · est une màne. d~;f:met
· · ijüle~nt
· · ·· ·
PREUVE. Effectuons la division euclidienne de P par X - a =/= 0 : on a vu (à la page 318)
qu'elle s'écrit P = (X - a)Q + P( a). Comme X - a I P si et seulement si le reste R dans la
division euclidienne de P par X - a est nul, on voit directement que X - a I P si et seulement
si P(a) = 0, c'est-à-dire a est racine de P. ■

Ce résultat se généralise au cas de m? 1 racines par des arguments d'arithmétique.

PREUVE. Puisque ai =/= ai pour i =/= j, les polynômes X - ai sont deux à deux premiers entre
eux et divisent P, on en déduit que (X - a1) ... (X - am) P. 1 ■

Nous sommes maintenant en mesure d'établir le résultat central de ce paragraphe le


degré d'un polynôme non nul P de IK[X] est un majorant du nombre de ses racines dans !K.

Pr'op~tîliJ,Îf13~li6; To'iifJ)ÔlyiilJme P 1i'i1n rnil à cf>é.ffieie1its;dansK'aàrtiel ai plûi.deg{f>)


fü~né# lfaitslc. ...· ·
PREUVE. Si P n'admet aucune racine dans IK, le résultat est clair. Dans le cas contraire,
notons a 1 , ••• , am les racines (deux à deux distinctes) dans 1K du polynôme P. D'après la
proposition précédente, il existe Q E IK[X] tel que P = (X- a1) ... (X- am)Q, ainsi deg (P) =
m + deg (Q) et comme (P =/= 0) =} (Q =/= 0), on a deg (Q) ? 0, d'où l'inégalité m::,; deg (P). ■

On en déduit immédiatement que le seul polynôme admettant une infinité de racines dans
1K est le polynôme nul.

EXEMPLE 13.67. Déterminons les polynômes P de IK[X] vérifiant P(X + 1) = P(X).


► Soit P un tel polynôme et Q = P- P(O). On prouve sans peine que Q(X + 1) = Q(X) et
Q(O) = O. On en déduit par une récurrence immédiate que Vn EN, Q(n) = O. Le polynôme
Q admet donc une infinité de racines : Q = 0 et donc P est constant. Réciproquement, il
est clair qu'un polynôme P constant vérifie P(X + 1) = P(X).

Comment montrer qu'un polynôme est nul?


Un polynôme P à coefficients dans 1K est nul si et seulement si il admet une infinité de
racines dans !K.

Nous avons démontré dans le chapitre consacré aux nombres complexes que tout polynôme
de degré deux à coefficients dans C admet une racine dans C. Ce résultat est généralisable à
un polynôme de degré quelconque mais non constant.

'Fbéürè•:tâ.6& (d'Alembett;.Gau8$} Tout ptflyriUme n01i constant il coefficients ®m


C admet une racine dans C.
329

Il existe de nombreuses démonstrations de ce théorème, reposant sur des considérations


analytiques. Il sera démontré dans le cours de L2. '='
;:l
0

ériiôllaiœ ia~69i.sx,{t p;.~COO?Ïdn ~ n t dt: ~a-.·1t,~.1Us·•nooi~.ftlitrtplefits êe:i


Il
z1, .•• , Zn, A tels (J_'IJ,e · · · · ·
'ii
::l'ii
rJJ
P =hfi{X-z1c) . e-
0
<:.)
k=l ·

PREUVE. Prouvons la propriété par récurrence sur n ;;::: 1. Le résultat est clair au rang 1. ~
Supposons le résultat acquis au rang n ;;::: 1 et considérons un polynôme P de degré n + 1.
Ill
•Ill

D'après le théorème de d'Alembert-Gau ss, P admet une racine Zn+1 E C. Ainsi, il existe
Q E C[X] tel que P = (X- Zn+ilQ. Comme deg (Q) = n, on déduit de l'hypothèse au rang n
l'existence de z 1 , ••• , Zn, À dans (C tels que
1
•Ill
"O
.s
n n+l
TI (X- zk)- §
Q = À TI (X- Zk) d'où P = (X- Zn+ilQ = À k=l •cd

s
rJJ
k=l
<O
L'hypothèse est donc vraie au rang n+ 1. On déduit du principe de récurrence que la propriété
est vraie pour tout entier naturel non nul n. ■
i
C".Ï
,-<

Définition 13. 70. On dit qu'un polynôme P E JK[X] est scindé sur 1K lorsqu'il existe n E N*, ..d
ü
X1, ... , Xn dans 1K et À E 1K tels que

n
P=ÀTI(X-xk l-
k=l

Autrement dit, un polynôme est scindé sur 1K si et seulement si il est le produit de poly-
nômes de JK[X] de degré un. On peut donc reformuler ainsi le théorème de d'Alembert-Gau ss :
tout polynôme de C[X] non constant est scindé sur C.

Test 13.29. Test 13.30.


Montrer que, pour tout n ): 1, il existe un Exprimer les racines complexes de P = X6 - 1
polynôme P E JR[X) de degré ln n'admettant à l'aide de j = eZi.n/3 _
aucune racine dans JR.

IV.2. Retour aux fonctions polynomiale s


Nous avons maintenant les outils pour mieux comprendre les liens entre polynômes et fonctions
polynomiales dans le cas où le corps de base est 1K = lR ou C.

PREUVE. Soient P1 et Pz dans JK[X] tels que F(Pi) = F(Pz), soit P1 = Pz. Cela signifie que,
pour tout élément x de lK, on a P1(x) = Pz(x). Ainsi, \/x E JK, (P 1 - Pz)(x) = O. Puisque
1K = lR ou (C est de cardinal infini, le polynôme P 1 - Pz admet une infinité de racines dans 1K :
il est donc nul et P1 = Pz. ■
330

Autrement dit, deux polynômes à coefficients dans IR ou <C sont égaux si et seulement
si leurs fonctions polynomiales associées sont égales. Le lecteur aura remarqué que le caractère
infini du corps OC joue un rôle central dans cette démonstration. Comme nous l'avons vu en
introduction de ce chap~re, l:,s polynômes P 1 = X3 + X et P2 = X2 + X sur OC = lF 2 = {O, î}
sont distincts bien que P1 = Pz.

IV.3. Multiplicité d'une racine

Proposition-dlifinit!on 13.12.· Soient P ·e


lt<tfXl\{O} et a ·e K une racine de P.· 1l èxiste. un
plus grand entièr niitutefti non nul tel que (X-a)n;I P. Cet entier estappel1Na midtiplîcitê
dela racine a de P: Une raciné de multiplicité un est dite simple. ·

PREUVE. Puisque a est une racine de P, l'ensemble E = {k EN* 1 (X - u)k I P} est non vide.
Comme P est non nul, E est majoré par deg (P). En tant que partie non vide et majorée de
N, l'ensemble E admet un plus grand élément n. ■

On prouve facilement que la multiplicité n de la racine a de P est l'unique entier naturel


non nul tel que (X - a)n I P et (X - u)n+l J P.

Proposition .13..'1'3. Si ah ...· , Um sont des racines deux à deux dîstin<;tes de, m'll,ltiplîcités
re/i'pectives ni.; ...., n.m de P E K[X], alors (X - a., )"11 ••• {X - Om.} nm j P.

PREUVE. Puisque ai cf. ai pour i cf. j, les polynômes X - ai sont deux à deux premiers entre
eux, et il en est donc de même des polynômes (X - ai)lli qui divisent P. On en déduit que
(X - ai)n, ... (X - Um)nm I P. ■

On en déduit immédiatement le corollaire suivant.

Corollàir_; 1$';74. Tout polynôme de :II{[XJ de degré n admet au plus n, racines. dans K
comptées avec leurs multiplicités.

Dans la pratique, le calcul de la multiplicité d'une racine a de P E OC[X] s'effectue rarement


en recherchant la plus grande puissance de X - a divisant P. La proposition suivante montre
que l'on peut déterminer cette multiplicité en calculant les nombres p(kl( a), pour k EN.

Proposition 13.75. Soient P E K[XJ, a E K et n E N*. n 'Il a équivalence entre les


·pro'flriétés.~iiyantes :
l} le iiOfT!<lmr a est une mcînê de rmdtiplicîtln dé P;
2) il existe Q E K{XJ tel que P =JX -.c a}nQ et Q(a} # 0; .
3) 'v'k E {O, ... , n - 1}, p(kl( al == 0 et ptnl( a) # 0,,

PREUVE. Prouvons successivement les implications 1) =} 2), 2) =} 3) et 3) =} 1).

1)=}2). Soit a une racine de multiplicité


n de P. Comme (X- u)nlP, il existe Q E OC[X]
tel que P = (X - a)nQ. Comme a est une racine de multiplicité n de P, X - a JQ ce qui
équivaut à Q(a) cf. O.
331

2) =} 3). Soit O ~ k ~ n - 1. D'après la formule de Leibniz,

p(k) = [(X- a)nQ](k) = t (k) [(X- a)n](flQ(k-fJ =


e=o C
t
(k) n! (X- a)n-eQ(k-fJ_
e=o C (n-C)!
Puisque n > k, on a, pour tout C entre 0 et k, n - C > 0 et donc, après évaluation en a,
p(kl(a) = O. De plus,

p(nl = [(X- a)nQ](n) = f_ (n)C [(X- a)n](e)Q(n-e) = f_ (n)C (n n!- C)! (X- a)n-eQ(n-eJ,
C=O C=O

d'où p(nl(a) = Q(a) =/- O.

3) =} 1). Comme p(nl(a) =f. 0, p(nl =f. 0 et ainsi p = deg (P) ? n. D'après la formule de Taylor
au point a,

p = ~ p(kl(a) (X- a)k = ~ p(kl(a) (X- a)k = (X- a)n ~ p(kl(a) (X- a)k-n_
L k! L k! L k!
k=0 k=n k=n
P p(kl(a) p(nl(a)
Posons alors Q = r.--(X-a)k-n_ On a P = (X-a)nQ et Q(a) = - -1- =/- O. On en
k! n.
k=n
déduit par l'absurde que P n'est pas divisible par (X - a)n+l : si c'était le cas, il existerait
Q 1 E JK[X] tel que P = (X - a)nQ = (X- a)n+ 1Q1. JK[X] étant intègre et (X- a)n =/- 0, on
aurait alors Q = (X- a)Q 1 d'où Q(a) = 0, ce qui est absurde. ■

Les racines appartenant à C\JR d'un polynôme à coefficients réels vont toujours par deux:
on peut les regrouper par paires de racines conjuguées. Ce résultat repose sur le lemme suivant.

Lemme 13.76. Pour tous Q E R{XJ et a E C, Q{a) = Q(ëi).


PREUVE. Écrivons Q = q 0 + q 1X + ... + qmXm où les qi sont réels. On a
m m m
Q(a) = qo + q1a + ... + qmam = L qkak = L qkak = L qkuk = Q(a)
k=0 k=0 k=0
car les qi sont réels. ■

Appliquons ce lemme aux couples de racines conjuguées d'un polynôme à coefficients réels.
Proposition 13.77. Soient P E R{X], n EN* et a E C. Le nombre a est une mcine de P
de multiplicité n si et seulement si le nombre ëï est 'U,ne mcine de P de multiplicité n.
PREUVE. On déduit du lemme 13.76 que, pour tout entier naturel k, p(kl(a:) = p(kl(a). Ainsi
p(kl(a) = 0 si et seulement si p(kl(a) = 0, d'où le résultat. ■

4 2
EXEMPLE 13. 78. Déterminer les racines du polynôme p = X6 +X 5 +3X +2X 3 +3X +X+ 1
sachant que i en est une racine multiple.
► On a P(i) = P'(i) = 0, mais P"(i) =-Si=/- O. Le nombre i est donc une racine de P de
multiplicité deux. Puisque P est à coefficients réels , -i est également une racine de P de
multiplicité deux. Pest donc divisible par (X-i)2(X +i) 2 = (X 2 + 1)2. En posant la division
euclidienne, on trouve P = (X 2 + 1)2(X 2 +X+ 1). Comme X2 +X+ 1 = (X - j)(X - j2), les
racines de P sont i, -i (racines d'ordre deux) et j, j 2 (racines simples).
332

Test 13.31. Test 13.32.


Soient un polynôme P E JK[X] et a E lK tels Existe-t-il un polynôme P E R[X] dont les ra-
que P(a) = P'(a) = P"(a) = O. Que dire de la cines sont exactement i, -i, j et -j ?
racine a de P ?

IV.4. Relations entre les coefficients et les racines


Définition 13.79. (Fonctions symétriques élémentaires) Soient n EN* et xi, ... , Xn
dans JK. On note, pour tout entier k compris entre 1 et n,

L x,1 ... x,k.


l~i1 < ... <ik~n

Les fonctions crk : ocn --+ JK, pour 1 ~ k ~ n, sont appelées les fonctions symétriques
élémentaires d'ordre n.

La notation est ambigüe : cette fonction dépend également de l'entier naturel non nul
crk
n. On écrira souvent crk au lieu de crk(x1, .•. , Xn) afin d'alléger les notations. Par exemple,
pour n = 2, on a cr 1 = X1 + Xz et cr2 = X1X2 ; pour n = 3, on a cr1 = x1 + xz + x 3 ,
CTz = X1X2 + XzX3 + X3X1 et 0"3 = X1X2X3.

L'adjectif « symétrique» signifie que les fonctions crk sont invariantes par permutation
quelconque de leurs n variables : pour tous X1, Xz, ... , Xn dans lK, on a crk(Xi:(1), .•• , Xi:(n)) =
crk(x1, ••• , Xn).

Test 13.33. Test 13.34.


Combien de termes dénombre-t-on dans ak? Écrire les fonctions symétriques élémentaires
d'ordre 4.

EXEMPLE 13.80. Soit n E N*. Exprimons les fonctions symétriques élémentaires d'ordre
n + 1, [k, à l'aide des fonctions symétriques élémentaires d'ordre n, CTt, pour tout k compris
entre O et n + 1.
► Soient X1, ... , Xn, Xn+l dans lK. On a L1 = cr1 + Xn+l, et, pour tout 1 ~ k (; n,

De plus, on a clairement Ln+l = CTnXn+l·

On rencontre les fonctions symétriques élémentaires lorsque l'on cherche à développer des
expressions du type rr
n

k=l
(X - Xk)- Par exemple,

2
(X - x1)(X - Xz) = X - (x1 + Xz)X + x1x2 = X
2
- cr1X + cr2,
333

ou encore, dans le cas de trois racines x 1, x2 et x 3,

P = À(X - x1 )(X - x2)(X - X3)


2
= À[X 3 - (x 1 + x2 + X3)X + (x1x2 + x2x3 + X3X1 )X - x1x2x3)
= À[X 3 - cr 1X2 + cr2X - cr3].

On calcule donc les coefficients d'un polynôme dont on connaît les racines au moyen des
fonctions symétriques élémentaires. La proposition suivante généralise nos calculs à un nombre
n ~ 1 quelconque de racines.

Propositi<>n 13~81. Soient n E N*, 7'1, ••• , Xn dans K, À E K* et P = À


·
nn

k.;,1
(X-xk). Alors,

PREUVE. Les formules découlent directement du développement d'un produit de somme


(voir le chapitre 6). Nous allons cependant en donner une preuve alternative par récurrence
sur n E N*. La propriété est claire au rang 1. Supposons la propriété vraie au rang n. Soient
alors x 1, ... , Xn+ 1 dans OC. Posons
n~ n
P=ÀI](X-xk)=(X-Xn+1lQ où Q=ÀI](X-xk),
k=l k=l

D'après l'hypothèdse au rang n,


n
Q=L_qkXk où qn=À et VkE{O, ... ,n-1}, qk=(-l)n-kO"n-k,
k=0 qn

en notant crk les fonctions symétriques d'ordre n. Ainsi,


n n
p = (X-Xn+ilQ = L qkxk+l - L. Xn+lqkXk
k=0 k=0
n
= qnXn+l + L_(qk-1-Xn+lqk)Xk-Xn+lqO
k=l

Notons rk ( 0 ~ k ~ n + 1) les fonctions symétriques d'ordre n + 1. D'après l'hypothèse au


rang net les calculs menés à l'exemple 13.80, on a, pour tout k compris entre 1 et n,

qk-1 - Xn+lqk = qn(-l)n-k+lCTn+l-k - Xn+1(-l)n-kqnCTn-k


= (-l)n+l-kqn(O"n+l-k + Xn+JO"n-k) = (-l)n+l-kqnLn+l-k

et qn = À, ainsi que -Xn+1q 0 = (-l)n+irn+iÀ; l'hypothèse est donc vraie au rang n+ 1 et


la formule est acquise pour tout entier naturel n non nul. ■
334

:\IHhocle Expressions polynomiales symétriques en x 1 , ..• , Xn


Il faut savoir (mais nous ne le montrerons pas 18 ) que toute expression de la forme
I:aoc1 , •.• ,an xf1 ••• x~, qui est symétrique ( au même sens que les <Yk) en les variables
1
X1, ••• , Xn, peut s'exprimer au moyen des <Yk sous la forme I:boc1 , ... ,ocn crf ••• cr~n. C'est
en particulier le cas des sommes x}+· · ·+x~ (pour k EN*), appelées sommes de Newton.

Connaissant les coefficients d'un polynôme P E C[X], on peut calculer les sommes de
Newton associées aux racines complexes de P.

EXEMPLE 13.82. Soient a, b et c les racines complexes du polynôme P = X3 - 2X + 5.


Calculons S = a + b + c .
4 4 4

► Exploitons les égalités P(a) = P(b) = P(c) = 0 en effectuant la division euclidienne de


X4 par P. On trouve sans peine X4 = XP + 2X 2 - SX. Ainsi a 4 = 2a2 - Sa, b 4 = 2b 2 - Sb
et c4 = 2c 2 - Sc, d'où S = 2( a 2 + b 2 + c 2 ) - 5( a+ b + c ). Notons cr 1 , cr2 et cr 3 les fonctions
symétriques d'ordre trois évaluées en a, b et c. Puisque

on a = 0, <Yz = -2 et CY3 = -5. Or. crf = a 2 + b 2 + c 2 + 2cr2 , d'où a 2 + b 2 + c 2


<Y1
(0)2- 2 x (-2) = 4. Ainsi, S = 2 x 4 - 5 x 0 = 8.

On peut trouver les coefficients d'un polynôme en calculant les fonctions symétriques
élémentaires en ces racines.

EXEMPLE 13.83. On reprend les notations de l'exemple précédent. Trouvons un polynôme


de degré trois à coefficients entiers dont a 2 , b 2 et c 2 sont les racines.
► Il suffit de calculer les fonctions symétriques élémentaires en a 2, b 2 et c 2. Notons-les I: 1 , I: 2
et I:3. On a clairement I:3 = a 2b 2 c 2 = (cr3)2 = 25 et on a déjà calculé I: 1 = a 2 + b 2 +c 2 = 4.
On conclut en remarquant que

cr~= (ab+ be+ ac)2 = a 2b 2 + b 2 c 2 + a 2 c 2 + 2(a2bc + ab 2c + abc 2)


= I: 2 + 2abc( a+ b + c) = I: 2 + 2cr3cr 1 = I:2 + 2 x (-5) x 0 = I: 2
2 2 2
et donc I: 2 = <Y~ = 4. Les nombres a ,b et c sont donc les racines du polynôme Q
x3 - 4X 2 + 4X - 2s.

Test 13.35. Test 13.36.


On note P = 2X - SX + 1. Calculer les fonc-
4 2
Exprimer xf + x~ + xi en fonctions des crk.
tions symétriques élémentaires associées aux
racines complexes de P.

18
Ce théorème relève de la théorie des polynômes à n indéterminées, sujet qui n'est pas à notre programme.
Nous nous contenterons de quelques exemples et ne donnerons aucun résultat plus précis.
335

V. ARITHMÉTIQUE DANS lK[X], ACTE II


L'objectif de cette partie est de définir une classe de polynômes qui joueraient le même
rôle que les nombres premiers sur Z, puis d'en déduire l'analogue polynomial du théorème
fondamental de l'arithmétique des nombres entiers.

V.1. Polynômes irréductibles


Définition 13.84. Un polynôme P E JK[X] est dit irréductible sur lK si P n'est pas constant
et ses seuls diviseurs dans JK[X] sont les polynômes constants et ceux de la forme ÀP, où
À E li(*.

Un polynôme irréductible sur lK est donc «incassable» par division dans JK[X].

Il faut préciser le corps lK !


La précision « sur lK » dans la définition précédente est essentielle. Montrons l 'impor-
tance du corps lK au travers d'un exemple. Le polynôme X2 + 1 n'est pas irréductible
sur (C car il se factorise en X2 + 1 = (X - i)(X + i) dans C[X]. En revanche, X2 + 1
est irréductible sur R Prouvons cette dernière affirmation par l'absurde : si X 2 + 1
n'était pas irréductible sur JR, il admettrait un diviseur Q E JR[X] de degré 1. Ce dernier
admettant nécessairement une racine réelle a, on aurait a 2 + 1 = 0, ce qui absurde car
a est réel.

Avant de décrire tous les irréductibles sur lR et C, nous passerons en revue quelques
exemples.

EXEMPLE 13.85. Tout polynôme de degré un est irréductible sur K


► Soit P un polynôme de degré un et Q un diviseur de P. Il existe Q 1 E JK[X] tel que
P = QQ, et donc deg(P) = 1 = deg(Q) +deg(Q 1 ) comme deg(Q) et deg(Q 1 ) sont des
entiers naturels, on a nécessairement (deg(Q),deg(Q 1 )) = (1,0) ou (0, 1). Ainsi Q 1 ou Q
est une constante non nulle. P n'est pas constant et ses seuls diviseurs sont les constantes
non nulles et les polynômes de la forme ÀP, avec À E li(* : P est irréductible sur JK.

EXEMPLE 13.86. Un polynôme de degré deux est irréductible sur lK si et seulement si il


n'a pas de racine dans JK.
► (=}) Cette implication est claire car, pour tout élément a de JK, P (a) = 0 équivaut à
X- a I P. (~) Raisonnons par contraposition. Soit P un polynôme de degré deux qui n'est
pas irréductible : il admet un diviseur unitaire Q non trivial qui est donc de degré 1. Ainsi,
il existe a E lK tel que Q = X - a I P d'où P (a) = 0. Le polynôme P admet donc une racine
dans K

Test 13.37. Test 13.38.


Que pensez-vous de l'affirmation suivante : un Que pensez-vous de l'affirmation suivante : un
polynôme irréductible sur 1K n'admet aucune polynôme n'admettant aucune racine sur IR:. est
racine sur 1K ? irréductible sur IR:. ?
336

Prôposltiôn-i3.8'T; On rwté Jic.1'ense.mbl~ 4eJr pôlv,i~~ lrrêtJ~iqfii,8UT·K.


1) ..?c ={P ÊCD<L degfP) =1}. . . ·... ·. .. . .. · . ..• ... . .

2) Un polyMme P ·âP(ltlf'tient à J\. si et jeülément•m il estdéd~ü:# Ôu i'il estii1édegré


dem et de discrimtnant strictement négatif. · ·· · ·

PREUVE.

1) On a {P E C[X], deg {P) = 1} C .fc d'après l'exemple 13.85. Soit P E C[X] tel que
deg (P) ~ 2. D'après le théorème de d'Alembert-Gauss, il existe a E C tel que P( a) = 0 et
donc X - a IP : P n'est pas irréductible. On en déduit l'inclusion réciproque.

- 2) Commençons par prouver qu'un polynôme de degré supérieur ou égal à trois n'est pas
irréductible. Soit P un tel polynôme. D'après le théorème de d'Alembert-Gauss, il existe
a E C tel que P( a) = O. Si a E JR, X - a I P et X - a E JR[X] donc P n'est pas irréductible sur
R Si a'/. JR, on sait que P(êï) = 0 et P(a) = 0, donc que X- êïl Pet X- al P. Comme Pest
à coefficients réels et a -=f. êï, êï et a sont deux racines distinctes de P, d'où (X - a)(X - êï) 1 P.
Or, (X - a)(X - êï) = X 2 - 29tc(a)X + lal 2 E JR[X]. Comme deg (P) ~ 3, on en déduit que
P n'est pas irréductible sur R Il reste à examiner le cas des polynômes de degré deux. Soit
P E JR[X] de degré deux. P n'est pas irréductible sur lR si et seulement si il admet un diviseur
de degré un dans K[Xl, c'est-à-dire de la forme ;\(X - ix), où À ER.* et <XE R Ainsi, P n'est
pas irréductible sur lR si et seulement si il admet une racine réelle, c'est-à-dire si et seulement
si son discriminant est positif. ■

V.2. Le théorème fondamental de l'arithmétique


Le théorème fondamental de l'arithmétique affirme qu'il est possible de factoriser un poly-
nôme quelconque P E K[X] à l'aide des constantes non nulles (qui sont les éléments inversibles
de l'anneau K[Xl) et des polynômes irréductibles sur K.

PropositioIJ 13.88;·.~f.e:• thêQrèmefo~apmtai·del'arithutêt'4..e}.&iiP -~·l{{Xl• un


polvn,bme non consw.~t. JI existe un• unitjtte entie1> m § ijt U'ft 11tni,gue '!îOTT!l>re À. EAlt, /fin
unique tn.-uplet (à perr,>!Jtqtion prts} de ~pl~ (P1f «1). ,.. 1 fPm-~~);o~J~J\ sop.tpoly-
ndmes unitaires .irtiduetible§·Sur K·deuxà dew;.d:istincfs et{~ ~son(.dtisètJ;tters•nature.ls
non nuls tels que
m
P:=À TI1>:.
l(.== l

Cette décomposition de P est appelée décomposition de n en produit de facteurs irréduc-


tibles sur K.

EXEMPLE 13.89. Décomposons en produit de facteurs irréductibles sur lR et sur C le


polynôme P = X 3 - 1.
► On a P = (X - 1) (X 2 +X+ 1) et c'est fini pour la décomposition sur lR car les polynômes
X - 1 et X2 + X + 1 (de discriminant strictement négatif) sont irréductibles sur R Sur C,
on peut continuer la décomposition de X2 +X+ 1 en X2 +X+ 1 = (X - j)(X - j2), d'où
P = (X - 1)(X - j)(X - j2) et c'est fini puisque tout polynôme de degré un est irréductible
sur C.
337

Nous donnerons deux preuves du théorème fondamental : une première démonstration


19
longue mais ne reposant sur aucun résultat admis , puis une seconde démonstration utilisant u
le théorème de d'Alembert-Gauss (que nous avons admis en attendant de nouveaux outils issus g
du cours d'analyse) mais qui a l'avantage de mettre en évidence le passage de la factorisation ê!:
Il
sur C à la factorisation sur R ~
r/l

V.2.1. La preuve algébrique i


2
La démonstration est délicate et nécessite quelques lemmes préparatoires. sr/l
<I)
•<IJ
JKIXJ non constant âdmet au moins uft diviseur irré-.
Lem.me 13,90. Toot polyn{jme P E
duetilJle sur K.
PREUVE. Soit P E OC[X] non constant. Notons çg l'ensemble des polynômes unitaires à
1
•<IJ
"Cl
.s
coefficients dans OC, non constants et divisant P. E = {deg (D) 1 D E çg}_ E est une partie non §
vide (elle contient deg (P)) de N. Elle admet donc un plus petit élément n 0 = deg (Dol où •Cil
Do E OC[X] est unitaire non constant et divise P. Prouvons par l'absurde que Do est irréductible
s
r/l

sur K Si ce n'était pas le cas, Do admettrait un diviseur unitaire D1 de degré strictement <O
inférieur à no et non constant. On aurait donc deg (D 1 ) E E et deg (Di) < n 0 = min(E), ce .§,
qui est absurde. ■ ~
....C')
..d
~nune 13;.9\. Soient P E JKOO un polynôme irréductible sur K et A E K[XJ. Alors C,)

PAA =.f si et'seulemettt si P ne divise 'f10,8 A.

PREUVE. Raisonnons en deux temps.


(~) Cette implication est claire puisque P n'est pas constant.
(~) Soit Q un diviseur commun à A et P. Puisque P est irréductible et Q divise P, Q est
constant ou associé à P. Puisque P ne divise pas A, Q est constant, d'où P AA = 1. ■

Proposition t:J.92.. (Lemme ~'Euclide}·. Soient·P un polynôme· irfêductible sur K et


(A, B) E K[XJ 2 tels qué P IAB. Alors PIA ou Pj:B.

PREUVE. Si PI A, le résultat est acquis. Sinon, d'après le lemme 13.91, P AA = 1 et, d'après
le lemme de Gauss, on a PI B. ■

On peut généraliser ce lemme par récurrence : si un polynôme P irréductible sur OC divise


un produit A 1 x ... x Am, alors il existe 1 ~ i ~ m tel que P I A 1.
Passons maintenant à la preuve du théorème fondamental. Raisonnons en deux temps.

◊ Existence. Raisonnons par récurrence sur n ~ 1. Notons HR(n) la proposition suivante :


pour tout polynôme P de degré inférieur ou égal à n, il existe un entier m E N, un nombre
À E OC*, un m-uplet de polynômes irréductibles unitaires deux à deux distincts (P 1 , .•• , Pm) et
un m-uplet d'entiers naturels non nuls (ex1, ... , <Xm) tels que P = À Il~ 1 P~.

19
Et qui a l'avantage d'être généralisable à un corps K quelconque.
338

HR(l) est clairement vraie car dans ce cas P est de la forme P = aX + b, avec a-/- 0, et
r/J
CL)
il suffit de poser À= a et P 1 =X+ b/a pour décomposer P en P = ;\P 1 avec P 1 irréductible
~ sur JK.
Soient n ~ 1 et P E JK[X) un polynôme de degré n + 1. Supposons HR(n) vérifiée. D'après
J~
'9
le lemme 13.90, le polynôme P admet au moins un diviseur irréductible unitaire Q. Comme
le quotient Q 1 de P par Q est de degré inférieur ou égal à n, on peut appliquer HR(n) : il
r/J existe un entier m E N, un nombre À E JK*, un m-uplet de polynômes irréductibles unitaires
deux à deux distincts (P1, ... , Pml et un m-uplet d'entiers naturels non nuls ( <X1, ... , <Xm) tels
que Q1 = ÀTI~ 1 P~k et donc P = ÀQ x TI;:'= 1 P~ : HR(n + 1) est donc vraie.
J o Unicité. Supposons que P s'écrive

k=l
p= À rr
m

k=l
p~ = µ
Qek rr
m'

avecµ et -v dans JK*, les Pi irréductibles et unitaires deux à deux distincts, idem pour les Qi;
m et m' dans N* ainsi que les ak et les f3t- Soit 1 ~ k ~ m. Comme les polynômes Pi et
Qi sont unitaires et µ et À ne sont pas nuls, À et µ sont égaux au coefficient dominant de P.
Puisque <Xk ~ 1, Pk I P, donc d'après le lemme d'Euclide, il existe 1 ~ i ~ m' tel que Pk I Qc
et donc, puisque ces deux polynômes sont irréductibles sur lK, Pk ~ Qc et comme ils sont
unitaires, on a Pk = Qc. On a donc prouvé que

Les deux décompositions du polynôme P jouant des rôles symétriques, l'inclusion réciproque
est également vérifiée. On a donc égalité des deux ensembles qui sont de cardinal m = m'.
De plus, quitte à réindexer les polynômes Qi, on peut supposer que Pk = Qk, pour tout
1 ~ k ~ n. Notons K+ = {k 11 ~ k ~ m, <Xk > f3k} et K_ = {k 11 ~ k ~ m, f3k > ak}. On a
alors 20
rr
m

k=l
p~k =
k=l
rr
m
pek
kEK+
p~-f3k =
=} rr pek-<Xkrr
kEK-
et comme K+ n K_ = 0, on déduit du lemme d'Euclide que l'un des ensembles K+ ou K_ est
v1.de. On a done TI kEK+ p<Xk-f3k
k = 1 ou TI kEK- pf3k-<Xk
k = 1, ce qui· entrame K+ = K_ = 0 car
A

tout polynôme irréductible sur 1K est de degré supérieur ou égal à un. Ainsi, \fk E Nm, ak = f3k,
ce qui achève de prouver l'unicité (à permutation près) des couples (P 1,a1), ... ,(Pm,<Xm)
décrits dans l'énoncé.

V.2.2. Preuve utilisant le théorème de d'Alembert-Gauss

L'unicité se démontre comme précédemment. Pour l'existence de la factorisation, distinguons


les cas de IR et de IC.

◊ Décomposition sur IC. Notons À le coefficient dominant de P et n le degré de P. D'après le


corollaire du théorème de d'Alembert-Gauss, P est scindé sur IC, donc il existe des nombres
complexes z1, ... , Zn tels que

p =À rr rx -
n

k=l
zkl-

20
Rappelons la convention Il k E 0 ak = 1.
339

D'où le résultat puisque tout polynôme de degré un est irréductible sur C.


u
si ::l
o Décomposition sur li. On considère un polynôme P E li[X]. On décompose P sur (('. 0

toutes ses racines complexes sont réelles, c'est fini. Sinon, on note r 1 , ... , Tm les racines réelles r,"i
Il
de P et z 1 , ... , Zr, z 1 , ... , :ZC les racines de P qui appartiennent à (('. \ li (on sait qu'elles vont ~
par paires de conjugués d'après la proposition 13.77 page 331). On a donc 00

r f r f ~
P= À TI (X - Tk) I] (X - zk) (X - zk) = À TI (X - Tk) TI (X 2
- 2 9le(zk)X + lzkl 2 )
LJ

k=l k=l k=l k=l


2 2
et c'est fini, car les polynômes X-rk et X - 29le(zk)X+ lzkl (qui est un polynôme du second
degré de discrimant strictement négatif puisque ses racines zk et zk ne sont pas réelles) sont
irréductibles sur R ■

Comment passer de (C à IR ?

Pour trouver la factorisation de P E li[X] en produit de polynômes irréductibles sur li


à partir de sa factorisation en produit de polynômes irréductibles sur C, on regroupe
les racines non réelles du polynôme P par paires de conjugués ( a, a) afin d'obtenir un
2 2
polynôme à coefficients réels (X - a)(X - a)= X - 29le(a)X + lal .

EXEMPLE 13.93. Déterminons la décomposition en produit de facteurs irréductibles sur li


du polynôme P =(X+ 1)7 - X7 - 1 sachant que j est une racine multiple de P.
► N'oublions pas la périodicité des puissances de j ((jnlnEJ\I = (l,j,j2, 1,j,j2, ... )) ni la
relation bien connue 1 + j + j2 = O.
14
P(j) = (1 + j)7 - j7 - 1 = (-j 2 )7 - j - 1 = -j - j - 1 = -(1 + j + j2) = 0
De même,

En revanche,
2
P"(j) = 42(1 + j) 5 - 42j 5 = 42(-j2) 5 - 42j2 = -42j 10 -42j2 = -42j - 42j = 42 -f 0.

Le nombre complexe j est donc une racine de P de multiplicité 2. Les nombres O et -1


sont des racines évidentes de P. On a vu que j est racine de P. Puisque ce polynôme est à
coefficients réels, J = j2 en est également une racine de multiplicité deux. Le polynôme est
donc divisible par
2 2
Q = X(X + l)(X-j)2(X-j2)2 = X(X + l)(X +X+ 1) •

Appliquons la formule du binôme,

P= f_
k=O
G)xk-x -1 = f_k=l G)xk_
7

P est donc de degré 6, de coefficient dominant égal à G) = 7. Puisque Q est unitaire de


degré 6 et qu'il divisise P, on a
340

Test 13.39. Test 13.40.


[/J
Cl) Décomposer P = X4 - 1 sur (['. puis sur IR. Décomposer P = X3 + 1 sur (['. puis sur R.

l
-g
..s VI. EXERCICES
[/J

](.)
13.1. 13.3.

~ Soit n ;::, O. Déterminer tous les polynômes P E R[X] tels


1. Montrer qu'il existe un unique polynôme réel que
Tn tel que (X+ 3)P(X) = XP(X + 1 ).

\lt E R , cos(nt) = Tn(cos(t)).


2. Expliciter Tk pour k ,;;; 3. 13.4.
3. Pour tout n ;::, 1, trouver une relation entre
Déterminer tous les polynômes P E R[X] tels
Tn+l, Tn et Tn-1·
que
4. Préciser, pour tout n E N, la parité, le de-
gré et le coefficient dominant de Tn.
5. Déterminer les racines de Tn. On précisera
les ordres de multiplicité.
13.5.
6. Établir que, pour tout n ;::, 2,
Déterminer tous les polynômes réels P tels que

\I (x, y) E R 2 , P(xy) = P(x)P(y).


13.2.

Cet exercice a pour objectif de déterminer tous


13.6.
les polynômes P E (['. [X] vérifiant

Déterminer les polynômes P de R[X] divisibles


par leur polynôme dérivé P'.
1. Déterminer les polynômes constants véri-
fiant l'équation (*). 13.7.
2. Soit P non constant vérifiant l'équation (* ).
Soit ex E (['. une racine de P. Prouver que ex2 Soient P E K [X] et u, b E K avec a =fa b.
est une racine de P. En déduire que lexl = 1. 1. Déterminer le reste de la division euclidienne
Montrer que lex + 11 = 1. En déduire les valeurs de P par le polynôme X - a.
possibles de ex. 2. Déterminer le reste de la division euclidienne
3. Montrer qu'il existe n E N tel que de P par le polynôme (X- u) 2 .
3. Déterminer le reste de la division euclidienne
de P par le polynôme (X- u)(X- b).
4. L'exercice est-il terminé ?
5. En s'inspirant de la méthode détaillée dans
les questions précédentes, déterminer tous les
polynômes P de C[X] solutions de

P(X 2 ) + P(X)P(X + 1) = 0 (** ).


341

13.8. 13.10.

On note a, b et c les racines complexes de Soit n E N*.


P =X 3 +X+ 1. 1. À l'aide de la formule de Moivre, déterminer
un polynôme Pn E R[X] tel que Vx E R \ nZ,
1. Calculer la somme
sin((2n+l)x) -P ( 2 ( ))
al+ b2 b2 + c2 c2 + a2 . + - n cotan x .
S=--2-+--2-+-b2 · sm 2n 1 (x)
C a
2. Déterminer les racines de Pn, puis calculer s
[/J

2. Déterminer un polynôme de degré trois dont leur somme. CU


•CU
les racines sont

ab
C
be
a
ac
b
3. Prouver que

Vx E]0,n/2[ , sin(x) <x<tan(x).


1
•CU
]
CU
4. En déduire que
§
2
13.9. n(2n-1) ~ (2n+1) n(2n+2)
s
[/J

3 < L kn < 3 .
k=l <O
Résoudre dans (('. le système suivant :
E,
5. Montrer que la suite de terme général ~
(")
n 1 ......
Un= L
k=l
k2 ..d
ü

converge vers 1·
COMPLÉMENT 1. DES RACINES

Compter les zéros d'un polynôme

Il existe des algorithmes très performants pour calculer une valeur approchée d'un zéro d'un
polynôme à coefficients réels sur la droite réelle. Nous verrons par exemple au chapitre 26 une
de ces méthodes couramment utilisée, la méthode de Newton. Cependant, il est généralement
nécessaire de connaître déjà un encadrement suffisamment précis de ce zéro pour que ces algo-
rithmes convergent. Pour approcher les zéros d'un polynôme, il faut donc trouver un premier
algorithme capable de localiser ces zéros, c'est-à-dire de donner de premiers encadrements qui
isolent chaque zéro et indiquent dans quelle région de la droite lR il faut les chercher.
Considérons par exemple le polynôme P = 4X 3 - 6X 2 + 1. Comme le degré de P est
impair, P(x) tend vers -oo quand x tend vers -oo, et vers +oo quand x tend vers +oo.
Par le théorème des valeurs intermédiaires, il existe donc au moins une racine c E lR telle
que P(c) = O. En fait, un peu d'arithmétique élémentaire montre que P a un unique zéro
rationnel, en c = 1/2. Or, P'(l/2) = -3 < O. Cela signifie que P(x) < 0 pour x > 1/2 et
P(x) > 0 pour x < 1/2, six est très proche de 1/2. Il en résulte que Pa deux autres racines
C1 < 1/2 < C2 sur la droite réelle. En fait P(2) = 9 et P(-1) = -9, ce qui nous permet de
préciser que -1 < c 1 < 1/2 < C2 < 2. Il est possible ensuite de recourir à des méthodes plus
efficaces pour calculer des valeurs approchées de C1 et C2 : un argument de convexité montre
que la méthode de Newton converge vers C1 si l'on part de -1 et qu'elle converge vers c 2 si
l'on part de 2.

FIGURE 13.1. Graphe de la fonction définie par P(x) = 4x3 - 6x 2 + 1.

Cet exemple montre comment la relation d'ordre sur lR donne des renseignements sur
l'emplacement des zéros. Une suite de Sturm est un outil plus sophistiqué pour extraire des
informations sur les zéros d'un polynôme du fait que lR est totalement ordonné. Notons qu'il
n'est pas anodin de choisir de travailler dans lR plutôt que dans C En effet, les racines réelles,
même comptées avec multiplicité, ne rendent pas compte de toute l'information contenue dans
un polynôme, même à coefficients réels. Par exemple, le polynôme X3 + X2 = X(X 2 + 1) a une
seule racine réelle. Ses racines ±i ne sont pas "visibles" dans R C'est le prix à payer pour
travailler sur un corps totalement ordonné.

j
1.1. Suite de Sturm et transversalité
Nous commençons par parachuter la définition des suites de Sturm et ses propriétés arith-
métiques. Le but de cette partie est de donner un sens géométrique et plus parlant à cette
définition et à ses conséquences.

1. Une suite de polynômes.


Définition 13.94. Soit Po, P 1 dans R[X], avec P1 1- O. La suite de Sturm associée à Po et
P 1 est la liste ordonnée de polynômes, notée Surm(Po, P1) = (Po, P1, P2 · · · , PN), définie par
Pk = -reste(Pk-Z, Pk-l) pour k 2:: 2,
où reste((Pk-Z, Pk_ 1) est le reste de la division euclidienne de Pk-2 par Pk-1· L'entier N
est l'indice du premier polynôme qui divise son prédécesseur. On l'appelle la longueur de la
suite.
En somme, une suite de Sturm est donnée par une variante de l'algorithme d'Euclide,
au signe près. Si l'on note Qk le quotient de la division euclidienne de Pk-1 par Pk, la suite
(Po, ... , PN) est caractérisée par les relations
(13.1)

Nous en déduisons trois propriétés importantes.

LçmEî 13.95. Soit Po, P1 dans RP(]~aflèe P1 #: 0, Alors ta sùite de Stfftm associée à
(P-0,Ph 1PNJ véri,fiele~ propr;iêté§ suivantes.
1) Pt,t est lèplw:gmnd:dsviseuf commun de Po et P,,
2) PN tlivise thi1,q'ue polynûme Pk pwr O:f k ::; N et
SÎlt~fPo/PN;t>Ù~~)'~ {P~/tN,• .. •~k!P~, ... ,tj.
a). fou,- .twt c e, llk J, •

(a)O'U ûiên PN{cj'iii=PN::t{c)=·~ • = P-0fc} =0,


(b}b;tftien'Pr-tl~fl~'ëtijur1 ••::; k~N•~ l,
.P1<.(c);;;:: 0 ;=} P1<.-1Jc)Pk+1{c) < ,o. {13.2)

Autre11tent.dit, le nombre c n'~tjamais .zéro de. deaa;:pôlyn6mes cdriséëutifs de la liste


{P-0,~.·•/P1,d .'èt eli.a,~zéro dé U,, liste (l!'o(c},.··• tPN{CH .est placé entre deux nombres de
signes opposés;
PREUVE.

1) On reproduit la démonstration de l'algorithme d'Euclide. Un polynôme divise Pi-l et Pi


si et seulement s'il divise Pi et PiQi - Pi-1 = Pi+l· Il en résulte que PGCD(P;,-1, P;_)
PGCD(P;,, Pi+ 1), puis, de proche en proche,
PGCD(Po, P1) = · · · = PGCD(PN-1, PN) = PN,
car PN divise PN-l par définition de N, ce qui démontre 1).
2) Le polynôme PN = PGCD(P;,_ 1, P;_) divise chaque Pi; la fraction rationnelle P;_/PN est
donc en fait un polynôme. Divisons les deux membres de la relation (13.1) par PN.
Pi_,f PN = (P;_/PN)Q;, - Pi+i/PN, donc reste (Pi_,f PN, P;_/PN) = -Pi+i/PN
par unicité de la division euclidienne et Sturm(P 0 /PN, P,/PN) a la forme annoncée.
3) o Supposons que PN(c) = O. Alors X - c divise PN et donc X - c divise chaque polynôme
Pk d'après le point 2), ce qui montre que Pk(c) = 0 pour tout 0 :S k :SN.
o Inversement supposons que PN(c) -f O. Si Pk(c) = Pk+i(c) = 0, alors X - c divise
PGCD(Pk, Pk+il = PN et donc on aurait PN(c) = O. Si Pdc) = 0 et Pk+i(c) -f 0, alors
la relation (13.1) évaluée en c montre que Pk_,(c) = Pk(c)Qk(c) - Pk+1(c) = -Pk+1(c). On
en déduit que Pk_ 1(c)Pk+ 1(c) = -(Pk+1(c)) 2 < 0, ce qui établit 3). ■

2. Interprétation géométrique. Représentons graphiquement la liste (P 0 (c), · · · , PN(c))


par la ligne brisée formée des segments de JR 2 reliant le point (k, Pk( c)) au point (k+ 1, Pk+ 1(c))
pour 0 :S k :S N - 1. Chacun de ses segments est de la forme

Nous allons considérer la manière dont cette courbe rencontre l'axe des abcisses.

FIGURE 13.2. Une ligne brisée transverse à l'axe en pointillé

► Si Pk( c) > 0 et Pk+l (c) > 0, alors le segment joignant (k, Pk( c)) au point (k + 1, Pk+l (c))
ne rencontre pas l'axe des abcisses. En effet,
ou bien 0 <ex~ 1, (1 - cx)Pk+i(c);?: 0 et cx.Pk(c) + (1 - cx)Pk+ 1(c);?: cx.Pk(c) > 0,
ou bien 0;?: ex< 1, cx.Pk(c);?: 0 et cx.Pk(c) + (1-cx)Pk+i(c);?: (1-cx)Pk+i(c) > O.
Dans les deux cas, on a bien cx.Pk(c) + (1 - cx)Pk+i(c) > O. On peut traiter de manière
analogue le cas où Pk( c) < 0 et Pk+l (c) < O.
► Si Pk(c) > 0 et Pk+ 1(c) < O. alors le segment joignant (k, Pk(c)) au point (k + 1, Pk+ 1(c))
coupe l'axe des abcisses en exactement un point. En effet, on résout l'équation

De plus Pk+1(c) = -IPk+1(c)I et Pk+1(c) - Pk(c) = -IPk+1(c)I - IPk(c)I. Le segment coupe


donc l'axe des abcisses au point d'abcisse

cx0 k + (1 - cx0 )(k + 1 ),

Le cas où Pdc) < 0 et Pk+1(c) > 0 est analogue.


► Enfin, supposons que Pdc) = O. Alors Pk+1(c)Pk-1(c) < 0 et la ligne brisée traverse l'axe
des abcisse sur [k- 1, k + 1] exactement au point d'abcisse k.
3. Transversalité. Le lemme 13.95 exprime le fait que si la ligne brisée associée à la suite de
polynômes n'est pas contenue entièrement dans l'axe des abcisses (c'est-à-dire si PN(c) =/- 0),
alors elle le coupe « franchement ». Elle ne peut ni rebondir dessus, ni coïncider avec lui sur un
intervalle non trivial : dès qu'elle le rencontre, elle le traverse. Si en outre les deux extrémités
de la ligne brisée ne sont pas sur l'axe des abcisses, on dit qu'elle est transverse à cet axe (voir
la définition 13.96 formelle ci-dessous).
La notion de transversalité est un outil très important de la géométrie différentielle, c'est-
à-dire de la branche de la géométrie qui étudie les espaces qui ressemblent à petite échelle à
un espace vectoriel21 . Elle intervient dès que l'on veut plonger un objet de dimension donnée
dans un espace de plus grande dimension en souhaitant lui donnée une position « générale ».
2
Dans notre cas, il s'agit d'une courbe, la ligne brisée, plongée dans le plan 11 et l'on souhaite
que sa position relative avec l'axe des abcisse soit la plus générale possible. Dire que la ligne
brisée est transverse à l'axe des abcisses signifie que si on modifie légèrement la position de la
courbe, on souhaite que la nouvelle configuration obtenue doit rester similaire.
Par exemple, si la ligne « brisée »rebondit sur l'axe des abcisses avec Pk, (c) > 0, Pk( c) = 0,
Pdc) > 0, alors la courbe pert un point d'intersection avec l'axe si on la pousse vers le
haut, et au contraire elle en gagne un si on la pousse vers le bas, et cela pour déplacement
aussi petit soit-il (voir figure 13.3). En revanche, dans le cas d'une ligne brisée qui coupe
« franchement »l'axe des abcisse, cette intersection n'est pas modifiée si on déplace légèrement
les sommets de la ligne brisée. Le nombre de fois que celle-ci coupe l'axe des abcisses reste
donc invariant.
Nous n'allons pas donner ici de définition mathématique de la transversalité en général
mais nous allons nous servir de l'idée. Ce point de vue est intéressant parce qu'il explique
pourquoi il est possible de compter les zéros d'un polynôme à l'aide des suites de Sturm. En
effet, la ligne définie par (P 0 (c), • • • , PN(c)) n'est pas transverse exactement quand P0 (c) = 0:
si on déplace le point (0, 0) vers (0, €)avec€ aussi petit que l'on veut, mais du même signe que
P1 ( c), la ligne perd un point d'intersection. On devine qu'il existe une relation entre ce nombre
d'intersections et les racines réelles de P0 . Maintenant, nous pouvons oublier ces considérations
géométriques et nous contenter de la définition 13.96 de la transversalité, que nous avons
fabriquée pour notre problème précis. Nous démontrerons complètement nos énoncés à partir
de la définition formelle, mais le fil conducteur des preuves est bel et bien géométique.
~

FIGURE 13.3. Une ligne brisée non transverse.

Notation. On rappelle que pour deux points A1 = (x1,1J1) et A2 = (x 2,Yz) dans 112, un
paramétrage du segment [A 1;Az.] est donné par

[A1;Az.l = { a(x1,1Jil + (1- a)(x2,1Jzl 10 :Sa '.S 1}-

21
Par exemple, une sphère de dimension 2 dans ll 3 rentre dans cette catégorie, car, comme le montre notre
expérience quotidienne au point qu'il fallut longtemps pour que cette évidence bien ancrée dans les esprits les
moins avertis ne soit considérée comme une naïveté, la surface terrestre est (localement) plane.
Définition 13.96. Soit (C 0 , ... , CN) E lllN+l une liste de nombres réels. On lui associe la
ligne brisée, notée [Co, ... , CNl C lll 2 , définie par
N-1
[Co, ... , CNl = LJ [rk, Ck); (k + 1, Ck+il].
k=O

On dit que la ligne [C 0 , ... , CNl est transverse à l'axe des abcisses si les deux conditions
suivantes sont remplies.
1. C0 -/- 0 et CN-/- O.
2. Si ck = 0 pour un entier 1 ::; k::; N - 1, alors ck-1 Ck+l < O.

Lemme . 13JJ7. $oit . {Po, ... , PN)' une suite . de: Stn. St Po{è) #:- ··o, alors
[P 0 (c}, P 1 (c), ••• , PN(cJJ est transvei-se â l'axe des abcisses.
PREUVE. C'est une reformulation du lemme 13.95 3). En effet, si P0 (c)-/- 0, alors PN(c)-/- 0
et le reste de la condition de transversalité est une traduction immédiate de (13.2). ■

Définition 13.98. Soit Cff = [C 0 , ••• , CNl une ligne brisée. Le nombre de croisements de Cff,
noté V(C), est le nombre de changement de signes de la liste (C 0 , ••• , CNl- C'est le nombre
d'éléments non nuls dans cette liste dont le premier successeur non nul est de signe opposé.
On convient que si la liste est identiquement nulle, alors ce nombre vaut zéro.

j EXEMPLE 13.99. V( [-3, 2, 0, 0, -1, -2, 3, 0, 0, 0, 5]) = 3.


Du reste, on notera que l'on a une propriété d'additivité :
(13.3)
Lemme 13.100. .Si<t' ={Co, ... ;CN] est tm'fUJf1erse}iViixê deiNtbéîss.es, alors,sqn nomt.if.e
des croisements est Î'ltltJàrloim pour de petites .variatioot1'de 'if .: ·il existe. 'Uft. réd ê > 0 tel qi.te
si iêt - C1J $ e pour tout O S i $ N, dlors {êo, .. ; , ÔNJl reste t1'11,fi$iiersêâ llmre des âl,éisqes
et V{[êô,. •. , êND =Y({Co, ••. , CNH; · ·
PREUVE. On raisonne par récurrence sur N.
o Si tous les Ck sont non nuls, on choisit O < e < min(ICol, ... , ICNI), de sorte que êk et Ck
sont de même signe, et ainsi V([êo, ... , êN]) = V([Co, ... , CNJl-
o Sinon, soit k le plus grand entier tel que Ck = O. Alors la condition de transversalité montre
que 1 ::; k::; N -1 et que Ck-lCk+l < O. On peut donc écrire

- Par hypothèse de récurrence, il existe un réel e 1 > 0 tel que


V([Co, ... , ck-lll = V([êo, ... êk-lll et V([Ck+l, ... CNJl = V([êk+l, ... , êN])
J J

pour Iêi - Cl ::; e 1, 0 ::; i ::; k - 1 ou k + 1 ::; i ::; N.


- Quitte à multiplier chaque terme de Cff par -1, supposons, pour fixer les idées, que Ck-l > 0
et Ck+1 < O. On choisit O < €2 < min(ICk-11, ICk+1I). Alors
V([êk-1, êk, êk+1ll = V([l, êk,-1]) = 1 (voir figure 13.4)
pour tout lêi - Cil ::; €2, k - 1 ::; i ::; k + 1. Ainsi e = min( e 1, e2) convient. ■
FIGURE 13.4. V(C, <X, C') = 1 pour CC'< 0 et pour tout <XE lR.

Remarque. Le lemme se limite aux petites déformations pour garantir la transversalité de


[ê 0 , ... , êNl- La même démonstration montre que si l'on déforme continûment [C 0 , ... , CN],
alors V([ê 0 , ••• , êN]) ne varie pas tant que la ligne brisée reste transverse à l'axe des abcisses.

Notation. Soit 9 = (Po,•·· , PN) une liste de polynômes à une indéterminée à coefficients
réels. On note V(9)(c) = V([Po(c), ... , PN(c)l).
On remarquera que si l'on note cx9 = (cxP 0 , • · · , cxPN), alors
V(9) = V(cx9) pour tout ex E JR\{O}. (13.4)

Lemme 13.101. _An,r tous>noml,res réels <1 < b, la fonction V(9) : [a, b] .; N est en
esc,a,lîer: îl e:,;istè une subdivision a= ao < a.1 • • • < a 11 = b telle que V{9)(c) est consta1>;te
quand c décrit chaque interualle ouvert la.1,;, a1ç+1 [, 0 :5 k $ p - 1.
PREUVE. Soit {c 1 , · · • , en} C lR l'ensemble des zéros sur la droite réelle des polynômes
P0 , ••• , PN. Quitte à élargir l'intervalle [a, b] et à réindexer la famille (cd1::;,::;n, on peut sup-
poser que a< c 1 < · · · < Cn < b. On pose p = n + 1, ao = a, ak = C1ç pour 1 $ k $net
Un+l = b. Cette subdivision de l'intervalle [a, b] est adaptée à la fonction V(9). En effet, les
polynômes Pi, 0 $ j :::::; N, ne s'annulent pas sur les intervalles ]a1ç, ak+l [, 0 :::::; k $ n. Aussi
Pi(c) garde-t-il un signe constant sur ]ak, ak+l [ en vertu du théorème des valeurs intermé-
diaires. Donc V( 9)( c) reste constant quand c décrit ] ak, ak+l [. ■

De combien « saute » V( 9) (c) quand c passe par un zéro? Pour répondre à cette question,
nous avons besoin de la notion d'indice de Cauchy.
Définition 13.102. Soit P0 , P1 E JR[X] avec Po-=/ 0 et soit Q la fraction rationnelle définie
par Q = Pi/Po. Soit a< b dans R tels que P0 (a)-=/ 0 et Po(b)-=/ O. L'indice de Cauchy de
Q sur l'intervalle ]a, b[ est la différence entre le nombre de sauts de -oo à +oo et le nombre
de sauts de +oo à -oo de la fonction rationnelle x H Q (x) quand x varie de a à b. On le
note I~(Q).

_ X(2X + 1) +oo _ _
EXEMPLE 13.103. Pour Q - (X+ )(X 2 _ l), on a L 00 (Q) - 2-1 - 1.
2
En effet la fonction x H Q(x) est définie sur JR\{-2, -1, l}. Elle saute de -oo à +oo au
passage de -2, de +oo à -oo au passage de -1 et de -oo à +oo au passage de 1. Pour voir
cela, on peut décomposer Q en éléments simples.

2 1/2 1/2
Q=x+2-x+1 +x-1·

Les comportements asymptotiques de Q (x) se déduisent alors de ceux de x H 1/x.


1.2. Le théorème de Sturm. Applications

1. Le théorème. Nous pouvons à présent démontrer le résultat principal de ce complément.


Théorème 13.104. Stùrin, 1831 Sôit P0 , P1 dans k{XJ. Soit a < b de'IJ/.t nombres réels.
On suppose que Po(a)-/- 0 et que Po{bY# O. Alors

V{Sturm(~o;Pi})(al~ V(Stûtm{Po,P,))(b)= 1:(:;).


PREUVE. Soit (P 0 , .•. , PNl la suite de Sturm de P0 et P1. La fonction V= V(P 0 , ..• , PN) est
en escalier, constante sur tout intervalle qui ne rencontre aucun des zéros des polynômes Pk,
pour 0:::; k:::; N. Il s'agit donc de comprendre de combien "saute" V(c) au passage d'un zéro.
On distingue deux cas.

o Cas où Po et P1 sont premier entre eux. Soit Co un zéro d'un des polynômes Pk, avec
a :S: c 0 :::; b et O :S: k < N (le polynôme PN est constant non nul).
- Si P 0 (c 0 )
-/- 0, Alors [P 0 ( Co), ... , PN(c 0 )] est transverse à l'axe des abcisses et le lemme 13.100
montre que V( c) reste constant pour c proche de c 0 •
- Si P 0 (c 0 ) = 0, alors P1(co) -/- 0 et V= V(Po, Pi)+ V(P1, ... , PN) au voisinage de Co. Le
cas précédent appliqué à Sturm(P1, Pz)= (Pi, Pz, ... , PN) montre que V(P1, ... , PN) ne varie
pas au passage de Co.
Étudions la variation de V(P 0 , P1) au passage de c 0 . Comme P0 n'est pas identiquement
nulle et que P1 (col-/- 0, la fraction Pi/Po a un pôle en Co. Or, V(Po, P1)(c) = 1 si P 1(c)/P 0 (c) <
0 et V(P 0 , P1)(c) = 0 si P1(c)/Po(c) > O.
Pi/Po(col Pi/P0 (ct) V(Po, P1Hcol V(Po, P1)(ct) ~V(co)
-oo +oo 1 0 -1
+oo -oo 0 1 +1
+oo +oo 0 0 0
-oo -oo 1 1 0
Ainsi V saute de + 1 exactement quand Pi/Po saute de +oo à -oo, et de -1 exactement
quand Pi/Po saute de -oo à +oo. La variation totale V(b) - V(a) égale donc la différence
du nombre de sauts de +oo à -oo et du nombre de sauts de -oo à +oo quand c parcourt
l'intervalle [a, bl, soit encore V(b) - V( a) = -I~(Pi/P0 ), ce qui est la formule annoncée.
o Cas où Po et P1 ne sont pas premiers entre eux. Comme P0 (a)-/- 0, le lemme 13.95 3)
montre que PN (a) -/- 0. Aussi

V(a) = V (PNl(a)Sturm(P 0 , P1)) (a)= V(Sturm(Po/PN, Pi/PN)l (a).

La première identité résulte de la relation (13.4) appliquée à fllJ = Sturm((P0 , P1) et à <X=
1/PN(a). La seconde identité découle du lemme 13.95 2). De même, V(b) a une expression
analogue. On applique alors le cas précédent aux polynômes P0 /PN et Pi/PN, premiers entre
eux.
V(a) - V(b) = I~ (;:;;:) = I~ (;:), ce qui démontre le théorème. ■
2. Compter les zéros sur la droite réelle. Dans cette partie, nous montrons comment le
théorème de Sturm répond au problème de localisation des zéros que nous avons posé dans
l'introduction.
T~ème Ja,105~. Bt1it P. .E &[X] lit ,wita < b .de~ nombres réels. On S'll,pffJOse que
P(a} ,foOetf>(b) if::Q. Alor-s .

V(Stu.n1t(l?, P1J}(a} ...:v(Stu.n,,:{P,P1:)){b). i=: ~a,1,1(P),


où lca,1:iJ{P) est le nombre de zéros de P dans l'intervalle [<i, bJ.
PREUVE. Soit u < C1 < • · · < Cn < b les zéros de P contenus dans [u, b]. Pour 1 ::; k::; n,
soit -vk 2 1 la multiplicité de ck. Alors on a la factorisation

où Q est un polynôme sans zéro dans [u, b]. On en déduit la décomposition


P' n 'Yk Q'
P = Lx-ck
k=l
+Q.
La fonction x H Q'(x)/Q(x) est continue sur [u, b]. On en déduit que P'(c)/P(c) fait exac-
tement n sauts de -oo à +oo quand c décrit [u, b]. Donc I~(P' /P) =net l'on conclut par le
théorème de Sturm. ■

2
EXEMPLE 13.106. Considérons P = 4X 3 - 6X 2 + 1. Alors P' = 12(X - X). On calcule la
suite de Sturm de P et P' /12.
Po= 4X3 - 6X 2 + 1,
2
P1 = X -X,
P2 = 2X-1,
P3=1/4.
Quand x tend vers -oo, (P 0 (x), ... , P3(x)) tend vers (-oo, +oo, -oo, 1/4 ).
Quand x tend vers +oo, (P 0 (x), ... , P3(x)) tend vers (+oo, +oo, +oo, 1/4).
On en déduit que P a exactement 3 - 0 = 3 zéros sur R On peut alors préciser.

V(-1) - V(2) = V([-9,2,-3, 1/4]) - V([9,2,3, 1/4]) = 3-0 = 3.


Donc les trois racines de P sont contenues dans l'intervalle ]-1, 2[. On retrouve l'encadrement
de l'introduction.

Remarque.
1) Chaque fonction polynômiale Pk garde un signe constant près de l'infini, qui dépend du
signe du coefficient dominant et, en -oo, du degré de Pk, Pour P = UnXn + · · · + u 0 avec
Un =f. 0, posons

P(+oo) = { +oo s~ Un> 0,


-00 SI Un< 0,
Nous pouvons alors prolonger la fonction V en ±oo en comptant les changements de signes
des suites (P1(-oo), · · · , PN(-oo)) et (P 1(+oo), • · · , PN(+oo)). Le théorème 13.105 s'applique
bien sûr de la même manière avec u = -oo ou b = +oo puisque tous les zéros sont concentrés
dans une partie bornée de la droite réelle ..
2) Pour un polynôme P = xn - u 1xn-l - • • · - Un, notons que si P(c) = 0 et si Ici 2 1, alors
lcln = lu,cn-l +'·'+Uni::; lu,llcln-l + '· · + lunl::; (lu,I +''' + lunlllcln-l_
Ainsi toutes les racines de P vérifient la majoration Ici:::; R, avec R = max:(1, ln 1 1 +···+Inn!).
Pour localiser les zéros de P, il suffit donc de subdiviser l'intervalle [-R, R] en [O, R] et [-R, O]
et de compter le nombre de zéro par le théorème de Sturm sur ces deux derniers intervalles,
puis de réitérer le processus de subdivision par dichotomie, jusqu'à obtenir des intervalles de
tailles adéquoites, isolant les zéros.

EXEMPLE 13.107. Considérons le polynôme P = X3 + a 1X2 + a 2 X + a 3 avec (a 1, a 2 , a 3 ) E


3
IR . On cherche une condition nécessaire et suffisante sur les coefficients a 1 , a 2 et a 3 pour
que P ait exactement trois racines réelles. Commençons par réduire le nombre de coefficients
de P. On pose Y= X+ j. Il est clair que Pet Q(Y} = P(Y- a,/3) ont exactement le même
nombre de racines sur IR. Or, un calcul immédiat montre que

al
3
p = n2-T;
Q = Y + p Y + q, avec
2af a 1a 2
q= 27 - -3- + a3.
Nous allons appliquer le théorème 13.105 au polynôme Q.
Cas où p -1- O. On calcule la suite de Sturm de Q et de Q' = 3Y2 + p.

Q O= y3 + p y + q,
Q, = 3y2 +p,
2p
Q2 = - Y- q,
3
4p 3 + 27q 2
Q3 = - 4p2

Quand x tend vers -oo. (Q 0 (x}, Q 1 (x}, Q2(x}, Q 3 (x}} tend vers (-oo, +oo, signe(p }oo, Q 3 }.
Donc V(-oo} :( 3 avec l'égalité si et seulement si p < 0 et Q 3 > O.
Quand x tend vers +oo, (Qo(x), Q 1 (x}, Q2(x), Q 3 (x}} tend vers
(+oo,+oo,-signe(p}oo,Q3}. Donc O :( V(-oo) :( 2 et V(-oo} = 0 si et seulement
si p < 0 et Q3 > O.
Il en résulte que V(-oo} - V(+oo} = 3 si et seulement si p < 0 et Q 3 > O. Notons
de plus que Q 3 > 0 # 4p 3 + 27q 2 < 0 et que cette dernière inégalité n'est possible que si
p < O. Ainsi,si p -1- 0, le polynôme Q = Y3 + pY + q a trois racines réelles si et seulement si
4p 3 + 27q 2 < O.
Cas où p = O. Si q = 0, alors Y3 a une racine triple en zéro. Si q -1- 0, alors Y3 + q a une
racine simple x 0 -1- 0 et deux racines simples conjuguèes dans C \IR de la forme x 0 exp ( ± 21).
Dans les deux cas, Q n'a pas trois racines distinctes dans R
Cas général. On a montré que pour que Y3 + p Y + q ait trois racines réelles, il faut et il
suffit que
4p 3 + 27q 2 < o.

3. Positions relatives de deux ellipses. Imaginons qu'un ingénieur souhaite programmer


un robot pour peindre le logo de la compagnie sur les ailes d'un avion. Le bras du robot
peut atteindre sans dommage la portion de surface limitée par une autre ellipse. Comment
doit-il programmer le robot pour s'assurer que le bras ne vas pas chercher à atteindre un
point impossible? Autrement comment peut-on calculer effectivement la position relative de
deux ellipses? Dans cette partie, nous allons montrer sur un exemple comment le théorème
de Sturm permet de répondre à ce problème.
Considérons les deux courbes E 1 et E2 de JR 2 d'équations respectives.

x 2 +(y-3)2=1 (E1);
x 2 + y 2 - xy = 3 (Ez);

Si on munit JR 2 du produit scalaire canonique ((x,y),(x',y')) = xx' +yy', alors (E1) est
l'équation du cercle centré en (0,4) de rayon 1 et on peut facilement montrer que (E2) est
l'équation d'une ellipse d'axes principaux les bissectrices de JR 2 d'équations x - y = 0 et
x + y = O. Mais nous ne nous servirons pas de ce fait. On se demande quelles sont les
positions relatives de E1 et Ez.
Calculs de projection. Nous allons calculer la projection de l'ellipse E1 sur l'axe x = O.
Considérons le polynôme Py = X2 -yX +y 2 -3. La projection {y I Y E JR, :3x E JR, Py(x) = O}
est aussi l'ensemble de nombres réels y pour lesquels le polynôme Py a des racines dans R
Bien sûr, on pourrait déterminer cet ensemble par le calcul d'un discriminant. Toutefois, dans
un souci de généralité (car Py pourrait être de degré plus grand pour une autre courbe), nous
allons utiliser la suite de Sturm de Py et P~, soit encore

Po = X2 - yX + y 2 - 3;
P1 = 2X-y:
P2 = -¾y2 +3.

Si P2 < 0, alors Py a Y( +oo, -oo, -1) - Y( +oo, +oo, -1) = 1 - 1 = 0 racines réelles.
Si P2 > 0, alors Py a Y( +oo, -oo, + 1) - Y( +oo, +oo, + 1) = 2 - 0 = 2 racines réelles.
Il en résulte que la projection de E2 sur l'axe x = 0 est l'ensemble des couples (0, y) tels
que -3y 2 /4 + 3 ): 0, soit encore tels que y 2 ::;; 4. Ainsi, la projection de E2 sur l'axe x = 0
parallèlement à l'axe des abcisses est le segment {0} x [-2,2]. Comme la projection du cercle
E 1 est le segment {0} x [2; 4], le cercle E2 est à l'extérieur de E 1.
Calcul d'intersection. Les courbes E1 et E2 sont elles tangentes? Bien qu'un peu de géomé-
trie pourrait répondre à cette question, faisons le calcul. On paramètre le cercle par l'équation

X= cos0·
y= 3 + ~in0;
{ 0ER

Posons u = tan ~. Alors


1 -u2 2u
cose = -1--2 sine= -1--2.
+u +u
On obtient une nouvelle paramétrisation de E 1 , privé du point limite quand u tend vers
l'infini, c'est-à-dire (-1,3). Mais on vérifie immédiatement que le point (-1,3) n'est pas
solution de (E2). Ainsi, E1 et E2 ont une intersection non vide si et seulement s'il existe u E lR
tel que le couple ( ~~~~, 3 + 1~~2 ) soit solution de (E2), soit encore, en multipliant l'équation
obtenue par (1 + u 2 )2, si

On développe. Il vient
Il nous reste à appliquer le théorème 13.105 au polynôme Q = 5X4 + 7X3 + 7X 2 + SX + 2. Le
lecteur consciencieux vérifiera que l'on obtient la suite de Sturm

Q 0 = 5X4 + 7X3 + 7X 2 + SX + 2;
Q 1 = 20X 3 + 21X 2 + 14X + 5;
2
Q2 = fo(-133X -202X-125);

Q 3 = 1; :9 (-348X-509);
Q 4 -_ 13815109
1211040 •

Le polynôme Q a donc V( +oo, -oo, -oo, +oo, +) - V( +oo, +oo, -oo, -oo, +) = 2 - 2 = 0
racines réelles. Les courbes E1 et E2 sont disjointes et E1 est à l'extérieur de E2.
Chapitre 14
FRACTIONS RATIONNELLES

ous savons que l'ensemble des nombres rationnels, muni des lois d'addition et de mul-

N tiplication, forment un corps. Ce corps peut être construit explicitement en prenant


le quotient de Z x Z* par une relation d'équivalence bien choisie. Mais, en dernière
analyse, on se rend compte que pour les calculs, il suffit de savoir qu'il existe un corps (Q qui
contient l'anneau Z et dont tous les éléments s'écrivent comme quotient de deux entiers. Peu
importe alors la méthode par laquelle ce corps a été construit, la seule chose qui compte est
qu'une telle construction existe.
De la même manière, les fractions rationnelles peuvent être vues comme quotients de
deux polynômes. Nous adoptons une présentation dans un premier temps assez informelle
pour nous consacrer aux manipulations pratiques de ces objets, réservant la construction
explicite du corps des fractions en complément. En particulier, nous verrons comment toute
fraction se décompose, au sens de l'algèbre linéaire, dans une base privilégiée très utile : c'est
la décomposition en éléments simples. La démonstration de l'existence de cette base n'est
sans doutes pas la plus rapide, mais elle a l'avantage de donner un algorithme pour effectuer
concrètement cette décomposition. C'est un calcul qu'il faut savoir faire si, par exemple, on
veut intégrer une fonction rationnelle.
Dans la suite, lK désigne le corps lR ou <C.

1. QUAND LES POLYNÔMES DEVIENNENT INVERSIBLES

I. 1. Le corps des fractions


Une fraction rationnelle est un élement d'un corps qui contient comme sous-anneau l'anneau
des polynômes JK[X] et dont tous les éléments s'écrivent comme quotient de deux polynômes.
Plus précisément, on gardera à l'esprit les. deux propriétés suivantes.

1) Il existe un corps JK(X) qui contient l'anneau JK[X] et dont les lois prolongent celles de
JK[X]. Autrement dit, l'injection i: JK[X] ----, JK(X) : PH P est un morphisme d'anneaux.
2) Tout élément de K(X) s'écrit sous la forme ~ avec P E JK[X] et Q E JK[X] \ {O}.

On appelle corps des fractions rationnelles le corps JK(X).


En particulier, il n'existe pas de sous-corps contenant JK[X] strictement inclus dans K(X).
En effet, supposons que K est un corps tel que JK[X] C K C JK(X) et soit x E JK(X). D'après
la condition 2), il existe P E JK[X] et Q E JK[X] \ {O} tels que x = ~- On en déduit que
Q · x = P E K. Or, Q E JK[X] \ {O} C K \ {O}, donc Q est inversible dans K. Par suite

x=(~)·(Q·x)EK

comme produit de deux éléments de K. Nous venons ainsi de montrer que lK(X) C K. Comme
l'inclusion réciproque résulte immédiatement de la définition de K, on a bien K = JK(X),
comme annoncé.
354

Montrons en détails comment les conditions 1) et 2) permettent effectivement de calculer


dans lK(X). Soit (x, -y) E 1K(X)2. Il existe (P, R) E 1K[X] 2 et (Q, S) E (lK[X] \ {0}) 2 tels que
x = ~ et -y = l On se propose de calculer les somme et produit x +-y et x · -y dans lK(X).
Calcul de la somme. On a les égalités suivantes dans lK(X).

~
Q
= (!.
S
s). 2-)
(p.
Q
=!.(S. P). __!_=(S. P). ! . __!_=(S. P). -
S Q S Q
1
(S · Q)
- =(P. S) · -
1
(Q · S)'
-

La structure de corps de lK(X) intervient déjà à cette étape. On a en effet utilisé l'associativité
du produit pour la deuxième égalité, et sa commutativité pour les troisième et cinquième
égalités. La quatrième égalité résulte du calcul de l'inverse du produit Q · S dans le groupe
multiplicatif (lK(X))*. On peut montrer de la même manière que
R 1
S= (Q. R). (Q · S)'
Il reste à utiliser la distributivité de la multiplication sur l'addition. On a donc

~ ~ 1 1
+ = (P · S) · ( -- ) + (Q · R) · ( -- ) = (P · S + Q · R) · ( -- ) .
Q S Q·S Q·S
1
Q·S
Or, d'après 1), les expressions P-S+Q· R et Q·S définies a priori par des opérations dans lK(X)
peuvent tout ausi bien être vues comme le résultat des opérations usuelles correspondantes
dans lK[X]. On a donc P • S + Q · R = PS + QR et Q · S = QS dans lK[X]. On a donc exprimé
x + -y sous la forme d'un quotient de polynômes. On retiendra que

Calcul du produit. On a les égalités suivantes dans lK(X).

(;) ·(i) = P·( ~ · R) ·¾=p. ( R · ~)-¾ = (P · R) · ~ · ¾ = (P · R) · ( / Q).


Ici encore, la structure de corps de lK(X) intervient. On a en effet utilisé l'associativité du
produit pour les première et troisième égalités, et sa commutativité pour la deuxième égalité.
Enfin, la dernière égalité résulte du calcul de l'inverse d'un produit dans le groupe multiplicatif
(lK(X))*.
Or, les produits P • R et Q · S sont définis et coïncident dans lK[X] et dans lK(X), d'après
la condition 1 ). Ainsi P • R = PR et Q • S = QS sont des produits usuels de poynômes. On a
bien réussi à écrire le produit x · -y comme quotient de deux polynômes. On retiendra que

P R PR
Q S QS.

Bien sûr, avec un peu d'habitude, ces raisonnements sont très naturels et il n'est plus
nécessaire de décomposer un calcul aussi simple en autant d'étapes, ni de se demander à tout
instant si un produit ou une somme se calcule dans lK(X) ou dans lK[X]. Mais il faut savoir ce
que l'on fait.
Pour que ces calculs aient un sens, il faut toutefois s'assurer que le corps lK(X) existe bien.
Cela résulte d'une construction générale, valable pour tout anneau intègre, que nous donnons
en complément.
355

I.2. Écriture irréductible


rJJ

On dit que l'écriture de la fraction rationnelle ~ est irréductible lorsque les polynômes P et
Q ne possèdent pas de facteur commun non constant, c'est-à-dire que P et Q sont premiers
entre eux. L'intérêt de cette notion vient de ce que cette écriture est non seulement la plus
simple possible, mais aussi qu'elle est essentiellement unique.
1
:0
~
§
14~L ~
Proposition Soit (P,R, Q, S) .E {K00) 2 x (K[X] \ {0})2. On suppose que l'écriture
est irréductible. On a alors les propriétés suivantes .•
1
-sj<
1) t= lsi et seuliYm!:nt s'il existe RtE K{X}\ {O} tel qué R= PR1 etS='QR 1•
......
..d
ü
2) L'ecriture} dela:J'raction i est irréductible si étseulement s'îl existe), E K\{O} tel que
R=AP etS=AQ.

PREUVE. 1) Supposons que~=~ avec~ irréductible. On a donc PS = QR. Ainsi, P divise


QR. Comme Pet Q sont premiers entre eux, le théorème de Gauss montre que P divise R. Il
existe donc R1 tel que R = PR 1. On a ainsi PS = PQ R1, soit encore S = Q R1 en simplifiant
par P. Inversement, si S = QR 1 et R = PR1, alors~= f
2) Supposons que ~ soit irréductible. Le raisonnement précédent montre qu'il existe P 1 E
K[X] \ {O} tel que P = P 1R et Q = P1S. On a donc R = PR1 = P1 R1 R. Comme R i= 0, on
en déduit que R1P 1 = 1. En particulier, on a O = deg(R1P1) = deg(R1) + deg(P 1). Donc
deg(Pi) = deg(Ri) = 0, ce qui signifie que P 1 et R1 sont deux constantes non nulles de K
Inversement, il est immédiat que si R =;\Pet S = ;\Q avec À E K*, alors R et S sont premiers
entre eux et l'écriture R/S est irréductible. ■

:.\IN liodc Obtenir une écriture irréductible de F E IK(X)


La proposition 14.1 montre que l'écritrure ~ d'une fraction rationnelle est irréductible
si et seulement si les degrés du numérateur P et du dénominateur Q sont les plus petits
possibles. Pour obtenir une écriture irréductible, partant d'une écriture quelconque, il
suffit de diviser les numérateur et dénominateur par le plus grand diviseur commun.

I.3. Degré d'une fraction rationnelle


À toute fraction rationnelle est associée un entier relatif, son degré, défini par
p
deg Q = deg P - deg Q , P, Q E K[X]\{0}, (14.1)

et on convient que le degré de la fraction nulle est -oo. Cette définition prolonge celle du
degré d'un polynôme et on retrouve les propriétés analogues à celles de ce dernier.

deg (F1 F2) = deg F1 + deg F2, deg (F1 + F2) ::S; max( deg F1, deg F2) (14.2)

x 2 +2x x+2
EXEMPLE 14.2. X3 et X2 sont deux écritures de la même fraction rationnelle F.
1 La seconde écriture est irréductible la première ne l'est pas. Le degré de F est -1.
356

1.4. Valeur d'une fraction en un scalaire


Soit F = ~ une fraction rationnelle avec P dans JK[X] et Q dans JK[X] \ {O} et soit x E 1K un
scalaire. Supposons que l'écriture ~ est irréductible et que Q(x) =JO. Alors nous définissons
la valeur de F en x, ou l'évaluation de F en x, par

P(x)
F(x) = Q(x)·

D'après notre discussion des écritures irréductibles d'une fraction, il est clair que cette valeur
ne dépend pas du choix de l'écriture de F comme quotient de deux polynômes. De la même
manière que l'on peut associer une fonction polynomiale à un polynôme, on associe à F la
fonction rationnelle définie par 1K \ {u 1, ..• , uT} ----+ lK, x H F (x), où u 1, .•. , UT sont les zéros
de Q.

Il. DÉCOMPOSITION EN PARTIE ENTIÈRE ET PARTIE POLAIRE

Étymologiquement, un pôle est un axe autour duquel on tourne (du verbe "polein", tourner,
en grec ancien) : pensez à l'étoile polaire qui indique l'axe de rotation de la voûte céleste, les
pôles géographiques du globe terrestre, et cetera ... En mathématiques, les pôles d'une fraction
rationnelle sont des points singuliers en lesquels la fonction rationnelle associée "part à l'infini".
Elle n'est donc pas définie en ce point. Nous verrons toutefois en troisième année de Licence
qu'il est très intéressant d'intégrer les fonctions rationnelles le long de chemins dans C qui
font le tour d'un pôle. C'est ce qu'on appelle le calcul des résidus, inventé par Cauchy. Pour
le moment, nous nous contenterons de préciser le comportement asymptotique de la fonction
au voisinage des pôles.
Soit F une fraction rationnelle et soit m E N*.
◊ Le nombre u E 1K est 1 un zéro de F de multiplicité m s'il existe deux polynômes S et Q tels
que

o Le nombre u E 1K est un pôle de F d'ordre m s'il existe deux polynômes Pet T tels que

(14.3)

Un pôle d'ordre 1 est appelé un pôle simple.


La condition sur S et Q garantit qu'il n'y a pas de facteur X - u "caché" dans S ou Q, c'est-
à-dire qu'on ne peut pas factoriser Sou Q par X- u. Si F = ~ est irréductible, alors les pôles
de F sont exactement les zéros du dénominateur Q. Il en résulte que l'ensemble des pôles de
F est fini.
Soit u 1, ... , UT E 1K les pôles de F et soit

1
On dit aussi que F possède un zéro en un point a (et de même pour les pôles).
357

la fonction rationelle associée à F. Calculons la limite de cp en un pôle. D'après (14.3) on a au


voisinage de ak
g(x)
cp(x) = (x - ak)m h(x) '
où m), 1 est l'ordre du pôle ak et où g eth sont des fonctions polynomiales qui ne s'annulent
pas en ak. Par continuité g et h sont non nuls au voisinage de ak, d'où

lim lcp(x)I
x---tak
= +oo.

Un pôle est donc caractérisé par la propriété que les valeurs de la fonction rationnelle de-
viennent infiniment grandes lorsqu'on s'approche du pôle.
Pour les limites à l'infini on a

0 si deg F < 0 ,
lim jcp(x)I = +oo si deg F > 0,
lxHoo { ~ . d F-0
lf3I s1 eg - ,

où <X et f3 sont les coefficients du plus haut degré de P et de Q respectivement.

. X2 (2X+l)
EXEMPLE 14.3. S01t f = ~ .
o Si on considère F comme une fraction rationnelle dans JR(X), alors F n'a pas de pôle. La
2
fonction rationnelle associée est la fonction cp : lR ----, lR définie par cp (x) = x ~ : l . t1
◊ Si on considère F comme une fraction rationnelle dans C(X), alors F a exactement deux
pôles, les nombres -i et i, et ce sont des pôles simples. La fonction rationnelle associée est
la fonction cp: (C \ {-i, i}----, (C définie par cp(z) = z
2 1
l. ;?:~
o Par division euclidienne 2X 3 + X 2 = (2X + 1)(X 2 + 1) - 2X - 1, donc
2X+ 1
F = 2X + 1 - X2 + l . (14.4)

Sur cette décomposition, on voit que la fonction rationnelle cp a pour asymptote la fonction
x H 2x + 1 lorsque lxl ----+ +oo. Cela signifie que pour x E JR, cp (x) - 1 - 2x tend vers zéro
quand lxl tend vers +oo.

On retient de cet exemple que l'existence des pôles dépend du corps dans lequel on tra-
vaille. En outre, on observe que la division euclidienne nous a permis de décomposer la fonction
rationnelle en la somme de deux fonctions dont l'une rend compte du comportement asympto-
tique de la fraction quand lxl tend vers +oo et dont l'autre rend compte de ses comportements
asymptotiques au voisinage des pôles.

Prop95ition'.'"définition 1";4. (Partie entière et partie polaire) Pour toute fraction


rati~nne!le f i), existe une unique déêomposition
.·: ··. f=E+F,
avec E €>:K{XJ, f E K(X) el deg f < o: 6n ·appêlteE lapartièentière et f sà partie polaire.
p
PREUVE. On écrit F = Q avec deux polynômes P et Q.
358

◊ Montrons l'unicité de la décomposition. Supposons que~= E+F = E1+F1 avec E, E 1 E JK[X],


F, F 1 E lK(X), deg F < 0 et deg F 1 < 0. Cela entraîne que P = EQ + FQ = E 1Q + F 1Q. On
remarque que FQ = P - EQ est un polynôme et que deg (FQ) = deg F + deg Q < deg Q car
deg F < O. Donc FQ est le reste de la division euclidienne de P par Q. Il en est de même
pour F 1Q. Par unicité de la division euclidienne, on a FQ = F1Q, donc F = F 1. Il s'ensuit que
E=F-F1=E1.
◊ Montrons l'existence de la décomposition. Comme on vient de le voir, il suffit d'effectuer
la division euclidienne P = EQ + R, deg R < deg Q, et de poser F = ~, ce qui démontre
l'existence de la décomposition. ■

.....
..... On retiendra que la partie polaire de ~ est égale à ~, où R est le reste de la division
euclidienne de P par Q, et que la partie entière est le quotient de cette division.

EXEMPLE 14.5. Dans l'équation 14.4 de l'exemple 14.3, on voit que la partie entière de F
est 2X + 1 et sa partie polaire est-~~!~. Cette décomposition ne dépend pas du corps. En
particulier dans JR(X), bien que F ne possède pas de pôle, F possède une partie polaire non
nulle.

Test 14.1. pôles, comptés avec multiplicités et ordres.


Démontrez que le degré d'une fraction ration- f. Toute fraction rationnelle sans pôle dans C
nelle est bien défini, c'est-à-dire qu'il est indé- est un polynôme.
pendant pas du choix de l'écriture F = ~ .
g. Une fraction rationnelle est un polynôme si
Test 14.2. et seulement si le dénominateur divise le numé-
Démontrez les deux formules de (14.2). rateur.
Test 14.3.
Test 14.5.
Montrer que toute fraction a une unique écri-
Donner une fraction rationnelle ayant un pôle
ture irréductible dont le coefficient dominant
d'ordre 2 en 3 et un pôle d'ordre 3 en 2.
du dénominateur est égal à 1.
Test 14.6.
Test 14.4.
Décomposez la fraction X(~:l) en parties en-
Les assertions suivantes sont-elles vraies ?
tière et polaire.
a. v'F E IK[X]\{O}, deg (F- 1) = -deg F.
b. Une fraction rationnelle est de degré positif Test 14.7.
si et seulement si elle est un polynôme. Déterminez les pôles (avec leurs ordres) et les
c. La partie entière d'une fraction rationnelle F zéros (avec leurs multiplicités) de la fraction
est nulle si et seulement si deg F < O. 2
(i+1) (i-X)(X+2-i) 5 (X+l) E C(X).
(i+l)X3(X-i) 2 (X2-1) 4
d. Si la partie entière E de la fraction ration-
nelle F est non nulle alors deg F = deg E. Test 14.8.
e. Le degré d'une fraction rationnelle est la dif- Une fraction rationnelle peut-elle avoir une in-
férence du nombre de zéros et du nombre de finité de pôles ?

III. DÉCOMPOSITION EN ÉLÉMENTS SIMPLES


Alors que le calcul d'une primitive d'une fonction polynômiale est immédiat, il en va
autrement pour les fonctions rationnelles. Nous allons voir que la décomposition en éléments
359

simples facilite considérablement ce calcul. L'idée est de la décomposer en une somme de


fonctions rationnelles plus faciles à intégrer. Pour lK = C, cela consiste à effectuer les deux
opérations suivantes.
1) Décomposer la fraction rationnelle en partie entière et partie polaire.
2) Décomposer la partie polaire en une somme de fractions rationnelles de la forme
C
avec u E C , c E C , m E N* . (14.5)
(X-u)m

On appelle élément simple d'ordre m une fraction rationnelle de la forme (14.5).

EXEMPLE 14.6. En réduisant au même dénominateur, on vérifie que

X4 + x 3 -1 1 2 1
X(X + 1) 2 ç,
partie entière
+ (X+ 1)2 + X+ 1 - X. (14.6)

éléments simples

x4 + x 3 -1
La fonction rationnelle cp IR\{O, -1} ---, IR, x H ---- a donc pour primitive
x(x + 1) 2

x2 1 x3 -x2 -2x-2 (x+l) 2


<D(x) = -x- x+ 1 +2lnlx+ ll-lnlxl = l(x+ l) +ln lxl
2
Le calcul de la primitive eût été bien moins aisé sans l'aide de la décomposition (14.6).

En général, pour une fraction rationnelle F donnée, la décomposition cherchée en partie


entière et en éléments simples est de la forme suivante.

(14.7)

Nous supposons que cette écriture est minimale, dans le sens que les nombres u1, ... , Ur sont
tous distincts et que les coefficients des plus hauts ordres C1m,, ... , Crmr sont tous non nuls.
Alors les nombres u 1 , ... , Ur sont précisément les pôles de F d'ordres respectifs m 1 , ... , mr.
Questions:
1) Quand existe-t-il une décomposition de la forme (14.7)?
2) Cette décomposition est-elle unique?
3) Existe-t-il un algorithme permettant de trouver cette décomposition?

Le théorème 14.8, page 361, et sa preuve répondront à ces questions. On peut cependant dès
à présent répondre partiellement à la première question. On observe en effet qu'une condition
nécessaire pour l'existence de la décomposition est que l'écriture irréductible de F ait un
dénominateur scindé. En effet, si on réduit le membre de droite dans (14.7) au même dénomi-
nateur, on obtient le polynôme {X - u,im, ···{X- Ur)=, qui est clairement scindé - et c'est
donc aussi le cas de tous ses diviseurs. Nous verrons que cette condition est aussi suffisante.
La preuve de ce fait repose sur un algorithme dont le lemme suivant, consistant à diminuer
l'ordre d'un pôle, est le chaînon élémentaire.
360

Lem:me 14i'.1'. :,Sé{t,,u iEIJK: ~ pôte41o~;m;;d ~~:frrv;tiô~ ~~Useif. Sôit P,,èt î::;àoo:c
pul1fnm,i~ ~E{X}, teœ: ~J,>( fii}4 O,ff(nr,é G: ·et , 5 ~ .

p · •·
F ;=, rx='a.J~l'' ·
• •. J Pftir/Tt«F '
J,/r=F.- (X-oJ,.
Alors f{possèdën'IÎ pâle i;c'«':i,Ôrdre ni1tm {si m1 ~ ôJàlbrfî=1 n'a plùtJdê pâle ~na).
Ve pltis, ft a le!Jmimesp6lès que f autres que a et leurs multiplicités sont ronservées. ·

Il)

j
..... PREUVE.
P1
OnaF 1 =(X-uJmT'avecP1=
T(a)P- P(a)T
T(a)
[ ]
ElKX.

o On remarque que P 1( a) = O. Si le polynôme P 1 est nul alors F1 = 0, et le résultat est


immédiat. Supposons P 1 -j. 0 et notons p E N* la multiplicité de a comme racine de P 1 . Ainsi
P 1 = (X- a)P S, avec SE JK[X] et S(a) -j. O.

F1 = (X-a)PS = (X- )p-m~


(X-uJmT a T"

Si p?:: m, alors F1 n'a pas de pôle en a.


Si p < m, alors F1 a un pôle en a d'ordre m 1 = m - p < m.
◊ Soit b un pôle de F autre que a, de multiplicité n. On a les factorisations

avec n = k - f > 0, et P2, T1 deux polynômes tels que T1 (b) -j. 0 et P2(b) -j. O. On a donc

P, = T(a)P - P(a)T = T(a)(X- b)eP 2 - P(a)T1 (X- b]k


T1 (a)( a - b) k T1 (a)( a - b) k
= (X- b)e T(a)P2 - P(a)T,(X- b)n_
T1 (a)(a - b)k

Le polynôme T( a)P2 - P( a)T1 (X - b )n ne s'annule pas en b car P2(b )T( a) -j. 0 et n > O. Il en
résulte que b est un zéro de P 1 de multiplicité t Comme b est un zéro de T de multiplicité k,
le nombre b est bien un pôle de F1 = (X-~JmT, de multiplicité k-f = n. Inversement, si b est
un pôle de F1 autre que a, le même raisonnement montre, en échangeant les rôles de P et de
P1, que b est aussi un pôle de F de même multiplicité, ce qui démontre la dernière assertion
du lemme. ■

III.1. Cas d'un dénominateur scindé, méthode élément par élément

Dans cette partie, nous donnons une méthode générale pour décomposer en éléments simples
une fraction. L'idée est de réduire par étapes les ordres des pôles en utilisant le lemme 14.7.
361

Théorènle 14~8•. ,(mcciin.pMi.ti()n en 'éléments s,implés} $o4t u1~; ;"i, a,; E K lu ~es
d'une fraction .rationnelle F, .d'ordres re8pectifs m1, : j . . ~ • · Qn:süpfJ(>sè qu'il· ~tdi é'·• K:fX} U)

~~

î
.

F- · · .· p • ·.· E K(Xl, avec P{ai) iO pour 1 ~ i;~·r. (14.9) el


- (X - a 1}m1 ••·{X- àT)m. U)

r <12 ~
Alors ïl existe un uniqire pôlynllmtfl:.' ~f K.00 et des t!onstàn'tês'tJnîqûJ Cld Ê K,
r, l ~ tE;; mk; tels que

.f:.::: E+ frt fr
:-r..
·
mi.,

(X~:~/~ • (14.10)
1
,:j<
......
..ci
ü
Le pohf,wme E est la partie entière de F. La stJmpie des .éléments simples esUa partie polaire.
PREUVE. Commençons par constater que le degré d'une somme d'éléments simples est stricte-
ment négatif. Ainsi (14.10) donne en particulier la décomposition en parties entière et polaire,
définie par la proposition-définition 14.4.
o Montrons l'existence de (14.10). Le lemme 14.7 fournit deux informations importantes:
- La fraction retranchée dans (14.8) est un élément simple.
- La soustraction de cet élément simple n'affecte pas les autres pôles de F.
Cela donne l'algorithme suivant. Posons F0 = F. On commence à éliminer le pôle a 1.

1) Le lemme 14.7 donne un coefficient C1m, E lK tel que la fraction


F1= Fo-(X Clmi ) 'l
·t unpoeena1 d' or d rem 1 <m 1.
1
- a1 m, ai
2) On pose cu = 0 pour m\ < f < m 1.

On réitère les opérations 1) et 2) pour chaque fraction F1, F2 , ••• Fv ainsi obtenue. L'algorithme
s'arrête quand a 1 n'est plus un pôle de F,.,, soit en -v::; m 1 étapes. On obtient ainsi une fraction
m,
'\""" Cu
F,,, = F- L (X- ai)r
f=l

sans pôle en a 1- De la même manière, on élimine les autres pôles a 2 , ... , Ur. Il en résulte la
fraction sans pôle

A ce stade on distingue deux cas.


- Si lK = <C, alors E est une fraction rationnelle complexe sans pôle, donc E E <C[X].
- Si lK = IR, alors E, vue comme fraction rationnelle dans <C, est sans pôle, donc E E <C[X].
Or, tous les coefficients ckl sont réels en vertu du lemme 14.7, donc E un polynôme réel.
Dans les deux cas, on a bien obtenue la décomposition souhaitée.
o Montrons maintenant l'unicité de la décomposition. Supposons que
T ffik T ffik
'\""" '\""" Ckf - '\""" '\""" Cu
E+ L L (X - ak)f = E+ L L (X - ak)f .
k=l f=l k=l f=l

Alors E = E par unicité de la partie entière. Donc

(14.11)
362

Multiplions cette équation par (X - a 1 )m1 et simplifions chaque fraction de la somme ainsi
obtenue dans le terme de gauche. Il vient
m1 T 111.k ,._,
L_(Cie - c1d(X- a1)mi-f + (X- ai)m1 L. L. (~kl',--:k)ff = 0.
f=l k=2 f=l

Évaluons le terme de gauche en X= a 1 . Il en résulte que C1m1 - C1m1 = 0 et (14.11) devient

On multiplie par (X- ai)mi-l pour montrer que C1,m1 -1 -c1,m1 -1 = 0, et ainsi de suite. ■

On retiendra de cette preuve l'algorithme suivant.

~Ié·t lrnde Décomposition associée à un pôle


Soit F E OC(X) une fraction rationnelle ayant un pôle d'ordre m ~ 1 en un point a E K
On pose k = 0, F0 = F et m 0 = m. Pour k = 0, 1, ... , m, tant que mk ~ 1, on effectue
les deux opérations suivantes.
pk
1. On factorise Fk = (X- a)mTkf a) avec Tk(a) =/ O.
Pk(a)/Tk(a) Pk(a) . .
2. On pose Fk+ 1 = Fk - ( ) et ck = - T
( ) . On obtient une nouvelle fraction
X-am ka
ayant un pôle d'ordre mk+l < mk en a.

L. (X ~:)lîlp
ka
Soit ka~ 0 le plus grand entier tel que que mk ~ 1. Alors la somme Fa=
p=O
est la décomposition en éléments simples de la partie polaire de F associée au pôle a.

Remarque.
◊ D'après le théorème fondamental de l'algèbre, tout polynôme complexe est scindé, donc
toute fraction rationnelle dans IC(X) possède une décomposition en éléments simples.
o Pour alléger les calculs, il peut être intéressant de commencer par décomposer la fraction en
partie polaire et partie entière à l'aide d'une division euclidienne, puis d'appliquer l'algorithme
de décomposition en éléments simples à la partie polaire. On manipulera ainsi des numérateurs
de degrés moindres.
◊ Pour chaque pôle ak, l'élément simple d'ordre 1 est de la forme x~~k. Le coefficient ckl est
appelé résidu de F au pôle ak.
o Dans la décomposition (14.10), les éléments simples d'ordres les plus élévés figurent né-
cessairement, ce qui se traduit par le fait que les constantes C1m,, ... , CrmT sont toutes non
nulles. En revanche, les éléments simples d'ordres plus petits n'apparaissent pas forcément car
la soustraction dans le lemme 14.7 peut faire disparaître le pôle complètement ou baisser son
ordre de plusieurs degrés. Par exemple la fraction F(X) = 1 + :;b-, qui est déjà décomposée, ne
possède pas d'élement simple d'ordre 1.
363

◊ Il n'est pas nécessaire d'apprendre par cœur la formule P(a)/T(a) du coefficient qui figure
dans le lemme 14. 7 car la démonstration de l'unicité de la décomposition permet de la retrouver r/J

i
facilement. En effet, si on multiplie F par (X - u)m et que l'on évalue en X = a la fraction
ainsi obtenue après simplification, chaque élément simple donne

( (X~b)P·(X-a)m) =0, r/J


lx-a

sauf l'élément d'ordre men a· qui donne ( (x~'aim · (X - a)m)


ficient devant 1
(X- aJm,
lx-a
= Cm Pour obtenir le coef-
avec m l'ordre du pôle a, il suffit donc de multiplier F par (X - u)m et
J
tj<
.....
d'évaluer la fraction en a. ..d
ü

EXEMPLE 14.9. Reprenons l'exemple 14.6 (page 359) et appliquons notre algorithme à

X4 + X3 -1
F = X(X+ 1)2

Nous allons d'abord éliminer le pôle O (une étape suffira car c'est un pôle simple) et ensuite
le pôle -1 (en au plus deux étapes puisque l'ordre du pôle est 2). Dans chaque étape le
lemme 14.7 indique l'élément simple à soustraire.

1 X4 + x 3 + x 2 + 2x X3 + x2 + x + 2
F1 = F+ X= X(X + 1)2 (X+ 1) 2
1 X + x + x + 1 x2 + 1
3 2

F2 = F1 - (X+ 1)2 = (X+ 1)2 x+ 1


2 x -1
2
F3 = F2 - - - = - - = X - 1
X+l X+l
1 2
Finalement, on obtient F + X- (X+ )2
1
- X+
1
= X - 1 , et on retrouve la décomposition
(14.6). Les résidus sont -1 au pôle O et 2 au pôle -1.
L'algorithme décrit dans la preuve du théorème 14.8 a plusieurs avantages. Il fonctionne
toujours. Il est facile à mémoriser et à programmer. C'est aussi un outil théorique car il a per-
mis de démontrer un théorème décrivant la structure des fractions rationnelles. En revanche,
il requiert une division euclidienne à la fin de chaque étape. Il peut être plus rapide d'écrire
la décomposition avec des coefficients inconnus et de les déterminer par diverses méthodes,
comme l'utilisation de symétries ou des limites à l'infini. Il existe d'autre part une façon sys-
tématique d'effectuer ces divisions euclidiennes, en un seul calcul pour chaque pôle donné!
Nous détaillerons cette méthode dans la partie III.2.
EXEMPLE 14.10. Nous reprenons toujours le même exemple. Séparons par division eucli-
dienne les parties entière et polaire :
X4 + X3 - 1 x2 + x - 1
F = X(X + 1)2 = X - l + X(X + 1)2 .
D'après le théorème 14.8, nous savons qu'il existe ( a, b, c) E IK.3 tel que

a b C X2 +X-1
X + X+ 1 + (X+ 1) = X(X + 1)2
2 .
364

La multiplication par X et et l'évaluation en O donne a= -1.


La multiplication par (X+ 1) 2 et l'évaluation en -1 donne c = 1.
Enfin, en multipliant par X + 1 on obtient

a(X + 1) c X2 + X - 1
X + b + X+ 1 = X(X + 1) .

Dans cette équation le passage à la limite à l'infini donne a+ b = 1, donc b = 2. On retrouve


la décomposition (14.6).

........ EXEMPLE 14.11. La fraction rationnelle

X4 +2x 2 -1
G = X2(X2+ 1)2 E IC(X)

est de degré négatif, donc sa partie entière est nulle. Nous remarquons que G est paire, ce
qui suggère de comparer les décompositions de G (X) et G (-X).

L'unicité de la décomposition de G(X) = G(-X) implique que a1 = -a1 = 0, b 1 = -ci et


b2 = c2. Ainsi

X4 + 2X 2 - 1 a2 b1 b2 b1 b2
X 2 (X 2 + 1)2 = X 2 + X - i + (X - i)2 - X+ i + (X+ i)2.

La multiplication par X 2 et l'évaluation en O donne a 2 = -1.


La multiplication par (X - i)2 et l'évaluation en i donne b2 = -1 /2.
Enfin, en multipliant par X 2 + 1 on obtient

X4 + 2x 2 - 1 . x2 + 1 x+ i X-i
X2 (X 2 + 1) = libi - X2 - 2(X - i) l(X+i).

Le passage à la limite en +oo donne 1 = 2ib 1 - 2, donc b1 = -3i/2. Ainsi


1 3i 1 3i 1
G = - X2 - l(X - i) - l(X - i)2 + l(X + i) - l(X + i)2.

III.2. Cas d'un dénominateur scindé , métode de la division suivant


les puissances croissantes
Dans cette partie, nous allons décrire une métode pour calculer rapidement la partie polaire
correspondant à un pôle donné. Soit F une fraction rationnelle possédant un pôle de multi-
plicité m au point a. Cela signifie qu'il exite deux polynômes P E JK[X] et T E JK[X] tels que
P(a)-=/=- 0, T(a)-=/=- 0, et que
365

La méthode repose sur le résultat suivant (voir le chapitre 13).

Proposition 14.12. Pour tout couple de polynômes (P, S) E {K[YJ)2 tel que S(0) # 0,
pour tout entier n. ~ 0, il existe un unique couple de polynômes (Qn., Rn) E K[YJ) 2 tels que
P = QnS + ynRn., avec deg Qn. < n.

Supposons que a= O. Appliquons cette proposition au couple (P, T) et à l'entier m. Il existe


Qm et Rm dans lK[X] tel que

On a donc
P Qm Rm
F = xmT = xm + T.
Soit encore, en écrivant Qm = c0 + c1X + · · · Cm-lxm-l,
m-1 m
F = , ~ Rm = , Cm-k Rm
L xm-k + T L Xk + T .
k==O k=l
Comme le nombre O n'est pas un zéro du polynôme T, la fraction~ n'a pas de pôle en O et
la somme du terme de droite est bien la décomposition polaire de F associée au pôle nul.
Supposons a E 1K quelconque. On se ramène au cas a = 0 par un changement de variable.
Posons Y = X - a. Le polynôme Y est élément de lK[X] mais P = a 0 + a1X + · · · apXP =
a 0 +a 1(a+Y)+- • • ap(a+Y)P peut aussi être vu2 comme un polynôme P1 E lK[Y] d'indéterminée
Y. Il est défini par la relation P1 = P(a+ Y). De même, on note Î1 E lK[Y] le polynôme obtenu
à partir de T, soit encore T1 = T(a + Y) et on note F1 = F(a + Y) E lK(Y). Alors

On peut donc appliquer le cas précédent. la division suivant les puissances croissantes de P 1
par î1 à l'ordre m donne deux polynômes R1,m et Q 1,m = Co + · · · + Cm-1 ym-l tels que

Revenons maintenant à la fraction F par le changement de variable X = Y + a et posons


Rm = Rm,1 (X - a) E lK[X]. On obtient la décomposition souhaitée

f=~ Cm-k Rm(X-a)


L
k=l
(X-a)k + T ·

EXEMPLE 14.13. Reprenons l'exemple 14.6, page 359.


o Pour le pôle nul , il n'y a pas à changer d'indéterminé. On effectue la division suivant les
puissances croissantes de -1 + X 3 + X4 par (X+ 1 )2 = 1 + 2X + X 2 à l'ordre 1.

2
Formellement, on peut voir P 1 comme l'évaluation de P dans l'anneau JK[Y] au point a+ Y.
366

-1 + x 3 + X4 11 + 2x + x2
2x + x2 + X3 + X4 -1
On a donc
-1 +x 3 +X 4 1 2+x+x 2 +x 3
X(l + X) 2 =-X+ (1 + X) 2

o Pour le pôle en - 1 , on pose Y = X + 1 . Ainsi

2 +X+ X2 + X3 = 2 + (Y - 1) + (Y - 1)2 + (Y - 1)3 = 1 + 2Y - 2Y2 + Y3 .

- Il en résulte que

1 + 2Y - 2Y2 + Y3 2 1 2 1
y2 = y + y2 - 2 +y= X+ 1 + (X+ 1 )2 + X - 1.

On retrouve bien la décomposition

3
EXEMPLE 14.14. Décomposons la fraction F = X 2 ~X++ l )2 en éléments simples.

◊ Pour le pôle nul, on effectue la division de 3 + X par 1 + 2X + X2 à l'ordre 2.


3 +x 1 +2x+x 2
-SX - 3X 2 3 - SX
7X 2 + 5X 3
3 5 7 + sx
On a donc F = X2 - X + (1 + X)2.
◊ Pour le pôle -1. on pose Y = 1 + X. Aussi 7 + SX = SY + 2 et

7 + SX SY + 2 5 2 5 2
(1 + X)2 = Y2 =Y+ Y 2 = X+ 1 + (X+ 1) 2.

3 5 5 2
Ainsi F = X2 - X + X+ 1 + (X+ 1)2"

IIl.3. Cas d'un dénominateur non scindé sur IR.


Sur C, tout polynôme est scindé. Mais sur JR, il existe aussi des polynômes irréductibles de
second degré (voir le chapitre 13). Aussi la décomposition (14.10) n'est-elle plus toujours
possible. Nous montrons dans cette partie qu'il existe cependant une décomposition analogue,
dont les éléments simples ont pour dénominateurs des puissances des polynômes irréductibles
dans JR[X].
367

Soit F une fraction rationnelle réelle. Faisons un détour 3 par le complexe en considérant F
comme un élément de C{X). Nous avons donc la décomposition dans C(X)
(14.12)
où E est la partie entière et où S 1 (respectivement S2 ) est la somme des éléments simples
de pôles réels (respectivement non réels). Les pôles non réels viennent en paires conjuguées
(voir le chapitre 13). Notons que E est un polynôme réel, comme partie entière d'une fraction
rationnelle réelle, et que, par construction, tous les coefficients de S 1 sont réels. Si on prend
le conjugué complexe des deux membres de (14.12), on obtient F = E + S1 + 52 . L'unicité de
la décomposition montre que 52 = S2 . Ainsi S2 est une somme de termes de la forme
C C c(X - a:Jf + c(X - a)i R
4 3
(X - a)i + (X - a)i = (X 2 - (a+ a)X + JaJ 2)i = (X2 - l(X)( + f3 )i (l .i )
où l'on a posé ex = ~e(a), f3 = JaJ 2 et où R est un polynôme à coefficients réels, comme
somme de deux polynômes conjugués. En effectuant des divisions euclidiennes successives par
X 2 - lcxX + f3, on décompose (14.13) en une somme de fractions rationnelles réelles de la forme

ex, f3, y, li E IR , cx2 - f3 < 0 , 1~ j ~ f . (14.14)

On les appelle des éléments simples de seconde espèce.

La décomposition en éléments simples de second espèce sur IR est utile pour l'intégration
des fonctions rationnelles réelles. Toutefois, il est bien souvent plus pratique de décomposer
sur C, d'intégrer et de rassembler le termes conjugés pour retrouver une fonction réelle, comme
le montre l'exemple suivant.
EXEMPLE 14.15. On cherche la primitive de la fonction rationnelle
2x 2 -4x-2
<p: IR -l IR, x H (x2+1)2

La décomposition sur C de fraction rationnelle est


2X 2 - 4X - 2 1+ i 1- i
F= (X 2 + 1)2 = (X - i)2 + (X+ i)2.
Une primitive complexe définie sur IC\{±i} est donc
l+i 1-i
x-i x+i
On rassemble ces deux termes conjugués et on trouve une primitive réelle de <p :
2(x-1)
<D(x} =
x2 + 1 ·
La décomposition sur IR en éléments simples de seconde espèce
2 4(2X + l}
F = x2 + 1 - (X2 + 1)2
est exploitable pour intégrer la fraction. mais elle nécessite une intégration par parties.

3
En fait, c'est un raccourci! Comme le disait le mathématicien Jacques Hadamard :
« le plus court chemin entre deux énoncés réels passe par le complexe. »
368

rn
III.4. Résidu d'un pôle simple

1
'8
.a
Soit F une fraction rationnelle ayant un un pôle simple en a. Nous allons donner une formule
permettant de calculer facilement le résidu du pôle a, c'est à dire le coefficient devant la
fraction x~a dans la décomposition en éléments simples de F.
Par hypothèse, il existe deux polynômes Pet T tels que P(a) =J 0, T(a) =JO et

F= p
(X-a)T

J Posons Q = (X- u)T et remarquons que Q' = (X- a)T' + T, donc Q'(a) = T(a). Le lemme
- 14.7 donne la partie polaire de Fen a, soit
P(a)/T(a) P(a)
X-a Q'(a)(X- a)·
Nous avons donc démontré le résultat suivant.
Proposition 14.16. (Résidu d,un pôle simple) SoitF = ~ a'l1ec Pet Q de'UX polynômes
dans K[X]. Soit a E K. On suppose que Q(a) = 0 et Q'(a) f. O. Alors on a la décomposition
P{a}
avec c1 = Q'(a)'
où F1 E K(X} est une fraction sans pble en a.
Cette formule est très pratique. Nous verrons en troisième année qu'elle est encore valable
pour des quotients plus généraux, comme le quotient de deux séries entières convergentes,
dans le cadre du calcul des résidus de Cauchy. Considérons le cas particulier d'une fraction
rationnelle dont le dénominateur est scindé et dont tous les pôles sont simples. Elle s'écrit
donc sous la forme

F =!= p avec a 1 , .•. , Ur d eux à d eux d istincts.


Q (X-u1) .. ·(X-ur)
La décomposition en partie entière et éléments simples prend alors la forme
p C1 ~
- = E(X) + - - + .. · + - - avec (14.15)
Q X-ai X-ur

EXEMPLE 14.17. Décomposons la fraction rationnelle F xLi E C(X). Comme son


degré est négatif, sa partie entière est nulle. Les pôles sont simples, ce sont les racines n-
èmes de l'unité :

w k = exp (2ki7î)
n , k = 0, ... , n - 1 , avec w = exp (n2in) .
D'après (14.15), le résidu de F relatif au pôle wk vaut
369

Attc11tio11
Il est important de supposer que F ne puisse plus être simplifiée par aucun facteur X - a.
Par exemple, pour P E JK[X] non constant, la fraction pP' a tous ses pôles simples et
P'(a)
pourtant les résisdus ne sont pas nécesairement égaux à P'(a) = 1, car P'(a) = 0 pour
une racine multiple de P.

P'
EXEMPLE 14.18. Soit P un polynôme non nul. Décomposons la fraction p·
Si a E 1K est une racine de multiplicité m de P alors a est une racine de multiplicité m- 1
du polynôme dérivé P'. Par conséquent, les pôles de f
sont les zéro de P et ils sont tous
simples. La formule (14.15) n'est pas utilisable directement car la dérivée du dénominateur
s'annule en a, soit encore P'(a) = 0 si m > 1. On peut cependant s'inspirer de la même
méthode. Écrivons P = (X - a)mS avec SE JK[X] et S(a) f O. Alors P' = m(X - a)m- 1 5 +
(X- a)mS'. Ainsi

P' m(X- u)m- 1 5 + (X- a)mS' m S'


p - - - - ( X___a_)_m_s_ _ _ = -X---a + S'

et on observe que la fraction f


n'a pas de pôle au point a.
Ainsi pour P = (X - a 1) mi · · · ( X - ar) m, avec a 1, · · · , nr deux à deux distincts, on a la
décomposition en éléments simples

P' m1 ffir
-
P
= X-u
- - + · · · +X-ar
--. (14.16)
1

Autrement dit, chaque pôle de la fraction rationnelle f est simple, de résidu la multiplicité
du pôle vu comme racine de P.
Donnons une application de ce dernier exemple. Soit z 0 une racine du polynôme P', autre
que n1, ... , nr. Alors on a

0= P'(zo) =~+-··+~.
P(zo) zo - a, zo - ar
Soit encore, en prenant la conjugaison de cette équation,
0 = - m,_ + ... + - m.,. .
Zo-n1 Zo-ar
Mais, pour 1 ~ k ~ r, on a
mk mk
=-=
½-~
= <Xk(zo - ak), avec <Xk = _ _
1½-~ 12
.

On a donc trouvé des coefficients <Xk E IR, avec <Xk > 0, tels que O = cx1(z0 - a 1) + ••• +
<Xm(Zo - am)- Ainsi zo s'exprime comme un barycentre des zéros u 1,... , nr. En effet
<X1n1 + · · · + <Xmnm
Zo =- -------
<XJ + ... + <Xm
On peut montrer que cette propriété entraîne que ½ est à l'intérieur du plus petit polygone
convexe contenant les zéros de P.
l 370

r/J
a)
'@
III.5. Coefficient d'indice maximal associé à un pôle multiple
Soit F une fraction rationnelle ayant un un pôle d'ordre p ~ 2 en a. Nous allons généraliser
1::
a) la formule du résidu d'un pôle simple. Cette formule est moins utilisée, mais elle peut rendre
§ service si le dénominateur de F n'est pas factorisé. Par hypothèse, il existe deux polynômes P
'O
.: et T tels que P(a)-/- 0, T(a)-/- 0 et
..Si
r/J
~ F= p
B<:.)
(X-a)PT
Ê
rJ) Posons Q = (X - a)PT et calculons sa dérivée kième par la formule de Leibniz
~

~
o..

En particulier Q(Pl(a) = p!T(a). Or, le lemme 14.7 montre que le coefficient devant (X~a)P

vaut P(a)/T(a). Nous en déduisons le résultat suivant.

Proposition 14.19. (Pôle multiple) Soit p ~ 2. Soit F =~avec P et Q deux polynômes


dans K[X]. Soit a E K. On suppose que Q(a) = Q'(a) = • • • = Q{p-ll(a) = 0 et Q(Pl(a)-/- O.
Alors on a la décomposition
p! P(a)
avec Co= Q(t>l(a),

où F1 E K(X) est une fraction dont le pôle en a est d'ordre p' < p.

Test 14.9. Test 14.10.


Quelle est la décomposition en éléments simples Pour quelles valeurs de c et de d la fraction
1 ?
d e 5(2"· x!
rationnelle x'.:. 1 + 1 est-elle paire?

IV. EXERCICES

14.1. 14.4.

Le théorème 14.8 reste-t-il valable si K = 1Q? Soit a un pôle de F = ~. On suppose que


P(a) # 0, que Q(a) = 0 = Q'(a) = 0 et que
14.2. Q"(a) # O. Quel est l'ordre du pôle a? Montrer
que le résidu de F en a est donné par la formule
,
Decomposer m, X4 +1
sur ms. X(X+ 1 l .
6P'(a)Q"(a)-2P(a)Q"'(a)
14.3.
3(Q"(a)) 2
Trouver une primitive de la fonction définie par
cp(x) = x4"._ 1 sur JR\{-1, l}.
COMPLÉMENT 1. L'IDÉE DE FRACTION

Corps des fractions d'un anneau intègre

Dans cette partie, nous donnons une construction générale du corps des fractions d'un anneau
commutatif unitaire intègre et nous en tirons quelques conséquences. Nous allons notamment
montrer que ce corps est unique dans un sens très précis : non seulement deux corps des
fractions d'un même anneau intègre sont «identiques» parce qu'il existe un isomorphisme
entre eux qui transporte la structure de corps, mais aussi cet isomorphisme est unique dans un
sens que nous préciserons. Certes, les mathématiques ne sont pas une philosophie, mais elles
ont développé pour les besoins de leur cause une science de l'identique qui la rapproche le plus,
parmi les sciences, d'une ontologie (qui a pour objet l'élucidation des propriétés générales de
l'être, de ce qui fait que les choses tiennent ensembles, avant même d'examiner le sens que
l'homme leur donne concrètement). La proposition 14.20 en est une belle illustration.

Propqsition 14.20. Soit A un anneau intègre. Alors it existe un corps (Q(A}, +, ·) et une
application t : A-t Q(Aftelle gue . ·. . . . · . .. . . .·
K 1) l 1appliéation i définît un morphisme d'anneaux de A dans Q(A);

;/f~
A--.!"Q(A)
2) l'application L est injective;
3) poor tout corps K et pour tout morphisme d'anneaux èp :,A....:.+ K, il
existe un unique morphisme de corps q> : Q{A).-t K tel que q> = .êp o t.
On appelle corps dœ frà.ctions del'anneaù A le couple formé dti corps Q{A) etdu morphisme
t:A..:.+ Q(A).

EXEMPLE 14.21. Pour une définition rigoureuse du corps des nombres rationnels ou du
corps des fractions rationnelles sur un corps JK, il suffit de poser (Ql = Q(Z) et JK(X) =
Q (JK[Xl). À ce point du programme de Licence, ce sont les deux principaux exemples que
ron pourra garder à l'esprit tout au long de cette partie.

EXEMPLE 14.22. Voici un contre-exemple où les conditions de la proposition ne sont pas


satisfaites. Soit p un nombre premier. On a un morphisme d'anneaux L : Z - t Z/pZ :
n H ri. Toutefois, le morphisme L n'est pas injectif puisque ker L = pZ. Montrons que la
condition 3) n'est pas non plus satisfaite. Supposons le contraire. Considérons cp : Z -t (Ql :
n H n. D'après 3), il existe un morphisme de corps <p : Z/p - t (Ql tel que cp = cp o L.
:.lais pour x E Z/pZ, on note p • x = x + •• • + x la somme de p fois x. Alors p • x = 0 et
0 = cp(p · x) = p · cp(x). Comme p # 0 9ans (Ql, il en résulte que cp(x) = 0, et cela pour tout
x E Z/pZ, ce qui est impossible car cp(l) = 1.

La proposition 14.20 requiert une démonstration, mais avant d'y venir, il est peut-être plus
important encore de comprendre la manière dont elle fonctionne.
1. Qu'est-ce qu'un diagramme? Il est commode de schématiser un ensemble de mor-
phismes d'anneaux par un graphe dont les sommets sont les anneaux considérés et dont les
arêtes (orientées) représentent les morphismes. On appelle diagramme un tel graphe. Un che-
min dans le graphe est une suite finie d'arêtes A1 -t Az -t · · · -t An donc chaque but coïncide
avec la source de la suivante. En composant les morphisme associés, on obtient un morphisme
A1 -t An. Il existe en général plusieurs chemins entre deux anneaux A1 et An donnés. On dit
que le diagramme est commutatif si pour deux sommets quelconques, le morphisme obtenu
par composition le long d'un chemin est indépendant du choix de celui-ci. Par exemple, dans le
diagramme qui figure dans la proposition 14.20, il existe deux chemins de A à K. Nous avons
en effet d'une part la flèche A~K, et d'autre part le chemin A~Q(A) q, K. Dire que
le diagramme est commutatif, c'est dire que ces deux chemins définissent le même morphisme,
soit encore que <p = cp o t. La condition 3) exprime donc le fait qu'il existe une unique flèche
Q(A) ---, K qui rende le diagramme commutatif. On observera que c'est la collection de tous
les corps K et des morphismes possibles A ---, K qui définissent le corps Q(A). Pour cette
raison, on appelle propriété universelle la condition 3). Ces diagrammes sont très pratiques
pour manier de telles propriétés universelles. Il est même souvent plus rapide de visualiser la
preuve que de la rédiger.
Cette idée qu'il existe des flèches naturelles entre des objets algébriques est apparue au
milieu du xxe siècle dans le cadre de l'étude de la cohomologie des groupes, alors en plein
essor. La première mention du terme de « morphisme naturel» date de 1942 dans un article
des mathématiciens polonais Samuel Eilenberg (1913-1998) et américain Saunders Mac Lane
(1909-2005) : premier pas vers ce qui deviendra la théorie des catégories.
Le terme de catégorie est, aux dires de Mac Lane, emprunté à la Critique de la raison pure
d'Emmanuel Kant, bien que la théorie mathématique n'ait pas de rapport avec le concept
philosophique.
Après-guerre, cette théorie s'est développée sous l'égide de Bourbaki (André Weil, Samuel
Eilenberg, Henri Cartan ... ). Il faut entendre sous ce patronyme un petit groupe de brillants
mathématiciens, pour l'essentiel de l'école française, qui, sous couvert d'un anonymat tout
relatif, entreprit dans une vaste collection de traités de dégager les structures algébriques du
matériel mathématique que tout mathématicien se doit de connaître. Par la suite, Alexandre
Grothendick donna ses lettres de noblesse à cette théorie en inventant littéralement une nou-
velle façon de penser en mathématiques dans le langage des catégories. Aujourd'hui, cette
théorie a « algébrisé » l'ensemble des mathématiques; c'est aussi un champ de recherche tou-
jours très actif.
Dans la suite de cette partie, tous les diagrammes représentés seront commutatifs. Nous
invitons chaleureusement le lecteur à suivre les étapes des démonstrations rédigées ci-dessous
en se reportant aux diagrammes afférents.

2. Signification des conditions 1) et 2) L'application t est un plongement de A dans


Q(A). En effet, l'injectivité de t (d'après la condition 2)) permet d'assigner à chaque élément
de l'image t(A) son unique antécédent par t. Autrement dit, on «étiquette» chaque élément
y E t(A) par l'unique x E A tel que i(x) = y. Nous obtenons ainsi une copie conforme
de A, structure algébrique comprise, incluse dans Q(A). Identifier x et t(x), c'est renommer
l'élément t(x) et l'appeler désormais x. Il n'y a pas d'ambiguïté dans les calculs en faisant
cette identification pour tous les éléments de A, car t est un morphisme d'anneaux. Par ce
procédé, on peut voir A comme un sous-anneau de Q(A). On dit que le morphisme t plonge
l'anneau A dans le corps Q(A). Si on identifie A et t(A), il n'est plus nécessaire de préciser
le morphisme t. On parle alors du corps des fractions de Q(A) : cela signifie que A est vu
comme une partie de Q(A) et qu'implicitement le morphisme t : A ---, Q(A) est l'injection
canonique x E AH x E Q(A).

3. Signification de la conditions 3) Le point de vue qui prévaut ici est de mettre l'ac-
cent moins sur les objets que sur leurs relations. Peu importe l'essence du corps Q(A), seules
comptent ses relations avec les autres corps, c'est-à-dire les morphismes de corps que l'on
peut construire entre Q(A) et un corps K donné. La condition 3) donne le mode opératoire
de ces constructions. Si on dispose d'un morphisme d'anneaux A --, K, on en déduit au-
tomatiquement un morphisme de corps Q(A) --, K. Inversement, tout morphisme de corps
1j, : Q(A) --, K est obtenu par ce procédé. En effet, l'application cp = 1j, o L: A--, K est un
morphisme d'anneaux.
Il existe donc un unique morphisme de corps 1j, o L : Q(A)--, K tel
Q(A) îVo"i K que (tj, o L) o L = cp. Mais 1j,: Q(A)--, K est un morphisme de corps
et il vérifie évidemment la condition 1j, o L = cp. Donc 1j, o L = lj,,
'Î~
A
ce qui montre bien que 1j, peut être obtenue par le procédé décrit
dans la condition 3).
4. Unicité à unique isomorphisme près. Nous allons démontrer que le corps des fractions
est unique dans un sens très précis: non seulement deux corps des fractions Q(A) et Q(A) d'un
même anneau intègre A sont «identiques», dans le sens qu'il existe un isomorphisme de corps
de Q(A) --, Q(A) qui identifie les structures de corps, mais en outre, cet isomorphisme est
unique si on veut qu'il soit compatible avec les conditions 1 ), 2) et 3) de la proposition 14.20.

Pl'Oposition 14.23. Soit A un anneau.intègre etQ(A} et Q{A} deu:ccorps.Soit t: A "4


Q(A} et i: A~ Q(A} deuz.morphismes d~anneaux. On suppose que les cooptés (t, Q{A)}
et (i, Q(A}) vérifient les comlîtiôns l), 2) et 3) de la proposition 1:{20. AtO'f'S il ea:iste un
unique isomorphisme deCory1s tj, :·Q{A}A QfA} telqué i = 1ft ot.
PREUVE. Unicité. L'application î: A --, Q(A) est un morphisme d'anneaux.
La proposition 14.20 appliquée à (L, Q(A)) et au morphisme cp = î
Q(A) montre qu'il existe un unique morphisme de corps W: Q(A) --, Q(A)
,✓ tel que î = W o L. Si 1j, existe, on a donc nécessairement 1j, = cp, ce qui
/ démontre l'unicité de l'isomorphisme lj,.
A x cp Existence. Il s'agit de vérifier que W : Q(A) --, Q(A) est bien un
~ isomorphisme de corps. Or, l'application L : A --, Q(A) est un mor-
L=~
phisme d'anneaux. La proposition 14.20 appliquée à (î, Q(A)) et au
Q(A) morphisme X = L montre qu'il existe un unique morphisme de corps
X: Q(A)--, Q(A) tel que L = x o î.
Nous allons vérifier que X et W sont deux bijections, réciproques l'une de l'autre. L'idée
est d'utiliser la condition 3) astucieusement.
Q(A)
On remarque que X o Wo L = X o î = L. Ainsi u = X o W est
un morphisme de corps qui vérifie u o L = L. Notons idQ(Al :
Q(A) H Q(A) l'application identité de Q(A). Évidemment,
idQ(Al est un morphisme de corps et idQ(Al o L = L. C'est
~
A-,- Q(A) idQ(A)

ici qu'intervient l'astuce : la proposition 14.20 appliquée à


(L, Q(A)) et au morphisme L: A--, Q(A) montre qu'il existe ~ Q(A)
un unique morphisme de corps K : Q(A) --, Q(A) tel que
Ko L = L. Comme K = X o W et K = idQ(Al conviennent,
l'unicité de K montre que Xo W= idQ(Al·

De la même manière, on vérifie que Wo Xo î = î. Comme


la proposition 14.20 montre qu'il existe un unique morphisme
de corps K : Q(A) --, Q(A) tel que Ko î = î, l'unicité de K
montre que Wo X = idQ(Al"

Il en résulte que Wet X sont bijectifs, et que West un isomorphisme de corps. ■


5. Minimalité du corps Q(A}. La proposition 14.24 précise l'idée que Q(A} est le plus petit
corps qui contient A. En adaptant légèrement la démonstration, on peut montrer que tout
morphisme de corps de K dans Q(A} est un isomorphisme si A se plonge dans K.

Proposition 14;24. Soit A un anneau intégre. On suppose f/11,e L: A -t Q(A) définit le


corps des .fractiorui de A. Soit Kun sous-œrps de Q{A) tel que t{A) C K C Q(A). Alors
=
K Q(A).

PREUVE. Soit l 1 : A -t K la restriction de i au but K et soit j : K ----1 Q(A) l'injection


canonique de K dans Q(A).
Il est immédiat que L= joL'. Par définition du couple (l, Q(A}}, Q(A)
la condition 3) de la proposition 14.20 appliquée à l 1 montre
qu'il existe un unique morphisme de corps V": Q(A} ----1 K tel que ~
A-,'---;.- K i~(A)
V°ol = L1 . Il en résulte que joV°ol = jot' = L. Ainsi, u = joii" est un
morphisme de corps de Q (A} dans Q (A} qui satisfait la condition
u o L = L. Comme idQ(Al o l = l, la proposition 14.20 appliquée
~ Q(A)
à cp = l montre que u = idQ(Al· Ainsi, on a j o V"= idQ(AJ, ce
qui montre que j est surjective. Comme j : K ----t Q(A} est définie
par j(x) = x, il en résulte que K = Q(A), ce qui démontre notre
assertion. ■

6. Construction du corps Q(A}. La fin de cette partie est consacrée à la démonstration de la


proposition 14.20. Nous commençons par établir quelques résultats intermédiaires intéressants
pour eux-mêmes. La proposition 14.25 montre que l'on peut construire un corps des fractions
dès que l'on dispose d'un plongement de l'anneau A dans un corps K. La proposition 14.26
justifie le point de vue naïf adopté pour étudier (Ql et JK(X} : les éléments de Q(A} sont bien
les quotients d'éléments de A.

Proposition 14.25. Soit A un anneau intègre.et K un corps. On suppose (J'll,e 1.: A ----t K
est un morphisme d'anneaux injectif On pose

Q(A) ={ :~:i I a E A, b E A\{O}}.

Alors Q(A} est un sous-corps de K contenant i(A) et si on note 1.1 : A -t Q(A} le1 restriction
de .1. au but Q(A), alors le couple {1/,Q{A}) vérifie les œnditions de la proposition 14;2.Q.
Autrement dit, le morphisme t': A., Q(A) définit le corps des fractions de A;

PREUVE. o Montrons que Q (A} est un sous-corps de K. On note 1K et 1 A les éléments neutres
de K et de A respectivement.
1) Q(A} est non vide car lK = t(lA}/L(lA} E Q(A).
2) Soit x = L(a}/L(b} E Q(A}, avec a E A et b E A\ {0} alors -x = l(-a}/t(b} E Q(A}.
3) Soit (x, y} E Q(A)2. On a x = '.\:l
et y = ~/~\, avec (a, c} E A 2 et (b, d) E (A\ {0})2.
Alors,
- l(a} l(c} - l(a}. t(d} + l(c}. l(b} - l(ad + be} Q( )·
x+y - l(b} + l(d} - l(b} · l(d} - l(bd} E A'
X. y= L(a} . l(c} = l(a}. l(c} = l(ac} E Q(A}.
l(b} l(d) t(b). l(d) l(bd}
1 t(b)
4) Enfin, pour x E Q(A) \ {0}, x = t(a)/t(b) avec (a, b) E (A\ {0})2. On a - = -(-) E Q(A).
X la
Les propriétés 1), 2) et 3) montrent que Q(A) est un sous-anneau de K et la propriété 4)
montre que tout élément non nul de Q(A) est inversible dans Q(A). Il en résulte bien que
Q(A) est un sous-corps de K.
◊ Montrons que t': A-----, Q(A) définit le corps des fractions de A. Soit K' un corps et soit cp:
A-----, K' un morphisme de corps. Supposons qu'il existe un morphisme de corps ëp: Q(A) -----, K'
tel que ëp o t' = cp. Soit x E Q(A) et soit (a, b) E A x A\ {0} tel que x = t(a)/t(b). Alors,
_ -(t(a)) -(t'(a)) ëp(t'(a)) cp(a)
cp(x) = cp t(b) = cp t'(b) = ëp(t'(b)) = cp(b).
Ce calcul montre que ëp(x) est déterminé. Ainsi, le morphisme ëp est unique s'il existe. Inver-
sement, pour x = t(a)/t(b) E Q(A), on définit

w G;:D = :;:; ·
Vérifions que ëp est bien définie. Il s'agit de vérifier que ëp(x) ne dépend pas du choix du
représentant de x. Six= t(a)/t(b) = t(e)/t(d), alors t(ad) = t(a)t(d) = t(b)t(e) = t(be).
L'injectivité del montre alors que ad= be. Il en découle que cp(a)cp(d) = cp(ad) = cp(be) =
cp(b)cp(e). On en déduit que :i;! = !i~j,ce qui démontre que la définition de ëp(x) est
indépendante du choix du représentant de x.
On vérifie aisément que ëp(x + y) = ëp(x) + ëp(y) et que ëp(xy) = ëp(x)ëp(y) pour tout
(x,y) E Q(A)2. En outre, on a ëp(t(a)) = ëp(t(a))/ëp(t(lA)) = cp(a)/cp(lA) = cp(a) pour
tout a E A car t(lA) = lK, et cp(lA) = h,. Cela démontre que ëp: Q(A)-----, K' est l'unique
morphisme de corps qui satisfait la condition ëp o t' = cp, ce qui prouve notre assertion. ■

Proposition 14.26. Soit A un anneau intègre. On suppose quel: A -t Q(A) définit le


corps des fractions de A. Alors tout élémenti E Q{A) s'écrit sous la.forme
L(O)
x = L(b), avec a E A, b E A\ {O},

· . 2 . t( a) l(C) . . .
2
De plus, pour (a, c, b, d) E A x (A\ {0}) , on a L(b} = t(d) dans Q(A) 81 et seulement 81

ad = be dans A.

PREUVE. Soit q(A) = {t(a)/t(b) a E A, b E A\ {O}}. D'après la proposition 14.25, q(A)


1

est un sous-corps de Q(A). On a donc t(A) C q(A) C Q(A). D'après la proposition 14.24, il
en résulte que q(A) = Q(A).
De plus, '.i;!
= ~[~( si et seulement si t(a)t(d) = t(b)t(e), soit encore t(ad) = t(be). Cette
dernière condition est équivalente à l'égalité ad= be par l'injectivité de l, ce qui démontre la
proposition. ■

Jusqu'ici, nous avons repoussé la construction du corps Q(A) autant que possible. Toute-
fois, par honnêteté intellectuelle, il faut s'assurer au moins une fois qu'un tel corps existe. La
démonstration de la proposition 14.20 n'est pas difficile, si on sait ce que l'on cherche. L'idée
est de regrouper en classes d'équivalence tous les représentants possibles d'un même quotient,
puis de définir les lois d'addition et de multiplication sur l'ensemble des classes obtenues, en
se laissant guider par la définition des lois usuelles sur Q.
PREUVE DE LA PROPOSITION 14.20.
◊ Définissons sur A x A\ {0} la relation
(a,b) ~ (c,d) {=} ad=bc.
Il est facile de vérifier que nous obtenons ainsi une relation d'équivalence de A x A\ {0}.
-- a
On note la classe d'équivalence d'un couple (a, b) sous la forme (a, b) = b et soit Q(A)
l'ensemble des classes d'équivalence. On définit sur Q(A) deux opérations en posant
a c ad + be a c ac
b+ d= bd b d bd"
Notons que bd -1- 0 car b -1- 0, d -1- 0 et A est intègre. Les classes de (ad+ be, bd) et (ac, bd)
sont donc bien définies. Montrons qu'elles ne dépendent pas du choix des représentants des
classes~ et t
Soit (a',c', b', d') E A 2 x (A\ {0}) 2 tel que (a, b) ~ (a', b') et (c, d) ~ (c', d').
Alors ab'= a'b et cd'= c'd. Nous en déduisons les deux identités
b'd'(ad +be)= ab'dd' + bb'cd' = a'bdd' + bb'c'd = (a'd' + b'c')bd;
1
(b'd')(ac) = ab'cd' = a'bc'd = (a'c')(bd),
ce qui montre que (ad+ be, bd)~ (a'd' + b'c', b'd') et (ac, bd)~ (a'c', b'd'), et les lois sont
bien définies.
◊ Montrons que ( Q(A), +, •) est un corps. Soit a, b, c, d, e, f dans A. On suppose que b,d et
f sont non nuls. Nous avons les propriétés suivantes.

1) Associativité de l'addition :
~ ~) :_ _ ad+ be :_ _ adf + bcf + ebd _ ~ de+ cf _ ~ (~ :.)
(b + d + f - bd + f - bdf - b + df - b + d+ f .
. a c ad + be cb + da c a
2) Commutativité de l'addition : b + d = bd = db = d + b.
, a O O a a· lA + 0 a
3) Elément neutre : - + - = - + - = - - - -
b lA lA b b b
a -a -a a ab - ab
4) Opposé : b + b = b + b = b2 = O.
. . (a c) e ac e ace a ( c e)
5) Associativité de la multiplication: b ·d ·f =bd· f = bdf = b · d · f ·
- a lA lA a a•lA a
6) Elément neutre multiplicatif: - · - = - · - = - - = -.
b lA h b b - lA b
. , . . . a c ac ca c a
7) Commutativite de la multiplication : b • d = bd = db = d · b'
8) Distributivité de la multiplication sur l'addition :
~ . (~ :.) _ ~ . cf+ de _ a( cf+ de) _ acf + ode _ acf ode _ ~ . ~ ~ . :_
b d+ f - b df - bdf - bdf - bdf + bdf - b d + b f.
a b b a ab lA
9) Inverse: - · - = - • - = - = - pour a -1- 0 et b -1- 0, car (ab, ab)~ (lA, lA),
b a a b ab 1A

Les conditions 1) à 4) montrent que Q (A) muni de l'addition est un groupe commutatif.
Les conditions supplémentaires 5), 6), 7) et 8) montrent que (Q(A), +, ·) est un anneau
commutatif. Enfin, la condition 9) montre que tout élément non nul est inversible, et donc
que Q(A) est un corps.
o Il est immédiat que l'application t : A -, Q(A) : a H : est un morphisme d'anneaux
1
injectif. De plus, pour a E A et b E A\ {O}, on a

t(a) a lA a
t(b) = lA. b = b.

Ainsi { '.1:; 1 a E A, b E A\ {O}} = { ~ j a E A, b E A\ {O}} = Q(A). D'après la proposi-


tion 14.25, le morphisme t: A-, Q(A) définit bien le corps des fractions de A. ■
Troisième partie
ALGÈBRE LINÉAIRE

ES mathématiciens comme les physiciens aimeraient pouvoir répondre à la question

L « qu'est-ce que l'espace?». Le travail du géomètre est précisément d'étudier la structure


géométrique d'espaces toujours plus sophistiqués, pour les besoins des mathématiques
et de la physique. Ainsi sont nées la géométrie euclidienne pour l'étude des figures du plan
et de l'espace, la géométrie projective pour l'étude de la perspective, la géométrie algébrique
pour l'étude des courbes et des surfaces données par des équations polynomiales, puis au
XIXe siècle la géométrie riemannienne, irritée par Gauss pour mesurer des longueurs sur des
surfaces courbes pour les besoins militaires en balistique et généralisée par Riemann en toute
dimension, et la géométrie symplectique pour les besoins de la mécanique céleste.
En contraste avec le développement de la géométrie, l'algèbre se cantonna jusqu'à la fin du
XVIIIe siècle essentiellement à la théorie des équations algébriques. Cependant, au cours du
XIXe siècle, les objets étudiés et les points de vue possibles sur ces objets se sont considérable-
ment multipliés. Pour ne citer que quelques aspects de cette révolution des idées, mentionnons
les travaux de Galois, de Cayley pour la théorie des groupes, de Gauss notamment pour sa
théorie des formes quadratiques en arithmétique, de Grassmann et Hamilton pour les premiers
exemples d'algèbre non commutative, les travaux de Kummer et de Dedekind pour la théorie
des idéaux en arithmétique.
Ainsi les champs d'études des algébristes se sont extrêmement diversifiés et il n'échappa
pas aux meilleurs mathématiciens de la fin du XIXe que dans la multitude des situations
concrètes rencontrées, des formes communes se dégageaient. Pour mettre de l'ordre dans ce
foisonnement d'idées, il devenait nécessaire de trouver un langage commun capable de séparer
l'essentiel de l'accidentel dans la variété des situations concrètes. Plus importantes que les
objets eux-mêmes, ce sont les relations entre les objets qui vont être privilégiées, c'est-à-dire
les opérations, les lois de composition qui agissent sur ces objets, puis la façon dont ces lois
se combinent entre elles et sont compatibles. Enfin, se pose la question des relations entre ces
relations, soit encore du transport des lois entre deux espaces, c'est-à-dire des morphismes.
C'est l'idée des structures algébriques, dont nous avons déjà vu quelques exemples importants
(groupes, anneaux, corps) dans les chapitres précédents.
L'algèbre linéaire est un nouvel exemple de « machine théorique» dont la puissance de
synthèse s'étend largement au-delà du champ traditionnel de l'algèbre exploré par les ma-
thématiciens du XVIIIe siècle. En effet cette théorie est la première marche dans l'ambitieux
programme d'une rencontre entre le géométrique (c'est-à-dire la question de l'espace) et l'al-
gébrique (c'est-à-dire la question de la structure). Dans ce cours de première année, une des
tâches sera de se convaincre qu'il est plus facile pour l'esprit humain de formaliser directement
une notion générale d'espace «linéaire» de dimension quelconque plutôt que d'étudier au cas
par cas les propriétés des espaces de dimension deux et trois qui portent notre intuition.
Dans le cours de deuxième année, nous gravirons une deuxième marche en approfondissant
nos connaissances d'algèbre linéaire dans les deux directions : algébrique et géométrique.
Algébrique d'abord par une étude plus poussée de la structure des applications linéaires et de
leur forme normale de Jordan. Géométrique ensuite en ajoutant des structures supplémentai-
res aux espaces vectoriels, par exemple« euclidienne» pour formaliser l'idée d'orthogonalité et
mesurer la taille des vecteurs, ou «affine» pour formaliser l'idée de parallélisme et introduire
la notion de barycentre.
380

Qu'est-ce que l'algèbre linéaire? Les mathématiciens répondront qu'il s'agit stricto sensu
d'une théorie mathématique qui étudie une structure algébrique particulière, celle de la caté-
gorie linéaire constituée des espaces vectoriels et de leurs applications linéaires. Cette théorie
englobe l'étude classique des systèmes d'équations linéaires, avec ses ramifications actuelles de
calculs effectifs. Mais elle est devenue surtout l'une des pierre angulaire de l'édifice mathéma-
tique, par son efficacité et la richesse de ses applications dont il est difficile de rendre compte,
tant elle présente partout, de la géométrie, à la théorie des représentations, en passant par la
théorie des nombres, l'analyse, la topologie ou la physique théorique.

L'algèbre linéaire généralise la règle de trois en toutes dimensions.

De manière plus générale, on peut dire que l'algèbre linéaire est la théorie mathématique
qui formalise l'idée de « linéarité », ou encore de « proportionalité » des sciences de la nature.

Presque partout, presque toujours, la réponse à de petites variations est linéaire.

Donnons quelques pistes pour étayer ces affirmations.

L'algèbre linéaire, voie royale de la géométrie classique ou Thalès revisité


Le premier travail de refonte critique de la géométrie est attribué traditionnellement au grec
Euclide de l'Égypte de la période lagide. Ses Éléments forment une magnifique présentation
déductive des connaissances géométriques de son temps (vers 300 av. J.-C.), à partir d'un
nombre restreint de postulats et de notions communes explicitement admises. Plus près de
nous, le mathématicien allemand David Hilbert a formulé à la fin du XIXe siècle une axioma-
tique rigoureuse de la géométrie « euclidienne ».
Pourtant, ces axiomatiques ne sont pas enseignées au lycée ... et pour cause: le livre d'Eu-
clide ne pourrait être utilisé tel quel 23 siècle après sa conception et sa refonte dans le langage
et la rigueur des mathématiques modernes, ce que Hilbert précisément accomplit, donna une
théorie beaucoup trop subtile et hardue pour être enseignée même dans les premieres années
de l'enseignement supérieur. Fort heureusement, il existe une autre approche pour présen-
ter la géométrie classique, et cela sans effort, au point que les axiomes d'Euclide-Hilbert, bien
qu'important historiquement, ont été relégués aux oubliettes même auprès des mathématiciens
professionnels. L'idée est d'abstraire l'algèbre linéaire sous-jacente au plan et à l'espace.
Donnons l'exemple du théorème de Thalès. Diogène Laërce 1 rapporte que selon Hiéronyme,
tyran de Syracuse, le sage Thalès de Milet (625-547 av. J.C.), mesura les pyramides d'Égypte
en calculant le rapport entre leur ombre et celle d'un bâton planté verticalement dans le sol.
Formulé dans langage de la géométrie du plan, le problème est le suivant. Nous connaissons
la hauteur A'H' du bâton, mais non la hauteur AH de la pyramide. Nous savons en revanche
que les droites (A'H') et (AH) sont parallèlles. Il s'agit donc de déterminer le coefficient de
proportionalité À E JR, 0 <À< 1, tel que A'H' = ÀAH (car alors A'H' = ÀAH pour les
distances).
Soit O l'unique point du sol, c'est-à-dire de la droite (HH'), tel que OH'= ÀOH. Ce point
est bien déterminé puisque

1
OH'= ;\OH# OH+ HH' =;\OH# (1 - À)OH = H11 # HO = -
1-À
-HH'.

1
Dans Vies, Doctrines et sentences des philosophes illustres, vol. 1
381

Il nous reste à vérifier que si un rayon de soleil passe par les points A et A', il touche le sol
au point O, ce qui montrera que les ombres de la pyramide et du bâton sont bien données
par les segments [H, O] et [H', O] respectivement. Autrement dit, il s'agit de vérifier que les
vecteurs 0A et 0A' sont colinéaires. Or
OA =OH+ HA= ÀOH' + ÀH'IV = À(oï=ïi + H'IV) = ÀOA',
ce qui démontre bien la colinéarité souhaitée. Ainsi, le coefficient
À= H'O/HO = A'H'/AH
est aussi bien le rapport des hauteurs que celui des ombres.
En conclusion, deux petits calculs évidents sur
des vecteurs se sont substitués à la démonstratio n
classique utilisant des triangles semblables. L'al-
gèbre linéaire permet d'exprimer ici très clairement
la proportionali té de deux longueurs dans chacune
des directions (OA), (OH) et {AH). En quelque
H H' 0
sorte, le théorème de Thalès exprime une règle de
trois en dimension deux. Figure 1 : un calcul de
hauteur
L'algèbre linéaire, comme science des petites
variations
1
Si une voiture roule à un instant t donné à la vitesse v = 20ms- , quelle distance aura-
t-elle parcourue entre cet instant et une seconde, deux secondes, dix secondes plus tard?
Évidemment, nous ne connaissons pas la loi d'évolution de la vitesse de la voiture et nous ne
pouvons donc donner de réponse exacte à cette question. Mais en première approximatio n,
nous pouvons considérer que la vitesse de la voiture est constante. Ainsi la distance parcourue
entre deux instants t <t'est donnée approximativ ement par la formule v~t, avec ~t = t' -t.
Il est important de noter que cette approximatio n est d'autant meilleure que ~test petit, c'est-
à-dire que la variation de la vitesse est faible sur l'intervalle de temps considéré. Autrement dit,
la distance parcourue est proportionell e - avec le facteur de proportionali té v - à la variation
temporelle ~t, avec une précision d'autant meilleure que cette variation temporelle est petite.

L'exemple de la voiture est de dimension 1. Donnons un exemple en dimension 3 en consi-


dérant la situation suivante. Nous supposons connus ici des rudiments d'analyse, de mécanique
classique et de géométrie élémentaires. Une bille d'acier est suspendue par quatre ressorts
2

identiques de resistance k > 0 fixés aux sommets d'un tétraèdre régulier (voir figure 2).
On néglige ici la pesanteur et on suppose que chaque ressort est au repos quand il a pour
longueur un nombre€> 0 donné. Quelle force s'exercera sur la bille si on lâche celle-ci d'une
position M -/- G, où G est le centre de gravité du tétraèdre ?
La physique nous apprend que cette force est donnée par la formule

2
Les raisonnements mathématiques exposés dans cet exemple pouront aisément être rendus parfaitement rigou-
reux après le cours de géométrie de deuxième année. Mais les connaissances du lycée suffisent ici pour saisir
comment la linéarité se manifeste. Bien sûr, les concepts de l'algèbre linéaire seront exposés dans les chapitres
qui suivent sans qu'aucune connaissance de géométrie ne soit nécessaire.
382
11111 l!llllliiliill
où IIMAnll désigne la norme euclidienne usuelle de MAn- Dans la formule MAn - e ~ ~ ,
11 11
le premier terme de la somme exprime le fait que la force exercée par le n-ième ressort est
proportionnelle à son élongation, le second terme exprime que cette force est nulle non pas
quand M = An, mais quand le ressort est~u repos, c'est-à-dire quand IIMAnll = t Peut
importe finalement d'où vient la formule de F, nous la considérons désormais comme acquise.
A1

Figure 2 : quatre ressorts et une bille


Nous allons transformer légèrement la formule de F. Mathématiquement, G est l'unique
point tel que

Ainsi
4 4
LkMAn= Lk(MG+GAn) =4kMG.
n=l n=l
et
4 --
- ~ ,MAn
F =4kMG-keL - = - •
n=l llMAnll
Notons que pour M = G, on a F = 0, le bilan des forces exercées sur la bille est nul. Si
la bille est placée au point G sans vitesse initiale, elle n'en bougera pas : le point G est une
position d'équilibre. Il convient de noter que si Mi- G, alors F n'est pas proportionnelle à la
«variation» GM, à cause des termes ~!11" Mais qu'en est-il si GM est petit?
11

Notons que pour tout point A, il existe une fonction continue E : g ~ JR, définie sur
l'espace des vecteurs muni du produit scalaire usuel, telle que

MAZ= (MG+ GX) z =GAZ+ t(GM),


avec t(O) = 0 et t(ü) = 2ü. AG+ 11rr11z-::,, 2ü. AG, en négligeant le terme 11rr11z.
Soit a= jw = IIGAnll > 0 pour n = 1, ... ,4. Alors en première approximation, nous
verrons dans le cours d'analyse que

quand Etend vers zéro. En négligeant des termes de l'ordre de IIGMl!z, il est aisé d'en déduire
que
383
FFtml ! !
Pourquoi cette formule est-elle plus simple que la formule exacte? Supposons un instant que
l'approximation ci-dessus soit en fait une égalité. On notera alors que si on lâche la bille de
deux fois plus loin selon une même direction, la force exercée par les ressorts est deux fois plus
forte. Plus précisément, si M' et M sont tels que GM' = ÀGM pour un nombre À E IR, alors
F' = À F, avec des notations évidentes, les forces correspondantes sont ainsi dans les mêmes
proportions. De plus, si M, M', M" sont trois points tels que GM" = GM + GM', alors les
forces correspondantes vérifient la relation F" = f + F'.
Autrement dit, la force exercée sur la bille dépend linéairement, en première approximation,
du déplacement GM, et cette approximation est d'autant meilleure que les termes négligés
sont petits, c'est-à-dire que l'écart à la position d'équilibre M = G est faible. On dit que la
formule approchée de F est une linéarisation de la formule exacte.
Bien sûr, si M est loin de G, la formule approchée pour F devient grossièrement fausse.
En fait, même la loi physique qui modélise la force d'un ressort ne convient plus, puisque si
l'on tire trop fort sur un ressort, son élongation n'est plus élastique, et il finit même par céder.
Mais proche de l'équilibre, le modèle linéaire donne un traitement mathématique beaucoup
plus simple et satisfaisant.

L'exemple ci-dessus est très particulier mais il illustre un principe très général : les lois
fondamentales de la physique classique sont linéaires. L'essentiel de la physique connue porte
en effet sur les systèmes proches de l'équilibre. Comme mathématique et science de la nature se
sont développées de concert, on ne s'étonnera donc pas que les mathématiciens ont su identifier
également des structures linéaires dans les problèmes auxquels ils se sont attelés. Même la
sacro-sainte géométrie euclidienne peut être vue comme une «linéarisation» de l'espace
ambiant. On sait en effet depuis Einstein que l'espace-temps n'est qu'approximativ ement
3
linéaire dans un « petit »voisinage de l'observateur.

Progression
Le matériel que nous présentons était pour l'essentiel sans doute déjà connu par Cayley et
Grassmann à la fin du XIXe siècle et constitue les fondements d'algèbre linéaire dont tout
étudiant aura besoin, quelles que soient les études scientifiques qu'il suivra ultérieurement.
Pour nous familiariser progressivement avec la notion de linéarité, nous avons choisi d'ex-
périmenter longuement les notions de bases qui seront axiomatisées plus tard, au chapitre 17,
puis revisitées dans leur cadre général aux chapitres 18 et 19. Aussi, dans un premier temps, les
espaces vectoriels se présenteront avec un système de coordonnées priviligiées. C'était le point
de vue de Cayley et c'est souvent aussi celui retenu en physique, quand les coordonnées sont
des variables physiques significatives. De tels espaces s'identifient naturellement à l'espace des
n-uplets, l'espace canonique !Kn, où nous nous bornerons par simplicité aux cas où lK désigne
le corps IR ou C, et dont l'étude occupera l'intégralité du chapitre 15.
Dans de tels espaces, il est déjà possible de développer les notions de famille libre, de famille
génératrice et de base, avec la possibilité de faire des calculs très concrets. Nous introduirons
en outre la notion de sous-espace vectoriel, idée principalement due à Grassmann, qui nous
fournira une première raison de ne pas limiter notre présentation de l'algèbre linéaire aux seuls
espaces canoniques. En effet, il n'existe pas en général de coordonnées privilégiées sur un sous-
espace d'un espace canonique. Et pourtant toutes les notions que nous aurons développées
dans les espaces canoniques s'étendent sans difficulté à ces sous-espaces.

3
Cette approximation est excellente dans la vie quotidienne, mais, par exemple, les GPS actuels utilisent des
calculs relativistes pour connaître avec la précision requise la position des satellites.
384

Après avoir étudié les espaces canoniques, nous introduisons au chapitre 16 les applica-
tions linéaires entre espaces canoniques, qu'il est commode d'écrire sous la forme de tableaux
de nombres, c'est-à-dire de matrices. La loi de composition des applications de la théorie des
ensembles induit une loi de composition des matrices, multiplicative associative mais non com-
mutative. En particulier, l'espace des matrices carrées forment une algèbre non commutative
en dimension plus grande ou égale à deux, dont l'ensemble des éléments inversibles forment
un groupe particulièrement riche, le groupe linéaire. Mais un tableau de nombres peut servir
à représenter bien d'autres objets qu'une application linéaire. Par exemple, nous avons déjà
fait un usage limité de l'écriture matricielle pour noter une permutation dans le chapitre sur
le groupe symétrique.
Historiquement, bien que le terme de matrice soit dû au mathématicien anglais Sylvester, le
premier mathématicien à avoir employé une notation matricielle est le mathématicien allemand
Gauss, pour représenter une « substitution » linéaire dans une forme quadratique, de même
qu'il notait une forme ax2 + 2bx-y + c-y 2 par le triplet (a, b, c). Une grande place est consacrée
dans le chapitre 16 à la méthode du pivot de Gauss qui décrit un algorithme de résolution des
systèmes linéaires et qu'il est commode de présenter sous forme matricielle.
Le chapitre 17 est un chapitre de synthèse, où nous reprenons les idées développées dans les
deux chapitres précédents, mais cette fois dans le cadre général des espaces vectoriels, présentés
sous forme axiomatique. Plus que pour les autres structures algébriques rencontrées jusqu'ici,
nous avons essayé de préparer le parachutage de la définition générale d'un espace vectoriel en
insistant sur la signification du renversement opéré par le point de vue axiomatique. Bien sûr,
ce travail de fond aurait pu être fait pour chacune des structures algébriques précédemment
rencontrées, mais il est toujours difficile, dans la place impartie d'un seul volume, de présenter
en détail à la fois un problème et sa résolution. Il nous a semblé que l'algèbre linéaire, par la
place qu'elle occupe dans le programme de première année, était le lieu pour montrer en quoi
l'abstraction d'une structure algébrique était source de clarifications et de progrès.
Ainsi le point de vue change, et la famille des objets considérés s'agrandit. Nous présentons
de nouveaux exemples d'espaces vectoriels avec leurs satellites (espaces-vectoriels et sous-
espaces vectoriels, algèbres et sous-algèbres), ainsi que les morphismes entre ces objets, soit
principalement les applications linéaires.
Contrairement au cas des espaces canoniques, la notion d'espace vectoriel peut maintenant
se développer séparemment de l'idée de dimension, celle-ci faisant l'objet d'un traitement
spécial. Nous reprenons au chapitre 18 les notions de famille libre, de famille génératrice et
de base développées dans le cadre étroit des espaces canoniques au chapitre 15.
Les techniques de changements de bases sont détaillées, pour les systèmes de coordonnées et
pour les représentations matricielles des applications linéaires. Dans le dernier cas, soulignons
qu'il ne s'agit plus de comprendre comment deux structures vectorielles se transportent à l'aide
d'un morphisme, mais comment les morphismes eux-mêmes se transportent par changement
de coordonnées. Le bon outil est la matrice de passage que l'on verra comme un foncteur4 ,
sans bien sûr employer cette terminologie trop avancée pour un cours de licence.
Le chapitre 19 expose l'idée sans doute la plus géométrique contenue dans le programme
d'algèbre linéaire de première année, qui discute de la position relative de sous-espaces vec-
toriels donnés au sein d'un même espace vectoriel. Le cas le plus intéressant pour l'algèbre
linéaire est celui de deux sous-espaces se coupant transversalemen t uniquement en l'origine

4
Un foncteur est un « morphisme » de morphismes, qui transforme les objets d'une catégorie en des objets
d'une autre catégorie, et les morphismes de la première catégorie en des morphismes de la seconde.
385

et dont la somme permet de reconstituer l'espace total (c'est par exemple le cas d'une droite
vectorielle et d'un plan vectoriel en position générale dans un espace de dimension 3). Il a fallu
certainement une certaine audace aux précurseurs pour appliquer ce point de vue géométrique
aux espaces vectoriels généraux et à leurs sous-espaces, indépendammen t de leurs dimensions.
Nous verrons comment ce point de vue est très éclairant pour comprendre la structure d'une
application linéaire.
Enfin, le chapitre 20 traite non pas d'algèbre linéaire mais d'algèbre multilinéaire, c'est-à-
dire des applications de plusieurs variables, linéaires en chacune de leur variable. Nous nous
5
intéresserons aux déterminants, c'est-à-dire aux formes multilinéaires alternées • Inventée pour
l'étude des systèmes d'équations linéaires, les déterminants sont historiquement indissociables
du développement du calcul matriciel. Ainsi, Cauchy savait calculer le produit de deux déter-
minants, mais non celui de deux matrices. De cette tradition, nous verrons la règle de Cramer
(explicitée par ce dernier en 1754). Mais cette technique de résolution par des quotients de
déterminants est plus théorique que pratique. Aussi avons-nous préféré ici encore mettre en
avant des idées géométriques, celles des travaux de Jacobi, plutôt que de celles de Cramer.
Ainsi le déterminant est avant tout pour nous le calcul algébrique d'un volume.

5
Une fonction alternée est une fonction qui ne peut prendre que deux valeurs ±ksi on permute les variables.
Chapitre 15
CALCUL VECTORIE L DANS IT(n

ANS le cours de géométrie du secondaire, nous avons appris à calculer la somme de

D deux vecteurs du plan euclidien, et à multiplier un vecteur par un nombre réel. Or, il
est possible de définir des opérations analogues sur beaucoup d'autres objets mathé-
matiques. Par exemple, la définition de l'addition de deux fonctions ou de la multiplication
d'une fonction par un nombre réel sont très naturelles. Dès lors que sur un ensemble donné il
est possible d'additionner entre eux deux éléments quelconques, et de multiplier les éléments
par les scalaires, nous dirons que cet ensemble peut être muni d'une structure d'espace vecto-
riel (et que ses éléments sont des vecteurs), sous réserve que les deux opérations ainsi définies
obéissent à un certain nombre de règles raisonnables que nous préciserons.
Dans ce chapitre, nous commençons par l'exemple simple des espaces constituées de n-
uplets. Cet exemple est fondamental car d'une part il peut être considéré comme le modèle
de tous les espaces vectoriels de dimension finie, et d'autre part parce que presque tous les
autres exemples d'espaces vectoriels que nous considérerons dans ce cours seront construits à
partir de celui-là.
1
Dans tout ce qui suit, II{ désigne le corps des réels ou le corps des complexes.

1. L'ESPACE VECTORIEL CANONIQUE JKn


I.1. De JR. 3 à ocn
Dans le chapitre 1, nous avons vu qu'un vecteur du plan peut se représenter par le couple de
2
ses coordonnées dans un repère. Ce couple est un élément de l'ensemble lî . Toute opération
2
sur les vecteurs se traduit alors en une équation dans lî . Par exemple, pour la somme de
deux vecteurs :
Addition des vecteurs : ü+v w,
Équation dans lî 2 : + 1J1, x2 + Yzl = (z1, z2),
(x1

où (x1, x2l, (yi, Yzl et (z1, z2) sont les coordonnées respectives de û, v et w.
L'ensemble lî2
est donc une sorte de « modèle »du plan.
Si on choisit un repère dans l'espace ambiant, l'addition de deux vecteurs conduit à une
3
équation similaire dans lî3 , car les coordonnées d'un vecteur constituent un triplet de lî .
lî 3 est un « modèle »de l'espace ambiant.
Ainsi, on peut dire que l'ensemble

Au passage, soulevons une question fréquente : lî3 est-il l'espace ambiant dans lequel nous
vivons ? La réponse est non. Que notre perception de la spacialité puisse se formaliser par
un espace euclidien de dimension 3 suppose déjà toute une construction de l'esprit, tout un
apprentissage que nous avons tous commencé dès la plus tendre enfance. Il ne s'agit cependant

1
Tous les énoncés restent valables si lK est un sous-corps quelconque de IC, comme ffi., IQ! ou un corps de nombres
algébriques. Presque tous les énoncés restent valables pour d'autres corps, comme par exemple Z/pZ, avec p
premier.
388

que d'un modèle, d'un outil qui nous aide à penser ce qu'est un certain aspect de l'espace,
bien adapté à un certain domaine du savoir scientifique.
Quand bien même on voudrait croire que l'espace dont nous avons l'expérience est parfai-
tement représenté par une structure vectorielle, il n'en est pas plus constitué, intrinsèquement,
de triplets de nombres réels ... Il faut pour cela choisir une origine et un repère.

Nous allons maintenant établir des règles de calcul dans nos «modèles» JR. 2 et JR. 3 . Bien
sûr, ces règles rassemblent le calcul vectoriel dont nous avons l'habitude. Or, nous ne faisons
essentiellement que deux opérations avec les vecteurs, qui se traduisent par deux opérations
dans JR. 2 .
Opérations dans le plan : Opérations dans JR. 2 :
1) Additionner deux vecteurs ; 1) (x1, x2) + (y1, Y2) = (x1 + Y1, x2 + Y2l;
2) multiplier un vecteur par un nombre 2) À(x1,x2) = (ÀX1,Àx2l,
réel. où (x1, x2l, (y1, Yi) sont dans JR. 2 et À ER
On calcule donc dans JR. 2 formellement comme avec les vecteurs du plan, et c'est pourquoi
l'ensemble JR. 2 , muni des deux opérations décrites dans le tableau ci-dessus, est aussi appelé
un espace vectoriel. Les éléments de JR. 2 sont des vecteurs et les éléments de lR des scalaires.
De même, on définit dans JR.3 les opérations suivantes :
1 Opérations dans JR. 3 :

1) (x1, x2, X3) + (Yi, Y2, Y3l = (x1 +Y1, x2 +Y2, X3 +y3);
2) À(X1, X2, X3) = (ÀX1, ÀX2, ÀX3),
où (x1, X2, X3), (Y1, Yi, y3) sont dans JR. 3 et À ER
Les espaces JR. 2 et JR. 3 portent aussi les noms d'espaces vectoriels canoniques de dimension
deux et trois sur R L'adjectif« canonique» (ou son synonyme «naturel») apparaît souvent
en algèbre. En français, le substantif« canon» est un terme d'origine juridique qui désigne un
ensemble de règles (penser au droit canon de l'Église romaine, ou au canon de beauté en art).
En mathématiques, il qualifie une situation (ou une équation, ou un ensemble de règles) qui
sert de modèle pour de nombreuses autres situations. Il est notamment employé lorsque l'on
veut privilégier un choix que l'on juge le plus naturel parmi d'autres. Il faut toutefois noter
que l'adjectif «canonique» n'est pas «canoniquement» défini : il n'existe pas de méthode
mathématique pour décider si un choix est canonique, cela reste une convention plus ou moins
justifiée par l'usage.
Par exemple, JR. 3 est un espace vectoriel canonique qui représente l'espace ambiant, mais la
correspondance entre l'espace ambiant et JR. 3 n'est pas canonique, car pour identifier l'espace
ambiant à JR. 3 , il faut choisir un repère et il n'en existe pas de privilégié : chaque observateur
a le droit de choisir le repère qu'il veut.

Comme les opérations dans JR.2 ou JR.3 se font composante par composante, il n'y a aucune
raison de limiter notre étude à la dimension 2 ou 3 : on peut définir des opérations analogues
sur l'ensemble ]Rn pour tout entier n. Par ailleurs, il est possible de remplacer les nombres réels
par les nombres complexes, c'est-à-dire de considérer les opérations analogues sur l'ensemble
en. La notation ocn désigne donc soit lRn, soit en.

Définition 15.1. Soit n ~ 1 un entier. L'addition de deux éléments de ocn et la multipli-


cation d'un élément de ocn par un élément de 1K sont définies par
(xi, ... , Xn) + (y1, ... ,Ynl = (X1 +Yi,•••, Xn +Yn), (15.la)
À· (x1, ... , Xn) = (Àx1, ... ,Àxnl- (15.lb)
389

Muni des opérations définies par (15.la) et (15.lb ), l'ensemble ocn est appelé l'espace vecto-
riel canonique de dimension n sur OC. Ses éléments, les n-uplets de nombres, sont des vecteurs.
La définition fait intervenir l'addition et la multiplication dans 1K dans chaque composante.
Ainsi les règles de calcul dans 1K (commutativité, associativité, élément neutre, etc.) induisent
les huit règles suivantes dans ocn.

Règle 15.2: Poûr tôm.v;-u:,w dans r et tcus :.\,µ. dtîns K, on à


1).v+u==u+v;· 5) 1 •"'!=v;
2) lv+it)+1Y:=~+.flt+W1; .· tl} À'. Ûl ·V) =.{Àµ)- V;
3) v+O=v; TT {À +µ},v.,;À··v + µ-v;
4) v+(:-v}='O; 8) À•(v+tî}=l•v+À·U..

Notation. Dans 3) et 4), on a noté O le n-uplet (0, ... , 0).


Dans 4), on a utilisé la notation suivante : si v = (x,, ... , Xn) _alors -v = (-x,, ... , -xnl-
Souvent, nous écrirons Àv à la place de À· v.

Remarque. Pourquoi ne nous contentons-nous pas d'étudier JR 2 et JR 3 ? Premièrement, beau-


coup de propriétés que nous allons démontrer ne sont pas spécifiques à la dimension 2 ou 3.
Nous les comprendrons mieux si nous les démontrons directement dans leur généralité. Deuxiè-
mement, de nombreux problèmes en sciences ont lieu dans des espaces « plus grands »que JR3 .
Par exemple, en mécanique newtonienne, on paramètre les configurations d'une particule par
JR3 x JR 3 = JR 6 . En effet, la loi fondamentale de la dynamique montre que le mouvement d'une
particule en présence de forces connues est caractérisé par la donnée de sa position initiale
q = (x 1 ,x2 ,x3 ) E JR3 et de sa vitesse initiale v = (v,,v2,v3) E JR 3. Le couple (q,v) dans
JR 6 caractérise donc le mouvement d'une particule. On notera qu'il y a ici un léger abus de
notation puisque nous avons identifié le couple de triplets ((x,, X2, x3), (v1, Vz, v 3)) E JR 3 x JR 3
et le 6-uplet (x 1 , x 2 , x 3 , v 1 , v 2 , v 3 ) E JR 6 . Cette identification est évidemment très naturelle et
ne pose aucun problème dans les calculs.
Le fait que l'on ne puisse plus visualiser ]Rn dès que n ~ 4 ne doit pas effrayer. Il ar-
rive même que l'on puisse souhaiter que n soit le plus grand possible. Par exemple, pour
prévoir le temps qu'il fera, les agences de météorologie disposent de stations disséminées sur
toute la planète pour mesurer la température et la pression de l'atmosphère (et bien d'autres
données). Pour chaque station j, avec 1 ~ j ~ N, on obtient donc un couple (Pi, Ti) E JR 2 .
L'état météorologique de la planète, à un instant donné, est alors décrit par un élément
(P 1, T1, P2, T2, ... , PN, TN) E JR 2N. Les prévisions seront d'autant plus précises que le maillage
des stations est fin, c'est-à-dire que N est grand.

Test 15.1. Quelle règle garantit que ces deux parenthé-


sages donnent le même vecteur ?
a. À quel espace canonique appartient le vec-
teur (1 + i)(l, i) ? Test 15.2.
b. Ajouter des parenthèses dans l'expression Écrire v = (-2i, i,O) + 2i(l + 2i)(l,4 + 2i,-i)
i( 1 + i) ( 1, i, 1 - i) de deux manières différentes. sous la forme d'un triplet de l['. 3 .
390

1.2. Sous-espaces vectoriels. Famille génératrice


L'espace canonique ocn est suffisamment important pour que nous exposions maintenant dans
ce cas particulier les principales notions que nous allons rencontrer plus tard dans un cadre
beaucoup plus général.
Définition 15.3. Un sous-espace vectoriel de ocn est un sous-ensemble non vide F C ocn
tel que pour tous v, u dans F et tout À E 1K on a v + u E F et ÀV E F.

Notons qu'un sous-espace vectoriel contient toujours .le n-uplet nul : cela résulte de la
définition ci-dessus en prenant À= 0 et v un vecteur arbitraire de F. Des calculs « linéaires»,
c'est-à-dire constitués d'une succession finie de sommes finies de vecteurs et de multiplications
par des scalaires, à partir de vecteurs d'un sous-espace vectoriel fixé F C E ne feront jamais
sortir de ce sous-espace vectoriel. Nous pouvons donc considérer les deux opérations

+ : F X F ---, F, (u, V) H u +V • : 1K x F---, F, (À, u) H Àu ;

restrictions des opérations correspondantes dans E. Adoptons momentanément un point de


vue intrinsèque : oublions que F est contenu dans un espace plus gros qui a servi à le définir et
ne retenons que les deux opérations ci-dessus. Nous avons obtenu un espace (F, +, ·) qui n'est
pas un espace canonique en général, mais dans lequel les objets peuvent s'additionner et être
multipliés par des scalaires. De plus, les huit points de la règle 15.2 restent valables dans F.
L'espace ocn contient toujours deux sous-espaces évidents dits «triviaux» : l'espace nul
qui contient seulement le n-uplet nul de ocn et l'espace ocn tout entier. Dès que n ): 2, il en
contient bien d'autres. Par exemple, pour tout e E ocn \ {O}, le lecteur vérifiera facilement que
la partie lKe = {Àe I À E JK} est un sous-espace vectoriel de ocn. On appelle droite vectorielle
un tel sous-espace vectoriel. Cette construction se généralise de la manière suivante.
Définition 15.4. Une combinaison linéaire des vecteurs v 1, ... , Vp dans ocn est une somme
de la forme À1V1 + · · · + ÀpVp où Àj E 1K. Les Àj sont appelés coefficients.

Il est clair qu'une combinaison linéaire de vecteurs de ocn est encore un vecteur dans ocn.
Rêgle.15.5. Soit F•un sous-ensemble non vide de gn~·Alors Fest uns(J1),S-espace vect6riel
si et seulement si toute combinaison linéaire ile vecteurs de f est dansF. ·
PREUVE.
► Supposons que F est un sous-espace de ocn. Soient v 1, ... , Vp dans le sous-espace vectoriel
F de ocn et soient À1, ... , Àp dans JK. Alors ÀjVj E F pour j = 1, ... , p, et par récurrence la
somme À1v1 + À2V2 + · · · + ÀpVp est aussi dans F.
► Inversement, supposons que F est stable par combinaison linéaire. Alors évidemment, pour
u, v dans F et À E JK, les vecteurs v+u et ÀV sont dans F car ce sont des combinaisons linéaires
particulières de v et u. ■

Notation. On note

vect(v 1, ... , vp) = { t ÀjVj I Àj E 1K} = 1Kv1 + • • • + lKvp

l'ensemble de toutes les combinaisons linéaires de v 1, ... , Vp .


Bien entendu, la somme de deux combinaisons linéaires de v 1, ... , Vp est encore une
combinaison linéaire de v1, ... , Vp et si on multiplie une combinaison linéaire de v 1, ... , Vp
391

par un nombre À E IK, on obtient encore une combinaison linéaire de V1, ... , Vp . Comme
vect(v 1, ... , vvl contient le vecteur nul, cette partie n'est pas vide et il résulte de cette dis-
cussion que l'ensemble vect{v 1, ... , vvl est un sous-espace vectoriel de ocn.

Définition 15.6. On appelle F = vect(v1, ... , vp) le sous-espace vectoriel engendré par
v 1, ... , Vp. On dit alors que la famille (v 1, ... , Vp) est une famille génératrice de F ou que
les vecteurs v1 , ... , Vp sont des générateurs de F.

Ainsi, pour construire des exemples de sous-espaces vectoriels de !Kn, il suffit de choisir
des vecteurs v 1, ... , Vp dans JKn et de prendre le sous-espace vectoriel engendré par ceux-là.
Nous verrons bientôt dans le théorème 15.20 que tout sous-espace vectoriel de !Kn est de cette
forme.

I
I

__vf>->
I

FIGURE 15.1. Espaces vectoriels engendrés par un, deux, ou trois vecteurs

Test 15.3. Test 15.5.


Combien de sous-espaces vectoriels possède l'es- Soient m, n deux entiers tels que O < m < n.
pace canonique Kn Est-ce que JRm est un sous-espace vectoriel de
]Rn?
a. pour n = 1?
b. pour n = 2? Test 15.6.

Test 15.4. Soient m, n deux entiers tels que O < m <


n et soit F l'ensemble de tous les n-uplets
Soit B = {(x, y) E JR 2 I x2 +-y 2 ,,ç l}. Déterminer (x1, ... , Xn) E Kn tels que Xk = 0 pour tout
tous les sous-espaces vectoriels de JR 2 contenus k > m. Est-ce que F est un sous-espace vecto-
dans B. riel de ]Rn?

1.3. Systèmes linéaires


Déjà, au lycée, nous avons résolu des systèmes linéaires, notamment de 2 ou 3 équations
et à 2 ou 3 inconnues. La méthode de résolution la plus utilisée consistait à procéder par
substitution : on isole une inconnue dans l'une des équations pour la remplacer dans les
autres, et ainsi de suite. Nous étudions dans cette partie les systèmes linéaires pour des
nombres d'équations et d'inconnues quelconques.
Un système linéaire de m équations à n inconnues x1, ... , Xn est de la forme

U11X1 + U12X2 + ··· + UJnXn = 1J1,


Uz1X1 + U22X2 + ··· + UznXn = 1!2,

{
Um1X1 + Um2X2 + · · · + UmnXn ~ 1Jm.
392

Les nombres aek et lJe, pour k = 1, ... , net e= 1, ... , m, sont des éléments donnés de JK. Les
inconnues sont les variables x 1, ... , Xn.
Une solution du système est un n-uplet x = (x 1, ... , Xn) E ocn qui vérifie toutes les
équations du système. La méthode par substitution est particulièrement simple si le système
est de la forme donnée par l'exemple 15.7. Plus tard, nous étudierons l'algorithme de Gauss
qui permet de ramener essentiellement tout système à cet exemple.

EXEMPLE 15.7. XJ + X2 + · · · + Xn-1 + Xn = 111


X2 + · · · + Xn-1 + Xn = 112

Xn-1 + Xn = lJn-1
Xn =lJn
On résout facilement du bas vers le haut. Le lecteur vérifiera que l'on obtient l'unique solution
(xi,•.•, Xn) = (111 -112, 112 -113, • • •, lJn-1 -lJn, 11n) ·

Un système homogène est un système dont le membre à droite est nul, c'est-à-dire s'il est
de la forme suivante.

U11X1 + U12X2 + · · · + U1nXn = 0


U21X1 + U22X2 + · · · + U2nXn = 0
(15.2)

+ Um2X2 + · · · + UmnXn ~ 0
{
Um1X1

Jl,èglé~~-&•. .. '.: . _.___ . . . . . _. _.. _. · . --_.. · i .. ·


L 'efis~ÎÎJ; i~: s~tùtWns Üitl•sft$ibrrie h<i'mligène ( 15.2J tst· un' soits-tspaœ· ?fe~()nel 8fd[{l\.

PREUVE. Un système homogène possède toujours une solution, par exemple la solution
triviale x = O. L'ensemble des solutions est donc non vide. Montrons que six, x' dans ocn sont
solutions et si À E JK, alors x + x' et ,\x sont également solutions. Six et x' sont solutions de
(15.2), alors, pour tout 1 ~ e ~ m

et (15.3)
En ajoutant ces deux équations, nous obtenons
ae1 (x1 + x\) + adx2 + x~) + · · · + aen(Xn + x~) = O.
En multipliant la première équation de (15.3) par À, nous obtenons
+ aei(.\x2) + · · · + aen(Àxnl = O.
ae1(.\xi)
Comme les deux équations obtenues sont valables pour tout e= 1, ... , m, la première équation
montre que x + x' est aussi solution, et la seconde équation montre que ÀX est solution. ■

Dans les exemples suivants les sous-espaces vectoriels sont tous des ensembles de solutions
d'un système linéaire homogène.

EXEMPLE 15.9. (0, 1)

o L'ensemble {(x 1 , x2) E 1R 2 x1 - 2x2 = O} est un sous-espace


1

vectoriel de JR 2 . Géométriquement ce sous-espace est une droite


passant par l'origine.
393

3
o L'ensemble {(x 1, x 2, x 3) E JR. 3 x 1 - 2x2 + 4x3 = O} est un sous-espace vectoriel de JR. .
1

Géométriquement ce sous-espace est un plan passant par l'origine.


o L'ensemble {(x1, xz, x3) E JR. 3 1 x 1 - 2x2 + 4x3 = x, + 3x2 = O} est un sous-espace vectoriel
de JR. 3 • Ce sous-espace est l'intersection de deux plans distincts passant par l'origine, donc
une droite.

L'union de deux sous-espaces vectoriels n'est pas un sous-espace vectoriel, en général.


EXEMPLE 15.10.
L'ensemble G = {(x 1, x 2) E JR. 2 (x 1 - 2xz)(x 1 + xz) = O} n'est pas
1

un sous-espace vectoriel de JR.2 . En effet (2, 1) et (1, -1) sont dans


G mais la somme (2, 1) + (1, -1) = (3, 0) ne l'est pas. Donc G n'est
pas stable pour addition. G est l'union de deux droites.

Test 15.7. a. N'ayant pas de solution.


Quel ensemble est un s.e.v. de JK3 ? b. Ayant une infinité de solutions.
a. {(x,-y,z) 1 (x-2-y)z=O}.
b. {(x,-y,z) 1 x-2-y =z}. Test 15.9.
c. {(x,-y,z) lx-2-y=-y+z=l}. Soient v, v,, ... , vp des vecteurs de ocn. Si on
d. {(x,-y,z) x-2-y = x+-y + z = O}.
1
veut montrer que v est combinaison linéaire
des v1, ... , Vp , on est amené à résoudre un sys-
Test 15.8. tème linéaire. Combien d'inconnues et combien
Donnez un exemple de système linéaire d'équations possède ce système?

Il. FAMILLES LIBRES, FAMILLES LIÉES

Il. 1. Dépendance linéaire


Nous abordons dans cette partie la notion importante de famille libre et la notion contraire de
famille liée. Ces notions nous conduiront aux concepts de dimension et de base. Comme dans
le reste de ce chapitre, nous avons pris le parti d'une présentation opératoire pour pouvoir
faire rapidement des calculs. Nous revisiterons ces notions plus loin dans le cours d'algèbre
linéaire pour en comprendre plus profondément le sens.
Définition 15.11.
1) Des vecteurs v 1 , ... , Vp dans :ocn forment une famille libre si pour tous À1 , ..• , Àp dans
:OC, on a l'implication

==}

Autrement dit, une famille de vecteurs est libre si la seule manière d'obtenir le vecteur nul
comme combinaison linéare de la famille consiste à prendre tous les coefficients nuls.
2) Des vecteurs v 1 , ..• , Vp dans :ocn forment une famille liée s'il existe À 1 , ... , Àp dans 1K
non tous nuls et tels que
394

Notez bien que ces notions ne portent pas sur des vecteurs isolés mais sur la famille
tout entière des vecteurs donnés. De plus, les notions de famille libre et de famille liée sont
évidemment antinomiques, c'est-à-dire qu'une famille est soit libre, soit liée.
Une équation ;\ 1v 1 + •••+ ÀpVp = 0, où l'un des coefficients au moins est non nul, s'appelle
relation de dépendance linéaire. On dit que les vecteurs sont linéairement indépendants ou
libres s'ils forment une famille libre. Dans le cas contraire, on dit qu'ils forment une famille
de vecteurs linéairement dépendants ou liés. Deux vecteurs liés sont dits colinéaires, et trois
vecteurs liés sont dits coplanaires.
Q)

~ EXEMPLE 15.12.
o Les vecteurs u = (1, 2, 3), v = (3, 1, 2), w = (2, 3, 1) sont libres dans ~ 3 .
En effet soient ;\ 1 , Àz, ;\3 E ~ tels que À 1u + ÀzV + À3W = O. Cela équivaut au système

On le résout et on trouve comme unique solution la solution triviale À1 = À2 = ;\3 = O.


o Les vecteurs u = (1, 2, 3), v = (3, 1, 2), w' = (-3, 4, 5) de ~ 3 sont liés.
En effet, comme ci-dessus on obtient un système en trois inconnues ;\ 1 , À2 , ;\3 . On trouve une
solution non triviale, par exemple (-3, 2, 1). On a donc la relation de dépendance linéaire
-3u + 2v + w' = O.

Remarque. Voici quelques conséquences immédiates de la définition.


◊L'ordre des vecteurs est sans importance,

V cr E 6p, {=} (Vcr(l), ... , Vcr(p)) libre.


◊ La famille vide 0 est libre.
◊ Une famille qui contient un seul vecteur est libre si et seulement si ce vecteur est non nul.
◊ Toute sous-famille d'une famille libre est libre,

==}

◊ On en déduit que toute famille ~qui contient une famille liée est liée. En particulier toute
famille contenant le vecteur nul ou deux fois le même vecteur est liée.

Règle 15~13. . . . .. . . .· / ...· > . . . ·... ·..• .. ·...... .


Des vecteurs sont liés siet seulemèntsi l'un pafmiêux est com6inaisÔn linéaireâês autrés:
PREUVE. Soient V1, ... , Vp dans ocn.
◊ Si ces vecteurs sont liés, alors il existe une relation de dépendance linéaire I:f=
1 Àivi = 0,
avec Àk # 0 pour un certain indice k E {l, ... , p }. On peut alors isoler vk en écrivant

(15.4)

ce qui prouve que vk est combinaison linéaire des autres vecteurs.


◊ Réciproquement, si l'un des vecteurs, disons vk, est combinaison linéaire des autres, c'est-
à-dire si vk = Lj,ik µivi, où (µ1, ... , µk-1, µk+l, ... , ~) E JK.P-l, posons µk = -1. Nous
obtenons la relation de dépendance linéaire I:f=
1 µivi = 0. ■
395

Pour isoler le vecteur vk dans (15.4), nous avons utilisé le fait que l'on peut diviser par tout
élément non nul du corps OC. C'est pourquoi nous nous sommes placés dans !Rn ou icn, et non
dans zn. L'ensemble zn peut cependant être muni naturellement d'une opération d'addition
et d'une opération de multiplication par les scalaires (éléments de Z). On obtient ainsi une
structure algébrique très naturelle et très intéressante sur zn, mais ce n'est pas une structure
d'espace vectoriel. C'est ce que l'on appelle un module. La structure algébrique de module est
importante mais plus délicate, elle ne sera étudiée qu'en troisième année de licence.
Nous donnons maintenant un critère simple pour qu'une famille de deux vecteurs de OC2
soit libre. Ce résultat est à rapproché de l'idée intuitive que l'aire d'un parallélogramme formé
par deux vecteurs donnés dans le plan est nulle si et seulement si le parallélogramme est
plat, c'est-à-dire si les deux vecteurs sont colinéaires. Plus tard, dans le chapitre 20 sur le
déterminant, nous généraliserons cette proposition à ocn, avec n quelconque.

Proposition 15. 14, Deux vecteurs (a, b) et (c, d) de OC2 sont colinéaoos si et seulement
si leur détermill9Jlt ad -:- be est nul.

PREUVE. Posons u = (a, b) et v = (e, d).


► Supposons qu'il existe(;.\,µ) E OC2 non nul, tel que Àu+ µv = O. Quitte à échanger les rôles
des deux vecteurs, on peut supposer que À -=/ O. Alors u = -x
v, soit encore ( a, b) = -x (
e, d).
Donc
µ µ
ad- be= (-~e)d- (-~d)e = O.

► Supposons que ad - be= O. Il faut prouver que les vecteurs u et v sont liés. Si v = 0 ils
sont certainement liés car O• u - 1 · v = 0 par exemple. Considérons le cas v-=/ O. On a alors
e -=/ 0 ou d-=/ O. Si e -=/ 0, alors b = acd. Ainsi, il existe une relation de dépendance linéaire
entre u et v, à savoir
a a ad
u- -v = (a,b)- -(e,d) = (a,b)-(a,-) =0.
e e e
La preuve est similaire si d -=/ O. ■

Il est important de comprendre que deux vecteurs quelconques de OC 2 sont presque toujours
libres, tandis que la non-liberté est le cas singulier : choisissez deux vecteurs « au hasard »,
ils ne seront pas colinéaires en général. En effet, pour que deux vecteurs (a, b) et (c, d) soient
colinéaires, nous venons de montrer qu'il faut et il suffit que le quadruplet ( a, b, e, d) appar-
tienne à la partie J/ = {(x, y, s, t) E OC4 1 xt -ys = O} C OC4 . Or, J/ est toute «petite» dans
OC4 . Pour une justification rigoureuse de cette dernière assertion, il faudra attendre le cours
de théorie de la mesure de troisième année. En attendant, donnons l'explication suivante, non
parfaitement fondée puisque nous ne disons pas ce qu'est une probabilité sur OC4 .
Pour prendre au hasard ( a, b, e, d) dans OC4 , choisissons d'abord b, e, d. La probabilité
que d = 0 est nulle. Donc, presque sûrement, la fonction affine OC -t OC : a H ad - be n'est
pas constante. Elle s'annule ainsi en un unique p9int isolé, et la probabilité de choisir ce point
est nulle. Ainsi, en appliquant la règle des probabilités conditionnelles, puisque les choix de
a, b, e, d sont indépendants, la probabilité que ad - be= 0 est nulle.
De même, si on choisit trois vecteurs au hasard dans OC3, il est presque certain qu'ils ne
seront pas coplanaires. Plus généralement, une famille de vecteurs choisis au hasard dans
ocn est presque toujours libre, pourvu que le nombre de vecteurs choisis ne dépasse pas la
dimension n (voir la règle 15.18).
396

Test 15.10. Test 15.14.


Pour examiner la liberté de p vecteurs de Kn, il Soient u, v, w dans E. Que pensez-vous des pro-
suffit de résoudre un système linéaire. Combien positions suivantes ?
d'équations a-t-il, et combien d'inconnues?
a. i\1u+ i\zv + i\3w = 0, avec i\1 = 1, i\2 = 0,
implique que u, v, w sont liés.
Test 15.11.
b. i\1u + i\zv + i\3w = 0 avec i\1 = i\2 = i\3
Les vecteurs (1, 2, 5), (-1, 4, 3) sont-ils coli- implique que u, v, w sont liés.
néaires dans 1K3 ?
c. i\1u + i\zv + i\3w = 0 avec i\1 = i\2 = i\3
implique que u, v, w sont libres.
Test 15.12.
Test 15.15.
Les vecteurs (1,2,0,0),(3,6, 15,0),(0,0,3,2)
sont-ils coplanaires dans JK:4 ? Soient u, v, w dans E. Que pensez-vous des pro-
positions suivantes ?
Test 15.13. a. u, v, w sont coplanaires si et seulement si u
Y a-t-il une différence entre « i\1, ... , i\n sont est combinaison linéaire de v, w.
tous non nuls » et « i\ 1, ... , i\n sont non tous b. Si u, v, w sont liés, alors il existe une infinité
nuls»? de relations de dépendance linéaire.

II.2. Enrichir une famille libre; Épurer une famille génératrice

Le but de cette partie est d'expliquer comment trouver une famille génératrice aussi petite que
possible. À cette fin, en partant d'une famille génératrice donnée, il est nécessaire de savoir
discriminer les générateurs «superflus», c'est-à-dire ceux qui peuvent être supprimés sans
diminuer le sous-espace vectoriel engendré. Inversement, en partant d'une famille libre donnée,
nous pouvons nous demander comment «enrichir» cette famille, c'est-à-dire l'augmenter de
vecteurs supplémentaires sans que la famille obtenue ne devienne liée. Le lemme suivant
répond à ces questions et sera le pivot de beaucoup de nos démonstrations d'algèbre linéaire.

Lemme 15.15. Soientv1, . •• ,vp des veèteurs deKn et k-E {1,u .,v} un indice fixé.
1) Remplacer un générateur.
Soil u = !:.f=1 Ajv; une combi1W.ison linéaire twec Àk ::/- O.
Alors vect {v1, ... , Vp) = vect (v1, ••• ; Vic-1, u, Vtc+tt ••• , v..),
2) Additionner à un générateur une combinaison linéaire des autres2 •
Pour tout· (À1, ••• , fic, ... ,Àp) E ](fP-1
vect {vi, ... , Vp) = vect (v1, ••• , V1c-t, '1k.+ Lj#k ;\Jv;, Vk+t, ••• , Vp),
3) Supprimer un générateur d'uue famille liée.
Supposons que [.f=t ÀjV; = 0 est une relation de dépendance linéaire, avec Àk # O.
Alors vect (v1, ... , Vp) = vect (v1, ••. 1 vi:, ... ,vp).
4) Enrichir un famille libre.
Supposons que (v1, ••. , vp} est libre et soit u E Kn\vect(v1, ... , vp}-
Alors la famille (u, Vt, •.• , Vp) est encore libre.
397

PREUVE.

1) Il s'agit de montrer l'égalité de deux parties de ocn. Montrons d'abord l'inclusion::>. Consi-
dérons une combinaison linéaire des vecteurs v 1, ... , vk-1, u, Vk+l, ... , Vp· Si nous remplaçons
le vecteur u par son écriture Lf=1 ÀjVj et que nous regroupons les termes, la combinaison
linéaire ainsi obtenue s'écrit aussi comme combinaison linéaire de vecteurs de V1, ... , Vp·
Montrons maintenant l'inclusion contraire C. Comme u = Lf=
1 ÀjVj et que ,\k =/. 0, nous
pouvons isoler vk en écrivant

Vk = ;k ( U - ~ ÀjVj) , (15.5)

Considérons une combinaison linéaire de vecteurs de v 1, ... , Vp, Si nous remplaçons le vecteur
vk par l'expression donnée par (15.5), alors la combinaison linéaire ainsi obtenue s'écrit aussi
comme combinaison linéaire de vecteurs V1, ... , Vk-1, u, Vk+l, ... , Vp,
2) est un cas particulier du cas 1) avec ,\k = 1.
3) est un cas particulier du cas 1) avec u = O. En effet,

4) Soit u E lKn \ vect (v 1, ... , vp) et supposons que ,\u + Lf=1 ÀjVj = O. Si,\=/. 0, alors

qui est donc combinaison linéaire des v 1, ... , Vp , contrairement à l'hypothèse. Ainsi, ,\ = 0
et il reste que Lf= 1 ÀjVj = O. Il en résulte que Àj = 0 pour tout j = 1, ... , p. La famille
(u, v 1, ... , vp) est donc bien libre. ■

Utilisons le lemme 15.15 pour montrer une inégalité importante : il ne peut y avoir plus
de vecteurs libres que de générateurs.

Prop~tîo~ l-~•J.&. ·soienfu.1., ... 'Ûq oons it.n; $(v1, ••. 1 Vp sont des véitè'llrs linéaire-
mènfltid€pendànfs i/,d,riJJ vei:f(Ü'.ÎJ. -'·; Uq}, f1Î()rs·1H, q'. · .

PREUVE. Posons F = vect(u 1, ... , Uq), Supposons par l'absurde que p > q. L'idée de la
preuve consiste à remplacer, les uns après les autres, les générateurs U1, ... , Uq de F par les
vecteurs V1, V2 ... , Vq.
Étape 1. Écrivons v 1 = L~i CX-jUj, avec au moins un des CX-j non nul (car v 1 =/. 0). Quitte à
renuméroter les générateurs, nous pouvons supposer que <X1 =/. O. En vertu du lemme 15.15,
remplaçons u 1 par v 1 . Nous obtenons ainsi une famille génératrice (v1, u2, ... , Uq) de F.
Étape 2. Écrivons v 2 = j3 1v1 + L~z /3jUj. Au moins un des coefficients l3i, j ~ 2 est
non nul, car Vz n'est pas combinaison linéaire de V1. Quitte à rénuméroter Uz, ... , Uq, nous
pouvons supposer que 13 2 =/. 0 et remplacer u 2 par v 2 . Ainsi, (v 1, Vz, u 3 , ••• , uq) est une famille
génératrice de F.

2 La notation Àk est très commode pour indiquer la suppression du coefficient Àk dans une liste de nombres. Au-
trement dit, (À1, ...,4, ... ,
Àp) = (À1, ... ,Àk-1,Àk+l, ... ,Àp), Le chapeau - est en quelque sorte le symbole
mathématique du Tarnhelm wagnérien !
398

Itérons le procédé. Après q étapes, nous obtenons la famille (v 1, ... , Vq) qui est encore gé-
nératrice de F. En particulier, le vecteur Vq+l est combinaison linéaire des vecteurs v 1, ... , Vq,
ce qui montre que la famille (v1, ... , Vq, Vq+l) est liée. C'est une contradiction. On a donc
p ~ q. ■

Test 15.16. alors vect (v1, ... , vµ) =


Soient VJ, ••• , Vµ E Kn et À 1, ..• , Àµ E K. Que vect (v1, ... ,Yk, ... ,Vf, ... ,vµ).
pensez-vous des assertions suivantes? b. Si (v1, ... , vµ) est une famille libre et si u, u'
a. Si .L)=l ÀjVj = 0, avec Àk i= 0 et s'il existe sont deux vecteurs dans Kn \ vect (v1, ... , vµ)
1 ( k < i ( n tels que Àk i= 0 et Àf i- 0, alors la famille (u, u', v1, ... , vµ) est libre.

Il.3. Bases
Nous venons de présenter deux procédés, l'un pour enrichir une famille libre, l'autre pour
épurer une famille génératrice de tous ses éléments superflus. Dans cette partie, nous étudions
les familles obtenues en poussant ces deux procédés à leur maximum. Il est remarquable que
l'on obtienne dans les deux cas le même type de famille.

Proposition-définition 15.17. . .· . . . . . .
Soit F c lKn u'n sous-espace vectoriel. Une base de
f est une famûle (b1, ... , b 11) de vecteurs
dans F qui vérifie les deux propriétés équivalentes suivantes : ·
1) la famille (b1, ..• , b11 ) est libre et génératrice de f;
2) tout vecteur de F s'écrit de manière unique comme comtrinaison linêaire desb1, ... , b 9 .
On convient que la famille vide i2J est ùné base de l'éspa'ce ntil f '= {O};

PREUVE.
1) =} 2). Soit u E F. Comme b 1, ... , bv sont des générateurs de F il existe À1 , ..• , Àn tels que
u = L.J=l Àjbi. Pour montrer l'unicité des coefficients Àj, on prend une autre combinaison
linéaire u = L.J=l ~bi. Alors I'.f=1(Àj-µj)bi = 0 et par liberté on obtient Àj- µi = 0 pour
tout j = 1, ... , p.
2) =} 1). D'après l'hypothèse on sait déjà que (b 1 , ... , bµ) est génératrice de F. Pour la liberté
on suppose L.J=l Àjbi = 0. Le vecteur nul s'écrit de manière unique comme combinaison
linéaire des b1, ... , bv, donc Àj = 0 pour tout j = 1, ... , p. ■

11.3.1. Base canonique de ocn

Dans le cas où F = ocn, il existe une base privilégiée. Considérons en effet les n-uplets

e1 =(1,0,0, ... ,0),


e2 = (0, 1,0, ... ,0),
(15.6)
en= (0,0, ... ,0, 1).

Il est immédiat que pour tout (x 1, ... , Xn) dans ocn, on a


n
(x1, .. ,,Xn) = .L_Xkek,
k=l
399

Cela montre d'une part que tout vecteur de ocn s'écrit comme combinaison linéaire des
e 1, ... , en, et d'autre part que cette écriture est unique (car les coefficients de la combinaison
linéaire sont précisément les composantes du n-uplet). Donc (e1, ... , en) est une base de ocn.
On l'appelle la base canonique ou la base naturelle de ocn.

Règle :,.5.18. . .
Toµte f<tmil.le libre dans Kn contient a'll plus n vecteurs.
Toutè famîlte gé1iératriœ de K_n possède au moins n vecteurs.

PREUVE. La proposition 15.16 permet de comparer la taille de la famille avec celle de la


base canonique, vue comme famille génératrice dans le premier cas, et vue comme famille libre
dans le second cas. ■

II.3.2. Existence d'une base. Dimension

Lorsque Fest un sous-espace vectoriel strictement inclus dans ocn, l'existence d'une base est
moins évidente.De plus, même si une telle base sur F est pratique pour ramener des calculs
sur des vecteurs à des calculs en coordonnées sur des scalaires, il n'existe pas, en général, de
base privilégiée, de sorte qu'il n'y a pas lieu d'identifier F à un espace canonique.
Et pourtant, il est bien évident que la distinction entre la structure algébrique d'un espace
canonique et celle d'un sous-espace est artificielle : dans les deux cas, tout repose sur les
mêmes règles 15.2. Au chapitre 17, nous étendrons la définition des espaces vectoriels pour
pouvoir traiter les espaces vectoriels et les sous-espaces vectoriels de la même façon.
Il est à noter qu'ici encore, le fait de travailler sur un corps est essentiel. La proposition
qui suit n'a pas d'équivalent en général pour les modules.

Proposition. 15.19.. (Complêtiott en une base, extraction d'une base)


Soit F C ocn un sous•espace vectoriel et soit (v1, •.• ,v~) une famille de vecteurs de F.
1) Si {vr, .. /;V:m} èst libre,. on peut la compléter en 1tne base de f, c'est-à-dire qu'il e:dste
Vm+h• •.• ,vv dans ftels que (v1, ..• , Vp) spit une. base de E .
2) $i (VJ,,. ~ , VmJ est génératrice de F, on peut en extraî~ une base de F, c'est-à-dire qu'il
les
emste entiers 1 ~ h < h <... < j11 ~ m tels que (vh ,.... , v,v} soit une base de F.

PREUVE.

1) L'idée de la preuve est d'agrandir la famille libre (v1, ... , Vm) en une famille libre maximale.
Si F = vect (v1, ... , Vm) alors la famille est génératrice et libre, donc c'est une base de F. Dans
le cas contraire, on a vect (v 1 , ... , Vm) ~ F et on choisit un vecteur Vm+l E F\ vect (v 1 , •.. , Vm).
D'après la règle 15.15, la famille augmentée (v 1 , ... , Vm+il est libre. Si elle est génératrice de
F, alors c'est une base de F. Sinon, on itère le procédé jusqu'à ce que ce ne soit plus possible,
ce qui finit toujours par arriver car d'après la règle 15.18, une famille libre de Kn ne peut
contenir plus de n vecteurs libres. Cela signifie qu'à une certaine étape, on atteint l'égalité
F = vect (v1, ... , vp) , ce qui donne la base (v 1, ... , vp) de F.

2) L'idée de la preuve est d'extraire de la famille génératrice (v1, ... , Vml de F une famille
génératrice m_inimale. Si (v 1 , ••• , vml est libre, alors c'est une base de F. Sinon, il existe
une relation de dépendance linéaire et la règle 15.15 permet de supprimer un vecteur de
400

(v1, ... , Vml pour obtenir une famille encore génératrice de F. On itère le procédé tant que
possible, c'est-à-dire tant que la famille obtenue n'est pas libre, ce qui ne peut durer que
pendant au plus m étapes puisque la famille vide est libre. Ainsi le procédé finit par s'arrêter.
On obtient alors une famille libre et génératrice de F, c'est-à-dire une base de F.

- Théorètne;15.20. . ·. . <
< ;. , ;\ , . ;° •. >,
Tout s~-espace veetorîelf CKn possidéurieliâse {b1, ... ,b;}. ..•· ..· . ·• .·
Deux bases de f contiennent toujours le méme nombre. de vecteurs; appeltJa dimension de f
et noté dîmF. · · ·
PREUVE.
► Existence d'une base : il suffit de compléter la famille vide en une base.
► Cardinal des bases : soient (b 1, ... , hp) et (b\, ... , b~) deux bases de F. Alors b 1, ... , bp
sont dans vect (b;, ... , b~) et la proposition 15.16 montre que p ~ q. L'inégalité contraire
q ~ p s'obtient en échangeant les rôles de p et q. ■

Tirons deux conséquences de ce théorème.


o La base naturelle de ocn contient n vecteurs. Ainsi nous obtenons que Kn est de dimension
n, ce qui est heureusement conforme à la terminologie employée jusqu'ici.
o Tout sous-espace vectoriel de ocn est de la forme vect(v 1, ... , vp) avec vi E ocn et p ~ n.

La dimension correspond au nombre de paramètres nécessaires pour décrire tout élément


de l'espace. Par exemple, si F = vect(v 1, .. ,,vp), où (v 1, ... ,vp) est une famille libre (donc
une base de F), alors tout élément de u E F s'écrit sous la forme u = Lj=i Àïvi. C'est-à-dire
que p paramètres, à savoir les coefficients Àj , sont nécessaires et suffisants pour décrire un
élément de F.
Un sous-espace vectoriel de ocn de dimension 1 est appelé une droite, un sous-espace
vectoriel de ocn de dimension 2 est appelé un plan.

1)·. toute Jam.ïlte.·généràtriœ~F~~~iâum~11·'~.rt}·.•··.· .


2} wtdé famille yë~triée âê fi?lê;tf1kitè'tP ~ ~~air.;
3) toute fartiîtle liÎirt ,,ik·f possêtl~ ôti pl;; p ùèi:t~'drs; ;•.·.
4) toute famille libre d~ns f .• de p vecteurs ~t une base. der.
PREUVE.
Ce sont des conséquences immédiates du théorème 15.20 et de la proposition 15.16. ■

Propôsiîfon l5.22. Soient f et G ~~ ·sÔt4St~~tfecto'l'iet~. de ~, ;On 8uppase. que


~ <Uinf. De r,lûs, difri:G,;,;, dùnF si êt seülément: si G ~ F:'
G c F. Alors diinG . .
PREUVE. Soit m = dimG et p = dimF. Soit (b 1, ... , bml une base de G. C'est aussi une
famille libre dans F. Le point 3) de la proposition 15.21 montre alors que m ~ p. Si de plus
m = p, alors on déduit du point 4) de la proposition 15.21 que (b1, ... , bml est une base de
F, d'où G = F. ■
401

EXEMPLE 15.23. Comme nous l'avons vu dans l'exemple 15.12, la famille

((1,2,3), (3, 1,2), (2,3, 1))

est libre dans JR 3. Or la dimension de JR 3 est 3, donc c'est une base de JR 3.


4
Revenons aux sous-espaces vectoriels. Considérons par exemple le sous-espace F de JK
défini par le système

{ :: : g_
Les vecteurs e 3 = (O, 0, 1, O) et e4 = (0, 0, 0, 1) sont des générateurs de F et sont libres. Donc
(e 3, e4 ) est une base de F qu'on pourrait appeler base naturelle. Mais le cas est rare où une
base semble réellement plus naturelle parmi toutes les autres.
EXEMPLE 15.24. Soit

Nous allons exhiber deux bases de F.


◊ Soit x = (x 1, x 2, x 3) un vecteur arbitraire de F. Alors X1 = 2x2 - 4x3, d'où

où on a posé b 1 = (2, 1, 0) et b 2 = (-4, 0, 1 ). Ainsi tout vecteur de F s'écrit comme


combinaison linéaire des vecteurs b 1 et bz. On voit tout de suite que ces deux vecteurs sont
linéairement indépendants, par conséquent (b1, b 2) est une base de F.
o De même, on peut démontrer que tout vecteur x = (x 1, x2, x 3) de F s'écrit sous la forme

_ x2 - x3 b' 4x3 - Xz b'


X- 1+ 2•
3 3
où on a posé b\ = (4, 4, 1) et b 2= (-2, 1, 1). Comme b\ et b 2sont linéairement indépen-
dants, (b\, b 2) est une base de F.
Donc le sous-espace vectoriel F ne possède pas de base naturelle; parmi (1:/ 1, b 2), (b\, b 2)
et toutes les autres bases possibles de F, il n'y en a pas une qui soit plus « belle » ou
« naturelle » que les autres.

Définition 15.25. Le rang d'une famille (v 1 , ••• , vvl de vecteurs de ocn est la dimension
de l'espace engendré par cette famille, soit encore rg (v 1 , ••• , Vv) = dim vect(v 1 , ••• , vvl.
EXEMPLE 15.26. Dans l'exemple 15.12, nous avons vu que la famille

(v1,Vz,V3) = ((1,2,3),(3, 1,2),(-3,4,5))


est liée. Donc rg (v 1, v2, v 3) < 3. D'autre part, les vecteurs V1 et Vz ne sont pas colinéaires,
donc rg (v1, V2, v3) > 1. Aussi rg (v1, Vz, V3) = 2.
Pour déterminer le rang d'une famille, il est pratique d'utiliser l'algorithme de Gauss que
nous donnerons plus loin, dans le chapitre sur les matrices. Pour le moment, bornons nous à
signaler la majoration évidente pour une famille de vecteurs de ocn,
rg (v 1 , •.• , vvl ~ min(p, n).
402

Test 15.17. comme combinaison linéaire de u, v, w.


Les vecteurs (-2,-1,0), (1,2,3), (4,5,6), Test 15.20.
(7, 8, 9) sont-ils liés?
Les vecteurs suivants constituent-ils une base
Test 15.18. de ocn7
Que pensez-vous de l'assertion suivante: « L'en- (1,0,0,0, ... ,0)
semble de solutions d'un système linéaire ho- (1, 1,0,0, ... ,0)
mogène avec n inconnues est de la forme
(1, 1, 1, 0, ... , 0)
vect (v1, ... , Vp) avec Vj E ocn. »?
Test 15.19.
Considérons les vecteurs u = (-1, 0, 7), v (1, 1, 1, 1, ... , 1).
(1,2,-3) et w=(l,4,1) deJR 3 .
a. Montrer que w = u + 2v.
b. Écrire w de deux manières différentes

III. EXEMPLE : L'ESPACE DES CARRÉS MAGIQUES


Un carré magique de type 3 x 3 est un carré de 9 réels
X11 X12 X13
(x11, X12, X13, X21, X22, X23, X31, X32, X33) dont les sommes
X21 X22 X23
de chaque ligne et de chaque colonne donnent le même
X31 X32 X33
nombre, appelé le caractère du carré.
Par exemple

1 0 -1 0 1 -1 0 0 0 0 0 0
0 0 0 , M2= 0 0 0 1 0-1 0 1 -1
-1 0 1 0 -1 1 -1 0 1 0 -1 1

sont des carrés magiques de caractère nul, alors que

1 0 0 4 2-8
li= 0 1 0 et A= -1 0 -1
0 0 1 -5 -4 7
sont des carrés magiques de caractères 1 et -2 respectivement.
Nous notons X l'ensemble des carrés magiques de type 3 x 3. Tout carré peut s'écire sur
une seul ligne (x11, X12, xn, X21, X22, X23, X31, X32, X33). Cela permet de considérer X comme
sous-ensemble de l'espace vectoriel canonique OC 9 . En effet, soient (i\, i\') E JR 2 et Met M' des
carrés magiques de caractères respectifs E., et E.,'. Alors on voit facilement que la combinaison
linéaire i\M + i\'M' est encore un carré magique et que son caractère est i\E., + i\'E.,'. Nous en
déduisons deux conséquences :
- X est un sous-espace vectoriel de OC 9 .
- Toute combinaison linéaire de deux carrés magiques à caractère nul est encore un carré
magique à caractère nul. Ainsi l'ensemble Xo des carrés magiques à caractère nul est
aussi un sous-espace vectoriel de OC 9 . Autement dit Xo C XC ]1( 9 .
Quelle est la dimension de X? On devine que la réponse est 5. En effet, pour construire
une carré magique, fixons arbitrairement son caractère (1 degré de liberté) et les quatre
composantes du sous-carré nord-ouest (4 degrés de liberté) - pour les cinq autres composantes,
il n'y a alors plus le choix. Formalisons cette intuition.
403

Proposition 15.2'T. L 'espacè .Jt:- de ça:rtés mtJ,fJiifues tk. type 3 x 3 ·e11fde dîme~on 5.
Les carrés magîqtJ,es M1, . .. , M.i, l[ ci-dessus forme_nt une base de .}((.

PREUVE. Nous procédons en plusieurs étapes.


► On vérifie facilement que M 1, ... , M 4 sont de caractère nul. Ce sont en fait des générateurs
de fo. En effet soit
X11 X12 X13
Mo= X21 X22 X23
X31 X32 X33
un carré magique quelconque de Xo . Posons

Pour prouver que M 0 est une combinaison linéaire de M 1 , ... , M4 , il suffit de montrer que
M = 0. Notons Yrk les coefficients de M. Il est immédiat que les quatre composantes nord-
ouest y 11 , Y12, y 21 , Y22 de M sont nulles. Pour la composante nord-est YB, un calcul immédiat
donne

y 13 =x13-x 11 x (-1}-x 12 x (-l)-x2 1 xO-x22xO=x11+x12+x13 =0.

Un calcul analogue montre que les autres composantes de M sont également nulles - seul le
calcul pour la composante sud-est y33 est légèrement différent :

Ainsi on a démontré que Xo = vect ( M 1, ... , M4).


4
► Montrons que (M1, ... , M4) est libre. Soit (µ1, ... , µ4) E lî tel que L1=l µiMi = O. En
raisonnant par exemple sur les quatre composantes nord-ouest, nous obtenons tout de suite
que µ1 = · · · = µ 4 = O. Ainsi (Mi, ... , M4) est une base de Xo.
► Comme ][ est de caractère 1, il n'est pas dans Xo. D'après le lemme 15.15, la famille
(IT, M 1, M2, M3, M4) est donc libre.
► Il reste à prouver que {IT, M 1 , ••• , M 4 ) est une famille génératrice de X. Soit M un carré
magique arbitraire. Notons E., son caractère et écrivons M = E.,IT + (M - E.,IT). Comme M - E.,IT
est dans Xo, il se décompose en une combinaison linéaire des carrés M 1 , ••• , M 4 . Aussi M
peut-il bien s'écrire comme une combinaison linéaire des carrés IT, M 1 , .•. , M 4 . ■

Corôllaîre 15.33. Sint-à. é Il, Al~ ·lu carrés magiqiû!s de tJm'àitèffe U zSf!ntles cfJ'r'l'é!I de
la Jarm.e ·
••• •• 4.
UT L ~Mk,
C

k=l

Test 15.21. mat 2 x 2. Exhiber une base de cet espace.


Quelle est la dimension de Xo ? Test 15.23.
Trouver un carré magique de caractère 4 et
Test 15.22. dont toutes les composantes sont des entiers
Considérer l'espace des carrés magiques de for- non nuls.
404

IV. EXERCICES

15.1. 15.5.

Déterminez la dimension du sous-espace vecto- On pose u = (1,-1, 1) , v = (2, 1,-1) et


riel de R 3 engendré par les vecteurs w = (-1, 3, 1). Montrer que pour tout vecteur
1. U=(l,2,0), V=(-1,1,1);
a= (x,11,z) E R 3 il existe un unique triplet
(a., 13, y) E R 3 tel que
2. u=(l,0,-2), v=(0,2,1), w=(-1,4,2);
3. u=(l,1,-2), v=(l,3,2), w=(-2,0,1), a = a.u + j3v + yw .
z=(l,-1,0).
Déterminer ( a., i3, y) en fonction de (x, 11, z) .
Comment appelle-t-on la famille définie par
15.2. PlJ = (u,v,w)?

Soit 15.6.

Déterminez tous lest E [O, 12[ tels que les vec-


teurs
1. Montrez que F est un sous-espace vectoriel
de lK4 .
2. Déterminez la dimension de F.
Vt = (sin(2nt), cos(2nt)), Ut= (sin 7, 7)
cos

sont liés. ( Indication : regardez un horloge -0

15.3. 15.7.

Soient u, v, w trois vecteurs de ocn et a., j3, y Lesquels des ensembles suivants sont des sous-
des scalaires tels que a.j3 =/= 0 et espaces vectoriels de R 3 ?
1. L'ensemble E des (x,11,z) E R 3 tels que
a.u + j3v + yw = O.
x2 + 112 + z2 = 0;
Prouver que vect (u, w) = vect (v, w).
2. L'ensemble F des (x, 11,z) E R 3 tels que
15.4.
2 2 2
x + 11 + z = -2(x11 + xz + 11z);
Expliquez pourquoi les ensembles suivants sont
des sous-espaces vectoriels de R 3 et déterminez 3. L'ensemble G des triplets de la forme
leurs dimensions.
(µ,À+ µ,À 2 - µ), où (À,µ) E R 2 ;
1. E =vect((l,2,3),(3,2, 1),(1, 1, 1));
2. F={(x,11,z) lx=11}; 4. L'ensemble H des triplets de la forme
3. G ={(x,11,z) 1 x+311 =11+z=2x-z=0};
4. H = {(x, 11, z)lx+311 = 11+z = x+211-z = O};
5. l={(x,11,z)lx+311=11+z=2x -z}. Reprendre l'exercice en remplaçant R par <C.
Chapitre 16
CALCUL MATRICIEL

NE matrice se présente sous la forme d'un tableau de nombres, mais peut donner lieu

U à plusieurs interprétations selon ce que l'on veut en faire. Cela ne peut être qu'un
simple tableau de nombres, sans structure, comme dans le cas des carrés magiques du
chapitre précédent, ou bien on peut la voir comme une liste de vecteurs colonnes ou une liste
de vecteurs lignes. Elle peut aussi coder les coefficients d'un système linéaire. Enfin et sur-
tout, nous verrons qu'elle peut modéliser toute application linéaire entre espaces vectoriels de
dimension finie. Cette dernière interprétation, fondamentale, explique pourquoi il est possible
de munir l'espace des matrices carrées de taille donnée d'une structure naturelle d'algèbre non
commutative. Aussi consacrerons-nous la majeure partie de ce chapitre à étudier le produit
de deux matrices. Comme dans le premier chapitre d'algèbre linéaire, nous insisterons ici sur
les aspects calculatoires.

1. MATRICES

Nous introduisons dans cette partie l'objet principal de ce chapitre d'abord comme simple
tableau de nombres. Puis, en l'interprétant comme représentant d'une application linéaire,
nous définirons le produit de deux matrices de formats adaptés.

I.1. L'espace vectoriel Atmn(lK)


Définition 16.1. Une matrice de format m x n à coefficients dans 1K est une famille de
nombres aek E 1K avec 1 ,:;; C,:;; m et 1 ::;; k ::;; n. Elle se dispose sous la forme d'un rectangle

A= (aekli,:;e,:;m =
1,:;k,:;n

L'indice C est appelé l'indice ligne, l'indice k est appelé l'indice colonne1 . On note Amn(lK)
l'ensemble des matrices m x n à coefficients dans 1K. Sim= n on note An(lK) = Ann(lK)
et on parle de matrices carrées d'ordre n.

Par exemple, les carrés magiques sont des matrices carrées d'ordre 3.
- Pour alléger les notations nous avons écrit aek à la place de O(f,k) pour tout indice
(C, k) E {1, ... , m} x {1, ... , n}.
On peut toujours insérer une virgule lorsqu'une confusion est à craindre. On distinguera
par exemple l'ensemble A2,4(1K) des matrices 2 x 4 et l'ensemble A24(lK) des matrices
carrées d'ordre 24.

1
Souvent, mais pas toujours, nous choisirons de noter f l'indice des lignes et k l'indice des « kolonnes ».
406

- Nous notons simplement A= (aekl lorsque le contexte ne laisse aucune ambiguïté sur
l'ensemble décrit par les indices.

Lignes ou colonnes. Une matrice 1 x n est une ligne et une matrice n x 1 est une colonne.
Comme les deux sont des n-uplets nous identifions l'espace canonique ocn à At'1n(lK) ou encore
à Ani (JK), c'est-à-dire que nous écrivons les n-uplets de ocn en ligne ou en colonne, selon nos
besoins. On parle alors de vecteur ligne ou de vecteur colonne.

Identification avec ocmn. Nous pouvons écrire les coefficients d'une matrice m x n en une
seule ligne, c'est-à-dire en un mn-uplet. Pour cela, il suffit de choisir un ordre de lecture des
coefficients, par exemple ligne après ligne

(a11, ... ,UJn,U21,--•,u2n, ...... ,UmJ, ... ,Umnl-

Une fois un tel ordre arbitrairement fixé, At'mn(lK) s'identifie à ocmn_ Ainsi, les opérations
d'addition et de multiplication par un scalaire dans ocmn induisent des opérations analogues
sur At'mn(lK) : nous avons défini l'addition de deux matrices m x net la multiplication d'une
matrice par un nombre dans JK. Évidemment, ces définitions ne dépendent pas du choix de
l'ordre de lecture des coefficients qui a servi à réaliser l'identification. En effet, il est facile
de vérifier que ces opérations se définissent directement sur les matrices par les formules
suivantes:

U11 + b11 U12 + b12 • .. U]n + b1n


U11 a12 ... U1nJ (b11 b12 ... b1nJ
U21 U22 ... Uzn b21 b22 ... b2n U21 + b21 U22 + b22 ... Uzn + b2n

(
a~1 a~ ... U~n + b~1 b~ ... b~n

ÀU11 ÀU12 ... ÀUJnl


ÀU21 ÀU22 ... ÀUzn
. . .
.. .. ..
(
ÀUmJ ÀUm2 ... ÀUmn

De même, les notions de famille libre, famille génératrice et de base sont valables aussi
pour les familles de matrices. En particulier, At'mn(lK) possède une base canonique : elle est
constituée des matrices Eek, 1 :::;; f :::;; m, 1 :::;; k :::;; n, où Eek est la matrice dont tous les
coefficients sont nuls sauf celui d'indice (!, k) qui vaut 1. Par exemple, dans At'24 (JK),

0100) 0000)
E12 = ( 0000 ' Ez4 = (000 1 .

Autrement dit, les matrices de la base canonique de At'mn(lK) sont de la forme

1 sia=j3,
.Eek = (ô(t,k).(p,qJli,;;v,;;m avec le symbole de Kronecker ôcx,/3 = .
1,S:q,S:n { O SI <X=f j3
407

Toute matrice A = (Ufkl E Atmn(lK.) se décompose alors d'une unique façon sous la forme

L.
A =
1,;;f,;;m
1,;;k,;;n
UfkEfk·

1
Test 16.1. Test 16.3. i
ü
À quel espace appartient la matrice Exprimer cô
y'3 13) 7
13) +2! (-2260)
......

a
( i+2 0 1 .
Test 16.2.
(01
Quelle est la dimension de AlmnOK)? sous la forme d'une matrice.

1.2. Multiplication matricielle. L'anneau Âln(]K)


I.2.1. Multiplication d'une matrice par un vecteur colonne

Dans cette partie, nous allons voir comment une matrice peut s'interpréter comme une appli-
cation entre espaces canoniques.
Définition 16.2.
Le produit d'une matrice A= (akd E Atmn(lK.) et d'un vecteurx E ocn est défini par:

(16.1)

Le produit Ax est donc un vecteur dans ocm.


Explicitons quelques cas particuliers pour mieux appréhender cette définition.
- Pour m = n = 1, le produit s'écrit sous la forme (u 1 )(x 1 ) = a 1x 1 , ce qui peut se voir
comme l'expression d'une règle de trois, avec x 1 pour variable et a 1 E 1K. pour coefficient
de proportionnalité.
- Pour m = 1 et n > 1 quelconque, on obtient le produit d'un vecteur ligne par un vecteur

m~
colonne, ce qui donne un élément de JK..

(a,, .. ,,an) a,x, + +a.x.

- Pour met n quelconques, la k-ième composante de Ax, avec


1 :::;; k:::;; m, peut se calculer comme produit de la k-ième ligne
de A par la colonne x.

Iltègle 16:3.: . Soient A E: .A'{Khnn etx == {X1Hs;:s;n E K_n. Alors


·.A=(C1,C2,,.,, Cn) =>, Ax =x1C1 +x2C2 + ·· · +xnCn,
en écrivant li matrice A comme le tPti,plet de ses éolonnes cl, C2 , ••• , Cn: .
408

PREUVE. Cela se lit immédiatement sur la formule (16.1). ■

EXEMPLE 16.4. Produit d'une matrice 3 x 4 par un vecteur de JK4 .

Cl)
(1; ~ 6) (-i) = (1) +
2 -4 0 -7
-1
-2
2
3 ( ;)
-4
( 6) ( ~)
-7 -9

~
o..
Notation. Pour toute matrice A E Atmn(lK), nous noterons  : ocn -+ ocm l'application
définie par Â(x) = Ax.

La propriété qui suit exprime le fait que l'application A préserve les structures d'espaces
vectoriels de ocn et de ocm.
Règle ·16.f.i. Soit A E .Af(K)mn. :Ptn1,r tbûs t;y dàiÎil~:~))êt"îkiif !Qtd XÊ{ Xi·•.
Â{x+vr=,Â(x)+Âfy) .. et.. Âf'-if==iÂ{xJ.·
PREUVE. Utilisons la règle 16.3.
n n n
A(x+y} = L_(Xk +Yk)Ck = L. xkCk + L_ YkCk = Ax+ Ay,
k=l k=l k=l
n n

EXEMPLE 16.6. Dans un pays démocratique imaginaire, trois partis tout aussi imaginaires
se partagent les suffrages des électeurs : les partis bleu, rose et vert. 2 Convenons d'appeler
sympathisant d'un parti donné tout électeur ayant voté à la dernière élection pour le candidat
de ce parti. Nous l'appellerons bleu, rose ou vert selon sa couleur politique. Supposons que, à
chaque nouvelle élection, 80 % des bleus conservent leur couleur politique, que 8 % passent
aux verts et que 12 % passent aux roses. Pour les sympathisants roses, 70 % restent roses,
20 % deviennent verts et 10 % passent aux bleus. Enfin, pour les sympathisants verts, 60 %
restent verts, 25 % passent aux bleus et 15 % passent aux roses.
Question : si on note b, r et v la répartition (en pourcentages) des électeurs portant leur
sympathie pour les partis bleu, rose et vert respectivement, quelle sera la nouvelle répartition
B ,R et V à l'élection suivante?
Réponse : ► il est facile de vérifier que les données s'expriment par la formule suivante :

l (80 10 25)
avec A = 00 12 70 15 .
1
8 20 60

Combien donnerait un homme politique pour connaître l'évolution de la répartition de l'élec-


torat au bout den élections? Sous l'hypothèse hautement improbable que les chiffres donnés
ci-dessus ne varient pas, cela revient à calculer la composition ( Â) n = Â o • • • o Â.
n fois

1
Bien sûr, toute ressemblance avec un pays existant ne serait que pure coïncidence.
409

Or il apparaît que l'application ainsi obtenue s'écrit encore sous forme matricielle. On
montre en effet aisément par récurrence sur n qu'il existe une matrice An E .4l33 (JR) telle
que ( Â) n= An.
Peut-on calculer An directement à partir des coefficients de A? La réponse
est oui, c'est l'objet de la partie qui suit. li
ü
1.2.2. Produit de deux matrices cô
.....
Calcul préliminaire. ..d
ü
Si A = (uktl E AtmnOK) et B = (b;_j) E Atnp(][{), nous avons vu dans la partie précédente
qu'il leur correspond deux applications  : ][{n ----+ ][{m et B : ][{P ----+ ][{n_ Considérons alors
l'application composée  o B : ][{P----+ ][{m. Comme nous l'avons vu dans l'exemple 16.6, il est
naturel de se demander s'il existe une matrice C E Atmp(K) telle que ê = Â o B.

► Soit ( eili,s;j,s;p, ( fk)l,s;k,s;n et (gf) 1,s;f,s;m les bases canoniques de ][{P, !Kn et ][{m respectivement.
Alors, par définition des applications  et B, pour tout (x;_) E ][{P et tout (1Jj) E ][{n,
p
B ( ~ xiei
)
) =;
n p
~ bkix/k;
m n

f=l k=l

Calculons  o B. Nous avons successivement

(en posant 1Jk = L. bkixi)


i=l
m n

= ,L_ ,L_ Ufk1Jk9f


f=l k=l

= tt, (t, Ufk bkjXj) 9f

= t t, (t,
m p
Ufkbk) Xj9f

= ,L_ ,L_ CfjXj9f,


f=l i=l
n
avec Cfj = L. Ufkbkj pour f = 1, ... , met j = 1, ... , p.
k=l

En posant C = (Cfj), on a bien ê = Â o B, ce qui montre qu'il existe au moins une matrice
qui satisfait l'identité souhaitée.
► Inversement, si C = (C 1, ... , Cn), vue comme matrice de m-uplets écrits en colonne, est
une matrice quelconque telle que ê = Â o B, alors la règle 16.3 montre que pour 1 :,:; i:,:; p,
p

Âo B(eïl = ê(ed = L. Ô;_iCi = C;_


i=l
où Ô,j est le symbole de Kronecker qui vaut 1 pour i = j et O pour i 1- j. Ainsi l'image par
 o Ê de e, donne la i-ième colonne de la matrice C, ce qui démontre l'unicité cette dernière
matrice.
Définition du produit de deux matrices.
Proposition-définition 1~.'l.
Si A = (Ottç} est de type m X n e( si B =fbtcil est de t'fl1)e fi,. X p a!or~ le produit AB est la,
matrice (cq} de typem xv définie par · ·
n
Ctj ""' L ~At<bkj •
k=l

Pour tôut (A, B}.·e ;A'rttn'(KJ x .Artfl(K}; le pf'bd'Ûif A l'.f êst ·1\tntquê mahiée :élëftœnt de
.Anp(K} tel que:ÂB == Â'.o B.

Revenons sur la formule (16.2). Le coefficient Crj est le produit de la f-ième ligne de A par
la j-ième colonne de B, soit encore

EEj [Ill] ~1
A B AB

c,; ~ (a,., ... , am) (:~:) ~ a,.b,; +aub,i + +ambn;

Notons les matrices A et B par leurs lignes et leurs colonnes.

La définition 16.2 et la formule (16.2) entraînent alors facilement les deux identités

- (16.3)

Règle· 1&..8. . ..
Les cofonnes de AB sorit de$ co~btnaisons lirJéairea'des ?.t>to~nes fie A; Plt1S précisdment,. la
Hème colonne de AB est la eombinaison linéttiii 'des coloniJes de A. qui à.JtfJUr eoejftcients
les éléments de la j-ième. colonne de B :
• :n
hième colonne de AB = Aq ::; E b1qCtc,
b=l

Les li~es de AB sont ks comb.inaiso-ns linéaires <tes l~;~eD, ~l~~iment~t.(;ème


ligne de.A$ ~t)~. çombi~i$gn #néfiii:e des lignes <le B. qui a pourc@jjjcie!l,ts. ~. 4Jêm,en~.
delà f-ième ligne),eA : - . . .• . . . .. .. . . .
n
t-ième ligne de AB :;::: ltB = I:, atkl~.
~1
411

.\ttenti011 Le produit de deux matrices n'existe pas toujours


Le produit matriciel est défini seulement quand le nombre de colonnes de A est égal au
nombre de lignes de B. Le coefficient Crk de AB est alors égal au produit de la €-ième
ligne de A par la k-ième colonne de B.

EXEMPLE 16.9. Nous ne pouvons inverser l'ordre des deux matrices dans le produit

0 12) ( l l 22) (-1 324)


(
4 -1 0 ~ ~ ~ =
-; 11 1 8 4 .

Si les deux matrices sont carrées, le produit a encore un sens si on inverse l'ordre des
matrices, mais le résultat est différent en général : la multiplication n'est pas commutative.

Contrairement au calcul dans un corps, le produit de deux matrices non nulles peut donner
la matrice nulle. On appelle de telles matrices des diviseurs de zéro.

1EXEMPLE 16.11. G~) (~ n = (~ ~) ou (11) ( 3-1) = (00)


22 -3 1 00 .

Test 16.4. Test 16.6.


Calculer les produits suivants : Soient A E Atmn(K) et B E Atpq (K) telles que
AB= BA. Que peut-on déduire sur m, n, p, q?

A~G-m(J •=(~;r Test 16.7.

m, ~ m
Soit A E Atmn(K) et soit er le f-ième vecteur
de la base canonique de Km et e( le k-ième
C = (1,2,3] D (1,2,3]. vecteur de la base canonique de Kn. On note er
comme ligne et e( comme colonne. Calculer les
produits eeA et Ae(.
Test 16.5.
Test 16.8.
Que pensez-vous des affirmations suivantes?
Notons Erk les vecteurs de la base canonique de
a. L'espace engendré par les lignes de AB
Atn(K). Soit A E Atmn(K) et B E Atnm(K).
contient l'espace engendré par les colonnes de Calculer les produits AEek, EekB et ErkEpq .
A.
b. L'espace engendré par les lignes de B Test 16.9.
contient l'espace engendré par les lignes de AB. Pour multiplier deux matrices n x n combien
c. L'espace engendré par les colonnes de AB est de multiplications dans K doit-on effectuer? Et
le même que l'espace engendré par les colonnes combien d'opérations faut-il au total (additions
de B. et multiplications)?
412

1.2.3. Règles de calcul

Nous venons de définir une opération de multiplication sur les matrices. Comme toujours
quand on rajoute une structure algébrique sur un ensemble, il est intéressant d'en étudier la
compatibilité avec les structures déjà existantes, comme ici la structure d'espace vectoriel de
.4l1nnOK). Ceci sera particulièrement remarquable dans le cas où m = n, pour lequel nous
obtiendrons une structure d'algèbre. Nous commençons par introduire une notation pour le
futur élément neutre de cette algèbre.
Définition 16.12. La matrice identité d'ordre n est la matrice ITn = (ôekl E .4ln(OC). Tous
ses coefficients diagonaux sont égaux à 1 et tous les autres sont nuls.

Notation. Lorsqu'on laisse un vide dans une région d'une matrice, cela signifie que tous les
coefficients dans cette région sont nuls.
On vérifie facilement que la matrice identité joue bien le rôle d'un élément neutre dans la
multiplication matricielle.

Nous avons vu que le produit matriciel n'est pas en général commutatif, même quand cela
a un sens d'inverser l'ordre des matrices. Toutefois, la multiplication matricielle satisfait fort
heureusement les autres règles habituelles de calcul comme la distributivité et l'associativité.
Il faut seulement veiller à respecter l'ordre dans lequel les matrices sont multipliées.

Rêgle 16~14.
Pour A,À' dans .A'mn(K), B,l3 1
da'IUJ .4,w{K}, CE .A'pq{K} et AE K., on a
. J.lA{B +B') =,A1J+AB 1
; 3} >.(AB) - (M)B= A(}.B);
·2l (A+A')B=AB +A'B; 4) A{BC}=(AB)C.
D'après 3) et 4), il n'y a pas d'ambiguïté à écrire sans parenthèses les produits ÀAB et ABC.
PREUVE.
Les deux premières règles sont des conséquences faciles des règles 16.3 et 16.5. La règle 3)
découle immédiatement de la définition du produit matriciel. Seule la preuve de l'associativité
du produit matriciel, c'est-à-dire la règle 4) requiert quelques détails.
Par définition, la matrice A(BC) est l'unique matrice de .4i'Tnq(l[{) telle que A(BC)
 o Éè. Or, BC est l'unique matrice de .4tnq(OC) telle que Éè = Ê o ê. Il en résulte que

De manière analogue, (AB)C est l'unique matrice de .4i'Tnq(l[{) telle que

Or, la composition des applications est associative. Il en résulte que


413

Ainsi
ÂoBC=Â(Bel = (AB)C.
Il s'ensuit que A(BC) = (AB)C par unicité de la matrice représentant le produit  o BC. ■

Remarque. Au passage, notons que par une simple récurrence sur r, les règles 1) et 3)
montrent que pour A E Atmn (]K), B1 , ••• , Br dans Atnp (1K) et À1 , ..• , Àr dans IK, on a

(16.4)

Dans le cas où m = n, ces règles de calculs montrent que l'ensemble des matrices carrées
est muni d'une structure d'anneau. La démonstration se fait en vérifiant point par point les
axiomes d'un anneau. C'est un exercice facile laissé au lecteur.

Ptol)~tiqn 16.11). Eimstimble .4ltn{Kl des 1t1,(Jtri,cei; eiJ,'f!fées d~ordn n, muni de 1'additîon
et clé la multîpliëutioomatrtcîêllësrtst'un an~u; Son tlêmerit n ~ pour la multîplic4tion
esNa miÎ~ 1,,::: ;. ··. · " · · · · ·· · · <

Terminons cette partie par une remarque. Nous avons insisté sur l'idée que la définition
du produit matriciel est induite de la composition des applications correspondantes entre
espaces canoniques. En retour, on peut se demander quelle est la structure de l'ensemble des
applications de ocn dans ocm qui sont de la forme Â, avec A E Atmn(IK), muni de l'addition
et de la multiplication par les scalaires usuelles.
Nous étudierons cet ensemble, notamment dans le cas m = n, ainsi que la correspondance
A H Â, au chapitre 17. Pour le moment, nous nous bornons à mentionner quelques propriétés
immédiates ou qui se déduisent clairement des règles que nous venons d'énoncer.

~~16.16' . . ···•. ·..• ............· . .. .· .·. . .


Po'll/f' A, A 4 doot.4f~tKj;'B;8' dans ;K,-ptK), C E .ApJJKl et A Énl:, .oo a
-_r,..._ ~ 1- - .;~.J, -"_{- .-, - - - ,,,,.,. -, ?-..::--_ ' , ' -> ;,..,.:..:..-..,, -, -- ~
· 1) A o lB t-R'}t A<> B.+ A ofW; -4){?v\fi,;;: M ;
2){Â+JVloBiA<>B+A1~B· "1>JÂ,oâ=AB;
·a1~;;::Î4icii/' . "'ri)'Â+A':fi:··~r:·

Test 16.10. a. Montrez que si A est un corps, alors les


seules involutions sont ± 1.
Soient A E Amn(K), ei le f-ième vecteur, noté
en ligne, de la base canonique de Km et e( b. Montrez que dans .A2(Kl, il existe d'autres
le k-ième vecteur, noté en colonne, de la base involutions.
canonique de Kn. Calculer le produit eiAe(.
Test 16.12.
Test 16.11. Démontrer l'associativité de la multiplication
Soit A un anneau. On appelle involution un matricielle en comparant les coefficients de
élément x E A tel que x2 = 1A· A(BC) et de (AB)C par un calcul direct.
414

Il. RANG D'UNE MATRICE

II.1. Le rang des lignes est égal au rang des colonnes


Les lignes d'une matrice de format m x n engendrent un sous-espace vectoriel de ocn et,
de même, ses colonnes engendrent un sous-espace vectoriel de ocm. Ces deux sous-espaces
vectoriels ne sont pas comparables si m -/- n car ils sont contenus dans deux espaces disjoints.
Nous allons démontrer maintenant une chose étonnante : ils ont la même dimension.
Pr9positîô11-dêtlnition 16.111
Soit A E .Km.n(Kl. une. matrice. A~s •lé.rang ae·. ses t~etteurs lignes· est l,gàl au r<J/1'/,g ·Je ses
vecteurs colonnes.· On appille cè nombre le rain.g de A, noté rg A. On a rg A ~ min(m1n );
PREUVE. Notons l 1, ... , lm les lignes de A et C 1, ... , Cn ses colonnes de sorte que

D'après le théorème 15.20, il existe une base (b 1, ... , bp) de vect (l 1, ... , lm)- Les lignes sont
des combinaisons linéaires des vecteurs de cette base. Ainsi
l1 i\11b1 + i\12b2 + · · · + i\1pbp,
l2 i\21 b1 + i\22b2 + · · · + i\2pbp,
(16.5)
{
lm= Àm1b1 + i\m2b2 + · · · + Àmpbp.
Chacune de ces équations est une égalité entre n-uplets, que l'on peut donc écrire composante
par composante. Notons

b1 = (1311, 1312,. • •, 131n), b2 = (1321, 1322, ... , 13zn), ... , bp = (l3p1, 13p2, ... , 13pn).
La première composante de chaque équation du système (16.5) donne

C1 =1311 (~;:) +1321 (~~) +···+13p1 (~::)

Àml i\m2 Àmp


De même, pour k = 1, ... , n, la k-ième composante du système donne

ck = 131k (~;:) + 132k (~~) + · · · + 13pk'(~~) ·


Àm1 i\m2 Àmp
Par conséquent, les colonnes de A sont des combinaisons linéaires des p vecteurs
415

Donc le rang des colonnes de A est majoré par p, c'est-à-dire par le rang des lignes. Que
le rang des lignes soit majoré par le rang des colonnes se démontre de manière analogue,
d'où l'égalité de ces deux rangs. La majoration rg A~ min(m, n) est alors une conséquence
immédiate du fait que les lignes sont dans ocn et que les colonnes sont dans ocm. ■

Pour mieux apprécier ce qu'il y a d'étonnant dans ce résultat considérons l'exemple suivant.

12 3)
EXEMPLE 16.18. Considérons la matrice carrée A=
(32 46 51 E ..4t3(lR).

Nous remarquons toute de suite que la deuxième colonne est un multiple de la première.
Donc il y a une relation de dépendance linéaire entre les colonnes. Ainsi rg A < 3. Les
deux dernières colonnes étant non colinéaires, on a rg A > 1. Ainsi rg (A) = 2. D'après la
proposition 16.17, il existe alors aussi une relation de dépendance linéaire entre les lignes et
cela ne saute pas aux yeux! Ni les colonnes ni les lignes de A ne forment une base de JR 3 .

Remarque.
1) Choisissons une matrice 3 x 6 avec des coefficients pris au hasard. Quel est son rang ?
Réponse : son rang est presque sûrement 3. En effet, les trois vecteurs lignes sont pris au
hasard dans l'espace vectoriel IK 6, de dimension 6. Aussi seront-ils libres avec une probabilité
de 1.
2) En général, une matrice A choisie au hasard dans ..4tnm(IK) est de rang maximal, c'est-à-
dire rgA = min(m, n).
3) Si un professeur cherche, par exemple pour « inventer » un exercice, n vecteurs liés dans
ocn, il peut procéder de deux manières :
o Choisir n- 1 vecteurs quelconques dans ocn, puis prendre comme n-ième vecteur n'importe
quelle combinaison linéaire des n - 1 premiers vecteurs.
o Prendre n vecteurs colonnes liés dans ocn, en utilisant la première méthode, les rassembler
en une matrice n x n, puis considérer les vecteurs lignes de cette matrice.
Voici la différence entre les deux méthodes : dans la première, le professeur connaît une relation
de dépendance linéaire car il l'a construite lui-même. Dans la seconde méthode, il ne la connaît
pas plus que les étudiants auxquels l'exercice est destiné; il sait seulement que les vecteurs
sont liés.

Test 16.13. a. Les lignes de A sont libres si et seulement si


Quel est le rang de ][n? rg(A) = m.
b. Les colonnes de A sont libres si et seulement
Test 16.14.
si rg{A) = m.
Déterminer de tête le rang de c. Les colonnes de A sont libres si et seulement
si rg{A) =n.
43-1 -2)
( 1 1 5 10
et 123 4)
5001 .
( 2468
d. Si rg (A) = r alors A possède r lignes libres
et r colonnes libres.

Test 16.15.
Soit A E .4'mn0K). Que pensez-vous des pro-
positions suivantes ?
416

Test 16.16. rang 3, mais les étudiants ont déterminé que


Lors d'un cours, un professeur écrit une ma- le rang était 2. Est-ce en contradiction avec
trice 3 x 3 au tableau. Comme il l'avait choisie l'affirmation selon laquelle la probabilité de cet
au hasard, il était convaincu qu'elle serait de événement est nulle ?

II.2. Matrices en blocs


Il est parfois pratique de partager une matrice A de format m x n en plusieurs blocs. Si par
exemple n = n 1 + n 2 et m = m 1 + m 2 avec nq, 111.p E N, alors nous pouvons la séparer en
matrices blocs Apq de format np x nq, avec p, q dans {l, 2} telles que

A= (An A12) _
A21A22
On convient qu'une matrice de format O x n ou m x O est vide. Si par exemple m 2 = 0 la
matrice est partitionnée en deux blocs A = (A 11, Au).
Un tel découpage d'une matrice peut être intéressant pour calculer son rang. Nous nous
appuyons sur l'observation élémentaire suivante :

Prenons une famille (v 1 , ... , Vp) de vecteurs de ocn et complétons chaque Vj = (vi 1 , .•• , Vjn)
d'un nombre n' de composantes arbitraires. On obtient un famille de vecteurs
Vj = (vjl, ... , Vjn, *, ... , *)
de ocn+n', où les étoiles désignent des scalaires qu'il n'est pas utile d'expliciter. Si certains
vecteurs parmi les v 1 , ... , Vp constituent une famille libre, alors les mêmes vecteurs étendus
forment encore une famille libre. En effet, une relation de liaison sur les vecteurs étendus
induit automatiquement une relation sur les vecteurs correspondant dans ocn, avec les mêmes
coefficients. Aussi rg(v 1 , .•. ,vp) ~ rg(v1 , .•. ,vp)-

On en déduit la majoration suivante.


ltèjte 11~1ti. ti rtirtfl'. #A. f!Jt rniti(fro parles rai1,g11 ies 6i()Cs .; . QfA-~ rgAp~·~urJiu~~
matrice blec •Avq extrJiite· <le A . . . . . .

EXEMPLE 16.20. La matrice suivante est de rang au moins 2, peu importe les valeurs des
étoiles.
****)
( 21 31 ** ** .

Notation. Il est commode de remplir les composantes que l'on ne souhaite pas expliciter
par un symbole conventionnel, par exemple une étoile, ou des hachures. L'espace vide est
traditionnellement réservé au cas où la composante est nulle. Les barres dans les matrices
sont des séparations pour distinguer les blocs.
Il est clair que la somme de deux matrices de même format et de même partition en
blocs peut s'effectuer blocs par blocs. De plus, on peut remarquer que le produit matriciel
peut également s'effectuer en utilisant des blocs. Le produit généralise la formule du produit
matriciel avec des coefficients scalaires. Il faut cependant être attentif ici à bien respecter
l'ordre dans les produits de blocs, car ceux-là ne sont en général pas commutatifs.
417

Règlê 10.21. Soient n1,ni,~~ m2, l'i,t:2des~ri.trerS- êi sdîêni


{t::::t
0 - ' -

ét (~1:t:);r;; ls
d~ fuâtriêes ~ des 1>loés B~ ~~format T:1 x mp ~t Al></
i
·{t::I:).(ltt:)·~•·~:;1::t:~:!~!kZiZ1~'
ü
(0
,....,
..d
ü

Dans le cas particulier où tous les blocs sont de format 1 x 1, nous retrouvons bien entendu
la formule habituelle du produit matriciel.
Le lecteur vérifiera aisément cette règle par un calcul direct. Nous la redémontrerons plus
tard, au chapitre 19, page 529, par des considérations plus ll,bstraites. Bien évidemment, nous
pouvons généraliser les deux règles à un nombre de blocs quelconque.

Dans la formule ci-dessus, nous avons implicitement supposé les conditions suivantes :
- les indices j des sommes de la matrice du terme de droite parcourent chacun l'ensemble
{1, ... , m};
- les blocs A1k •.. ,Amk d'une même colonne ont tous le même nombre de colonnes, et
les blocs An ... , Ain d'une même ligne ont tous le même nombre de lignes. Il en est de
même pour B;
- tous les produits matriciels ont un sens, c'est-à-dire que le nombre de colonnes du bloc
Bei est égal au nombre de lignes du bloc Aik·

EXEMPLE 16.22.

2)
10 12
10
15 18 .
(
15 8

Test 16.17. Les blocs indiqués, peuvent-ils servir pour éva-


luer le produit BA? Et le produit AB ?
Soient les matrices
Test 16.18.
1 20
On souhaite partager en blocs une matrice de
2101 ) o 2 o 1) .
(101110
l format 4 x 3; on veut qu'il y ait au moins deux
A= 3210 etB=
32101 lignes de blocs et au moins deux colonnes de
( Olll 01111 blocs (pas de blocs vides). Combien de possibi-
10 10
lités a-t-on ?
418

II.3. Le groupe Gl(n, OC) des matrices inversibles


Dans un corps, tous les éléments non nuls sont inversibles. Dans un anneau, ce n'est pas
nécessairement le cas. Par exemple, dans l'anneau Z/4Z, la congruence 2 est non nulle mais
2. 2 = 2 . 2 = 4 = o.
Définition 16.23.
Une matrice A E .4ln(]K) est inversible s'il existe une matrice A -l E .4ln{]K) telle que
AA- 1 = A- 1A = ITn.
Le sous-ensemble de .4ln(]K) formé des matrices inversibles et muni du produit matriciel, est
un groupe, d'élément neutre la matrice identité. On l'appelle le groupe linéaire et on le note
Gl(n,lK).

Vérifions que Gl(n, lK) est bien un groupe. L'associativité de la multiplication et le fait
que ITn est l'élément neutre découle des propriétés du produit matriciel que nous avons déjà
vues. En outre, si A, B dans .4tn(1K) sont inversibles, alors
(B- 1A- 1 )(AB) = B-1 (A- 1 A)B = B-1ITnB = B- 1B = ITn,
1
(AB)(B- 1A- 1 ) = A(BB- 1)A- 1 = AITnA- 1 = AA- 1 = ITn,
ce qui montre que AB est inversible avec (AB)- 1 = B- 1 A- 1 •

Règle 16.24. Le grou,pe Gl{n, K) · est commutatif si et seulement si n = 1.


PREUVE. Évidemment Gl(l, lK) = lK* est commutatif. Considérons Gl(2, lK). Dans l'exemple
16.10 nous avons déjà vu deux matrices 2 x 2 qui ne commutent pas. Montrons que ce sont
des matrices inversibles. Il suffit de donner les inverses :

(011)1 (10-1)
1 = (10-1)
1 (11)
01 = (01)
2

1O = [ IT 2 , 2.

Si n ~ 3, on voit par multiplication en blocs que les matrices suivantes sont inversibles et ne
commutent pas :

Nous allons maintenant donner plusieurs critères pour reconnaître les matrices inversibles.
Pour cela, le lemme suivant sera utile.

Lemme 16.25. La multiplication matrièielle n'augmente pas le rang. Autrement dit, pour
tous A E -4.mnf!K) et BE ;A'np{K), ona rg(AB} ~ min(rg(A),rg(B}).

PREUVE. Les colonnes de AB sont des combinaisons linéaires des colonnes de A, d'où la
majoration rg (AB) ~ rg (A). Les lignes de AB sont des combinaisons linéaires des lignes de
B, d'où la majoration rg (AB) :,;; rg (B). ■
419

PropositÎQn 16.26..· Soit· A € ;;4n{1'.l, tes propriétés ffii'OO.ntes sent &}ttivalenteJJ :.


t} A· est in~~ibk.; . . .. . . ]à
CJ

2):Aest.invermleàdroite1 .~'~•à~4ire.JJU'il ezïsteB Ê.~n,(K} .~rqueA'B== In,;


3) A est inversitile dgc.tiche,>ë'est::.à,~ qu,'il e,;iste 'B' e .:l,tfK} tel qU:e 'B 1A =ln; i
"3CJ
4) Îescblônnes dé Af()fment tinê6asè.deKn; cil
5) le~ lignés 'àè A Jormê.rii;Jr,,~ basé, dé r; ü
co
.....
6Jrg(A)=n. · · · ..d
ü
PREUVE. L'équivalence entre les trois dernières propriétés est une conséquence directe de la
proposition 16.17.
4) =} 2). Si les colonnes forment une base de ocn, alors tout vecteur de ocn peut s'écrire comme
combinaison linéaire des colonnes C 1 , ••• , Cn de A. C'est vrai en particulier pour les vecteurs
e1 , ••• , en de la base canonique, notés en colonnes. Il existe donc des coefficients 13kt E 1K tels
que
n
Cf= L_ /3kfCk, pour f = 1, ... , n.
k=l
Or, les vecteurs de la base canonique sont précisément les vecteurs colonnes de la matrice
identité. Posons alors B = (13kt) E .4ln(1K). Il en résulte que lin= AB, et A est bien inversible
à droite.
5) =} 3). Même chose en travaillant sur les lignes à la place des colonnes.
2) =} 4). D'après le lemme 16.25, nous avons rg (A) ~ rg (AB) = rg (lin) = n. De plus, la
proposition 16.17 montre que rg (A) ,::; n. Ainsi rg (A) = n.
3) =} 5). La preuve est analogue.
Nous venons ainsi de prouver l'équivalence des propriétés 2) à 6). Il reste à montrer l'équiva-
lence (1) # (2).
1) =} 2). est trivial.
2) =} 1). Comme 2) et 3) sont équivalents, partons de l'hypothèse qu'il existe B et B' dans
.4ln(1K) telles que B' A= AB = lin et montrons que B = B'. C'est une propriété valable dans
tout groupe: B = llnB = (B'A)B = B'(AB) = B'lln = B'. ■

On retiendra notamment que les inverses à gauche ou à droite d'une matrice carrée sont
identiques, et qu'ils sont donc l'inverse. Cela signifie que pour vérifier que deux matrices
carrées A et B sont inverses l'une de l'autre, il suffit de calculer un seul des deux produits AB
ou BA et de montrer qu'il égale lin.

PREUVE. Le fait que ad-be cf. 0 soit une condition nécessaire et suffisante pour l'inversibilité
est une conséquence de la proposition 17.14. Le lecteur vérifiera la formule donnée en calculant
par exemple le produit

(ab) ( d-b) = (
ed -e a ad - be) ll2 • ■
420

Test 16.19. Test 16.21.


Construire un morphisme injectif de groupes du Que pensez-vous de ces assertions?
produit de groupes Gl(n,lK) x Gl(m,lK) dans a. Une combinaison linéaire de matrices inver-
Gl(n+m,lK). sibles est aussi inversible.
b. Si A est inversible, alors -A l'est aussi.
Test 16.20.
c. Si AB= 0, avec A, B dans An(lK)*, alors ni
Soient A E Amn(lK) et B, B' dans Anm(lK) A ni B ne sont inversibles.
telles que AB = llm et B' A = lin. Peut-on en
d. Si A, B dans .4t'3(lK) sont de rang 2 alors AB
déduire que m = n?
l'est aussi.

II.4. Transposition
Les considérations précédentes sur le rang d'une matrice ont fait apparaître que des raisonne-
ments peuvent se faire aussi bien sur les lignes que sur les colonnes. Dans cette partie, nous
allons formaliser cette symétrie entre lignes et colonnes.

Définition 16.28. Soit A = ( aek) E .4tmn(1K). La matrice transposée de A est la matrice


tA de .4tnm(1K) dont le coefficient d'indice (C, k) est au.

La transposition d'une matrice intervertit les rôles des colonnes et des lignes.

14
EXEMPLE 16.29. S1 A= . (123)456
, alors tA = ( )
; ~ .

Règlè 16.30. SC1ient A E Mmn{K) it B E Mm>(Kr)~


1)_ L<ftrunsptf~tiané.9tinvplutivè: t(tAl-=::A-
,_ - -<, ,- - - C -•~ -- , - - - - •

2) La. transposition oonserve l~ mn_g : .Jg{tAl ,::: r.g A, .·


3) Là t,mnspositio'ni int6f'JJertit ;n:trâre ât;!i Jactëu:rs <làrtfl:un pttHlmt :c t{>..B-}='-tB iA. -
4) Si A est inversible alors tAl'est a-1LSIJi et (tA)"'1 =•tp(é.i.1J:

PREUVE.

1) Cela résulte immédiatement de la définition : si aek est le coefficient de A d'indice (C, k),
alors au est le coefficient de tA pour ce même indice et, par suite, aek est bien le coefficient
de ttA d'indice (C, k), ce qui prouve l'identité souhaitée.
2) C'est une conséquence immédiate de la proposition 16.17.
3) Notons A= (aekl et B = (bkil- Considérons le coefficient d'indice (j,C) de t(AB), c'est-à-
dire le coefficient Cej de AB.
Cej = (ae1, ... , Uenl t(b1j, ... , bmj) = I:~1 Uekbki = (b1j, ... , bmj) t(an, ... , Uenl-
Donc Cej est le produit de la j-ième ligne de tB par la C-ième colonne de tA, ce qui prouve
que Cej est le coefficient d'indice (j, C) de tB tA.
421

4) Calculons: t(A- 1 )(lA) = t(AA-1 ) = trrn = Iln, Ainsi, la matrice t(A- 1 ) est l'inverse à
gauche de tA et le résultat s'ensuit d'après la proposition 16.26. ■

Notons qu'en vertu de la quatrième règle, nous pouvons supprimer sans ambiguïté les paren-
thèses pour calculer l'inverse d'une transposée que nous noterons désormais tA _,.

III. L'ALGORITHME DU PIVOT DE GAUSS

IIl.1. La méthode
La méthode du pivot ou le procédé d'élimination de Gauss est un algorithme qui permet de
calculer le rang d'une matrice, soit encore - et nous avons vu que cela revenait au même - le
rang d'une famille finie de vecteurs de Il{n_ Nous verrons également dans cette partie comment
il permet de résoudre les systèmes linéaires.

Soit A une matrice m x n. Notons l 1 , ... , lm ses lignes et C 1, ... , Cn ses colonnes. Nous
avons donc

Nous allons nous servir de six types d'opérations élémentaires.


Opérations élémentaires sur les lignes :
échange de deux lignes : le+----------+ li, où r -1- j;
multiplication par un scalaire non nul : le H Àle, où À E Il{*;
addition d'un multiple d'une autre ligne : le H le+ µli, où f -/- j, µ E lK.

Opérations élémentaires sur les colonnes :


échange de deux colonnes : Ck+----------+ Cp, où k-/- p;
multiplication par un scalaire non nul : ck H ÀCk, où À E Il{*;
addition d'un multiple d'une autre colonne : CkH ck+ µCp, où k-/-p, µEK

Pl'.oposition 16.31.
l} l,e,s opé~fJ;S{lérnentaires sur les lignes ne dumgent pas le sous.;espacè 11tdoriel c1e Kn
e~ge:n,âté par les ligt,,es.
2) w opéràtiôns 'êlémente;ires sur- les· colonnes ne chàngent pas le· sous~espace v(!ctoriel ·de
K.m engendré pat les colonn.es:
3) Aucune opératiôn élémentaire ne change le rang de la matrice.
PREUVE.
1) Il est évident qu'une permutation des lignes ou la multiplication d'une ligne par un scalaire
non nul laisse vect {l 1 , .•. , lml inchangé. Pour l'addition d'un multiple d'une autre ligne, c'est
une conséquence du lemme 17.15.
2) La démonstration est analogue.
3) C'est une conséquence de 1) et 2) et du fait que le rang des lignes est égal au rang des
colonnes d'après la proposition 16.17. ■
422

L'idée de la méthode du pivot est d'arriver, par une succession finie d'opérations élémen-
taires sur les lignes, à une matrice dont le rang se calcule de tête.

1) Installation d'un pivot


► Si la première colonne C 1 de A est nulle, alors on recommence avec la matrice (C 2 , ... , Cn)
de type m x (n - 1 ) .
► Si C 1 est non-nulle, on se ramène, par une éventuelle permutation des lignes, au cas où
a 11 -/- O. On multiplie alors la première ligne par _!_
011
pour obtenir une matrice de la forme

On appelle le nombre 1 en haut à gauche le pivot.

2) Nettoyage en dessous du pivot


► Par l'opération élémentaire l 2 H l2 - 02 1 l 1 , nous obtenons

1 * ... *
0 * ... *
U31 U32 .. · U3n

Um] Um2 ... Umn

► De même, par le même type d'opération élémentaire, le pivot peut «nettoyer» toutes les
entrées en-dessous dans sa colonne. Nous obtenons la matrice

où le bloc A' est de format (m - 1) x (n -1).

3) Suite de l'algorithme
On applique au bloc A' les deux étapes que nous venons de décrire (installation d'un pivot,
puis «nettoyage» en-dessous). Comme le bloc à gauche de A' est nul, il n'est pas affecté par
ces opérations. À l'intérieur du bloc A', on obtient un nouveau bloc A" et on recommence ...

L'algorithme s'arrête lorsque A s'est tranformée en une matrice en «escalier».

1 * * * * * * * ... *)
1 ******···*
1****···* (16.6)
( 1 ***···*
1 * ... *

La matrice (16.6) n'est qu'un exemple. Plus généralement, on obtient une matrice A dans
.4i'mn0K) qui peut commencer par des colonnes nulles (si les premières colonnes de A sont
423

nulles, on n'y trouve pas de pivot) et finir par des lignes nulles (l'algorithme s'arrête lorsqu'on
ne trouve plus de pivot). En général, le résultat final de l'algorithme de Gauss est donc de la
forme
1
A = ( Or p escalier ) (16.7) i
ü
cri
......
Om-r,p Om-r,n-p
.d
ü
où Op,q désigne la matrice nulle de format p x q. Les cas p = 0 ou m = r sont néanmoins
possibles. L'entier r est le nombre de pivots ou encore le nombre de «marches» de l'escalier.
La hauteur des «marches» de l'escalier est toujours d'une unité tandis que la largeur des
«marches» peut varier. Il existe un entier r E {l, ... , min(m, n)} et une suite finie k1 < k2 <
... < kr tels que
sii=l, ... ,r
si € = 1 , ... , r et k < ke (16.8)
si€> r.

Bien sûr, il n'est pas utile d'apprendre par cœur les formules (16.8), mais il est plus important
de comprendre la forme d'escalier sur la matrice de (16.6). Les équations (16.8) traduisent
le fait que les indices k 1 , ••• , kr indiquent les colonnes qui portent un pivot. Par exemple,
dans (16.6), nous avons r = 5 et (k 1, ••• , k 5 ) = (1, 2, 4, 5, 7).

Avec des opérations élémentaires sur les colonnes, nous pouvons aller plus loin et trans-
former l'escalier« irrégulier» A de (16.7) en un escalier dont les «marches» sont toutes de
largeur 1. Nous permutons les colonnes de A pour obtenir une matrice de la forme

1* *
:* *
.. * : (16.9)
1* *

Ensuite, nous « nettoyons » tout ce qui se trouve à droite des pivots par des combinaisons de
colonnes, en utilisant la sixième des opérations élémentaires que nous avons énoncées. Nous
obtenons une matrice de la forme

(16.10)

Il est immédiat ~e rg A = r. Les opérations élémentaires laissant le rang invariant, les


matrices A, A et A ont donc toutes les trois le même rang r. Résumons cette discussion.
424

Méthode du pivot de Gauss


Soit A E AmnCIK) une matrice.
1) La méthode du pivot de Gauss est un algorithme qui, par des opérations élémentaires
sur les lignes, transforme A en une matrice« escalier» A de Amn(lK) de la forme (16.8).
2) Le rang de A égale le nombrer des pivots.
3) Les n - r dernières lignes de A sont toutes nulles. Les r premières lignes de A
constituent une base de l'espace engendré par les lignes de A.
4) Par des opérations élémentaires sur les lignes et sur les colonnes on peut transformer
A en une matrice de la forme (16.10).

EXEMPLE 16.32. Nous allons appliquer la méthode du pivot de Gauss pour calculer le
rang des trois vecteurs (1,2,3), (2,4, 1), (3,6,5) de JR. 3 .
Nous écrivons plusieurs opérations en une seule étape et les indiquons, l'une après l'autre,
par des petites flèches. Dans la deuxième étape, par exemple, nous multiplions la deuxième
ligne par -i, puis nous ajoutons à la troisième ligne la deuxième multipliée par 4.

A=
123)
241
( 3 65
=]2 -3
+
12 3)
00-5 I x
( 00-4 <
(-D J4 A=
123)
001
( 000
+ +

L'algorithme de Gauss s'arrête ici, on trouve rg (A) = 2. On pourrait continuer avec des
transformations élémentaires sur les colonnes, d'abord en permutant des colonnes, ensuite
en « nettoyant » la matrice, pour obtenir

132) _ (100)
0 10 A= 010 ,
( 000 000
mais cela est inutile si on ne souhaite calculer que le rang, qui, en fait, pouvait se calculer
de tête dans ce cas (voir l'exemple 16.18).

En général, il n'est pas nécessaire de normaliser les pivots par le nombre 1. Nous pouvons
laisser des pivots avec des valeurs quelconques pourvu qu'elles soient non-nulles. En effet, cela
n'empêche pas le «nettoyage».

EXEMPLE 16.33. Nous allons appliquer l'algorithme de Gauss à une matrice réelle de type
4 x 6. Remarquez que nous commençons par permuter deux lignes pour ne pas avoir -3
comme premier pivot, ce qui évite l'apparition de fractions, et que nous simplifions la 3ième
ligne pour éviter de manipuler de grands nombres.
425

A=
c~ -1
8
-3
-24
9

3
-2
-1
4 -12
0 -2
3 5
-2
-4
7
_;) ?i
10
~
~
s
'3
<:)

cil
ü

-co
(-~ -1
-3 -2

-1
-6
3
9 -2

0
3
-3
-2
5
-1
7
-~)~10 +
..d
ü

( 0
-3
0
-1
0
-2
-1
_q
0
0
0
0
-1
1
-1
-3
3
5 10 :J
1 -3 -1 -2

( 0
0
0
0
0
0
0
0 -1
0 -3
-1
2
6 i) '.. (-1) 1:

~ ~
-3 -1 -2

A~( 0
0
0
0
0
0
0
0
0

0
-1
-2
0
-2
0
) , donng(A) 3.

Test 16.22. Test 16.23.


Détailler la démonstration de la propriété 3) de Déterminer des scalaires a, b, c dans lK tels que
la méthode du privot de Gauss. les vecteurs (1, 0, 0), (1, 2, 3), ( a, b, c) forment
une base de IK3 .

Test 16.24. Test 16.25.

a. Dans l'exemple 16.32, combien d'opérations Les matrices suivantes forment-elles une base
élémentaires a-t-on utilisées pour passer de A à de Al2(IK)?
A?
b. Les vecteurs (0,0, 1) et (1,2,0) forment-ils
une base de l'espace engendré par les lignes de
A?
IIl.2. Application à la résolution des systèmes linéaires

Forts de notre algorithme, nous revenons sur l'étude des systèmes linéaires. Nous allons voir
dans cette partie comment l'algorithme du pivot donne une méthode systématique et efficace
pour les résoudre.

III.2.1. Structure de l'espace de solution

Commençons par reformuler le problème dans le langage des matrices. Le système linéaire

a11x1+ a12x2+···+ U1nXn=1J1


U21X1 + U22X2 + · · · + UznXn = 1J2
(16.11)
~ 1Jm
{
Um1X1 + Um2X2 + · · · + UmnXn

peut s'écrire de manière plus concise sous la forme Ax = y, où A = (Ufkl est de format m x n
et x E :ocn et y E :ocm sont notés en colonnes. Le système homogène associé est le système
Ax=O.

Régie 16.34. Soit S l'ensemble des solutions du système Ax. = V. Alots__

ouhienS=0, ou bûinS,;,x+So~
qù 'i E S est une solutiq_n arbitraire Ji,xéè et S-OC désigne l'ensemble des solutions du système
homogène associé, c'est-à~dire du système Ax =Q. .Autmment dit
solution générale =·solt.ttiou. pa,rtic'Ulière + :11olution générale dit systèmt hômogên~.

Notation. La dénomination de solution particulière pour x ne signifie pas que cette solution a
des propriétés particulières, mais seulement qu'il s'agit d'une solution que l'on a su déterminer
parmi d'autres et que l'on fixe une fois pour toute.
D'après la règle 17.8, nous savons que S 0 est un sous-espace vectoriel de :ocn. La notation
suggestive x+ S 0 désigne l'ensemble des n-uplets de la forme x+ z, où z parcourt S 0 . Ainsi, S
est en quelque sorte un « sous-espace vectoriel translaté» ; on l'appelle un sous-espace affine3
de :ocn.

PREUVE. Supposons que S f= 0. Il existe donc x E S. Nous allons montrer que S = x + S 0


par double inclusion.
► Montrons l'inclusion C. Soit x E S. Alors A(x - x) = Ax - Ax = y - y = O. Ainsi, la
différence z = x - x est solution du système homogène associé et x = x + z E x + S 0.
► Montrons l'inclusion =i. Soit z une solution du système homogène associé. Alors A(x+z) =
Ax + Az =y+ 0 =y, c'est-à-dire que la somme x + z est dans S. ■

3
Le mot« affine» renvoie à l'idée que x+So ressemble au sous-espace vectoriel So. Nous étudierons les aspects
géométriques de cette notion dans le cours de deuxième année.
427

III.2.2. Résolution par la méthode du pivot

Le système (16.11) est entièrement donné par la matrice (A,y) E Atm,n+1(IK), nous identi-
fions donc les deux points de vue. Ainsi les opérations élémentaires sur les lignes de (A, y)
correspondent aux opérations suivantes :
- permuter deux équations ;
- multiplier une équation par un nombre non nul ;
- ajouter à une équation le multiple d'une autre.
Comme toute solution du système initial est encore solution du système transformé, l'en-
semble-des solutions ne peut qu'augmenter après chaque opération élémentaire. Or, ces opéra-
tions sont réversibles : après chaque transformation, il est possible de revenir au système initial
par une opération du même type. Il en résulte que l'ensemble des solutions reste invariant.

Règle 16.35. Si on transforme (A,y) en (A,y) par des opérations élémentaires sur les
lignes, alors ces deux systèmes sont équivalents : ils possèdent le mime ensemble de solutions.

)üte11tio11 Peut-on agir sur les colonnes ?


En principe, les opérations sur les colonnes sont aussi possibles mais il faut prendre en
compte le fait qu'elles induisent des changements sur les variables inconnues.

Pour résoudre un système, on procède comme suit.


1) Par la méthode du pivot, on transforme A en une matrice escalier A et simultanément on
fait les mêmes opérations sur y.
2) On obtient ainsi un système (A, y) équivalent au système initial et facile à résoudre. Par
exemple, **
1 * * * * * * * * ...
1 *******""**
(A,Yl = 1 *'"**

*
3) On isole les inconnues qui correspondent aux colonnes avec pivots, puis on les exprime
successivement, du bas vers le haut, en fonction des autres inconnues.

EXEMPLE 16.36. Considérons le système à cinq inconnues

-3x1 + 9x2 - 2x3 + 3x4 + 5x5 = 4


X1 - 3x2+ X3- X4-2Xs= 0
(16.12)
{ 8x1 - 24x2 + 4x3 - 12x4 - 4x 5 = -8
-xi+ 3x2 - 2x4+7xs= 10

Par la méthode du pivot la matrice

-3 9-2 3 5 4)
1 -3 1 -1 -2 0
(A,y) = 8-24 4-12-4-8
(
-1 3 0 -2 7 10
428

se convertit (voir l'exemple 16.33) en la matrice

1 -3 1 -1 -2 0)
- _ 0 0 1 0-1 4
(A, 1J) = 0 0 0 1 -2 -2
(
0 0 0 0 0 0

On isole successivement les inconnues des colonnes pivots, à savoir x4 , x 3 , x 1 , puis on les
exprime en fonction de x2 et Xs :

Par conséquent, la solution générale est de la forme

où x 2 et x 5 sont arbitraires dans K


L'algorithme de Gauss ne donne pas une manière unique de procéder car on a souvent
le choix entre plusieurs pivots. Nous avons fixé un algorithme en prescrivant la recherche du
premier pivot dans la première colonne. En pratique, il est judicieux de se souvenir que ce
choix est arbitraire et que nous pouvons démarrer le processus dans n'importe quelle colonne.
En analyse numérique, on étudie la façon de faire ces choix pour éviter d'accumuler des
erreurs d'arrondi. C'est une théorie qui peut devenir très complexe quand il s'agit de traiter
des systèmes de plusieurs centaines d'équations. Nous en montrons l'enjeu sur un exemple
très simple.
EXEMPLE 16.37. Prenons un cas extrême et supposons que nous avons une calculatrice qui
arrondit toujours à deux chiffres significatifs : elle ne distingue pas entre les nombres 0, 0234
et 0, 0229 par exemple car elle les représente tous les deux par l'expression 2, 3 x 10-2.
Considérons le système

Ce système a pour solution x 1 ::::; 0, 5025 et x 2 ::::; 0, 4975, ce qui dans notre machine serait
arrondi à X1 ::::; x 2 ::::; 5, 0 x 10- 1 .
o Par la méthode de Gauss, avec le pivot 0, 005, le système est équivalent à

0,005 1 )(Xi)-(0,5)
( 0 -199 X2 - -99 .

Or, notre machine ne reconnaît pas le nombre à trois chiffres 199, qu'elle arrondit donc à
2, 0 x 10 2. Ainsi, pour elle, le système s'écrit

0,005 1 ) (XJ) 0,5)


( 0 -200 X2 ( -99 .
429

Ce système a pour solution exacte x 1 = 1 et x 2 = 0,495, ce que la machine arrondit à x 1 = 1


et X2 ~ 5,0 X ,0- 1 .

◊ Voyons si le choix d'un autre pivot produit un résultat plus précis. Choisissons dans le
système initial le pivot 1 en bas à gauche. Nous obtenons

ce que la machine arrondit à

La solution exacte de ce système est x 1 = x2 = 0,5.


On constate donc que pour des raisons d'arrondi, il valait mieux prendre 1 comme pivot
plutôt que 0, 005.

Retenons de cet exemple qu'entre deux pivots possibles, il vaut mieux écarter le plus petit,
en général.

III.2.3. Dimension de l'ensemble des solutions

Remarquons d'abord qu'un système linéaire ne possède pas toujours une solution. En effet, le
système en escalier (A, y) peut présenter des lignes impossibles.

EXEMPLE 16.38. Considérons le système (16.12) mais avec pour second membre
1 -3 1 -1 -21 0 )
(4,0,-8,0) au lieu de (4,0,-8, 10).Alors nous obtenons (A,y) = (
g g 6 ~ =1 J. .
0 0 0 0 0 -10
La dernière ligne du système signifie que O = -10, ce qui rend le système impossible.

En général, avec T = rg (A),


escalier
Yr
le système prend la forme (A, y) =
Yr+l
lignes nulles
Ym
Proposition 16.39. Avec les notations ci-dessus, les trois conditions suivantes sont équi-
valentes:
1) la forme· escalier {A, y) ;atisfait les relations de compatibilité : yt =0 pour tout t > T;
2) le. système Ax: = y possède une solution;
3) rg(A,y) =rg A.
PREUVE.
1) ==} 2). Si Yi= 0 pour tout t > T, alors le système (A, y) se résout en partant du bas.
2) ==} 3). Six= ( : ) est une solution de Ax = y, cela signifie que y= L~=l xkCk où les Ck
sont les colonnes de A. Pour calculer le rang des colonnes de la matrice (A, y), la colonne y
est donc superflue, ce qui montre que rg (A, y) = rg A.
430

3) =} 1). Supposons par l'absurde qu'il existe e > r tel que Yi =J O. Alors ij n'est pas com-
binaison linéaire des colonnes de A car ses colonnes ont toutes des coefficients nuls à partir
du (r + 1 )-ième coefficient. Ainsi rg (A, ij) > rg A. Or rg A= rg A et rg (A, ij) = rg (A, y),
d'où on est en contradiction avec l'hypothèse rg (A, y)= rg A. ■

Proposition 16.40. Si le système Ax = y à n inconnues et m équations possède une


solution, alors son ensemble S de solutions est décrit po,r n -T paramètres où T = rgA.
x,
Plus précisément il existe b1, ..• , bn-r éléments de Kn tels que les solutions x sont exac-
tement les vecteurs de la forme

De plus, pour x solution donnée, les coefficients Àf sont uniques.

PREUVE. S'il existe une solution x, alors l'ensemble des solutions est de la forme S = x+ So,
où S0 est le sous-espace vectoriel de ocn formé par les solutions du système homogène associé
et qui a une base b1, ... , bp. Il nous reste à voir que p = n -T. Lorsque l'on résout le système
homogène en escalier Ax = 0, on exprime les inconnues correspondantes aux colonnes pivot en
fonction des inconnues restantes, soit encore T inconnues en fonction de n-r autres inconnues,
ce qui prouve que la dimension de So est bien n - T. ■

EXEMPLE 16.41. Dans l'exemple 16.36 nous avons écrit la solution générale en fonction
1

~u(x--~ar)a~è:~Œ(:~ ):À:,~(u~s)lafo,I:e prnmie, 4-uplet est une , solution particu-


11
d: ~

2 2 lière » et les deux autres forment une base de


0 1 l'espace de solutions du système homogène.

Corollaire 16.42. Soit S l'ensemble.des solutions du système Ax =y à n inconnues et m


équations.
1) Si rg(A) = n, il existe au plus une solution.
2) Si rg {A) = m, âlors il existe au moins une solution.
3) Si rg (A) = m = n, alors il existe exactement une solution.

PREUVE.

1) Si rg (A) =net s'il existe une solution, alors d'après la proposition 16.40, elle ne dépend
d'aucun paramètre, donc elle est unique.
2) Si rg (A) = m, alors A ne peut contenir de ligne nulle et donc une solution existe d'après
la proposition 16.39.
3) C'est une conséquence de points 1) et 2) mais on peut le montrer aussi directement :
rg (A) = m = n implique que A est une matrice carrée inversible, donc l'unique solution du
système Ax = y est le vecteur x = A- 1-y. ■

Remarque. La démonstration du point 3) suggère une méthode pour inverser une matrice.
Si A est une matrice carrée de taille n, alors A est inversible si et seulement si le système
431

Ax = y admet une unique solution pour tout y E ocn. En écrivant y = (Y1, ... , Yn) en colonne
sous la forme d'un n-uplet quelconque et en résolvant le système Ax = y par la méthode du
pivot, nous pouvons exprimer x en fonction de y sous la forme x = By, où Best précisément la
matrice inverse de A. Nous reviendrons sur cette technique d'inversion à la fin de ce chapitre.

EXEMPLE 16.43. Inversons la matrice ( ~;), ce qui revient à résoudre le système

x 1 +2x 2 =y 1
{ 2x1+Sx2=Y2,
soit encore
x1+2x2=Y1 . {x1=Y1-2x2=Y1-2(yz-2 yi)=5y1-2Y2
{ pms
X2=Y2-2Y1, X2=Y2-2Y1-

Il s'ensuit que (12)-l = ( 5-2)


25 -2 1 .

Test 16.26. d. Il existe une unique solution si et seulement


On considère un système linéaire. Que pensez- s'il y a autant d'équations que d'inconnues.
vous de ces propositions?
Test 16.27.
a. Il n'existe pas de solution s'il y a plus d'équa-
tions que d'inconnues. Les assertions suivantes sont-elles vraies ?

b. S'il n'existe pas de solution, alors il y a plus a. Pour décrire une droite dans JR 5 , trois équa-
d'équations que d'inconnues. tions suffisent.
c. Il existe une solution si et seulement s'il y a b. On peut décrire un plan dans JR4 par deux
autant d'équations que d'inconnues. équations.

111.2.4. Système transposé et colonne témoin

Système transposé. Soit A une matrice m x n. Au système homogène avec n inconnues et


m équations
Ax=O, XE JK:n,

on associe le système transposé avec m inconnues et n équations

XE JK:m.

La dimension de l'espace de solution du système Ax = 0 est n-rg A, tandis que la dimension


de l'espace de solution du système transposé est m - rg A.

Trouver un système à partir des solutions. Dans le chapitre 15 (voir règle 15.8) nous
avons démontré que l'espace de solutions d'un système homogène est un sous-espace vectoriel
de ocn_ Mais la réciproque est vraie aussi :

Proposition 16.44. Tout SOUlf•espace vectoriel de JKll est l'espace de solutions d'un système
linéaire homogène à n inconnues.
432

PREUVE. Soit F un sous-espace vectoriel de ocn. On sait que F est engendré par un nombre
fini de vecteurs v 1 , ... , Vp de ocn. On note A la matrice p x n dont les lignes sont précisément
les vecteurs Ve. On poser= rg A= dim F. L'espace des solutions du système linéaire Ax = 0,
pour x E ocn, est un sous-espace vectoriel de ocn. Il est de dimension m = n - r et possède
donc une base formée de vecteurs l'on note

j = 1, ... ,m.

Notons B = (bkil E Aé"nm(OC). Alors on a AB= 0 et par transposition

Soit F' l'espace des solutions du système tBx = 0, pour x E ocn. Chaque vecteur colonne de
tA est dans F'. Or les colonnes de tA engendrent F. On en déduit que F CF'. On conclut en
notant que dim F' = n - rg B = n - m = r = dim F. ■

EXEMPLE 16.45.
Soit F le sous-espace vectoriel de 11(5 engendré par les vecteurs v 1 = [-3, 9, -2, 3, 5, 4),
v2 = (1,-3, 1,-1,-2,0), v 3 = (8,-24,4,-12,-4,-8) et v 4 = (-1,3,0,-2,7, 10). Nous
allons déterminer un système linéaire dont Fest l'espace de solutions. On pose

On reconnaît la matrice du système homogène Ax = 0 de l'exemple 16.36. On y a montré


que les vecteurs colonnes de la matrice

forment une base de l'espace de solutions de système Ax = O. Ainsi Fest l'espace de solutions
du système tBx = 0, x E 11(5 , c'est-à-dire

Dans cet exemple la famille (v 1 , ••• , v 4 ) dans 11(5 est de rang 3. Il est donc pas étonnant
que deux équations soient nécessaires pour décrire le sous-espace vectoriel qu'elles engendrent.
Bien sûr on pourrait aussi prendre 3 équations ou plus, mais évidemment on cherche plutôt
un système sans équations superflues.
433

.-\ttPlltÎOll Systèmes homogenes =/- Systèmes inhomogènes


Il faut bien distinguer entre deux choses :
1) Chercher un système linéaire dont l'espace des solutions est le sous-espace vectoriel
engendré par les vecteurs v 1 , ..• , Vp ;
2) Chercher un système linéaire dont l'espace des solutions est le plus petit possible
parmi ceux qui contiennent les vecteurs v 1 , ••• , Vp .

La première question est celle que nous avons traitée. Elle aboutit à un système homogène,
tandis que la deuxième aboutit en général à un système inhomogène.
Par exemple dans JR. 3 muni de sa base naturelle e 1, e 2, e 3, un système linéaire dont l'espace
des solutions est le sous-espace vectoriel engendré par e,, e2 est
X3 =0.
En revanche un système linéaire dont l'espace des solutions contient e,, e2 est
x, +x2 = 1,
{ X3 =0.
Trouver des relations de dépendance linéaire des lignes par une colonne témoin.
Soit B = (bfkl E AmnOK). Nous cherchons des relations de dépendance entre les lignes
l 1 , .•• , lm les lignes de B. Pour cela nous constatons que les lignes de B sont les colonnes

C,, ... , Cm de tB. Or écrire À1C1 + · · · + ÀmCm = 0 revient à écrire que tB (:~) = 0.

Règle 16.46, .Chercher une relation de dépendance linéaire entre lès lignes de B revient à
che1'Cher une solution non nulle du système transposé tBx = O.
Ainsi le problème de trouver des relations de dépendance linéaire entre les lignes se résout
par la méthode du pivot en passant au système transposé tBx = O. Nous allons donner une
seconde méthode de résolution du problème des relations de dépendance en appliquant la
méthode du pivot au système non transposé Bx = O.
Pour cela nous rajoutons une « colonne témoin» T, constituée de variables indéterminées
T1, ... , În, analogues à l'indéterminée X des polynômes (voir le chapitre 13),

Les variables T1 , ••• , În sont des notations commodes pour représenter n'importe quel vecteur,
noté en ligne, d'un espace ][(P, où p est un entier arbitraire, le même pour toutes les variables,
et qu'il n'est pas nécessaire de connaître explicitement dans les calculs qui vont suivre.
En appliquant la méthode du pivot à la matrice (B, T), nous obtenons une matrice de la
forme

escalier

0
434

où r = rg B et où (i\fkl E .4lm(]K). La colonne des blocs de droite garde la trace des opérations
élémentaires effectuées sur les lignes de B .

.Proposition 16.47.
1) Les vecteurs (Àtt, ••. , i\em), r < t ~ · m, forme nt· une base. de Fespace de .solution du
système transposé tB,c =.O, x E.Km,
2) · Toute relation de dépendance liriéaire entre les lignes l h .• , , lm de B est une aombinaisort
linéaire des relations· i\n l1 + ·· · + Àtmlm =.0, pour r < t ( m.
PREUVE.
1) L'idée de la preuve est d'utiliser les «témoins» Îf comme des «jokers», que l'on peut
remplacer par des vecteurs bien choisis.
► Substituons à Îf la ligne lf de B, f = 1, ... , m. Alors la colonne témoin du départ n'est
autre que la matrice B. Nous obtenons donc les relations

Cela s'écrit sous la forme


1

tB ( i\; ) = O,
Àfm
ce qui montre que les m - r vecteurs (i\fl, ... , Àfml, r < f ( m, sont solutions du système
transposé. Il suffit maintenant de voir pourquoi ces m - r vecteurs sont linéairement indépen-
dants. En effet, nous pourrons alors conclure par un argument de dimension, puisque l'espace
des solutions du système transposé est de dimension m - rg (tB) = m - r.
► Substituons à Îf le vecteur ef, écrit en ligne, de la base naturelle de ocm. Alors la colonne
témoin du départ n'est rien d'autre que la matrice identité Ilm et par des opérations élémen-
taires celle-ci est transformée en la matrice (i\fkl qui est encore de rang m. En particulier ses
dernières m - r lignes (i\fl, ... , Àfml. pour r < f ::,;; m, sont linéairement indépendantes.
2) C'est une conséquence immédiate de 1) et de la règle 16.46. ■

En résumé: si on applique l'algorithme de Gauss avec une matrice munie d'une ligne témoin
on trouve une base de l'espace de solutions du système homogène transposée ou encore une
« base » de toutes les relations de dépendance linéaire entre les lignes de la matrice.

EXEMPLE 16.48. Nous cherchons toutes les relations de dépendance linéaire entre les cinq
vecteurs (-3, 1,8,-1), (9,-3,-24,3), (-2, 1,4,0), (3,-1,-12,-2), et (5,-2,-4,7). Pour
cela nous les écrivons en lignes dans une matrice B que nous complétons par une colonne
témoin,

On applique la méthode du pivot

-3 1 8 -1 T1 ) -3 1 8 -1 T1 )
0 0 0 0 T2+3T1 0 -1 28 16 3Ts+5T1
0 1 -4 2 3T3-2T1 0 1 -4 2 3T3-2T1
( 0 0 -4 -3 T4+T1 ( 0 0 -4 -3 T4+T1
0 -1 28 16 3Ts+ST1 0 0 0 0 T2+3T1
435

8 -1 Ti ) ( -03 -11 28 1
8 16 Ti )
0 -11 28
-3 16 3Ts+ST1 3Ts+ST1
0 0 24 18 (3T3-2Ti)+(3Ts+5Ti) O O 8 6 T1+T3+Ts
( 0 0 -4 -3 T4+T1 0 0 0 0 3T1+T3+2T4+Ts
0 0 0 0 T2 +3T1 0 0 0 0 3T1 + T2

Les lignes l 1 , ••. , l 5 de B (c'est-à-dire les colonnes de A = tB) vérifient les relations de
dépendance linéaire 3l 1 + l2 = 0 et 3l1 + l3 + 2l4 + ls = 0, et toute autre relation de
dépendance linéaire entre l 1, ... , l 5 est une combinaison linéaire de ces deux équations. Les
vecteurs (3, 1, 0, 0, 0} et (3, 0, 1, 2, 1} constituent une base de l'espace de solution du système
transposé tBx = O.

Dans cet exemple on constate que B = tA où A est la matrice du système de l'exemple


16.36. Nous avons obtenu dans les deux exemples la même base de l'espace des solutions
du système Ax = O. Bien entendu, c'est un pur hasard car, en général, les divers choix qui
interviennent dans la mise en œuvre de la méthode du pivot donnent différentes bases de
l'espace des solutions.

Comment résoudre un système linéaire homogène ?


On retiendra que l'on dispose de deux méthodes pour résoudre le système Ax = 0 :
- La méthode du pivot sur A suivie de substitutions du bas vers le haut ;
- La méthode du pivot sur la matrice transposée tA avec une colonne témoin. Une base
de l'espace de solutions se lit alors directement dans la colonne temoin.

Test 16.28. a. à résoudre t Ax = 0 ;


b. à résoudre Ax = 0 :
Soit A une matrice de colonnes C 1, ... , Cn.
c. à résoudre (A tA)x = O.
Trouver une relation de dépendance linéaire
entre C 1 , ... , Cn revient : Que pensez-vous de ces trois assertions?

III.3. Retour sur l'exemple des carrés magiques


Dans le chapitre précédent (page 402), nous avons déterminé une base de l'espace vectoriel
X des carrés magiques. Pour la trouver, il nous a fallu de l'intuition ou de l'expérience. Mais
on peut aussi résoudre le problème par une «méthode-pilon » : nous allons considérer X
comme l'ensemble des solutions d'un système linéaire que nous pourrons alors résoudre par
l'algorithme de Gauss.
Il convient de noter que ceci est caractéristique de l'algèbre de première année : contraire-
ment à ce qui se produit dans les chapitres d'analyse, aucune des propositions d'algèbre dans
ce livre n'exige une preuve astucieuse, toutes découlent de méthodes systématiques.
X11 X12 X13
Revenons à notre exemple. Par définition, le carré est magique si
X21 X22 X23
et seulement si les six sommes horizontales et verticales sont égales,
X31 X32 X33
soit encore si
436

Prenons les différences entre X11 + X12 + X13 et les cinq autres sommes. Ainsi le carré est
magique si et seulement si ses coefficients vérifient le système linéaire homogène suivant :

X11 +x12+x13-X21 -xzz-X23=0


X11 + X12 + X13 - X31 - X3z - X33 = 0
X12 + X13 - Xz1 - X31 = 0 (16.13)
{ X11 + X13 - X22 - X3z = 0
X11 + X12 - X23 - X33 = 0

C'est un système à neuf inconnues X11, X12, X13, X21, X22, X23, X31, X32, X33 et cinq équations. Il
est donc de la forme Ax = 0 où la matrice A est de format 5 x 9. On transforme A en
escalier (ce n'est pas la peine de considérer la matrice (A, y), car ici y = 0). Nous obtenons
successivement les matrices suivantes :
11 -1 -1 -1 0 0 0

~JI
11 0 0 0 -1 -1 -1
A= 01 -1 0 0 -1 0 0
10 0 -1 0 0 -1 0
11 0 0 0 -1 0 0 -1

1 1 -1 -1 -1 0 0 0
0 0 0 1 1 1 -1 -1 -1
0 1 1 -1 0 0 -1 0 0
0 -1 0 1 0 1 0 -1 0
0 0 -1 1 0 0 0 -1
:11
1 1 1 -1 -1 -1 0 0 0
0 1 1 -1 0 0 -1 0 0
00 0 1 1 1 -1 -1 -1
00 1 0 0 1 -1 -1 0
00 -1 0 0 0 -1 :11
111 -1 -1 -1 0 0 0
011 -1 0 0 -1 0 0
001 0 0 1 -1 -1 0
000 1 1 1 -1 -1 -1
000 1 -1 -1 -1 J~l
111 -1 -1 -1 0 0 0
011 -1 0 0 -1 0 0
A= 001 0 0 1 -1 -1 0
000 1 -1 -1 -1
000 0 0 0 0 0 0
437

Cette dernière matrice est de rang 4, donc dimX = 9 - 4 = 5. Pour trouver une base, on
résout le système en escalier du bas vers le haut.
X21 = -X22 - X23 + X31 + X32 + X33
X13 = -X23 + X31 + X32
X12 = -X13 + X21 + X31 = -X22 + X31 + X33
XJ 1 = -X12 - X13 + X21 + X22 + X23 = X22 - X3J + X23
Reformulons ce résultat avec les notation des carrés magiques. Nous obtenons
X11 X12 X13 X22 -x220 X23 0-X23 -X31 X31 X31
X21 X22 X23 -X22 X22 0 + -x 23 0 X23 + X31 0 0
X31 X3z X33 0 0 0 0 0 0 X31 0 0

0 0 X3z 0 X33 0
+ X32 0 0 + X33 0 0
0 X32 0 0 0 X33

1 -1 0 1 0 -1 -1 1 1 001 0 10
avec B1 = >---+---+-<
-1 1 0 , B2 = -10 1 1 0 0 , B4 = 10 0 , Bs = 10 0
0 00 00 0 100 010 001

pour base de X.

IV. MATRICES SPÉCIALES

Nous avons vu que pour tout entier n E N*, l'ensemble An(]K) des matrices carrées est
muni naturellement d'une structure d'anneau et même d'algèbre (qui n'est rien d'autre qu'un
anneau compatible avec la structure d'espace vectoriel sur JK). Cette algèbre est d'autant
plus extraordinaire qu'elle est non commutative et qu'elle permet de construire beaucoup
d'autres exemples d'algèbres non commutatives intéressantes en considérant certaines parties
(sous-algèbres) de An(lK).
D'autre part, nous avons également vu que An(lK) contient un groupe remarquable, le
groupe linéaire Gl(n, JK), lui aussi non commutatif. Ici encore, ce groupe permet de construire
explicitement beaucoup d'autres groupes intéressants, en considérant certaines parties (sous-
groupes) du groupe linéaire. Il s'agit d'ailleurs d'une question mathématique à part entière,
et encore actuelle, que d'étudier de quelles facons un groupe donné peut se voir comme un
sous-groupe de Gl(n, JK) : c'est le point de départ de la théorie des représentations.
Dans cette partie, nous allons introduire quelques classes de matrices que l'on rencontre
très souvent dans ces contextes, bien qu'il ne soit pas toujours possible à ce stade d'expliquer
l'intérêt de ces exemples. Nous nous bornerons essentiellement à présenter les objets et le
vocabulaire qui leur est associé. Il faut donc prendre les considérations qui suivent comme une
première sensibilisation à un monde mathématique dont nous levons à peine le voile.
Ce sera aussi pour nous l'occasion de présenter deux méthodes efficaces pour inverser les
matrices de Gl(n, JK).
438

IV .1. Matrices symétriques, triangulaires et nilpotentes


Matrices symétriques.
Les matrices symétriques à coefficients réels seront étudiées en détail dans le cours de géométrie
de deuxième année. Nous nous bornons ici à donner la définition.
Définition 16.49. Une matrice A E Mn(OC) est symétrique si tA A. Elle est anti-
symétrique si tA = -A.

EXEMPLE 16.50. Voici deux matrices symétrique et anti-symétrique respectivement.

123) . (0 -2 -3)
(2 4 5
356
, 2 0 -5
350
.

Matrices triangulaires.
Les matrices triangulaires supérieures (respectivement inférieures) constituent une sous-algèbre
de An(OC). Cela résulte du fait que ces deux classes de matrices forment deux sous-espaces
vectoriels stables pour le produit matriciel. L'intérêt principal des matrices triangulaires est
qu'elles se comportent bien au regard de la question de l'inversibilité : il est facile de voir si
une matrice triangulaire est inversible, et le cas échéant de l'inverser.
Définition 16.51. Soit A= (afkl une matrice carrée d'ordre n.
1) La diagonale de A est le n-uplet (a 11, ... , Unnl.
2) A est une matrice diagonale si tous ses coefficients en dehors de la diagonale sont nuls.
3) A est triangulaire supérieure si tous ses coefficients en-dessous de la diagonale sont nuls,
c'est-à-dire si Ufk = 0 dès que f > k.

U11 UJ2 ... U1n)


a22 ..•Uzn
A= ..
(
Unn

4) De manière analogue, A est triangulaire inférieure si Ufk = 0 dès que f < k, soit encore
si la transposée t A est triangulaire supérieure.

Prop0$ition ·;1$,IS:2. ·• .. . . . .· . .
Soient rt. E .N* êtA.e ....Hn,(~}et,soit e1,.,. , en la btJ,s.e canpni,que de ~- La màtrîce A est
f:ri.angumire s~tfaffl si et seulement si l 'app1icâtion linéaitré Â : .K~ 4 gn estttlle que
A(vect(e,, ••• ,et.Hè vect(e1,•... ,~) pour k = J ,•; •. , n.·
PREUVE.
► Soit A triangulaire supérieure et soit k un entier tel que 1 ,( k ,( n. Alors
n k
Â(ek) = L Ufk ef = L Ufk ef E vect(e1, ... , ek), car Ufk = 0 pour f > k.
f=l f=l

Supposons de plus, dans le cas où k 2: 2, que Â( vect ( e,, ... , ek-l)) C vect ( e1, ... , ek-l) (si
k = 1, on ne suppose rien). Comme tout vecteur de vect ( e,, ... , ek) peut s'écrire comme
439

combinaison linéaire d'un vecteur de vect (e1, ... , ek-l) et de ek, il résulte de la linéarité de
 (voir la règle 16.5, page 408) que toute combinaison linéaire de e 1, ... , ek est transfor-
mée par  en une combinaison linéaire d'un vecteur de vect(e1, ... ,ek-il et d'un vecteur
de vect (e 1, ... , ek), soit encore en un vecteur de vect (e1, ... , ek) car vect (e1, ... , ek-1) C
vect (e 1, ... , ekl- Nous avons donc démontré les n conditions souhaitées par récurrence sur k.
► Inversement, supposons que les n conditions de l'énoncé soient satisfaites. Alors pour 1 ~
k ~ n, comme ek E vect ( e 1, ... , ek), nous en déduisons que
n
Â(ek) = L aek ee
e=l
peut s'écrire comme une combinaison des vecteurs e1, ... , ek, soit encore que Uek = 0 pour
tout e > k puisque la décomposition de Â( ek) dans la base e1, ... , en est unique. ■

Rêgle 16.53. Le produit de d,eux matrices triangulaires supériev:res de .lnfK) est une
matrice triangulaire su:péri,eure.

PREUVE. Soient A et B deux matrices triangulaires supérieures. Alors la proposition précé-


dente montre que pour 1 ~ k ~ n, on a

ce qui montre bien que AB est encore triangulaire supérieure. ■

Règle 16.54. Une matrice triangulaire de .lnfK} est de rrsng n si et seulement si tous ses
éléme.nts diago?iaux sont nim,.nt,J,s. ·

PREUVE. Considérons une matrice triangulaire supérieure (pour une matrice triangulaire
inférieure on passera à la transposée).
(===}) Supposons que rg A = n. Supposons par l'absurde qu'il existe p E {1, ... , n} tel que
uPP = O. Alors les n - p + 1 lignes lp, ... , ln sont liées car elles sont engendrées par les
n-p vecteurs ep+l, ... , en tirés de la base canonique de !Kn, ce qui contradit l'hypothèse que
A est de rang n.
({==) Si les éléments sur la diagonale sont tous non nuls, alors la matrice triangulaire est en
escalier. Elle a donc n pivots et elle est bien de rang n. ■

RèglEI . UUi5 • . Une matrif;t inversible triangulaire supérieure (respectivement inférieure) de


AnfK} a une inverse triangulaire supérieure {respectivement inférieure).

PREUVE. Soit A une matrice triangulaire. Quitte à considérer t A, nous pouvons supposer
que A est triangulaire supérieure. Notons A = ( urkl avec urk = 0 pour f > k et Ukk =/- 0 pour
k = 1, ... , n. Pour inverser la matrice A, nous allons résoudre l'équation Ax = 11 pour tout
n-uplet 11 = t(111, ... , 1lnl E !Kn. Il s'agit donc de résoudre le système suivant :

U11X1 + U12X2 + · · · + U1nXn = 111


U22X2 + · · · + UznXn = 1lz
.. ..
{
. .
UnnXn = 1ln•
440

Ce système se résout sans difficulté en partant du bas. Nous obtenons que pour tout entier k
tel que 1 ~ k ~ n, il existe des coefficients bkk, ... , bnk, fonctions des aii, tels que
n
Xk = L, bkm11m·
m=k

En fait, il est facile de montrer que

-- Uk,k
1
bk,k+l = ---ak,k+l bk+1,k+1,,
Uk,k
1
bk,k+2 = ---(ak,k+l bk+l,k+2 + ak,k+2bk+2,k+2l,
Uk~ ·

1
= ---(akk+lb k+l n + Ukk+2bk+2n + · · · + Uknbnnl-
ak,k , , ' ' '
Ainsi, par récurrence descendante sur k, nous obtenons des coefficients bkp pour tous les
couples d'entiers (k, p) tels que 1 ~ k ~ p ~ n. En posant bkp = 0 pour k > p, nous
définissons une matrice B = (bkp) triangulaire supérieure telle que

Ax = 11 si et seulement si x = B11

pour tous x, 11 dans ocn, ce qui montre que B = A- 1 et donc que l'inverse de A est bien
triangulaire supérieure. ■

Au passage, notons que la démonstratio n ci-dessus donne aussi une méthode rapide pour
inverser une matrice triangulaire : il suffit d'écrire le problème sous la forme d'un système et
de le résoudre en partant du bas.

EXEMPLE 16.56. Inversons la matrice


123)
A=
(014 .
001
Cela qui revient à résoudre le système
x1 +2x2+3x3= 111
X2 +4x3 = 112
{
X3 = 113·

Ainsi,
441

Matrices nilpotentes.

Définition 16.57. Une matrice A E .4tn(]K) est nilpotente s'il existe un entier p ? 1 tel
que AP = O. Le plus petit entier p qui vérifie cette propriété est appelé l'ordre de nilpotence
de A.

L'exemple typique d'une matrice nilpotente est une matrice triangulaire de diagonale nulle,
par exemple de la forme

0 a12 ... a,n )


. .
- 0 ·.:
A - .
( · .. Un-1,n
0

Le lecteur vérifiera que An = O. En fait, toute matrice nilpotente de .4lnCIK.) vérifie que An = 0,
mais ce n'est pas une propriété évidente. Nous la démontrerons dans le cours de deuxième
année.

Test 16.29. Test 16.30.


Que pensez-vous de des affirmations suivantes? Quelle est la dimension de l'espace des matrices
a. Une matrice diagonale est une matrice qui n x n qui sont
est à la fois triangulaire supérieure et inférieure. a. triangulaires supérieures,
b. symétriques,
b. Si A est inversible et symétrique, alors son
c. anti-symétriques?
inverse l'est aussi.
c. Le produit de deux matrices triangulaires in- Test 16.31.
férieures est encore une matrice triangulaire in- Une matrice carrée peut-elle toujours être trans-
férieure. formée par des opérations élémentaires sur les
d. La diagonale d'une matrice antisymétrique lignes en une matrice triangulaire inférieure ?
est forcément nulle. Test 16.32.
e. Pour tout A E Mmn(K), la matrice tAA est
Montrer que la matrice suivante est nilpotente
symétrique. et déterminer son ordre de nilpotence.
f. Il n'y a pas de matrice nilpotente inversible.
g. La somme de deux matrices nilpotentes est
nilpotente.
h. L'ensemble des matrices symétriques est un
sous-anneau de Mn(K).

IV. 2. Matrices élémentaires

Par la méthode du pivot, nous pouvons transformer toute matrice inversible en la matrice
identité. Cette idée est le point de départ pour deux procédés : trouver une famille de
générateurs du groupe linéaire et obtenir un algorithme pour inverser une matrice.
L.:. IV .2 .1. Les matrices élémentaire s engendrent Gl( n, JK)

Définition 16.58.
Les matrices élémentaires n x n définies pour (C, k) E {1, ... , n}2, C -/- k, À E JK*, µ E lK
sont les matrices suivantes :
1) Uek se déduit de la matrice identité en permutant la Cième et la kième ligne ;
2) Ue[;.\] se déduit de la matrice identité en substituant au fième chiffre 1 de la diagonale le
nombre À;
3) Uedµ] se déduit de la matrice identité en substituant au coefficient nul d'indice (C, k) le
nombreµ.
Les schémas suivants représentent les matrices élémentaires. Les pointillés sur la diagonale
sont des 1. Comme d'habitude, il n'y a que des zéros dans les espaces vides.
k e e
l 1 l

k-, 0
Uek= Ue[À] =
e-, 0 e-, À

k
1

e-, µ

Test 16.33. Uek[µ] = lin + µEek-


Que pensez-vous de ces identités? Rappel : Eek désignent les matrices de la base
canonique de .4tn(K).
Ue[l] = lin, liedµ] = Uke[µ], Ue[l] = Udll,
Uek = Uke, UedO] = lin, Test 16.34.
Uek = lin - Eee - Ekk + Eek + Eu, Expliciter dans GL(4, K) les matrices li4,1,
Ue[À] = lin+ (À - 1)Eee, U2[2] et U 1,3[-2] .

Soit U une matrice élémentaire de Gl(n, JK). Considérons les multiplicatio ns à gauche et
à droite par U.
.4tnm(lK) --t .4tnm(lK), A H UA,
.4tmn(lK) --t .4tmn(lK), AH AU.
Il existe un « dictionnaire » entre ces applications et leurs effets sur la matrice A. Plus
précisément, multiplier à gauche A par une matrice élémentaire se traduit par une opération
élémentaire sur les lignes de A; multiplier à droite par une matrice élémentaire se traduit par
une opération élémentaire sur les colonnes de A. Nous pouvons résumer ces correspondan ces
par le tableau suivant :
443

Matrice élémen- UA = opération élémentaire sur AU = opération élémentaire sur


taire U les lignes de A les colonnes de A
Urk lr t----+ l k Ce t----+ ck
Ue[À] leHÀle Ce H ÀCe
Uek[µ] le H le+ µlk ck H ck + µCe

Par exemple, multiplier par U 3 ,1 [2] à droite (resp. à gauche) a l'effet suivant :

7 221)
= 6240 .
( 2211

En particulier, nous obtenons que

Par conséquent, les matrices élémentaires sont inversibles, c'est-à-dire dans Gl(n,JK), et leurs
inverses sont encore des matrices élémentaires.

Proposition 16.59. Les matri~s élémentaires engendrent le groupe Gl(n, JK). Autrement
dit, toute matrice A E Gl(n,JK) peut s'écrire sous la forme d'un produit d'un nombre fini
de matrices élémentaires.
PREUVE. Soit A E_Gl(n, JK). Par la méthode du pivot, nous pouvons tran~former A en une
matrice en escalier A. Comme A est de rang n, la règle 16.54 montre que A est triangulaire
supérieure inversible avec des 1 pour pivots sur la diagonale, c'est-à-dire qu'elle est de la forme

** *
1 * *
A=
*

Toujours par des opérations élémentaires sur les lignes, nous « nettoyons » A au dessus des
pivots, en commençant avec la dernière ligne, pour obtenir finalement la matrice identité.
Nous avons donc transformé, par un nombre fini d'opération élémentaires sur les lignes, la
matrice A en la matrice lin. Soient U 1, ... , Um les matrices élémentaires correspondant à ces
opérations (dans l'ordre où elles sont effectuées). Alors
(16.14)

ce qui montre que A est un produit de matrices élémentaires. ■


444

IV.2.2. Calcul de l'inverse

La preuve de la proposition 16.59 nous donne une méthode élégante pour calculer l'inverse
d'une matrice par la méthode du pivot de Gauss. En effet, la relation donnée par (16.14)
s'écrit encore
A- 1 =lim···U1lln,

..... Donc les opérations élémentaires sur les lignes qui transforment A en lln transforment pareille-
.....
.....
V
ment, si elles sont effectuées dans le même ordre, la matrice lln en A- 1 .

~ Règù{16.60. Poûr déterminer'l'inuerse d'une matrice A, ilsuffit de transformer la matrice


(A,ln) en une matrice de la forme (i111 B) par des apérations élémentaires sur les lignes, alors
B = A-1• Si au cori:rs du procédé, il s'avère. qu'il n'est po;s possible de transformer A en ln,
alorsA n'est pcis invèrsible. ·

PREUVE. Il nous reste à montrer la seconde partie de la règle. Le procédé s'arrête en cours
de processus exactement lorsque la matrice transformée contient une colonne sans pivot. Il
est alors clair que cette colonne peut s'exprimer comme combinaison linéaire des colonnes
précédentes, ce qui montre que la matrice n'est pas inversible. ■

EXEMPLE 16.61. Inversons une matrice 3 X 3. Nous avons successivement


( 1 1/20 1 0 0
(A, ITnl = 2 0 1 0
-4 1 2 0
1
0
0
1 )~J
(li 1/2 0 1 0
-1 1 -2 1
3 2 4 0
~) ~! I · -1
1/2 0 0 0 )
1 -1 2 -1 0 f---i+
0 5 -2 3 1 1 · i J

Donc
11/20)-l l ( 1 1-2)
2 0 1 =
( -4 1 2 5 -28 -23 11 .

Test 16.35. Test 16.36.

Inverser, si possible, la matrice A =( n l).


1 10
Pour a, b, c dans IK, inverser A= ( ~? 8).
b c 1
445

IV.2.3. Sous-groupes du groupe linéaire


'il
·o i
Cette partie prépare la décomposition lR de la partie suivante. Nous aurons besoin des ma- ~ !'
trices de permution et des matrices triangulaires. Mais il était difficile de pas citer au passage s
le groupe des matrices matrices inversibles sur l'anneau Z. :i
c:,)
ëil
ü
Le groupe linéaire des matrices à coefficients entiers. (.0
......
Le produit de deux matrices carrées à coefficients dans Z est encore une matrice à coefficients .d
ü
dans Z, mais il n'est pas vrai en général que l'inverse d'une matrice à coefficients entiers a
ses coefficients dans Z. Notons que toute matrice d'ordre n à coefficients entiers envoie les
vecteurs de coordonnées entières, c'est-à-dire éléments de zn, sur des vecteurs de coordonnées
entières. Autrement dit, elle préserve le réseau zn C JRn. Une matrice d'ordre n inversible
sur l'anneau Z est une matrice carrée à coefficients entiers qui réalisent une bijection sur ce
réseau zn.
Définition 16.62. On note Gl(n, Z) le groupe de toutes les matrices A dans Gl(n, JR)
dont tous les coefficients et tous ceux de A_, sont entiers.
Il est clair que Gl(n, Z) est un sous-groupe de Gl(n, JK). Dans le chapitre sur le détermi-
nant (proposition 20.22), nous verrons une autre caractérisation de Gl(n,Z).

EXEMPLE. 16.63. ( 2 3) (-l 3)


► La matnce A = est dans Gl{2, Z) car A comme A- 1 = 1 2
_sont bien des
11
matrices à coefficients entiers.

► La matrice (~ ~) n'est pas dans Gl{2, Z) car son inverse (~ 1~2) n'est pas à coefficients
entiers.
Le groupe des matrices de permutation.indexM atrices !de permutation
Proposition-définit ion 16.64. (Matrices de permutation).
1) Pour toute perrnutation o- E 6n, la matrice

Pa= (6t,a{k)h~.~h.

est dans Gl( n, Z) .. Une matrice de cette forme est appelée matrice de permutation.
2) L'application
P : 6n -¼ GL(n,Z), o- H Pa,
un
est un m01j>his1M injectif de groupes. Son i'mage est sii'tl,S-fll'O't,jpe de Gl.{ n; Z}, iso:rr/bl'phë
au groupe symétriqtJ,e Sn. On l'appelle le groupe de matrices de permutation.
~) Multiplier une matrice A E .A'nm(lK) à gauche par Pa se traduit par une permutation des
lignes L1, ••• , ln de l\ .selon la/ormy.le ·

PaA = P.,, L1)


Lz
.
..,--1.11>)
= .(L.la-1<2J
... . (16.15)
..
(Ln . l.,--t(n)

En particulier, si <r est la transposition qui échange k et e, on obtient la matrice élémentaire


Pa= Ukf.
446

La formule (16.15) est trompeus e.


En effet P cr permute bien les lignes de A suivant cr, dans le sens où la ligne lk de A se
lit à la cr(k Jième ligne dans P crA pour tout entier 1 :S;: k :S;: n. Cela résulte du fait que
lcr1 (cr(k)) = lk.

- Par exemple, pour la permutation cr= (4, 1, 3, 2), on a Pcr= ( g Hl).


1000
On voit que P cr est la
matrice obtenue en appliquant la permutation cr aux lignes de la matrice identité.
PREUVE.
► Soit cr une permutation et soit A E Atnm0K). La f-ième ligne du produit P crA est le produit
de la f-ième ligne de Pcr et de A. Or la f-ième ligne de Pcr est le vecteur ecr1(fl de la base
canonique de ocn. Donc La f-ième ligne de P cr A est la ligne lcr1 (il de A, ce qui démontre la
propriété 3).
► Prenons maintenant le cas où A = P--r, avec 'T E 6n . Alors, d'après ce que nous venons
de
voir, la f-ième ligne de PcrP --r est la cr- 1 ( f )-ième ligne de P--r , donc c'est le vecteur e., 1cr 1(il =
er=i-1 (il· Ainsi
Pcr--r = PcrP--r. (16.16)
En particulier PcrPcr1 = Pcrcr1 = Pid = (l'irkl =lin.Donc Pcr est inversible d'inverse (Pcr)- 1 =
P cri. Donc P cr et son inverse sont à coefficients entiers. Ainsi l'application P est bien un
morphisme de groupes de 6n dans Gl(n, Z).
► Comme la permutation identité est la seule ayant pour image la matrice identité, le noyau
du morphisme P est l'élément neutre de 6n ce qui montre l'injectivité de P. ■

Remarque. Il est facile de vérifier qu'une matrice carrée est une matrice de permutation si
et seulement si chaque colonne et chaque ligne contiennent exactement un seul coefficient non
nul, égal à 1. Un calcul immédiat montre alors que Pcr tp cr = lin.

PREUVE. Cela résulte des relations P cr tp cr = lin et P cr Pcr' = Pcrcr' pour toutes permutations
cr, cr' dans 6n. ■

Pl"oposition J;tUi6. Le grouw de$ m,tJtrices de perm'/Jitation èst-eo!J(mdfré. tmr Ici, matrices
élémentaires Ukt.

PREUVE. La matrice Ukl est la matrice qui correspond à la transposition de k et f. Le


résultat s'en déduit car nous avons vu au chapitre 10 que toute permutation est le produit de
transposition s. ■
447

Groupes des matrices triangulaires.


Proposition 16.67.
1) L'ensemble T+ des matriœs triangulaires supérieures de rang n. constitue un sous-groupe
de GL(n,K). n est engendréparles matrices élémentaires lie[ÀJ avec 1 ·~ f .~ n, À E K*, 1
et li&[µ] avec 1 :( f < k ~ n, µ E K ··
2) L'ensemble N+ des matrices triangulaires supérieures avec des l fJ'IJ,r la diagonale constitue
~u
un sov.s-groupe de T+. Il est engendre par les matric.es élémentaîres li&[µ] 1 ~ f < k~ n., co
.....
µ € ][{. On note N+ èe grouy,e. ..d
u
Notons T- et N- les groupes analogues constitués de matrices triangulaires inférieures.
PREUVE.

1) Remarquons que les générateurs proposés sont bien triangulaires supérieurs de rang n, ils
sont donc dans T+. De plus, nous savons grâce à la régle 16.53 que le produit de deux matrices
de T+ est encore dans T+. Soit A E T+. Alors par des opérations élémentaires sur les lignes,
nettoyons, en partant du bas, tout ce qui se trouve au-dessus de la diagonale.

U1 * ·. · ~)
Uz ·
A= devient A'=
( *
Un

Nous avons utilisé exclusivement des opérations élémentaires de la forme le H le+ µlk, avec
e< k. Il existe donc une matrice M produit d'un nombre fini de matrices de la forme Uek[µl,
avec e< k, telle que MA= A'.
Transformons maintenant A' en la matrice lin par des opérations élémentaires de la forme
le H Àle. Donc il existe une matrice M' produit de matrices de la forme Ue(;\] telle que
M'A' = lin- Ainsi M'MA = lin. Nous en tirons deux conséquences :

- L'inverse A- 1 = M'M est bien dans T+ comme produit d'éléments de T+.


- On a la relation A= (M'M)- 1 .
De la première assertion, nous concluons que T+ est bien un groupe et il résulte de la seconde
assertion que les matrices indiquées sont bien des générateurs de T+, car UedµJ- 1 = Ued-µ]
et Ue[À]- 1 = Ue[À- 1].
2) Un calcul immédiat montre que la diagonale du produit de deux matrices triangulaires
supérieures est donné par le produit terme à terme des deux diagonales. En particulier, le
produit de deux matrices de N+ est encore dans N+. Le reste de la démonstration est analogue
à celle du point précédent. ■

Remarque. Il existe des énoncés analogues pour T_ et N_. Pour les démontrer, il suffit de
se ramener par transposition au cas des matrices triangulaires supérieures.

Test 16.37. Test 16.38.


Comment se traduit la multiplication à droite Un étudiant calcule l'inverse d'une matrice.
par P cr sur les colonnes d'une matrice A E Soudain, il se rend compte qu'il ne voulait pas
.4tmn(K)? inverser cette matrice mais celle dont les deux
premières lignes sont permutées. Doit-il recom-
mencer du début? Généraliser.
448

Test 16.39.
Déterminer l'inverse de

IV.2.4. La décomposition LR

Dans cette partie, nous allons montrer que toute matrice inversible se décompose en un produit
de trois matrices, éléments des trois sous-groupes remarquables de GL(n,JK:) introduits plus
hauts. L'intérêt de cette décomposition vient de ce que les trois matrices obtenues sont plus
faciles à inverser en général que la matrice d'origine.
Nous notons WC GL(n,JK:) le sous-groupe des matrices de permutation. Rappelons que
N- (respectivement T+) est le groupe des matrices L (respectivement R) de la forme

Rappelons que chacun de ces éléments est très facile à inverser. La dénomination L (respec-
tivement R) vient de left ou links (respectivement right ou rechts) et se réfère à la position
relative des coefficients non nuls par rapport à la diagonale.

PropÔsition 16.68. (l>éœfflpo:ntion tRJ .·•· ........· . ·..... ·. ·.. .....·. .•


Toute matrice A E Gl(n, KJ se d~mpose en un produit de f!rois matrices4'de ·ià forme
A z.PlR, avecl EN-, RE r+ et P E W.
Nous pouvons retenir cette proposition par l'écriture suggestive

qui est une notation sibylline pour rappeler que l'application W x T- x T+ ---+ GL(n, JK:) :
(P, L, R) H PLR est surjective.
Attention : la notation W T- T+ est trompeuse. Elle ne signifie pas que cette application
est un morphisme de groupes, et encore moins que GL(n,JK:) est isomorphe au produit des
groupes W x T- x T+.

PREUVE. Soit A E GL(n,JK:). Par l'algorithme de Gauss, sans normalisation des pivots,
transformons la matrice A en une matrice R triangulaire supérieure inversible. L'algorithme
comprend n - 1 étapes, chacune consistant à installer un pivot et à nettoyer en dessous dans
la colonne du pivot. Par conséquent,

Mn-lMn-2 · · · M1 A= R,

4
Évidemment « décomposition PLR » serait une appellation plus appropriée.
449

où la matrice Me se traduit par une série d'opérations élémentaires sur les lignes correspondant
à la fième étape. Précisons la forme de la matrice Me : elle correspond à l'installation d'un
pivot à l'emplacement d'indice (e, f), puis d'un « nettoyage» en-dessous du pivot. Donc
1
S'il n'est pas nécessaire de permuter deux lignes pour installer le pivot, nous prendrons k = €,

car Uee = ITn. Si le nettoyage est superflu, nous prendrons ~ = 0 car Uu[O) = ][n· Dans cette (C
......
fième étape, le nettoyage complet en-dessous du pivot est donc réalisé en multipliant par la ..d
ü
matrice
e
l

(16.17)

e.
Soient pet q deux entiers tels que n ~ p > q > Échangeons les colonnes pet q de Ne, puis
les lignes p et q, alors les 1 de la diagonale reviennent sur la diagonale et le seul effet obtenu
sur Ne est de permuter les coefficients ~ et µq. Ainsi la matrice Nf = UpqNeUpq est encore
de la forme (16.17). Nous venons de montrer le résultat suivant.

Lemme 16.69. Soient p et q deux entiers tels que n ~ p > q > t. Alors lèS matrices
élémen~aires Up4 ,commutent presq1te avec. l.es ~trit;es Nt de la /01'f11,e do?'Jmé:e pg,r.JUi.17)
dans le sens sui.voot:' : pour tmite matri,ce Ni, il ex#,te une matrice Nt de. la matiu: fo~
telle que Upq Ne= Nf Upq.

Nous poursuivons la preuve de la proposition 16.68. Le lemme ci-dessus permet de regrou-


per dans Mn-1 Mn-2 · · · M 1 toutes les matrices élémentaires qui correspondent aux permu-
tations. Par exemple, pour deux étapes consécutives, nous avons

où nous avons utilisé que p ~ e+ 1 ~ e.


De manière analogue, nous pouvons regrouper à droite l'ensemble des matrices élémentaires
correspondant aux permutations. Ainsi,

Mn-lMn-2 · · · M1 = NQ
où N est un produit de matrices de la forme (16.17), avec € = 1, ... , n - 1, et où Q est un
produit de matrices élémentaires du type Uu. Donc N est dans le groupe r- des matrices

5
Cette propriété rappelle la définition de sous-groupe distingué. Mais ici les matrices du type Ne ne constituent
pas de sous-groupe de Gl( n, OC).
450

triangulaires inférieures avec uniquement des sur la diagonale et Q est une matrice de
permutation. Or

R= Mn-1Mn-2 · · · M1 A= NQA =} A= Q- 1 N- 1 R.
i::: On conclut en posant P = Q- 1 et l = N- 1 .
,.c
•V

~
EXEMPLE 16.70. Déterminons la décomposition lR de la matrice ( ~ âl E Gl(n,JK}.
D'après la règle 16.27, nous savons que ad - be -1- O. Ainsi a -1- 0 ou b -1- O.
► Considérons d'abord le cas a -1- O. Alors nous nettoyons avec le pivot a et il est superflu

n(: !) ud:bc)
de permuter les lignes.

(~~ = (~

Gn(~ ud:bc) .
D'où la décomposition

(; : ) = (16.18)

► Considérons maintenant le cas c -1- O. Alors nous permutons les deux lignes, puis nous
nettoyons avec le pivot c.

D'où la décomposition
(16.19)

En général, la décomposition lR n'est pas unique : si dans l'exemple ci-dessus a et c sont


tous les deux non nuls, les deux décompositions (16.18) et (16.19) sont valables.

Si l'algorithme de Gauss ne fait pas appel à une permutation de lignes, il existe une
décomposition lR où la matrice de permutation est l'identité, comme dans (16.18). Voici un
critère plus maniable pour prouver l'existence d'une telle décomposition.

Proposition 16.71. Soit A= (atk} une matrice arbitraire dans Gl(n,K}.


1) Les propriétés suivantes sont équivalentes :
a) A possède unè. décomposition de la forme A = LR avec l E r- et R E T+;
=•.
b) pour tout p tel que 1 ~ p ~ n, le bloc Ap (at1ch,;;;t._;p E Lp(K} est de rang p.
1,;;;k,_;p . •
2) Si A possède une décomposition de la forme A = lR avec l E T~ et R E T+, alors l èt
R sont uniques.
PREUVE.
1) Supposons que A= lR avec l ET- et RE T+. Comme pour A et Ap, notons lp le bloc
px p des p premières lignes et colonnes tronquées del et, de manière analogue, notons Rp le
bloc correspondant pour R. Alors

où les étoiles désignent des blocs de formats adaptés. Ainsi Ap = lp Rp et comme lp et Rp


sont de rang p, c'est-à-dire inversibles, la matrice Ap l'est aussi.
451

Réciproquement, nous raisonnons par récurrence sur n pour montrer l'implication b) =} a).
Le cas n = 1 est immédiat. Soit n ~ 2 et supposons l'implication a)=} b) démontrée pour les
matrices dans Gl(n-1, K). Soit A E Gl(n, K) telle que tous les blocs Ap, pour p = 1, ... , n,
sont de rang p. Posons A' = An-l· Par hypothèse, nous savons que l'A' = R' avec des
matrices l', R' de format (n - 1) x (n - 1) et de la forme

avec r, · · · Tn-1 -/- O.

Nous obtenons par des calculs par blocs

r, * .. . * *
* Tz

*
* ... * 1 Tn-1 *
Unl • • • • • • Un,n-1 Unn * * *
Écrivons cette égalité sous la forme MA = S. Les éléments diagonaux de R' étant non nuls,
nous pouvons, par des opérations élémentaires sur les lignes sans permutations, transformer
Sen une matrice RE T+. Il existe donc M' ET- telle que M'S = R. Ainsi M'MA = R, soit
encore A= lR, où nous avons posé l = (M'M)- 1 ET-, ce qui démontre la condition a) et
donc l'implication réciproque pour les matrices de taille n.
2) Supposons que A = l 1R, = l2R2 avec li E T- et Ri E T+. Alors l 21 l, = R2R11 est
dans T- n T+. Or il est clair que cette intersection ne contient que la matrice identité. Donc
l 21 l, = R2R11 = In ce qui implique que l, = l2 et R, = Rz. ■

Évidemment, ce critère est un résultat plutôt théorique car vérifier que tous les blocs Ap
sont de rang maximal prend plus de temps que d'appliquer l'algorithme de Gauss sur A.

Test 16.40. Test 16.41.

Déterminer la décomposition LR de (~; ~) . Déterminer la décomposition LR de (; ~ !) .


1 14 3 8 14

V. EXERCICES

16.1. 16.2.

Résoudre le système suivant, Déterminez les puissances Am, m = 0, ... , n,

X+ 1J + 2z + t 1
X + 4-y + Sz + 2t -1
{ 2x - y + z + t 4
7x + 4-y + 11z + 6t 9
452

de la matrice n x n 2. Montrer que le centre de An(OC) est formé


des matrices homothétiques Àiln , À E OC.
(Indication : s'aider des matrices de la base ca-
nonique.)

16.7.
16.3.
Soit A = (aekl E An(<Cl une matrice carrée
complexe.
Soit A = (aek) E Amn(lR) une matrice et
1. On suppose que A est « diagonal-
b = ( :~) un vecteur non-nul de JRm tel que dominante », i.e., pour tout (i, k) E {1, ... , n}2
avec i i= k on a
pour tout k = 1, ... , n

Montrer que A est inversible. (Indication: Mon-


trer qu'une dépendance linéaire entre les co-
lonnes amène à une contradiction.)
2. Montrer que le résultat de 1. reste valable
Démontrez que le système linéaire Ax = b ne
sous l'hypothèse plus faible où les inégalités
possède pas de solution. strictes lakkl > n - 1 deviennent larges à l'ex-
(Indication : Entamez une preuve par l'absurde ception d'une. Montrer sur un exemple simple
et évaluez le produit tb b de deux manières dif- que le résultat devient faux si toutes ces n in-
férentes.) égalités deviennent larges.

16.4.
*
3. On suppose que laekl < pour tout (i, k) E
{l, ... , n}2. Montrer que Iln + A est inversible.

Exhibez deux matrices A, B E A4(<C) telles que


16.8.
rg A= rg B = 2 et AB = O.
Montrez que les matrices suivantes forment un
16.5.
sous-groupe de Gl(2, Z) isomorphe au groupe
symétrique 63,
Soit C l'ensemble des matrices réelles de la
forme ( ~ -;).
1. Montrez que C est un sous-espace vectoriel
b= (11 -10)
de A2(1R). En donner une base.
2. Montrez que C est un sous-anneau de A2(1R)
f= (-1-1 01)
isomorphe au corps <C.
3. Calculez la puissance ( c?s ex ~ sin ex) k pour Remarque. Nous savons déjà (voir proposi-
sm a cos ex
tout k E Z. tion 16.64) qu'on peut représenter 6 3 comme
sous-groupe de Gl(3,Z). L'exercice dit qu'on
16.6. peut même le représenter dans le groupe plus
petit Gl(2,Z).
Le centre Z(A) d'un anneau A est l'ensemble
des éléments qui commutent avec tous les élé- 16.9.
ments,

Z(A) = {b E A 1 \;la E A, ba =ab}. Soit A E An(OC) une matrice nilpotente. Mon-


trez que Iln - A est inversible. ( Indication :
1. Montrez que Z(A) est un sous-anneau com- Pensez à la somme 1 + A + A 2 + ... + A k pour
mutatif de A. Dans quel cas a-t-on Z(A) =A? k grand.)
Chapitre 17
ESPACES VECTORIELS ET APPLICATIONS
.,.
LINEAIRES

PRÈS avoir traité en détail le cas de l'espace canonique, nous allons généraliser les

A notions que nous avons introduites dans les deux précédents chapitres. Mais pourquoi
ne pouvons-nous nous contenter de nos calculs explicites dans ocn?
Le développement de l'algèbre linéaire relève de ce que l'on appelle l'abstraction ma-
thématique : plutôt que de refaire les mêmes preuves dans chaque situation rencontrée, il
est intéressant de rassembler toutes ces situations et d'en abstraire une notion générale qui
pourra se spécialiser dans chaque cas. Le gain évident en est que les preuves sont faites une
fois pour toutes, l'autre intérêt étant que l'abstraction épure les preuves de leurs contingences,
et qu'ainsi il est plus facile de comprendre comment elles fonctionnent : la notion générale
peut alors devenir objet d'étude en soi et permet d'aller plus loin.
Mais il n'est pas simple d'abstraire une notion mathématique. C'est un acte de création
au même titre qu'un philosophe crée des concepts ou qu'un peintre peint un tableau. Ce n'est
pas arbitraire, cela répond à une problématique 1 .

1. IK-ESPACES VECTORIELS ET IK-ALGÈBRES

1.1. Le point de vue axiomatique

Longtemps les mathématiciens ont calculé sans avoir besoin de formaliser la notion explicite
d'espaces vectoriels parce qu'ils manipulaient des objets particuliers, représentés dans des
systèmes de coordonnées. Mais certains espaces ne se présentent pas avec un système de
coordonnées privilégié. C'est le cas notamment des espaces de fonctions. Par exemple, si l'on
considère l'ensemble 'b"(IR) de fonctions continues de IR dans IR, la somme de deux fonctions
continues ou le produit d'une fonction continue par un nombre réel ont un sens, et pourtant,
il n'existe pas de système de coordonnées naturel sur 'b"(IR).
Le point de vue axiomatique opère un renversement dans la définition d'un espace vecto-
riel. Au lieu de le définir par l'existence d'un système de coordonnées, on modélise un espace
vectoriel par les règles que doivent suivre les calculs possibles en son sein. Il s'agit donc de
répondre à la question suivante : si on veut manipuler des objets quelconques qui peuvent
s'additionner et être multipliés par des scalaires, sans avoir recours à un système de coor-
données particulier, quelles sont les règles qu'il faut respecter au minimum pour que cela soit
raisonnable?

1
Dans ce sens, une abstraction mathématique est toujours littéralement concrète.
454

1. 1. 1. Les axiomes d'un espace vectoriel

Les mathématiciens ont fait le pari que les huit axiomes de la définition d'espace vectoriel ci-
dessous répondent à la question. Ces axiomes ne tombent pas du ciel. Il faut bien comprendre
qu'ils n'expriment pas les conditions a priori de tout calcul possible, mais au contraire les
conditions a posteriori de tout calcul que l'histoire des mathématiques a retenues. Ces huit
règles doivent donc être comprises comme un cahier des charges minimal pour que les calculs
soient raisonnables. Ils sont bien évidemment calqués sur les huit règles (cf. 15.2) que nous
avions énoncées dans ocn.

Définition 17 .1. Un OC-espace vectoriel ou espace vectoriel sur OC est un ensemble E muni
de deux lois,

une loi interne, notée + E X E --1 E ' (u, V) H u +V;


une loi externe, notée · OC x E --1 E , (i\, u) H i\ • u

telles que les huit axiomes suivants soient vérifiés.

EV1 V(u,v) E E2, u+v =v+u.


EV2 V(u,v,w) E E3 , (u+v) +w = u+ (v +w).
EV3 :lOEE, 'v'vEE, v+O =u.
EV4 'v'vEE :l-vEE, v+(-v)=O.
EVs Vv E E, 1 ·V =V.
EV6 Vv E E , V (i\, µ) E OC2 , i\-(µ-v) = (i\µ)-v.
EV7 Vv E E , V (i\, µ) E OC2 , (i\ +µ)·V= i\ ·V+µ· V.
EVs V (u, v) E E2 , V i\ E OC , i\-(u+v) =i\•u+i\-v.

On appelle les éléments de E les vecteurs, et les éléments de OC les scalaires.

Définition 17 .2. Un sous-espace vectoriel d'un espace vectoriel E est un sous-ensemble


non vide F C E stable par addition et multiplication par les scalaires, dans le sens que
V (u, v) E F2 , \fi\ E OC, u +vEF et i\ · v E F .
Autrement dit, les deux lois sur E peuvent se restreindre en deux lois sur F.

Remarque.
o Les quatre premiers axiomes ne concernent que la loi interne. Elles expriment que (E, +)
est un groupe abélien.
◊ Quand on munit un ensemble d'une structure comportant plusieurs lois, on impose des
conditions de compatibilité. C'est un fait très général. Les axiomes EV7 et EV8 expriment
la compatibilité de la loi · avec la loi +, l'axiome EV6 exprime la compatibilité entre la loi
· et la multiplication dans le corps 1K.
◊ Tout C-espace vectoriel est aussi un :IR-espace vectoriel. En effet, lR est un sous-corps de C ;
donc si les axiomes EVs à EVs sont vérifiés pour les scalaires complexes, ils le sont a fortiori
pour les scalaires réels.
◊ Si E est un OC-espace vectoriel et si F est un sous-espace vectoriel de E, alors F est un OC-espace
vectoriel. En effet, les deux lois sur E induisent deux lois sur F qui vérifent immédiatement
les huit axiomes par restriction, à ne pas confondre avec celle du point précédent où nous
avons restreint le corps des scalaires mais non l'ensemble des vecteurs.
455

o Nous n'utilisons pas la flèche v


pour les vecteurs, car le contexte permettra toujours de
distinguer les vecteurs des scalaires. 2
o Le symbole 0 peut désigner plusieurs objets différents : le vecteur nul de l'espace vectoriel
E, le scalaire nul dans 1K et même l'espace nul {0}. Par exemple, dans la formule Ü•v = 0, où
v E E, le zéro à gauche désigne le scalaire nul, tandis que le zéro à droite désigne le vecteur
nul. On peut le préciser en écrivant ÛJK · v = 0E , mais très souvent nous ne le ferons pas, car
le contexte indique toujours de quel zéro il s'agit.

Nous démontrons maintenant deux autres règles de calcul. Ces dernières pouvant se déduire
des huit règles de la définition, elles n'ont pas le statut d'axiome.

l_lègl~ l,7~3:~ .S~E itn ~~e$pjl~ vectt>rlel. §Qient v E .E etÀE,llC.• Alor$ on a>
1) À • v ::;: 0 · Ri.et .stulement ai À =Ût<· nu V= 01: ;
2)'(-1) ·V~ '-V.

PREUVE.

1) Rappelons que dans tout groupe (E, +), l'équation u + u = u a pour unique solution
u = 0E (voir le chapitre 9).
({=) Supposons que v = 0E et soit À E K Alors À· ÜE +À· ÛE = À· (0E +0E) =À· ÜE d'après
l'axiome EVs. Donc À· 0E = 0E.
Supposons maintenant que À= OK et soit v E E. Alors 0JK · v + ÛJK · v = (0JK + 0JK) · v = ÛJK · v
d'après l'axiome EV7 . Donc 0JK · v = 0E.
{==}) Inversement soit À E 1K et v E E tels que À· v = 0E. Supposons que À f. 0oc et
montrons que v = 0E. En utilisant EV5 , EV6 et la direction({=) que nous venons de prouver,
1
nous calculons: v = 1 • v = (À- 1 À) • v = À-1 •(À· v) = À- · 0E = 0E.
2) Nous calculons: v+ (-1) ·v = 1 ·V+ (-1) •v = (1 + (-1)) •v = Ooc •v = 0E, en vertu
des axiomes EV5 , EV7 et du point 1) démontré ci-dessus. Ainsi (-1) · v est bien l'opposé de v
dans le groupe (E, + ). ■

Lors de nos calculs dans ocn, nous avons à de nombreuses reprises utilisé ces règles sans
nous en rendre compte. En effet, dans JKn, ces règles étaient des propriétés immédiates des
n-uplets et elles ne nécessitaient pas de démonstration.
Notation. Nous noterons éventuellement ÀV au lieu de À· v, et u -vau lieu de u + (-v).

I.1.2. Les axiomes d'une algèbre

De même que la définition générale d'un espace vectoriel était induite des propriétés de ocn, la
définition d'une algébre s'appuie sur l'exemple de At'n(lK). Une algèbre est un espace vectoriel
dans lequel les vecteurs peuvent aussi se multiplier entre eux. Nous rajoutons donc une loi
interne multiplicative à la structure d'espace vectoriel. Comme toujours, nous obtenons ainsi
une structure intéressante uniquement si des conditions de compatibilité sont satisfaites.

2
Dans ce chapitre, la plupart des vecteurs portent des lettres latines b, f, g, u, v, w, ... et les scalaires des lettres
grecques À, µ, E,, ...
456

Définition 17.4. Une OC-algèbre est un OC-espace vectoriel A, muni d'une


multiplication interne x : AxA ---+ A , (u, V) f------7 u X V ,
telle que les quatre axiomes suivants soient vérifiés

\f(u,v,w) E A 3 , w X (u X v) = (w X u) X V.
\f (u, V) E A 2 , \f À E OC , À· (u X v) =(À. u) X V= u X (À· V),.
:31EA,\fuE A, uxl=lxu= u.
w x (u+v) =w x u+w x v,
\f(u,v,w) E A 3 ,
{ (u+v) X w =U X w+v X W.

La OC-algèbre A est commutative si u x v = v x u pour tous u, v E A.

En somme, une OC-algèbre est à la fois un OC-espace vectoriel et un anneau, avec une
condition de compatibilité des multiplications dans l'anneau et dans OC, donnée par l'axiome
Al 2 . Le vecteur 1 du troisième axiome est appelé unité. Certains auteurs n'exigent pas son
existence et appellent notre algèbre une algèbre avec unité, ou encore une algèbre unitaire.
Notation.
◊ Pour distinguer le vecteur 1 de A du scalaire 1 de OC, on peut écrire 1A et 1IK·
◊ Souvent, on écrira uv au lieu du produit u x v si le contexte est suffisamment clair pour
savoir de quelle multiplication il s'agit.
◊ Comme toujours quand il y a associativité, on peut supprimer des parenthèses et noter
uvw = (uv)w = u(vw) et Àuv = À(uv) = (Àu)v.

PREUVE. Cela est vrai dans tout anneau (voir la proposition 11.4). On a v x OA = v x
(OA + OA) = v x OA + v x OA donc v x OA = OA. La formule OA x v = OA se démontre
de manière analogue. ■

Définition 17.6. Une sous-algèbre de A est un sous-espace vectoriel B C A qui contient


l'unité 1A de A et qui est stable pour la multiplication interne, au sens que
\f(u,v)EB 2 , uxvEB.
Autrement dit, la loi interne multiplicative peut aussi se restreindre à B.

Évidemment, comme dans le cas des espaces vectoriels, les lois d'une algèbre A induisent sur
une sous-algèbre B une structure d'algèbre. C'est la raison pour laquelle nous avons exigé que
B contienne l'unité de A.

Test 17.1. Test 17.3.


Soit E un lK-espace vectoriel. Que pensez-vous Quel axiome parmi les huit d'un espace vecto-
des assertions suivantes? riel exclut l'ensemble vide 0?
a. {Àv I À E lK, v E E} = 1K x E.
b. {u+v 1 (u,v) E E2} = E. Test 17.4.
Quels couples de lois font de JR. 2 un lR.-espace
Test 17.2. vectoriel?
Démontrer que l'espace nul est le seul lK-espace
(x,y) + (x',y') = (x+x',y +y'),
vectoriel de cardinal fini. (lK = lR. ou q. a.
{ À· (x, y)= (0, Ày).
457

b. {(x,y) + (x',y') = (0,0), f. {(x,y) +(~,y')= (x+x',y +y'),


À• (x, y) = ("'Ax, "'A.y). À•(x,y)-(x,y).
(x,y) + (x',y') = (0,0), Test 17.5.
c.
{ À• (x,y) = (0,0). Montrer que dans toute algèbre A, l'unité 1A
(x,y) + (x',y') = (x+y',y +x'), est unique.
d.
{ À• (x, y)= ("'Ax,"'Ay). Test 17.6.
(x,y) + (x',y') = (2x+2x',y +y'), Montrer que dans une algèbre A, on a lA = OA
e. si et seulement si A= {0}.
{ À• (x,y) = ("'Ax,"'Ay).

I.2. Exemples
1.2.1. Exemples d'espaces vectoriels

L'espace ocn est bien sûr un exemple d'espace vectoriel. En voici d'autres.
◊ L'espace nul {O} qui ne contient que le vecteur nul est l'espace vectoriel le plus petit possible.
On le note souvent simplement O au lieu de {O}.
◊ Les translations dans le plan forment un lR-espace vectoriel.

◊ L'espace JK[X] des polynômes est un OC-espace vectoriel (voir le chapitre 13).
◊ Le corps JK(X) des fractions rationnelles est un OC-espace vectoriel (voir le chapitre 14).

◊ Le corps lK est un OC-espace vectoriel : c'est l'espace canonique ocn avec n = 1.

◊ Pour tout ensemble J non vide, et pour tout espce vectoriel E sur lK (par exemple E
JK), l'ensemble ET des applications définies sur J à valeurs dans E est un OC-espace vectoriel.
Les vecteurs de cet espace sont les applications de J dans E, soit encore les familles (xj)iEJ
d'éléments de E indexés par J. L'addition de deux vecteurs de cet espace et la multiplication
par les scalaires sont définies composante par composante, dans le sens que pour tous (xj)jEJ
et (YiliEJ dans Eî, et pour tout À E lK

La vérification des huit axiomes ne pose aucun problème car elle se ramène sur chaque com-
posante aux règles afférentes dans E, ce qui se voit très bien puisque nous avons adopté le
point des familles. Du point de vue des applications, les lois de ET sont définies pour toutes
applications f : J ---t E et g : J ---t E et pour tout À E lK par les conditions

Vx E J, (f + g)(x) = f(x) + g(x) et ("'Af)(x) = "'A(f(x)).

Une définition plus générale de l'espace canonique. Si on choisit E = lK dans le dernier


exemple, nous obtenons l'espace JKT des fonctions. Pour des choix particuliers de J, nous
retrouvons des espaces bien familiers.
◊ L'espace ocn = JK{l,. .. ,n}_
◊ L'espace JKN des suites.
◊ L'espace des matrices Atmn(lK) = JK{l, ... ,m}x{l, ... ,n}.
◊ L'espace lR I des fonctions réelles définies sur un intervalle I C R
458

En somme, l'espace JM;J est le prototype de nombreux espaces vectoriels. On peut alors construire
beaucoup d'autres exemples à partir de ceux-là, notamment en utilisant les trois opérations
suivantes.
o Prendre un produit d'espaces vectoriels (page 460).
o Prendre un sous-espace d'un espace vectoriel (page 468).
o Prendre le quotient d'un espace vectoriel par un sous-espace.
En tant que brique élémentaire de ce jeu de construction, l'espace JKJ porte encore le nom
d'espace canonique.

I.2.2. Exemples d'algèbres

L'exemple fondamental est l'algèbre .4tn(OC), avec pour loi interne multiplicative la multipli-
cation matricielle, dont l'élément neutre est la matrice identité Iln. Pour n > 1, elle est non
commutative (voir la règle 16.24). Voici d'autres exemples importants d'algèbre.
o Le corps OC est une OC-algèbre commutative.
o OC[X) est une OC-algèbre commutative, d'unité le polynôme constant de valeur 1.
o OC(X) est une OC-algèbre commutative, d'unité la fraction constante de valeur 1
o ][{J est une OC-algèbre commutative. La multiplication interne est définie composante par
composante pour tout (xj)jEJ et (-YïliEJ dans OC 1 par

L'élément neutre est la famille constante de valeur 1. La vérification des axiomes de OC-algèbre
ne pose aucun problème car elle se ramène sur chaque composante aux règles afférantes dans
K Du point de vue des fonctions à valeurs dans OC, le produit est défini pour toutes fonctions
f : J ---+ OC et g : J ---+ OC par la condition

'vx E J, (fg)(x) = f(x)g(x).


Notons qu'en tant qu'espace vectoriel, l'espace .4tn(OC) peut s'identifier à ][{{l, ... ,n}2 , mais
ce n'est pas le cas en tant qu'algèbre. En effet, pour n > 1, la multiplication matricielle dans
.4tn(OC) est non commutative et n'a donc rien à voir avec la multiplication composante par
composante de OC{l ,... ,nl2 •

Att('ll1 io11 Les conditions de compatibilité sont critiques


Une multiplication interne naturelle sur un espace vectoriel ne définit pas nécessairement
une algèbre.

o L'espace canonique JR 3 muni du produit vectoriel défini pour tous (x, -y, z) et (x', -y', z') dans
JR 3 par
(x, -y, z) /\ (x', -y', z') = (-yz' - z-y', zx' - xz', x-y' - -yx') (17.1)
n'est pas une algèbre. Géométriquement le produit vectoriel donne un vecteur orthogonal aux
deux facteurs. Montrons que ce produit n'est pas associatif. Soient i = (1, 0, 0), j = (0, 1, 0)
et k = (0, 0, 1) les vecteurs de la base canonique de JR 3 ; alors un calcul direct montre que
(i/\j) /\j = k/\j = -i, alors que i/\ (j /\j) = O.
459

◊ Considérons sur JRIR la composition des fonctions, notée o, définie par

Vx E lR, (uov)(x) = u(v(x)).


Cette loi est associative et possède idJR comme élément neutre. Mais elle ne fait pas de JRIR
une algèbre car en général
wo (u+v) ,fwou+wov . (17.2)

1.2.3. L'algèbre JK[[X]] des séries formelles

Nous donnons dans cette partie un dernier exemple d'algèbre. Une série formelle à coefficients
dans 1K est une suite a : N -, JK, k H Uk. On la note généralement comme une somme formelle

.[_akxk,
kEN

sans faire intervenir directement de notion de convergence. Le symbole X désigne donc la suite
qui vaut O pour tous les indices, sauf pour l'indice 1 pour lequel la suite prend la valeur 1. On
appelle X l'indéterminée et on note JK[[X]] l'ensemble des séries formelles à coefficients dans 1K.
Les séries formelles complètent en quelque sorte l'algèbre des polynômes. Plus précisément,
un polynôme est une série formelle dont tous les coefficients sont nuls à partir d'un certain rang
(l'indice du dernier coefficient non nul étant le degré du polynôme). Pour définir l'addition et
la multiplication de deux séries, ainsi que la multiplication par un scalaire, on s'inspire des
lois connues pour les polynômes en posant pour tous L kEN ukXk et L kEN bkXkdans JK[[X]], et
pour tout À dans 1K

kEN kEN kEN

À· L. akXk = L (Àuk)Xk.
kEN kEN
Alors JK[[X]] est une OC-algèbre commutative. Son élément unité est la série 1, c'est-à-dire
la série LkEN ukXk telle que ao = 1 et uk = 0 pour tout k):: l. La vérification des axiomes
d'algèbre et de la commutativité est laissée en exercice (comme pour les matrices, le seul
axiome non immédiat est l'associativité de la multiplication, voir la question-test 17.9).

Expliquons le choix du terme de « série formelle ». A priori, une série formelle n'est pas
un objet plus formel qu'un polynôme qui contient également le symbole X. Or, il y a une
grande différence : dans un polynôme, la fonction de l'indéterminée X est de représenter
potentiellement toute quantité algébrique qui pourrait lui être substituée. Par exemple, X peut
être remplacé par un nombre, mais aussi par un autre polynôme ou même par une matrice
carrée. Plus généralement, si A est une OC-algèbre et si P = .L.~ ukXk est un polynôme dans
lK[X], alors nous avons l'application polynomiale associée définie sur A par
p

A -, A, x H P(x) = L akxk, (17.3)


k=O
460

avec pour convention que x 0 = 1A pour tout x E A. En revanche, dans une série formelle,
la seule quantité qui peut être substituée à X avec certitude est l'élément nul. Par exemple,
considérons la série

............

dite « exponentielle ». Par quoi pouvons-nous remplacer X? Si nous ne voulons pas utiliser de
notion de convergence, il nous faut substituer une quantité dont la puissance s'annule à partir
d'un certain rang. Ainsi, dans le cas où X devient une matrice, elle doit être nilpotente.

On emploie généralement des séries formelles quand on veut formaliser un raisonnement


sur une série pour laquelle la question de la convergence n'importe pas ou est écartée dans une
première analyse. C'est en ce sens qu'une série formelle est plus « formelle » qu'un polynôme.
Les séries formelles peuvent aussi servir à coder une information qui peut se lire convenable-
ment comme une série tronquée en un polynôme de degré arbiraire; c'est le cas par exemple
des séries de Taylor ou des développements asymptotiques, ou encore des séries génératrices
en combinatoire. Nous ferons un usage très limité des séries formelles en algèbre linéaire pour
reformuler commodément la notion de combinaison linéaire (voir page 475).

Test 17.7. Test 17.9.


L'espace vectoriel JR2 muni de la multiplication Démontrer que la multiplication interne dans
interne définie par la formule IK[[X)) est commutative et associative.
(x,-y)(x',-y') = (xx' -1111',x-y' +yx') Test 17.10.
est-il une JR-algèbre? En général, est-ce que cela a un sens de substi-
tuer à l'indéterminée X
Test 17.8.
a. une série formelle dans un polynôme,
a. Le produit vectoriel défini par (17.1)
possède-t-il un élément neutre? b. un polynôme dans une série formelle,
b. Prouver que (17.2) est possible à l'aide d'un c. une série formelle dont le premier coefficient
exemple. ao est nul dans une série formelle ?

I.3. Produit d'espaces vectoriels

Dans cette partie, nous introduisons un premier procédé pour construire d'autres exemples
d'espaces vectoriels à partir d'exemples connus. Nous avons déjà rencontré le cas particulier
de l'espace E1 pour un espace vectoriel E donné.
461

Proposition-définit ion 17.7. 8-oit J un ensemble non vide et soit (Ei)Jer 11,ne famille de
K-espaces vectoriels. .On. note
TIE;
iEJ
l'ensemble de toutes lesfàmilles (Uj)jeJ telles que Uj E Ej pour tout j E J que l'on munit de
deu:flois comme suît.
loi. interne : (Uj)jEJ + {Vj)jEJ == (Uj+Vi};EJ,
loi externe : À· {Uj);eJ =
{:\UjheJ •
On obtient ainsi un espace vectoriel appelé espace produit de la famille (EiheJ·
Si J est l'ensemble fini J= {1, ... , n}, on note
·n
fitj = E1 .x ···X .En.
j=l

PREUVE. La vérification des huit axiomes s'effectue composante par composante, en utilisant
les axiomes correspondants de chaque espace vectoriel Ei . Montrons le premier axiome, c'est-
à-dire la commutativité de l'addition dans njEJ Ej. Soit (Uj)jeJ, (vj)jeJ E njEJ Ej. Pour tout
j E J, on a l'équation Uj +vj = Vj +uj dans l'espace vectoriel Ej, Cela signifie que dans njEJ Ej'
on a l'identité
(uj)jeJ + (viliEJ = (vj)jeJ + (Uj)jeJ.
Les autres axiomes se démontrent de manière analogue. ■

Explicitons quelques cas particuliers.


n
o Facteurs identiques : Il E = E 1 et Il E = ~ = En.
iEJ i=l n fois
n
◊ Tous les facteurs égaux à K : Il K = K 1 et Il K = Kn .
iEJ j=l
◊ Si on écrit les vecteurs de Km en lignes : (Km)n = Atmn(K).
◊ Si on écrit les vecteurs de Kn en colonnes: (Kn)m = Atmn(K).
Remarque. De la même manière, on a la notion de produit d'une famille d'algèbres en
définissant la multiplication interne « composante par composante ».

Test 17.11. a. E J x F est un espace vectoriel.


Soient E1 E2 des espaces vectoriels. Est-ce que
1 b. JF x E est un espace vectoriel.
tout sous-espace vectoriel de E I x E2 est de la
c. FE est un espace vectoriel.
forme F1 x F2 où F1 C E I et F2 C E2 sont-ils des
sous-espaces vectoriels ? d. (E x F)I est un espace vectoriel.
Test 17.12. e. (Ef)I est un espace vectoriel.
Soient I, J deux ensembles quelconques non f. EX F = F XE.
vides et soient E, F deux espaces vectoriels. Les
assertions suivantes sont-elles vraies, en géné- g. On peut identifier (Ex F)1 = E1 x Fr.
ral? h. On peut identifier (El) 1 = EJxr_
462

II. APPLICATIONS LINÉAIRES

Plus particulièrement au cours du xxe siecle, il s'est souvent avéré fructueux d'étudier un
type d'objet mathématique donné non pas en considérant les objets eux-mêmes mais plutôt
les applications définies entre ces objets. Les objets qui nous intéressent ici sont les espaces
vectoriels. Évidemment, nous n'allons pas considérer toutes les applications entre ces espaces
- qui constitueraient un ensemble beaucoup trop gros pour refléter les structures des espaces
considérés - mais seulement celles qui préservent la structure des espaces vectoriels, c'est-à-
dire celles qui sont compatibles avec les calculs dont nous avons fixé les règles. Dans tout ce
qui suit E et F sont deux OC-espaces vectoriels.

Il.1. Morphismes d'espaces vectoriels, morphismes d'algèbres


De la même manière qu'un homomorphisme de groupes conserve la loi de groupe, un mor-
phisme d'espaces vectoriels - appelé aussi une application linéaire - conserve les deux lois
d'un espace vectoriel, l'addition interne et la multiplication externe.

Définition 17.8. Soit f: E-, F une application. On dit que f est une application linéaire,
ou un morphisme d'espaces vectoriels, si

'v' (u,v}= E2, f(u+v) =f(u) +f(v),


'v' (À, V) E JK X E , f(;\v) = M(v).
Une application linéaire E -, F est appeléé3 isomorphisme si elle est bijective, endomor-
phisme si E = F, automorphisme si elle est bijective et si E = F.

Remarque. Soit f : E -, F une application linéaire.


o On a f(O) = f(O + 0) = f(O) + f(O), donc f(O) = 0.
o Pour tous u, v E E et tous À,µ E 1K on a f(Àu + µv) = M(u) + µf(v).
o Par récurrence sur n, on en déduit que pour tout n E N, pour tous vecteurs v 1 , ..• , Vn E E
et pour tous scalaires À1, ... , Àn E JK,

o Si E, F sont des C-espaces vectoriels alors ce sont aussi des IR-espaces vectoriels. Il est
nécessaire de distinguer les morphismes entre E et F, en tant que C-espaces vectoriels, et les
morphismes entre E et F, en tant que IR-espaces vectoriels. Les premiers sont dits C-linéaires et
les seconds IR-linéaires. En tout état de cause, lorsqu'on parle d'application linéaire, l'espace
de départ et l'espace d'arrivée sont supposés avoir le même corps de scalaires.

3
Certains ouvrages appellent monomorphisme une application linéaire injective et épimorphisme une application
linéaire surjective.
463

EXEMPLE 17.9.
r/J
o Pour deux lK-espaces vectoriels E, F. considérons les applications
(u,v) et Exf (u,0).
i
,Q)
Exf ll
l
E
1
u
î
E
1
u i
r/J

;!:l

On les appelle projection naturelle de Ex F sur E et injection naturelle de E dans Ex F. Pour ~


F il y a des applications analogues. Ces applications sont linéaires : la structure d'espace ~
r/J
vectoriel sur le produit Ex F (voir la proposition 17.7) est choisie précisément pour qu'elles
soient linéaires.

0 La dérivation d~ : JK[X] -----, JK[X], p =


p

L_ akxk
k=0
HP'=
p

L_ kakxk-l
k=l
est linéaire. i[
r/J

o L'application f lK[X] -----, JK[X] , P(X) H P(X) 2 n'est pas linéaire. En effet,
~
f(l +X)= (1 + X)2 # 1 + X2 = f(l) + f(X).
r..:
....
..d
Application linéaire définie par une matrice. La règle 16.5 du calcul matriciel implique (.)

que pour tout A E .A'mn(lK), l'application  : lKn -----, ]Km, x H Ax est linéaire. Pour que
le produit Ax ait un sens, on écrit x en colonne de sorte que l'application soit définie par la
correspondance

où les Ck sont les colonnes de la matrice A. Ainsi nous retrouvons l'interprétation fondamentale
d'une matrice au regard du produit matriciel que nous avons déjà rencontré au chapitre 16.

Règle.17,10. La k•ième colonne de la matrice A E .A'mn0K) est l'image du vecteur ek de


la base èanoniqUè par l'application linéaire  : Kn-----, JKm. ·

Soit par exemple la matrice A = ( ~?). Alors  : !R JR 2 est définie par  ( ~) = ( tx).
2
-----,

Elle envoie la configuration sur la configuration suivante.

(2,0)

Nous constatons que l'image de la droite est encore une droite, mais que l'image du cercle
n'est plus un cercle. Autrement dit, la notion de cercle «rond» n'a pas de sens dans le monde
linéaire : ce n'est pas une notion qui est préservée par tout automorphisme linéaire. Nous
verrons en deuxième année qu'il faut une structure supplémentaire dite euclidienne, c'est-à-
dire un produit scalaire, pour pouvoir parler de cercle. En revanche, la notion de droite est bien
464

une notion linéaire. Avec un peu d'habitude, le lecteur gagnera en intuition pour distinguer
ce qui est linéaire de ce qui ne l'est pas.

Morphisme d'algèbres. Lorsque les espaces vectoriels sont aussi des algèbres, il est naturel
de considérer les applications linéaires qui conservent, en outre, la multiplication interne. On
notera que l'on exige que les morphismes d'algèbres préservent les unités.
Définition 17.11. Soit A, B deux OC-algèbres. Un morphisme d'algèbres est une application
linéaire f: A ----t B telle que f(lA) = 18 et telle que f(uv) = f(u)f(v) pour tout (u, v) E E2.

EXEMPLE 17.12.
◊ Pour toute OC-algèbre A, l'application OC ----t A, i\ H i\ · 1A est un morphisme d'algèbres.
◊Soit M E .4"1n(IK) une matrice carrée fixée. Alors IK[X] ---+ Atn(OC), P H P(M) est un
morphisme d'algèbres.

Test 17.13. b.JK--,K, aHQ(a).


Les deux parties suivantes peuvent-elles être c. K[X] --, K[X] , P(X) H P(X 3 ) .
l'image du cercle {(x, y) 1 x 2 + y 2 = l} d. K[X]'--, K[X], P H P'.
par une application linéaire de JR 2 dans JR 2 ?
e . .An( K) --, .An(K) , A H A+ B.

~ y:
Tl ~
f . .An(K) --, .An(K) , A H BAC.
g . .Amn(K) --, .4é'nm(K) , A H tA.

Test 17.17.
Soit f: E--, IKn, v H (f1 (v), ... , fn(v)). Que
pensez-vous de. la proposition
Test 17.14. « f est linéaire si et seulement si les applications
La conjugaison complexe C --, C , z H z, fk : E --, K sont linéaires pour k = 1, ... , n. » ?
est-elle C-linéaire? Est-elle lR-linéaire? Test 17.18.
Test 17.15.
Pour chacune des conditions ci-dessous, indi-
Pour a E IK, posons fa : 1K --, IK, x H ax . quer si elle est nécessaire et/ou suffisante pour
a. Montrer que fa est linéaire. que f : E --, F soit linéaire.
b. Montrer que pour toute application linéaire a. v'u,v E E v'i\ E K•: f(O) = 0 et f(u+i\v) =
f : 1K --, IK, il existe a E lK tel que f = fa . f(u) + i\f(v).
Test 17.16. b. v'u, v E E v'i\ E K: f(u+i\v) = f(u) +i\f(v).
Fixons a E IK, Q E K[X] et B, C dans .An(K). c. v'u v'n E .Z: f(nu) = nf(u).
Pour chaque application ci-dessous, indiquer s'il
d. v'u E E v'i\ E K: f(i\u) = f(i\)f(u).
s'agit d'une application linéaire ou même d'un
morphisme d'algèbres. e. v'u E E v' i\ E K: f(i\u) = f(i\) + f(u).
a. JK(X] --, K, P(X) H P(a). f. v'u E E: f(-u) = -f(u).

II.2. L'espace vectoriel 2'(E, F), l'algèbre 2'(E), le groupe GL(E)


Dans cette partie, nous allons étudier l'ensemble des applications linéaires entre deux espaces
vectoriels donnés. Il s'agit de l'analogue de l'espace des matrices que nous avons interprétées
465

commes des application s linéaires entre espaces canoniques. Il est remarquab le qu'ici encore
nous obtenions un espace vectoriel, et même une algèbre dans le cas où les deux espaces
vectoriels sont identiques.

Pour deux K-espaces vectoriels E et F, on note 2'(E, F) l'ensemble des applications linéaires
de E dans F, et 2'(E) = 2'(E, E) désigne l'ensemble des endomorphismes de E.

Propositi on 17.13.. L'ensemble 2{E, f) des applications: linéaires de E dans F est un


so'ùS-espace ·vectoriel de l 'espo,ee 'IJectoriel fE. ·

PREUVE. D'abord nous remarquon s que 2'(E, F) est non vide car l'applicatio n nulle est
linéaire et appartient donc à 2'(E, F). Soit f et g : E --t F deux applications linéaires et À E2 K
Nous devons montrer que les application s f + g et Àf sont linéaires. Pour tous (u, v) E E et
<XE K, on a
(f + g)(u+ <XV)= f(u+ <XV)+ g(u+ <XV)= f(u) + <Xf(v) + g(u) + <Xg(v))
= f(u) + g{u) + <X(f(v) + g{v)) = (f + g)(u) + <X(f + g)(v),
("Af)(u +<XV)= "Af(u) + À<Xf(v) = ("Af)(u) + <X("Af)(v).

Remarquon s que la preuve utilise le fait que À<X = <XÀ. Pour des espaces vectoriels sur un
corps non commutati f (cela existe!), la proposition est fausse. Dans ce livre, les corps sont
commutati fs par définition (voir le chapitre 11).

Propositi on 11\14. Smènt E, f, G des espaces vectoriels, soit i\ E K, et soie11.t f, f' dans
Z(E, f) et g, g' dans .2"(F, G}. Alors,
1) la composéeg of est dans.2'(E, G);
2) go {f + f') = g o :f+ g o f1 et
3) Â(g of)= ("Ag) of= go ("Af).

PREUVE.

1) La linéarité de go f se déduit directemen t de la linéarité de f et de g.


2) La première égalité4 résulte de la linéarité de f, la seconde est toujours vraie.
3) L'égalité À(g of) =go (Ml est une conséquence de la linéarité de g.

L'égalité À{g of) = ("Ag) of, en revanche, est vraie pour des application s quelconques.

Corollaire 17;15.
L'espace 2'(E) des endomorphismes de E, muni de la multiplication donnée par la eomposi-
=
tion; est une K.-algèbre, dont l'élbnent unité est l'application ide11J,ité 12 cE) idE,

Rappelons qu'une application linéaire bijective est appelée un isomorphisme.

Propositi on 17.16.
L'application réciproque d'un isomorpbisme d'espaces vectoriels est encore linéaire.

4
Comparer avec l'équation (17.2, page 459).
466

PREUVE. Soit f : E -t F une application linéaire bijective et soit g : F -t E son application


réciproque. Soient u, v E F et À E OC. Alors,

f(g(u + Àv)) = u+ Àv = f(g(u)) + M(g(v)) = f(g(u) + Àg(v)).

Par injectivité de f, on obtient que g(u + Àv) = g(u) + Àg(v). Donc g est bien linéaire .

Définition 17.17.
Deux espaces vectoriels E et F sont isomorphes s'il existe un isomorphisme f : E -t F.

Notation. On écrit f: E ~ F pour un isomorphisme et E ':::'. F pour deux espaces isomorphes.

Le terme d'« isomorphe» vient du grec, de isos, même, et morphê, forme. Deux espaces
isomorphes ont la même forme, dans le sens qu'il n'est pas possible de distinguer un espace
d'un autre espace isomorphe par ses propriétés: tout énoncé dans l'un se traduit par un énoncé
similaire dans l'autre, où seuls les noms des objets ont changés via un isomorphisme. Deux
espaces isomorphes sont donc différents nominalement mais indiscernables intrinsèquement.

EXEMPLE 17.18.
o Si A E Gl( n, JK) alors l'application linéaire  : lKn -t lKn, x H Ax est un automorphisme.
En effet x H A- 1x est son inverse.
◊ La transposition A'tmn(IK) -t A'tnm(IK), AH 1A est un isomorphisme d'espaces vectoriels.

Dans le cas particulier où E = F, les isomorphismes sont des automorphismes (du grec
autos, soi-même). Ce sont précisément les éléments inversibles de l'algèbre 2"(E), soit encore
les applications bijectives de E dans E qui sont de plus linéaires. Les bijections de E dans E
forment un groupe, le groupe symétrique 6(E), vu au chapitre 10. Les automorphismes de E
en constituent un sous-groupe.

Proposition~définition' 17'.19~ · L'ènsembkdes aùtoinarph.îsmes de E est un sous-groupe


du groupe symétrique 6fE}.· On.l'appelle le groupe linéa.ire·de E et on le note.GJJE}.

Test 17.19.
Quel est l'élement neutre de Gl(E}? Comment peut-on généraliser ce résultat?
Test 17.20. Test 17.22.
La relation ':::'. est-elle d'équivalence? L'application JK:1'' -, lK[[X)] , ( ak)kEN H
Test 17.21. LkEN akXk est-elle un isomorphisme d'es-
paces vectoriels? Est-elle un isomorphisme d' al-
Pour chacune des deux applications ci-dessous,
gèbres?
montrer qu'il s'agit d'un automorphisme d'es-
paces vectoriels et donner son inverse. Est-ce Test 17.23.
des automorphismes d'algèbres? La transposition Atn(lK) -, Atn(lK), A H
1
A est-elle un automorphisme de l'algèbre
Atn(lK)?
467

II.3. Retour sur le produit matriciel : Atmn(IK) c:::: 2'(1Kn, ocm)

Comme nous l'avons vu, toute matrice A E .4'lmn0K) induit une application de  de ocn dans
ocm, définie par Â(x) = Ax pour tout x E ocn. Bien entendu, cette application est linéaire,
comme le montre la règle 16.5. Avec le vocabulaire introduit dans ce chapitre, nous pouvons
maintenant résumer la construction du produit matriciel du chapitre 16 par la proposition
suivante.
Prc>position· 11.20.
1) .L '#!l'lication
.4~{lKJ -+ 2{r')tfu) : À ~X
est un isomorp1ii$me â •~~s dlwtone~ tje .r€d.prolftie ,: -
t - - ~ ~

2{1'n, Km} ---4 .4'lmn.{K} : f H A1;

où A1 :=: {f(e1l. .. , ,ftê:}}tstl{rnatric~ftmnle ~~ veci~rsfletJ, ~ts en e,ôlonnê, imô,ges


par. t·dM vectettrf âe]abase•œ1ivn.ique âe.Kn, · · •
2) i'our A E ~mlic(K}.~ ÎS: E:: ~(K~on a,AB .: ; : ÂoB.
3} pJû~f E :2(JK1î"Jt{WfJf 9'e\F{Jtm; Kh/on· a, A;;,; ·d;A~r ..

4). L'applwatioff.A~(K} ~ ;{Kfl : AH.À est •un°isQm~his ~ d!~~8'


Bit, !J(iitieu#ei, AE .L~{J.test,mversilile si 1:1t ~ul~t ati est·~ ay,tçr((}Pf:l}his~êc de Kn
et, dansce.~,.Â.,...1 ::;::M. . .. • . . ...
PREUVE.
1) Il est clair que les applications définies par A H Â et f H Af sont linéaires (voir aussi
la règle 16.16, page 413). De plus, on vérifie immédiatement que pour tous A E .4'lmn(1K) et
f E 2'(1Kn, lKm), on a
Af = f et A Â = A.
Ainsi, les deux applications considérées sont bijectives, réciproques l'une de l'autre.
2) C'est la définition du produit matriciel (voir définition 16.7, page 410).
3) D'après 2), on a ~ = A 9 o At = go f = Agof• On conclut grâce à l'injectivité de la
correspondance A H A.
4) découle des points 1) et 2), et du fait que¾ = idocn, ainsi que des propriétés générales
des isomorphismes d'algèbres. ■

Ainsi, les matrices m x n correspondent précisément aux applications linéaires de ocn


dans ocm, et cette correspondance se fait via un isomorphisme canonique, car il n'y a pas de
choix arbitraire dans la construction de l'isomorphisme A H Â. C'est pourquoi, désormais,
nous n'écrirons plus le chapeau et désignerons par le même symbole A la matrice m x net
l'application linéaire de ocn dans ocm induite par A. Donc nous ne différencions plus .4'lmn(1K)
de 2'(1Kn, ocm); nous identifions les espaces vecoriels

De la même manière, nous identifions les algèbres .4'ln(1K)::::: 2'(1Kn). Sous cette identifica-
tion, les matrices inversibles correspondent aux automorphismes de ocn. Aussi nous identifions
Gl(n,JK)::::: Gl(JKn).
468

EXEMPLE 17.21. Donnons la matrice de l'application linéaire

f : JK. 3 ---+ JK. 2, (x,y,z) H (2x-5-y,x+-y+4z).

Il suffit de calculer les images f(ei) = (2, 1), f(e2) = (-5, 1), f(e3) = (0,4) et de les juxtaposer
en colonnes dans la matrice
2-5
At= ( 1 1 4 .
0)
Bien entendu, nous aurions pu écrire directement les vecteurs de ocn en colonnes, ce qui
aurait donné immédiatement le résultat car

(~X) = ( + y + 4z) = (1 1 4) (X)


lx- 5-y 2 -5 0
f X ~

Mais pour une question de place, il est fréquent d'éviter l'écriture en colonnes.

Test 17.24. Test 17.25.


Que pensez-vous des assertions suivantes? Pour n ~ 2, trouver deux automorphismes de
a. Il n'existe pas d'application linéaire surjec- ]Knqui ne commutent pas.
tive de lKn dans lKm, pour n < m. Test 17.26.
b. Il n'existe pas d'application linéaire injective Pour n ~ 2 trouver deux endomorphismes non
de ]Km dans lKn, pour n < m. nuls de lKn dont la composée est nulle.

III. Sous-ESPACES VECTORIELS. IMAGE ET NOYAU

Dans tout ce qui suit, E est un OC-espace vectoriel. Jusqu'à présent, nous avons vu peu
d'exemples d'espaces vectoriels autres que l'espace canonique JK.T ou l'espace ET et leurs cas
particuliers ocn, JK.N et A'tmn(lK.). Dans cette partie, nous montrons comment il est possible
de construire beaucoup d'autres espaces vectoriels comme sous-espaces vecoriels d'un espace
vectoriel donné. En effet, comme nous l'avons noté page 454, un sous-espace vectoriel est
lui-même un espace vectoriel car les lois sont induites par l'espace qui le contient et les huit
axiomes sont automatiquement satisfaits.

111.1. Stabilité par combinaison linéaire


Nous avons vu que 2'(E, F) est un sous-espace de fE. Mais pourquoi ne considérerions-nous
pas 2'(E, F) directement comme un espace vectoriel? La raison est pratique: pour démontrer
que 2'(E, F) est un espace vectoriel, il faudrait d'abord définir les deux lois, puis montrer
qu'elles vérifient les huit axiomes d'un espace vectoriel. En revanche, pour montrer qu'il est
un sous-espace vectoriel de EF, il suffit de monter qu'il est non vide,stable par addition et
stable par multiplication par les scalaires, ce qui est beaucoup plus rapide. Bien entendu, une
fois établi que 2'(E, F) est un espace vectoriel, on le considère comme un objet en soi, et on
oublie l'espace moins intéressant fE qui a servi à le construire.
Pour résumer, pour montrer que F est un espace vectoriel, il suffit de trouver un espace
469

vectoriel E bien connu qui le contient et de vérifier des conditions de stabilités par addition
et par multiplication par les scalaires; ce qui s'écrit en une seule condition comme suit.

Comment montrer qu'une partie est un sous-espace ?


Une partie non vide F C E est un sous-espace vectoriel (s.e.v.) de E si et seulement si
elle est stable par combinaisons linéaires, c'est-à-dire si
\f( u, V) E F2 , \f À, µ E OC, Àu + µv E F.

Nous laissons au lecteur le soin de prouver le bien-fondé de cette méthode.

EXEMPLE 17.22.
◊ JK[X] est un sous-espace vectoriel de l'espace OC[[X]] des séries formelles.
◊ L'ensemble OCn[X] des polynômes de degré au plus n est un sous-espace vectoriel de JK[X]
(et donc aussi de OC[[Xll).
◊ Soit I C lR un intervalle et k E NU{oo}. Alors l'ensemble <tfk(I) est un sous-espace vectoriel
de l'espace canonique JE.I. En effet, la fonction nulle est de classe 'tfk, et toute combinaison
linéaire de fonctions de classe <tfk est aussi de classe <tfk (voir les chapitres d'analyse).
◊ De même, on montre que l'ensemble C des suites réelles convergentes est un sous-espace
vectoriel de JE.N_
Pour obtenir l'espace vectoriel des suites convergentes ou l'espace vectoriel des fonctions
dérivables, nous avons fait le détour par les espaces ]RN et ]RI_

Remarque.
◊ Un sous-espace vectoriel contient toujours le vecteur nul.
◊ L'espace nul et E sont deux sous-espaces vectoriels de E; on les appelle les sous-espaces
triviaux. Chaque espace vectoriel E a «son» espace nul {OE}. Ainsi, il y a autant d'espaces
nuls que d'espaces vectoriels. Cependant, on parle toujours de « l'espace nul », car ils sont
tous canoniquement isomorphes : il existe5 un unique morphisme entre deux espaces nuls
donnés, l'application nulle, et c'est un isomorphisme.
◊ Un sous-espace vectoriel strict est un sous-espace vectoriel F tel que F ~ E.
◊ Si F est un sous-espace vectoriel de E et si G est un sous-espace vectoriel de F, alors G est
un sous-espace vectoriel de E. Évidemment, la relation d'inclusion définit ainsi une relation
d'ordre sur l'ensemble des sous-espaces vectoriels d'un espace vectoriel E fixé.

Test 17.27. Test 17.28.


Montrer qu'une partie F non vide de E est un Ces assertions sont-elles vraies ?
sous-espace vectoriel si et seulement si a. Z est un s.e.v. de IR.
\f (u, v) E E2 , \f 'A E K, u + 'Av E F.
b. L'axe réel est un s.e.v. de IC.
c. L'axe imaginaire est un s.e.v. de IC.

5
En revanche, deux espaces nuls sur des corps de bases différents ne sont pas isomorphes.
470

III.2. Image et noyau d'une application linéaire


i
•<U
Nous venons de voir une première méthode pour vérifier qu'une partie F de E est un sous-
;§ espace vectoriel. Mais qu'en est-il si F n'est pas donné explicitement? Nous allons voir dans
] cette partie comment les applications linéaires permettent de construire directement des sous-
•<U espaces vectoriels.
:W
s Propositiôn l'f.23. Soit f.: E ~ E1 11.ne'ÔtpplîëiJ,tiôtt lifÛ!a~: ·sotenïf 'ûrt 'i>or1,sJ..espâet!;
~ :vectoriel.~ E , et f' ur,, soil,s;.ea~ Vt;Ctoriel dit(f/; Alà-rs~;" ·
o.. 1)· !t'im• ffr1.•~âfs,r1,1ri'~it~ :vec~el·.tle•fi>·
2) L 'imàge réciproque f-:-:1{F} ·est un sous-espace v~tori.è( de 'E.

PREUVE.

1) Soit F CE un sous-espace vectoriel. Soit u', v' E f(F) et i\, µ E lK. Alors il existe u, v E F
tels que f(u) = u' et f(v) = v'. Donc i\u' + µv' = i\f(u) + µf(v) = f(i\u + µv) E f(F).
2) Soit maintenant F' C E' un sous-espace vectoriel. Soient u, v E f- 1 (H) et i\, µ E lK.
Alors f(u) et f(v) sont dans F'. Donc f(i\u + µv) = i\f(u) + µf(v) E F', ce qui montre que
i\u + µv E f- 1 (F'). ■

Définition 17.24. Soit f: E-) F une application linéaire.


On appelle noyau de f l'image réciproque par f de l'espace nul. On le note6 Ker (f).

Ker (f) = f- 1 ({0}) = {u E E I f(u) = 0}.


On appelle image de f l'image directe de E par f. On la note lm (f).

lm (f) = f(E) = {v E E :3 u E E, v
1 = f(u)}.
Il résulte de la proposition 17.23 que le noyau est un sous-espace vectoriel de l'espace de départ
et l'image un sous-espace vectoriel de l'espace d'arrivée. La propriété la plus importante du
noyau est la suivante (comparer avec les homomorphismes de groupes du chapitre 9).

PREUVE. Soit f: E-) E' une application linéaire.


= O. Par injectivité, 0 est le seul antécé-
(==}) Supposons que f est injective. On sait que f(O)
dent de O. Ainsi Ker (f) = {O}.
({=) Supposons que Ker (f) = {0} et soit (u, v) E E2 tel que f(u) = f(v). Alors, f(u-v) =
f(u) - f(v) = 0, donc u-v E Ker (f). Ainsi u -v = 0, puis u = v. ■

EXEMPLE 17.26.
o Soit A E AlmnOK). Alors l'espace des solutions du système linéaire homogène Ax = 0 est
le noyau de l'application linéaire A: ocn-) ocm.

5
La notation Ker pour le noyau vient de l'allemand« Kern » et de l'anglais« kernel ».
471

◊ Soit I C lR un intervalle. On montre en analyse que la dérivation

~ : 'i!f 1 (Il ---t 'i!f(I) f H ddf = f'


dx x
est linéaire. Elle est surjective, c'est-à-dire que son image est 'i!f(I), car toute fonction continue
possède une primitive. Son noyau est constitué des fonctions constantes sur I.
o Lenoyaudel'endomorphisme'i!f 00 (JR) ---1 'i!f00 (JR), f H f"+festl'ensembledesolutions
de l'équation différentielle
y"+y=0.

En analyse, on montre que la solution générale de cette équation différentielle est une com-
binaison linéaire des fonctions sin et cos.

Propositionl7.27. ·•Soitf :·E ➔ F une application linéaire ej soit l-t·un sous-espace vectoriel
de E:.Ators ~. restriction ftH de f à H est une applièation tinéàire de noyau Ker(f1wl =
HnKëtf.

PREUVE. Notons g = f1H.


► Soit v EH. Si g(v) = 0, alors clairement f(v) = O. Donc Ker (f1Hl CH n Ker f.
► Inversement, si v EH n Ker f, alors g(v) = f(v) = O. Donc H n Ker f C Ker (f 1H). ■

En résumé, nous disposons des trois méthodes suivantes pour montrer qu'une partie H
non vide de E est un sous-espace vectoriel.
- En montrant la stabilité de H par combinaisons linéaires. Par exemple : 'i!f(I).
- En consid'erant H omme image réciproque d'un sous-espace vectoriel par une ·applica-
tion linéaire, en particulier comme un noyau. Par exemple : Ker A, comme l'espace des
solutions du système linéaire homogène Ax = O.
- En considérant H comme image d'un sous-espace vectoriel par une application linéaire,
en particulier comme image de l'espace de départ. Par exemple : si v 1 , .•. , Vp sont des
vecteurs de ocn, alors vect (v 1 , ... , vp) est l'image lm (f) de l'application linéaire f :
JKP ---t ocn, (À1, ... , Àp) H Lj=l ÀjVj ·
Le noyau d'une application linéaire est l'exemple par excellence d'un sous-espace vectoriel.
En effet, nous verrons que tout sous-espace vectoriel est le noyau d'une application linéaire
(voir le corollaire 19.18, page 523). Mais nous verrons aussi que ce point de vue n'est pas
toujours instructif. Par exemple, même s'il existe une application linéaire f définie sur JR 1 telle
que Ker (f) = 'i!f(I), l'espace d'arrivée serait trop« théorique» pour être exploitable. En effet,
il faudrait dans ce cas définir f à partir de 'i!f(I). La connaissance de l'application f ne nous
apprendrait donc rien de plus sur 'i!f(I). C'est pourquoi les deux autres méthodes ci-dessus ne
doivent pas être negligées.

Test 17.29. Test 17.30.


Soit F le plan d'équation z = x + y dans JR 3 . Les applications suivantes sont-elles injectives?
Exhiber une application linéaire :
a. f:JR 2 ---ilR2 , (x,y)H(2x-y,x-2y);
a. f : JR 3 ---l lR dont le noyau est F ; b. f:JRZ---lJR3,
(x, y) H (2x-y,2y -4x, 6x- 3y);
b. g : JR 2 ---l JR 3 dont l'image est F.
c. f:lR 2 ---lC, (x,y)H(x+iy)(x-iy);
472

d. f: OC[X]----, OC[X], P(X) H P(X 2 +X+ 1) « Pour faire partie du "petit noyau",
e. <l> : 'i&' 2 (I) ----+ 'if(I), f H f' - f. du ''petit groupe", du "petit clan"
des Verdurin, une condition était
Test 17.31. suffisante, mais elle était nécessaire
[... ]))
Soient f : E ----, F et g : F ----, G deux applications
linéaires. Que pensez vous des propositions sui- a. Dresser la liste de tous les mots de cette
vantes? phrase qui sont aussi des notions mathéma-
tiques.
Ker ( g o f) = Ker (f) n Ker (g)
Ker ( g o f) C Ker (f) ; b. Il y a un mot qui devrait déranger le logicien
Ker ( g o f) :::i Ker (f) ; en herbe que vous êtes. De quel mot s'agit-il?
Im (f) C Ker{ g) # gof = 0. Test 17.33.
Test 17.32. Soit f : E ----+ E' une application linéaire. Le
Voici la première phrase du livre Un amour de graphe de f défini par {(v, f(v)) v E E} est-il un
1

Swann (paru en 1913) de Marcel Proust. sous-espace vectoriel de E x E' ?

III.3. Sous-algèbres
D'après la définition 17.4, une sous-algèbre de A est un sous-ensemble qui contient le vecteur
1A , qui est un sous-espace vectoriel (c'est-à-dire qui est stable par combinaisons linéaires), et
enfin qui est stable pour la multiplication interne. Nous donnons dans cette partie quelques
exemples de sous-algèbres, à la lumière de la notion de morphisme que nous avons développée.

EXEMPLE 17.28.
o JK[X] est une sous-algèbre de JK[[X]].
o 1Kn[X] n'est pas une sous-algèbre de JK[X] (sin> 0).
o 'i!fk(I) est une sous-algèbre de JR 1.
En effet, c'est un sous-espace vectoriel (exemple 17.22) ; la fonction constante égale à 1 est
de classe 'i!fk, et en analyse nous apprenons que le produit de deux fonctions de classe 'i!fk
est aussi de classe 'i!fk.
o De même, on montre que l'ensemble C des suites réelles convergentes est une sous-algèbre
de ]RN_

Dans ce qui suit, nous écartons le cas de l'algèbre nulle, c'est-à-dire que nous supposons
que O /. 1 (voir question-test 17.6).

Image et image réciproque par un morphisme. Soit f: A----, A' un morphisme d'algèbres.
Comme dans 17.23, on montre que l'image réciproque d'une sous-algèbre de A' est une sous-
algèbre de A et que l'image d'une sous-algèbre de A est une sous-algèbre de A'.

Plus petite sous-algèbre. Pour toute JK-algèbre A l'image du morphisme d'algèbres

]K----, A,À H À·lA

est une sous-algèbre de A, notée lK- lA. Comme ce morphisme est injectif (son noyau est nul),
on peut identifier 1K avec 1K · 1A· Par ailleurs, une sous-algèbre de A contient forcément tous
les vecteurs de la forme À· 1A où À E K Il s'ensuit que 1K · 1A est la plus petite sous-algèbre
de A.
473

carrées est consti-


Par exemple , la plus petite sous-alg èbre de l'algèbre Atn(K) des matrices
tuée des matrices

où À E lK.

Test 17.34. Test 17.35.

Dans m.JR on considère les sous-ensembles formés Dans JR1>1, on considère les sous-ensembles for-
més
a. Par les fonctions polynomiales ;
b. Par les fonctions en escalier ; a. Par les suites de limite nulle ;
c. Par les fonctions de période 1 ; b. Par les suites majorées ;
d. Par les fonctions f telles que f( 1) = 0; c. Par les suites bornées ;
e. Par les fonctions f telles que f(O) = 1; d. Par les suites arithmét iques;
f. Par les fonctions monoton es ; e. Par les suites géométri ques;
g. Par les fonctions à support borné (nulles en f. Par les suites périodiques ;
dehors d'un segment) ;
g. Par les suites de Fibonacci, c'est-à-di re telles
h. Par les fonctions ayant +oo ou -oo pour li-
que Un+2 = Un+l + Un, \l'n E N;
mite en +oo;
h. Par les suites positives.
i. Par les fonctions affines.
Dans chaque cas, indiquer s'il s'agit d'un sous- Dans chaque cas, indiquer s'il s'agit d'un sous-
espace vectoriel, d'une sous-algèbre de m.JR. espace vectoriel, d'une sous-algèbre de RN.

IV. EXER CICES

17.1. 17.3.

On note E = RN. Les sous-ensembles suivants


On munit R''t- de la loi interne u EE v = uv et de
sont-ils des sous-espaces vectoriels de E ?
la loi externe À Gu= u\ pour (u, v) E (JR~_)2
et À E R. Obtient-o n un R-espace vectoriel ?
f = {(un) nEN E E lim (un -Un+iJ = o}
I n-->oo
17.2.

3
Dans l'espace vectoriel E = JR , on considère les
G = { (unlnEN E E \Un= o(n2)}
I Un ~ *}
sous-ensembles
2
E R },
H = { (un)nEN E E
F = {(À-3µ ,2À+3µ ,À), (À,µ)
G = { (x,y,z) E E I x+2y =Ô }· L = { (unlnEN E E 1 :lk E lR, Un ~ ~}
1. Prouver que les ensembles F et G sont des
sous-espaces vectoriels de E. (Voir définitions 25.84 et 25.94 pour les sym-
2. Détermin er le sous-espace vectoriel F n G. boles des O et ~ .)
Chapitre 18
BASES

ANS ce chapitre, nous allons nous intéresser à la façon de repérer la position d'un

D vecteur dans un espace vectoriel donné. L'idée repose sur le fait que l'on dispose
de beaucoup d'applications linéaires à valeurs dans 1K. Ce sont les valeurs prises
par ces fonctions en un vecteur donné qui vont déterminer la position de ce dernier. Par
exemple, dans le cas de l'espace canonique :ocn, l'ensemble constitué des projections :ocn-, :OC,
(x 1 , ... , Xn) H Xk pour k = 1, ... , n détermine la position de tout vecteur.
Nous distinguerons deux types d'espaces vectoriels : ceux de dimension finie pour lesquels
un ensemble fini d'applications linéaires à valeurs dans 1K suffit pour déterminer la position
de tout vecteur, comme dans le cas de :ocn, et ceux de dimension infinie, pour lesquels un
ensemble infini est nécessaire. Il est cependant remarquable qu'un ensemble optimal de fonc-
tions linéaires existe toujours. Ce fait repose sur l'existence, pour tout espace vectoriel, d'une
notion que nous avons déjà rencontrée pour l'espace canonique: tout espace vectoriel possède
une base.
Dans le cas de la dimension finie, ce point de vue est particulièrement intéressant car
il permet de ramener l'étude des applications linéaires entre espaces de dimension finie au
calcul matriciel, et ainsi à des calculs sur des scalaires. Toutefois, l'isomorphisme par lequel
un espace vectoriel de dimension finie s'identifie à un espace canonique n'étant pas unique, il
nous faudra faire preuve ici de la plus grande vigilance sur la façon dont le calcul matriciel
entre en jeu. Comme précédemment, E désigne un :OC-espace vectoriel dans tout ce qui suit.

1. Sous-ESPACE VECTORIEL ENGENDRÉ PAR UNE PARTIE

Étant donnée une partie d'un espace vectoriel, il existe un plus petit sous-espace vectoriel
qui la contient pour la relation d'ordre définie par l'inclusion. On l'appelle le sous-espace
vectoriel engendré par cette partie. Nous avions déjà rencontré cette notion dans le cas de
l'espace canonique :ocn et nous la reprenons ici dans le cas plus général d'un espace vectoriel
quelconque. C'est une première étape en vue de la définition d'une base.

I.1. L'espace vectoriel JKOl des familles presque nulles


Jusqu'à présent, nous avons toujours manipulé des combinaisons linéaires d'un nombre fini de
vecteurs. Par exemple, dans l'espace IK[X], le polynôme

est une combinaison linéaire des vecteurs Xk pour k = 0, ... , p. Si on souhaite ajouter à P le
polynôme

on se heurte à une petite difficulté d'écriture : la somme P + Q devrait être le polynôme dont
le j-ième coefficient est la somme Cj =ai+ bi. Or si p -=/ q, la formule n'est pas correcte pour
476

les indices j > min(p, q). Il faut en effet distinguer le cas où p > q, dans lequel Cj = Uj, du
cas où q < p, dans lequel Cj = bi. Évidemment, cette discussion alourdit les démonstrations.
Pour remédier à ce problème, il suffit de compléter le polynôme de plus petit degré par
des coefficients nuls jusqu'à l'indice max(p, q) car alors la formule des coefficients de P + Q
est bien ci = ai + bi pour tous les indices. Mais par exemple dans le cas où p > q, il a fallu
compléter Q, alors que dans le cas où q < p, il a fallu compléter P. Nous n'échappons donc
pas complètement encore à une discussion.
L'idée est alors de compléter les polynômes par une infinité de coefficients nuls. Ainsi nous
écrivons P et Q comme des séries formelles
+oo +oo
P- ~a-Xi
- L._ J ' Q = LbiXj
j=O j=O

et nous obtenons la formule concise


+oo
P+Q = L(ai+bi)Xi.
j=O

Plus formellement, par l'isomorphisme d'espaces vectoriels


+oo
JK_l11 ----+ OC[[X]], (aj)jEl'I HL aiXi,
j=O

le sous-espace OC[X] de OC[(X]] correspond à un sous-espace de ocN. Nous le notons oc(NJ_ Il


est formé des suites de la forme ( a 0 , a,, ... , av, 0, 0, ... ) . Ces suites sont caractérisées par la
propriété d'avoir seulement un nombre fini de termes non nuls.
Bien sûr, nous n'avons rien fait de plus que de rappeler la définition des polynômes,
puisqu'entre OC[[X]] et OCN, en tant qu'espaces vectoriels, il ne s'agit que d'une différence
de points de vue entre familles et fonctions. Nous allons généraliser cet exemple des suites,
éléments de OC!\/, aux fonctions ou familles quelconques.
Définition 18.1. Soit J un ensemble.
► On dit qu'une fonction f E OC 1 est presque nulle ( ou à support fini) si l'ensemble supp( f) =
{j E JI f(j) -# O} est de cardinal fini.
► On dit qu'une famille x = (xiliEJ E OC 1 est presque nulle (ou à support fini) si l'ensemble
supp(x) = {j E JI Xj -# O} est de cardinal fini.

Notation. Dans les deux points de vue, on note ocm le sous-ensemble de ocJ formé par les
familles (ou fonctions) presque nulles.

Proposition 18.2.
L'ensemble grn des familles presque nulles est un S-Ous-espace vectoriel de JK:1.
PREUVE. On voit facilement que, pour tous f, g dans oc1 et tout,\ E OC*,
supp(f + g) C supp(f) U supp(g) et supp(M) = supp(f).
On en déduit qu'une combinaison linéaire de deux fonctions à supports finis a encore un
support fini. ■

Soit maintenant (viliEJ une famille quelconque de vecteurs d'un OC-espace vectoriel E et
soit (Àj)jEJ une famille de scalaires dans K Alors l'expression

LÀjVj
jEJ
477

est une combinaison linéaire si Jest fini. Mais si J est infini, il s'agit d'une somme infinie dont
il est difficile de donner un sens sans notion de convergence. Cependant, si seul un nombre fini r/J

de termes sont non nuls, on convient que seuls ceux-là sont pris en compte dans la somme. ~
o:l
La somme infinie n'est alors qu'une notation commode qui cache en réalité une somme finie.
00
Plus précisément, si (;\i)iEJ E ocm, il existe des indices j 1 , ••• , jn E J tels que Àj = 0 pour tout ......
.d
j E J\01, ... , jn}- Alors on pose ü
n
.L_ ÀjVj = .L_ Àjk Vik .
jEJ k=l

Notons que l'ensemble {j 1 , ... , jn} n'est pas unique car il peut comporter un nombre arbitraire
mais fini d'indices dont le coefficient associé est nul. Heureusement le terme de droite est bien
indépendant de ce choix. Sauf mention contraire, les sommes infinies que nous rencontrerons
en algèbre linéaire seront formées par des familles de coefficients presque nulles.
Règlé l8;!k Dans 'linè comlnnaisbn tiriéaire d/un nomb~ infini de' vecteurs de E., toy,s lès co-
effièîènts saufun nombre fini dàivent 'tire nuls. :Autremènt dit, èltè est de la Jorrnè rJEtÀjVj,'
avec \lj E E et {Àj)JeJ dans JK.Ul. .

Test 18.1. Test 18.2.


La suite constante 1 = (1, 1, ... ) est-elle combi- Soit J un ensemble. Que pensez-vous des asser-
naison linéaire des suites suivantes? tions suivantes?
a. K(J) = KT # J est un ensemble fini.
lio = (1,0,0,0, ... ) b. Si la famille (Àj)JEJ est presque nulle et in-
jective alors J est un ensemble fini.
li1 = (0, 1,0,0, ... )
li2=(0,0,l,0, ... ) Test 18.3.
À quelles conditions les suites suivantes sont-
elles presque nulles ?
a. Une suite stationnaire, c'est-à-dire constan-
te à partir d'un certain rang.
b. Une suite périodique.

1.2. Sous-espace engendré par une partie


Nous abordons un procédé très général de construction en mathématiques : dès qu'une struc-
ture est préservée par intersection, il est possible de définir la notion d'espace engendré par
une partie. Nous allons détailler ce procédé dans le cas de la structure d'espace vectoriel. Bien
sûr, cette construction reste très théorique. Aussi ferons-nous intervenir la notion de famille
presque nulle pour une description plus explicite du résultat obtenu.
têîitnie ··18.4: ... L 1intèfséction â'unêfâm,i.lle ~C.ÔntJû,t'. de SiYÛsfespaces, .vëctàriel$ ·.de .E. est
un. so~ësp✠-vectoriel de È. · · · · ·

PREUVE. Soit (Fj)jE) une famille de sous-espaces vectoriels de E. Notons F = njEJ Fj leur
intersection. Nous constatons que le vecteur nul est dans F car chacun des Fi le contient. Soit
(u, v) E F2, (;\, µ) E JK2 et j E J. Alors (u, v) E Ff, donc ;\u+ µv E Fi car Fi est un sous-espace
vectoriel. Comme cela est vrai pour tout j E J, il en résulte que Àu + µv E F. ■
478

Proposition-d:élinition · 18;5; 8d E ·11,n espaie- vecturiel et V c E une tmme. '.Alors il


existe une unique ,siMcWt;:,;yect(V} E. E ·qui· oorifit les trois· œndttwns=suivante,f: •
1) W est ftn $oûs~êiptiri('IJectorièl clé E ;
2)VcW; . .

3) Si Fen un sous-espace vectoriél de E et si V cF, alors Wc F,


......
Autrement· ditt vectfV} est le plus petît àes sous-espaces vectoriels· qui contiennent V: Il est
......
...... donné par la form:ule · ·
vect(V) ::i î. n
·F·. VCFc:j :,_ •.
S.e.l/,"" IC.

On l'appellelesoûs-espaœ ~ectiriëfêngendré pa,i'.y.


PREUVE.
► Notons§ l'ensemble des sous-espaces vectoriels F de E qui contiennent V. Montrons que la
partie vect {V) = n § = {x E E 1 \fF E §, x E F}, donnée par la formule de l'énoncé, satisfait
bien les trois conditions souhaitées.
1) E est un "sous-espace vectoriel» de lui-même et il contient V donc E E § et § est non
vide. Son intersection est bien un sous-espace vectoriel de E d'après le lemme 18.4.
2) Par définition, chaque F de § contient V donc il en est de même pour l'intersection de
tous les F E §.
3) Soit Fun sous-espace vectoriel de E qui contient V. Alors FE§ et donc six E n §, on
a x E F. Cela montre que n§ CF.
► Montrons maintenant l'unicité de vect (V). Soient W 1 et W2 deux parties de E satisfaisant les
trois conditions de l'énoncé. Alors W 1 est un sous-espace vectoriel contenant V. La condition 3)
appliquée à F = W1 et à W = W2 montre que W2 C W1. De manière analogue, en échangeant
les rôles de de W1 et W2, on obtient l'inclusion réciproque W1 C W2, ce qui montre par double
inclusion l'égalité W 1 = W2 souhaitée. ■

Remarque. En particulier vect (0) = O. Nous obtenons ainsi une application vect : V H
vect (V) de l'ensemble des parties de E dans l'ensemble des sous-espaces vectoriels de E.
o L'application vect est surjective car vect (F) = F pour tout sous-espace de E.
o L'application vect est croissante : si V C U C E, alors vect(V) C vect(U).
o L'application vect est idempotente: vect(vect{V)) = vect(V).

La définition 18.5 est conceptuellement satisfaisante, mais n'est guère opératoire. Voici
une description plus explicite du sous-espace vectoriel engendré.

Propôsition 18.6. SôitV uiie pq,rl!iè nôri mde de E. Alors.

txv".,
'-\iâv'· •1·•· J.À,,···•.•.·,·.!••.
ve.•·· ~
Y. . . . .•l[{(V)·.l··.·••:.
} .
Le sous-espaee véctoriel enge'ndréJHJr\' estJ'ensemble
de vecteurs âeV. · · · ·· ·
d,: toût~sles combinaisons
·
linéaires

PREUVE. Notons H le membre de droite de la formule (18.1).


► On sait que vect (V) est un sous-espace vectoriel, donc il est stable par combinaisons li-
néaires. L'ensemble V est inclus dans vect (V), donc vect (V) contient toutes les combinaisons
479

linéaires de vecteurs de V. D'où l'inclusion vect (V) :::, H.


► Inversement la somme de deux combinaisons linéaires de vecteurs de V reste une combi- rJJ
Q)

naison dans H et, de même, pour le produit d'une combinaison linéaire de vecteurs de V par gJ
i:o
un scalaire. De plus, H contient évidemment V. Par conséquent, H est un sous-espace de E et
cxi
vect (V) C H d'après la condition 3) de la définition 18.5. ■ '""
..d
ü
Sous-espace vectoriel engendré par une famille.
Définition 18.7. Soit (vj)iEJ une famille de vecteurs de E. Le sous-espace vectoriel engendré
par la famille (viliEJ est le sous-espace vectoriel engendré par la partie {vi I j E J}. On le note
vect ((viliEJl-
Autrement dit,

vect ((viliEJl = vect{vi I j E J} = { L. ÀjVj


jEJ
Pour une famille finie (v 0 , ••• , Vp), on note encore

vect(v 0 , ..• , vp) = JK:v0 + · · · + lKvp.


Nous pouvons faire trois observations.
- Une permutation de l'ensemble J des indices n'affecte pas le sous-espace vectoriel engen-
dré par la famille (viliEJ·
- Si la famille (viliEJ n'est pas injective, c'est-à-dire si un vecteur y figure plusieurs fois,
cette redondance n'apporte rien de plus au sous-espace vectoriel engendré par la partie
{vi i j E J}.
- À toute partie V nous pouvons associer la famille (v)vEV· Et inversement, à toute famille
(vj)iEJ nous pouvons associer la partie V = {vi I j E J}. Dans tous les deux cas, les
sous-espaces engendrés sont les mêmes.
Dans ce contexte, travailler avec des familles ou avec des parties revient donc au même.
Désormais nous dirons que la famille (viliEJ contient la famille (ue)eEL s'il existe une application
cp : l-+ J telle queue= Vq:,(e) pour tout CE l, autrement dit, si {ue I C E l} C {vi I j E J}.

Test 18.4. Test 18.6.


Donnez une équation du plan F dans JR3 engen- Comparer les sous-espaces vectoriels de IK[X]
dré par les vecteurs (1,0,-1) et (0,0, 1). engendrés par les parties

Test 18.5.
Soient U, V des parties de E. Que pensez-vous Test 18.7.
des assertions suivantes?
On considère l'espace vectoriel JRIR des fonctions
continues. Pour chacun des sous-espaces vecto-
a. vect (V n U) = vect (V) n vect (U). riels ci-dessous, dresser la liste des fonctions
constantes qu'il contient.
b. vect (V n U) c vect (V) n vect (U). a. F=vect(sin,cos).
b. G = vect(sin 2 , cos 2 ).
c. vect (V\U) C vect (V)\vect (U).

d. vect (V) = V {=} V est un s.e.v. de E.


480

Test 18.8. Que pensez-vous de la formule vect (V)


Soit E un espace vectoriel et V C E. LJ vect (U)?
ucv
Ufini

II. BASES. DIMENSION

Nous allons reprendre les notions de famille libre, de famille génératrice et de base que nous
avons rencontrées dans le cas particulier de l'espace canonique ocn. L'idée est que la plupart
des raisonnements que nous avions tenus au chapitre 15 ne requiert pas l'existence d'une
base canonique et donc qu'ils s'étendent sans difficulté aux espaces vectoriels généraux. Nous
séparerons les espaces vectoriels en deux grandes catégories : ceux qui sont isomorphes à un
espace canonique ocn et les autres. Nous verrons de plus que ceux de la première catégorie sont
complètement classés par les entiers naturels, ce qui nous conduira à la notion de dimension.

II.1. Familles génératrices. Familles libres


11.1.1. Familles génératrices

Avant d'expliquer ce qu'est la dimension d'un espace vectoriel, donnons une première définition
grossière qui distingue les espaces vectoriels de dimension finie des autres espaces vectoriels.
Définition 18.8. Une partie V C E est une partie génératrice de E si vect(V) = E. On dit
aussi que V constitue un ensemble de générateurs de E. De manière analogue, une famille
est génératrice si son image l'est.

Définition 18.9. On dit que E est de dimension finie s'il existe une partie génératrice finie
de E et on note alors dimE < oo. Dans le cas contraire, on dit que E est de dimension infinie
et on note dimE = oo.
Remarquons que tout espace vectoriel E possède une partie génératrice V : il suffit de prendre
V = E. La notion ne sera évidemment intéressante que si nous sommes capables de déterminer
des parties génératrices beaucoup plus petites.

EXEMPLE 18.10.
o Au chapitre 15, nous avons déjà montré que ocn et tous ses sous-espaces vectoriels sont de
dimension finie.
o L'espace des polynômes OC[X] possède les générateurs naturels Xk, k E N. Montrons que
OC[X] est de dimension infinie. Supposons par l'absurde qu'il existe une partie génératrice
finie {P 1, ... , PT} de OC[X]. Soit m le plus haut des degrés de ces générateurs. Alors toute
combinaison linéaire des Pk est de degré au plus m. Donc le polynôme xm+l n'est pas dans
vect (P1, ... , PT}, ce qui contredit l'hypothèse.
o Soit F l'ensemble des solutions de l'équation différentielle 11" + 11 = O. Alors Fest le sous-
espace vectoriel de 'tf' 00 (JR) engendré par les fonctions sin et cos. Par conséquent, F est de
dimension finie.
481

Test 18.9. . linéaire surjective de :oc:n sur E, pour un certain


n;:, 1. [/J
Donner une partie génératrice de IC , vu comme
IC-espace vectoriel. Test 18.11.
~
Donner une partie génératrice de IC 2 , vu comme 'cxi°
~-espace vectoriel.
Test 18.10.
Les espaces vectoriels suivants sont-ils de di-
mension finie ? -
..d
u
a. Le sous-espace de 'if 00 ( ~ ) engendré par les
Les assertions suivantes sont-elles correctes ? sin(k)
fonctions de la forme k!, avec k E N.
a. Si E possède une partie génératrice infinie,
alors il est de dimension infinie. b. L'espace des solutions d'un système linéaire
b. Si dim E < oo, alors son cardinal est fini. homogène Ax = O.
c. Si dim E < oo, alors il existe une application c. L'espace des endomorphismes de :oc:n.

11.1.2. Familles libres

Rien ne change pour les familles libres par rapport au cas de l'espace canonique sinon qu'il
peut exister maintenant des familles libres infinies. Notre travail sur les familles presque nulles
facilite cependant grandement leur maniement.

Définition 18.11.
1) Une famille (vi)iEJ de vecteurs de E est libre si pour toute famille (Ài)iEJ E JKOl on a
l'implication
L_ ÀjVj = 0 =} 't;/ j E J, Àj = 0.
jEJ
2) Une famille (vj)iEJ de vecteurs de E est liée s'il existe une famille non nulle (Àj)iEJ E JK.Ol
telle que LiEJ ÀjVj = 0.

Évidemment, toute famille est soit libre, soit liée, et les deux notions s'excluent mutuellement.
Nous avons bien sûr une définition analogue pour les parties : une partie V CE est libre si la
famille (v)vEV est libre, c'est-à-dire si, pour tout (Àv)vEV E JK,(Vl, on a l'implication

L. ÀvV = 0 =} 't:/ V E V, Àv = 0.
vEV

EXEMPLE 18.12.
◊ Les fonctions sinus et cosinus forment une famille libre dans le .IR.-espace vectoriel 'i&' 00 (JR.).
En effet, soient À, µ deux réels tels que Àsin x + µ cos x = 0 pour tout x E R Alors en
évaluant cette relation d'abord en x = 0, puis en x = n/2, il vient que µ = 0, puis À = O.
Donc les fonctions sin et cos forment une partie libre.
◊ La famille (Xk)kEN dans JK[X] est libre : un polynôme est nul si et seulement si ses coeffi-
cients sont nuls.
◊ Soit fk: lK-, lK définie par h(x) = xk pour tous x E lK et k EN. Alors la famille (fklkEN
à valeurs dans JKiK est libre. En effet, c'est une propriété des fonctions polynomiales définies
sur lK = lR. ou C: la fonction polynomiale lK.-, JK, x H P(x), définie par P E JK.[X], est nulle
si et seulement si P = 0 (voir la proposition 13. 71).
482

Remarque. Un C-espace vectoriel est aussi un :IR-espace vectoriel. Toutefois une famille
liée dans un C-espace vectoriel E ne l'est pas nécessairement dans E en tant que :IR-espace
vectoriel. S'il y a lieu de préciser, on parlera alors de familles liées ou libres sur C ou sur R

EXEMPLE 18.13. La famille des vecteurs (1, i) et (i+ 1, i-1) de C 2 est liée sur C (car son
1 déterminant 2 x 2 est nul), mais libres sur R

Proposition 18.14.
Po-ur toute famille (vj}1eJ de vecteùrs de. E, les propriétés. suivantes sont éqùivalentes :
1) lafamille {viljeJ es.t libre;
2) poùr chaque t E J; le vecteur Vt n'est pas combinaison linéaire des vecteurs VJ pour
j E J\{t}; .
3) tout vecte-ur du sous-espace F engendré par la Jam:l,lle (vJ)ieJ s'écrit de m~ière unique
comme combinaison linéaire des VJ ;
4) si un vecteur de E peut· s'écrire comme combinaison ·tméaite· des VJ, cette écriture est
ùniqué.
PREUVE.
1) =} 2). Montrons la contraposée. Supposons qu'il existe un indice C E J tel que Vt soit
combinaison linéaire des vecteurs Vj pour j =J C. Ainsi il existe une famille presque nulle de
coefficients (i\liEJ\{il telle que Vt = Lïµ ÀjVj. On complète cette famille de coefficients en
posant Àt = -1 et on obtient que LiEJ Àivi = 0. Donc la famille (viliEJ est liée.
2) =} 3). Soit v E F = vect({vj I j E J}). Par définition, le vecteur v s'écrit sous la forme d'une
combinaison linéaire des vecteurs Vj, soit encore
V= _L ÀjVj,
jE)
avec (Àj)jEJ une certaine famille presque nulle de coefficients. Montrons que cette écriture est
unique. Supposons par l'absurde que v = LiEJ ~vi pour une autre famille (~liEJ presque
nulle. Cela signifie qu'il existe un indice C tel que Àt =J µf. Et comme .L. (Àj - µj)Vj = 0, on
jEJ
obtient que Vt = -(Àt - µt)~ 1 .L (Àj - ~)vi, ce qui contredit l'hypothèse 2).

3) =} 4). Supposons la condition 3) satisfaite. Soit v un vecteur de E. Ou bien v est dans
F = vect ({vi I j E J}) et dans ce cas la condition 3) montre que v possède une unique écriture
comme combinaison linéaire des Vj, ou bien v n'est pas dans F et dans ce cas il ne s'écrit pas
comme combinaison des Vj .
4) =} 1). Supposons la condition 4) satisfaite. Soit (Àj)iEJ une famille presque nulle de coef-
ficients telle que LiEJ ÀjVj = O. Alors le vecteur nul est combinaison linéaire des Vj. D'après
la condition 4), cette écriture est unique. Comme 0 = LiEJ0 · Vj, la famille nulle convient et
donc Àj = 0 pour tout j E J. ■

Test 18.12. Test 18.13.


Est-ce que {1, i} est une partie libre dans C, Montrer que toute famille non injective est liée.
vu comme C-espace vectoriel? Et dans C, vu
comme lR.-espace vectoriel?
483

Test 18.14. On note h(x) = eix_


Que pensez-vous des assertions suivantes? a. La famille (h, sin, cos) est-elle libre dans le rJJ
Cl)

a. L'intersection de parties libres est libre. JR-espace vectoriel ICIR ?


~
b. L'union de parties libres est libre.
c. Une partie V C E est libre si et seulement si
toute partie U ~ V est libre.
b. La famille (h, sin, cos) est-elle libre dans le
IC-espace vectoriel icoc ? -
oci
.d
ü
Test 18.17.
d. Une partie V C E est libre si et seulement si
Les assertions suivantes sont-elles vraies ?
toute partie finie U C V est libre.
a. x H x2 , x H x 2 + x 3 sont liées dans ICIC.
e. Toute partie d'une partie liée est liée.
b. (exp,sinh,cosh) est libre dans JRIR_
Test 18.15.
c. (sin,cos) est libre dans ]Roc_
Les fonctions log et y' forment-elle une fa-
mille libre dans le JR-espace vectoriel JRlO,oo [? Test 18.18.
Test 18.16. Soit J un ensemble. Déterminer toutes les fonc-
tions f E icJ telles que f, f 2 soient liées.
11.1.3. Opérations sur les familles

Jusqu'ici, pour montrer qu'un espace vectoriel est de dimension infinie, nous ne disposons que
de la définition : il faut montrer que toute famille génératrice est infinie. Ce n'est pas une mé-
thode facile parce qu'il faut envisager toutes les familles génératrices possibles et celles-ci sont
infiniment nombreuses. Nous allons voir dans cette partie qu'il est possible de remplacer cette
définition par un critère beaucoup plus simple. Un espace vectoriel est en effet de dimension
finie si et seulement s'il possède une famille libre infinie. Il suffit donc d'exhiber au moins une
telle famille pour montrer que l'espace est de dimension infini.
Ce sera pour nous l'occasion de revoir succintement les opérations élémentaires sur les
familles que nous avons étudiées dans ocn. Leur généralisation aux espaces vectoriels quel-
conques est immédiate et nous renvoyons le lecteur à la preuve du lemme 15.15 pour tous les
détails.

tëriime 1s.15~; · ·
Soientv € E~ (vjheJ unef11,mil!e de vecteurs de E et fixons un indice k € f.
Remphleer un générateur; ·
Si:11.s'~rii com1neu'lte i:oml;~on l~ire des Vi ~pec un coe,fficient d'irulice. k non
}• :~,; itlory~•Pf!ttt~~}<i flê1;tew'vir.··•~.Y.sims fi]frtct~lë sôtis~~ tJéet(Jrlel
engendré iô,r:Îilfamüle{
. .. . .
Additionner à un générateur une combinaison linéaire des àutres.
Si ~n,11,dditùmn: avk une com,bin~isonJinéaire dep autres vecteûrs de la famille (v,heJ,
t:ela ne ého,1Jg(tpas·le~o~esp<iœ Vllcloriel'engeooré.··
0

$tipprimêr ut1 ·gên~ateù.t · · . .


S'iJ ëxisté '!!ne -felatùm'~ iMpéndanœ linroim entro les Vj pour laqueUe le coefficient
d'indice k est 1Îonr111il, alors on peuttm,pprimerle vèctéurvir. dela famille (vj}JeJ sans
affecter lé if>.11:5~hJJmœ •fffièùfnel engendré.·.
Enrichir un famille libre.
Si la famille ( vf }mJest fibre €tsi l'onTaugmente d 1u1r v8Cteur ifui. n'est pas combinaison
linéaire des v;,' tilors l(J;Jàm;iJle cbtênüe est enœre libre.
484

Avant d'aborder la question des espaces de dimension infinie, rappelons quelques notions
sur les cardinaux. 1 Un ensemble J est fini si J = 0 ou s'il existe un entier n E N* et une
bijection {j E N 11 ~ j ~ n} --t J. Dans ce cas, cet entier est unique, on l'appelle le cardinal
de J et on le note card J = n. Autrement dit, chaque ensemble fini est en bijection avec un
unique ensemble «modèle», de la forme {j E N 1 ~ j ~ n} pour J -/- 0. Dans le cas des
1

ensembles infinis, nous pourrions aussi bâtir une liste d'ensembles modèles pour classer tous
les ensembles à bijection près, mais ce serait aller beaucoup trop loin dans le formalisme de
la théorie dites des ordinaux. Bien plus modestement, nous nous contenterons d'écrire que
card J = oo si J n'est pas fini .

. \ttcntion card N = card IR = oo

Dans ce chapitre et contrairement à l'usage, la condition card I = card J ne signifie pas


que les ensembles I et J sont en bijection s'ils sont infinis.

On étend la relation d'ordre habituelle de N à NU{oo} en posant n ~ oo pour tout n EN.

Pl'()positj9n ÎSrÎI!· SQit J:\lt}Ji;J y~/0:mille libre <le t1it~ùr;s de !- et.{tt,e)~1, ~11,ef<1'fT!;ilJe
générutri~. AlorB eardJ ~ carciL . . . . . . ..
PREUVE. Si card l = oo alors il n'y a rien à démontrer. Nous traitons donc seulement le cas
où E possède une famille génératrice finie (u 1, ... , Uql, c'est-à-dire le cas où E est de dimension
finie. Supposons par l'absurde que card J > q. Alors la famille (vj)jEJ contient une sous-famille
libre (v1, ... , Vq+l ). Exactement comme dans la preuve de la proposition 15.16, page 397, on
utilise le lemme 18.15 pour remplacer l'un après l'autre les vecteurs de la famille génératrice
par des vecteurs de la famille libre. À la fin du processus, on obtient une famille génératrice de
vecteurs pris dans la famille libre, autrement dit de la forme (v 1, ... , vq), quitte à réindexer
la famille. C'est impossible car le dernier vecteur Vq+l serait une combinaison linéaire des
vecteurs v 1 , ••• , Vq. ■

P;ropnsiti9..,18;J,7;\ ·U11, ..~e.1,HXJtorifl est-t/e~rµ~i,mtJ,n/i'li,.i.tf sîxe~s.~e'lifi{~ffe>ssêde


unè ifarliè llôre: infinie. ·· ··

PREUVE.
( {=) Si un espace vectoriel possède une partie libre infinie, alors d'après la proposition 18.16,
il n'existe pas de famille génératrice finie. Donc l'espace est bien de dimension infinie.
( ==}) Soit E un espace vectoriel de dimension infinie. Nous allons définir par récurrence une
suite Vo, V1, v2, ... de vecteurs de E comme suit.
► Comme E est de dimension infinie, on a E-/- {O} et on choisit pour v 0 un vecteur arbitraire
non nul.
► Soit k E N. Supposons que nous avons déjà choisi les vecteurs v 0 , ••• , vk. Ces vecteurs
n'engendrent pas E, qui est de dimension infinie. Alors on choisit arbitrairement vk+ 1 E E \
vect{vi 11 ~ j ~ k}.

1
Pour plus de précision, voir le chapitre 8 sur le dénombrement.
485

D'après la quatrième opération décrite dans le lemme 18.15, on obtient ainsi pour tout k EN
une famille (v 0 , ... , vk) libre. La famille infinie 2 (viliEN est libre. ■
i'.l
~
Cœ:olhûm 18~18. cxi
.....
'foût §~~ésp<i&e'ieètorlèl d'ûn ~'spad fliêti>rteîde:.dimet&à:wn fime es'i"dê dimensi<:m fi,nte. ..d
ü

PREUVE. Soit F un sous-espace de E. Il suffit de remarquer qu'une famille libre de vecteurs


de F est encore libre dans E. Ainsi, une famille libre infinie dans F peut être vue comme une
famille libre infinie dans E. ■

Dans JKN notons C le sous-espace vectoriel des suites convergentes, Co celui des suites
convergentes avec limite nulle et S celui des suites stationnaires, c'est-à-dire constantes à
partir d'un certain rang. Or, dans JK(NJ, nous connaissons la famille libre infinie

e 1 = (1,0,0,0, ... ), e2 = (0, 1,0,0, ... ), e3 = (0,0, 1,0, ... ), ...

Donc ][((NJ est de dimension infinie. Comme nous avons les inclusions

et comme de plus JKN ':::'. JK[[X]] et JK(NJ ':::'. JK[Xl, nous en déduisons la liste suivante d'espaces
vectoriels de dimension infinie.

Cotollâir~ ts~l.9. . .. > • ..• .. ·•• .. ·..... · .. · . . • . • ·.· ·. .·.


Lês es,lâêis. J[(INl;' S, C-0: ê, KM', K[XJ êt Kl{X]l Sd1ltâ:,i':di11Îensiort ;;finit. ··•·
Soit I C :IR un intervalle non-réduit à un point. Notons Fp 0 1(I, JK) le sous-espace vectoriel
de JK 1 formé par les fonctions polynomiales. Les fonctions x H xn, n EN, forment une famille
libre infinie dans Fp 01 (I, JK). Pour tout k EN on les inclusions

ÇoroJ!ajre 18.20, . , . ·•. . · .•.·· .


I&s ~;paces F 101ll;KJ, ~k(l,K} poutitout. kE NU {oo}, et. K.1 sont de dimensiori..mfinîe.
Test 18.19. c. l'espace des suites périodiques qui admettent
Les espaces vectoriels suivants sont-ils de di- 5 pour période ;
mension finie ? d. l'espace des suites de Fibonacci;
a. L'espace des fonctions paires sur lR; e. l'espace des solutions d'un système linéaire
b. l'espace des suites périodiques; comme par exemple (16.12).

2 Pour construire chaque famille finie (vo, ... , vk), nous avons dû faire un nombre fini de choix. Pour « emboî-
ter » toutes ces familles en une famille infinie (v 0 , ... , vk, ... ), il faut donc opérer une infinité dénombrable
de choix. Le passage dans cette construction des familles finies arbitrairement grande à la famille infinie est
en fait un point délicat, bien que correct si on dispose de l'axiome du choix de la théorie des ensembles, que
nous n'exposerons pas dans ce livre.
486
Il
Il.2. Bases et dimension
~
.
Il)

•Il)
Nous allons établir que tout espace vectoriel admet une base. Ce fait repose sur le résultat
;§ classiquement connu sous le nom du théorème de la base incomplète et sera la clef de voûte de
.
Il)

.c
,Il)
la classification des espaces vectoriels de dimension finie. Il est à noter que, même en dimension
finie, extraire une base d'une famille génératrice n'est pas complètement évident.
'01)

< Le cas de la dimension infinie est très similaire à celui de la dimension finie mais le trai-
- tement de l'infini requiert plus de technicité dans le maniement de la théorie des ensembles

~
que nous avons pris le parti de ne pas exposer dans ce cours de première année. Aussi, bien
11. que le résultat soit valable pour tous les espaces vectoriels, nous limiterons la démonstration
de l'existence d'une base (théorème 18.22) au cas des espaces de dimension finie.

11.2.1. Tout espace vectoriel possède une base

Par famille génératrice minimale, nous entendons une famille génératrice {viliEJ de E telle
que, pour tout € E J, la famille «diminuée» (vj)jEJ\{f} n'est pas génératrice de E. Par famille
libre maximale, nous entendons une famille libre {viliEJ telle que pour tout v E E, la famille
«augmentée» (viliEJ U {v} est liée.

Propositwn~di,finition 18.21.
Soit éA = (bf)ièJ une famille dans E,. Les propriétés suivantes !JO~ .élf,d.110,},ent~ .:
1) ·!JB est lilrre et génémtnœ âe E ;
2) T<JUt vect~ur ~e Ese déœ~JX>$e ên ~e 11,niqtie mmbi~n(i~ aè~; ·
3} ~ est une famille libre ma:rimalé; . . . . .. . . . ...
4) éA .est.'!!,nt partie génfmtrice minimale;
Si Èllf vérifie ces propriétés, ord'appelle ùne: basé de E.

PREUVE.

1) =} 2). C'est une conséquence directe de la proposition 18.14.


2) =} 3). La condition 2) et la proposition 18.14 impliquent que fJ6 est libre. Montrons la
maximalité. Soit v E E. Par hypothèse v est combinaison linéaire des bi, donc la famille
constituée de v et des vi, pour j E J, est liée.
3) =} 4). Supposons fJ6 libre maximale.
► Montrons qu'elle est génératrice. Soit v E E. Par l'hypothèse de maximalité, il existe une
relation de dépendance linéaire Àv + LiEJ Àj bi = O. Si À était nul, la liberté de fJ6 montrerait
que tous les Àj sont nuls, ce qui est impossible pour une relation de dépendance linéaire. Donc
À =/= 0 et on peut écrire v comme combinaison linéaire des Vj .
► Montrons qu'elle est minimale. Supposons par l'absurde qu'il existe€ E J tel que la famille
{viliEJ\{f} soit encore génératrice de E. Alors Ve est combinaison linéaire des vi avec j =/= €, ce
qui contredit la liberté de ff6.
4) =} 1). Supposons que fJ6 est génératrice minimale et montrons qu'elle est libre. Supposons
par l'absurde qu'il existe une relation de dépendance linéaire de la forme LiEJ Àjbi = 0, avec
Àe =/= 0 pour un certain indice € E J. D'après le lemme 18.15, la famille {biliEJ\{f} est encore
génératrice, ce qui contredit la minimalité de ff6. ■
487

Théorème 1s:22. {de la base incomplète).


1) Toutefamilldiore JJeut être complétée en:4ine base.
2) Toute famille génératrice contient une base.
3) Tout espace vectoriel possède une base.
4) Si !19 = (bi);EJ et fi== (bdeeL sont des bases de E alors card(J) = c:ard(l).
PREUVE. Comme annoncé, nous limitons la preuve de ce théorème au cas des espaces de
dimension finie. Soit E un espace vectoriel de dimension finie et soit (u,, ... , uq) une famille
génératrice de E.
1) Soit V une famille libre dans E. D'après la proposition 18.16, toute partie libre est de
cardinal au plus q car {u 1 , ... , Uq} est une partie génératrice de E. Considérons toutes les
parties libres qui contiennent V. Leurs cardinaux forment un sous-ensemble M de N majoré
par q. Soit n le plus grand élément de M. Il existe donc une partie libre !JlJ qui contient V et
qui est de cardinal n. Mais alors !JlJ est libre maximale, donc c'est une une base de E.
2) Soit V une partie génératrice de E. Considérons dans un premier temps le cas où V est
finie. Considérons toutes les parties génératrices finies contenues dans V. Leurs cardinaux
forment un sous-ensemble N de N. Soit n le plus petit élément de N. Il existe donc une partie
génératrice finie !JlJ contenue dans V et de cardinal n. Mais alors !JlJ est génératrice minimale,
donc c'est une base de E. Il reste à traiter le cas où V est infini. Écrivons chaque vecteur de la
partie génératrice {u 1 , ... , uq} comme combinaison linéaire de vecteurs de la partie génératrice
V
Uk = .L. i\k,vV, (i\k,vlvEV E oc(VJ, k = 1, ... , q. (18.2)
vEV
Les supports Vk = {v E V I i\k,v -=fa O} sont finis car les familles (i\k,vlvEV sont presque
nulles. Posons V' = u~=l vk. Autrement dit, V' est l'ensemble (fini) des vecteurs de V qui
«comptent» dans les combinaisons linéaires (18.2). Chaque vecteur de E est combinaison
linéaire des u 1 , •.. , Uq et donc aussi combinaison linéaire des vecteurs de V'. On vient donc
d'extraire de V la partie génératrice finie V' C V. Nous nous sommes donc ramenés au cas
fini et V' contient une base de E.
3) On a le choix : ou bien on applique 1) et on complète une partie libre, par exemple
l'ensemble vide, en une base, ou bien on applique 2) et on extrait une base d'une partie
génératrice, par exemple de E tout entier.
4) C'est une conséquence immédiate de la proposition 18.16. ■

Définition 18.23. Soit E un espace vectoriel et !JlJ = (biliEJ une base de E. On appelle
dimension de E le cardinal de J et on le note dim E cardJ. C'est donc un élément de
NU {oo}, indépendant du choix de la base !Jll.

Corollai,re 18.24. · Soit E un €space vectoriel de dimension finie fi .


1) 'Toutefamille gênératrléedé E I)(issèàe•aumoins n vectevlts.
2) Si Une famîl,le den vecteûrs engendre Ë, àlors i:!estune tfasê:
3) Toutefamille.lilJre.,dans f..possède au plus n .vecteurs.
4) Toute famille libre dans E avec n vecteurs est une base· de E.
488

La notion de dimension formalise l'intuition que nous avons d'un nombre de degrés de liberté.
Avec de l'habitude, on peut deviner la dimension d'un espace donné avant de chercher à la
calculer : il s'agit d'appréhender le nombre minimal de paramètres nécessaires pour décrire
une position quelconque d'un élément de l'espace.
1 1

EXEMPLE 18.25. A
1
1
1
1

Soit F le sous-ensemble de JRl-l,ll formé des fonctions conti- -1: 10


1
1
1
1

nues dont les restrictions à [-1, 0[ et à [0, 1] sont affines. On le


vérifie facilement que Fest un sous-espace vectoriel. Une fonc- 1
1
tion de F a l'allure ci-contre. 1 1 1
Comme chacun des points A, B, C peut être déplacé le long d'une« verticale», on devine
qu'une position est caractérisée par les trois hauteurs des points A, B, C et on s'attend à ce
que la dimension de F soit 3. Pour le démontrer rigoureusement, écrivons la forme générale
d'une fonction f de F. Il existe trois paramètres a, b, c tels que

f(x) = {ax+ b
si -1::;; X< 0,
ex+ b si O ~X::;; 1 .

On retrouve que trois paramètres sont nécessaires pour décrire cette fonction. En fait, on
montre alors facilement que les trois fonctions f1, fz et f3 définies par

si -1 ::;;x<0, si-1::;;x<0,
s1 0~x~l, si 0 ::;; X ::;; 1 ,

forment une base de F et que les coefficients qui figurent dans la définition de f sont donnés
par la décomposition f = af1 + bf2 + ch

Ptopqsitioû t8:2ft Piiùr tout soûs-espaœ veoiorieH 'de E on a


1) dim.F ~ dîmE,
2) Si E est de dimension finie, alors on a dimf =dimE si et seulement si F = E.

PREUVE.

1) Si E est de dimension infinie, alors il n'y a rien à prouver. Considérons donc le cas où
n = dimE < oo. D'après le corollaire 18.18, la dimension du sous-espace Fest également finie.
Alors il existe une base de F formée de p vecteurs, avec p = dimF. Cette base de F est une
famille libre de E. D'après le point 3) du corollaire 18.24, on a donc p ~ n.
2) Si dimF = dimE = n, il existe une base de F formée den vecteurs. D'après le point 4) du
corollaire 18.24, c'est aussi une base de E, d'où F = E. ■

.-\ttc11ti()Jl On peut avoir F Ç E et dim F = dim E


C'est possible en dimension infinie. Par exemple, l'espace des polynômes JK[X] est de
dimension infinie. Le sous-espace strict des polynômes de degrés pairs est également de
dimension infinie.
489

Proposition 18.27. Soient E, E' deux K-espaœsvectoritls:c Alors


dim(E x E1) = dim E +dimEr. • rn
11)
gJ
PREUVE. Soit (bj)jEJ une base de E et (b~ltEL une base de E'. Alors les vecteurs m
cxi
......
(bi, 0), pour j E J, et (0, b~), poud E l, ..d
u
constituent une base de Ex F. En effet, cette famille est évidemment libre. Les vecteurs (bj, 0)
engendrent les vecteurs de la forme (x, O) avec x E E, les vecteurs (0, bn engendrent les
vecteurs de la forme (O, y) avec y E E'. Or, tout vecteur de Ex E' se décompose sous la forme
(x,y) = (x,0) + (0,y). Donc la famille obtenue est génératrice. On a donc dim(E x E')
card (J) + card (l) = dim E + dim E'. ■

Bien sûr, cet énoncé se généralise à un nombre fini quelconque de facteurs.

Test 18.20. de Amn(lK) formé des matrices (Utk) telles que


Otk = 0 pour f ( k?
Soit {b1, ... , bn} une base de E. Les parties
suivantes sont-elles des bases de E ? Test 18.23.
a. {b1, 2b2, 3b3, ... , nbn}- On pose f(x) = cos(4x), g(x) = sin(Sx). Les
b. {b1 + bn, b2 + bn, ... , bn-1 + bn,2bn}- fonctions f + 4g, 4fg', Sg - fg', Sf sont-elles
linéairement indépendantes dans <t' 00 (R) ?
c. {b1 - bn, b2 - b1, b3- b2, ... , bn - bn-1}.
Test 18.24.
Test 18.21.
Trouver une base de
a. Donner une base de l'espace des polynômes a. l'espace de solutions de l'équation différen-
pairs. tielle y" +y= 0,
b. Déterminer dim 1Kn[X] . b. l'espace des suites à valeurs dans R de pé-
c. Montrer que les polynômes X - 2, X2 + 1, riode 3.
X2 + X - 1, X2 - X sont liés.
Test 18.25.
Test 18.22.
Quelle est la dimension de l'espace vectoriel des
Quelle est la dimension du sous-espace vectoriel fonctions affines de lK dans lK?

11.2.2. Bases canoniques

Une base canonique d'un espace vectoriel E est une base que l'on estime naturellement asso-
ciée à sa structure d'espace vectoriel. C'est une base que l'on choisit de privilégier. Comme
nous avons déjà eu l'occasion de le mentionner, il n'y a pas de définition universelle du mot
«canonique» en mathématiques. C'est une affaire de convention.
A contrario, il existe des espaces qui n'ont pas de base canonique. Ce sont ceux pour
lesquels il n'existe pas de procédé pour construire algorithmiquement la moindre base. Ce
sont donc en particulier des espaces de dimension infinie. Il y a en effet une grande différence
entre démontrer qu'une base existe toujours et en construire explicitement une. Par exemple,
il n'est pas possible d'expliciter une base pour les espaces vectoriels ][(N, ][(IK et 'i&'k(I) où I est
un interval non trivial de IR et k E NU {oo}. Dans cette partie, nous allons passer en revue
quelques espaces dont il est bon, pour sa culture générale, de connaître les bases canoniques.
o ocn possède la base naturelle

e0 =(1,0,0, ... ,0) e1 = (0, 1,0, ... ,0) en= (0,0,0, ... , 1).
490

◊ OCn[X] possède la base naturelle (Xk)o,:;;k,(n.


◊ OC[X] possède la base naturelle (Xk)kEI\I .
◊ Les espaces vectoriels OC[X] et ][((Nl sont isomorphes. La base naturelle de OC[X] correspond
à la base naturelle (l\j)jEN de oc(NJ où

l>o=(l,0,0,0, ... )
ÔJ = (0, 1,0,0, ... )
1>2=(0,0,1,0, ... )

◊ Montrons que l'espace J[(Ol où J est un ensemble arbitraire, possède également une base
naturelle.
Pour cela rappelons le symbole de Kronecker défini par la formule

ô -{1
if -
sij=f,
0 si j-=/- f

Pour tout j E J, la famille ôj = (ôitltEJ peut donc aussi être vue comme la fonction Ôj : J --,
OC, f H Ôjf qui prend la valeur 1 en j et qui est nulle partout ailleurs.

Proposition 18.28. L'espace Km des- familles presque nulles a pour base (h;heJ · E~ parti-
culier dimJKΠ= card f.
PREUVE.
► Montrons d'abord que (l>iliEJ est libre. Soit (Àj)jEJ une famille de scalaires presque nulle
telle que LiEJ Àiôi = O. C'est une identité de fonctions que nous pouvons évaluer en un point
f E J arbitraire, ce qui donne les relations

Tous les coefficients Àt sont nuls, ce qui montre bien que ( Ôj) iE J est libre.
► Montrons que {ôi I j E J} est une partie génératrice. Soit f E ocm. Notons S le support de
f. Alors S est fini et

Comme cette dernière relation est vraie pour tout f, nous obtenons l'égalité des fonctions
f = LiES f(j)l\i, ce qui démontre bien que {ôi I j E J} est génératrice. ■

Remarque. Évidemment, on décide que la base (&rliEJ est une base canonique. Pour J=
{1, ... , n} (resp. J = N) on retrouve la base naturelle de ocn (resp. ][((Nl).
491

Test 18.26. réelles stationnaires, c'est-à-dire des suites


Trouver une base de l'espace Y' des suites constantes à partir d'un certain rang. (/J
V
~
o:i

-
cxi
.d
(.)

II.3. Système de coordonnées associé à une base

Pour décrire la position d'un vecteur de plan, il suffit de fixer un repère constitué de deux
vecteurs non colinéaires, puis d'identifier tous les vecteurs du plan aux couples de coordonnées
dans JR'. 2 à l'aide de la décomposition dans cette base. Ce procédé se généralise à tout espace
vectoriel de dimension quelconque et conduit à la notion de système de coordonnées.
De plus, comme nous l'avons vu, les bases canoniques sont très rares. Ainsi il est presque
inévitable qu'en de multiples occasions nous choisissions diverses bases pour un même espace
vectoriel. Or pour deux choix de base donnés, les coordonnées d'un vecteur fixé seront en gé-
néral différentes. Il nous faudra donc apprendre à faire le passage d'un système de coordonnées
à l'autre.

II.3.1. Fonctions coordonnées associées à une base en dimension finie

Pour fixer les idées, nous commençons par considérer les espaces vectoriels de dimension finie.
L'idée sous-jacente à cette partie est qu'il existe toujours suffisamment de fonctions linéaires
sur un espace vectoriel pour distinguer chacun des vecteurs. Pour un espace de dimension n,
nous allons voir qu'il suffit de n fonctions bien choisies pour distinguer chacun des vecteurs.

Définition 18.29. Soit E un espace vectoriel de dimension n et soit pg = (b 1 , ... , bn) une
base de E. Alors l'application linéaire
<D.@ : ocn-) E' (i\,, ... ,i\n) H i\,b, + ... + Ànbn.
est un isomorphisme d'espaces vectoriels. Si on décompose un vecteur sous la forme v =
.[_~1 i\ibi,
alors les coefficients i\i sont appelés les coordonnées de v dans la base /!g_ L'iso-
mophisme réciproque <D .sW = (<D.@')- 1 défini par
n
<D,@' : E-) ocn, VH (i\,, ... ,i\n) tel que V= L i\kbk
k=l

est appelé un système de coordonnées associé à la base /!g. On peut le voir comme un n-uplet
<D.@ = ( <p 1, ... , <rnl de fonctions linéaires <ri : E -, 1K pour j = 1, ... , n, appelées fonctions
coordonnées associées à /!g.

Le système de coordonnées associé à /!g envoie donc tout vecteur v E E sur le n-uplet de
ses coordonnées dans la base /!g.
Remarque. Rappelons que les fonctions coordonnées sont linéaires parce que ce sont les
composantes d'une application linéaire à valeurs dans ocn (voir la question-test 17.17). Ces
fonctions sont très sensibles au choix de la base : si on change un seul vecteur d'une base il se
peut que toutes les fonctions coordonnées changent, comme le montre l'exemple ci-dessous.
492

b1 b1
le vecteur v a pour coordonnées ( 1, 1) . le vecteur v a pour coordonnées (3, 0).

Voici une première conséquence de l'existence de systèmes de coordonnées.

Proposition 18.30. Deux espaces vectoriels de dimensions finies sont. isomorphes si. et
seulement s'ils ont m~e dimension.
PREUVE.
Soient E, E' deux OC-espaces vectoriels de dimensions net m respectivement.
( ==}) Si n = m, alors on a deux isomorphismes E é:-:é ocn et E' é:-:é ocn (via des systèmes de
coordonnées), donc E é:-:é E'.
( ==}) S'il existe un isomorphisme f : E -2t E', alors l'image par f d'une base de E est une base
de E'. Donc les deux espaces ont la même dimension. ■

La démonstration de la proposition 18.30 peut s'interpréter comme suit. Nous avons étudié
au chapitre 15 une liste d'espaces vectoriels
IK, IK2 , ... , ocn, ...
Or, tout espace vectoriel de dimension finie est isomorphe à un unique élément dans cette
liste. Autrement dit, à chaque entier n ;;?; 1 correspond un unique espace vectoriel ocn, et à
chaque espace vectoriel E de dimension finie correspond un unique entier n tel que E soit
isomorphe à ocn. La liste des espaces canoniques est une classification des espaces vectoriels
de dimension finie. Il est très remarquable d'avoir ainsi pu mettre en correspondance un objet
infini et «continu», tel qu'un espace vectoriel, avec un objet fini et discret, sa dimension.

Toutefois, comme nous l'avons déjà évoqué en introduction du chapitre 17, ce serait une
erreur de vouloir faire de l'algèbre linéaire uniquement sur ocn, même en dimension finie. En
voici quelques raisons supplémentaires.
◊ Raison naturelle. L'isomorphisme <I>a1 entre E et ocn n'est pas naturel, il dépend du choix
de la base /1' dans E. En général il n'y a pas de base naturelle donc pas de choix naturel.
◊ Raison nominale. En identifiant tout espace de dimension finie avec l'espace canonique on
perdrait vite le contact avec la question posée. Les objets mathématiques portent des noms et
sont notés d'une certaine façon, ce qui n'est pas anodin dans notre manière de les penser. Par
exemple, l'espace engendré par les colonnes d'une matrice a la même dimension que l'espace
engendré par ses lignes. Donc les deux sont isomorphes. Or il serait complètement absurde
d'identifier ces deux espaces.
◊ Raison efficiente. Passer en coordonnées signifie en général que l'on va faire des calculs,
avec toujours une possibilité d'erreur et le risque de perdre le fil de ce que l'on souhaite prouver.
Nous savons par expérience que beaucoup de problèmes de géométrie ont des solutions courtes
et élégantes sans calcul en coordonnées. Il faut garder le passage en coordonnées comme une
roue de secours quand on a plus d'idée.
493

Voici enfin deux caractérisations des systèmes de coordonnées.

Proposition 18.31. . .___ _ _ _ ~


Soit_ E un .espace vectoriel de dimension finie et soit ff.l =Jb1; ... , bn) une base de E. ~
1) Le système de coordonnées associé à BI est l'unique n-uplet de fonctions linéaires cpj ....cxi
E -tlf{, j = 1, ... , n telles que · .d
ü
n
VvEE, V= L cpj(v)bj. (18.3)
j=l

2) Le système de coordonnéès associé à ~ est l'unique n-uplet de fonctions linéaires 'Pl :


E--+lK, j=l, ... ,ntellèsque
V (j, f) E {l, ... , n}2 , cp;(bt) = b;t. (18.4)
PREUVE.
1) C'est une conséquence immédiate de la définition 18.29 des fonctions coordonnées.
2) Comme la décomposition de chaque vecteur be suivant la base ff.l est unique, les fonctions
coordonnées vérifient bien la condition (18.4). Inversement, soit Wi : E --+ lK une fonction
linéaire telle que lj,i(be) = Ôje pour tout t Nous allons montrer que <rJ = Wï- Soit v E E. La
relation (18.3) montre que v = .L~=l cpe(v)be. Donc la linéarité de Wi entraîne que

Wi(v) = Wi (t, cpe(v)be) = t, cre(v)lj,j(be) = t, <pe(v)ôje = <rJ(v),

ce qui prouve l'égalité des fonctions Wi et <ri. ■

EXEMPLE 18.32. Soit l'espace vectoriel E = {(x 1, x2, X3) E JR. 3 X1 - 2x2 + 4x3
1 = O}. Dans
l'exemple 15.24, nous avons exhibé deux bases de E,

ff.l = (b1,b2) = ((2, 1,0), (-4,0, 1)),


ff.l' = (b;,b;) = ((4,4, 1), (-2, 1, 1)),

et nous avons montré que pour tout x = (x 1 , x2, x 3 ) E E on a

Chaque système de coordonnées définit un isomorphisme E _:::, JR. 2 . Les formules pour les
fonctions coordonnées sont

et

II.3.2. Fonctions coordonnées associées à une base en dimension infinie

Soit E un espace vectoriel (de dimension arbitraire) et soit ff.l = (bi )jEJ une base de E. Le
système de coordonnées associé à la base ff.l est l'isomorphisme réciproque <D /Jè E --+ JKOl
de l'isomorphisme
<D/]è : JKOl --+ E, (Àj)jEJ H .L.
Àjbj.
jEJ
494

Le système de coordonnées <DaJ est donc une famille ( <rïljEJ de fonctions de E dans OC., les
fonctions coordonnées associées à la base !JIJ. Comme en dimension finie, ces fonctions sont
caractérisées par les deux propriétés équivalentes

a) Vv E E, v = L, cpi(v)bi ,
jEJ
b) Vj E J, <ri est linéaire et V€ E J,

--
EXEMPLE 18.33. Soit !JiJ = (Xi)iEN la base naturelle de OC.[X]. Alors le système de coor-
données <D 86 est un isomorphisme qui, à un polynôme, associe la suite quasi nulle de ses
coefficients.
<DM : JK.[X] ----+ oc_(Nl, P=L_aiXi H (aj}jEN•
jEN
La fonction coordonnée <ri envoie un polynôme sur son coefficient d'ordre j.

Test 18.27. Test 18.29.


Soient u et v des vecteurs d'un espace de Expliciter le système de coordonnées <l> aJ dans
dimension 3. Dans un système de coordon- les cas suivants :
nées (<p1, <p2, <p3) associé à une base, on a a. E = lKn et 8lJ la base canonique ;
cpz(u) = 2cp3(v) = 4 et cp3(u) = 3cp2(v) = 3.
Montrer que u, v sont libres. b. E = 1Kn[X] et 8lJ = (1, X, ... , xn);
Test 18.28. c. E = lK2[X] et 8lJ = (1, 1 + X, 1 +X+ X 2 );
Montrer la linéarité des fonctions coordonnées d. E=lK 2 et8ll=((l,0),(1,1));
directement à partir de (18.3). e. E=lK2 et8ll=((l,1), (-1,1)).

11.3.3. Changement de coordonnées

Matrice de passage. Un changement de base induit un changement des coordonnées. Soient


!JiJ = (b1, ... , bnl et !JIJ' = (b;, ... , b~} deux bases de E et soit <DaJ = (<p1, ... , <rnl et
<D af' = (cp;, ... , cp~) les systèmes de coordonnées associés. Exprimons chaque vecteur de la
base !Ji]' en fonction des vecteurs de la base !JiJ. On a
n
b( = L, Ytkbr . (18.5)
f=l

Pour tout vecteur v E E, on a

Cela signifie que


<rr(v) = L_ Ytk<r((v), f = 1, ... , n. (18.6)
k=l

Traduisons (18.5) et (18.6) matriciellement.


495

Règle 18,34. (Matrice d$ passage).


La matrice de.passagè de!:IJNers fJlJ' est la matrice Cfflffl' = (Y&c) dont la k-ième colonne r/J

est le vecteur bk de la « nouvelle » base exprùmé ·en coordonnées dans l '« ancienne » base fJlJ. ~
o::i
Autrement dit3
(J:) = tcfflffl'( J). (18.1)
....00
a
Soit v E E un vecteur et soient x1, .•. , Xn. ses coordonnées dans la base fJlJ et soient x1, ... , x:.
celles dans fJlJ'. Alors
(18.8)

Remarque. L'usage de la terminologie « ancienne base » pour fJlJ et « nouvelle base » pour
est très commode pour apprendre ces formules. On retiendra les deux propriétés suivantes
!li)'
des matrices de passage.
- Les colonnes de la matrice de passage sont les vecteurs de la nouvelle base écrits en
coordonnées selon l'ancienne base.
- La multiplication par la matrice de passage exprime les anciennes coordonnées en fonction
des nouvelles.
Remarquons le chiasme : la matrice de passage permet d'exprimer les vecteurs de la nou-
velle base en fonction de ceux de l'ancienne, mais elle permet d'exprimer les anciennes coor-
données en fonction des nouvelles. C'est à rapprocher du problème de changement d'heure
effectués dans beaucoup de pays européens deux fois par an : si par exemple on passe directe-
ment de 3h à 4h du matin, ou bien on considère que l'on a avancé les aiguilles de la montre
d'une heure (point de vue des coordonnées), ou bien on considère que le minuit de l'ancien
temps a lieu une heure plus tard que le minuit du nouveau temps (point de vue du choix de
l'origine, c'est-à-dire de la base). Le mélange des deux points de vue est source de bien des
confusions. Il faut faire très attention.

EXEMPLE 18.35. Dans JR. 2 nous considérons les deux bases

et

b;=½b1-½b2
On a le système entre vecteurs
{
b~ = ½b1 + ½b2.
On transpose la matrice de ce système et on obtient la matrice de passage de fJlJ à !llJ',

c~.@' = ; ( ~ 1 ~) .
Notons x et y les coordonnées associées à fJlJ (coordonnées naturelles) et x' et y' les coor-
données associées à !llJ'. Pour les coordonnées on a donc le système
X= ½x'+½y'
{
li= -½x' + ½11'

3
Il s'agit d'un système den équations entre vecteurs (et non entre scalaires!). Le produit d'une matrice avec
un élément de En est défini de manière analogue au produit d'une matrice avec un élément de IKn.
496

qui permet de traduire toute équation avec les «anciennes» coordonnées x, 11 en une équation
avec les «nouvelles» coordonnées x', 11'- Remplaçons par exemple les «nouvelles» coor-
données dans l'équation de l'hyperbole x 2 - 11 2 = 1 .

1= X2 - 112 = (x' +11') _ (-x' +11') = X,11 , .


2
2
2
2

Dans les « nouvelles coordonnées», l'équation de l'hyperbole est x'11' = 1.


'' 111
1

'' 1
'' 1
1
'' 1
'' b2
''
''
''
X

Dans les deux systèmes d'équations l'hyperbole possède deux équations différentes. On
notera que l'hyperbole reste la même et que c'est le système de coordonnée qui change. Cette
situation est à distinguer du cas où on envoie l'hyperbole H sur une autre hyperbole f(H) par
un automorphisme f du plan, le système de coordonnées restant le même; la question qui
se pose alors est savoir comment on déduit, toujours dans le même système de coordonnées,
l'équation de f(H) de l'équation de H (voir l'exercice 18.14 pour la réponse).

Plusieurs passages. On peut résumer la situation par le diagramme suivant.

Nous identifions ici la matrice C~~, avec son application linéaire. D'après la formule (18.8),
on a <I>~ = CfiB!iB' o <I>fiB'· Cela signifie que dans le diagramme ci-dessus, si on part du nord,
nous pouvons aller directement vers le sud-ouest ou bien faire le détour par le sud-est, mais
le résultat sera le même. On dit que le diagramme est commutatif
Ces diagrammes sont très utiles pour garder une vue d'ensemble des divers changements de
base que nous considérerons. Par exemple, avec trois bases 8ll, 8ll', et 8ll" de E, les changements
de base possibles sont représentés par le diagramme suivant.
497

j
00
....
6

Comme chacun des trois petits triangles commute, le grand triangle commute aussi. On déduit
que C$$' C$'$" = C$$". Si on prend en particulier !!li= !!li" on trouve C$$' C$'$ = C$$ ;
or la matrice de passage de !!li à elle-même est certainement la matrice unité.Cela prouve la
relation de Chasles suivante, à rapprocher par exemple de celle bien connue des vecteurs du
plan (BB' +WB"= 8"13).
Règle 18.36. Toutes !!li, !!li' et !!li"· de E vérifient les propriétés suivantes.
1) C111grCM'•" = C••"·
2) La matrice de passage c••, est inversible et ( c:~•' )- 1
= C111'M·
Test 18.30. Test 18.33.
Considérons l'exemple 18.35. Soient ( (1)1, cpz) et ( cp 1, cp 2) les systèmes de co-
a. Donner la matrice de passage de :JIJ' à :JIJ. ordonnées d'un même espace vectoriel, associés
à deux bases (b1, bz) et (b 1,b 2) respectivement.
b. Soit v = (3, -2) E JRZ. Quelles sont les coor-
On suppose que
données de v dans la base :J1J ? Et dans la base
:JIJ'?
Test 18.31.
Toute matrice de passage est-elle carrée ? Toute Parmi les systèmes suivants, trouvez les intrus !
matrice de passage est-elle inversible ? Toute
matrice inversible est-elle une matrice de pas- cp 1= 3cp1 + 2cpz (/)] = 3cp, + 7cp 2
{ <pz= 7cp1 +Scpz { cpz = 2cp + Scp
sage? 1 2
Test 18.32.
b1 = Sb 1- 2b 2 cp 1= Scp1 - 7cpz
Soit C$$' = (Yrkl une matrice de passage. Que { bz = -7b 1+ 3b 2 { (/)z = -2cp1 + 3cpz
pensez-vous de ces assertions?
a. 'Yik = cpf(bkl, d. 'Yik = cpl'.{b~), b1 = 5b 1+ 2b 2 (/)] = 3cp, + 2cpz
{ bz = 7b 1+3b 2 { cpz = 7cp 1+5cp 2
b. 'Yik = cpUbr), e. 'Yik = cpk(bf).
c. Y ik = <p f{b0 ,

II.4. Images d'une famille par une application linéaire. Rang


Il est aisé de montrer qu'un isomorphisme d'espaces vectoriels transporte les bases de l'espace
de départ vers les bases de l'espace d'arrivée. Dans cette partie, nous allons affiner ce résul-
tat en considérant l'action d'applications linéaires seulement injectives ou surjectives sur des
familles libres ou génératrices. Cette étude approfondit notre connaissance des applications
linéaires. Nous verrons en particulier que l'image et le noyau d'une application linéaire n'ont
pas des dimensions indépendantes.
498

II.4.1. Images d'une famille libre et d'une famille génératrice

Proposition 18.37.
Soit f : E -'-+ F une application linéaire. Alors les propriétés suivantes sont équivalentes :
1) f est injective;
2) pour toute famille libre (v;);eJ dans E, la famille (f(v;) heJ est libre;
-
::::: 3) pour toute base (b;)jeJ de E, la famille (f(b;));er est libre;
4) il existe une base {biheJ de E telle que la famille {f(biJl;er est libre.

PREUVE.
1) =} 2). Soit f injective et soit (vj)iEJ libre dans E. Pour montrer que la famille (f(vj))jEJ est
libre, soit LiEJ Àjf(vi) = 0, avec une famille presque nulle de coefficients (Ài)iEJ E ocm. Alors
f(LiEJÀivi) = LiEJÀif(vi) = 0, donc par injectivité de f, on a LiEJÀivi = 0, d'où Àj = 0
pour tout j E J.
2) =} 3). Toute base est libre.
3) =} 4). Tout espace vectoriel possède une base.
4) =} 1). Soit v E Ker (f). Nous décomposons v dans la base (viliEJ fournie par l'hypothèse 4),
v = LiEJÀibi. Alors LiEJÀif(bj) = f (LiEJÀibi) = f(v) = 0. Par hypothèse (f(bj))iEJ est
libre, d'où Àj = 0 pour tout j E J. On conclut que v = 0, donc le noyau de f est nul. ■

De la même manière que les applications linéaires injectives sont adaptées aux familles
libres, les applications linéaires surjectives le sont aux familles génératrices.

Proposition 18.38. .. . .
Soit f : E ~ F une application linéaire. Alors les propriétés suivantes ·sonté<jrJ:ivalentes :
1) f est surjecti'fle ;
2) pour toutefamille génératrice (vihëJ de Ela famille (f(v1)heJ est génératrice de F;
3) pour toute base (b;heJ de E la famille (f(b;)he, est génératrice de f; .
4) il existe une base O>;}ieJ de 1:. telle que (f(bj)}iEJ est génératrice de F;
5) il existe une famille génératrice (vj);er de E telle ~ue (f(v;HieJ est génératrice de F.

PREUVE.
1) =} 2). Soit f surjective et soit (vj)iEJ une famille génératrice de E. Montrons que la famille
(f(vïlliEJ est génératrice de F. Soit u E F arbitraire. Alors il existe v E Etel que u = f(v). On
écrit v = LiEJ ÀjVi avec une famille presque nulle de coefficients. Alors
u = f(v) = f (LiEJÀivi) = LiEJÀif(vj).
2) =} 3). Toute base est génératrice.
3) =} 4). Tout espace vectoriel possède une base.
4) =} 5). Toute base est génératrice.
5) =} 1). Soit (viliEJ une famille génératrice de E telle que (f(vj))iEJ est génératrice de F. Soit
u E F. Nous pouvons écrire u comme combinaison linéaire de la forme u = LiEJÀif(vi)·
Posons v = LjEJÀivi E E. Alors on a f(v) = f (LiEJÀivi) = LiEJÀif(vi) = u ce qui montre
la surjectivité de f. ■

En combinant les deux propositions 18.37 et 18.38 on obtient la proposition suivante.


499

Prop0$itio:n 18;3'9.
Soit f: E.-4 F•une application linéaire. Alors les propriétés suivttntes·sont équi11alentes ..-: (/J
Q,)

1) .f est '!ilà îsomovphisme ; gJ


CO
2) pour toute llasêJbj}jEJ âlÊ la famille (f{bjJ)jEJ est une oosê JlF; .•. ·.· ...· 00
.....
3) il exïste une basê {bJJJeJ de E telle que lafamille (f{b;}heJ est unè base de F. ..d
u

11.4.2. Définir une application linéaire par les images d'une base

Il est possible de construire une application linéaire en prescrivant dans l'espace d'arrivée
l'image de chacun des vecteurs d'une base choisie dans l'espace de départ.

Prtlposition 18.40. Soient f;g àtlns 2(E, f) fPôit tvj)jEJ .uneJam:i,lle g'énémtrif,è 1e t.;
Alors f.= g F} f(v1) ~ g(vj) pour toùt fE J. · ·· ··
Autrement. dit, une application linéaire est déterminée par_les images de générateurs.

PREUVE.
(===}) Immédiat par définition.
({c=) Soit w un vecteur arbitraire de E. Il s'écrit comme combinaison linéaire w = LjEJÀivi
avec une famille presque nulle de coefficients. Alors

f(w) =f (.L.
jEJ
Àjvi) = .L. À/(vj) = .L. Àjg(vj) = g (.L. Àjvi) = g(w),
jEJ jEJ jEJ
ce qui montre que f = g. ■

Remarque. La proposition 18.40 n'affirme pas que l'on peut définir une application linéaire
f par la prescription des images des générateurs. Par exemple, on ne peut pas demander
simultanément que f(v) = u et f(2v) = u pour v et u fixés non nuls. La proposition dit
seulement que si les valeurs d'une application linéaire sont connues sur une partie génératrice,
alors elle est entièrement déterminée.

ProP9Sition 18.41. ..
Soient (b1heJ une base de E et (UjheJ une JamîUe arbitraïré dans f; Alors il existe une unique
application linéaire f : E -4 F telle que pour tout j E J ·

f(bi}=Uj.

Autrement dit, une application linéaire est définie -par les tràleurs qu'elle prend sur une base.

PREUVE.
► Unicité : c'est une conséquence de la proposition 18.40.
► Existence : Posons
f(v) = L
cpi(v)ui
jEJ
où ( cpilîeJ est le système de coordonnées associé à la base (bj)jEJ· Vérifions que f satisfait les
conditions demandées. Grâce à la propriété (18.4, page 493) des fonctions coordonnées,

\/ i E J, f(be) = _L cpj(be)Uj = _L ÔjfUj = Ue.


jEJ jEJ
500

La linéarité de f découle de celle des fonctions coordonnées. En effet pour tous (v, w) E E2 et
À E OC, on a

f(v + Àw) = L <Pi(v + ÀW)Uj = L (cpi(v) + Àcpj(w)) Uj


~J ~J

= L <Pi(v)ui + ÀL <Pi(w)ui
jEJ jEJ
=f(u) +M(v).

Test 18.34. 18.41, il existe une unique application linéaire


3 2 f : E --, ocn telle que f(bk) = ek. De quelle
Existe-t-il une application linéaire f : JR --, JR
application s'agit-il?
telle que
Test 18.36.
f(l,2,3) = (1,0) et f(2,3, 1) = (1,0)?
Montrer que (P, Q, R) = (X, 2 - X, 1 + X) est
une famille génératrice de lR 1 [X).
Test 18.35. Existe-t-il f : lR 1 [X) --, OC linéaire telle que

Soit ~ = (b1, ... , bnl une base de E. Notons ek a. f(P)=l,f(Q)=3 et f(R)=l,


les vecteurs de la base naturelle de ocn. D'après b. f(P)=l,f(Q)=3 et f(R)=3?

11.4.3. Rang d'une application linéaire

Nous allons définir une notion de rang sur les applications linéaires et étudier ses principales
propriétés. En particulier, toute matrice, élément de Atmn(!K) canoniquement isomorphe à un
élément de 2"(:IKn, ocm), héritera d'une nouvelle notion de rang. Comme il existait déjà une
notion de rang sur les matrices, nous allons vérifier la compatibilité des définitions.

Définition 18.42. Le rang d'une famille de vecteurs de E est la dimension du sous-espace


vectoriel engendré par la famille, soit encore

Le rang d'une application linéaire f : E -, F est la dimension de son image, soit encore

rg (f) = dim lm (f) = dimf(E).

Nous déduisons de 18.37 et de 18.38 les deux majorations suivantes.

Règle 18.43.
1) Si f:.E ~ f es,tlinmire injective, al(.)Ts dimE ~ dimf.
!1) Si .f : f. ~- f est linéairè surjectwe, alors dimE -~ dimf .

Montrons enfin que le rang ne peut que diminuer.


501

Prôpm1itiôn°18,41. tSoie?Jtf·t. E ➔ Fêtg: f ➔ •G deui. appl~îôiis .ti,n~re:t.êt ilôit'(VJher


est 'ûne famille da'8 E.. Alo.71 · · ·
. rglfl ~ mm{diinl:; dimf),· . '.(18.9)
·. •.· rg(i1<>fJ.~min(rg(9],rg(fl); · (18.10)
l'g (f{Vj}je;J) ~ tllÎll{ l'g {f} tg f{Vj )jEJ}) •
1
..· (l8;l'l)

De plus, si (v;)jEJ. engendre E,. alors


rg(fl = rg (r(v;J,e1l. (18.12)
PREUVE.
► L'égalité (18.12) est une conséquence directe de la proposition 18.38.
► Montrons (18.11). La famille (f(vj))jEJ est dans f(E) donc son rang est majoré par rg (f).
Pour l'autre majoration, posons E' = vect{vj I j E J} et F' = vect{f(vj) 1 j E J}. Alors on a
l'application linéaire surjective E'---, F', v H f(v) et on déduit que dimF' < dimE', ou encore
rg (f(vi)iEr) < rg ((vi)iEr).
► Pour démontrer (18.10) on remarque d'abord que lm (go f) C lm (g), d'où rg (go f) <
rg (g). Pour prouver l'autre majoration on considère une famille génératrice (vi)iEJ de E (par
exemple (v)vEE)- Alors (f(vj)jEr) est génératrice de f(E) et (g(f(vj)))iEJ est génératrice de
(go f)(E) et on déduit de (18.11) que rg (go f) = rg ((g(f(vj)))iEJ) < rg (f(vi)iEJ) = rg (f).
► Maintenant prouvons (18.9). On a rg (f) < dimF car l'image f(E) est un sous-espace
vectoriel de F. Pour prouver l'autre majoration, on considère l'application linéaire

f: E ---, f(E), v H f(v).

De la surjectivité de f, on déduit l'inégalité dimE )', dimf(E). ■

PrQpoaitiOll 18.45. Le ro,ng d'une matrice A E J(m.tl,.f)Kfèst égal à:u rung dèfappliêati(ln
linéaire A.: Kn ---, K.11\ x H Ax. · ·

PREUVE. Pour être plus clair dans la preuve nous réutilisons (provisoirement) la notation Â
pour l'application induite par la matrice A. Si on écrit la matrice A E .4tmn0K) en colonnes,
A= (C,, ... , Cn), alors

Â: ocn---, ocm, (x,, ... ,Xm) H x,C,+··•+xnCn,


Le rang de cette application linéaire est la dimension de son image. Or manifestement son
image est l'espace engendré par les colonnes de A, et la dimension de cet espace est bien le
rang de la matrice A. ■

Théorème 18.46. (Théorème du rang dans 2(JKn ,.:WO)} &nt A E .Amn.(KJ. ·Alors
n:;::: ditnKer A+ rg (A). ·

PREUVE. Nous allons déduire cette proposition de la théorie des systèmes linéaires (voir
chapitre 16). Comme le système Ax = 0 a toujours au moins une solution, la solution nulle
x = 0, la proposition 16.40, page 430, montre que l'espace des solutions est de dimension
n - rg (A). Mais cet espace des solution est aussi le noyau de l'application A : ocn ---, ocm.
L'identité annoncée en découle immédiatement. ■
502

Corollaire.l3~4T~.,Soit A € Amn:OKJ. Alors• z,appliœtiorf lîrtiaire A: Kli·~ Km vtrijè lês


pro,Jriétis B1AÎ11tlrt.tes. .. . . . .
1) A est injective $i et seulement sirg(A}·:: n.
2) ..\ lfSt à'JJ.rjectîve ~ et seule111ent sfdimKer A """ n - m:
3) A est bijective si et seulement Î$i rg{A) =.n=m.
PREUVE.
1} A est injective si et seulement si non noyau est nul, soit encore sin= rg (A)+ O.
2) A est surjective si et seulement si rg (A) = m, soit encore si n - dim Ker A = m.
3} ► Si l'aplication A est bijective, alors A est injective et surjective, soit encore rg (A) = n
et dimKer A= 0 = n- m d'après 1) et 2).
► Inversement, si rg (A) = n = m, alors la condition rg (A) = m montre que A est surjective
et la condition rg (A) = n montre que A est injective d'après la propriété 1). ■

Test 18.37. Test 18.38.


Soit f E 2'(E, F). Que pensez-vous de la propo- Existe-t-il des applications linéaires
sition suivante? a. injective de OC2 dans OC3 ,
b. surjective de lR dans lf(JR),
rg (f) = dimF # f est surjectif. c. surjective de 'if 00 (JR) dans lR,
d. bijective de 'if 00 (JR:"i-) sur 'if 00 (JR),
e. injective de C[X] dans Cn[X]?

III. REPRÉSENTATION D'UNE APPLICATION LINÉAIRE PAR UNE


MATRICE

Dans ce qui suit, E et F désignent deux K-espaces vectoriels de dimensions finies n et m


respectivement et ~ = (b 1 , ••. , bnl et ~' = (b;, ... , b~) sont des bases de E et F respecti-
vement. Nous avons vu à la proposition 18.41 que la donnée d'une application linéaire de E
dans F équivaut à la donnée des images des n vecteurs de ~- Or chacune de ces images est
donnée par le m-uplet de ses coordonnées dans la base~'- Ainsi la donnée d'une application
linéaire de E dans F équivaut à la donnée de mn scalaires. Autrement dit, le choix de deux
bases~ et ~' de E et F détermine un isomorphisme 2'(E, F) ~ Atmn(K).
Comme le choix des bases ~ et ~' n'est pas canonique en général, nous allons en outre
indiquer comment cette correspondance est modifiée en cas de changements de bases.
Les changements de bases sont des opérations qui ne sont pas aussi faciles que ce que l'on
voudrait bien croire (pensez au problème du changement d'heure été-hiver). Il est primordial
de bien connaître un mode opératoire et de s'y tenir. Le minimun à retenir de cette partie
(si on l'a bien comprise) pour pouvoir tout reconstruire, est sans doute l'un des deux points
de la règle 18.49, l'autre point étant équivalent, l'interprétation de la matrice de passage
qu'il en résulte (règle 18.50) et le caractère « fonctoriel 4 » des propriétés énoncés dans le
théorème 18.51.

4
C'est-à-dire obéissant à une sorte de relation de Chasles.
503

III.1. L'isomorp hisme 2'(E, F) ::::: Atmn(IK)


rn
Il)

Les systèmes de coordonnées <l>~ est un isomorphisme entre E et ocn. De même <l>~, est un ~
Ill
isomorphisme entre F et ocm. Cela permet de « transporter » une application linéaire f : E --, F
cxi
vers l'application linéaire entre ocn et ocm, ,-(

6
Or, nous avons identifié les applications linéaires entre espaces canoniques avec les matrices.
La correspondan ce f H <l>~, of o <I>_;;/ permet donc d'identifier 2'(E, F) et -4'mn(OC).

Définition 18.48. La matrice de f E 2'(E, F) dans les bases /jg et Çg' est l'unique matrice 1
A E -4'mn(OC) qui définit la même application linéaire dans 2'(0Cn, ocm) que <l> ~, of o <1>.i •
On la note A= M~,~(f).

Autrement dit, la matrice de f est l'unique matrice qui rend commutatif le diagramme suivant.

E f F (18.13)

~@ t t ~@'

ocn .............~.........,.. j[(ffi

Cette présentation est très satisfaisante pour l'esprit mais n'est peut-être pas des plus parlantes
au premier abord. Voici ce qu'elle signifie en pratique.

Rêgle 18.49.
l} La k-ième·eol<1nne âe la matri.œ M~•s,(f} est le mAtplet des COl11dmmées dé f(bi.J dans
là base Çg';
2) Bi x1 1 •••• , ~ _sont{es ctJOrdonnéesdev E E dans la base di et si.y1, .•• t.1Jm s.ontcelles
1
de f{v). darts la: btise $ , alojs . _ _

•. .~,f111}< ._ •· ("l'
: ;.~M$ x~r· 1
i(f}

PREUVE.
1) L'application <l>~, étant inversible, nous pouvons emprunter dans le diagramme commu-
tatif (18.13) deux chemins différents de ocn à ocm.
Suivons le vecteur ek de la base naturelle de ocn, faisons-le d'abord par le chemin du haut.

Ce chemin mène donc à <l>~,(f(bk)) qui n'est autre que le m-uplet de coordonnées de f(bk)
dans la base Çg'.
Maintenant, suivons le chemin direct
504

La multiplication de la matrice M!liJ'!liJ(f) par ek donne la k-ième colonne de M!liJ'!liJ(f).


2) C'est une conséquence immédiate de la définition 18.48. ■

Cette règle fait étrangement penser aux propriétés de matrices de passage de la règle 18.34.
Cela n'est bien sûr pas un hasard.

Règle 18.50.
- Soient E un espace vectoriel de dimension finie et fjlJ et fJIJ' deux bases de E. On note id1:.
E """7 E l'application identité. Alors · ·

(18.14}

PREUVE. En effet, la k-ième colonne de M!liJ!liJ'(idE) donne par définition les coordonnées du
k-ième vecteur bt = idE(bU de !!,6 1 , exprimé dans la base !!,è, et on retrouve exactement la
définition de la matrice de passage de !!,è à !!,è'. ■

Attt:.•11t iun à l'ordre des bases dans les règles 18.49 et 18.50

La matrice MM~,(idE) est la matrice de passage de !!,è à !!,è'. Elle exprime les coordonnées
des vecteurs de la nouvelle base !!,è' dans l'ancienne base !!,è.

Nous arrivons au résultat principal de cette partie. Il exprime comment la matrice d'une
application linéaire est modifiée en cas de changement de bases. Ce résultat se retient très
facilement si on veut bien se rappeler que les formules de composition et de passages sont des
relations de Chasles.

Théorème 18.51.
1) L'application Ma,a 2(E, F) """7 Al=(JK), f i-t Ma•M(f) est un iso;,,iorphisme
qui conseroe le rang.
2) Pour tout g E 2(F, G} où G est un espace vectoriel de:base lll"; on a

MM"tlf(g of) = Ma,,a,{9} M~ aff}.


1

3) Si d et d' sont deux autres bases de E et F respectivement, alors

4) Dans le cas particulier E =


F et fJIJ = fJIJ', on note M.':i'a(f) = Ma(f) la matrice de
l'endomorphisme f dans la base tJIJ, Alors

est un isomorphisme d'algèbres. Si g/J' est une autre base de E, alors

L'application M[JJ induit un isomorphisme de groupes entre les groupes linéaires Gl(E) et
Gl(n,K). En particulier pour tout f E GL(E} on a M[JJ(f-1 ) = Ma(f)- 1 •
505

PREUVE.
rJJ
1
1) Par définition on a Mal''al'(f) = <Dai'' of o <I>i . La linéarité découle donc de celle de <Dai'',
<1)
gi
par exemple pour l'addition

-
00

d
1
De plus, l'applicatio n f H Mal''al'( f) = <I> al'' of o <I>i est bijective et d'inverse l'applicatio n
définie par A H <I>i , o A o <I>.'Jl'. Comme le rang de la matrice Mal''al'(f) est aussi le rang
1

de l'applicatio n linéaire <Dai'' o f o <I>i (proposition 18.45) et que la composition par des
1

isomorphismes ne change pas le rang d'une application linéaire, on a rg (Mal''al'(f)) = rg (f).


2) Soit p la dimension de G. La situation est donnée par le diagramme suivant.

Les circuits intérieurs sont commutati fs, donc le grand circuit triangulair e extérieur l'est aussi.
Cela démontre la formule exposée. Si le lecteur est plus à l'aise avec les calculs, il préférera la
preuve suivante. Notons Mal''al'(f) = (cxkj) et Mal'"al''(g) = (f3ekl- Alors pour tout vecteur bi
de la base canonique de Kn, on a

Cela signifie que l'élément d'indice (C, j) de la matrice Mal'"al'(g of) est Lk f3ekCXkj. C'est
donc exactemen t le produit matriciel Mal'"al'(g of) = Mal'"al''(g) Mal''al'(f).
3) Rappelons que Cal'.<11 = Mal'.<11(idE) et utilisons la formule de composition prouvée au
point 2).

Md'd(f) = Md'd(idE Of OidE)


= Md'as,(idE ) Mal''al'(f) Masd(idE)
= cd'al'' Mal''al'(f) Cas.of'.

4) Le fait que Mas soit un morphisme d'algèbre découle des points 1) et 2) avec Çg' = f!g et
du fait que la matrice de l'applicatio n identité dans une base donnée est toujours la matrice
identité. La formule de passage est une conséquence de 3) et le reste de l'assertion est vrai pour
tout isomorphisme d'algèbres, les groupes linéaires étant les groupes des éléments inversibles
des algèbres considérées.

506

Remarque. Si dans le théorème, on prend E = ocn et F = ocm et si !JiJ, !JiJ' sont les
bases naturelles de ces espaces, alors l'isomorphisme est précisément l'identification entre
.Y(lKn, lKm) et Atmn(lK) que nous avons déjà rencontrée.

Chaque énoncé sur les applications linéaires a donc une traduction en terme de matrices.
Ainsi le théorème 18.46 du rang se traduit sur les applications linéaires f : E 4 F en prenant
pour A la matrice de f dans des bases choisies. Pour que cette écriture matricielle soit possible,
-:::: nous exigeons que E soit de dimension finie. La dimension de l'espace d'arrivée F n'a pas
d'importance : si F est de dimension infinie on le remplacera par f(E), qui est de dimension
finie. Nous obtenons donc le

Théorème 18,52, (Théorème d~ rang d,811$ 2{E, f)) . . .


Soit f: E 4 f linéaire. Si E est de dimension finie, alors dîmE =dimKer (f) + rg {f}.

Le raisonnement ci-dessus qui utilise le « dictionnaire » entre matrices et applications linéaires


est parfaitement correct. Toutefois, parce que ce théorème est important, nous donnons ici
une autre démonstration s'appuyant sur l'existence de bases.
PREUVE.
► Soit (b1,• .. , bn) une base de E. La famille (f(bi), ... , f(bnll est donc génératrice de f(E).
On en déduit que f(E) est de dimension finie. Soit (v1, · · · , Vr) une base de f(E), avec r =
dim f(E) = rg (f) par définition. Par construction, il existe pour k = 1, ... , r des vecteurs
b( E E tels que f(b(l = vk.
► Comme Ker f est un sous-espace de dimension finie, il est également de dimension finie.
Soit (b;', · · · , b;) une base de Ker f, avec p = dimKer f.
► Nous allons montrer que la famille (b;, · · · , b;, b;', ... , b;) est une base de E.
- Soit x E E. Alors f(x) E f(E). Il existe donc des coefficients i\1, ... ,i\r dans 1K tels que
f(x) = À1V1 + · · · + ÀrVr- On a donc

f(x) = i\1f(b;) + · · · + i\rf(b;J = f(i\1 b; + · · · + i\rb;).


Ainsi f(x - i\1 b; + · · · + Àrb;) = O. Il en résulte que x - i\1 b; + · · · + Àrb; E Ker f. Il
existe donc des scalaires µ1, ... , µµ tels que x - i\1 b; + · · · + Àrb; = µ 1b;' + • · • + µµb;,
soit encore
x = i\1b; + · ·· +i\rb;+ µ1b; 1 + · · · + µµb;.
- Supposons que i\1, ... , Àr et µ 1, ... , µµ dans 1K sont tels que

i\1 b; + · · · + i\rb; + µ, b;' + · · · + µµb; = O.


Alors O = f(O) = f(i\1 b; + · · · + Àrb; + µ, b;' + · · · + µµb;) = i\1V1 + · · · + ÀrVr, car
f(b;') = 0 pour j = 1, ... , p, et f(b() = vk pour k = 1, ... , r. Comme (v 1, ... , Vr) est une
famille libre, en tant que base de f(E), il en résulte que

i\k = 0 pour k = 1, ... , r.

Dans ce cas l'hypothèse s'écit encore µ 1b;' + • · · + µµb; = O. Comme (b;', ... , b;J est
une famille libre, en tant que base de Ker f, il en résulte que

~ = 0 pour j = 0, ... , p.
Le premier point montre que la famille (b;, · · · , b;, b;', ... , b;) est génératrice de E, le second
point montre qu'elle est libre. Il s'agit donc bien d'une base. Il ne reste qu'à compter les
vecteurs : on an= r + p, avec r = rg (f) et p = dim Kerf, par unicité de la dimension. ■
507

Corollaire 18.53. Soitf; E ~ f linéaire.


1) · Si E··de dimension finie alors f est injective si et seulement si rg (f) dimE . = rJJ

2) Si F de dimension finie alors f est surjective si et seulement si rg(f) = dimF. J


ai
3) Si E et F sont de tn€me dimension finie alors la lJijectîvité àe f éqltivat1.t â son injeetivité ....
ou encore à sa surjectivité. .d
ü

PREUVE.

1) f est injective si et seulement si Ker f = 0, c'est-à-dire si dim E - rg( f) = O.


2) f est surjective si et seulement si rg (f) = dimF par définition du rang.
3) Supposons que E et F sont de même dimension finie. Nous allons montrer les implications

(f injective ) =} ( f surjective ) =} ( f bijective ) ,

la dernière implication (f bijective ) =} ( f injective ) étant toujours vraie.


► Si f est injective, alors rg (f) = dimE d'après 1). Comme dim E = dim F, il en résulte que
rg (f) = dim F, puis que f est surjective d'après 2).
► Supposons f surjective, alors rg (f) = dimF d'après 2), donc rg (f) = dimE, puisque dim E =
dim F. Ainsi f est injective d'après 1). L'application est donc injective et surjective, c'est-à-dire
¼~w. ■

Test 18.39. l'exemple 18.35.


Soit ex E lR fixé. On considère Test 18.40.
f . JR2 --t JR2 ( yx) H ( -1))
• 1 -x ) Sur Kn[X] on considère la base naturelle ~ =
. m,2 m,2 ( x) (xcos<X-1)sin«) ( 1, X, ... , xn). Donner la matrice de l'endomor-
9 · 11'. --t 11'. ' 1J H xsin «+1icos « ·
phisme dérivation c&
dans cette base. Quelle est
Expliciter M35(f), M35,(f), M35(g) et M~,(g) le rang de la dérivation? Quel est son noyau?
dans le cas où les deux bases sont celles de Comparer avec le théorème du rang.

III.2. Matrices équivalentes, matrices conjuguées


Dans cette partie, nous introduisons l'idée que les matrices peuvent être classées sous l'action
du groupe linéaire. Nous donnons les relations d'équivalences classiques et montrons comment
elles s'interprêtent en terme d'applications linéaires.
Définition 18.54.
1) Deux matrices A,A' E .4tmn0K) sont équivalentes s'il existe C dans Gl(n,IK) et C' dans
Gl( m, IK) telles que
A'= CAC'.
2) Deux matrices carrées A, A' E .4tn(IK) sont conjuguées ou semblables s'il existe C dans
Gl( n, IK) telle que
A'= c- 1 Ac.
Il est évident que ces deux notions définissent des relations d'équivalences. Elles sont bien
distinctes. La première est définie pour toutes les matrices de format m x n tandis que la
seconde est seulement définie pour les matrices carrées n x n. Mais même lorsque n = m, deux
508

matrices carrées équivalentes ne sont pas forcément conjuguées. Par exemple, toute matrice
carrée inversible A est équivalente à la matrice identité (prendre l'inverse de A pour C et
l'identité pour C'), mais la seule matrice conjuguée à l'identité est l'identité elle-même.

Par la formule de passage, ces deux notions peuvent s'interpréter en terme de représenta-
tion d'applications linéaires.
- Deux matrices sont équivalentes si et seulement si elles représentent une même application
linéaire avec des bases éventuellement différentes à la source et au but.
- Deux matrices sont conjuguées si et seulement si elles représentent un même endomor-
phisme dans deux bases, chacune prise simultanément comme base de départ et comme
base d'arrivée.
L'un des chapitres importants en deuxième année sera le problème de la réduction d'un
endomorphisme. On entend par là la recherche, pour f E 2(E) donné, d'une base /!.i telle que
la matrice M$(f) soit d'une forme la plus simple possible, par exemple triangulaire et même
diagonale 5 si possible. Évidemment cette base dépendra de l'endomorphisme f.
Dans l'algèbre .4i"nCIK) des matrices, ce problème revient à examiner si, dans une classe
de conjuguaison donnée, il existe une matrice triangulaire (ou encore mieux, diagonale). En
effet, pour une base /!.i quelconque fixée, posons A = M$(f). S'il existe une base f!.i' telle
que A'= M$,(f) est triangulaire alors A et A' sont conjuguées car A'= (C$$' i-1 AC$$'.
Réciproquement s'il existe A' triangulaire et conjuguée à A = M$( f), alors A' = c- 1AC pour
un certain CE Gl(n, IK). Or toute matrice inversible est la matrice d'un changement de base,
donc pour la base !!.i' telle que C = C$$' on a la représentation triangulaire A'= M$,(f).
En deuxième année, nous verrons des critères d'existence de cette réduction en matrice
triangulaire (ou encore mieux, diagonale). Dans la dernière partie de ce chapitre, nous en
donnons un exemple concret élémentaire.
Remarque. La notion de conjugaison existe dans tout anneau.

Polynôme annulateur. Soient f E 2(E) et P = L~=l akXk un polynôme de IK[X]. Si


on remplace l'indéterminée X par f on obtient l'endomorphisme P(f) = L~=l akfk, avec
la convention f 0 = idE. Un polynôme annulateur de f est un polynôme P non nul tel que
P(f) = O. Autrement dit, un polynôme annulateur de f est un élément non nul dans le noyau
de l'évaluation evf, qui est le morphisme d'algèbres défini par

evf : IK[X] --, 2(E), P H P(f).

Supposons maintenant que n = dim E est fini. Alors comme il est isomorphisme à l'espace
des matrices carrées, la dimension de 2(E) est n 2 . Comme la dimension de OC[X] est infinie,
le noyau de evf est non nul. Ainsi tout endomorphisme d'un espace vectoriel de dimension
finie possède un polynôme annulateur.

De manière analogue, on définit la notion de polynôme annulateur d'une matrice carrée A.


Si A, A' sont deux matrices conjuguées, c'est-à-dire si A'= c- 1AC, alors pour tout polynôme
Pon a

donc les matrices P(A) et P(A') sont conjuguées. En particulier un polynôme annulateur
d'une matrice annule aussi toute sa classe de conjugaison.

5
On dit alors que l'on a «diagonalisé» l'endomorphisme f.
509
Tes t 18.4 1.
Ma,,(f) le sont dans Mn(IK).
Que pensez-vous des assertions
suivantes?
a. Deux matrices carrées con Tes t 18.4 2.
juguées sont for- ~
cément équivalentes. gj
Si dim E =n et f E .Z(E ), donner o:l
b. Deux matrices sont équival une majora-
tion du plus petit degré des poly

e-
entes si et seule- nômes annula- cri
ment si elles ont le même rang. teurs de f.
c. Si b est un élément inversib
le de l'algèbre A, Tes t 18.4 3.
alors a H b~l ab est un automor
phisme d'al-
gèbres. Soit fun endomorphisme et soit
P un polynôme
d. Soi t~ une base de E. Alors annulateur de f. Montrer que si
f, g dans .Z(E ) P(O) =f O alors f
sont conjugués si et seulement est un automorphisme. ( Indicati
si Ma,,(f) et on : fact oris er
P(f) par f.)

III .3. Ex em ple : réd uct ion


d'u ne ma tri ce
Soit p E K Considérons la mat
rice

Nous allons chercher une mat


A= G~)-
rice diagonale B qui lui soit
sommes pas sûr que B existe. conjuguée. À ce stad e, nou s
Pou r chercher un obj et inco nnu ne
à sup pos er qu'i l existe, à étud , une bon ne dém arch e consist
ier les pro prié tés qu'i l doi t pos e
l'ob jet à par tir de ces pro prié séder puis à essayer de con stru
tés. ire
► Supposons don c qu'i l exis
te une mat rice diagonale B = 13
telle que AC = CB pou r une ( d t,) conjugée à A, c'est-à-dire
cert aine mat rice C E GL(2,ID
2
can oni que de IR . Alors pou r !.). Not ons (e 1 ,e2) la base
k E {1, 2}, on a ACek = C(B
encore Avk = f3kvk avec vk = ek) = C(f3kek) = f3kCek, soit
Cek. De tels vec teur s v et Vz
pro pres de A. Ils son t cara ctér 1 sont appelés des vecteurs
isés par la con diti on

(18.15)
Par définition, les vecteurs v
1 et Vz son t les deu x colonne
par ticu lier , ils son t non nuls. Cel s de la mat rice inversible C. En
a implique que Ker (A - f3kli )
Or le noy au Ker (A - f3kll2) est 2 est non nul pou r k E {1, 2}.
non triv ial si et seulement si
inversible, c'es t-à- dire si et seu la mat rice A - f3[z est non
lem ent si le déte rmi nan t

s'an nule , soit encore si


( 1 - /3 )2 - p 2 = 0 .
On trou ve donc deu x valeurs,
/31 = 1 -p et /32 = 1 +p . En résumé,
diagonale B conjuguée à A, alor s'il exis te une mat rice
s elle est forcément de la form
e
B=(l-p O) 0 1 +p ou
(
1 +p O )
0 1- p .
► Ma inte nan t déte rmi non s la mat
rice C. Ses deu x colonnes son
vérifient (18.15) qui mai nten ant t les vec teur s v 1 et v . Ils
s'éc rit 2

et
(-p p)
p- p
V2 = 0.
510

On peut prendre par exemple V1 = ( __! 1 ) et V2 = ( J ). Inversement, si on pose

Le lecteur vérifiera facilement que AC = CB, ce qui montre bien que A= CBC-1 •
Application.
CU Considérons le problème suivant. On dispose deux verres remplis d'une même quantité de

~
liquide, l'un de vin, l'autre d'eau. On verse une partie du vin dans le verre d'eau. Puis on
reverse la même quantité du mélange obtenu dans le verre de vin, de sorte que les niveaux
de liquide dans les deux verres restent égaux. On itère le procédé en transvasant toujours la
même proportion de liquide.
1) À chaque étape, la proportion de vin dans verre d'eau est-elle plus grande, égale ou plus
petite que la proportion d'eau dans le verre de vin?
2) Quelle est la limite du mélange dans chaque verre lorsque le nombre d'étapes tend vers
l'infini?

Réponses.
1) Les deux proportions sont égales ! On peut raisonner sans calcul : après chaque opération,
la partie de vin dans le verre d'eau prend un certain volume V. Au début du processus, ce
volume V était occupé par de l'eau. Or, nous n'avons pas perdu de liquide. Ainsi ce volume
V est précisément celui de l'eau qui se trouve maintenant dans le verre de vin.
2) On a l'intuition que l'on mélange de mieux en mieux les liquides, c'est-à-dire que les
proportions vont s'approcher de 50%. Nous allons le démontrer en utilisant le calcul matriciel.
Pour n EN, soit

Xn = la proportion d'eau dans le verre de vin après la n-ième opération,


{ 1:Jn = la proportion d'eau dans le verre d'eau après la n-ième opération.

Rappelons que Xn est aussi la proportion de vin dans le verre d'eau. Nous avons donc toujours
Xn + 1:Jn = 1. Évidemment, au départ, Xo = 0 et 1:Jo = 1.
Notons p E]O, 1] la proportion de liquide transvasé. En versant une portion du verre d'eau
dans le verre de vin, nous obtenons
1
1:/n+l = l + p (1:/n + PXn),
Et comme Xn+l + 1:Jn+l = 1, on obtient
1 (1-xn) +p(l -xn) 1
Xn+l = 1 -1:Jn+l = 1 - l +p (1:Jn +PXn) = l +p = l +p (1:/n +PXn).

Ainsi nous avons démontré la formule de récurrence

Xn+l)
( 1:/n+l = 1+ p
1 (1P p)1 (Xn)
1:/n

On reconnaît la matrice A = (; f). Par itération on trouve

Xn+l)-
( 1:ln+l - (1 +p)n
An 1 (0) 1
511

Pour calculer les puissances An, le plus simple est d'utiliser la matrice diagonale B conjuguée
àA.

Par conséquent,

converge bien vers ½( l ) car la suite géométrique de raison ~ converge vers zéro. Ainsi les
proportions d'eau et de vin tendent à s'équilibrer dans chaque verre.

IV. EXERCICES

18.1. 2. On suppose dans cette question que f 3 = 0


et f 2 =/= O. Calculer le rang de f. Donner un
Soit f un endomorphisme d'un OC-espace vec- exemple d'un tel f.
toriel E. Montrez l'équivalence des propriétés
suivantes. 18.4.
1) f est une homothétie, c'est-à-dire il existe
À E OC tel que f = ÀidE. Donnez un exemple simple d'un endomor-
2) Pour tout v E Ela famille (v, f(v)) est liée. phisme f de OC[X] qui est
1. injectif mais pas surjectif;
18.2. 2. surjectif mais pas injectif.

1. Soit fun endomorphisme d'un OC-espace vec-


18.5.
toriel E de dimension finie. En utilisant l'exer-
cice 18.1 montrez l'équivalence des propriétés
Soit E = 'é"(JR+) l'espace vectoriel des appli-
suivantes.
cations continues de lR+ dans R Considérons
a. f est une homothétie. l'application 1J,, de E dans E qui à f associe
b. La représentation matricielle de f ne dé- l'application g : lR+ H lR définie par
pend pas de la base choisie.
2. En déduire le centre du groupe Gl( n, OC) Vx ;;,, 0 , g(x) = ( tf(t)dt.
(voir exercice 9.7). Comparer avec le résultat
de l'exercice 16.6. 1. Quelle est la dimension de E ?
2. Pourquoi l'application 1J,, est-elle bien défi-
18.3.
nie? Montrer que 1J,, est un endomorphisme de
E.
Soient E un espace vectoriel sur OC de dimension
3 et f appartenant à 2'(E). 3. Etudier l'injectivité puis la surjectivité de 1J,,.
1. On suppose dans cette question que f 2 = 0 4. Soit À E R En utilisant vos connaissances
et f =/= O. Calculer le rang de f. Donner un sur les équations différentielles déterminez le
exemple d'un tel f. sous-espace vectoriel Ker (1J,, - 'Jo..idEl-
512

18.6. 18.10.

Soit Fun sous-espace vectoriel d'un espace vec- Pour tout t E R, on pose
toriel E.
1. E\F est-il un sous-espace vectoriel de E ?
2. Montrer que Prouvez que la famille (f tltEJR est libre dans JRlR.

'ix E F , r/11 E E\F , x + 11 E E\F.


18.11.
3. En déduire que lorsque F /= E, vect (E\F) =
E.
Trouvez des espaces isomorphes parmi les R-
espaces vectoriels suivants !
18.7.
't&'l(R)' (CN, R2n+3 , (C(N) cH,H
4 ' '
Soient F le sous-espace vectoriel de R défini
IC[X], Cn[X]xR, cz C[X], c(Z)
par l' équation x + z = t + 11, et G défini par ' '
11 + t = X -11 - Z = Ô. R[X] 2 , C[[X]], Rn[X] xRnxlC,
1. Déterminer la dimension ainsi qu'une base 't&'J (R)' 't&'J(R)xR, ICJR 't&'(R)'
de F. Soit a= (3, 1,2,4). Déterminer les coor- '
données de a dans cette base. où on a posé 't&'J (R) = {f E '6' 1 (R) 1 f(O) = O}.
2. Déterminer la dimension ainsi qu'une base 18.12.
de G. Soit b = (4, 1,3,-1). Déterminer les co-
ordonnées de b dans cette base.
Le Q-espace vectoriel R possède-t-il une base
3. Déterminer la dimension et une base de dénombrable?
F n G.
18.13.
18.8.
Soient I, J des ensembles.
Montrez de deux manières que les trois fonc- 1. Montrer qu'on peut identifier
tions

2. Sous cette identification est-ce qu'on a


forment une famille libre dans l'espace vectoriel
des applications de JO, +oo[ dans R :
1. une fois, en donnant des valeurs particulières
à la variable x ;
18.14.
2. une autre fois, en utilisant les croissances
comparées des trois fonctions en + oo. Dans cet exercice on considère l'espace vectoriel
R 2 avec sa représentation « habituelle » comme
18.9. plan euclidien. On note C le cercle d'unité défini
par x 2 + 11 2 = 1 et D la tangente à C au point
Soient E un l!C-espace vectoriel et (vkll ,;;k,;;n
une famille de vecteurs de E. Pour tout entier
P = (~' 1).Soient les matrices

naturel k :::;; n, on pose


A1 = (~ ~)

A3 = G~) , -S!Il . G7I)


cos -l; '
Prouver que la famille (vk)J ,;;k,;;n est libre si et
seulement si (Uk) 1 ,;; k,;; n est libre.
As= C~),
513

1. Donnez une équation cartésienne ainsi 3. Pour chaque j = 1, ... , 6, donnez des équa-
qu'une écriture paramétrique de O. Dessiner C tions des images q = Aj(C) et o; = Aj(D) du r/J

et O. cercle Cet sa tangente D par l'endomorphisme ~


2. Montrez que l'image de la droite D par Ai de JR 2 (pour C~ et C 6il faut en plus des in- c:l
équations). cxi
un endomorphisme f de R 2 est un point si ......
(J3, -1) E Ker f et est une droite sinon. Faites des dessins de q, o; et Pl= f(P).
6
Chapitre 19
SOMME S DE SOUS-E SPACES
VECTOR IELS

OUS avons déjà rencontré des exemples de sommes directes sans le savoir. En effet,

N nous savons que tout JK-espace vectoriel E admet une base. En terme de sous-espaces
vectoriels, cela signifie que E contient une famille de droites vectorielles, les droites
engendrées par chaque vecteur de la base, telle que tout vecteur de E se décompose de manière
unique en une somme presque nulle de vecteurs, chacun dans une de ces droites. Nous dirons
que E se décompose en la somme directe de cette famille de droites.
En somme, les droites engendrées par une base constituent des sortes d'« atomes» de
l'espace vectoriel : elles sont indécomposables et leur somme permet de reconstituer l'espace
vectoriel tout entier. Dans certains problèmes, notamment liés à l'étude des applications li-
néaires, on peut souhaiter pouvoir décomposer l'espace en sous-espaces plus gros. Par exemple,
pour un endomosphisme f E .2"(E) donné, il peut être instructif pour étudier f de décomposer
E en une somme directe de sous-espaces Ei tels que f(Ed C Ei, puis d'examiner les restric-
tions de f à chaque Ei, Mais en général, les espaces Ei obtenus ne sont pas de dimension 1.
C'est pourquoi nous allons étudier dans ce chapitre la notion générale de somme directe de
sous-espaces vectoriels.

1. SOMME DIRECTE DE SOUS-ESPA CES VECTORIELS


La notion de somme directe est fondamentale pour saisir les propriétés géométriques des
espaces vectoriel8\ Par exemple, dans JR , deux plans vectoriels (passant par l'origine), se
3

coupent en général le long d'une droite vectorielle (passant par l'origine). En revanche, deux
droites vectorielles se coupent transversalemen t, à moins d'être confondues, et de même, une
droite et un plan vectoriel se coupent également transversalemen t, à moins que la droite ne
soit contenue dans le plan. Dans les deux cas, la transversalité des deux sous-espaces vectoriels
considérés signifie que leur intersection se réduit à l'espace nul. Le cas du plan et de la droite
est plus intéressant, car tout élément de JR se décompose de manière unique comme somme
3

d'un vecteur de la droite et d'un vecteur du plan : on dit alors que le plan et la droite sont
3 tout ce qui suit, E est un JK-espace vectoriel.
supplémentaires dans JR • Dans

1.1. Somme de sous-espaces vectoriels


Soient v E E et F, G deux sous-espaces vectoriels de E. Nous avons déjà rencontré des notations
bien utiles
lKv = {Àv I À E JK} et F+ G ={v+ul (v,u) E F x G}.
Il est immédiat que si F et G sont des sous-espaces vectoriels de E, alors l'ensemble F + G
est stable par addition et par multiplication par les scalaires, et donc qu'il est également un
sous-espace vectoriel. On l'appelle la somme de F et de G.
516

Nous généralisons immédiatement cette définition à la somme d'une famille arbitraire


(Fi)iEJ de sous-espaces vectoriels de E. Pour cela, on note E(J) le sous-espace vectoriel de E1
formé des familles presque nulles de vecteurs, c'est-à-dire des familles (vdiEJ dans E telles que
le support {j E J I Vj -=/ O} est fini.

Proposition-définition 19.1.
Soit (fj)JEJ une famille de so'US-espaces 1Jectoriels de E. Alors

est un so'IJ»espace 'lleCtorielde E. On l'appelle la somme dela famille (fjJieJ.

PREUVE. Il est évident que le vecteur nul est dans cette somme. Montrons la stabilité par
combinaisons linéaires. Soient u, v dans LiEJ Fi et (À,µ) E OC2 . Il existe deux familles (vj)jEJ
et (ui)iEJ presque nulles dans E, avec (vj, Uj) E Ff pour tout j E J, telles que v = LjEJ Vj et
u = LiEJUj• Alors,


jEJ jEJ jEJ jEJ

EXEMPLE 19.2. On a OC[X] = L_ OCn[X].


1 nEN

Règle 19.3.
Soit (V;};eJ une famille de parties de E . Alors, vect (LJvi) = L.vect{Vj).
jEJ !EJ

PREUVE.
► Il est évident que la somme LiEJ vect (Vj) contient chaque Vi et donc leur union. Or,
vect ( ujEJ Vj) est le plus petit des sous-espaces vectoriels qui contient cette union, ce qui
prouve l'inclusion
vect ( LJ Vi) C L_ vect (Vj),
jEJ jEJ

► Pour la réciproque, on remarque que pour tout f E J, l'inclusion Ve C LJ j E JVi entraine


que vect (Ve) C vect ( LJ j E JVi). Donc, la somme des vect (Ve) est également contenue dans
vect (LJj E JVi)- ■

Remarque. Cette règle montre que nous aurions pu définir la somme de sous-espaces vec-
toriels comme le sous-espace vectoriel engendré par leur union, c'est-à-dire par la formule

L_ Fi= vect (LJFi).


jEJ jEJ
517

. \tîl'lltÎUll Distinguer intersection, union et somme


!l
(1)

Tandis que l'intersection et la somme de sous-espaces vectoriels sont toujours des sous- ~u
espaces vectoriels, leur union, en général, ne l'est pas. ~
rJl
(1)

EXEMPLE 19.4.
i
(1)

Dans JR. , on considère les deux axes lR. x {O} et {O} x R Ce sont des sous-espaces vectoriels
2
2
de JR. 2 . L'intersection des deux axes est l'espace nul. La somme des deux axes est JR. . L'union
~
(1)
2 "O
des deux axes n'est pas un sous-espace vectoriel du plan JR. . rJl

Précisons cette question de somme et d'union.


J
ai
Règle 19.5. Soient F, G deux sous-espaces vectoriels de E. Alors, ......
..d
1) FnGcFuGçF+ G; u
=
2) F + G f aietseulèmt}nt si F.:::> G;
3) f Û G est un $OÛS~esfni<:tf veêtoriel si ét seulément si F C: G ou f :)G.

PREUVE.

1) Cela découle immédiatement des définitions.


2) ({=) Si F::) G, alors F + G c F + F = F. Il est évident que F c F + G.
(===}) Si F + G = F, alors G c F + G = F.
3) ({=) Évident.
(===}) Soit FU G un sous-espace vectoriel de E. Supposons par l'absurde F </. G et F "j) G.
Alors il existe v E F\ G et u E G\ F. Comme FU G est stable par addition, on a v + u E FU G.
Il existe donc w E F ou w E G tel que v + u = w. Dans le premier cas, on a la contradiction
u = w - v E F, et dans le deuxième la contradiction v = w - u E G. ■

Test 19.1. Test 19.4.


Montrer que la somme de deux sous-algèbres Que pensez-vous des assertions suivantes?
n'est pas forcément une sous-algèbre. (Indica-
tion: chercher un contre-exemple dans l'algèbre
a. OC[[X]] = .L_ OC[X] . c. OC[X] = LJ OCn[X] .
nEN
des polynômes.)
Test 19.2.
b. OC[[X]] = LJ OCn[Xl .
nEN
Soient F, G deux s.e.v. de E. Que pensez-vous
Test 19.5.
des assertions suivantes ?
F n G c F + G, FU G c F + G, F c F + G, Soit (Fj)jEJ une famille de sous-espaces vec-
F + F = F, Fu G :::i F + G, F + G = G + F. toriels de E. Que pensez-vous des assertions
suivantes?
Test 19.3.
Soient F, G, H trois s.e.v. de E. Que pensez-vous a. .L_ Fi= LJFi.
jEJ jEJ
des relations suivantes?
Fn(G+H) C (FnG)+(FnH), b. nFj C Fk C .L_ Fj pour tout k E J.
jEJ jEJ
F n (G + H)::) (F n G) + (F n H).
c• .L. Fj C IlFj.
jEJ jEJ
518

1.2. Supplémentaires
1.2.1. Somme directe

Nous venons de définir la somme de sous-espaces vectoriels. Nous nous demandons, à présent,
dans quel cas tout vecteur dans cette somme admet une unique décomposition. Dans le cas
où chaque sous-espace est une droite engendrée par un vecteur, cela revient à se demander si
la famille de ces vecteurs est libre.

Définition 19.6. Soit (Fj)jEJ une famille de sous-espaces vectoriels de E. La somme H =


LiEJ Fi est dite en somme directe si tout vecteur de la somme se décompose de manière
unique comme somme de vecteurs de chaque sous-espace.

Notation. Dans le cas où H = L. Fi est en somme directe, on écrit H = E9 Fi .


~, ~,
Proposition 19.7. .· .··. . . . .. ·.. . . .•·. . ..·. . ... .... ·.
La somme d 'wn,e Jtmiille de· sotuFe$p11,~ veetori~ #J~t ~~ $! et;seuleµ1ent $!,.pour toute
famille (vi);e1 E Em, aveévi E F1 pour tout j E J, tm a l'implication ·

Vj E J. . Vt =.o.

PREUVE. Soit (FiliEJ une famille de sous-espaces vectoriels de E. On pose H = LiEJ Fi.
( {==) Soit u E H. Par définition u = LiEJ Vj avec des vecteurs Vj E Fi formant une famille
vf
presque nulle. Soit v = LjEJ une autre décomposition de la sorte. Alors,
LiEJ(vi - v;J = O.
La condition implique que vi - vf = 0 pour tout j E J, et la décomposition est bien unique.
(===}) Le vecteur nul se décompose en une somme de termes nuls et la décomposition est
unique, donc chaque vi est nul. ■

Nous en déduisons les deux conséquences suivantes.

Corollaire 19.8. Soit (v;hef une famille de vectew-s non .nul$ dans E. Alors les cooditiô'fl;$
suivantes sont équivalentes :
1) la famille (vj);eJ estlïbre;
2) vect{v,ljEJ}=(BK vi.
iEJ

Corollaire 19.9. SoifFi, ... ,În. ri.es SO'IJ,$~espaces vectoriels de E. Alors les cond#ifJne sui-
vantes sont équivalentes : ·· · · · · · ·
1) E = F1 E9 · • · E9 Fn ;
2) f: F1 x ... x Fti-t E,{Vt.-•'i"n.) i--t v1 + ... +v'll-, est 'liilJ, isomorpliisme d'espaœs
vectoriels. · ·
519

EXEMPLE 19.10.
◊ La somme .L. 1Kn[X] n'est pas directe.
$J
Cl)
,:::
nEN .8u
◊ La somme E9 JKX 2k est directe. Elle donne l'espace des polynômes pairs. ~
r/J
Cl)
kEN
n ~
~
◊ La somme E9(1KX 2k + JKX 2k+l) est directe. Elle donne l'espace lK2n+l [X]. Cl)
11)
k=O ::l
0
On a même n
r/J

lK2n+l [X] = E9(1KX 2k ffi JKX 2k+l). ~


r/J
Cl)
k=O

Ainsi, il arrive que les termes d'une somme directe puissent aussi se décomposer en sommes
directes.
J
cri
......
Jtêgle 9 t . . "'<; ; 6
Ji};~1fI!:.;~,~.u.;;'"T4,J~w,~l.î{~),;1~;\fî~,';f:~l;
2) ·P~r to~ sok~es~cefv~torielsF[G- de E, on_ a F$ G.
termes.a un sens, l'au~!,tan.t all;rs.~~tpmatiqu~eiit Wài;- •· · • •· _.· ............ _·
3) -PQV,r:toussmtS-es~ces.vecj~f.~,Hde E, ~ri-af@(;$'t{;;(F@ ç;)$M.~F$(G@ij)
-dès- ~i•z 100 âei.i trois te~.a v.n stns,. les-de11i1;. av.Cret ~iJ/n,t iJl<ir"s 4i.t,tpmg,t~e,tt ~. .

PREUVE. Cela découle immédiatement de la proposition 19.7, de l'associativité et de la


commutativité de l'addition dans E. ■

Ainsi, l'ordre et le parenthèsage dans une somme directe n'ont pas d'importance. Par
exemple,

(F1 ffi G1) ffi (F2 ffi G2) = F1 ffi G, ffi F2 ffi G2 = (F1 ffi F2) ffi (G1 ffi G2).
Cela est encore vrai pour une famille de sous-espaces indexée par un ensemble infini, mais la
notion de parenthèsage serait alors plus difficile à formaliser.

Dimension d'une somme directe.

St its.sbus-espqdifjc<le.E,. po'ÛrJ~°f: sdnt ~ sirtn!tii:1 dârêcte, Ûl,of~1


dïm($f1;1:dimA. · •
jèJ / jEl • .,

Err, 1,11$ftîculier-dim tf @:G.) i1 ditti f•+ ditt1 Ci.


On note l'analogie avec la formule des cardinaux

card LJ Ai = .L. card Ai si les Ai sont disjoints deux à deux.


jEJ jEJ

1
On convient qu'une somme d'éléments de NU {oo} vaut oo si elle contient une infinité de termes non nuls ou
si au moins l'un des termes est infini.
520

L'idée de la preuve de la proposit ion consiste justeme nt à se ramener


à cette formule en
choisissant une base.

PREUVE . Remarqu ons que, dans le cas particuli er d'un


nombre fini de facteurs, la proposit ion
est une conséquence immédia te de la proposit ion 18.27 et du corollaire 19.9.
Posons H = EBiEJ Fi. Dans chaque Fi on choisit une base Vi C Fi (vue comme
partie de Fi)-
On a dim Fi = card Vi. Par conséquent, il suffit de montrer que V= ujEJ
vi est une base de
H et que cette union est disjointe.
► Supposo ns par l'absurd e qu'il existe v E Vin Ve avec j
=/- i. Alors v E Fin Fe. Comme Fi et
Fe sont en somme directe, on a Fin Fe = 0, c'est-à-d ire v = 0, ce qui contredi
t le fait que la
partie Vi est libre.
► De plus,la règle 19.3 montre que

vect (V) = vect (u


iEJ
vi) = L. vect (Vi) =
iEJ
L Fj = H.
iEJ
Donc V est une partie génératr ice de H.
► Il reste à montrer que V est libre. Supposo ns que LvEvÀv V =
0 avec (Àv)vEV E IK(Vl.
Comme V est union disjointe des Vi , on peut regroupe r cette somme par
« paquets », sous la
forme

Comme les sous-espaces Fi sont en une somme directe, on a ui = 0 pour tout E J, et


finalement tous les coefficients Àv sont nuls car Vi est libre.

Project eurs et inclusio ns.

Soit E = EBiEJ Fi. Alors pour chaque j E J, nous pouvons associer à cette décomposition deux
applicat ions linéaires.
L'inclu sion naturel le Lj : Fi ----) E , v ----) v.
Le project eur sur Fi Pi : E ----) Fi , v ----) vi .
Cette dernière applicat ion est définie par la l'unicité de la décompo sition
de chaque vecteur
v E E en une somme presque nulle de vecteurs Vj E F;. On pose en effet Pi(v)
= vi. Autreme nt
dit, la famille des projecte urs Pi est caractéri sée par la conditio n

\lv E E, V= L. Pi(v).
jEJ
Nous reverron s les projectio ns à la fin de ce chapitre .

Test 19.6. v 1-) (p, (v), ... , Pn(v)) est l'inverse de l'isomor-
a. Vérifier la linéarité de ij et de Pi· phisme f: F1 x · · · x Fn--+ E, (v,, ... ,vn) 1-)
v, + · ·· +vn.
b. Détermin er Pi o lk.
c. Détermin er lk o Pi . b. Soit E = F1 + · · · + Fn de dimension finie.
Alors cette somme est directe si et seulemen t si
Test 19.7. dimE = dimF1 + · · · + dimFn.
Que pensez-vous des assertions suivantes ?
c. Soit E = F1 EB F2 = F; EB F~. Si F1 = F;, alors
a. Soit E= F1 ffi · · · œ Fn. Alors l'applicat ion Pl= p;.
521

L2.2. Somme directe de deux sous-espaces. Supplémentaires


rJJ

Dans le cas particulier d'une somme de deux facteurs, nous avons le critère suivant.

i
i'.l
i
Ill
rl:,
§
rJJ
PREUVE. Ill
'O
1) =} 2). Si H = F EB G, alors H = F + G. Montrons que F n G = O. Soit v E FU G. Alors

r
rJJ
0 = v + (-v). Comme VE F et -v E G, la proposition 19.7 montre que v = O.
2) =} 1). Il faut prouver que tout vecteur u E H s'écrit de manière unique comme somme d'un 0
rJ)
vecteur de F et d'un vecteur de G. L'existence de cette décomposition vient de l'hypothèse
H = F + G. Pour montrer l'unicité, la proposition 19.7 affirme qu'il suffit de le faire pour le ai
.....
vecteur nul. Supposons donc que O = u + v avec u E F et v E G. On sait que v est dans G et ..d
ü
-u est dans F. Ainsi v = -u E F n G = O. Cela montre u = v = O. ■

... _..-'\ \
,. ... G ' \
(
\ \
\ \

.,,,,, ,,,-""'\······
\ ·. ------,,. ,,,.,,
______
, .,,,,,,, F ·..
' -----,-"" .,,,,,,.
\ \
\ \
\\ >
\
v,.
... ......
La somme F + G est directe La somme F + G n'est pas directe car
car F n G est l'espace nul. F n G est une droite donc n'est pas nul.

Deux, mais pas trois


La proposition 19.13 est valable seulement pour le cas de deux sous-espaces vectoriels.

EXEMPLE 19.14. Considérons par exemple les trois sous-espaces vectoriels de JR. 2 suivants:

F2 = 0 X lR' F3 = {(x, x) 1 XE JR}.

On a Fin Fk = 0 si j =/- k, mais la somme F1 + F2 + F3 n'est pas directe car le vecteur (1, 1) a
les deux décompositions distinctes : (1, 1) = (1, 0) + (0, 1) + (0, 0) = (0, 0) + (0, 0) + (1, 1).

Définition 19.15. Si E = F EB G, on dit que G est un supplémentaire de F (dans E).

Évidemment, si G est un supplémentaire de F, alors F est un supplémentaire de G. On dira


aussi que F et G sont supplémentaires. On ne peut pas dire G est le supplémentaire de F car
3
il n'est pas d'unique. Par exemple, dans le cas d'un plan F et d'une droite G de l'espace JR. ,
toute droite non contenue dans le plan Fest un supplémentaire de F.
522

EXEMPLE 19.16. Dans l'espace F(JR., JR.) = JR.IR des fonctions de lR. dans JR., l'espace de
fonctions paires est un supplémentaire de l'espace des fonctions impaires,

► Soit h: lR.---+ lR. une fonction arbitraire. Supposons que l'on a la décomposition souhaitée
h = h+ + h_. Alors h+(-x) = h+(x) et h_(-x) = -h_(x). Donc,

h(x) = h+(x) + h_(x),


{ h(-x) = h+(x) - h_(x).

Ce système se résoud aisément. On obtient

( ) h(x) + h(-x) = h(x) - h(-x)


h+ x = 2
et ( )
h _X 2 . (19.1)

L'unicité de la solution de ce système montre que la somme des deux espaces est directe.
► Inversement, pour h : lR. ---+ lR. une fonction arbitraire, on définit h+ et h_ par les formules
de (19.1) et on vérifie immédiatement que h = h+ + h_ d'une part, et que h+ est paire et
h_ est impaire d'autre part.
Ainsi toute fonction s'écrit de manière unique comme somme d'une fonction paire et
d'une fonction impaire.

Complémentaire =/- supplémentaire


Il ne faut pas confondre les mots complémentaire et supplémentaire. Le complémentaire
de F dans E, noté E \Fou E-F, n'est pas un sous-espace vectoriel : il ne contient pas le
vecteur nul.

PREUVE. L'idée est de compléter une base du sous-espace en une base de l'espace entier; les
vecteurs ajoutés engendreront le supplémentaire.
Soit Fun sous-espace vectoriel de E. D'après le théorème 18.22 il existe une base V de F (ici
nous considérons les bases comme des parties et non comme des familles). En particulier V
est une partie libre dans E. D'après le même théorème, on peut la compléter en une base de
E, c'est-à-dire, il existe une partie U C E telle que

Vnli=0 et V UU est une base de E .

Posons G = vect (U) et montrons E = F EB G. La règle 19.3 montre que

E = vect (VU U) = vect (V)+ vect (U) = F + G.

Soit maintenant w E F n G. Alors w est combinaison linéaire des vecteurs de V, et aussi des
vecteurs de U.
w = ÀvV = L ~u. L
vEV uEU
523

Donc
L. ÀvV - L. ~u = 0.
vEV uEU
Comme V et U sont disjoints et comme VU U est libre, tous les cofficients Àv et ~ sont nuls,
ce qui implique que w est nul. Cela prouve F n G = 0 et achève la démonstration. ■

~~~ .~il}ïf;.·
~t$etllew:eüt~'il -Pt?
~tte·~Û, sr J.LW,w,• 6W«:m•<-
·•·r:...::.r:.,c·.1!!:··•.~ 'èst:tt,'is~~~ ~ è l si
f/nfj:e. p'·,.·.f.~_,s:...~. . .~.-
PREUVE. Nous savons que le noyau est un sous-espace vectoriel. Réciproquement, soit F C E
un sous-espace vectoriel. Alors il possède un supplémentaire G, c'est-à-dire E = F EB G. Donc
F est le noyau du projecteur sur G associé à la décomposition E = F EB G. ■

Remarque. La démonstration de la proposistion 19.17 repose essentiellement sur la com-


plétion d'une famille libre en une base. C'est pourquoi dans le cas de dimension infinie, il peut
être impossible d'expliciter un supplémentaire, parce que nous ne connaissons pas explicite-
ment de base de l'espace.
Par exemple, dans JK[[X]] il n'est pas difficile de trouver un supplémentaire de 1Kn[X] (voir
la question-test 19.10), mais nous sommes dans l'incapacité de donner un supplémentaire de
JK[X] - et pourtant il existe.
À cause de cette difficulté, bien que le corollaire 19.18 affirme qu'il suffit de montrer qu'une
partie soit le noyau d'une application linéaire pour qu'elle définisse un sous-espace vectoriel,
cette méthode n'est pas toujours pratiquable.
Si on voulait par exemple montrer que '5' 00 (1) est un sous-espace vectoriel de JR 1 en le défi-
nissant comme le noyau d'une application linéaire, il faudrait disposer d'un supplémentaire
explicite de '5' 00 (1) dans JR 1.

Remarquons l'analogie avec la formule des cardinaux


card (AU B) + card (An B) = cardA + card B.
PREUVE. Soit F' un supplémentaire de F n G dans F, c'est-à-dire tel que F = F' EB (F n G).
Il n'est pas difficile d'en déduire que F + G = F' EB G. La proposition 19.12 montre que
dim (F + G) = dim F' + dim G. On conclut en ajoutant dim (F n G) aux deux membres de
cette égalité. ■

PREUVE. Soient G 1 et G2 deux supplémentaires d'un sous-espace F de E. Cela signifie que


E= F EB G, = F EB G2. Nous devons montrer que G, et G2 sont isomorphes. Soit Pi: E-) Gi
le deuxième projecteur de la décomposition E = F EB Gi, pour j = 1, 2, et soit p : G 1 -) G2 la
restriction de P2 à G 1. Nous allons montrer que p est un isomorphisme d'espace vectoriels.
► Injectivité : On a Ker p = Ker p2 n G 1 = F n G 1 = 0, donc p est bien injective.
► Surjectivité: Soitv E G2. Alorsv, = p,(v) E G 1 et P2(v1) = p2(v 1+(v-v 1)) = p2(v) =v
car P2(v-v,) = 0 puisque v-v 1 E F. Ainsi p est bien surjective. ■
524

Test 19.8. Test 19.10.


La fonction exponentielle x H ex peut-elle Donner un supplémentaire du sous-espace
s'écrire de manière unique comme somme d'une 1Kn[Xl dans lK[X], puis dans lK((X]].
fonction paire et d'une fonction impaire? Si oui, Test 19.11.
donner ces deux fonctions.
Soient F, G, G' des sous-espaces de E. Les pro-
Test 19.9. positions suivantes sont-elles vraies?
F EB G = F EB G' =} G = G'.
Donner un supplémentaire des matrices symé-
E = F EB G =} E ~ F x G.
triques dans A'ln(]K).
E = F EB G {= E ~ F x G.

II. SOMMES DIRECTES ET APPLICATIONS LINÉAIRES

Forts de la notion de supplémentarité, nous allons dans cette partie approfondir notre connais-
sance des applications linéaires. Nous commençons par un exemple très simple : le cas où
l'espace d'arrivée est le corps OC des scalaires.

Il.1. Formes linéaires. Hyperplans


Définition 19.21. Une forme linéaire sur un OC-espace vectoriel E est une application li-
néaire de E dans OC. L'espace vectoriel E* = 2"(E,OC) des formes linéaires sur E est appelé
le dual de E. Un sous-espace vectoriel de E est appelé hyperplan s'il est noyau d'une forme
linéaire non nulle sur E.

Remarque. Le rang d'une forme linéaire est majoré par la dimension de l'espace d'arrivée
OC, donc par l. Une forme linéaire est non nulle si et seulement si elle est surjective.

EXEMPLE 19.22. Les fonctions coordonnées cp 1, ... , <rn associées à une base (b 1, ... , bn)
de E sont des formes linéaires. Elles sont non nulles car <ri (bi) = 1 pour tout j = 1, ... , n.
Par ailleurs, <ri(bk) = 0 pour tout k / j, donc l'hyperplan Ker(cpi) est l'espace engendré
par tous les vecteurs de la base à part bi .

Ker (cpj) = vect (b1, ... , hj, ... ,bn).

PREUVE. Nous devons prouver que E = OCv EB Ker (f).


► Montrons d'abord que E = OCv+Ker(f). Soit u E E. Posonsµ= f(u)/(v) E OC, u 1 = µv E E
et u 2 = u- µv E E. Alors f(u 2) = f(u)- µf(v) = 0 par construction. Ainsi u = u 1 + u 2 avec
U1 E OCv et u2 E Ker (f).
► Montrons maintenant que la somme est directe. Soit u E OCv n Ker (f). Alors u = µv
avec µ E OC. On a µf(v) = f(µv) = f(u) = 0, donc µ = 0 car f(v) :/ O. Cela montre que
OCv n Ker (f) = O. ■
525

EXEMPLE 19.24. Soit (a,, ... , Un) E lKn\{0}. Alors,

est un hyperplan de ocn, car F est le noyau de la forme linéaire non nulle f : (x 1 , ... , Xn) H
L~i aixi . Soit k E {l, ... , n} tel que ak-=/ O. Alors f( ek) -=/ 0, c'est-à-dire que ocn = lKek EB F.
1
~

La résultat suivant est à rapprocher du théorème du---rang pour les systèmes linéaires. La
i
'liUJ
dimension de l'espace des solutions est égale au nombre de variables diminuées du nombre
d'équations indépendantes, donc ici de 1 pour un hyperplan donné par une équation. En ~
particulier, dans un espace de dimension 3, un hyperplan est de dimension 2, donc un plan ~
UJ
vectoriel. Dans un espace de dimension 2, un hyperplan est de dimension 1, donc une droite
vectorielle. Dans un espace de dimension 1, l'unique hyperplan est l'espace nul.

PrOJlllSition l.9~25.< ~~ 'E >tin ~~vectortêîdè dimenri<>n fi,niè n èt soit F un sous-espace


J
11ectôriet dt :f,: Alors f est un hwerpl<.m le E si et séulemel)tt îti dim F = n - l. -
oi
..d
ü
PREUVE.
( ===}) D'après la proposition 19.23, un hyperplan possède une droite comme supplémentaire.
Il est donc bien de dimension n - 1.
(~) Soit Fun sous-espace vectoriel de Ede dimension n-1. Soit (b 1 , ... , bn-il une base de
F, que l'on complète en une base (b 1 , • •. , bnl de E. Soit cpn la dernière fonction coordonnée
associée à cette base. Alors cpn est une forme linéaire non nulle et Ker ( cpn) = F. Ainsi F est
un hyperplan de E. ■

Il est bien connu que les équations d'une droite vectorielle dans R 2 ou d'un plan vectoriel
dans R 3 sont uniques, à un facteur multiplicatif près des coefficients. Le résultat suivant
montre plus généralement que l'équation linéaire d'un hyperplan est essentiellement unique.

Prop0${tion 19.26. Soit f E E* unefome linéaire non nulle et soit li= Ker f l'hyperplan
.fJ.88~, Soit if €J!.* une forme li:tîéâire quelconque. Alors,

l)'rtq:Kèrg~1:JÀEk, g=M;
2) à:== K,r g ~ 3Â. eJ(*, =
g Af.
PREUVE.
1) (~) Supposons que g = Àf. Alors pour x EH, on a f(x) = 0, donc g(x) = M(x) = O.
(===}) Supposons que H C Ker g et soit v E E \ H. Alors f(v) # 0 et E = H EB lKv. Posons
À = g(v) C f(v). La forme linéaire f - Àg s'annule sur H par hypothèse, et sur lKv par
construction de À, donc elle s'annule sur H EB lKv = E et ainsi f = Àg.
2) (~) C'est immédiat.
(===}) Le point précédent montre qu'il existe À E 1K tel que g = Àf. Le scalaire À est non nul
sinon H = Ker g = E ne serait pas un hyperplan. ■

Prc0~t1ett 1.ü~1. ~AllJlt~~in:~Jl$' ~~-nge) > .....·• .· ·.·.•.... ... ... . . .


&ient'1;:fl,, :i;/m:~ ~•œirê$ stl.r'an ~Cê tièctffl~ lz:,.·Alêws·~ ~'11$ oondîtioru
s•031,(fis• ~~'1'1,!Af'1,rivàly_nres, .

1) Kert0fîKer:fk-,-•'
~'I.
2) R existe Àt, ... ~Â,n. E K tels-tjiœg =1ltf1 + · ··+ À1nf~.
526

On appelle les coefficients Àk des multiplicateurs de Lagrange. Ils joueront un rôle en deuxième
année en analyse dans le chapitre des fonctions de plusieurs variable, lorsque l'on déterminera
les extrema d'une fonction sous conditions.
PREUVE. Nous avons clairement 2) =} 1). Montrons l'implication 1) =} 2) par récurrence sur
m. Le cas m = 1 est déjà connu : on reconnaît le point 1) de la proposition 19.26.
Soit m 2'. 2 fixé et supposons que le cas m - 1 est démontré. On se donne m formes
linéaires f,, ... , fm dans 2'(E) telles que
-
n
m
Ker g :::> Ker f P (19.2)
p=l

Pour allerger les notations, on pose

et Fk = nk

p=l
Hp, pour k = 1, ... , m.

Ainsi la condition (19.2) s'écrit encore Hm:) Fm,


► Si Fm= Fm-1, alors Fm-1 C Ker g et on applique le cas m-1 aux formes g, f,, · · · , fm-1·
il existe des coefficients À1, ... , Àm-1 dans ][{ tels que g = À1f1 + · · · + Àm-1f m-1 . On conclut
alors en posant Àm = O.
► Si Fm Ç Fm-1, alors la forme fm n'est pas identiquement nulle sur Fm-1 car

Il en résulte que f m induit par restriction une forme non nulle sur Fm-1. En outre, la propo-
sition 19.23 montre que si on choisit Vm E Fm-l \ Fm, alors

Posons
À _ g{vm)
m- fm{Vm).
Alors par construction la forme g - Àmf m s'annule sur la droite OCvm, et clairement elle
s'annule aussi sur Fm. Donc g-Àmfm s'annule sur FmEBOCvm = Fm-1· On peut donc appliquer
l'hypothèse de récurrences aux formes g - Àmf m, au lieu de g, et f1, ... , f m-l · Il existe des
coefficients À1, ... ,Àm-1 dans][{ tels que g -Àmfm = À1f1 + · · · + Àm-lfm-1, ce qui prouve
l'hypothèse de récurrence au rang m. ■

Test 19.12. e. Les fonctions f telles que f(l) = f(O);


f. Les fonctions f telles que f(l) = f(O) = O.
Quelle est la dimension d'un hyperplan dans
K[X]? Si c'est le cas, donner des supplémentaires.
Test 19.13. Test 19.14.
Quelles familles de fonctions de l'espace vec- La tmce est l'application
n
toriel '6' 1 ([0, ll) parmi les suivantes définissent
des hyperplans ? tr : .4ln( K) --t K, ( aek) H L akk.
k=l
a. Les fonctions d'intégrale nulle; Les matrices de trace nulle constituent-elles un
b. Les fonctions constantes ; sous-espace vectoriel de .4ln(K) ? Si oui, quelle
c. Les fonctions s'annulant en 1;
d. Les fonctions f telles que f'(l) = 0; est sa dimension ?
527

II.2. Le théorème du rang


Le point de vue des sommes directes nous donne une troisième démonstration du théorème
du rang, sans doute la plus géométrique. t~
~~î'.i~;~.; ,J(!.rii~:ilp ··r~Jii~fl~ -'f: ~
1) ·
zy.·dîtfttt
. aJre ~1{e:t.{f)cèsf
iiittH.t~tti.'r;> ·· i
'r/JP

PREUVE. ~
1) Soit G un supplémentaire de Ker (f), c'est-à-dire E = G EB Ker (f). Montrons que l'appli- ~
r/J
cation f : G -* f(E), u H f(u) est un isomorphisme. La linéarité de f vient de celle de f. On
a
Ker (f) = {u E G I f(u) = O} = G n Ker (f) = 0, J
oi
d'où l'injectivité de f. Pour la surjectivité, soit v E f(E). Alors il existe u E Etel que f(u) .....
= v. ..d
On décompose u = w + w' avec w E G et w' E Ker (f). Donc ü

v = f(u) = f(w + w') = f(w) + f(w') = f(w) + 0 = f(w),

ce qui montre la surjectivité de f.


2) D'après la proposition 19.17, le sous-espace vectoriel Ker (f) possède un supplémentai-
re G, c'est-à-dire tel que E = G EB Ker (f). Avec la proposition 19.12, on trouve dimE =
dimG +dimKer (f). D'après 1), l'espace Gest isomorphe à l'image de f, donc dimG = rg (f),
ce qui permet de conclure. ■

II.3. Sommes directes et matrices en blocs


Une façon de comprendre le théorème du rang consiste à décomposer l'espace source en la
somme du noyau et d'un supplémentaire F et de décomposer l'espace but en la somme de
l'image et d'un supplémentaire. L'essentiel de l'application linéaire se lit alors sur sa restriction
au supplémentaire F à la source et à son image au but.
Plus généralement, nous pouvons analyser une application linéaire en décomposant le but
et la source en sommes directes arbitraires. La donnée d'une application linéaire se réduit
ainsi à la donnée d'applications linéaires entre les sous-espaces d'une somme directe. Ceci
est intéressant parce que l'étude d'une application entre sous-espaces est a priori plus facile
que l'étude de l'application entre des espaces plus gros. Nous allons voir que cette analyse
correspond à la décomposition d'une matrice en blocs. Nous illustrerons cette correspondance
par l'étude des projections et des symétries vectorielles.

Si, par exemple, E = F1 EB F2 et E' = F\ EB F~ alors


528

L'ordre des facteurs n'a pas d'importance .


PREUVE. On note
lk : Fk -; E , u H u
l'injection de Fk dans E. Tout vecteur de E se décompose de manière unique en une somme
V1 + · · · + Vn avec vk E Fk. Cela définit les projecteurs

CU
On définit de manière analogue tf et pf associées à la décomposition de E'.
~
Pour tout f E 2'(E, F), on pose
ftk= pf of o tk : Fk -+ Fe de fa-
çon à obtenir le diagramme com-
mutatif ci-contre.

Les applications ftk sont linéaires comme composées d'application s linéaires. Elles définissent
l'application
2'(E, F) -; TI 2'(Fk, F~), f H (ftk)l~i~m
l~k~n
(19.3)
l~i~m
l~k~n
Elle est linéaire car les applications pf le sont. Réciproquement, à partir des ftk on reconstruit
f par la formule 2
f = L t;fekPk-
t,k
Ainsi l'application définie par (19.3) est un isomorphisme.

Compositio n de deux applications .
Soit maintenant E" = F;' EfJ • • • EfJ F; un troisième espace vectoriel décomposé en somme directe
et soit g : E' -; E" une application linéaire. Alors,

f = .L, t; fek Pk, g = .L, t;' 9iq P~


i,k j,q

où les indices parcourent les ensembles {1, ... , p,} 3 j, {1, ... , m} 3 q, {l, ... , m} 3 k,
{1, ... , n} 3 t Pour la composée p~ tf, on a

siq=i,
siq-:/=i.

Donc gf = L, t;' 9it f


j,i,k
ik Pk = .L, t5'
j,k
(r:. i
9it f tk) Pk. On obtient ainsi la formule

gf = L, t 5' (gf)jk Pk avec (gf)jk = L, 9itftk • (19.4)


j,k i

2
Pour simplifier l'écriture nous omettons le symbole o.
529

Cette formule est similaire à la formule du produit matriciel. Ce n'est pas un hasard.

1
Lien avec les matrices en blocs.
Supposons maintenant que E, E', E" sont de dimensions finies. Prenons pour chaque Fk une
base !JIJk. En les rassemblant, on obtient la base !1iJ = (!JIJ1, ... ,!JIJn) de E. Faisons l'opération
<Il
analogue dans E' et E". Posons
~
î'
<Il
::,
Alors les matrices de f et de g sont les matrices en blocs 5l
~
<Il
_ (A-11 ... A_1n)
et A- : :
Ami ... Amn J
a5
.....
Et de même, on peut écrire en blocs la matrice M.'lll".'lll(gf) de la composée gf. La for- .ci
ü
mule (19.4) exprime alors précisément le produit en blocs des deux matrices ci-dessus (voir
page 417).

Il.4. Exemple : réduction des projections et symétries


Nous illustrons la technique de décomposition en blocs sur deux exemples. Pour deux sous-
espaces vectoriels supplémentaires F et G, c'est-à-dire si E = F EB G, nous allons étudier les
applications suivantes :

p :E -t E, v=u+wHp(v)=u, }
avec u E F, w E G .
s : E - t E, v = u+wH s(v) = u-w,

Ces applications sont bien définies, car la somme directe garantit l'unicité de la décomposition
de v E E en somme de u E F et w E G. On vérifie facilement que p et s sont linéaires. Ce
sont donc des endomorphismes de E.
I
I V
I
.
s(v) __

.-·
_:
__ .,,,.,
-
G .:·--- I
--- F

Remarque. Le dessin ci-dessus schématise une projection et une symétrie générales. Les
espaces F et G représentent des sous-espaces vectoriels quelconques qui peuvent même être
de dimensions infinies. Le plan de la feuille ne représente donc pas un espace de dimension
deux. C'est un dessin d'une nature très différente de celui que nous avons donné page 521
pour illustrer des sous-espaces supplémentaires dans l'espace ambiant, de dimension 3.
530

Définition 19.31.
i 1) p est la projection sur F parallèlement à G.
•v 2) s est la symétrie par rapport à F parallèlement à G.
il
] Notons que s 2 = idE. Par conséquent la symétries est un automorphisme avec ç 1 = s.
,v En outre, p 2 = p et nous avons
i Ker(p) = G et lm (p) = F. (19.5)
On en déduit que la projection p n'est ni injective, ni surjective, sauf dans le cas peu intéres-
sant F = E ou F = O.

Remarquons de plus que Fest l'espace des vecteurs invariants pars,


F={vEE I s(v)=v}, (19.6)
tandis que G est l'espace des vecteurs que s transforme en leurs opposés.

G={vEE I s(v)=-vEE}. (19. 7)

PREUVE.

1) Il faut d'abord montrer qu'avec F = lm f et G = Ker f on a la décomposition E = F EB G.


► Montrons d'abord que E = F+G. Soit u E E. Alors v = u+w avec u = f(v) et w = v-f(v).
On a f(w) = f(v - f(v)) = f(v) - f 2 (v) = f(v) - f(v) = 0, donc v est bien la somme d'un
vecteur de F et d'un vecteur de G.
► Montrons maintenant que F n G = O. Soit v E F n G. Alors il existe v' E Etel que v = f(v').
Utilisant le fait que f 2 = f et que v E Ker (f), on obtient

v = f(v') = f(f(v')) = f(v) = O.


On a donc la décomposition E = F EB G.
► Il reste à montrer que f est la projection sur F parallèlement à G. La décomposition d'un
vecteur v dans E = F EB Gest v = f(v) + (v - f(v)), donc sa projection sur F parallèlement à
Gest bien f(v).

2) Les parties F et G sont bien des sous-espaces vectoriels car ce sont les noyaux des applica-
tions linéaires f - idE et f + idE. Montrons que E = F EB G.
► Montrons que E = F + G. Soit v E E. On écrit
v+f(v) v-f(v)
V= 2 + 2 . (19.8)

Le premier vecteur de cette somme est invariant par f car f(v+f(v)) = f(v) +f 2 (v) = f(v) +v,
donc il est dans F. De même on montre que le deuxième est dans G.
► Montrons maintenant que la somme E = F + G est directe. Pour cela soit u E F, w E G tel
que u+w = O. Donc O = f(u+w) =u-w. On déduit u =w = O.
531

► Il reste à montrer que f est la symétrie par rapport à F parallèlement à G. La décompo-


sition d'un vecteur v dans E = F EB G est donné par (19.8). Son symétrique par rapport à F rn
parallèlement à G est donc ~
v+f(v)_v-f(v)=f()
2 2 V . ■ 1rn

Ce résultat justifie les appellations suivantes. ~


P.
rn
CL)

~
Définition 19.33.
1) Une projection est un endomorphisme p de E tel que p 2 = p. rn
CL)

2) Une symétrie est un endomorphismes de E tel que s 2 = idE. "O


rn

On peut reformuler la proposition 19.32 comme suit.


◊ Dans une algèbre, un élément qui est son propre carré est appelé idempotent (du latin idem,
le même, et potens, pouvant). D'après la proposition 19.32 les idempotents de 2'(E) sont
J
ai
......
précisément les projections sur un sous-espace et parallèlement à un supplémentaire. .d
ü
◊ Dans un groupe, un élément qui est son propre inverse est une involution (du latin in, à
l'intérieur (de soi), et volere, tourner). Les involutions de Gl(E) sont précisément les symétries
par rapport à un sous-espace et parallèlement à un supplémentaire.
En outre, en dimension finie, nous avons aussi la traduction suivante en termes de matrices
en blocs.
◊ Pour toute projection dans E il existe une base fig de E telle que la matrice de f dans fig est

où la taille du bloc avec les 1 correspond au rang de f.


En effet, on prend fig= (86'1, figz) où figl est une base de l'image de f et figz une base du noyau
de f.
◊ De manière analogue, pour toute symétrie dans E, il existe une base fig de E telle que la
matrice de f dans fig est

-1

-1
où le nombre des 1 est la dimension de l'espace des vecteurs invariants par f.

EXEMPLE 19.34. Considérons l'endomorphisme


532

f est l'application linéaire induite par la matrice

0 -1
A= -1 0
( 1 1

Le lecteur vérifiera que A 2 = JI 3 , c'est-à-dire f est une symétrie. Réduisons-la.


L'espace des vecteurs invariants par f est le noyau F = Ker( f - idN.3). Ainsi F est l'espace de
solutions du système homogène de matrice A - lI3,

-1 -1
-1 -1
( 1 1

On obtient le plan F = { (x, y, z) 1 x + y = 0 }. Donc f est la symétrie par rapport à un plan et


parallèle à une droite supplémentaire. Cette droite est l'espace des vecteurs que f envoie sur
leurs opposés, c'est donc l'espace G de solutions du système homogène de matrice A+ JI 3 ,

1 -1
-1 1
( 1 1

Si on prend une base de F, disons b 1 = (-1, 1, 1) et b 2 = (1,-1, 1), ainsi qu'une base de G,
disons b 3 = (1, 1, -1), alors dans la base fig= (b 1 , b 2 , b 3 ) de JR 3 , on a

10 0)
B=M8ll(f)= 01 0 .
( 0 0 -1

Si on note fig' la base naturelle de JR 3 , alors A = M8ll,(f) dans l'exemple ci-dessus. La


matrice de passage et son inverse sont les matrices (voir la question-test 16.35)

c8ll'8ll =
-1 1 11)
1 -1 , (C8ll'8ll)- 1 =
l (010111) .
( 1 1 -1 2 110

Le lecteur vérifiera que (C8ll'8ll)- 1 A C8l/'8li = B. Bien évidemment, on aurait pu choisir une
autre base de F et une autre base de G. On aurait alors obtenu une autre matrice de passage
qui transforme la matrice A en la matrice B.

Test 19.15. une projection si et seulement si idE - p l'est


Expliciter la symétrie par rapport à l'espace aussi, ou encore si et seulement si p et idE - p
nul. commutent. Montrer que dans ce cas
lm p = Ker (idE -p) et Ker p = lm (idE -p).
Test 19.16. Test 19.18.
Un endomorphisme peut-il être à la fois une Donner l'image de X 2 + X par la
symétrie et une projection?
a) projection sur les polynômes pairs,
Test 19.17. b) symétrie par rapport aux polynômes pairs,
Soit p E 2'(E). Montrer que p E 2'(E) est parallèlement aux polynômes impairs.
533

Test 19.19. Test 19.21.


Dans le IR-espace vectoriel IC, quel nom porte la D'après ce que nous avons vu page 402 l'espace
symétrie par rapport à R parallèlement à iR ? des carrés magiques se décompose sous la forme
Et quel nom porte la projection sur R parallè-
lement à iR ? X = Xo EB vect (JI) .

Test 19.20. Soit s la symétrie par rapport à Xo parallèle-


ment à la droite vect (JI).
Dans R 3 soient b1 = (1, 1, 0), b2 = (2, 0, 0),
Donner l'image du carré magique A de la page
b3 = (2, -1, ~J Donner la matrice dans la base 402 pars. Quel est le lien entre le caractère d'un
naturelle de carré magique et celui de son symétrique?
Test 19.22.
a. la projection sur 0Cb1 et parallèlement à
Soit E = F EB G. On note Lk et Pk, k = 1,2,
vect (b2, b3),
les inclusions et projections associées à cette
décomposition. Exprimer en fonction de ces ap-
b. la symétrie par rapport à 0Cb1 et parallèle- plications la projection p sur F parallèlement
ment à vect (b2, b3). à G et la symétrie s rapport à F parallèlement
à G.

III. EXERCICES
19.1. 2. Si f et g sont deux automorphismes comme
ci-dessus, alors il existe À E OC* tel que g = M.
Soient E et F des OC-espaces vectoriels et
f, g E 2'(E, F). On suppose E de dimension 19.3.
finie n.
1. Montrer que Toute permutation a E 63 définit un automor-
phisme ëf de R 3 par permutation de coordon-
1rg (f) - rg (g)I,:;; rg (f + g) ,:;; rg (f) + rg (g). nées, c'est-à-dire

2. Prouver que rg (f + g) = rg (f) + rg (g) si et ëf( XJ, Xz, X3) = XJ err(l l + x2err(2) + x3err(3) .
seulement si (Autrement dit, ëf(x) = Prrx avec la matrice de
permutation de la proposition 16.64.) Considé-
lm (f) n lm (g) = {O} et Ker (f) + Ker (g) = E.
rons les sous-espaces
(Indication: montrer que dans ce cas on a l'éga-
G ={(x1,x2,x3) E R 3 I x1 =X2 =x3}
lité Ker( f + g) = Ker( f) n Ker ( g).)
F ={(x1,x2,x3) E R 3 I x1 +x2 +x3 =0}

19.2. 1. Montrez que R 3 = F EB G


2. Montrez que~ = (b1, b2} = ( e1 -e2, e2-e3)
Soit (G1, G2, G3) un triplet de trois droites vec- est une base de F.
torielles distinctes dans OC2, et soit (G(, G G 2, 3) 3. Montrez que G est invariant sous l'action du
un autre tel triplet. Démontrez les assertions
auivantes. groupe 63, c'est-à-dire

1. Il existe un automorphisme de OC2 qui envoie


le premier triplet sur le second. Autrement dit,
il existe f E Gl(OC 2) tel que f( Gj) = G pour 1 4. Montrez que les seuls sous-espaces vectoriels
toutj=l,2,3. de R 3 invariants sous 63 sont F, G, R 3 et l'es-
534

pace nul. (Indication : Observez que si un sous- 2. Démontrez qu'on o un isomorphisme cano-
espace invariant n'est pas contenu dans F, alors nique
il contient bi-)
5. Pour tout cr E 63 on note ô' l'automor-
phisme de F induit par l'automorphisme o' de
19.7.
JR 3. Montrez que les matrices Mai(ô'), cr E 63,
sont précisément les six matrices dans Gl(2, Z) Pour un K-espace vectoriel E on note E** =
renconytrées dans l'exercice 16.8. (E*)* le bidual de E, c'est-à-dire le dual de son
dual.
19.4.
1. Pour tout v E E et tout f E E* on pose
x(v)(f) = f(v). Démontrez que
On reprend les notations de l'exercice 19.3.
Dans toutes les questions suivantes on munit le X : E --t E** ' V H x(v) '
plan complexe (C de sa structure naturelle de
IR-espace vectoriel. est un morphisme injectif.
1. Montrez qu'il existe un unique isomorphisme 2. Si E est de dimension fini on écrit E = E**
et non seulement E -::::; E**. Justifiez.
f:F--tC,

tel que f(b1)= 1 et f(b2) = !(-1 + iv3). 19.8.

2. Pour tous f, k E {1, 2, 3} avec f # k notons


Démontrez que la matrice n x n
Ztk= f( er- ek) . Quelle est la configuration for-
mée par les points Zfk, f # k? Faire un dessin.
3. Pour tout cr E 63 on note cr l'automor-
11. .. 1)
A=_!_~~---~
phisme de (C défini par n (: : :
1. ..
1 1
CY=foô'or 1 .
est idempotent. Déterminez une matrice C E
Notons crrk E 63 la transposition qui permute
GL(n,IR) telle que B = c- 1AC est une matrice
f et k. Montrez que l'automorphisme Œ& est la
diagonale.
reflexion par rapport à la droite perpendiculaire
àllhtk·
19.9.
En déduire une interprétation géométrique du
groupe 63.
Soit p E l(E) une projection. On pose q
idE - p. Montrez les assertions suivantes
19.5.
1. l'endomorphisme q est une projection,
Démontrez que pour toute forme linéaire f # 0 2. p O q = q Op = 0,
sur E il existe un système de coordonnées sur 3. lm p = Ker q et lm q = Ker p.
E dont f est l'une des fonctions coordonnées.
4. E = Ker q EEl lm q.
19.6.
19.10.
Pour un K-espace vectoriel E on note E* =
Z(E, K) l'espace des formes linéaires sur E, et Soient H1 et H2 deux hyperplans distincts d'un
on l'appelle le dual de E. espace vectoriel E de dimension finie n.
1. Soit E de dimension fini. Démontrez que 1. Prouver que n ): 2.
E-::::; E*. 2. Montrer que dim(H 1 n H2) =n - 2.
COMPLÉMENT 1. NOYAUX

De l'algèbre linéaire aux équations différentielles

Nous allons prouver, avec les méthodes de l'algèbre linéaire, un résultat bien connu de la
théorie des équations différentielles.

Notation. Nous notons la composition de deux endomorphismes f, g d'un ][{-espace vectoriel


Epar fg (à la place de f o g).
On fixe un endomorphisme f de E. Les puissances fk, k E N, sont encore des endomor-
phismes. On convient que t 0 = idE. Cela permet de définir « l'évaluation en f »
n n

evf : ][{[X] --, 2'(E), P = L. akXk H P(f) = L. akfk.


On vérifie facilement qu'il s'agit d'un morphisme d'algèbres et que pour tous polynômes P, Q
on a
(PQ)(f) = P(f)Q(f) = Q(f)P(f),
c'est-à-dire que les endomorphismes P(f) et Q(f) commutent entre eux.

=~:fflm~~ri~~.#~~~~2~-··
ftr~:~i;,
z;I~.,
~~r~, à.t<~t~1 P:t1t~K~' Q(if. ·•
0

PREUVE. Appliquons le théorème de Bézout (13.51) à Pet Q : il existe R, S dans ][{[X] tels
que RP + SQ = 1. Alors R(f)P(f) + S(f)Q(f) = idE.
► Montrons que Ker (PQ)(f) = Ker P(f) + Ker Q(f). Soit v E Ker (PQ)(f). Alors,

v = idE(v) = R(f)P(f)(v) + S(f)Q(f)(v) = v 1 + v2,


avec v 1 = R(f)P(f)(v) et v 2 = S(f)Q(f)(v). On a

Q(f)(v 1) = Q(f)R(f)P(f)(vi) = R(f)(PQ)(f)(v 1) = R(f)(0) = 0,


ce qui prouve que V1 E Ker Q(f). On montre que V2 E Ker P(f) de manière analogue.
On a donc prouvé que Ker(PQ)(f) C Ker P(f) + Ker Q(f). Pour montrer l'inclusion réci-
proque, il suffit de montrer que Ker (PQ)(f) contient l'union Ker P(f)UKer Q(f). Or, l'identité
(PQ)(f) = P(f)Q(f) montre que Ker Q(f) C Ker (PQ)(f) et l'identité (PQ)(f) = Q(f)P(f)
montre que Ker P(f) C Ker(PQ)(f).
► Montrons maintenant que la somme est directe. Soit v E Ker P(f) n Ker Q(f). Alors,

v = idE(v) = R(f)P(f)(v) + S(f)Q(f)(v) = R(f)(0) + S(f)(0) = 0. ■

Maintenant, appliquons le lemme des noyaux à l'endomorphisme


EXEMPLE 19.36. On considère l'équation différentielle

(19.9)

Pour P =X+ 2 et Q = X - 1, on a PQ = X2 + X - 2. Si on remplace dans l'indéterminée X


l'endomorphisme d~' on obtient l'endomorphisme

2
PQ ( -d) = -d + - d- 2 .
dx dx 2 dx

Les solutions de (19.9) sont précisément les éléments de noyau de PQ ({x) . Or ce noyau
est la somme directe du noyau de P (-fx) = -fx + 2 et du noyau de Q ( d;J = -fx - 1. Ces
deux noyaux sont faciles à déterminer : la fonction x H e-2x est une base du premier et la
fonction x H ex une base du second.
Ainsi l'espace des solution de (19.9) a pour base les fonctions e-2x et ex.

Proposition 19~37. SoîtP = xn+an-1Xn,,;l +•·· + œtX+: Clô un p<Jlyn/Jmedé.C{X}·â


racines simples «1, ... , «u. E C. Alors l'espace des solutions.de l'équation différentielle

(19.10)
a pour base les fonctions x H e<Xkx, k = 1, . .. , n.

PREUVE. L'espace des solutions de (19.10) est précisément le noyau de P ( !) .


On a P = (X - a 1 ) · · · (X - exn). On applique le lemme des noyaux à (X - cx 1) et à
Q = (X - cx2) · · · (X - «n) ; on obtient

Par récurrence on déduit alors que

Chaque noyau se détermine simplement,

Le fait que la somme est directe assure que ces fonctions soient libres, donc elles forment une
base de l'espace de solutions de l'équation différentielle. ■

Comment peut-on procéder lorsqu'il y a une racine double? Ici encore, le lemme des noyaux
donne la réponse. Supposons que P a des racines distinctes CX1 , ••• , CXr de multiplicités
respectives m1 , ... , ffir. L'espace des solutions de l'équation différentielle est donc
On a ( ! - ex) (xPecxx) = pxP-1e=, et par récurrence pour tout q EN,

En particulier(! - ext (xPecxx) = 0 pour p < q. On en déduit que les fonctions xPecxx, pour
p = 0, ... , m - 1, sont dans Ker (d~ - ex) m . En outre, elles forment une famille libre.
En résumé, l'espace des solutions de (19.10) a pour base les fonctions

xPe""x, p = 0, ... , mk - 1, k = 1, ... , r.


Chapitre 20
DÉTERMINANT S

E déterminant est la notion qui formalise algébriquement la mesure géométrique du

L volume. Nous en verrons l'emploi dans le chapitre d'analyse des fonctions de plusieurs
variables du cours de deuxième année. Dans ce chapitre, nous allons présenter une
courte introduction géométrique en dimension deux, avant de nous consacrer aux aspects plus
calculatoires, notamment pour la résolution des systèmes linéaires.

I. AIRE D'UN PARALLÉLOGRAMME


Quelle est la formule générale d'un déterminant? Si on suppose qu'un déterminant est un
outil pour mesurer un volume en dimension quelconque, il doit mesurer une aire en dimension
deux.
Soit E le plan euclidien et soit a : E2-, JR+, (u, v) H a(u, v) la
fonction qui à tout couple (u, v) associe l'aire du parallélogramme
b.--- ,/ ---7
/
formé par les vecteurs u et v.
u
Nous allons emprunter l'approche axiomatique. Pour (u, u', v) E E3 et À E JR+, on souhai-
terait que la fonction a vérifie les relations suivantes :

a(u, v) = a(v, u)
a(-u,v) = a(u,v)
a(Àu,v) =Àa(u,v)
(20.1)
a(u+u',v) = a(u,v) + a(u',v)
a(v,v) =0
a( u, v) = 1 si (u, v) est une base orthonormée.
En effet, seules les deuxième et quatrième propriétés ne sont pas évidentes. Nous les illus-
trons par les dessins suivants.
V ---7
,--- I
I
I
I

/a(-u,v) I
I
I
I
I

-u
--"7' ....
---- I ',
................ .., --:=-------:..·.,
I I
a(u',v) I a(_ii+u',v) I
I I
I I
I
I ----..Ji,Ljt.,_!;!U!:_i_•·_··.:_··:.:_·.:_;·.:..:.... /
Or, ces conditions sont incompatibles. En effet, les première, quatrième et cinquième condi-
tions montrent que

0 = a(u+v, u+v) = a(u,u+v) + a(v,u+v) = a(u+v, u) + a(u+v,v)


= a(u, u) + a(v, u) + a(u, v) + a(v, v) = a(u, v) + a(v, u) (20.2)
et ainsi a(u, v) = -a(v, u), ce qui contredit les première et sixième conditions. Il nous faut
donc abandonner l'idée d'une mesure d'aire à valeurs dans JR+ vérifiant les conditions (20.1).

On se propose de chercher une expression algébrique vérifiant le plus possible des condi-
tions de (20.1), sous la forme d'une fonction des coordonnées dans une base !!.i = (b 1 , b 2 )
de E. En particulier, on souhaite que si u = xb1 + yb2 et v = x'b1 + y'b2, alors on cherche
une fonction f de quatre variables réelles telle que lf(x, y, x', y')I = a(u, v). Le mot « algé-
brique» veut dire ici que les seules opérations permises sur les variables x, x, y, y' sont les
opérations élémentaires dans un corps : addition, multiplication, soustraction, division. La
valeur absolue, par exemple, n'est pas admise.

Notre discussion sur la compatibilité des conditions nous conduit à abandonner notre
notion d'aire a à valeurs positives et à adopter la notion d'aire orientée d(u, v) qui peut
prendre des valeurs dans tout lR. Le principal avantage est que nous pouvons multiplier les
vecteurs u et v par des scalaires de signe quelconque. Fixons une base de E de référence
!l.io = (Uo, Vo). Nous cherchons une fonction qui vérifie maintenant les conditions suivantes
pour tout u, v, w dans E et pour tout À E lR :

d(u,v) =-d(v,u)
d(Àu, v) = Àd(u, v)
d(u+v,w) =d(u,w) +d(v,w). (20.3)
{ d(v,v) =0
d(Uo,vo) = 1
De plus, la quatrième de ces conditions est une conséquence de la première. En effet,
d(v, v) = -d(v, v) entraine que 2d(v, v) = O. Enfin, la deuxième et la troisième des conditions
peuvent être reformulées en terme d'applications linéaires.

d(.,v): E--tlR,uHd(u,v) estlinéaire


{ d(u, .) : E --t lR, v H d(u, v) est linéaire·
Inversement, montrons la première propriété de (20.3) est une conséquence des autres. Le
calcul est analogue à celui que nous avons fait pour a.

0 = d(u+v,u+v) = d(u,u+v) +d(v,u+v)


= d(u, u) + d(u, v) + d(v, u) + d(v, v) = d(u, v) + d(v, u)
=} d(u, v) = -d(v, u). (20.4)
En résumé, la fonction d : E2 --t lR vérifie les trois propriétés suivantes :

0 1 : V (u, v) E E2 , d(., v) et d(u, .) sont linéaires


02 : Vv E E, d(v, v) = 0 (20.5)
{
03 : d(Uo, vol = 1.
Nous pouvons à présent déterminer l'application d. Exprimons les deux vecteurs u et v
dans la base !l.io. Nous avons u = XUo + yv 0 et v = x'Uo + y'v0 . Alors,
541

d(u, v) = d(xu0 + -yvo, x'uo +-y'vo)


= xd(Uo, x'uo +-y'vo) +-yd(vo, x'Uo +-y'vo)
= xx' d(uo, uo) + x-y' d(uo, vo) +-yx' d(vo, Uo) + y-y' d(vo, vol (20.6)
1 1
=XX X 0+x-y X 1 +-yx' X (-1) +y-y' X 0
= x-y' - x'-y.

Ainsi la fonction d est complètement déterminée. Remarquons que cette expression est pré-
cisément le déterminant auquel nous sommes habitués. On convient qu'appeler base directe
tout couple de vecteurs (u,v) tel que d(u,v) > 0, et base indirecte tout couple de vecteurs
(u,v) tel que d(u,v) < O. On notera de plus que nous n'avons pas fait appel à la notion
de base orthonormée pour définir la fonction d. Ce sont deux notions distinctes. Bien sûr,
comme les isométries préservent les aires, il est d'usage de prendre pour référence une base
orthonormée. Toutes les bases orthonormées seront alors de déterminant 1 ou -1 selon leur
orientation.

Évidemment, il y a des preuves plus directes de cette proposition. Mais notre approche
est conceptuellement plus intéressante. Sans faire appel à des notions métriques comme la
longueur des deux vecteurs ou la mesure de l'angle qu'ils forment, nous avons trouvé cette
formule seulement en réfléchissant à une axiomatique possible de ce qu'une mesure d'aire doit
raisonnablement être.

Test 20.1. a. Déterminez les coordonnées du point D


(resp. D') tel que (ABCD) (resp. (CABD')) est
À l'aide d'un base orthonormée, on identifie le
un parallélogramme.
plan euclidien à R 2 . On définit par leurs co-
ordonnées trois points : A(2, 1), B(-1,2) et b. Calculez et comparez les aires des parallélo-
C(3,-4). grammes (ABCD) et (CABD').

Il. DÉTERMINAN T D'UNE MATRICE

Nous allons maintenant étendre la définition du déterminant à toute dimension finie. Il faut
garder à l'esprit que le déterminant mesure un volume (c'est-à-dire une aire en dimension 2),
celui du parallélépipède de côtés formés par les vecteurs. Il est alors clair que si les vecteurs
sont liés, alors ils sont contenus dans un hyperplan et donc le volume est nul. Le déterminant
doit donc avoir en toute dimension une propriété analogue à la condition (20.4) : c'est la
propriété essentielle d'une application alternée.
II.1. Formes multilinéaires alternées
Définition 20.2. Soit E un espace vectoriel et

une fonction. On dit que f est multilinéaire alternée si elle vérifie les deux conditions sui-
vantes:
1) pour tout k = 1, ... , n, et pour tout (v 1, ... , Vic, ... ,Vn) E En~l, l'application

est linéaire;
2) on a f(v 1, ... , Vn) = 0 dès que vk = Vj avec k /- j.
La première condition signifie que f est multilinéaire, c'est-à-dire qu'elle est linéaire en
chaque variable. La seconde condition est clarifiée par la proposition suivante, qui justifie de
plus la terminologie : le signe de f «alterne» lorsqu'on permute les vecteurs V1, ... , Vn.

~l5é,$ftf~Î',cJJi? .s'iiU}f:E~9"~û#t

ir
,' ,'_,

.~) S~ .!es ~V.ts,Mf, ~ .. ·; . .· . ....


:~t!i~i~f:~f;
Le nombre E( <J) est la signature de la permutation <J comme définie en 10.26. La deuxième
propriété affirme qu'on peut ajouter à un vecteur une combinaison linéaire des autres, sans
que cela ne change la valeur de f.
PREUVE.

1) Commençons par le cas de la transposition qui échange les deux premiers indices. En
développant
0 = f(v1 + Vz, V1 + Vz, V3, ... )Vn) )
on montre comme pour (20.4) que
f(vz, V1, V3, ... , Vn) = -f(v1, ... , Vn) .
De la même manière, on prouve la formule (20. 7) pour toutes les autres transpositions. Comme
E ( <J) = (- 1) m, où m est un nombre de transpositions dont la permutation <J est le produit,
on conlut alors par récurrence sur m.
2) Si les vecteurs v 1, ... , Vn sont liés, alors il y en a un parmi eux qui est combinaison linéaire
des autres. À un signe près (voir le premier point), nous pouvons supposer que c'est le premier.
Alors,

±f(v1, ... ,vn) = ±f (f k=2


Àkvk,vz, ... ,vn) =± fk=2
Àkf(vk ,Vz , ... ,vn) = 0,
car chaque terme de cette somme est nul, la fonction ayant pour argument des n-uplets
comportant deux vecteurs égaux.
543

3) f(v1, ... , Vk-h vk+ L ÀjVj, Vk+l, ... , Vn) = f(v1, ... , Vk-1, Vk, Vk+l, ... , Vn)
j,fk
+f(v1, ... , vk-1, .L, Àivi, Vk+l, ... , Vnl-
i,ék
Le dernier terme est nul car les vecteurs sont liés. ■

Il.2. La formule polynomiale du déterminant


Nous prenons pour E l'espace lKn et nous identifions En = (JKn)n avec l'espace A'tn(lK) des
matrices carrées : nous écrivons une matrice carrée comme n-uplet de ses colonnes.

ft!!ritTI=:!!~~"~i·~~~
3) . ·sî ,h ~Jfl(h•·f,1'!•~'.fjtJ$b,'lfÎftfa~tt(!ii;,m'lliffiiî~.al~étf ên ·les. çolonnès;·alors
1

po~r.totstAEAn{l{êt •.

4) le,<léterrriinrmt ~'l'~~ni~ 4pp{ibâtÎfJn !<le.Â;..(JK) da~ K qtti t~l,om,,aliséè par la condi-


tion 2}.et .qai est multilitîéai"re alternée en les colon.nés.
PREUVE.

1) Nous devons montrer deux propriétés.


► Multilinéarité. Pour simplifier l'écriture nous démontrons la linéarité seulement en la pre-
mière colonne (la démonstration est analogue pour les autres colonnes).
1

Soit À E JK, soient v 1, ... , Vn des vecteurs colonnes et soit u 1 = ( b; ) un vecteur quelconque
bnn
de ocn. Alors,

det(v, + ÀU1, Vz, ... , Vn) = .L_ e( o-)( Ucr(l)l + Àbcrrnilucr(2)2 · · · Ucr(n)n

= L, e(o-)Ucr(1)1Ucr(2)2 · · · Ucr(n)n
CYE6n

= det(v1, ... ,vn) + Àdet(u1, V2, ... ,vnl-


► Alternance. Supposons donc vk = Vj pour deux indices distincts k et j. Soit 'T la transpo-
sition qui permute j et k. Alors, pour tout <Y E 6n, on a

Ucr(l),l · · · Ucr(n),n = Ucrr(l),1 · · · Œcrr(n),n et e( <Y'T) = -e( <Y) •


544

Ainsi dans la somme (20.8), on peut regrouper les termes d'indice <Y E .!dn (tels que do-) = 1)
et ceux d'indices <Y'T (tels que t:(o-T) = 1). Les termes viennent donc en couples dont les
membres s'annulent mutuellement.
2) On a detlln = .LcrE'5n t:(o-)Ôcr(lll · · · Ôcr(n)n = 1, car la seule permutation <Y telle que les
symboles de Kronecker Ôcr(l)l , ... , Ôcr(n)n sont tous non nuls est l'identité.

3) Nous procédons comme pour montrer (20.6) : nous écrivons chaque vecteur colonne de
A comme combinaison linéaire des vecteurs e 1, ... , en de la base canonique de ocn et nous
utilisons la multilinéarité de d.

d(A) =d (tk1=l
ak, 1ek, , , , , , t
kn=l
aknnekn)

n
L_ ak, 1 · · · Ukn n d( ek, , . , , , ekn) .
k1 ,... 1kn=l

Pour les indices dans cette somme, il y a deux cas possibles.


► Le n-uplet (k 1, ... , kn) E {1, ... , n}n possède deux nombres égaux. Donc la matrice
(ek,, ... , eknl a deux vecteurs colonnes identiques et d(ek,, ... , eknl = 0 à cause de l'al-
ternance de d.
► Le n-uplet (k1, ... , kn) définit une permutation <Y E 6n en posant o-(j) = ki· Donc la
matrice (ek, , ... , ekn) résulte de la matrice identité en appliquant la permutation o-- 1 à
ses colonnes. L'alternance de d et la formule (20.7) montrent que

Par conséquent,

d(A) = .L, t:(o-)Ucr(l)l .. · Ucr(n)n d(lln) = detA d(lln).


crE6n

4) résulte immédiatement de 3). ■

On note souvent IAI = <let A


Ne pas confondre avec la valeur absolue <let AI du déterminant.
1

Expérimentons la formule (20.8) sur deux cas particuliers.


Pour n = 2. Nous avons 2 permutations : celle qui envoie ( 1, 2) sur ( 1, 2), qui est paire, et
celle qui l'envoie sur (2, 1), qui est impaire. Donc,

011 U121
= U11U22 - Uz1U1z.
1 U21 Uzz
On retrouve donc notre formule habituelle du déterminant en dimension 2.
545

Pour n = 3. Nous avons 6 permutations qui envoient (1,2,3) sur

(1,2,3), (3, 1,2), (2,3, 1) paires etsur (1,3,2), (3,2,1), (2,1,3) impaires.

Donc (dans ce même ordre),

il11 U12 il13


Î
•V
Ci

a21 a22 a23 = a11a22a33 + il31a12a23 + a21U32il13 0


C"I
(20.9) .d
il31 il32 il33 C,.)

L'o,pplièâti® dèt. ; Jfh'{1'){'--¼ K .èst•n~. d mllltilirt~'~rnéè êîilt11;~ 4e.


A,. et ê'est l'ûniqûe application avec ces pro'J}rié:tés.

PREUVE. Il suffit de montrer l'invariance par transposition, le reste de l'énoncé sera ensuite
une conséquence de la proposition 20.4. Soit A= (iltk) E .4'n0K). Nous notons tA = B = (bkt)
sa matrice transposée. Ainsi bkt = ilfk. Alors, en utilisant le fait que la signature d'une
permutation est la même que celle de son inverse , on trouve

det tA = .L_ E(u)bcr{l)l · · · bcr(n)n


crE6n

= .L_ E(u)a1cr{l) · · · ilncr(n)

= L E(u)ac, 1 (1)1 · .. ilc,l(n)n

= L E(u')acr'(l)l ... ilcr'(n)n


cr'E6n
=detA. ■

Test 20.2. Test 20.3.


214 Ces formules sont-elles vraies pour des matrices
Calculer le déterminant 3 0 1 . En déduire nxn?
512
a. det(A+B) =detA+detB.
2 1 4 5 15
ex= 5 1 2 et (3 = 301 . b. det(ÀA) = ;\detA.
-3-0-1 512 c. det(-A) = -detA.

Pour certaines matrices, le déterminant est particulièrement simple à calculer.

Déterminant d'une matrice de permutation. En effectuant la permutation u sur les


lignes d'une matrice, on obtient la matrice de permutation P cr• Ainsi on a la

Rêglê 20.-6. · l,e :dé~~o,nt d1üne ma~ dé perm,utati<m est la, signll,turè <Ïf'fla'permtitat~n
0
• det(Pir} z e( a) •
546

Déter minan t d'une matric e triang ulaire . Considérons une


matric e triangu laire. Évidem-
ment tous les termes de la somme (20.8) sont nuls, sauf celui
qui corresp ond à la permu tation
identit é.

EXEM PLE 20.8. On souhai te calculer le déterm inant de la matric e

0123 45
1012 34
2101 23
A=
3210 12
4321 01
5432 10
Si on ajoute à une colonne une combinaison linéaire des autres
colonnes, le déterm inant ne
change pas, et de même pour les lignes. On soustra it success
ivement la k-ième colonne de la
(k - 1)-ième colonne, k = 2, ... , 6. On obtien t

-1 -1 -1 -1 -1 5
1-1- 1-1- 1 4
1 1 -1 -1 -1 3
detA=
1 1 1-1- 12
1 1 1 -1 1
1 1 1 0
Mainte nant on additio nne la premiè re ligne à toutes les autres.

-1 * * * * *
-2 * * **
-2 *
detA =
-2 *
* * = (-1 )(-2) 4 X 5 = -80.
*

Pour calculer ce déterm inant par la formule (20.8), on aurait


dû effectuer 5 x 6! = 3600
multip lication s ...

Test 20.4. Test 20.5.


Quel est le déterminant de -Iln? Quel est le déterminant de ( Ilnl][n) ?
547

Volume d'un parallélépipède. Soit !!lJ une base orthonormée de l'espace à 3 dimensions.
Pour des vecteurs u, v, w quelconques dans l'espace, notons A la matrice dont les colonnes
(ou lignes) sont les coordonnées de u, v, w. Alors on démontre, comme dans le paragraphe
introductif, que le volume du parallèlépipède défini paru, v, w est le nombre Vol(u, v, w) =
ldetAI. Î
,<l)

Cl
ci
C'I
.d
ü

.w

Test 20.6. du parallélépipède engrendré par les quatre


points A(l,O, 1), B(2,-2,2), C(-1,2,4) et
On identifie l'espace ambiant à R 3 en choisis-
sant une base orthonormée. Calculer le volume
D(2,3,0).

III. CALCULS DE DÉTERMINANTS ET CONSÉQUENCES

III.1. Déterminant d'un produit


Déterminons les déterminants des matrices élémentaires (voir définition 16.58). Les matrices
de type liek sont des matrices de permutation, tandis que lie[À] et liedµ] sont des matrices
triangulaires, À E ][(*, µ E OC. Nous avons donc

<let liek = -1 , <let lie[À] = À, <let liedµ] = 1. (20.10)

Nous remarquons que toutes les matrices élémentaires sont de déterminant non nul.

PREUVE. Pour ce résultat important, nous donnons deux preuves indépendantes.


Première preuve. Soit <D : Atn(OC) --+ ][( définie par <D(M) = det(AM). Montrons que
<D est une application multilinéaire alternée en les colonnes de M. On note dans la suite
ME Atn(OC) en colonne sous la forme M = (Mi, ... , Mn), avec Mk E ocn pour 1 ~ k ~ n.
► Si M 1 = ÀM; + µMf, avec À, µ dans ][( et M;, Mf dans ocn, alors

<D(M) = det(ÀAM; +µAM;', ... ,AMn) = Àdet(AM;, ... ,AMnl + µdet(AM;', ... ,AMnl-
11 en résulte que la fonction <D est linéaire en la première colonne de M. Bien entendu, la
linéarité de <D en les autres colonnes se démontre de manière analogue.
► Si Mi = Mk pour deux indices 1 ~ k < j ~ n, alors AMi = AMk et

<D(M) = det(AM1, ... ,AMk, ... ,AMi, ... ,AMn) = O.


548

Ainsi, la fonction <l> est bien multilinéaire alternée en les colonnes de M. D'après le point 3)
de la proposition-définition 20.4, on a
det(AB) = <I>(B) = <l>(lln)detB =detA detB,

ce qui termine la première preuve.


Seconde preuve. Nous distinguons deux cas.
► Cas où rg B < n. Alors les lignes de B sont liées et d'après la proposition 20.3, on a
det B = O. Or, les lignes du produit AB sont des combinaisons linéaires des lignes de B et, par
conséquent, les lignes de AB sont également liées, d'où det(AB) = O.
► Cas où rg B = n, c'est-à-dire BE Gl(n,OC). Commençons par le cas où Best une matrice
élémentaire.
- Si B = Urk, alors le produit AUrk s'obtient en permutant deux colonnes de A. Donc
det(AUrkl = -detA.
- Si B = Ud7'], alors le produit AUr[À] s'obtient en multipliant une colonne de A par
À -1 O. Donc det(AUr[Àl) = ÀdetA.
- Si B = Urk[µl, alors le produit AUrdµ] s'obtient en ajoutant à une colonne de A un
multiple d'une autre. Donc, d'après la proposition 20.3, on a det(AUrk[µl) = det A.
Ainsi det(AB) = detAdet B est vrai si Best une matrice élémentaire. Or, d'après la proposi-
tion 16.59, toute matrice B E Gl( n, OC) peut s'écrire comme produit de matrices élémentaires,
et on conclut par une récurrence aisée sur le nombre de facteurs élémentaires nécessaires pour
écrire B. ■

Corollmê 20:10;
1). Une ~~~~•J1•.~~4Bi~t~~1ttsî~it~f~t~}i~~~~é
Autremrnt dit, on à · ·

2) Le dêterminant définit 11,n m<Yipb,is:rii.J de groùj,e°s; J•


· Gt{n:,.KJ ··~o·K;,,·Àî;~,,det~ .• ,,
En particulier pour toutAE Gl(n,:K}on a d~t(A~jl'iJ:.J.J-J:'
PREUVE.

1) ({=) Supposons que A est inversible. Alors il existe A - l tel que AA -l = lin. Ainsi
1 = det lin= det(AA- 1 ) = detA det(A- 1 ), ce qui montre que det A -1 O.
(===}) Supposons inversement que A n'est pas inversible. Alors les colonnes de A sont liées
et det A = 0, d'après la proposition 20.3.
2) est une conséquence de 1) et de la proposition 20.9. ■

Test 20.7. Test 20.8.


Montrer que pour toute matrice de la forme Montrer directement que si An 0, avec
B = tAA, avec A E .An(]R:.), on a <let B) O. A E .An(K), alors <let A = O.

Déterminant d'un endomorphisme.


La proposition 20.9 a une autre conséquence importante. Elle permet en effet de définir le
déterminant d'un endomorphisme, sans que ce déterminant dépende du choix de la base dans
lequel l'endomorphisme est représenté. Voyons cela de plus près.
549

Si f est un endomorphisme d'un espace vectoriel E de dimension finie n, alors on peut


le représenter par la matrice Ma11(f) dans une base!:$. Pour une autre base, on obtient une
matrice conjuguée. Or, des matrices conjuguées ont le même déterminant. En effet,

det(C- 1 AC) = (det q- 1 detAdet C = detA.


Définition 20.11. On appelle déterminant de l'endomorphisme f E 2'(E) le déterminant
1
,(1.)
Cl
c:i
CN
det(f) = det Ma11(f), ..d
u
où!:$ est une base quelconque de E.
Ainsi f est un automorphisme si et seulement si det (f) 1- 0.

IIl.2. Développement suivant une ligne ou une colonne


III.2.1. Les développements

Page 545, nous avons détaillé les formules des déterminants d'ordres 2 et 3. Pour les dimensions
supérieures, les formules deviennent péniblement longues. En dimension 4, il y a déjà 4! = 24
termes. Nous allons maintenant voir comment le déterminant d'ordre n peut s'exprimer en
fonctions de déterminants d'ordre n - 1.

Proposition 20.12. Soit A = atk) E Afn{JK) une matricecarrée. Pour (f, k} E {1, ... , n}2,
on note Aek E Afn.-l (K} la matrice obtenue en supprimant de A la f-ième ligne et la k:-ième
colonne. de A. Alors on peut calculer le déterminant de A = (Otk) E .An.(K) :
t\

1) ·Par un développement suivant la k-ième colonne : det A = L (-1 )t+katk det Atk;
f=l

t\

2) Par un développement suivant la f-ième ligne det A = L (-1 )t+katk det Atk •
k=l

Ces formules expriment le déterminant d'ordre n comme somme alternée de déterminants


d'ordre n - 1, les coefficients de la somme étant les coefficients d'une colonne ou d'une ligne
choisie. En somme, nous avons obtenu des formules permettant de calculer le déterminant par
récurrence sur la taille de la matrice. Évidemment, on aura intérêt à choisir de développer de
préférence suivant la ligne ou la colonne comportant le plus de coefficients nuls possible.
PREUVE .
.'.'fous nous bornons à montrer le développement suivant les colonnes. Le développement suivant
les lignes s'en déduit en effet aisément par transposition. Commençons par le développement
suivant la première colonne.
Pour tout C = 1, ... , n soit 6n,f la partie du groupe symétrique 6n formée des permuta-
tions O' telles que O'( 1) = t Il est clair que
n

et que c'est une union d'ensembles disjoints. On peut donc séparer la formule du déterminant
en plusieurs sommes.
550

detA = L, é:(<J)Ocr(l)l · · · Ocr(n)n

n
= L, L, é:{<J)Ocr(l)l · · · Ocr(n)n
f=l crE6n,I
n
-- = L, Ue1
f=l
L,
crE6n,!
E( <J)Ocr(2)2 · · · Ocr(n)n·

Maintenant, considérons la matrice


0 a12 ... U1n

0 ae-1,2 ... ae-1,n


A~= 1 0 0
Û Uf+J,2 ... Uf+J,n

0 an2 ... Unn


et calculons son déterminant de deux manières différentes.
► D'abord par la formule (20.8) : nous voyons que toutes les permutations <J de 6n telles
que <J(l) -=/€donnent un produit de coefficients nul. Donc

det A~; = L, E( <J)Ocr(2)2 .. · Ocr(n)n.


crE6n,!

► Par ailleurs, on peut transformer Af; avec € - 1 transpositions sur les lignes en
0 0
0 a12 ... U1n

A~1 = 0 ae-1,2 ... ae-1,n


Û Uf+J,2 ... Uf+J,n

Û Un2 ... Unn


Ainsi detAf; = (-l)H detAf 1 . Notons a;k les coefficients de Af 1. Alors, toujours par (20.8),

(20.11)

Toute permutation <J E 6n,1 définit par restriction une permutation 0" 1 de {2, ... , n}; cela
permet de considérer 0" 1 comme un élément de 6n-1· Il est évident que <J 1 a la même signature
que <J. Ainsi la somme (20.11) est celle du déterminant de la matrice An E A'tn-l (JK) obtenue
de A par suppression de la première colonne et €-ième ligne. On a donc
a12 U1n

ae-1,2 ... ae-1,n


Uf+J,2 ... Uf+J,n
551

En résumé,

L, t:( cr)a"(l)l · · · UCJ(nln = det Af1 = (-1 )f-l det A~ 1 = (-1 )e-l det Aei ,
CYE6n,f

et par conséquent on obtient la formule de l'énoncé pour le développement de la première


colonne,
n
detA = .L_(-1 )Hae1 detAe1.
f=l
Le cas des autres colonnes se ramène au cas précédent de la manière suivante. Par k -
1 transpositions de colonnes voisines on amène, la k-ième colonne en première place (sans
changer l'ordre des autres colonnes) et on développe selon la formule ci-dessus. On trouve
ainsi n
det A= (-1 )k-l L. (-l)e-laekdet Aek,
f=l
ce qui est la formule de l'énoncé pour les colonnes. ■

Test 20.9. Test 20.10.


Calculer Calculer
1 4 7
3 -2 1 4
2 0 8 -1 2 3 5
3 6 0 5 0 1 0
2 1 2-3

Ill.2.2. Équation d'un hyperplan

Nous allons montrer dans cette partie comment le développement suivant une ligne ou une
colonne permet d'établir facilement une équation d'un hyperplan dans ocn.
Soient Ve = (ve 1, ... , Venl. e= 1, ... , n - 1, des vecteurs linéairement indépendants de ocn.
Si un vecteur (x 1, ... , Xn) est dans l'hyperplan F = vect (v1, ... , Vn-1) alors

XJ Xn
V11
o.
Vn-1,1 • • • Vn-1,n

Le développement suivant la première ligne donne alors une équation de la forme

(20.12)

Au signe près, le coefficient Uj est le déterminant de la matrice (vekl privée de sa j-ième colonne.
La matrice (vekl étant de rang n-1 l'espace engendré par ses colonnes est de dimension n- 1.
Par le théorème d'extraction d'une base, on sait alors qu'il existe n - 1 colonnes parmi les n
qui sont linéairement indépendants. Ainsi les ai ne sont pas tous nuls et (20.12) est l'équation
d'un hyperplan F'. Or F CF' donc F = F'.
552

EXEMPLE 20.13.
◊ Une équation du plan vectoriel dans JR 3 engendré par les vecteurs (2, 1, 0) et (-1, 3, 2)

X 11 Z
2 1 0 2x-411 + 8z O.
-1 3 2

◊ Pour déterminer une équation du plan affine dans JR 3 passant par les trois points A(l, 0, 2),
B(-2, 2, 2), et A(l, 2, 3), on remarque que le point M(x, 11, z) est dans ce plan si et seulement
si AM, AB, AC sont linéairement dépendants. On obtient alors l'équation

x-1 11 z- 2
-3 2 0 2x + 311 - 6z + 10 = 0.
0 2 1

111.2.3. Le déterminant de Vandermonde

Nous allons calculer par récurrence sur n le déterminant suivant, « classique » mais fort utile.

Règle 20.14. Pimr tous Xt, ••. , Xn E Kn, on a

1 X1 X12 ... X1n,-1


l Xz X22 ••• X2n-1
= (20.13)

PREUVE. Notons Yn le déterminant ci-dessus. Il est clair que la formule est correcte pour
n = 1 (on convient qu'un produit vide vaut toujours 1). Supposons maintenant la formule
démontrée pour n - 1 et calculons le déterminant Vn. On a

X2-X1 x~-xf ... x 2- 1 -x1 - 1


X3 - X1 X~ - xf ... X3-l - xï-l

La première égalité ci-dessus est obtenue par soustraction de la première ligne de toutes les
autres, et la deuxième égalité en est le développement suivant la première colonne. Rappelons
que uk- bk = (a - b)(bk-l + bk-la + • · · + buk-2 + ak-l). Nous pouvons donc factoriser
chaque ligne par (Xt - x il. Ainsi

Yn=D TI (Xt-X1l,
l<t:s;n

X1 + Xz xf + X1X2 + X~ XÎ-l + X1- 3X2 + · · · + Xz-l


3
X1 + X3 xf + X1X3 + X~ XÎ-l + X1- X3 + · · · + X3-l
où D=
553

Maintenant, on utilise la première colonne pour« nettoyer» les suivantes. Plus précisément,
on additionne à la k-ième colonne la première multipliée par -x~- 1 , où k = 2, ... , n - 1 . Il
reste
Xz X1X2 + X~ 2
x~- x 2+ x~-3x~ + · · · + x 2-2
X3 X1X3 + xi X~-2X3 + X~-3X~ + ... + xr-2
D=

Ensuite, on utilise la deuxième colonne pour « nettoyer » les suivantes. Plus précisément,
on additionne à la k-ième colonne la deuxième multipliée par 2
-xt
, où k = 3, ... , n - 1 . Et
ainsi de suite. On obtient finalement une expression fonction de x2, ... , Xn, de la forme

x2 n-2
Xz 2 Xz
x2 n-2
X3 3 X3
D=
Xn x2 x~-2
n

Par hypothèse de récurrence, D = TI (xe - xk). Finalement,


2:(kk:(n

Ill.2.4. Règle de Cramer

Nous montrons maintenant comment les déterminants peuvent résoudre des systèmes linéai-
res. Il faut toutefois noter que cette méthode, bien que tentante, n'est guère pratiquable, sauf
peut-être en dimension 2 ou 3, du fait du nombre considérable d'opérations qu'elle requiert
dans le calcul des déterminants. La méthode de Gauss est en général beaucoup plus rapide.

Définition 20.15. Un système de Cramer est un système linéaire de la forme Ax = 1J où


A E Gl(n,lK).

Autrement dit, un système linéaire est de Cramer si et seulement si le nombre d'équations est
égal au nombre d'inconnues et s'il n'y a pas d'équation superflue.

Règle 20.16. (Règle de Cramer;) Tout système de GramerAx = y possède une solùtion
unique qu'on peut calculer comme suit. .On remplace la k-ième colonne de A par y et on note
Ak la matrice ainsi obtenue, pour k = 1, ... ; n: Alors la k-ième com:posantède la 'solution x
est donnée par la forrm.de

detAk
Xk= detA ' k=1, ... ,n.

PREUVE. La matrice A est inversible, donc le système a pour unique solution


554

Notons Ci, ... , Cn les colonnes de A. On a donc 1J = x1C1 + · · · + XnCn. La k-ième colonne
de Ak est donc égale à x1C1 + · · · + XnCn. Par linéarité du déterminant suivant la k-ième
colonne, nous obtenons que

où on a noté Bkj la matrice A dans laquelle on a remplacé la k-ième colonne par la j-ième
colonne Ci. Si j -f. k, la matrice Bki possède deux colonnes identiques et par conséquent
det Bki = O. Si j = k, alors Bkk = A. On obtient alors

detAk = xkdetA.
La formule annoncée en résulte car on peut diviser par det A -1- O. ■

EXEMPLE 20 .1 7. Nous appliquons la règle de Cramer au système

3x1 + 2x2 = b1 ,
{ 4x1 + 3x2 = b2.
Le déterminant de la matrice du système vaut

I! ;I = 3 x 3 - 2 x 4 = 1 -f. 0.

On obtient donc la solution x = (x 1, x 2),

b1 21 3 b11
lb23 14 b2
X1 = I! ;I = 3b1 - 2b2, Xz = I! ;I = 3b2 - 4b1 .

111.2.5. La comatrice

Nous allons démontrer dans cette partie une formule explicite de l'inverse d'une matrice en
fonction des coefficients de la matrice inversible.
Définition 20.18. Soit A E .4"n(1K). On note Afk E .4"n~l (OC) la matrice obtenue par
suppression de la f-ième ligne et k-ième colonne de A. La comatrice de A est la matrice
comA dont le coefficient d'indice(€, k) est (-l)Hk detAfk·

l'tôpositio•{20~J.9~ f()Ur touté m:at~.A E .A'n.(lKJiJtt a


.. At(eom Â) = t{com A) A = (detA} I,..
PREUVE. Soit A = (Ufkl.
► Nous montrons d'abord l'égalité A t(comA) = (detA)IIn. Soient lf la f-ième ligne de A
et Ci la j-ième colonne de t(comA). Il faut montrer que lfCi = bfidetA.
On a lf = (afk)J,;;k,;;n et cj = ((-l)i+k detAjk)J,;;k,;;n· Ainsi
n
(20.14)
555

Sie= j, on retrouve la formule du développement du déterminant de A suivant la f-ième ligne


et on a donc prouvé que leCe = <let A.
Sie -/- j, on considère la matrice A' obtenue à partir de A en remplaçant la j-ième ligne par
le. Cette matrice possède deux lignes égales, d'où <let A' = O. D'autre part, si on développe
le déterminant de A' par la j-ième ligne on trouve précisément la somme (20.14). On a donc
prouvé que leCi = O.
► Pour démontrer l'égalité t(comA)A = (detA)]In, on procède de manière analogue avec
des développements suivant les colonnes. ■

Nous pouvons maintenant donner la formule annoncée.


. 1
Rêgle 20.20... Si AE Gl(n,lK}, alors A-1 = d. A. t(conifA}) .
. et

EXEMPLE 20.21. Soit


011)
A= 101 .
( 110

On a <let A= 2, donc A E Gl(3, OC). Par la règle 20.20, nous obtenons

-11bl lb11) (-1 1 1)


l?bl -1?11 = 1-1 1
-1?11 1?61 1 1-1

Pour des matrices de grande taille cette formule de l'inverse est peu utile car elle de-
mande beaucoup trop de déterminants à calculer; inverser par la méthode du pivot est plus
rapide. Néanmoins la formule est utile pour démontrer certains résultats théoriques, comme
par exemple une caractérisation du groupe Gl(n, Z) qui est plus belle que notre définition de
la page 445. Rappelons que nous y avons défini Gl( n, Z) comme l'ensemble des matrices de
Gl(n, IR) à coefficients entiers et dont l'inverse est également à coefficients entiers.

Propotiition 20.22. Le groupe Gl(n,Z} èst constitué de toutés les matrices n x n à


coefficients entiers dont le. déterminant vaut 1 ou -1 .

PREUVE. Tout d'abord nous remarquons une chose simple mais importante: le déterminant
d'une matrice à coefficients entiers est un entier. Cela se voit directement sur la formule de la
définition du déterminant.
► Soit A dans Gl(n,Z). Alors A et A- 1 sont à coefficients entiers. Donc detA et det(A- 1 )
sont des entiers. Or

c'est-à-dire que <let A est inversible dans Z. Par conséquent, <let A = ± 1 .


► Réciproquement, soit A une matrice n x n à coefficients entiers et telle que <let A = ± 1.
Alors A possède un inverse A~ 1 E Gl(n,IR). La règle 20.20 montre que A~ 1 = ±t(com(A)).
Or la comatrice de A est à coefficients entiers. Par conséquent, A E Gl(n,Z). ■

Remarque. De la même manière on montre plus généralement qu'une matrice à coefficients


dans un anneau commutatif est inversible si et seulement si son déterminant est inversible
dans cet anneau.
556

On devine qu'une arithmétique se dessine sur le groupe linéaire. Nous ne pouvons qu'effleu-
rer le sujet et nous nous contentons de mentionner l'existence d'un sous-groupe remarquable
de Gl(n,Z).

Proposition-définition 20.23, On note Sl(n.,Z} l'ensemble des matrices n x n à cotffi,-


cients dans Z de déterminant 1. Sl(n.,Z) est un sot1S-groupe distingué deGl{n.,Z}.

PREUVE. Sl(n,Z) est le noyau du morphisme de groupes det: Gl(n,Z) --t {-1, l}. ■

Test 20.11. Test 20.16.


Discuter du rang de com(A) en fonction de celui Combien d'éléments contient GL(n,Z)?
de A. Test 20.17.
Test 20.12.
Ces assertions sont-elles vraies ou fausses ?
Soit A E .4é'n(K). Montrer que a. Si tous les coefficients d'une matrice de
com(com(A)) = (detA)nA. Gl{n, JR) sont rationnels, alors tous les coeffi-
Test 20.13. cients de son inverse le sont aussi.
Ces assertions sont-elles vraies ou fausses ? b. Gl{n,Z) = Gl{n,lR) n Atn(Z).
a. tcom(A) = com(tA). Test 20.18.
b. tAcom(A) = (detA)Hn. Les ensembles suivants sont-ils des sous-groupes
Test 20.14. de GL(n,IC)?
Soit (<Pl, cp2, <p2) le système de coordonnées G1={AEAln(ICJI ldetAl=l},
associée à la base
G2 = { A E .4é'n(ICJ I det A E lR*},
~ = ((2,0, 1), {-1, 1,-3), (2, 1,-2)) G3 = { A E .4é'n(ICJ I det A E lR~},
G4 = {A E Aln(ICJ I detA E lR"._},
de JR 3. Montrez que (cp1(v),cp2(v),cp2(v)) E Z 3
Gs = { A E .4é'n(IC) 1 det A E Z\{0}},
pour tout VE Z3.
G6={AE.4é'n(ICJ I detA=±i},
Test 20.15.
G7={A E Aln(ICJ I detA E {±1,±i}}.
Déterminer tous les sous-groupes de IC* dont
tous les élements sont des entiers.

IV. EXERCICES

20.1. 1. Démontrez que detf = ± 1.


2. Démontrez que detf = (-1 )m où l'on a pos'é
Calculez le déterminant de la matrice n x n m = dim Ker {idE + f).

20.3.

Prouver que l'endomorphisme de JR 3 qui a


(x, 11, z) associe
20.2.
(x +11 + z,2x- z +11,311 + x + z)

Soit fun endomorphisme d'un K-espace vecto- est un automorphisme.


riel de dimension fini tel que f 2 = idE-
557

20.4. 2. Soient G1,G2,G3 trois droites vectorielles


distinctes dans JK2 et soit oc E JK*. Montrez qu'il
Soit A une matrice n x n et D une matrice existe au plus une droite vectorielle G, distincte
mxm. des trois autres, telle que
1. Soit

une matrice « triangulaire par blocs » (où C est


un bloc de taille m x n). Montrez que
3. Si on a deux quadruplets de droites vecto-
<let M = <let A <let D . rielles distinctes dans JK2 alors montrez qu'il
existe un automorphisme de JK2 qui envoie le
Comment peut-on généraliser ce résultat à un premier quadruplet sur le second si et seulement
nombre de blocs plus grand? si les birapports des quadruplets sont égaux.
(Indication : utiliser l'exercice 19.2.)
2. Calculer

<let(~).
20.7.
3. On suppose maintenant que n = m. Mon-
trer qu'en général Soient a et x dans K Calculer

<let ( ~~
1 ) # <let A <let D - <let B <let C .
a11 xaa
1a 1 et Ll2 axa
11a aax
20.5.

Soient A et B deux matrices de .4'ln(<CJ. On


pose
20.8.
A-B)
M= ( BA .
Soient a, b, c, k quatre réels. Calculer
1. Prouver que

<let M = det(A + iB) det(A-iB). cos( a) cos( a+ k) cos( a+ 2k)


il cos(b) cos(b + k) cos(b + 2k)
2. A-t-on <let M = det(A2 + B 2 ) ? cos(c) cos(c + k) cos(c + 2k)

20.6.

Le birapport d'un quadruplet (G1,G2,G3,G4) 20.9.


de quatre droites vectorielles distinctes dans JK 2
est le nombre Soit w une racine cubique de l'unité. Prouver
avec un minimum de calcul que

1 w2 w
w 1 w2 0
w2 w 1
où Gj = lK(Xj, 1/jl. j = 1, ... ,4.
1. Expliquez pourquoi le birapport est bien dé-
fini et pourquoi il n'est jamais nul.
558

20.10. 20.12.

Soient a, b, c E lK. Calculer les déterminants Soient a, b E IC. Calculer sous forme factorisée
suivants, (on factorisera les expressions obte- a2 ab ab b2
nues !)
ab a2 b2 ab
11= b2 a2
0 ab ab ab
b2 ab ab a2
111 aOc
bcO
Indication : penser aux blocs ( ~ ~).
1 1 1
112 a b c 20.13.
a2 b2 c2
a+b b+c c+a Soit f l'endomorphisme de IK2[X] défini par
113 a2+ b2 b2+c2 c2+ a2
a3+ b3 b3+c3 c3+ a3 pH P+ P'.

Calculer det(f). Que peut-on déduire?


114 a
b C
b+ca+ca+b 20.14.
a be
115 C ab Soit A E .4l3(1K) une matrice antisymétrique.
b ca Prouver que A n'est pas inversible.
Indications : Developper 113 par multilinéarité. 20.15.
Pour 115 examiner le produit

( b
a b
c ab
c) ( 1 112 )
1. j )
Discuter en fonction de a E 1K l'inversibilité de
la matrice
c a 1 J2 J
a+l 1 1 )
Ma 2 a+2 2
(
3 3 a+3
20.11.

Soient a, b, c, d E IC et 20.16.
4
a a2 a
Soit n 2:: 2 et soit A E .4ln(]R) une matrice telle
b b2 b4
que VM E .4ln(R),
c c2 c4
d d 2 d4 det(A + M) = detA + det M.
1. Montrer que pour tout polynôme de la forme Prouver que A= O.
p = X 4 + cx2X 2 + CX] X+ CX(J on a
20.17.
a a 2 P(a)
b b 2 P(b)
Déterminer une condition nécessaire et suffi-
c c 2 P(c)
sante sur m E 1K pour que l'ensemble des solu-
d d 2 P(d)
tions du système suivant contienne une droite
vectorielle.
2. Montrer qu'il existe un unique polynôme de
la forme ci-dessus et ayant pour racines a, b, c. 2-y + z mx
Le déterminer (sous forme factorisée). 1J 2z my
3. Utiliser le polynôme de la question 2. pour 2y - z mz
factoriser 11.
COMPLÉMENT 1. QUESTIONS D'ORIENTATION

Éléments de topologie de Gl(n, IR)

Si Çg = (e 1 , ••• , en) et Çg' = (e;, ... , e.;,) sont deux bases de lRn, nous savons qu'il existe un
unique automorphisme f de ]Rn qui envoie Çg sur fg', c'est-à-dire tel que f(ek) = e~ pour
k = 1, ... , n. Nous allons nous poser une question beaucoup plus subtile :

Pour deux bases données jjg et Çg' de JRn, peut on déformer de manière continue la famille
jjg en la famille Çg' parmi les bases de !Rn ?

Écrivons les vecteurs des bases Çg et Çg' en colonnes et regroupons les sous forme de matrices
carrées. La question peut se reformuler alors sous la forme beaucoup plus précise suivante :

Soient A et A' dans Gl(n,JR). Existe-t-il des fonctions Atk : [0, 1]----, lR continues, pour
1 :'( k,f :'( n, telles que si on note A(t) = (Ardt)), alors

A(O) = A, A(l) = A', et Vt E [O, 1], detA(t)-/- 0?

Il est clair qu'une condition nécessaire est que det A et det A' soient de même signe.
En effet supposons au contraire que det A > 0 et det A' < 0, par exemple. L'application
[O, 1] ----, lR : t H det A(t) est une fonction continue puisque det A(t) est une fonction
polynomiale des coefficients Ark(t). Par le théorème des valeurs intermédiaires (voir la partie
analyse), il existe donc un réel O < to < 1 tel que det A(to) = 0, ce qui est absurde.
Il est beaucoup plus remarquable que cette condition soit également suffisante.

Propositiotr20.24. Soient A= et A' dans Gl(n,R}. Pour qu'existe des Jonctions conti-
nues An, : [O, t] ~ R, pour 1 ¾ k, t ¾ n, telles

A(O) =A} A(l)= A', et \:tt E [O, t], detA(t) -=I- 0,


avec A(t) = (AnJt)), 'il faut et il suffit que detA et detA' soient de méme signe. Dans ce
cas, detA(t) garde un signe &Jnstant pour tout O¾ t :'( l.

PREUVE. Nous avons déjà montré le sens facile de cette équivalence. Montrons le sens difficile.
► Commençons par considérer le cas où A' = lin et où det A> O. Il s'agit donc de déformer
continûment la matrice A parmi les matrices inversibles en la matrice identité. Nous savons
que toute matrice inversible s'écrit comme un produit fini de matrices élémentaires (voir
chapitre 16) sous la forme A = A 1 · Ap. Nous allons déformer simultanément chacune des
matrices élémentaires de la façon suivante.
- Si Ai= Urk[µ] =lin+ µEtk, avecµ E lR et f-/- µ, alors on pose Aj(t) = Urk[(l - t)µ] =
lin + (1 - t) µEfk pour déformer Ai en lin.
- Si Ai= Ur(À] =lin+ (À-1 )Ere, avec À E JR:;_, on pose Ai(t) = ur[t + (1 -t)À] (car alors
t + ( 1 - t )À > 0, pour tout O :'( t :'( 1), pour déformer Ai en lin.
- Si Ai= Ur[À], avec À E JR~, on pose Aj(t) = ur[-t+ (1-t)À] (car alors -t+(l -t)À < 0,
pour tout O :'( t :'( 1), pour déformer Ai en Ud-1], qui est une matrice diagonale, formée
de 1 et d'un seul -1 pour l'indice (f,f).
- Enfin, si Ai = Uek = lin - Eu - Ekk + Eek + Eke, on pose Ai(t) = lin - Eee - Ekk +
sin(tn/2)(Eee-Ekk)+cos(tn/2)(Eek+ Ekel- Autrement dit, si on considère la sous-matrice
des indices (k, k), (k, i), (e, k) et (e, i), cela revient à déformer la matrice

(~ ~) par (-:!:g:;;? ~~:i!::in , pour O ~ t ~ 1, en la matrice (-6 -~)-


Ainsi Ai (t) réalise une déformation de Uek en une matrice diagonale formée de 1 et
d'exactement de deux -1 sur la diagonale.

Posons
1
pour O :( t :(
2.
Nous obtenons ainsi une déformation de la matrice A sur la matrice A( 1/2) qui est un produit
de matrices diagonales formées de 1 et de -1. Autrement dit

avec t: k E {- 1, 1} pour k = 1, ... , n.

De plus, puisque det A(t) ne s'annule pas, on a det A(l /2) > 0 donc le nombre d'indices k
tels que t:k = -1 est pair. Regroupons les -1 de la diagonale par paire deux à deux disjoints
d'indices {k, i} telle que Ek =Et= -1 et déformons la matrice extraite d'indices (k, k), (k, i),
(i, k) et (i,i)

(-6-~) par ( - :::~;!~ ~~:~;!:D , pour 1/2 ~ t ~ 1, en la matrice Gn.


En procédant ainsi pour chaque paire, nous obtenons une déformation (A(t)) 1; 2 ,,;t,,;l conti.nue
de A(l/2) en l!n. Ainsi (A(t))o,,;t,,;1 est bien une déformation continue de la matrice A en la
matrice l!n.
► Examinons maintenant la cas général. Soient A et A' dans Gl(n, R) deux matrices dont
les déterminants sont du même signe. Alors det(A'- 1A) > O. D'après le point précédent, il
existe une famille continue (A(t))o,,;t,,;l de matrices dans Gl(n,R), toutes de déterminants
strictement positifs, telle que A(O) = A'- 1A et A(l) = lin. Alors la fammille définie par la
formule B(t) =A'• A(t), pour O :( t :( 1, a les propriétés requises. ■

Cette propriété conduit à la notion importante d'orientation. Nous dirons que deux bases
définissent la même orientation s'il est possible de déformer continûment l'une en l'autre parmi
les bases. Nous venons donc de montrer qu'il existe exactement deux orientations possibles
sur Rn.
Définition 20.25. Soit !!il la base canonique de Rn et soit !!Il' une base quelconque. On
rappelle que l'on note Cf%Jf%J' = Mf%Jf%J'(id) la matrice de passage de !!il à !!Il', c'est-à-dire la
matrice des coordonnées des vecteurs de !!Il' dans la base !!il.
1) On dit que !!Il' est une base directe si det Cf%Jf%J' > O.
2) On dit que !!Il' est une base indirecte si det Cf%Jf%J' < O.

Les « feuilles » de Gl(n, JR).


Nous allons utiliser la notion d'orientation pour dresser un «portait» du groupe Gl(n, JR) en
distingant de grandes régions où les éléments se ressemblent dans un sens que nous préciserons.
Définition 20.26.
1) Gl+(n,IR) est l'ensemble des matrices de Atn(IR) de déterminant strictement positif.
2) Gl_(n, IR) est l'ensemble des matrices de Atn(IR) de déterminant strictement négatif.
3) Sl(n, OC) est l'ensemble des matrices de Atn(OC) de déterminant 1.

Les premier et troisième de ces ensembles sont des sous-groupes distingués de Gl(n, OC), le
premier parce qu'il est l'image réciproque du sous-groupe IR~ par le morphisme de groupes

<let: Gl(n,IR) ~IR•,

le troisième parce qu'il est le noyau du morphisme de groupes

<let: Gl(n,OC) ~OC*.

Le groupe Sl(n, OC) est appelé le groupe spécial linéaire.


Nous allons chercher à comprendre les tailles occupées par les ensembles Gl(n, lR), Gl+( n,lR)
et Sl(n,IR) dans l'espace Mn(lR). Le cas n = 1 est facile: M1(lR) = lR, Gl+(l,lR) = lR~ et
GL(l, IR) =IR:'._. On a donc la réunion disjointe

M 1(1R) = GL(l,lR) U {O} U Gl+(l,lR).

M 1 (IR) est consistuée de deux grandes parties, séparées par la partie toute fine {O}. À l'inté-
rieur de Gl+{l, IR), nous avons la partie toute petite Sl(l, lR) = {1}. Elle sépare Gl+( 1, lR) en
deux parties, à savoir ]O, 1[ et ]1, oo[.

Il est remarquable que la situation est la même lorsque n > 1. Pour fixer les idées nous
nous limitons ici au cas n = 2.

► Nous identifions l'espace M 2 {1R) à lR4 via l'isomorphisme d'espaces vectoriels ( ~ ~) H


(a, b, c, d). La partie Z des matrices non inversibles est définie par l'équation ad - be = O.
Nous avons déjà mentionné qu'elle est toute petite dans lR4 : il est très rare de rencontrer une
matrice non inversible.
► Le déterminant d'une matrice est soit positif, soit nul, soit négatif. Ainsi l'espace M2 {1R)
est l'union disjointe de trois parties.

M 2 (1R) = GL(2, lR) U Z U Gl+(2, lR).

► Il faut s'imaginer Z comme une sorte de paroi toute fine qui sépare la partie Gl_(2,lR), où
ad-be< 0, de la partie Gl+(2,lR), où ad-be> O. La situation est similaire à un hyperplan
d'équation
a.a+ l3b +ye + M = 0,
avec ( a., 13, y, 1\) =I= 0, qui sépare JR4 en deux parties, celle où a.a + 13 b + ye + l\d > 0 est celle
où a.a+ 13b + ye + l\d < 0. La seule différence est que Z n'est pas un hyperplan, car Z est
défini par l'équation ad - be = 0 et (a, b, c, d) H ad - be n'est pas linéaire. On appelle Z
une « hypersurface ».
Notre discussion sur l'orientation montre qu'il est possible de «voyager» de manière
continue de n'importe quel point de départ dans Gl+(2,lR) à n'importe quel point d'arri-
vée dans Gl+(2, lR), sans jamais sortir de Gl+(2, lR); et la partie GL(2, lR) possède une
propriété analogue. On dit que les parties Gl+(2, lR) et GL(2, lR) sont connexes par arcs.
En revanche, il n'est pas possible de voyager continûment d'un point de Gl+(2, :IR) à un point
de Gl_(2, :IR) sans jamais traverser la paroi Z.
► L'ensemble Sl(2, :IR), défini par l'équation ad - be = 1, est contenu dans Gl+(2, :IR). On
montre avec les mêmes raisonnements que ci-dessus que Sl(2, :IR) est une hypersurface qui
sépare Gl+(2, :IR) en deux parties, celle formée des matrices de déterminant 0 < ad - be < 1
et celle formée des matrices de déterminant ad - be > 1. De plus, l'équation ad - be = 1
s'écrit encore

En effectuant le changement de variables linéaire

X=a+d . a-d b-e


Y=-- W=-2-•
2 ' 2
nous obtenons l'équation X2 + W 2 - Y2 - Z 2 = 1. Il est facile alors de montrer que Sl(2, :IR)
est aussi connexe par arcs. En effet, soit 't/ = { (x, w) E lR 2 1 x 2 + w 2 = 1} le cercle de centre 0
et de rayon 1. Alors l'application

'{/ X JR 2 -, {(X, w, Y, Z) E JR4 1 X2 + W 2 - Y2 - Z 2 = 1},

(x,w,y,z) H (x✓l +11 2 +z2 ,w ✓1 +11 2 +z2,11,z)


réalise une bijection continue (dans un sens que nous ne préciserons pas) sur Sl(2,JR) dans
les nouvelles coordonnées, de réciproque

{(X, w, Y, Z) E JR4 I X 2 + W 2 - Y2 - Z 2 = l}-, '{/ X JR 2,

(x,w,y,z)H( ✓1 +yx2 +z2' ✓1 +yw2 +z2'11,z).


Ainsi, Sl(2, :IR) a la même «forme» que le «cylindre» '{/ x JR 2 . Il est clair que deux points
quelconques de '{/ x JR 2 peuvent être joints par un chemin continu. La connexité par arcs de
Sl(2, :IR) s'en déduit facilement.
► Si on note ZÀ la partie de .4lz(lR) d'équation ad - be = À, avec À E lR fixé, alors pour
tout À -/- 0, on a la bijection continue Z 1 -, ZÀ : A H MÀA, avec MÀ = ( ~ ?). Il en
résulte aisément que chaque ZÀ est connexe par arcs. Ainsi nous avons le «portrait» d'un
«feuilletage», qui ressemble un peu à celui du mille-feuille en pâtisserie .

.4l2(lR) est constitué de «feuilles» ZÀ, À E :IR, deux à deux disjointes. Chacune d'entre
elles sont connexes par arcs. La feuille Zo est singulière, elle sépare Gl(2, :IR) en deux parties
connexes par arcs, Gl+(2,JR) et Gl_(2,JR). Les feuilles ZÀ, pour À E :IR*, ressemblent toutes
à la feuille particulière Z 1 = Sl(2,JR).
- Pour À > 0, ZÀ sépare Gl+(2,JR) en deux parties connexes par arcs, l'ensemble des
matrices telles que ad - be> À et l'ensemble des matrices telles que O < ad - be< À.
- Pour À < 0, ZÀ sépare Gl_(2,JR) en deux parties connexes par arcs, l'ensemble des
matrices telles que ad - be< À et l'ensemble des matrices telles que À< ad - be< O.
Quatrième partie
ANALYSE

ETTEpartie est conscrée à la mise en forme de la plupart des notions rencontrées dans

C le cadre des études de fonctions, dans les classes secondaires. Les fonctions considérées
sont définies sur :IR et à valeurs dans :IR ou C, il faut donc commencer par préciser
exactement ce que nous entendons par nombre réel et droite réelle.
o Les nombres. Commençons par quelques considérations très naïves sur ce que pourrait
être un nombre réel. Nous sommes habitués depuis l'école primaire à manipuler des nombres
dits décimaux, qui s'obtiennent comme quotients d'entiers par des puissances de 10, soit donc
des nombres de la forme n/lOm, avec n E Z et m E N. Ces nombres peuvent toujours être
écrits de la manière suivante

où les entiers ak, -q ::; k ::; p, sont compris entre O et 9. Cette écriture signifie simplement
que
(Il

Si l'on se donne deux nombres décimaux au moyen de leur développement (Di), il est possible
par exemple d'en faire la somme, ou la différence, ou le produit, au moyen d'opérations posées
d'une manière systématique et effectuée de façon algorithmique.
Les nombres rationnels sont plus complexes. En effet, on sait aussi depuis les classes
primaires que par exemple

i =0,33333333333333
1
6= 0, l 66666666666666 ... , (D2)

les développements obtenus sont alors dits illimités. On se convainc intuitivement du bien
fondé de ces écritures en posant la division 1/3 ou 1/6, et en notant que son reste se répète
indéfiniment. Mais le sens même de ces développements est quelque peu obscur.
Admettons maintenant que l'on décide qu'un nombre réel est simplement une expression
de la forme

où le développement se poursuit indéfiniment, les entiers ak, k E Z, k::; p, étant tous compris
entre O et 9. Une question très naturelle est alors de se demander s'il est possible de définir
une addition sur ces nombres, définie à partir de leurs développements. Reprenons pour cela
les expressions (Dz). On obtient sans difficulté

0, 33333333333333 ... + 0, 166666666666666 ... = 0, 499999999999999 ...

et l'on peut se convaincre que cette suite illimitée de 9 correspond à l'addition de 1 au terme qui
la précède (ou à tout le moins proposer cette règle comme règle opératoire). On obtient alors
1/3 + 1/6 = 0,5 = 1/2, ce qui concorde avec nos conventions d'opérations sur les rationnels.
Mais supposons que nous voulions calculer 1/6 + 1/6. Il se pose alors un problème autrement
plus difficile, celui de la Êretenue. En effet, il est facile d'additionner 0, 756 + 0, 877 = 1,633 :
564

on « commence par la droite », on effectue les sommes des chiffres de même rang terme à
terme, si cette somme est comprise entre O et 9 on considère que l'on a obtenu le terme de
rang correspondant dans la somme, si elle dépasse 10 on lui ote 10, on considère que le résultat
est le terme de rang correspondant dans la somme, et on ajoute 1 au terme du rang précédent
de l'un des deux nombres initiaux (c'est la retenue); on réitère alors la même opération au
rang précédent. Comme le nombre de termes est fini, on arrive au bout d'un nombre fini
d'étapes à une expression de la forme (Di), que nous considérons comme la somme des deux
nombres, ce qui est bien conforme à (I).
Mais cet algorithme ne peut pas être utilisé pour additionner des développements infinis
généraux : on ne peut plus commencer par la droite lorsque des retenues se présentent pour
des termes de rang arbitrairement élevé. On ne peut donc pas procéder aussi naïvement pour
construire une addition, et la notion de nombre définie par leurs développements illimités
semble inadéquate.
Le problème vient clairement de ce que l'on doit manipuler une infinité de termes, c'est-à-
dire que l'on doit sortir du domaine de l'algèbre, où toute opération peut-être effectuée en un
nombre fini d'étapes, pour établir dès le départ des procédés adaptés à cette nouvelle difficulté.
L'idée nouvelle fondamentale, qui peut-être considérée comme à la base de toute la construc-
tion de l'analyse, est celle de limite. Notre intuition de la notion de limite repose certainement
sur le fait qu'il n'est pas possible de trouver un rationnel strictement positif qui soit plus petit
que tous les rationnels strictement positifs, ou en d'autre termes, que (Ql~ n'a pas de plus petit
élément. En effet, suppposons que r E (Ql~ soit le plus petit élément de (Ql~, on voit que r/2 < r
car la différence r - r /2 = r /2 est strictement positive, ce qui montre que r n'est pas le plus
petit élément, puisque r /2 E (Ql~.
On dit qu'une suite (rnlnEN de rationnels a pour limite un rationnel C lorsque pour tout
E E (Ql~, il existe un entier no tel que Irn - Cl < E lorsque n 2 no. On note alors C = limn--->oo r n,
et on dit que la suite converge vers C. Il existe bien sûr des suites qui ont des limites (toutes les
suites constantes par exemple) et d'autres qui n'en ont pas, comme la suite de terme général
r n = (-1 )n. Mais la limite, lorsqu'elle existe, est unique. On peut donc définir sans ambiguïté
la limite d'une suite de rationnels, lorsqu'elle existe.
Cette nouvelle notion permet de donner un sens parfaitement clair aux développements
décimaux illimités que nous manipulions plus haut. Considérons le développement (D 3 ). On
pose
p

Yn = L. aklOk (S)
k=-n

et on décide que le développement (D 3 ) est égal à la limite de la suite de rationnels (r nlnEN,


lorsque cette limite existe.
Mais on peut montrer que cette limite n'existe pas toujours, plus précisément qu'elle
existe si et seulement si le développement est périodique à partir d'un certain rang, c'est-à-
dire s'il existe des entiers k 0 et -v tels que a_k = a-k--v si k 2 k 0. Il apparaît donc que les
développements qui n'entrent pas dans ce cadre correspondent à des nombres non rationnels.
Il serait possible de poursuivre dans cette voie et de donner des définitions de l'addition et
de la multiplication des développements grâce aux suites définies par les termes généraux (S).
Mais c'est un peu lourd, on préfère en général d'autres constructions. On note en particulier
que les suites de la forme (rnlnEN ont en commun une propriété très intéressante, à savoir que
pour tout E E (Ql~, il existe un entier n 0 tel que pour tous indices m et n plus grands que
no, on a lrm - rnl < E. En d'autres termes, l'écart entre deux termes de la suite peut être
rendu arbitrairement petit à condition de choisir les indices de ces termes assez grands. Cette
propriété est ce que l'on appelle la propriété de Cauchy.
565

Il est facile de montrer que toute suite de rationnels convergente possède la propriété de
Cauchy, mais ce que nous venons de voir montre que la réciproque n'est pas vraie.
L'idée est alors très simple. On considère l'ensemble C(/ de toutes les suites de Cauchy de
rationnels, et on veut construire un ensemble !fi, qui sera nécessairement plus gros que Q, dont
chaque élément joue le rôle de limite généralisée pour une certaine suite de"(!_ Il est inutile de
définir précisément cette notion, il suffit de pouvoir dire dans quel cas deux suites de Cauchy
doivent avoir la même limite généralisée. On adopte la convention suivante : deux suites de
Cauchy étant données, elles auront même limite généralisée lorsque leur différence (dont le
terme général est la différence des termes généraux des deux suites) converge et a pour limite
O. On vérifie que ce procédé définit une relation d'équivalence dans"(!_ Une classe d'équivalence
est donc un ensemble de suites de Cauchy qui possèdent la même limite généralisée. Et ceci
permet maintenant de définir notre ensemble !fi comme l'ensemble quotient de "(! par cette
relation d'équivalence, dont on se convainc facilement qu'il vérifie la propriété souhaitée.
Il est ensuite possible de montrer que cet ensemble !fi contient Q, a une structure de corps
totalement ordonné, que Q est un sous-corps de !fi, et que toute suite de Cauchy de rationnels
possède une limite dans R Cet ensemble !fi est traditionnellement noté :IR, on l'appelle la
droite réelle. Et notre procédé initial pour définir les nombres réels a maintenant un sens,
puisque la suite (rn) définie par (S) est une suite de Cauchy. Sa limite dans lR est le réel
représenté par le développement (D 3 ).
Les propriétés de la droite réelle, ainsi que l'étude détaillée des suites réelles et complexes
seront étudiées aux chapitres 21, 22 et 23.
◊ La notion de continuité. La droite réelle étant convenablement construite, de même
que la notion de convergence des suites de réels, il est ensuite possible de fonder de manière
satisfaisante la théorie des fonctions de variable réelle. La première notion à définir est encore
celle de limite pour une telle fonction. Si une fonction f est définie sur un intervalle ] a, b], et à
valeurs dans C, on dit qu'elle possède une limite à droite e E (C au point a lorsque pour tout
t: > 0 (qu'il faut comprendre comme arbitrairement petit), il existe un réel a> 0 (à choisir en
fonction de t:) tel que six E ]a, a+ a[, lf(x) - fi < t:. Intuitivement, les valeurs de la fonction
deviennent de plus en plus proches de eà mesure que la variable se rapproche de a. La limite
à gauche se définit de manière analogue, et on peut se livrer à diverses variations sur la même
notion, qui seront développées au chapitre 25.
Il est alors possible de parler de continuité. Une fonction définie sur un intervalle [a, b]
est dite continue à droite au point a si sa limite à droite en a est égale à sa valeur en a.
La continuité à gauche se définit de la même manière et une fonction est dite continue en
un point x 0 de ]a, b[ lorsqu'elle est à la fois continue à droite en à gauche en x 0 . Enfin, une
fonction est dite continue si elle est continue en tout point.
La continuité est une propriété de régularité des fonctions. La meilleure manière de pré-
senter cette idée est certainement de montrer que le comportement des fonctions continues
peut être complètement décrit au moyen celui de leur restriction à certaines parties de leurs
domaines de définition, ces parties pouvant être très «petites». Par exemple, deux fonctions f
et g continues sur [a, b] qui prennent la même valeur en tout point rationnel de [a, b] prennent
nécessairement la même valeur en tout point de [a, b]. Ce théorème est remarquable dans le
sens où les rationnels forment (dans un sens à préciser) une toute petite partie dans l'ensemble
[a, b]. Ceci est à rapprocher du résultat algébrique affirmant que deux fonctions polynômes
de degré n sont égales sur lR si elles sont égales en n + 1 points.
L'autre résultat remarquable sur les fonctions continues est le théorème des valeurs inter-
médiaires, qui affirme que si une fonction f: [a, b] -) lR est continue, alors f prend toutes les
valeurs comprises entre f(a) et f(b). Une conséquence fondamentale de ce théorème est le fait
566

qu'une fonction continue et strictement monotone définie sur un intervalle est une bijection
de cet intervalle sur son image, qui est aussi nécessairement un intervalle ; et la réciproque
de cette bijection est elle aussi continue. Comme nous le verrons, ce résultat va s'avérer être
crucial pour la construction des fonctions élémentaires, mais nous allons ici en donner une
illustration plus imagée, que nous appellerons le problème de la double promenade.
On considère deux fonctions continues f et g de [O, 1] dans JR, dont les graphes seront notés
'#f et '#9 . Nous imaginerons que ces graphes sont des chemins dans le plan, joignant les points
A à A' et B à B' respectivement. Sur ces chemins ont lieu deux «promenades».

o Promenade 1 : la dame et le chien. Dans la première, une dame D promène son chien C,
avec une laisse de longueur 2f. Elle se déplace sur le chemin '#f, son chien se déplace sur le
chemin '#9 , tous deux partent de A et de B, et arrivent aux points A' et B'. L'expérience
commence à l'instant O et se termine à l'instant T. L'abscisse du point D est une fonction
continue et strictement croissante du temps, et celle de C est continue.
o Promenade 2 : les mexicains. Dans la seconde, deux mexicains M et N, portant des chapeaux
de rayon C, se promènent sur les deux chemins. A l'instant de départ t 0 , M est en A et N est
en B', à l'instant final t 1 M est en A' et N est en B. Au cours de cette expérience, l'abscisse
de M est une fonction continue et strictement croissante du temps, et celle de N est continue.

On demande si les chapeaux des deux mexicains sont obligés de se toucher durant la
seconde promenade. Bien entendu, on a assimilé chaque participant à un point se déplaçant
sur son chemin, et les chapeaux sont des disques centrés sur les points M et N.

A'

0 ....__________.

FIGURE 20.1. Les deux promenades à l'instant initial

La réponse est oui, mais elle n'a rien d'évident. Pour le démontrer, nous allons représenter
ces deux promenades d'une autre manière. On notera Llt l'intervalle de temps durant lequel
se déroule la promenade i, pour i E {1, 2}. Pour i E {1, 2}, nous allons représenter dans le
carré [O, 1] l'image de la fonction <Dt qui à un instant t E Llt associe le couple (x[(t), xf(t))
formé par l'abscisse x[(t) du point se déplaçant sur le graphe '#f et l'abscisse xf(t) du point
se déplaçant sur le graphe '#9 .
Le point crucial est que dans les deux promenades, les ensembles images

sont des graphes. En effet, pour la promenade 1 par exemple, on a supposé que la fonction
x{ est continue et strictement croissante. Donc c'est une bijection de L'.1 1 sur [O, 1]. Notons
E.1 : [O, 1] ---+ L'.11 sa bijection réciproque. Alors si une abscisse x E [O, 1] est donnée, on sait que
l'abscisse x{ de la dame est égale à x à l'instant E, 1 (x), par définition. Il lui correspond donc
une unique coordonnée xr ( t, 1(X)) pour le chien, que J' on porte en ordonnée. On reconnaît
567

bien là la définition d'un graphe de fonction. En d'autres termes, <D, ('11) est le graphe de la
fonction cp 1 : [0, 1] ----t [0, 1] définie par

De la même manière, <1> 2 (.1 1 ) est le graphe de la fonction <pz : [0, 1] ----t [0, 1] définie par
cp 2(x) = Xi(E, 2(x)), où E,2 = (x;)~ 1. Un résultat élémentaire montre que la composée de
fonctions continues est continue, il en résulte que cp 1 et <pz sont continues. Il suffit maintenant
de remarquer que, compte tenu de la forme des deux promenades que nous avons décrite

En effet, par exemple pour la promenade 1, à l'instant 0, x{ = 0, ce qui montre que E,,(0) = 0,
et Xi(0) = 0 = Xi(E, 1 (0)) = cp 1 (0). On raisonne de même en utilisant les conditions initiales
et finales des deux promenades.

FIGURE 20.2. Les graphes de cp, et cpz

Il nous suffit maintenant d'utiliser encore le théorème des valeurs intermédiaires, appliqué
cette fois à la fonction cp = cp 1 - cp 2 . Cette fonction est définie dans [0, ll, un résultat facile
montre qu'elle est continue, et elle vérifie cp(0) = -1 et cp(0) = 1. Le théorème des valeurs
intermédiaires montre donc qu'il existe un élément a E [0, 1] tel que cp(a) = 0, c'est-à-dire
cp 1 (a) = cpz(a).
Posons t 1 = E, 1(a) et t 2 = E.2(a). Aux instants t 1 et t2 respectivement, pour la première
promenade la dame D est à l'abscisse a et le mexicain M est aussi à l'abscisse a, il sont donc
au même endroit sur leur chemin. Et le chien est à l'abscisse cp 1 (a), alors que le mexicain N
est à l'abscisse cp 2 (a). Ces deux abscisses sont égales, donc N est au même endroit que C.
Mais comme la dame promène le chien avec une laisse de longueur 2C, la distance entre D et
C est plus petite que 2C, et comme le rayon des deux chapeaux est C, ils sont obligés de se
toucher, puisqu'ils sont centrés en M = D et N = C. Ceci prouve notre assertion.
o Dérivation et intégration. La notion de limite étrant convenablement fondée, il est
possible de former une nouvelle notion, celle de nombre dérivé d'une fonction en un point.
Pour une fonction f de lR dans JR, et un point a E JR, on définit le taux d'acroissement 'Ta de
f au point a par
'Ta(t) = f(t) - f(a)
t-a
pour t E lR \ {a}. Ce taux d'accroissement est la pente de la corde du graphe de f tracée entre les
points ( a, f (a)) et (t, f (t)). Le nombre dérivé f' (a) de f au point a est par définition la limite
du taux 'Ta au point a, lorsqu'elle existe. Ce nombre dérivé représente donc la pente limite
des cordes précédentes, lorsque le point t se rapproche de a. Les interprétations concrètes de
568

ce nombre dérivé sont multiples. Si par exemple test le temps et f(t) la position d'un mobile
sur une droite, repérée par rapport à un point fixe 0, 'Ta(t) s'interprète comme la vitesse
moyenne du mobile entre les instants a et t, et f'(a) comme la vitesse instantanée à l'instant
a. Du point de vue de la théorie des fonctions, cette définition permet de donner un sens
précis à ce que l'on appelle la tangente au graphe de f au point a, et par là même de poser
convenablement et de résoudre un grand nombre de problèmes dans lesquels cette définition
intervient. On pourra se reporter à l'introduction du chapitre 31, où l'on décrit la mise en
équation du problème de la tractrice, courbe suivie par un mobile tiré de manière tendue par
une corde reliée à un point mobile sur un axe; ou encore au chapitre 28 où l'on montre que la
courbe formée par un fil pesant suspendu par ses deux extrémités à la même hauteur est une
chaînette. L'important est de noter que dans ces deux problèmes la mise en équation n'est
possible que grâce à une interprétation correcte de la notion de tangence.
On dit qu'une fonction est dérivable en un point lorsque la limite précédente existe. On
montre facilement qu'une fonction dérivable en un point est continue en ce point, mais la
réciproque est fausse, comme le montre l'exemple de la fonction x H lxl au point O. Une
fonction dérivable en tout point d'un intervalle ouvert est dite dérivable sur cet intervalle. On
introduit ainsi une nouvelle classe de fonctions, plus régulières que les fonctions continues,
pour lesquelles de nombreuses propriétés peuvent être étudiées.
Dans ce but, l'idée centrale est que pour une fonction dérivable sur un intervalle, on peut
passer de la propriété purement locale de dérivée en un point à des propriétés globales qui
mettent en jeu les valeurs de la fonction en des points éloignés. L'outil central dans cette
direction est le théorème des accroissements finis, qui relie le taux d'accroissement de la
fonction entre deux points a et b aux valeurs de la dérivée aux points compris entre a et b.
Dans le cas des fonctions à valeurs réelles, il est possible de montrer que ce taux d'accroissement
doit être atteint par la dérivée entre a et b, en d'autres termes qu'il existe t E [a, b] tel que
f'(t) = 'Tuf(b). De ceci on déduit de nombreux renseignements si l'on connaît la dérivée en
tout point. Le plus évident est que si cette dérivée est partout nulle, la fonction ne peut pas
varier, puisqu'alors son taux d'accroissement entre deux points doit être nul. De même, si la
dérivée est partout positive, la fonction doit être croissante, etc. Ces idées sont couramment
utilisées dans les classes secondaires, mais elles ne peuvent être correctement établies qu'à
partir du théorème des accroissements finis.
Lorsque l'on connaît la vitesse moyenne d'un mobile entre deux instants, il est immédiat de
retrouver la distance parcourue entre ces deux instants, en multipliant cette vitesse moyenne
par l'écart temporel. La question naturelle est alors de savoir comment retrouver la distance
parcourue par le mobile si l'on connaît à tout instant sa vitesse instantanée. De manière plus
précise, supposons que le mobile soit situé au point O sur la droite, à l'instant t = 0, et que
l'on connaisse sa vitesse v(t) à tout instant t. On veut alors trouver la fonction « distance à
0 », f, nulle au début de l'expérience, telle que la dérivée f'(t) soit égale à v(t) à tout instant
t. Une telle fonction f s'appelle une primitive de v. Là encore, un procédé de passage à la
limite est clairement nécessaire. La première idée est de découper l'intervalle temporel [O, t] au
moyen d'une subdivision donnée O = to < t1 < · · · < tn = t, dont le pas~= max(ti+ 1 - td
est très petit par rapport aux variations de la vitesse, de reconstituer la distance parcourue
en additionnant les distances parcourues sur chacun des intervalles de la subdivision, ce que
l'on fait au moyen du taux d'accroissement entre les intervalles de la subdivion, ce taux
d'accroissement étant supposé bien approché par la vitesse instantanée en un point de la
subdivision. La mise en forme de cette idée est simplement un passage à la limite lorsque le
pas de la subdivision tend vers O.
En disant ceci, nous employons les idées couramment utilisées au XIXe siècle, mais nous
n'avons aucune garantie que le procédé que nous venons de décrire reconstitue effectivement
569

la fonction f souhaitée. Il est clair qu'une condition de régularité doit être imposée à la vitesse
v pour que ces intuitions soient légitimes. On peut montrer que c'est en particulier le cas
lorsque la fonction v est continue. En d'autres termes, toute fonction continue possède une
primitive.
Ces idées sont intimement reliées à un autre problème de grande importance, celui du calcul
des aires. Il est facile de montrer pourquoi, au moins de manière intuitive. Considérons une
fonction v de lR dans JR, que nous supposerons positive pour simplifier. Pour t 2': 0, notons
f(t) l'aire de la région R(t) du plan limitée par l'axe des abscisses, l'axe des ordonnées, le
graphe de v et la droite verticale d'abscisse t. Admettons qu'il existe une fonction « aire ».vl,
définie sur l'ensemble des parties de JR 2 et à valeurs positives, telle que l'aire d'un rectangle
[a, b] x [c, d] soit égale à ( d- c)(b - a) et telle que si une région A du plan est contenue dans
une région B du plan, l'aire du complémentaire .vl(B \ A) = .v/(B) - .vl(A). On en déduit
en particulier que .vl(A) :::; .v/(B) si A C B. Tout ceci n'est pas entièrement justifié, mais
on peut considérer que ces hypothèses sont légitimes dans le cas des parties que nous allons
considérer.
Fixons a 2". O. Alors par hypothèse

f(a + t) - f(a) = .vl(R(a + t)) - .v/(R(a)) = .v/(R(a + t) \ R(a)).

La région R( a+ t) \ R(a) est contenue dans le rectangle [a, a+ t] x [O, sup[a,a+tl v], et contient
le rectangle [a, a+ t] x [O, inf[a,a+tl v], son aire vérifie donc

tinf[a,a+t]V :S .vl(R(a+t) \ R(a)) :St sup v.


[a,a+t]

Si l'on suppose que v est continue, et si t tend vers 0, alors inf[a,a+tJV tend vers v(a) et
sup[a,a+tl tend vers v(a), ce qui montre que

lim f(a + t) - f(a) = lim .vl(R(a + t) \ R(a)) =v(a)


t.-,O t t.-,O t
par encadrement des limites, ce qui est licite.

0
a a+t

FIGURE 20.3. La différence des aires

Nous venons donc de vérifier que la dérivée de f au point a est v( a), ce qui montre que f
est bien une primitive de v. Le chapitre 27 établira ces raisonnements intuitifs sur des bases
solides, essentiellement en fondant la notion d'aire pour une classe de parties du plan bien
construite.
◊ Les fonctions élémentaires. Les notions de continuité, dérivation et intégration que nous
venons d'évoquer permettent à leur tour de construire des fonctions à partir des fonctions
570

rationnelles. Les fonctions dites élémentaires, exponentielle, logarithme, cosinus, sinus, tan-
gente, sinus hyperbolique, cosinus hyperbolique, tangente hyperbolique, peuvent toutes être
construites et parfaitement définies par ce moyen. L'étude de ces fonctions sera donnée en
détail au chapitre 28. Nous allons simplement ici préciser la portée de ces constructions.
Le fonction logarithme ln est définie sur lR';_ comme la primitive de la fonction continue
x H 1/x qui s'annule au point 1. Cette fonction est donc dérivable, de dérivée strictement
positive, il en résulte qu'elle est strictement croissante et continue, et possède donc une ré-
ciproque qui est aussi continue, que l'on note exp. C'est en général ainsi que l'on résume la
construction de ces fonctions. Mais il faut souligner l'extraordinaire raccourci que représentent
ces conventions et notations. Par exemple, en utilisant la notion de somme de Riemann, que
nous verrons au chapitre 27, une écriture moins condensée pour ln x serait

n-1 x-1
ln x lim .L,
= n-->oo n+ k{ x- 1) .
k=Û

Et il sera par ailleurs possible de montrer que pour tout x E lR

expx = lim (1 +
n------,oo
~)n
n
On en déduit donc l'égalité

1 n-1 X- 1 m
X= lim (1
m-->oo
+- lim ' -
m n-->oo L n - --)
+ k( X - 1)
.
k=Û

pour tout réel x. Bien entendu, les fonctions élémentaires permettent d'éviter ce genre de
... lourdeurs. Mais il faut toujours garder présent à l'esprit le fait que les quantités que
l'on manipule en analyse, des nombres réels aux fonctions, des dérivées aux intégrales, sont
toujours définies au moyen de l'outil essentiel de limite.
Chapitre 21
LA DROITE RÉELLE

'ENSEMBLE des nombres réels R sur lequel est fondé toute l'analyse est à la fois proche de

L notre intuition géométrique, puisqu'on se le représente comme l'ensemble des points


d'une droite idéale, et dans le même temps assez difficile à appréhender. Cela est
peut-être dû au fait que dans la pratique, nous ne manipulons que des nombres rationnels .
1

Par conséquent, ces nombres irrationnels, dont le développement décimal est infini et très
complexe, échappent à notre intuition. Pourtant, on ne peut s'en dispenser pour faire des
mathématiques, et ce d'autant plus que la presque totalité de l'ensemble des réels est formée
par les irrationnels (dans un sens qui sera précisé dans la suite du cours).

Historiquement, il semblerait que la découverte des nombres irrationnels soit le fait de


Pythagore et de son école, et qu'à l'époque elle jeta un trouble certain. Par la suite, une
théorie déjà assez élaborée des nombres réels positifs fut donnée par Eudoxe de Cnide au IVe
siècle avant J.-C., et présentée par Euclide dans le livre V de ses Éléments.

Au début du xe siècle, un même mot, celui de adad (nombre), apparaît dans les mathéma-
tiques arabes, aussi bien dans la désignation des nombres rationnels ( al-addad al-muntiqa)
que dans celle des nombres irrationnels ( al-addad al-summa), montrant ainsi que les algéb-
ristes arabes voient une unité dans ces nombres. Les mathématiciens arabes Abu Kamil,
Al-Samaw'al, Al-Karagi, élargissent alors le calcul aux nombres irrationnels et tendent à s'af-
franchir de la vision géométrique des nombres (longueurs, aires, volumes) qui est celle des
Grecs, pour aller vers une vision plus arithmétique : on passe des grandeurs incommensu-
rables aux nombres irrationnels.

Cependant, il fallut attendre le XIXe siècle pour qu'on dispose de constructions formelles
et rigoureuses de ces nombres, abandonnant tout recours à la géométrie. Comme nous le
verrons dans les chapitres suivants concernant les fonctions, une réforme de l'analyse tendant
vers une plus grande rigueur s'amorce au XIXe siècle, sous l'impulsion de Cauchy, Bolzano et
Weierstrass. Toujours est-il qu'au milieu du XIXe siècle, aucune théorie vraiment satisfaisante
des nombres n'a encore été proposée, aucun fondement logique de «l'arithmétique» n'est
disponible.

C'est en particulier pour des raisons pédagogiques (pour construire son cours de calcul
différentiel à l'université de Berlin sur des bases rigoureuses) que Weierstrass décide de combler
cette lacune. En 1863, il propose une construction de la droite réelle. En 1872, deux autres
constructions du même type sont publiées, une première due à Cantor et Heine, et une seconde
due à Dedekind (Stetigkeit und irrationale Zahlen), que nous développerons en complément
de ce chapitre.

Concernant la première d'entre elles, Méray a, dès 1869, fait paraître une construction des
réels qui en est assez proche. Pour la seconde, Dedekind a en fait conçu cette théorie dès 1858

1
Et même, dans la vie de tous les jours, uniquement des nombres décimaux.
L.:. et, là encore, c'est par une réflexion trouvant son origine dans des questions d'enseignement
qu'il y est conduit 2 . La préface de Stetigkeit und irrationale Zahlen, dont suit ici un extrait,
en témoigne.

cul différentiel et je ressentis à cette occa-


sion, plus vivement encore qu'auparavant,
combien l'arithmétique manque d'un fon-
dement véritablement scientifique. A pro-
pos du concept d'une grandeur variable qui
tend vers une valeur limite fixe et notam-
ment pour prouver le théorème que toute
grandeur qui croît constamment, mais non
au-delà de toute limite, doit nécessairement
tendre vers une valeur limite, je cherchai re-
Julius Wilhelm Richard Dedekind fuge dans les évidences géométriques. [... ]
(1831-1916) Mon sentiment d'insatisfaction était alors si
« Les considérations qui font l'objet de ce puissant que je pris la ferme décision de ré-
court essai datent de l'automne 1858. Je fléchir jusqu'à ce que j'aie trouvé un fon-
me trouvai alors professeur à l'École poly- dement purement arithmétique et parfaite-
technique fédérale de Zurich, obligé pour la ment rigoureux des principes de l'analyse in-
première fois d'exposer les éléments du cal- finitésimale. »

Ainsi de plusieurs manières équivalentes, le corps des nombres réels était construit rigou-
reusement à partir de celui des rationnels, eux-mêmes construits à partir des entiers. C'est
donc avec l'axiomatisation des entiers naturels par Peano en 1889 que l'édification de cette
«tour» de nombres, partant de N et allant à IR, s'appuyait enfin sur des bases logiques, ri-
goureuses, purement arithmétiques et indépendantes de tout recours à des « évidences » géo-
métriques.

De gauche à droite, Karl Wilhelm Weierstrass (1815-1897), Georg Ferdinand Ludwig Philipp
Cantor (1845-1918) et Giuseppe Peano (1858-1932)

2
Notons à ce propos que c'est aussi de la volonté d'écrire un ouvrage didactique, qui rompe avec les livres
faisant autorité en analyse au début du xx• siècle et soit fondé sur une parfaite rigueur, qu'est né le groupe
Nicolas Bourbaki.
573

1. LA NÉCESSITÉ D'ENRICHI R LE CORPS DES RATIONNELS

1.1. Le corps Q des rationnels


L'ensemble (Q des rationnels, muni de son addition et de sa multiplication usuelles, est un corps
commutatif On le construit à partir de l'ensemble Z des entiers relatifs (lequel est seulement
un anneau commutatif), selon un procédé de passage au quotient standard en mathématiques,
consistant à le voir comme ensemble de classes d'équivalence de couples d'entiers. Nous ne
-
C'I
.d
détaillerons pas cette construction ici et nous contenterons de l'approche intuitive et fami- ü
lière acquise dans l'enseignement primaire, puis secondaire. Un rationnel est ainsi un nombre
qui peut se représenter comme le quotient de deux entiers (cette représentation n'étant pas
unique 3 ); on sait additionner et multiplier des nombres de ce type et aussi les ordonner.
Précisons ce dernier point : un nombre rationnel, représenté comme une fraction a/b, avec
a E Z et b E N*, est dit positif si le produit ab est un entier naturel. On voit aisément que
cette qualité ne change pas si on représente ce nombre rationnel par une autre fraction da/ db
puisque d 2 est un entier naturel. Si on note P l'ensemble des rationnels positifs, on peut alors
définir une relation d'ordre sur (Q, notée::;, de la manière suivante: six et y sont des éléments
de (Q, x :5 y (x inférieur ou égal à y) si et seulement si y - x E P. On peut alors facilement
vérifier que ceci définit bien une relation d'ordre total sur (Q, qui prolonge celle des entiers.
On sait alors que cette relation d'ordre est compatible avec les opérations d'addition et de
multiplication, en ce sens que l'on peut ajouter membre à membre des inégalités ou multiplier
les deux membres d'une inégalité par un même nombre positif sans l'altérer. On notera de
manière classique x < y pour x :5 y et x -/- y.
On peut alors définir sur (Q la valeur absolue, de la manière suivante.

Définition 21.1. Six E (Q, on définit la valeur absolue de x, notée lxl, par lxl = max(x, -x)
(l'ordre étant total, les éléments x et -x sont toujours comparables, et max(x, -x) est par
définition le plus grand des deux).
On a alors la proposition suivante, dont l'utilisation est permanente.

l}O:S lxl. =
2) lxyl !xlh,I.
S:}tx:+ 1:11 :5 !xi + lyl. 4} llxl -'- IY!l:5 lx - y!.

PREUVE. Par définition de lxl, lxl = x si x 2: 0 et lxl = -x six :5 O. La première propriété


est évidente. La deuxième résulte de la règle des signes. Quant à la troisième propriété, si x
et y sont de même signe, elle est évidente et on a même une égalité; si en revanche x et y
sont de signes contraires, par exemple x 2: 0 et y :5 0, on a
◊ six+ Y 2: 0, lx+ YI = x + Y :5 x -y = lxl + IYI ;
◊ si x+y :5 0, lx+yl = -x-y :5 x-y = lxl + lyl.
La quatrième propriété s'en déduit aisément. ■

Une dernière propriété importante concernant le corps des rationnels est qu'il possède la
propriété d'Archimède (on dit aussi qu'il est archimédien), c'est-à-dire que pour tous rationnels

3
Par exemple i et ½représentent le même nombre rationnel.
574

a> 0 et x 2:'. 0, il existe un entier naturel n tel que x :S na. Pour le voir, écrivons x = p/q
et a= u/v, où p 2:'. 0,q > 0,u > 0,v > 0 sont des entiers. Alors x/a = (vp)/(uq), donc

t vp - x/a = (uq - 1)x/a 2:'. 0, ce qui montre que l'entier n = vp est supérieur à x/a, donc
an 2:'. x (par compatibilité).
Ce caractère archimédien de l'ensemble des rationnels a pour conséquence que l'ordre sur
IQl vérifie la propriété suivante : entre deux rationnels x et y vérifiant x < y, il existe toujours
un rationnel différent de x et de y. En effet, il existe un entier n strictement supérieur au
rationnel positif 1/(-y - x), et donc x < x + 1/n < y.

Test 21.1. Test 21.3.


Vérifier que pour tous x, y de Q avec y-# 0, on Existe-t-il un rationnel strictement positif plus
xi lxl petit que tous les rationnels strictement posi-
a Y= M·
1
tifs?
Test 21.2.
Test 21.4.
Pour x et y dans Q, vérifiant x < y, comparer
Montrer que pour tout rationnel x, il existe un
x 1 et y 1 .
unique entier n tel que n ::; x < n + 1.

1. 2. Le naufrage des pythagoriciens


On attribue généralement la découverte des irrationnels à Pythagore et son école. Pour les
pythagoriciens, un nombre a une nature essentiellement géométrique (longueur d'un segment,
aire d'une figure plane, volume d'un corps). De plus, deux nombres du même type (longueur,
aire, volume) sont toujours commensurables, c'est-à-dire qu'ils possèdent une commune mesure
en ce sens qu'ils sont tous deux multiples d'une même grandeur commune (l'unité). Or il est
possible de montrer, comme nous allons le voir, que la longueur de la diagonale d'un carré n'a
pas la propriété d'être commensurable avec le côté. Cette découverte jeta le trouble dans les
esprits de l'époque. Certaines «légendes» affirment même que les pythagoriciens voulurent
la cacher au reste du monde, et que ceux qui trahirent le secret périrent dans un naufrage ...

En langage plus actuel, comme nous allons le


montrer, vérifier que la diagonale d'un carré
n'est pas commensurable à son côté, revient
à vérifier que le nombre -/2 n'est pas un
nombre rationnel. Cette dernière assertion
résulte par exemple du théorème fondamen-
tal de l'arithmétique qui affirme que tout en-
tier 2:'. 2 se décompose de manière unique ( à
l'ordre près des facteurs) en un produit de
Pythagore (vers 580-520 av. J.-C.)
nombres premiers.

En effet, par l'absurde, si -/2 était rationnel, il s'écrirait sous la forme a/b avec a et b
entiers naturels non nuls et donc on aurait a 1 = 2b 1 ; l'entier n = a1 = 2b 2 aurait donc, selon
qu'on le voit comme a 1 ou comme 2b 1 , un nombre pair de 2 ou un nombre impair de 2 dans
sa décomposition en facteurs premiers, contredisant ainsi l'unicité de cette décomposition.
Il est important de s'arrêter un instant sur la démonstration que nous venons de donner.
Il faut en effet bien voir que le terme -/2 n'y est pas défini. Plaçons-nous dans la peau d'un
membre de l'École pythagoricienne essayant de comprendre l'étrange propriété de la diagonale
d'un carré que nous venons d'évoquer. Considérons un carré dont le côté a pour longueur
l'entier l, ce qui veut dire qu'il est l fois plus long qu'un segment unité. On se demande si la
diagonale de ce carré a elle aussi pour longueur un multiple D de celle du segment unité, soit
2
donc D EN*. Mais ... Pythagore dans son célèbre théorème montre que l + l2 = D , soit
2
2 2 , soit encore 2 = (D/l)2. Ceci entraîne donc que le nombre rationnel D/l a
donc 2l = D
pour carré 2. Or le cœur de la démonstration précédente est précisément qu'il n'existe aucun
rationnel dont le carré est 2 : c'est ce qui troublait les pythagoriciens.
Pour comprendre notre formulation moderne du problème, admettons maintenant l'exis-
tence d'un corps ordonné R de« nombres», contenant Q comme sous-corps, et dont la relation
d'ordre prolonge celle de Q (au sens où elle coïncide avec celle de Q sur les couples de ra-
tionnels). Supposons de plus que pour tout rationnel positif r, il soit possible de trouver un
unique élément s > 0 de R tel que s 2 = r, que l'on note s = Jr. Dans ce nouvel ensemble
R, l'équation 2 = (D/l) 2 est équivalente à D/l = vl, et ce que nous venons de montrer
s'écrit en fait v1 E R \ Q. Bien entendu, un exemple d'un tel corps R est introduit dans les
classes secondaires, c'est le corps des réels, et son utilisation nous paraît maintenant intuitive
et naturelle. Le raisonnement précédent portant sur v1 nous est donc facilement compréhen-
sible : nous interprétons maintenant la longueur de la diagonale du carré de côté l comme un
nombre, D = vll, et comme v1 n'est pas rationnel, let D ne peuvent être commensurables.
Mais une telle construction n'était pas à la portée des pythagoriciens, et on mesure à quel
point la définition claire des quantités qu'ils considéraient pouvait poser des problèmes.
Bien que le corps des réels soit d'une utilisation fréquente, sa construction n'est pas simple.
Nous allons donner dans ce chapitre une idée intuitive de sa nature. Nous verrons plus loin,
en complément au chapitre 22, une construction, due à Cauchy. Mais avant d'introduire les
notions nécessaires à une véritable formalisation des notions, et pour permettre au lecteur de
former son intuition des divers problèmes, nous allons donner quelques exemples supplémen-
taires de même nature que celui que nous venons de considérer.
Les nombres réels et les symboles que nous utilisons dans ces exemples ont le sens usuel
introduit dans les classes secondaires, rappelé dans la première partie de ce livre.
On peut utiliser l'idée précédente, basée sur l'unicité de la décomposition en facteurs
premiers, pour prouver l'irrationnalité d'autres nombres.

EXEMPLE 21.3.
► Nous allons d'abord vérifier que pour tout entier premier, fo est irrationnel. Raisonnons
par l'absurde. Si fo était rationnel, donc de la forme u/b, a et b entiers, on aurait pb = u ,
2 2

d'où une puissance de p impaire dans le membre de gauche et paire dans celui de droite,
contredisant ainsi l'unicité de la décomposition en facteurs premiers.
► Plus généralement, montrons que sin E N, vn est rationnel si et seulement si n est un
carré parfait (de la forme m ,2
où m EN). En effet, sin est un carré parfait, vn est un entier
donc c'est un rationnel. Inversement, par l'absurde, sin n'est pas un carré parfait, alors l'un
au moins de ses diviseurs premiers, que nous noterons p, apparaît avec une puissance impaire
dans la décomposition en facteurs premiers de n. Si donc vn est rationnel, il s'écrit u/b
avec a et b entiers d'où nb 2 = u 2 , ce qui contredit à nouveau l'unicité de la décomposition
en facteurs premiers, le nombre p étant nécessairement affecté d'une puissance impaire dans
le membre de gauche et d'une puissance paire dans celui de droite.
► Montrons enfin que les nombres v1 + v'3 et v1 + v'3 + v'6 sont irrationnels. En effet, si
T = v1 + v'3 était un rationnel, on aurait en élevant au carré 5 + 2 v'6 = r 2 et donc v'6 serait
576

rationnel, ce qui n'est pas, compte tenu de ce qui précède et du fait que 6 n'est pas un carré
parfait. Posons s = v1. + J3 + v6. Si s était un rationnel, on aurait v1. + J3 = s - v6,
d'où en élevant au carré, 5 + 2v6 = s 2 + 6- 2sv6, ou encore 2(s + l)v6 = s 2 + l. Mais
alors, nécessairement s + 1 = 0 sans quoi v6 serait rationnel. Or s > 0, donc on ne peut
avoir s + 1 = O.
Voici maintenant un autre exemple utilisant la fonction logarithme.
EXEMPLE 21.4.
► Montrons que log 10 2 est irrationnel. En effet, s'il existait deux entiers non nuls a et b tels
que ln 2/ ln 10 = u/b, on aurait b ln 2 = a In 10 c'est-à-dire 2b = 2°5°, ce qui contredirait
l'unicité de la décomposition en facteurs premiers. Plus généralement, on voit facilement que
pour n E N*, log 10 n est soit entier, soit irrationnel.

Test 21.5. Test 21.6.


Montrer que les nombres Que peut-on dire des nombres x + y et xy dans
les cas suivants?
v2 ln3 ijz a. x et y sont rationnels.
y'}' ln2 et
b. x et y sont irrationnels.
sont irrationnels. c. x est rationnel et y est irrationnel.

I.3. L'ensemble des rationnels est lacunaire


La découverte des pythagoriciens montre que les seuls rationnels ne peuvent rendre compte de
toute la réalité des nombres vus comme longueurs géométriques4 . Si l'on imagine une droite
(idéalisée!) avec un point marqué origine O et un autre point marqué I donnant l'unité de
longueur, et si l'on souhaite appeler nombre la longueur de n'importe quel segment d'origine
0 (que l'on identifiera avec le point de la droite obtenue en reportant cette longueur à partir
de O), ce qui précède montre que le report de toutes les longueurs rationnelles laisse des
« trous », des lacunes, puisque le report de la longueur de la diagonale d'un carré de côté 1
aura son extrémité sur un point qui n'est pas un rationnel.
Pour mieux formaliser ce caractère lacunaire des rationnels nous aurons besoin de quel-
ques rappels sur les relations d'ordre et les notions associées : majorant, minorant, borne
supérieure, borne inférieure.
Définition 21.5. Soit E un ensemble muni d'une relation d'ordre total notée :::;, et soit A
une partie non vide de E.
1) Un élément M de E est appelé un majorant de A si pour tout élément x E A, on a
x :S: M. Un élément m de E est appelé un minorant de A si pour tout élément x E A, on a
m:S:x.
2) La partie A est dite majorée si elle admet un majorant; elle est dite minorée si elle admet
un minorant.
3) Un élément µ appartenant à A et vérifiant x :S: µ pour tout élément x E A est appelé
un plus grand élément de A. Un élément -v appartenant à A et vérifiant -v :::; x pour tout
élément x E A est appelé un plus petit élément de A.

4
Nous ne nous intéressons qu'aux nombres positifs pour l'instant.
577

On vérifie facilement que si la partie A possède un plus grand élément, alors il est unique.
En effet, supposons que µ et µ' soient deux plus grands éléments de A. Alors par définition
même µ::::; µ' et µ' ::::; µ. Il en résulte bien µ = µ', puisque ::::; est une relation d'ordre. On
peut donc parler sans ambiguïté du plus grand élément de A. De même, la partie A possède
au plus un plus petit élément.

EXEMPLE 21.6. ....


► Considérons la partie A= {-8, -5, 2, 12} de (Z, ::::;). Tout entier inférieur ou égal à -8 est IN
un minorant de A, et tout entier supérieur ou égal à 12 est un majorant de A. En fait -8 ..d
ü
est le plus petit élément de A tandis que 12 est le plus grand élément de A.
► Plus généralement, toute partie finie de (Z, ::::;) possède un plus grand élément et un plus
petit élément. Toute partie de (N, ::::;) possède un plus petit élément.
► La partie A= (Q)~ de ((Q), ::::;) ne possède pas de plus petit élément.

Définition 21.7. Soit E un ensemble muni d'une relation d'ordre total notée::::;, et soit A
une partie non vide de E. Un élément µ* de E sera appelé une borne supérieure de A si µ*
est un majorant de A et si c'est le plus petit élément de l'ensemble des majorants de A. Un
élément>'* de E sera appelé une borne inférieure de A si .,. est un minorant de A et si c'est
le plus grand élément de l'ensemble des majorants de A.

On vérifie facilement que si A possède une borne supérieure, alors elle est unique. Même
propriété pour la borne inférieure. On parle donc sans ambiguïté de la borne supérieure ou de
la borne inférieure d'une partie, lorsqu'elle existe.
La définition d'une borne supérieure ou d'une borne inférieure peut se réécrire de la manière
suivante, plus formalisée, qui est aussi un moyen pratique de les reconnaître.

Borne supérieure et inférieure


µ* est la borne supérieure de A si et seulement si
l)VxEA,x::::;µ*,
2) VA E E, si (A< µ*) alors (:lx E A, A< x).
>'* est la borne inférieure de A si et seulement si
1) Vx E A, .,. ::::; x,
2) VA E E, si (A>>'*) alors (:lx E A, x < A).

EXEMPLE 21.8. Nous avons déjà remarqué que la partie (Q)~ C (Q) n'a pas de plus petit
1 élément. Mais elle possède une borne inférieure, qui est O.

Notons que pour qu'une partie A admette une borne supérieure (resp. inférieure), il est
nécessaire, par définition même, qu'elle soit non vide et majorée (resp. minorée).
La proposition suivante donne un exemple d'une partie non vide et majorée de (Q), sans
borne supérieure. Cet exemple est à la base de la construction du corps des réels par la
méthode des coupures de Dedekind.
578

Proposition 21.9. La partie A de l'ensemble totalement ordonné {Q, i) définie par

A = {x E Q, x2 i 2},

est non vide et maf<>rée mais n'admet pas dê borne supérieure.


PREUVE. En effet, cette partie est clairement non vide (elle contient 1 par exemple) et est
majorée (par 2 par exemple). Supposons par l'absurde qu'elle admette une borne supérieure
µ E IQ). On ne peut avoir µ 2 = 2, comme nous l'avons déjà remarqué. Par suite, soit µ 2 < 2
soit µ 2 > 2. Supposons que µ 2 < 2. Pour tout n E N*, le nombre µ + 1/n appartient à iQ) et
est strictement supérieur à µ. Si on prouve que µ + 1/n E A pour un certain n, ceci contredira
le fait que µ majore A. Or
(µ+ 1/n) 2 = µ 2 +2µ/n+ 1/n2 :S µ 2 + (2µ+ 1)/n.
Comme iQ) est archimédien, et 2- µ 2 > 0, il existe n EN* tel que 2µ + 1 :S n(2- µ 2 ) et donc
tel que (µ + 1/n) 2 :S µ 2 + 2 - µ 2 = 2, ce que nous souhaitions montrer.
Si maintenant µ 2 > 2, par un raisonnement analogue il est possible de trouver n E
N tel que (µ - 1/n) 2 > 2, avec de plus µ - 1/n > 0 (remarquer que µ > 1), ce qui
montre que µ - 1/n est encore un majorant de A, et donc µ n'est pas le plus petit, ce qui
est contradictoire. ■

Il. LA DROITE RÉELLE


Nous sommes maintenant en mesure d'introduire de manière formalisée le corps des réels,
dont les parties précédentes montrent l'intérêt, et d'en étudier les premières propriétés.

ILL La droite réelle


Pour l'instant nous nous limitons à énoncer un théorème d'existence, dont nous donnerons la
preuve en complément.
Théorème 21:10. Il existe un corps commutatif amtenànt Q oomme sous-corps, muni
d'une relation d'ordre total prolongeant celle de Q, compatible avec les ()[Jérati<>ns, et dans
lequel toute partie non vide et majorée possède une borne supérieure.
Ce corps, dont on peut de plus montrer l'unicité à isomorphisme près, sera appelé corps
des réels, ou encore droite réelle, et sera noté (]R, +, •) (on note aussi x la multiplication). La
relation d'ordre sur lR sera notée :S, le fait qu'elle prolonge celle de iQ) signifie qu'elle coïncide
avec la relation d'ordre de iQ) sur tous les couples de rationnels. Nous adopterons par ailleurs à
partir de maintenant toutes les notations usuelles pour les lois et relations sur R Par exemple,
si a et b sont des réels, a > b signifie b 2: a et b -/= a.
On résume la propriété d'existence d'une borne supérieure pour toute partie non vide et
majorée de lR en disant que lR possède la propriété de la borne supérieure. C'est donc cette
propriété qui distingue essentiellement le corps des réels du corps des rationnels. Elle est
équivalente à la propriété de la borne inférieure (toute partie non vide et minorée possède
une borne inférieure) par symétrisation (multiplication par -1) des parties. Nous en verrons
de multiples applications dans les chapitres qui suivent. Nous allons maintenant expliciter les
propriétés de la droite réelle.
579

La droite réelle (IR, +, ·, :::; )

1) (IR,+, ·) est un corps commutatif, Q est un sous-corps de R


2) La relation ::::; est une relation d'ordre, qui prolonge celle de Q.
3) La relation ::::; est compatible avec les lois + et ·, c'est-à-dire que :
- pour tous réels x, y, z, si x ::::; y, alors x + z ::::; y + z;
- pour tous réels x, y, z avec z > 0, six::::; y, alors x · z::::; y· z.
4) IR possède les propriétés de la borne supérieure et de la borne inférieure : toute partie
non vide et majorée possède une borne supérieure, toute partie non vide et minorée
possède une borne inférieure.

Conformément à l'usage on note souvent xy le produit x · y de deux réels. Nous allons


dans la suite de ce chapitre détailler les conséquences que l'on peut tirer de ces propriétés.
Auparavant, allons un peu plus loin dans la description de quelques parties remarquables de
la droite réelle. Nous avons vu que le corps des rationnels est un sous-corps de R L'ensemble
des réels contient donc en particulier, comme Q, l'ensemble N des nombres entiers naturels,
l'ensemble Z des nombres entiers relatifs, et l'ensemble llll des nombres décimaux, c'est-à-dire
des rationnels de la forme a/lOn, a E Z, n E N. Ces sous-ensembles ont des propriétés
de stabilité pour l'addition et la multiplication : la somme et le produit d'entiers (resp. de
décimaux) sont entiers (resp. décimaux).
En revanche le sous-ensemble IR\ Q des irrationnels ne se comporte pas bien vis-à-vis des
opérations : il n'est pas stable par l'addition et la multiplication. Par exemple, nous savons
que ,,/2. est irrationnel, alors que ,,/2. - ,,/2. = 0 et ,,/2. ,,/2. = 2 sont entiers. Notons que nous
ne connaissons encore que peu d'exemples de nombres irrationnels, nous en verrons quelques
autres au chapitre 23. Nous verrons dans le cours de L2 qu'il est aussi possible de montrer
que les nombre 7t et e sont irrationnels. Signalons cependant que la preuve de l'irrationnalité
d'un nombre donné est en général un problème très ardu, et donne lieu à des questions encore
non résolues aujourd'hui.
Mais cette difficulté à citer des irrationnels ne doit pas nous laisser penser qu'ils sont
exceptionnels dans l'ensemble des nombres réels. Bien au contraire, ils forment un « très
gros » sous-ensemble de la droite réelle. Pour donner une idée vague de ce fait, on peut dire
que si on choisit un réel au hasard, on a toutes les chances de tomber sur un irrationnel (dans
un sens qui sera précisé dans le cours de L3)
Dans l'ensemble IR\ Q, on peut encore distinguer des sous-ensembles d'irrationnels parti-
culiers comme celui des nombres algébriques et celui des nombres transcendants. On dit qu'un
irrationnel est algébrique s'il est racine d'un polynôme à coefficients rationnels, c'est le cas de
,,/2. par exemple qui est racine de X2 - 2. Les nombres transcendants sont ceux qui ne sont
pas algébriques. On peut prouver, par exemple, que 7t et e sont transcendants.

Il.2. La partie entière d'un réel


Comme cela a déjà été dit auparavant, on peut se représenter les réels comme les points d'une
droite idéalisée sur laquelle on a fixé une origine qui correspond au réel O. Nous allons mainte-
nant essayer de préciser cette intuition, et nous allons commencer par montrer la proposition
suivante.
580

Prppositiôn'.21:11. l,e •corps dés réêls est archirn~îên, ·C 'est.:.iJ,-âfre que pqui'J1Jfiî~~tll;;êt
tout b E R';., on peut trouver un entier n Ê N tel que nb > a. · ·· · · · ·
PREUVE. Supposons que pour tout n E N, nb :S: a. Alors la partie N = {nb In E N} est
non vide, et majorée par a. Elle possède donc une borne supérieure, que nous noterons ex. Par
définition, puisque b > 0, il existe un élément x de N qui vérifie x 2: ex - b. Par définition de
la partie N, il existe n E N tel que x = nb. On obtient donc nb 2: ex - b, et donc

(n+2)b =nb+2b 2: (ex-b) +2b = ex+ b > ex

où les égalités et inégalités font intervenir les diverses propriétés de R que nous avons rap-
pelées. Mais (n + 2)b est un élément de N, par définition, et l'inégalité précédente contre-
dit le fait que ex est un majorant de N. L'hypothèse initiale est donc fausse, ce qui prouve
notre proposition. ■

On dit aussi que le corps des réels possède la propriété d'Archimède. Si on se donne sur la
droite idéalisée une unité de mesure, cette propriété d'Archimède traduit simplement le fait
qu'on peut dépasser toute longueur en mettant bout à bout, un certain nombre de fois, des
segments de longueur égale à l'unité de mesure. En utilisant cette propriété, la proposition
suivante prouve qu'on peut encadrer toute longueur à l'aide de cette unité.

Proposition 21.12; Soit a> O. Six ER, il existe un ùnique k E Z tel que

ka :S: x < (k + 1}a.


PREUVE. Commençons par prouver l'unicité d'un tel entier. Pour cela supposons qu'il existe
deux entiers k et h vérifiant ha :S: x < (h + 1) a et ka :S: x < (k + 1) a. Nous avons h :S: x/ a <
k + 1 et k :S: x/ a < h + 1. On déduit alors de la première inégalité que h :S: k et de la seconde
k :S: h. Nous avons donc h = k.
Montrons maintenant qu'un tel entier existe. Pour x ER, notons Ex l'ensemble des entiers
n tels que n :S: x/a. Supposons x 2: 0, alors Ex est non vide car il contient 0 et si on applique
la propriété d'Archimède à 1 et x/a, on voit que Ex est majoré. L'ensemble Ex possède donc
un plus grand élément, puisque c'est une partie finie de N. Notons k = max Ex, par définition
k vérifie k :S: x/a < k + 1, d'où la propriété en multipliant par a> O.
Si maintenant x < 0, l'ensemble Ex est majoré par 0 et il est non vide grâce, cette fois,
à la propriété d'Archimède appliquée à -x/a. En appelant k son plus grand élément, nous
avons k :S: x/a < k + 1, d'où la propriété. ■

On peut imaginer sur la droite réelle l'ensemble aZ = {na I n E Z} comme une «échelle» in-
finie d'unité a. Ce qui précède montre que tout réel est contenu entre deux échelons consécutifs
de cet ensemble. Si l'on fixe a= 1 et si on applique à un réel x la proposition 21.12, on obtient
un unique entier p vérifiant p :S: x < p + 1. L'entier p est le plus grand entier inférieur ou égal
à x, il sera noté [x].

Définition 21.13. Soit x un réel. Il existe un entier [x], appelé la partie entière de x, qui
est caractérisé par les propriétés

[x] E Z, [x] ::; x < [x] + 1 .

Le réel {x} = x - [x] est dit partie fractionnaire de x.


581

EXEMPLE 21.14.
► Comme 7 est strictement entre 4 et 9, alors v7 est strictement compris entre 2 et 3. On
déduit alors que [vl] = 2.

Test 21.7. Test 21.8.


Soit E la fonction définie par E(t) = [t]. La Soit D la fonction définie par D(t) = {t}. La
fonction D est-elle périodique ? Est-elle paire ? .....
fonction E est-elle périodique ? Est-elle paire ? IN
Tracer le graphe de E. Tracer le graphe de D. .d
u

II.3. Inégalités entre nombres réels


Le but de cette partie est de montrer quelques exemples d'utilisation de la structure de corps
totalement ordonné de la droite réelle. En d'autres termes, nous allons manipuler des inégalités
entre nombres réels, en évitant de faire des erreurs. Nous en avons d'ailleurs rencontré déjà
un certain nombre dans ce qui précède, et invitons le lecteur à une relecture attentive pour
les justifier entièrement. Toutes les manipulations d'inégalités sont basées sur la compatibilité
entre la relation d'ordre et les lois + et ·.
Commençons par quelques règles très simples. Il est possible d'ajouter membre à membre
deux inégalités, mais soustraire deux inégalités conduit toujours à des absurdités. Montrons
ce que nous entendons par là. Considérons les deux inégalités suivantes
x :S y, x' :S y'.
L'inégalité obtenue en faisant la somme membre à membre est donc
x+x' :S y +y'.
Montrons qu'elle est correcte. Par compatibilité de l'addition et de la relation d'ordre nous
avons d'abord x+x' :S y +x'. Ensuite, toujours par compatibilité, nous avons y +x' :S y +y'.
Enfin, par transitivité de la relation d'ordre, nous en déduisons x + x' :S y+ y' ce que nous
voulions montrer. Notons que nous n'avons utilisé que la compatibilité et la transitivité de la
relation d'ordre, il est donc possible d'additionner de la même manière des inégalités strictes.
De la même manière, on peut additionner des inégalités faisant intervenir les symboles 2
ou>.
En revanche, la soustraction d'inégalités est absurde. Par exemple, on a 6 :S 8 et 3 :S 9.
La soustraction membre à membre conduit à 3 :S -1, ce qui est faux. Dans le même ordre
d'idée, on ne peut bien entendu pas additionner des inégalités faisant intervenir des symboles
différents (par exemple 4 :S 5 et 7 2 3). On invite le lecteur à faire une mise au point analogue
pour les multiplication d'inégalités.
Donnons maintenant un premier exemple moins élémentaire de manipulation d'inégalités.
EXEMPLE 21.15.
► Soient x et y deux réels. Montrons tout d'abord que sin est un entier, alors [x+n] = [x] +n.
En effet, en ajoutant n à chaque membre des inégalités [x] :S x < [x] + 1, on obtient
[x] + n :S x + n < [x] + n + 1. L'entier [x] + n est bien la partie entière de x + n.
► Montrons maintenant que [x] + [y] :S [x + y] :S [x] +[y]+ 1. En effet, si on somme membre
à membre les inégalités [x] :S x < [x] + 1 et [y] :S y < [y] + 1, on obtient [x] + [y] :S x + y <
[x] + [y] + 2. Par définition de la partie entière de x + y, la première inégalité montre que
[x] + [y] :S [x + y]. En tenant compte de [x + y] :S x + y, la seconde inégalité prouve que
[x + y] < [x] + [y] + 2. Nous avons donc [x + y] :S [x] + [y] + 1.
582

Test 21.9. Test 21.10.


Trouver deux réels x et y tels que Trouver deux réels x et y tels que

[x] +[y]< [x+y]. [x + y] < [x] + [y] + 1.

Rappelons maintenant que la valeur absolue d'un réel, comme celle d'un rationnel, se
définit par
't/x E IR, lxl = max(x,-x).
Comme dans le cas des rationnels, on a le résultat suivant.

Proposition 21.16. Soient x et y deux éléments ile R.


1) 0~ lx:!; Z) lxyfk !,cllyJ.
3) lx+ vl ~ M+fvl. 4)flil ;.;:.tô!I $' lx-yt.

Les inégalités 3) et 4) forment les deux parties de ce qu'il est convenu d'appeler l'inégalité
triangulaire.
À titre de dernier exemple, nous allons montrer une inégalité fondamentale entre nombres
réels.

Proposition Zt.17. (Inégalité dé ~uc;:by--Sèh~); .


Soit n EN*, et soient x1, ... , Xn, YJ, .•. ,Yn des réels. Alors

PREUVE. Nous allons montrer cette inégalité de deux manières différentes.


1) Il est toujours utile, pour se faire une idée, d'envisager un problème sous son jour le plus
simple. En l'occurrence, on peut se demander comment montrer l'inégalité lorsque n = 2 (le
cas n = 1 étant trivial). Elle s'écrit alors

Faisons la différence du deuxième membre et du premier membre, on obtient

soit encore (X1Y2 - X2Y1 )2 qui est bien un réel positif. On peut alors chercher à généraliser
cette approche pour tout n. On vérifie alors (voir le chapitre 6) que

cf. cf.
i=l
xf)
i=l
yf)-(f. XtYtf =
i=l
L_
1::;i<j::;n 1::;i<j::;n
2
(xfiJf+xf1d-2xtXjYtYil = L_ (XtYj-Xjyt) ?: 0

ce qui prouve l'inégalité cherchée.


2) On note d'abord que pour tout réel ex, I:~1 (CXXt +yt) 2 ?: O. L'expression développée
n n n
<D(cx) = (L 2
xf) cx + 2( L XïYt) ex+ ( L yf)
i=l i=l i=l
583

est donc toujours positive. Deux cas sont possibles.

- SiL.~=l xf = 0, tous les termes Xi sont nuls, et l'inégalité que l'on veut montrer est triviale.
Si L.:i xf > 0, <D((X) est un trinôme du second degré en (X. Comme il est positif, son
discriminant doit donc être négatif ou nul, ce qui s'écrit précisément

.....
C'I
..d
u
et prouve notre inégalité. ■

II.4. Les intervalles de lR


Dans tout ensemble totalement ordonné, on peut définir la notion d'intervalle. Nous le ferons
ici dans le cas particulier de la droite réelle, qui est de loin le plus utile dans la pratique
courante.
Définition 21.18. Soient a et b deux réels vérifiant a S b. On pose

[a, b] = {x E lR I a S x Sb}, [a,b[={xElR, asx<b},


]a,b]={xElR, a<xsb}, ]a, b[= {x E lR, a< x < b},
] - oo, a)= {x E JR, x S a}, ] - oo, a[= {x E JR, x < a},
[a, +oo[ = {x E JR, x ~ a}, ]a, +oo[ = {x E JR, x > a},
lR =] - oo, +oo[.

Un intervalle de lR est une partie de l'une des formes précédentes. On dit que ]a, b [ est un
intervalle ouvert, que [a, b] est un intervalle fermé, et que [a, b[ et ]a, b] sont des intervalles
semi-ouverts. On dit que] - oo, a[ et ]a, +oo[ sont des intervalles ouverts, et que] - oo, a]
et [a, +oo[ sont des intervalles fermés.

Notons en particulier que 0 = ]a, a[ est un intervalle, et que les singletons {a} = [a, a]
sont des intervalles.

Proposition 21.19~ Une-partie I de Rest un interval:lé si et seulement si wur tous x;y


dans I avec x < y, alors [x, y] C I.

PREUVE. Si I est un intervalle, l'assertion est claire par transitivité de la relation d'ordre.
Réciproquement, soit I une partie vérifiant la condition de la proposition. On note d'abord
que si I est vide, I est un intervalle, et c'est terminé.
Supposons maintenant la partie I non vide et bornée, et notons a = inf I et b = sup I.
Alors ]a, b[ C I. En effet, si u E ]a, b[, par définition des bornes inférieure et supérieure, il
existe x E I tel que a S x < u et il existe y E I tel que u < y S b. Il en résulte que u E [x, y],
donc u E I puisque [x, y] C I.
Par ailleurs, si x > a alors x (/: I, puisque a est un majorant de I. De même, si x < b,
alors x (/: I. Il en résulte que I C [a, b].
Comme ] a, b [ C I C [ a, b], on a donc les possibilités suivantes : I =] a, b [, I = [a, b [,
I = ]a, b] ou I = [a, bl, donc I est un intervalle.
584

Supposons maintenant I non vide, minorée et non majorée. Alors si a = inf I, on voit que
pour tout u > a, il existe x E I tel que a :S: x < u, par définition de la borne inférieure, et il
existe y E I tel que u < y puisque I est non majoré. On en déduit que u E [x, y] C I, donc
u E I. Donc I = [a, +oo[ ou I = ]a, +oo[.
Si I est non vide, majorée et non minorée, alors on montre de la même manière que I est
de la forme] - oo, b] ou] - oo, b[. Enfin, on montre que si I est non vide, non minorée et non
majorée, nécessairement I = lR. ■

On déduit facilement de la proposition précédente le corollaire utile suivant.

Corollaire 21.20.
1) Sf Lest 1in
intt!~l~. non 'Ili.de,
1-oô,siipl[ôùl;;:.:~oi:liSÛplJ.· .. .
m,a,joré et non tni1ll>ré de R" alors I est. de la forme
. . . . .
2) Sq. est ufiint~le no,n ¼Jidef mîtk>ré 'èt n~~. tfwj~ di/fi./ -~,iits'f ~t de la forme
Jinfl,+®[pitr fwf t:~f. · . ..
3) Si l'ést• un inler11aUë n~·fJide, mi,noré et majfké, ·îl•'estâe Îfl7orint3/]infl;supl{,
[fufl; supl], HmI, siip I} ôtl, lînft, SÛp If. ,·· .
Il est toujours possible d'échanger des intervalles bornés de même nature par une applica-
tion affine très simple.

PREUVE. C'est une simple vérification. ■

Terminons cette partie par une représentation très utile des intervalles de lR.

Propomtlon '21.22~ Soiênt a etb dèwt réels tels que û s b. Alors


· · 1a, bJ = {Ù ~ll« +tblt Ê·[o, lJ}={d +t(b--- âJ t t ~-[O, 11}.

PREUVE. C'est une application immédiate de la proposition précédente. ■

Il existe bien entendu des représentations analogues pour les intervalles semi-ouverts bornés
ou ouverts bornés. Terminons en signalant qu'un intervalle à la fois fermé et borné, c'est-à-dire
de la forme [a, bl, avec ( a, b) E ~ 2 , a :S: b, est encore appelé un segment.

Test 21.11. Test 21.13.


Les parties {x E JR, x2 ::; 2} et {x E JR, x2 > l} Donner les bornes inférieures et supérieures des
sont-elles des intervalles ? intervalles [O, 1], [O, 1[, JO, 1], ]O, 1[.
Test 21.12.
Test 21.14.
A quelle condition la réunion de deux inter-
valles est-elle un intervalle ? Que peut-on dire Déterminer toutes les formes possibles pour un
de l'intersection de deux intervalles? intervalle fermé de lR.
585

Test 21.15. Test 21.16.

Peut-on transformer l'intervalle [O, 1[ en l'inter- Peut-on transformer l'intervalle [O, 1 [ en l'inter-
valle ]O, 1] par une application affine? valle [O, +oo[ par une application affine?

II.5. Adhérence, intérieur, ouverts, fermés, voisinages.


.....
Nous allons donner définir maintenant quelques propriétés des sous-ensembles de JR, qui nous IN
seront très utiles tout au long de cette partie d'analyse. Elles seront revues et généralisées ..d
u
dans les cours de L2 et de L3, elles annoncent ce que nous appellerons la topologie, qui analyse
les relations de "voisinage" entre les points d'un ensemble.

Définition 21.23. Soit A une partie de R


1) On appelle intérieur de A le sous-ensemble de lR formé par les points x E A tels qu'il
existe un intervalle ouvert I de lR tel que x C I C A. On note Int A ou A l'intérieur de A,
O

on a donc par définition Int A C A. Un élément de Int A est dit intérieur à A.


2) On appelle adhérence de A le sous-ensemble de lR formé par les points x tels que pour
tout intervalle ouvert I de lR contenant x, An I =/- 0. On note AdhA ou A l'adhérence de
A. On a donc par définition AC AdhA. Un élément de AdhA est dit adhérent à A.

Notons que les inclusions IntA CA et AC AdhA peuvent être strictes. Par exemple, on
voit facilement que l'intérieur de l'intervalle [O, lJ est l'intervalle JO, 1 [, alors que l'adhérence
de l'intervalle JO, 1 [ est l'intervalle [0, lJ.

PREUVE. Montrons la première égalité. Soit a E A. Alors tout intervalle ouvert contenant
a rencontre A, donc aucun tel intervalle n'est contenu dans AC, donc a (/:. Int AC, ce qui
montre que a E (IntAc)c. Donc AC (IntAc)c. Réciproquement, soit a E (IntAc)c. Alors
a(/:. Int AC, ce qui signifie qu'aucun intervalle ouvert contenant a n'est contenu dans Ac_ Donc
tout intervalle ouvert contenant a rencontre A, ce qui montre que a E A. Donc (Int A cl c C A,
et on a montré la première égalité. La seconde se montre par passage au complémentaire. ■

Définition 21.25. Soit A une partie de R On dit que A est ouverte (ou est un ouvert)
lorsque pour tout x E A, il existe un intervalle ouvert I de lR tel que x E I et I C A. On dit
que A est fermée ( ou est un fermé) lorsque son complémentaire Ac est ouvert.

L'exemple suivant fait le point sur la terminologie déjà utilisée pour les intervalles, qui
pouvait paraître étonnante dans le cas des intervalles non bornés.

EXEMPLE 21.26.
► Soient a et b dans JR, a :S b. Alors l'intervalle ouvert Ja, b[ est un ouvert de JR, et
l'intervalle fermé [a, bJ est un fermé de R
► Soit a E R Alors les intervalles [a, +oo[ et J -oo, aJ sont des fermés de JR, et les intervalles
Ja, +oo[ et J - oo, a[ sont des ouverts de R
► Notons aussi que 0 et lR sont à la fois ouverts et fermés.

On laisse la démontration de la proposition suivante au lecteur, à titre d'exercice.


586

Proposition· 21/J/l.
< ' - -- _- --

1) La rwnion r.l'ùnefamille (O, )Je.I ·d'ouutrts de R ést 'Uri/ouvert de lll;


2) L'iritèrsectiêri de de:tii: ]ermés de R esîun fermé de R.
3) Une partie est fermée si et seulement si elle est égale à son adhérence, une partie est
-0uverte si et seulement si ~ile est ég4',e à son intérieur.

Terminons par une dernière notion ensembliste, d'utilisation très fréquente.

Définition 21.28. Soit a E lR. Une partie de lR est un voisinage de a si elle contient un
intervalle ouvert contenant a.

Par exemple, l'intervalle (0, 1[ est un voisinage de tout point de JO, 1[, mais ce n'est pas un
voisinage de O.

Propositio~ 21.29. Une partie de R est ouverte si ét seul$"llént sCc'est im vtlisirtage de


chacun de ses points.

PREUVE. En effet, supposons que A est un voisinage de chacun de ses points. Soit, pour
tout x E A, un intervalle ouvert lx tel que X E lx et lx C A. Alors

ce qui montre que A est la réunion d'une famille d'intervalle ouverts, qui sont ouverts dans
JR, donc c'est un ouvert par la proposition 21.27. ■

II.6. La propriété de densité


La notion de densité que nous introduisons maintenant est très importante en analyse. En
effet, il sera nécessaire dans nos constructions futures de travailler avec des ensembles difficiles
à décrire (par exemple des espaces vectoriels de dimension infinie), mais dans lesquels une
notion de distance entre deux points est présente. Une partie A d'un tel ensemble E est dite
dense dans cet ensemble lorsque pour tout point x de E il est possible de trouver un point a
de A arbitrairement proche de x. Ceci se traduit de la manière suivante. Si d(x, y) désigne la
distance entre deux points x et 1J de E, supposée appartenir à JR+, on veut pour tout c > 0
pouvoir trouver a E A tel que la distance d(x, a) soit plus petite que c. Dans de nombreux
cas, on peut trouver une partie A très simple à décrire, qui a cette propriété de densité, ce
qui permet en retour de mieux comprendre les éléments de E ainsi que sa structure.
Bien entendu, beaucoup de constructions sont encore nécessaires pour en arriver à ces
considérations. Mais l'idée de densité et son utilisation trouvent déjà de nombreuses illus-
trations sur la droite réelle. Nous allons maintenant donner de cette densité une définition
formelle, valable seulement dans JR.

Définition 21.30. Une partie A de lR est dite dense dans lR (ou simplement dense) lorsque
tout intervalle ouvert non vide de lR contient un élément de A. De manière équivalente, la
partie A est dense si et seulement si A = lR.
587

Cette définition est bien compatible avec le commentaire précédent. En effet, nous verrons
que la distance la plus naturelle entre éléments de lR est simplement la valeur absolue de
leur différence, soit d(x,-y) = lx - -yl. Dans ces conditions, supposons la partie A dense
dans lR suivant notre définition. Alors, si x est un réel donné, et si E: > 0 est donné, on
considère l'intervalle I = ]x - E:, x + d. Il existe un point -y de A contenu dans I, on a alors
d(x, -y)= lx--yl < r, ce qui montre que A est dense suivant notre approche intuitive initiale.
Montrons maintenant une proposition fondamentale. ......
N
,.d
Proposition :U.3l. L'ensem§le Q,des mtionrrels est dense dans R.
u

PREUVE. Soit I = ]a, b[ un intervalle ouvert non vide. Comme lR est archimédien, il existe
n EN tel que n > 1/(b - a), soit encore 1/n < b - a. Alors si m = [an], on obtient

m m 1
-<a<-+-
n - n n

ce qui montre que a< .!!l


n
+ .l
n
< b, donc que le rationnel .!!l
n
+.lest
n
dans ]a, b[. L'intervalle I
rencontre donc (Q, ce qui montre que (Q est dense dans R ■

C'est la densité de (Q dans lR qui sera exploitée de multiples manières dans le chapitre sur
l'approximation des réels. Nous allons aussi voir un autre exemple de parties denses dans la
partie suivante.

Pr-ep0$itiqn.21~32. .L 1ensemble lll\Q.des irrationnels est dense danr; R.·

PREUVE. Soit I = ]a, b[ un intervalle ouvert non vide. Comme précédemment, il existe un
entier n tel que n > 1/(b - al, soit encore 1/n < b - a. Alors si m = [an]/v12, on obtient

v12m v12m 1
--<a<--+-
n - n n

ce qui montre que a < v'2m n


+ .l
n
< b, donc que l'irrationnel v'2m
n
+ .ln est dans ]a, b[. Donc
l'intervalle I rencontre lR \ (Q, ce qui montre que lR \ (Q est dense dans JR. ■

EXEMPLE 21.33.
► Nous avons vu que (Q est dense dans JR, c'est-à-dire que tout intervalle ouvert non vide
de lR contient un rationnel. Ceci montre que ij = JR, et là encore on voit que l'inégalité est
stricte. On voit de même que lR \ (Q = R
► On voit aussi que Int (Q = 0. En effet, comme tout intervalle ouvert de lR contient un
irrationnel, par le point précédent, on voit que aucun point de (Q ne peut être contenu dans
un intervalle ouvert contenu dans (Q. De même, on montre que lnt (JR \ (Q) = 0. On peut
aussi utiliser la proposition 21.24 et voir que

Int(Q = (Adh (JR \ (Q)ic = 0, Int (JR \ (Q) = (Adh (Qt = 0.


588

II. 7. Les sous-groupes additifs de IR


Un sous-groupe additif de lR est une partie de IR, contenant 0, stable par addition et par
passage à l'opposé. Par exemple Z ou plus généralement l'ensemble des «multiples» d'un
réel a, soit aZ = {ak, k E Z}, sont des sous-groupes de lR. Un autre exemple est fourni par
l'ensemble Q. En revanche, nous avons signalé que l'ensemble des irrationnels n'est pas un
sous-groupe.
Un sous-groupe de la forme aZ est dit monogène, puisqu'il est engendré par a. En revanche,
remarquons que Q n'est pas monogène puisque entre deux éléments de Q se trouve toujours
un autre élément de Q, propriété que ne possède à l'évidence pas un sous-groupe monogène.
Nous allons énoncer un théorème qui montre que les exemples que nous venons de mentionner
sont les deux seuls cas de figure possibles.

Théorème 21.34. Si G est un sous-groupe âe IR àloirs soit il existe un réelstriétemènt


positif a tel que G = aZ, et donc le sous groupe est monogène, soit G est dense dans R.

PREUVE. Soit G un sous-groupe de lR non réduit à zéro. Alors G contient nécessairement un


élément strictement positif. En effet, six=/ 0 appartient à G alors -x est aussi dans G, et l'un
des deux éléments x ou -x est strictement positif. Par suite, l'ensemble P = {x E G, x > 0}
admet une borne inférieure. Notons a = inf P; on a a ~ O. Nous allons distinguer deux cas
selon que a > 0 ou que a = O.
◊ Premier cas : a > O. Dans ce cas, on a a E G car sinon, par définition d'une borne
inférieure, il existerait un élément x E G tel que a < x < la; à nouveau par définition d'une
borne inférieure, il existerait -y E G tel que a < -y < x. Mais alors on aurait x - -y E P et
x - -y < a ce qui contredirait la définition de a.
Ensuite, puisque G est un sous-groupe de IR, donc est stable par addition et passage à l'opposé,
on a clairement aZ C G. Inversement, six E P, posons n 0 = [x/a]. On a alors clairement
noa ~ x < (no+ 1 )a. Mais alors 0 ~ x - n 0 a < a et comme x - n 0 a appartient à G, c'est
que x - noa = 0 par définition de a. Ainsi, x = n 0 a. Si maintenant x E G et x < 0, alors
-x E Pet d'après ce qu'on vient de voir, il existe n 0 EN tel que -x = n 0 a, donc x = -n0 a.
On a ainsi prouvé que G = aZ.
◊ Deuxième cas : a = O. Nous allons voir que dans ce cas, G est dense dans lR c'est-à-dire
que si <X, 13 E lR avec <X< 13, alors il existe x E G tel que <X< x < f3. Si <X et f3 sont de signes
contraires, c'est clair puisque O est alors entre les deux. Quitte alors à passer à l'opposé,
puisque G est stable par cette opération, on peut supposer O ~ <X < f3. Posons dans ce cas
e = f3 - <X > 0; par définition d'une borne inférieure (ici a = 0), il existe -y E G tel que
0 < -y < e. Posons no = [ix/-y]. Alors (n 0 + 1)-y E] <X, f3 [, comme on le vérifie facilement, et
(no+ 1)-y E G puisque -y E G, donc G n]ix, f3[ / 0. ■

EXEMPLE 21.35.
► Soient u, v deux réels strictement positifs. L'ensemble

G ={nu+mv (n,m) E Z2 }
1

est clairement un sous-groupe de (:IR,+), on vérifie d'ailleurs que c'est le sous-groupe engendré
par la partie {u, v}, nous le noterons aussi< u, v >. D'après ce que nous venons de montrer, il
est donc soit dense, soit monogène. Précisément, il est monogène (resp. dense) si et seulement
si u et v sont commensurables (resp. incommensurables), c'est-à-dire si leur rapport est
rationnel (resp. irrationnel). En effet supposons par exemple u et v commensurables. Il
589

existe alors un rationnel p / q > 0 (avec p et q premiers entre eux) tel que v = up / q. Par
suite
G = {nu+ mv 1 (n, m) E ::t:2} = {nu+ mup/q 1 (n, m) E Z::2}
donc
G ={(qn+pm)u/q 1 (n,m) E Z 2 }.
Le théorème de Bézout nous montre que {qn + pm (n, m) E Z 2} = Z, puisque pet q sont
1

premiers entre eux. Donc G = aZ avec a = u/ q. Ainsi G est monogène.


Inversement, supposons G du type aZ, a > O. Alors, en particulier, il existe des entiers
p et q strictement positifs tels que u = up et v = uq. Mais alors u/v = p / q E <Q et donc u
et v sont commensurables.
Ainsi par exemple, le sous-groupe < 1/2, 1/3 > est monogène, alors que le sous-groupe
< 1 , v'2 > est dense.

EXEMPLE 21.36. Un réel est dit dyadique lorsqu'il est de la forme n/2m pour n E Z et
m EN. On note çg l'ensemble des réels dyadiques. Montrons que çg est dense dans R
► L'ensemble çg est un sous-groupe de R En effet O E çg, et si d = n/2m et d' = n' ;2m'
sont deux réels dyadiques, avec par exemple m' :::: m

est encore un réel dyadique.


► çg n JR~ a pour borne inférieure O. En effet, il suffit de voir que pour f > 0, si m E N
vérifie m :::: 1/t:, comme 2m :::: m, 1/2m < f. Comme 1/2m E çg n JR~, ceci montre que
inf çg n JR~ < t:, donc inf çg = O. Notons qu'un tel m existe bien puisque lR est archimédien.
En vertu du théorème précédent, on voit donc que çg est dense dans R

Test 21.17. Test 21.18.


Soit G = {2nv12+3nv121 (m, n) E Z 2}.Vérifier Soit G = {2n In E Z}. G est-il un sous-groupe
que G est un sous-groupe de R. Est-il dense ou de R?
monogène?

II.8. La droite numérique achevée IR


La droite numérique achevée est obtenue en adjoignant à lR deux éléments, que nous avons
déjà rencontrés dans l'écriture des intervalles non bornés, -oo et +oo. On a donc

iR = lR U {-oo, +oo}.
On définit sur ÏR une relation d'ordre, que nous noterons encore :S:, qui coïncide avec la relation
d'ordre usuelle sur JR, et qui se prolonge de la manière suivante

Vx E JR, -oo < x < +oo ; -oo :S: -oo, +oo :S: +oo.

Ainsi, :S: est une relation d'ordre total sur ÏR, et l'ensemble ÏR possède un plus grand élément
+oo et un plus petit élément -oo. On voit que si l'on adopte les notations d'intervalles valables
sur tout ensemble totalement ordonné, il y a exactement quatre type d'intervalles dans ÏR

[ex, (3), [ex, (3[, )ex, (3), )ex, (3[,


590

2
où ( ex, 13) E ÏR avec ex ::::; 13. Notons aussi qu'un intervalle de la forme] a, +oo[ dans ÏR coïncide
avec la partie de lR que l'on note de la même manière. Il en va de même pour tous les types
d'intervalles non bornés de R
Il est aussi possible de faire des conventions permettant dans une certaine mesure de
prolonger les lois + et • de lR à la droite numérique achevée. On pose

Vx E lR, X + (+oo) = (+oo) + X = +oo; X + (-oo) = (-oo) + X = -oo ;


(+oo) + (+oo) = +oo, (-oo) + (-oo) = -oo;
Vx E JR~, X· (+oo) = (+oo) •X= +oo, X · ( -OO) = (-OO) ·X = -OO ;

Vx E lR".._, X. (+oo) = (+oo). X= -oo, X. (-oo) = (-oo). X= +oo;


(+oo)(+oo) = (-00)(-00) = +oo, (+00)(-00) = (-oo)(+oo) = -oo.

Notons que les lois ainsi prolongées ne sont pas partout définies, on ne peut pas par exemple
écrire (-oo) + (+oo) ou (+oo) · O.

II.9. Le corps CC des nombres complexes


La droite réelle étant maintenant convenablement établie, on peut considérer la construction
usuelle de C, qui ne relève que de considérations algébriques, comme parfaitement fondée. En
particulier, on rappelle les propriétés suivantes.

Le corps CC des nombres complexes

1) Sur le groupe (JR 2 , +), on définit une loi x (encore notée ·) par

(a,b) x (a',b') = (aa' -bb',ab' + a'b).

Muni des lois + et x, JR 2 est un corps commutatif, noté (C, +, x ).


2) L'application cp: lR-----, C définie par cp(x) = (x, O) est un morphisme injectif de corps.
On identifie lR à cp(JR) et on considère donc que lR c C.
3) On pose i = (0, 1) E C. Alors tout z E C s'écrit de manière unique sous la forme
z = a + ib, avec (a, b) E JR2 . L'ensemble C a une structure de lR espace vectoriel de
dimension 2, de base (1, i).
4) Pour z = a+ib E C, on posez= a-ib (conjugué de z) et lzl = (zz) 112 = ✓a2 + b 2
(module de z).
5) L'application z H z de C dans C, considéré comme lR espace vectoriel, est linéaire
et vérifie z • z' = z • z' pour (z, z') E C 2 .
6) Le module vérifie les propriétés suivantes, pour (z, z') E l['.2 :

lzl = o# z= o, lzz'I = lzllz'I, lzl = lzl, llzl - lz'II ::::; lz- z'I ::::; lzl + lz'I.
La dernière propriété s'appelle l'inégalité triangulaire.
591

III. EXERCICES

21.1. est-il rationnel ou irrationnel?

L'ensemble 21.5.

1. Simplifier l'écriture du réel ......


a-t-il une borne supérieure dans Q? CSl
..d
21.2.
a= {!20 + 14v'2 + {/20-14v'2 u

en trouvant une équation du troisième degré sa-


Soient A et B des parties non vides de IR. On
tisfaite par a et en cherchant les racines de cette
définit
équation.
A+ B ={a+ b, a E A, b E B}. 2. Faire de même avec le réel
Montrer que si A et B sont bornées, alors A+ B
l'est aussi et que b = {/sv2 + 7 - {/sv2 - 7.
inf(A + B) = inf A+ infB
et 21.6.
sup(A+ B) =supA+supB.
Soit f : IR ----t IR une fonction réelle dèfinie sur IR.
Soit

21.3. G ={TE IR, v'x E IR, f(x + T) = f(x)}.

Soient A et B des parties non vides de IR+. On 1. Montrer que G est un sous-groupe de IR. On
définit l'appelle le groupe des périodes de f.
AB= {ab, a E A, b E B}. 2. Donner des exemples de fonctions où G est
monogène puis des exemples où G est dense.
Montrer que si A et B sont majorées, alors AB
l'est aussi et que
21.7.
sup(AB) = supAsup B.
Soient a 1, • • • , Un des nombres réels stricte-
Est-ce encore vrai si A et B contiennent des réels
ment positifs. Donner une condition nécessaire
négatifs? et suffisante pour que le sous-groupe de (IR, +)
engendré par ces nombres, c'est-à-dire
21.4.

Le réel
soit dense dans R
Chapitre 22
LES SUITES RÉELLES OU COMPLEXES

E chapitre consacré à l'étude des suites sera l'un des plus longs et fondamentaux de

C cette partie du programme d'analyse, ce qui reflète l'importance de la notion, tant


du point de vue théorique que pratique.
L'idée de suite est présente très tôt dans l'histoire des mathématiques, dès !'Antiquité.
Mais il faut attendre la fin du xrxe siècle pour voir émerger la définition actuelle, proposée
par G. Peano, d'une suite comme fonction définie sur l'ensemble N des entiers naturels.
La notion de suite ne peut être dissociée de celles de mouvement, de quantité en devenir,
de dynamique, d'objet concret évoluant vers quelque objet idéal. On ne peut pas vraiment
faire un historique de l'idée en tant que telle, car il n'y a pas à proprement parler de théorie
des suites qui évolue au cours des âges. Il y a plutôt une multitude de problèmes variés dans
lesquels elles interviennent, sinon comme fin, du moins comme moyen. De plus, la notion de
suite est intimement liée à celle de «série», c'est-à-dire au problème de la sommation d'une
infinité de termes.
Donnons quelques exemples choisis, évidemment très fragmentaires, pour illustrer notre
propos. Archimède est l'un des premiers à utiliser des suites pour résoudre des problèmes de
quadrature, ce dernier terme signifiant étymologiquement la construction d'un carré de même
aire qu'une surface donnée 1 . Aujourd'hui, il faut tout simplement entendre par là le calcul de
l'aire de la surface en question.

Archimède développe une méthode dite centes de périmètres, obtenues, pour l'une,
d'exhaustion, qui consiste, pour calculer une par des polygones réguliers inscrits et, pour
telle aire, à encadrer la surface entre deux l'autre, par des polygones réguliers circons-
autres dont la différence des aires est aussi crits, dont il fait croître le nombre de côtés.
petite que l'on veut. Dans son De la quadra- Il obtient ainsi l'encadrement suivant :
ture de la parabole, il établit par exemple la
proposition suivante :
« un segment quelconque compris par une
droite et une parabole est égal à quatre fois
le tiers d'un triangle qui a la même base et
la même hauteur que le segment. »
Pour ce faire il est amené à travailler avec
une suite géométrique de raison 1/4, dont il
doit sommer les termes, en évitant toutefois
la somme infinie et en se contentant de ma-
nipuler la suite des sommes finies.
Un autre exemple dû à Archimède est
son calcul approché de 7t par la méthode dite
des isopérimètres, consistant à approcher le
périmètre d'un cercle par deux suites adja- Archimêde (287-212) avant J.-C.

1
Par exemple, l'aire d'un disque.
594

Un autre exemple célèbre et significatif nous est donné au début de notre ère par Héron
d'Alexandrie pour le calcul approché des racines carrées 2 • Cet algorithme se trouve dans son
manuscrit intitulé Les Métriques, rédigé en grec et retrouvé à Constantinople au début du
xxe siècle. Il fait état des connaissances des mathématiques grecques de l'époque et il y figure
en particulier la fameuse formule dite de Héron, donnant l'aire S d'un triangle en fonction de
ses côtés a, b, c, à savoir S = Jp(p - a}(p - b}(p - c) (où p désigne le demi-périmètre du
triangle). Prenant par exemple un triangle de côtés a = 7, b = 8 et c = 9, Héron obtient
pour aire v1720. Pour calculer une valeur approchée de cette grandeur, avec une précision
arbitraire, il propose la méthode suivante :
« Puisque 720 n'a pas de côté rationnef3, nous extrairons le côté avec une très petite diffé-
rence comme il suit. Comme le premier nombre carré4 plus grand que 720 est 729 qui a pour
côté 27, divise 720 par 27; cela fait 26 et 2/3; ajoute 27 : cela fait:' 53i; prends-en la moitié :
cela fait 26K Ainsi donc le côté de 720 sera très proche de 26K En fait, 26~ multiplié
par lui-même donne 720SG, de sorte que la différence est 1/36. Si nous voulons rendre cette
différence inférieure encore à 1/36, nous mettrons 720SG trouvé auparavant, à la place de 729
et, en procédant de la même façon, nous trouverons que la différence est beaucoup plus petite
que 1/36. »
Ce faisant, Héron écrit 26 2 < 720 < 27 2 puis encadre v1'fi6 entre 720/27 = 26 + 2/3 et
27 dont il prend la moyenne, puis recommence. En traduction moderne, il propose la suite
itérative
Un +Un) , Uo =27,
lln+l = l1 (720

dont nous montrerons un peu plus tard qu'elle a effectivement pour limite le réel v1'ff6.
Une autre suite célèbre dans l'histoire est manière générale (en supposant l'absence de
celle de Fibonacci, prototype d'un système mortalité), Un+2 = Un+1 +Un. Le comporte-
dynamique discret et modélisant la repro- ment de cette suite (dite suite de Fibonacci)
duction des lapins! À l'instant initial n = 0 lorsque n devient grand est alors gouverné
nous avons un couple de lapins nouveau- par le mythique nombre d'or cl> = 1+j5.
nés qui ne pourra se reproduire qu'à par-
tir de l'âge de deux mois (n = 2, l'unité de
temps est le mois) pour donner alors chaque
mois un autre couple de lapins, chacun de
ces couples de lapins se reproduisant selon
le même schéma. Si on note Un le nombre
de couples de lapins à l'instant n, on a alors
uo = 1, u, = 1, u 2 = 1 + 1 = 2 et de Léonard de Pise, dit Fibonacci ( vers
1170-1250)
Avertissement. Dans ce chapitre, pour donner des exemples explicites, nous ad-
mettrons les propriétés usuelles des fonctions élémentaires. Ces propriétés seront
démontrées au chapitre 28.

2
Nous l'étudierons en détail dans le chapitre consacré aux fonctions dérivables.
3
Ne pas oublier la vision géométrique des nombres (des grandeurs) qu'ont les Grecs; 720 est vu ici comme un
carré au sens géométrique du terme et extraire la racine carrée de ce nombre, c'est donc trouver le côté d'un
carré d'aire 720.
4
Il faut entendre par là carré parfait, c'est-à-dire le carré d'un nombre entier.
5
Il ne s'agit pas ici, et dans la suite, d'un produit mais d'une somme; lire 53j comme cinquante trois deux
tiers, c'est-à-dire 53 + 2/3.
595

1. SUITES BORNÉES, SUITES MAJORÉES, SUITES MINORÉES


[fJ

Dans tout ce chapitre, lK désigne lR ou C. ~


Définition 22.1. Soit I C N une partie infinie de N. Une suite à valeurs dans :OC, d'ensemble
t8
d'indices I, est une application de I dans :OC. g
[fJ

La suite est dite réelle si elle est à valeurs dans lK = JR, complexe si elle est à valeurs ~
Cl)

dans lK = C (noter que ces deux définitions ne s'opposent pas : une suite réelle est aussi une ...
,Cl)

[fJ
suite complexe). On note (UnlnEI la suite qui, à l'entier n, fait correspondre le nombre u,,_. Le 1l
nombre u,,_ est appelé le terme d'indice n de la suite (UnlnEI· Par souci de simplification et -~
par commodité, on ne considérera ici, sauf indication contraire, que des suites à valeurs dans j
[fJ

lK définies sur N tout entier. On laisse au lecteur le soin de vérifier que les résultats que nous
C'Ï
allons énoncer restent valables dans le cas d'autres ensembles d'indices, comme par exemple <N

N*.
.d
u
EXEMPLE 22.2. Voici différents exemples de suites, définies de diverses manières sur divers
ensembles d'indices.
1) La suite de terme général ✓n - 4 définie à partir de n 2: 4.
2) La suite (unlnEN de terme général Un= n 2 sin est pair et u,,_ = ~ sin est impair.
cosn+i .
3) La suite complexe de terme général . . définie sur N tout entier.
1 +ismn
4) La suite (wnlnEN dont le terme général est donné sous forme récurrente par Wo = 1 et
1 +wn
Wn+l = - - - 2 .
n+wn

.\tt('lltÎ()ll Suite et image d'une suite


On prendra garde à distinguer une suite (UnlnEN, qui est une fonction, de son image
{un In EN}, qui est un sous-ensemble de lK.

Définition 22.3. Soit (UnlnEN une suite réelle.


1) {UnlnEN est dite minorée si l'ensemble de ses valeurs admet un minorant. Sim est un
minorant de cet ensemble, on dit aussi que m minore la suite (Un)nEN.
2) (unlnEN est dite majorée si l'ensemble de ses valeurs admet un majorant. Si M est un
majorant de cet ensemble, on dit aussi que M majore la suite (Un)nEN·

Définition 22.4. Une suite (UnlnEN de lK est dite bornée si l'ensemble de ses valeurs est
borné, c'est-à-dire s'il existe un réel M > 0 tel que \ln EN, lunl :S M. On dit aussi dans ce
cas que la suite (UnlnEN est bornée par M.

Le lecteur pourra aisément vérifier qu'une suite réelle est bornée si et seulement si elle est
minorée et majorée.
596

EXEMPLE 22.5. Soit (unlnEN la suite réelle définie par Un= ✓n4 + 1-n2 . Elle est minorée
1 par O et majorée par 1 car O :::'.Un:::'. ✓n + 2n + 1 - n = 1.
4 2 2

EXEMPLE 22.6. Soit (UnlnEN la suite complexe définie par Un= vnl n:i.
+1.n
Nous avons
vn+T
lunl = ✓f+nl. Comme, pour tout n EN, vn+T : :'. ✓ 1 + n 2 , on peut alors conclure que
1 +n 2
la suite (unlnEN est bornée par 1.

Test 22.1. Test 22.2.


La suite de terme général vn+1 - Jn est-elle La suite de terme général t~~;t~ est-elle bor-
majorée? Minorée? née?

li. SUITES CONVERGENTES

Dans cette partie, nous donnons la définition formelle de la notion de limite de suite. La
convergence d'une suite (UnlnEN vers une limite C signifie, d'une manière intuitive, que le
terme Un est aussi près que l'on veut de C à condition de choisir n assez grand.

Définition 22.7. Soit (UnlnEN une suite de K On dit que (UnlnEN converge vers CE li{ (ou
que (unlnEN tend vers C) quand n tend vers l'infini si

',if, E JR~, :lN E N tel que si n 2'. N, alors IUn - Cl < E.

Une suite (Un)nEN est dite convergente s'il existe un élément C E li{ tel que (UnlnEN converge
vers C. Une suite qui n'est pas convergente est dite divergente.

Le lemme suivant montre que si une suite (UnlnEN est convergente, elle converge vers un
unique élément de K

PREUVE. Soit E > 0 un nombre réel strictement positif. Par définition, il existe N E N et
N'EN tels que IUn - Cl< c/2 pour tout n 2'. Net IUn, - C'I < c/2 pour tout n' 2'. N'. Soit
n un entier plus grand que max{N, N'). L'inégalité triangulaire montre que

IC - C'I = IC - Un+ Un - C'I :::= IUn - Cl + lun - C'I < L

Ainsi IC - C'I < E, et cela pour tout E > 0, ce qui entraîne que C- C' = O. ■

Ce nombre C est appelé la limite de la suite, ce que l'on note

lim Un= C.
n--l-too
597

EXEMPLE 22.9. Montrons que si p E N*, la suite de terme général Un= 1/nP converge
vers O.
► Remarquons d'abord que pour n E N*, nP 2: n, et donc 0 ~ Un ~ 1/n. Soit f > 0 fixé.
Alors comme IR est archimédien, il existe N E N tel que N > 1/ f. Donc pour n 2: N

ce qui montre la convergence de la suite vers O.


La remarque suivante est presque évidente, mais très importante en pratique.

Inégalités strictes ou larges


c-i
Dans la définition de la limite, il est toujours possible de choisir arbitrairement le type C'I
..d
d'inégalités utilisé. Par exemple, avec les notations de la définition, (UnlnEN a pour limite u
C si et seulement si pour tout f > 0, il existe N E N tel que pour tout n E N vérifiant
n > N, on ait l'inégalité IUn - Cl ~ ë..

EXEMPLE 22.10. La suite (unlnEN définie par Un= (-l)n est divergente.
► En effet, supposons qu'une telle suite soit convergente et de limite C. Appliquons la dé-
finition de la convergence avec f = 1 : il existe un entier N tel que lun - Cl < 1 pour tout
n 2: N. Or, pour n = 2N, cette inégalité donne Il - Cl< 1. De même, pour n = 2N + 1, on
obtient 1-1 -Cl< 1. Ainsi, on a 2 = Il - (-1)1 = 1(1 -Cl - (-1 -C)I ~Il-Cl+ 1-1 -Cl< 2,
ce qui est absurde. Nous avons donc démontré que la limite C n'existe pas. La suite (unlnEN
est bien divergente.

EXEMPLE 22.11. Soit (UnlnEN une suite convergente de limite C. Montrons que la suite
(lunllnEN est convergente de limite ICI.
► Pour f > 0, il existe un entier N tel que si n 2: N, alors lun - Cl < f. Or, l'inégalité
triangulaire montre que llunl - ICII ~ IUn - Cl. On en déduit que lltinl - ICII < f pour tout
n 2: N, ce qui démontre notre assertion.
Une conséquence immédiate mais importante de la convergence d'une suite est donnée par
la proposition suivante.
Prop~niôn2i~~t:'f'ri1tt~"'s'iiaii è,iff/µ:j~ft.Jè~~?',: ....
PREUVE. Soit (UnlnEN une suite convergente de limite C. Appliquons la définition de la
convergence avec f = 1 : on peut trouver un entier N tel que IUn - Cl < 1 pour tout
n 2: N. L'inégalité triangulaire montre alors que ltinl < 1 + ICI pour n 2: N. On en dé-
duit que ltinl est majorée par max(luol, lu, 1, ... , luN-1 I, 1 + ICI) pour tout n EN, ce qui prouve
notre assertion. ■

Suites bornées non convergentes


La réciproque de la proposition précédente n'est pas vraie. Prenons par exemple la suite
(UnlnEN définie par Un= (-l)n. Elle est bornée par 1, mais elle n'est pas convergente
comme cela vient d'être vu dans l'exemple 22.10.
598

1
EXEMPLE 22.13. Montrons que la suite (unlnEN* définie par Un= nn converge vers 1.
► On remarque d'abord que la suite est minorée par 1. Soit E > 0 un nombre réel strictement
positif. Montrons que n¼ < 1 + E pour n assez grand, ce qui équivaut à n < (1 + E)n. La
formule du binôme de Newton montre que (1 + E)n = 1 + nE + n(n - 1)é: 2 /2 +•••+En.
Comme tous les termes du second membre sont positifs, pour avoir n < (1 + E)n, il suffit que
n soit strictement inférieur à n(n - 1 )é: 2 /2. Ceci a lieu sin est strictement plus grand que
1 + 2/E: 2 . Ainsi, choisissons N strictement plus grand que 1 + 2/E: 2 . Alors pour tout n ~ N,
on a 1 :Sn¼ < 1 + E, ce qui prouve notre assertion.

Notons que l'exemple précédent repose sur le caractère archimédien de la droite réelle.
Nous utiliserons à l'avenir ce type de propriété sans le rappeler systématiquement. On a aussi
utilisé les propriétés de la fonction iy, que nous verrons en détail au chapitre 25.

Test 22.3. Test 22.4.


Montrer, à l'aide de la définition, que la Soit (unln:c:o une suite réelle. Est-il vrai que
n+l si (IUnl)n:c:o est convergente, alors (unln:c:o est
suite de terme général
Un
2n+3 a pour
convergente ?
limite 1/2.

III. ÜPÉRATIONS ÉLÉMENTAIRES SUR LES LIMITES

L'espace des suites de 1K est muni naturellement d'une structure d'anneau, et même d'algèbre.
Lorsqu'une notion d'analyse vient se greffer sur une structure algébrique, il est tout naturel
d'en étudier la compatibilité avec les lois de composition de la structure. Dans cette partie,
nous allons donc étudier comment la notion de limite se comporte en regard des opérations
algébriques sur les suites et nous obtiendrons ainsi des règles générales de calcul sur les limites
de suites.

IIl.1. La somme de deux suites


Définition 22.14. La somme de deux suites (UnlnEN et (vnlnEN est la suite dont le terme
d'indicen estUn+Vn- On la note (unlnEN+(vnlnEN, soit (Un)nEN+(vnlnEN = (Un+Vn)nEN·

P,;op~jj;ton,,i2.)S-D· $i.!~lliEN•etJ-~1n:lnéN.•.~.~~e.\
S'ltÎte ~tiergertte~-Îii.li.miti éstiii
~ietJr,J~~.·~•.·'n~,
somme des$~@f{il;,,Jfiê?< ètlvn.)~)\\jifiit·en~~
lim (u,.+vnl = lim
n-i+oo · · · · · n-i+oo
fun Vn.
Un+ n-+foo
PREUVE. Soit E > 0 un nombre réel strictement positif. Appliquons la définition de la
convergence des deux suites avec E/2: il existe deux entiers N et N' tels que !Un - fi< 1 si
n ~ N et lvn - f'I < 1 sin~ N'. En utilisant l'inégalité triangulaire, on obtient
é: é:
IUn +vn - (f + e'll = l(Un -fl + (Un -e'll :s: IUn - fi+ lvn -e'I <
2+ 2 = E

pour tout n ~ max(N, N '). On a donc trouvé un entier N" = max(N, N ') qui vérifie IUn +vn -
(f + e') 1 < é: pour tout n ~ N ". Comme le nombre réel é: > 0 était arbitraire, la proposition
~M~~- ■
599

EXEMPLE 22.16. Il est équivalent de dire qu'une suite (unlnEN converge vers f et que la
suite de terme général Un - f converge vers O. C'est immédiat à partir de la définition, et rJJ

on le vérifie aussi en remarquant que (unlnEN est la somme de (Un - flnEN et de la suite
constante de valeur t
i
<:)

g
Test 22.5. Test 22.6. rJJ

Donner l'exemple de deux suites divergentes Soient (unln20 une suite convergente et ~•V
~
dont la somme est une suite convergente. (vnln20 une suite divergente. La somme de rJJ

ces deux suites est-elle convergente? ~;:l


rJJ

~
III.2. Le produit de deux suites c--i

a
N
Définition 22.17. Le produit de deux suites (UnlnEN et (vnlnEN est la suite dont le terme
d'indice n est UnVn. On la note (Un)nEN · (vnlnEN, soit (UnlnEN · (vnlnEN = (UnVnlnEN·

- - , - - ,-

1) ~'11, iupposê; #e l11 stiitë {n;,.:..)JtEN ~ bôrnée et que la suité Vn est oonverpente êt de limite
nulle.. Alors le f)r(iàiJ,it {ù,i}~N , (v,;:};ne111 est une sùite c-0nvergente de limite nulle.
2) Or.su11pa~~.quëles,$Uik,d~lnElll .edvnlnEN sont deux suites convergente, de limites€
ètt' ~t#îepient; Alor;s leJ>roduit [Une)new · {vnlneN est une suite convergente de limite le
proif,ùit#l1 , !Ûnt encore . . . .
lim. {lln:W,}:,;:;. lim Un· lim Vn'.
n-t+oo · n-+too 11.-:,>+oo

PREUVE.

1) Supposons d'abord que la suite {vnlnEN converge vers zéro, c'est-à-dire que f' = 0, et que
la suite (UnlnEN est bornée. Montrons que le produit (UnlnEN · (vnlnEN converge vers zéro. Par
hypothèse, il existe un réel M > 0 tel que !Uni :S M pour tout n EN. Soit E > O. Appliquons
la définition de la convergence à la suite (vnlnEN avec c/M: il existe N EN tel que lvnl < c/M
pour tout n ~ N. Il en résulte que !UnVn - OI = !Unvnl :S Mlvnl < c, ce qui montre bien que
(UnlnEN · (vnlnEN converge vers zéro et prouve le premier point.
2) Supposons maintenant que les suites (UnlnEN et (vnlnEN sont convergentes et de limites
f E OC et f' E OC quelconques. Écrivons UnVn - U' = Un(Vn - f') + f'(Un - e). D'après
la proposition 25.57, la suite {UnlnEN est bornée car elle est convergente. Comme les suites
(vn -e'lnEN et (Un -flnEN convergent vers 0, le cas précédent montre que les suites de termes
généraux Un(Vn -e') et f'(Un -f) convergent et sont de limite nulle. La suite de terme général
UnVn - ff' est la somme de deux suites convergentes de limite nulle, donc elle converge et sa
limite est nulle, d'après la proposition 22.15. On a bien montré que la suite produit converge
vers U'.

EXEMPLE 22.19.
► La suite (';~:~)nEN est convergente et de limite nulle (la fonction cos est bornée par 1).
► La suite ( f!~ ( :¾))
1+ nEN est convergente de limite 1. Posons Un = ~:~ = 1 + n: 1 et
Vn = 1 + :¾-
La suite de terme géneral Un converge vers 1, en effet limn-->oo n:, = 0, comme
600

on le vérifie facilement, et l'assertion résulte alors de la proposition 22.15. On voit de même


que la suite de terme géneral Vn converge vers 1, puisque limn--HJO ~ = 0 (cette dernière
assertion résulte de notre étude des suites de terme général 1/nP et de la proposition 22.18).
On applique enfin la proposition 22.18 à la suite produit (unvnlnEN·

Définition 22.20. Le produit d'une suite (UnlnEN par un élément À de![( est la suite dont
le terme d'indice n est ÀUn. On la note À(unlnEN, soit À(UnlnEN = (ÀUn)nEN·

La suite À(unlnEN est donc le produit de la suite (UnlnEN par la suite constante de valeur
À. On déduit alors de la proposition précédente le résultat suivant.

Proposition 22.21. Soienn.. E K et (Un.}n€N ûne- sVJ.itè êonvér{Jêrite èt ili f:imite"e, AliJ~s
0

la suit.e À(Un.}T\€-N (!_St corweryente de limite Àt, s€Jjt erù]6re -


Iinî '{>.lin,) :::::· À liin tin
n➔+oo n-H-oo

Test 22.7. Test 22.8.


Donner l'exemple de deux suites divergentes Si la suite (unvnlnEN converge vers zéro, les
dont le produit est une suite convergente. suites (unlnEN et (vnlnEN sont-elles nécessaire-
ment bornées ?

III.3. Le quotient de deux suites


Le quotient de deux suites est analogue au cas du produit. Il faut toutefois veiller à ce que le
dénominateur ne s'annule pas.

Définition 22.22. Soient (UnlnEN et (vnlnEN deux suites de K On suppose que tous les
termes Vn sont non nuls. Le quotient de (UnlnEN par (vnlnEN est la suite dont le terme
d'indice n est Un/Vn. On la note (Un)nEN/(vnlnEN, soit (Un)nEN/(vnlnEN = (un/vnlnEN·

PREUVE. Montrons d'abord que la suite (1 /vnlnEN est bornée. Comme f' est non nulle,
appliquons la définition de la convergence de la suite (vnlnEN avec E = Wl/2 : il existe N E N
tel que lvn - e'I < 1€'1/2 pour tout n 2 N. Or, l'inégalité triangulaire montre que WI - lvnl :::;
lvn - f'I. Il en résulte que lvnl 2 Wl/2 pour tout n 2 N. Posons

Alors R est strictement positif et minore la suite ( lvnl lnEN. On a donc ( 1/lvnl lnEN :::; 1/R pour
tout entier n.
601

Soit (wnlnEN la suite définie par


Un
Wn=---=----
e Une' -vnf
Vn f' f'Vn
La suite (wnlnEN est le produit des suites de termes généraux 1/(f'vn) et Une' - VnL La
première est bornée et la seconde est convergente de limite nulle. D'après la proposition 22.18,
la suite (wnlnEN est convergente et de limite nulle, ce qui démontre notre assertion. ■

. . n 2 -3n+2
EXEMPLE 22.24. Montrons à l'aide de la formule du quotient que hm = 1.
n-.+oo n 2 + n + 1
► On ne peut appliquer directement la proposition 22.23 au quotient des suites définies par
Un = n 2 - 3n + 2 et Vn = n 2 + n + 1 puisque ces deux suites ne sont ni convergentes, ni
même bornées. En revanche, on peut factoriser et simplifier le numérateur et le dénominateur
de la fraction Un/Vn par n 2 .
1-3/n+2/n2
1 + 1/n + 1/n2"
Le dénominateur de cette fraction ne s'annule jamais, et les suites définies par 1-3/n+2/n2
et 1 + 1/n + 1/n 2 convergent toutes deux vers 1. Le résultat découle donc maintenant
immédiatement de la proposition 22.23.

De deux à un nombre fini


Nous avons énoncé des résultats valables pour des opérations sur des couples de suites.
On obtient par une récurrence immédiate des résultats analogues pour des opérations
sur un nombre fini de suites. Par exemple, le produit de m suites convergentes converge
vers le produit de leurs limites.

Test 22.9. Test 22.10.


Soit (Un)n2:o une suite convergente. Les pro- Soit (Unln2:o une suite convergente. Les pro-
priétés suivantes sont-elles équivalentes? priétés suivantes sont-elles équivalentes?
1. La limite de (Un)n2:o est non nulle. 1. La limite de (unln2:o est non nulle.
2. Pour tout n EN, Un c/= O. 2. Il existe p E N tel que, pour n 2". p, Uni= O.

III.4. Lien entre suites réelles et suites complexes


Soit (UnlnEN une suite complexe. Pour n E N, les réels 9îc(Un) et Jm(Un) désignent respec-
tivement la partie réelle et la partie imaginaire du complexe Un- Nous avons ainsi associé à
une suite complexe les deux suites réelles (9îc(Un)lnEN et (Jm(Un))nEN· La relation entre la
limite d'une suite complexe et les limites de ses parties réelle et imaginaire est donnée par la
proposition suivante.

Pt&posîtiôn 22.25. .siJil(11.i)~N iine witè·


complexe..Afm's ('Un}'1€:N .·èSt· cânvef!1ente si èt
seul~ent si les -sui.tf;6 (9'ù(Un).)~n etf3m{11nHne111 s<>nt eo1it00rgentes, De plus,
-
802

PREUVE. Pour tout n EN, posons Xn = 9te(Un) et -Yn = Jm(Un)-


o On suppose que la suite (UnlnEN est convergente et de limite e E C. Posons x = 9te(t) et
montrons que la suite (xnlnEN converge vers x. Soit E > 0 un nombre réel strictement positif.
La définition d'une limite montre qu'il existe N E N tel que !Un - fi < E pour tout n :2: N. Or

Il en résulte que lxn - xi < E pour tout n :2: N, ce qui montre que la suite (xnlnEN converge
bien vers x. L'assertion analogue concernant la suite (-YnlnEN se prouve de la même manière.
o Inversement, on suppose que les suites (xnlnEN et (-YnlnEN sont convergentes. Comme la
suite (unlnEN est la somme de la suite (xnlnEN et de la suite (i-YnlnEN, les propositions 22.15
et 22.21 montrent que (UnlnEN est convergente et que sa limite vérifie les deux relations de la
proposition. ■

Test 22.11. Test 22.12.


Soit (unlnEN une suite complexe. Les propriétés Posons Un=
v'2 +in.
suivantes sont-elles équivalentes? cosn+in
1. La suite (unlnEN est convergente. 1. Déterminer 9\e(un) et '.Jm(Un).
2. la suite (unlnEN est convergente. 2. Étudier la convergence de (unlnEN·

IV. ÜRDRE TOTAL ET SUITES RÉELLES CONVERGENTES


Dans cette partie, nous allons étudier les propriétés spécifiques des limites de suites de lR.
Contrairement au corps des nombres complexes, le corps des nombres réels possède une re-
lation d'ordre total, notée :S comme il est d'usage, compatible avec sa structure algébrique.
Il existe d'autres sous-corps de C ayant cette propriété, comme par exemple le sous-corps
(Q des rationnels. Cependant, comme nous l'avons vu dans le chapitre sur la droite réelle, le
corps totalement ordonné (IR,+,•, :S) a l'avantage de posséder la propriété dite de la borne
supérieure. Nul doute que cette propriété caractéristique de IR doit se refléter dans l'étude de
la notion de limites de suites réelles.
Dans ce qui suit, pour alléger la présentation, nous supposerons que les suites considérées
vérifient des hypothèses que nous énoncerons à partir du rang n = O. Toutefois, nous laissons
le soin au lecteur de vérifier que presque toujours, les conclusions des propositions demeurent,
même si ces suites ne sont supposées satisfaire leurs hypothèses qu'à partir d'un rang N EN
arbitrairement fixé.

IV .1. Le théorème des gendarmes


Notre premier résultat va nous montrer que la notion de limite est compatible avec la relation
d'ordre, dans le cas de suites réelles.

PREUVE. Soient e la limite de (unlnEN et e' la limite de (vnlnEN· Soit E > 0 un nombre
réel strictement positif. Écrivons la définition des limites de (UnlnEN et (vnlnEN avec E.
603

Il existe N EN et N'EN tels que f-t: <Un< f+t: pour tout n ~Net f'-t: < Vn < f'+t:
pour tout n 2:: N'. Posons N" = max(N, N'). Alors (/J

f- E < Un, :S Vn < f' + E

pour tout n 2:: N". Il en résulte que f- f' < 2t:, et cela pour t: > 0 quelconque. On en déduit
que f - f' :S 0, ce qui démontre la proposition. ■
ig
(/J

En revanche, si la suite (vnlnEN converge, et si Un :S Vn pour tout n E N, on ne saurait ~


en déduire que la suite (UnlnEN converge. Nous avons besoin d'une troisième suite (wnlnEN ...
,Cl)

(/J

pour garantir la convergence, comme l'illustre la proposition 22.27 connue sous le nom de
théorème des gendarmes : il faut deux «gendarmes» (vnlnEN et (wnlnEN pour encadrer le 1(/J
«galopin» (unlnEN et l'empêcher de s'enfuir. j
Proposition 22~27. Soient. (Un}nel'h {vn)neN et (wnlneN trois suites réelles. On suppose
que pour t()ut n € N, on a l. 1encadrement

Vn :5 Un :5 Wn•
On sup~osè en outre que tês siiilfJS{'\>n}iiê:111 et (wnlneN œn11èrgênt 'OerS une mtme limite
t E .R. Alors la suite (UnJnEN ê$t tga'li:trleft.t convergente et de mtme limite t.
PREUVE. La démonstration est analogue à la preuve de la proposition 22.26. Soit t: > 0
un nombre réel strictement positif. Par définition de f, il existe N E N et N' E N tels que
e- E < Vn < e+ E pour tout n ~ N et e- E < Wn < e+ E pour tout n ::::: N'. Posons
N" = max(N, N'). Alors, pour tout n ~ N", on a les encadrements
f- E < Vn :S Un, :S Wn < f + f..

On en déduit aisément que IUn - fi < t: pour tout n 2:: N 11 • Comme le nombre t: > 0
était arbitraire, on reconnaît la définition de la convergence de Un vers f, ce qui prouve la
proposition. ■

_ 1 +2! + •·· +n!


EXEMPLE 22.28. Etudions la suite de terme général Un = ------
n!
► Pour tout n EN, nous avons l'encadrement suivant :

n! :S n!Un, :S 2((n -1)!) + n!.

La minoration est évidente car n!Un, = 1 + 2! + • • • + n! est une somme de termes positifs. La
majoration vient de ce que l'on peut majorer les n - 2 premiers termes de la somme n!un
par (n - 2)!. On a donc

n!un - n! :S (n-2)((n- 2)!) + (n -1)! :S (n-1 )((n- 2)!) + (n-1 )! = 2((n- l )!).
Nous avons donc, pour tout n 2:: 1, l'encadrement suivant :

2((n-l)!)+n!_ 2
1 :S Un :S I - 1 + -.
n. n
Comme la suite de terme général 1 + 2/n converge vers 1, qui est aussi la limite de la suite
constante égale à 1, le théorème des gendarmes montre que la suite (UnlnEN est convergente
et de limite égale à 1 .
604

.\ttc-lltiol! Inégalités strictes ou inégalités larges ?


La suite ( tl nEN* est convergente de limite nulle alors que tous ses termes sont strictement
positifs. Cela montre que même si Un < Vn pour tout n E N dans la proposition 22.26,
les limites de (UnlnEN et (vnlnEN peuvent cependant être égales.

Il y a donc en général tout à gagner, quand on a le choix, à employer des inégalités larges
en analyse, plutôt que des inégalités strictes 6 .

Test 22.13. Test 22.14.


Soient. (unlnEN une suite de K, (vnlnEN une On suppose que O < Vn :S Un :S Wn pour tout
suite réelle et i E K On suppose que !Un - il :S n E N et que lim Wn/Vn = 1. Commenter les
n--->+oo
Vn pour tout n E N. Montrer à l'aide du théo- assertions suivantes :
rème des gendarmes que si la suite (vn)nEN 1. lim Un = lim Vn = lim Wn;
est convergente, de limite nulle, alors la suite n--->+oo n--->+oo n--->+oo

(UnlnEN est convergente, de limite t 2. lim Un= 1.


n--->+oo Vn

IV.2. Suites réelles monotones


Dans cette partie, nous exprimons avec le langage des suites réelles la propriété affirmant que
toute partie de IR non vide et majorée admet une borne supérieure.

Définition 22.29. Une suite réelle (Un)nEN est dite


1) croissante si Un~ Un+1 pour tout n EN,
2) décroissante si Un+1 ~ Un pour tout n EN,
3) strictement croissante si Un< Un+i pour tout n EN,
4) strictement décroissante si Un+1 < Un pour tout n EN,
5) monotone si elle est croissante ou décroissante.

Thêorême 22.3(k 'lbiite smtç réêlle craj,ssante et )naj<Ytit:, est convergente, de limite la
borne S1J,1)ffl-ev.re de t'ensembli Je ses valeurs. Toute suite réèlle1 dé~afl.te .et mi1Ul'rée €$t.
èonuergênte, .de limite la borne inférieure de l'ensemble de ses valeurs.

PREUVE. Soit une suite réelle (UnlnEN croissante et majorée. On note i la borne supérieure
de l'ensemble de ses valeurs, qui existe bien puisque cet ensemble est non vide et majoré.
Soit f. > 0 un nombre réel strictement positif. Par définition de i, il existe n 0 E N tel que
i - f. < lino ~ i. De plus, la croissance de la suite montre que lino ~ Un pour tout n 2 n 0.

6
Ceci est d'autant plus légitime que l'erreur commise en remplaçant une inégalité stricte par une inégalité large
est, en général, plus petite que celle commise en substituant une inégalité stricte à une inégalité large. Par
exemple, soit x un nombre réel. Supposons que la seule propriété de x que l'on sache montrer est que x < O.
Alors, remplacer l'inégalité x < 0 par x :S 0, revient à rajouter la possibilité que x = O. Supposons au contraire
que la seule propriété que l'on sache montrer sur x est que x :S O. Alors, remplacer cette inégalité par une
condition de la forme x < c impose de choisir c > 0, ce qui revient à rajouter la possibilité que x E]O, c[ et ce
dernier intervalle est infiniment plus gros que le singleton {O}.
605

Enfin, Un S C par définition de C. Il en résulte que C - é: < Une S Un S C, et donc que


0 S C- Un S é:, pour tout n 2 n 0 • Nous avons ainsi montré que C est la limite de la suite
(Un)nEN, ce qui prouve la première assertion du théorème. La seconde assertion se démontre
de manière analogue. ■

EXEMPLE 22.31. Suites géométriques.


Soit a E (['. tel que lai< 1. On pose Un= un pour tout n EN.
► Supposons d'abord que a est un nombre réel, a E [O, 1[. Alors la suite (UnlnEN est décrois-
sante. En effet, on montre facilement par récurrence que un 2 0 pour tout n 2 O. On a donc
0 S Un+1 = UUn S Un car OS a< 1. La suite (anlnEN est donc décroissante, minorée par
zéro. Elle converge donc vers une limite C 2 O. :Montrons que f = O. L'idée est de « passer à
la limite »la relation Un+l = UUn. Le terme de gauche conyerge vers C, par exemple d'après
le théorème des gendarmes car O S Un+1 - f S Un - f (on peut aussi utiliser le fait que
(Un+ 1lnEN est une sous-suite de (UnlnEN, notion que nous Yerrons dans la partie VIII). Le
terme de droite converge vers aC d'après la proposition 22.21. L ·unicité de la limite montre
que aC = C. Il en résulte que C = 0 car O S a < 1.
► Montrons que si lai< 1, alors lim an= O. Pour prouver cela, il suffit de remarquer que
n---t+oo
lanl = Iain et d'appliquer le résultat précédent au réel lai.

EXEMPLE 22.32. On considère la suite (Un)nê':l définie par Un= 1 + -p + · · · + ~-


► La suite (Un)n>i est croissante puisque Un+l -Un= 1/(n+ 1)2 2 0; pour montrer qu'elle
2
est convergente, il suffit donc de la majorer. Or, pour tout entier n 2 2, on a n(n- 1) S n .
On en déduit que~ S n~l - ~- En additionnant membre à membre les inégalités, on obtient
par télescopage
n 1 n 1 1 1
Lk
k=2
2 :SL_(k-1-k) =l-n.
k=2
Donc Un - 1 S 1 - 1/n, soit Un S 2 - 1/n. La suite (Un)nEN est donc croissante et majorée
par 2, ce qui démontre sa convergence.
La proposition suivante donne une caractérisation séquentielle des bornes supérieure et
inférieure.
Prol)t>$ltir:nt,22.~3~. SoitA, ~ne partie .ntm, mde de R.
l:} · ùh 'l'éêl µ est là fM>tnê s~pé'fi&ure iîè it'~ efseûleniénhû clest }wn rtûi,ji}tarit âè A, et s'îl
·emte une suite tl'élémenf/8 de A.q11iiconvèrge 1Jers µ:
si
2) lin réel -v eslîâ qo~ î ~ f ~ "âe A si~ sèuleme~t c'est un minorant de A, et s'il
existè Une' suite d'élément$ d,e•A,::·~~éoti:1,e.1!(Je ·vers.-v.
,,_' ,- , ;-,

PREUVE. Montrons la première propriété. Siµ= supA, c'est un majorant de A par défini-
tion, et pour tout n E N*, il existe un élément Un E A tel que µ - 1/n < Un S a. On voit
facilement que la suite ( unlnEN* ainsi obtenue converge vers a.
Réciproquement, si µ est un majorant et si (anlnEN est une suite d'éléments de A qui
converge vers a, pour tout é: > 0, il existe n E N tel que µ - é: < Un S µ, ce qui montre que
µ- é: n'est pas un majorant de A. Il en résulte donc que µ est le plus petit des majorants de
A. Doncµ= supA. ■

On vérifie de plus que dans le point 1), la suite peut être choisie croissante, et que dans
le point 2), la suite peut être choisie décroissante.
606

Test 22.15. Test 22.16.


Soit (unln::,:o une suite réelle convergente de Les assertions suivantes sont-elles vraies?
limite O dont tous les termes sont positifs. Les
affirmations suivantes sont-elles vraies? 1. Le produit de deux suites croissantes est une
1. La suite (unln::::o est décroissante. suite croissante.
2. Il existe p E N tel que la suite (un)n::,:p soit 2. La somme de deux suites décroissantes est
décroissante. une suite décroissante.

On peut maintenant déduire du théorème 22.30 une conséquence très importante dans la
pratique : le principe de Cantor des intervalles emboîtés. Il relie le comportement des suites
monotones, qui est de nature analytique, à celui des suites d'intervalles de IR, qui est de nature
géométrique.

Théorème 2~.84. .· 'PtJiaf tout:ti . E N,· sôit In = fctn, ttJ i;n ·intêroâitè nhn. Wde de a.. ··Or,;
suppose satis/aitis lès êoiul.itiom' S'IJ,1,f!tlntés : · · · ·· ·
1) In+l ~t inclus dans I~i
2) In èst un intervalle Jermé et borné.
Alors les suites {On)n€N eflbn)neN coru1ergent, lin.in....,,.,. «n S litnn➔oo bn, et

PREUVE. La première hypothèse du théorème montre que la suite ( Un)nEN est croissante,
(bn}nEN est décroissante et, pour tout n E N et tout p E N, on a Un ::::; bp. D'après le
théorème 22.30, la suite (unlnEN, croissante et majorée par bp, pour p E N fixé, converge
vers une limite que l'on note u et qui satisfait l'inégalité u ::::; bp pour tout p E N. De la
même manière, la suite (bn}nEN, décroissante et minorée par toute valeur de la suite (un)nEN,
converge vers une limite que l'on note b et qui vérifie l'inégalité Un::::; b pour tout n EN.
On a l'encadrement Un ::::; u ::::; b ::::; bn pour tout n E N, ce qui montre l'inclusion de
l'intervalle [u, b] dans l'intersection de tous les In. Inversement, six E In pour tout n EN, alors
Un::::; x::::; bn. Il en résulte en passant à la limite que u::::; x::::; b d'après la proposition 22.26.
Ainsi x E [u, bl, ce qui montre que l'intersection de tous les In est incluse dans [u, b].
Par double inclusion, on a montré que nnEN In= [u, b] et cette intersection est donc un
intervalle non vide, fermé et borné. ■

Test 22.17. Test 22.18.


Montrer que l'intersection précédente est ré- 1. Que peut-on dire de l'intersection si les in-
duite à un singleton si la longueur des inter- tervalles In sont supposés ouverts et bornés?
valles tend vers zéro.
2. Quelle est l'intersection de tous les inter-
valles de la forme [n, +oo[ où n E N?

IV.3. Suites adjacentes


Le théorème des suites adjacentes, très utile en pratique, est un corollaire du principe des
intervalles emboîtés dans le cas où la longueur des intervalles tend vers zéro.
607

Définition 22.35. Deux suites réelles (UnlnEN et (vnlnEN sont dites adjacentes si elles vé-
rifient les conditions suivantes :
1) (unlnEN est croissante;
2) (vnlnEN est décroissante;
3) la suite (Un -vnlnEN converge vers O.
Comme on peut le pressentir, deux suites adjacentes convergent et elles ont la même limite.
Théotème 22.36. Soit(11n).IËN et{vn.)n.eN deux suites adjacentes. Alors
me~;
1} elles sont êo'live1rJènièi et 'ortt limite,
2} leuf'lirnîte ~~ ft1i'l'ifie Un :5 t :5 Vn. pour tout n E .N.
PREUVE. Posons Wn = Vn -Un,. On remarque que Wn+l -Wn = (Vn+l -Un.+1) - (vn -un) =
(vn+l -vn) + (Un - Un.+1) :s; O. Ainsi la suite (wnlnEN est décroissante et converge vers zéro.
Il en résulte en particulier que Wp :s; Wn pour tout p 2 n. En prenant la limite quand p tend
vers l'infini, d'après la proposition 22.26, on a O :s; Wn, ce qui montre que Vn 2 Un- Ainsi,
les hypothèses du théorème montrent que la famille des intervalles définis par In = [Un, v,J
satisfait les conditions du théorème 22.34. Il s'ensuit que la suite (Un)nEN est convergente de
limite f, que la suite (vn)nEN est convergente de limite f' et que Un :s; f :s; f' :s; Vn pour
tout n E N. Mais f - f' = limn-Hoo(Un - Vn) = 0, ce qui montre que f = f' et conclut la
démonstration du théorème. ■

On peut noter qu'il n'est pas nécessaire de supposer que Un :s; Vn dans le théorème 22.36 :
cela résulte des hypothèses.
EXEMPLE 22.37. Définition du nombre e.
► Considérons la suite (UnlnEI\I* définie par Un= 1 +fi+ fi+···+ ,b pour tout n 2 1 et
posons Vn =Un+ ,b pour n 2 1. Vérifions que ces deux suites sont adjacentes. Nous avons
Un+i -Un= 1/(n+ 1)! > 0, donc la suite (unlnEN est croissante. De plus, on a

Ainsi, la suite (vnlnEI\I* est décroissante (et strictement décroissante à partir du rang n = 2).
Enfin, 0 :s; Vn -Un, = 1/n! :s; 1/n donc la suite (Un -vnlnEN* converge vers zéro, ce qui prouve
que les deux suites sont bien adjacentes. On note traditionnellement e leur limite commune,
on dit que ce nombre e est la base des logarithmes népériens. C'est le premier exemple que
nous rencontrons d'un objet défini comme limite d'une suite. On vérifie immédiatement que
2 < e < 3 en considérant les premiers termes des suites adjacentes précédentes.
EXEMPLE 22.38. Irrationnalité du nombre e.
► !
Supposons que e soit un nombre rationnel et écrivons e = où p et q sont deux entiers
naturels non nuls (avec q 2 2 puisque e n'est pas entier). En utilisant la deuxième propriété
du théorème 22.36 pour n = q + 1, on obtient, avec les notations de l'exemple 22.37, les
inégalités suivantes
1 1 1 p 1
] + -1! + -2! + · · · + -q ! = Uq < Uq+1 < - Vq+1 < Vq = 1 + -1! + -2! + · · · + -q ! + -
- e = -q < q !.
En multipliant par q! on obtient q!uq < p(q-1)! < q!uq+ 1. Or q!uq = q!+-y/+fi+· · ·+*1,
p(q - 1)! et q!uq + 1 sont trois nombres entiers. Mais il n'existe pas d'entier strictement
compris entre deux entiers consécutifs. Nous aboutissons ainsi à une contradiction, ce qui
prouve que e E JR\(Ql.
608

V. CRITÈRE DE CAUCHY
c;
_;m Jusqu'ici, pour montrer qu'une suite converge, il nous fallait deviner un candidat qui joue le
C:
< rôle de sa limite, puis montrer que les termes de la suite sont arbitrairement proches de ce
~ nombre candidat à partir d'un certain rang. Par exemple, pour montrer le théorème 22.30
u pour les suites croissantes, nous avons dû deviner que la limite a priori que la limite était la
t
cf borne supérieure des valeurs de la suite.

Pour construire des quantités définies a nous étudions dans cette partie.
priori comme limite d'une suite, il est pri-
mordial d'être capable de décider si une
suite converge, à partir des termes de la
suite, et sans nécessairement connaître la va-
leur de la limite. C'est ici qu'intervient la no-
tion de suite dont les termes sont arbitrai-
rement proches à partir d'un certain rang,
notion qui fut introduite par Cauchy et que Augustin-Louis Cauchy (1789-1857)

Définition 22.39. Une suite (UnlnEN de OC est une suite de Cauchy si elle possède la
propriété suivante :

Ve E JE.~, :3N EN tel que si p 2'. N et q 2'. N, alors lu,, - uql < E.

L'intérêt de cette notion vient de sa relation avec la notion de convergence, dont la proposition
suivante donne le premier élément.

Proposition 22~40. 'fqqte suite de K. qùi est convergente est une suîte;dêCàuchtJ;

PREUVE. Soit (UnlnEN une suite de lK convergente et de limite e.


Soit E > O. Il existe N EN
tel que !Un - fi < c/2 pour tout n 2'. N. Soient p 2'. N et q 2'. N. Alors, par application de
l'inégalité triangulaire, on a

Ainsi, (Un)nEN est bien une suite de Cauchy. ■

EXEMPLE 22.41. Divergence de la série harmonique.


i
► Montrons que la suite (Unln2:1 définie par Un= 1 + ½+ ½+ · · · + est divergente. Nous
allons minorer Uzn -Un= 1/(n+ 1) + · • •+ 1/(n+ k) + · · · + 1/2n par un nombre strictement
positif et indépendant de n. Remarquons en effet que 1/ (n + k) 2'. 1/ (2n) pour 1 ::::; k ::::; n.
Il en résulte que Uzn - Un 2'. 1/2. Ainsi, la suite (Unln2:1 n'est pas de Cauchy. En vertu de
la proposition 22.40, elle n'est donc pas convergente.

La preuve précédente semble être due à Jacob Bernoulli, vers 1690, donc bien avant les
idées de Cauchy. Nous allons maintenant nous employer à démontrer la réciproque de la
proposition 22.40. Nous aurons besoin du lemme suivant.

Lemme 22.42. Toute suite de Gn:uchy est bornée.


609

PREUVE. Soit (UnlnEN une suite de Cauchy. Par définition, pour ë = 1, il existe N E N
tel que luN - Uql < 1 pour tout q 2 N. On en déduit que lunl - luNI ::::; luN - Uni < 1, r/J

soit encore que IUnl < 1 + luNI pour tout n 2 N. Ainsi, la suite (IUnllnEN est bornée par
max(luol, lu1I, ... , luN-11, luNI + 1).

Théorème 22.43. Touti S:u•te ''l'éélk ik Cauchy est convergente.



PREUVE. Soit (UnlnEN une suite réelle de Cauchy. Pour n EN, notons En= {uk I k 2 n}.
~...
,Cl)

r/J
L'ensemble En est non vide et en vertu du lemme 22.42, il est borné. Il existe donc Un =
infEn et bn = sup En. Nous allons vérifier que les suites (unlnEN et (bnlnEN sont adjacentes. j
L'inclusion de En+l dans En, ce qui montre que la suite (unlnEN est croissante et que (bnlnEN r/J
j
est décroissante. Soit ë > O. Comme (UnlnEN est une suite de Cauchy, il existe N E N telle
c-i
que l11p - Uql < ë pour tout p 2 N et pour tout q 2 N. D'autre part, soit n 2 N. Il résulte C'I

de la définition de Un et bn qu'il existe p 2 n et q 2 n tels que Un :=::; Up < Un + ë et .d


ü
bn - ë < Uq::::; bn. Or, l11p - Uql < ë car n 2 N. L'inégalité triangulaire donne alors que

ce qui montre que la suite (bn - unlnEN converge vers zéro. Les suites ( UnlnEN et (bnlnEN
sont donc bien adjacentes.
D'après le théorème 22.36, les suites (unlnEN et (bnlnEN convergent vers une même limite,
que nous noterons t Comme Un ::::; Un ::::; bn pour tout n E N, le théorème des gendarmes
montre que la suite (UnlnEN est convergente de même limite t, ce qui conclut la démonstration
du théorème. ■

Nous pouvons maintenant facilement énoncer et démontrer la réciproque de la proposi-


tion 22.40.

Thêorême 22.44. Tbute suite C11m,plexe de Gauchy est wnverge1ite;

PREUVE. Soit (Un)nEN une suite complexe de Cauchy. Les inégalités IJm(Up) - Jm(uq)I ::::;
l11p - Uql et l 9îe(11p) - 9îe(uq)I ::::; l11p - uql, montrent que la partie réelle et imaginaire de
la suite (UnlnEN sont des suites réelles de Cauchy. D'après le théorème 22.43 ci-dessus, elles
sont convergentes. En vertu de la proposition 22.25, la suite (UnlnEN est convergente, ce qui
démontre le théorème. ■

La condition donnée dans la définition 22.39 fournit ainsi une condition nécessaire et
suffisante pour qu'une suite converge, qui se formule à partir des termes de la suite, sans
référence à une expression possible de la limite. Ce résultat est assez important pour justifier
l'introduction d'un nouveau qualificatif.

Définition 22.45. Les corps IR et C sont dits complets, ce qui veut dire que toute suite de
Cauchy de IR ou C est convergente.

EXEMPLE 22.46. Soient 0 E IR et k E JO, 1[. Étudions la convergence de la suite (unln>O


définie pour n 2 0 par Un = 1 cos 1 + k cos e + k 2 cos 0 2 + ... + k n cos en. -
► Soit ë > O. Soient p et q dans N tels que p < q. Nous avons
610

Comme la fonction cosinus est bornée par 1, l'inégalité triangulaire montre que

Comme 0 < k < 1, l'exemple 22.31 montre qu'il existe N E N tel que kP+l < (1 - k)E pour
tout p 2: N. Donc IUp - Uql < E si q 2: p 2: N. Ainsi, la suite (u1JnEN est de Cauchy. Elle
est donc convergente.

Test 22.19. Test 22.20.


Une suite bornée est-elle de Cauchy? Une suite réelle qui est de Cauchy est-elle mo-
notone?

VI. EXTENSION DE LA NOTION DE LIMITE

Les suites considérées dans cette partie sont toutes supposées réelles. Parmi les suites réelles
divergentes, certaines ont un comportement à l'infini plus régulier que d'autres. Par exemple, la
suite de terme général n 2 a tous ses termes aussi grands que l'on veut à partir d'un certain rang.
Au contraire, la suite de terme général Vn = nsin (2rrn/3) a des termes positifs arbitrairement
grands pour n de la forme n = 1 +3k, avec k EN, mais elle a aussi une infinité de termes nuls
puisque v 3 k = 0 pour tout k E N. Dans cette partie, nous allons étudier les suites divergentes
dont le terme général tend vers l'infini.

Définition 22.47. Soit (UnlnEN une suite réelle.


1) On dit que (unlnEN tend vers +oo quand n tend vers l'infini, lorsque

\/A E JR~, 3N EN tel que sin 2: N, alors Un> A.

2) On dit que (Un)nEN tend vers -oo quand n tend vers l'infini, lorsque

\/A E JR~, 3N EN tel que sin 2: N, alors Un< -A.

On note alors lim Un= +oo dans le cas 1) et lim Un= -oo dans le cas 2).
n~+oo n~+oo

EXEMPLE 22.48. La suite de terme général vn tend vers +oo. En effet, pour A > 0, il
1 suffit de choisir N > A 2 .

Considérons maintenant l'exemple des suites géométriques.

EXEMPLE 22.49. Si u > 1, alors la suite (unlnEN tend vers +oo.


► En effet, posons u = 1 + h avec h > O. D'après la formule du binôme de Newton, nous
avons un= (1 + h)n = 1 + nh + • • • + hn. Comme h est positif, on déduit que un> nh.
Pour A> 0, il suffit de prendre N > A/h = A/( u - 1) pour que un> A pour tout n 2: N.

D'après la définition, une suite qui tend vers +oo n'est pas majorée. De même, une suite
qui tend vers -oo n'est pas minorée. En général, la réciproque n'est pas vraie comme le montre
l'exemple suivant.
611

EXEMPLE 22.50. Soit (unlnEN la suite définie par U2n =net Uzn+l = 1. Cette suite n'est
1 pas majorée mais elle ne tend pas vers +oo. r/J

j
Test 22.21. Test 22.24.
~
0
(.)

Les propriétés suivantes sont-elles équivalentes? Une suite réelle de limite +oo est-elle croissante §
r/J
1) (unln::::o tend vers +oo ou tend vers -oo. à partir d'un certain rang? CL)

2) La suite (lunlln::::o tend vers +oo. ~


,CL)
1-..
Test 22.25. r/J
Test 22.22.
1) Si a> 0, montrer que lim n° = +oo. ~
n-++oo ::l
Si Un ~ Vn à partir d'un certain rang et si r/J
r/J
2) Si a :S -1, que peut-on dire de la limite de
(vnlnEN tend vers +oo, que peut-on dire de la ~
suite (unlnEN? la suite (anlnEN?
c-i
N
Test 22.23. Test 22.26. ..ci
ü
Montrer qu'une suite croissante non majorée Soit (unln::::o une suite à termes positifs et de
tend vers +oo. limite +oo. Que peut-on dire de ( fo;;:lnEN?

VI.1. La limite de la somme


La formule donnant la limite de la somme de deux suites n'est plus valable dans le cas où les
deux suites tendent vers l'infini. Considérons, par exemple, les deux suites de termes généraux
Un = n et Vn = -n + 1. Leur somme est convergente et de limite 1. Si, maintenant, on prend
Un= n 2 et Vn = -n, la somme tend vers +oo. Dans les deux cas, nous avons calculé la limite
de la somme de deux suites dont l'une tend vers +oo, et l'autre vers -oo. Ainsi, on ne peut rien
conclure sur la limite par cette seule information. Dans cette situation, on dit que la somme
présente la forme indéterminée +oo - oo. Comme nous le verrons, l'étude de la limite dans ce
cas d'indétermination est souvent rendue possible par la recherche de bonnes approximations
des termes de la suite. Nous nous limitons ici à des cas de sommes sans indétermination.

.. - -
lim Un z+oo
1). Si n,-.+oo ..
etsi (vn)neN est minorée, alors la suite (Un +vn.Jn.l':N tend vers +oo.
2) Si fun 1.1n,
n..... +oo
=~oo et si (v-n)nE'N est maJorée; alors la suite (u.,,, + vnJrieN tend vers :-oo.
PREUVE. Soit (UnlnEN et (vnlnEN deux suites réelles telles que (UnlnEN tende vers +oo et
que (vnlnEN soit minorée. Soit A un réel strictement positif et soit m un minorant de (vnlnEN·
Écrivons la définition de la limite de (UnlnEN avec le réel A+ 1ml : il existe N E N tel que
Un> A+ 1ml pour tout n :::=: N. Nous avons alors

car m minore Vn, ce qui démontre que lim (un +vn) = +oo. Le cas de la limite -oo se traite
n-++oo
de manière analogue. ■

Test 22.27. alors leur somme tend aussi vers +oo et que si
Montrer que si deux suites tendent vers +oo, deux suites tendent vers -oo, alors leur somme
tend aussi vers -oo.
612

Test 22.28. 3. L'une des deux suites n'est pas majorée.


Soient (un)~o et (vnl~o deux suites réelles
Test 22.29.
telles que lim (Un+ Vn) = +oo. Les affirma-
n--t+oo
tions suivantes sont-elles vraies ? Montrer qu'une suite qui tend vers +oo est po-
sitive à partir d'un certain rang et qu'une suite
1. L'une des deux suites tend vers +oo.
qui tend vers -oo est négative à partir d'un
2. Les deux suites tendent vers +oo. certain rang.

VI.2. La limite du produit


Comme dans le cas de la somme, la formule du produit ne s'étend pas, en général, au cas des
suites qui tendent vers l'infini. En effet, considérons, par exemple, les suites de terme général
Un = n et Vn = 1/(n + 1 ). Alors le produit de ces deux suites tend vers 1. Si, en revanche,
on pose Vn = 1/(n + 1 )2, alors le produit UnVn tend vers O. Pourtant, dans les deux cas, la
suite (Un)nEN tend vers +oo et la suite (vnlnEN converge vers zéro. Ainsi, dans cette situation,
on ne peut pas savoir a priori si le produit converge, ni calculer la valeur de la limite le cas
échéant. On dit que le produit présente la forme indéterminée oo x O. Comme dans le cas des
sommes, nous nous limitons ici à des cas de produits sans indétermination.
Proposition' 221li2., . SQjent {~}neN .ét, {vn}ru;;N àeui:/t/ù.'ltrli 'téltiits."'?,.
lJ .Si, ile!!~ 1tt;; qi:, ,+:oo e,t."ifvTJJnE1t '!$t mznoœ'e: a J)i;J~trtl'un.:},:~~n 'l'fnJf; Pt-tt/t,tn ,.ré!J{
striétement~tif âZvrs là imte [>1îJÙMit {Un.VnÎMti terif
~) .· .. 0 . ç-0<)
tiert+~{
;c ..·...•••..•. · . . .•.. • . ·. ·.· ..•·•.

~L# fyn}~; "ésf rrtinôf6: 'ti pariiiti/~ii ~ rnn!J,Pfl! ~n·, tié.f


11trictem.entposî#f, alors {u.nvnJneN·terul vers -,-oo; ..
PREUVE. Démontrons le premier cas. On suppose que (UnlnEN tend vers +oo et qu'il existe
un nombre réel m > 0 et un entier n 0 E N tel que Vn 2: m pour tout n 2: n 0 . Soit A > O.
Par définition de la limite de (Un)nEN, il existe N EN tel que Un> A/m pour tout n 2: N.
Ainsi, pour n 2: max(N, n 0 ), on obtient, en multipliant membre à membre les deux inégalités,
que UnVn 2: (A/m)m = A, ce qui démontre que (UnVn)nEN tend vers +oo. Le second cas se
démontre de manière analogue. ■

EXEMPLE 22.53. Pour p EN*, la suite (nP)nEN tend vers +oo. On le vérifie directement
puisque nP 2: n, mais on peut aussi appliquer la proposition précédente au produit de p
suites de terme général Un= n (noter qu'une suite tendant vers +oo est minorée par un réel
strictement positif à partir d'un certain rang).

EXEMPLE 22.54. Si a> 1 et p E Z, alors la suite (nPanlnEN tend vers +oo.


► Nous avons déjà traité le cas p = O. Pour p 2: 1, la suite nPan tend vers +oo car elle est
le produit de deux suites qui tendent vers +oo.
► Montrons la propriété pour p = -1. Soit h > 0 tel que a= 1 + h. Nous avons

Comme tous les termes de cette somme sont positifs, on en déduit l'inégalité
613

soit encore an/(n(n-1)) 2 h 2 /2. Ainsi, la suite (an/(n(n-l)llnEN est minorée, pour
n 2 2, par le nombre h 2 /2 > O. Or, la suite (n - 1lnEN tend vers +oo. On en déduit que

tend vers +oo, en vertu de la première propriété de la proposition 22.52.


1
► Il reste à prouver le résultat dans le cas où p ::; -2. Posons q = -p et b = as. Nous
avons

Mais b > 1 car q :::,: 1 et a> 1. La suite de terme nPan a donc pour limite +oo car c'est le
bn ~
produit fini (q fois) de la suite - qui tend vers +oo. N
n .ci
ü
La fin de cette preuve repose sur les propriétés de la fonction {/, que nous verrons au
chapitre 25.

Test 22.30. Test 22.31.


Étudier la limite de la suite produit (unvnlnEN Montrer que si Un 2:: Vn à partir d'un certain
dans les cas suivants : rang et si (vnlnEN tend vers +oo, alors la suite
a. lim Un lim Vn = +oo ;
= +oo et n~+oo Un tend vers +oo.
n~+oo
b. lim Un = +oo et lim Vn = -oo ; Test 22.32.
n~+oo n~+oo
c. lim Un = -oo et lim Vn = -oo. Si la suite (unvnlnEN est bornée, est-il possible
n~+oo n~+oo
que la suite (unlnEN tende vers +oo?

Vl.3. La limite du quotient


Lorsque deux suites tendent toutes deux vers zéro ou vers +oo, on dit que leur quotient
présente la forme indéterminée § ou ~ respectivement. Il faut alors étudier en détail la
situation pour en déterminer la limite.
Par exemple, soient (Un)nEN et (vnlnEN deux suites définies par Un = n et Vn = n + 1.
Les deux suites tendent vers +oo et le quotient de ces deux suites tend vers 1. En revanche,
si on pose Vn = n 2 , le quotient 11-n/vn tend vers O. Si maintenant Un= 1/(n + 1) et Vn = Un,
le quotient 11-n/vn converge vers 1 alors que les deux suites convergent vers O. En revanche,
si on pose Vn = (-1 )~, les deux suites convergent encore vers zéro mais le quotient 11-n/vn
n'a pas de limite.
Comme pour les sommes et produits, nous nous limitons ici à des cas de quotients sans
indétermination.

Prtl~i,~1~.i~bit{'WrtJnEM' .U#~.~îtt{~f,tênd•~f$ ;i:90~!' tüj..tert,tl,_ver~ ~oo,. On


suppose .qûe to~ s~ têrmês SiJ.nt non nùls; Alors la suitè fJ/11-n)neN canveryè vers O. .

PREUVE. On suppose que la suite (UnlnEN tend vers +oo. Soit E > O. Pour A = 1/ E, il existe
NE N tel que Un> 1/E pour tout n 2 N. Nous avons alors pour tout n 2 N l'encadrement
0 < l/11-n < E, ce qui montre que la suite (1/unlnEN converge vers zéro. Dans le cas où la
suite (UnlnEN tend vers -oo, on se ramène au cas précédent en considérant la suite de terme
général -l/11-n. ■
614

On montre de manière analogue la proposition suivante.


~Ït.ôtt 22.5'6t Sî f~}~1f ~ ûnë suîte ·qiiî tëiid YJeiri o ét tfonttoîis' lei tiftne:s $ânt
$tr'ictement positif$, âivrs la lJUité fl/Û-ti}Af:N te,jd vérs,J-90, . .·. .· · . . . ·. .. . . .· .•
Si (Un}moN est une suite qui tend vers. 0 et dont t(YIJ,S ·lès termes sont smçtement nPgoiifsr
ak>rs la $Uite (1 /ttn)nEN tend tJers -oo. · · · ··
PREUVE. On suppose que Un > 0 pour tout n E Net que la suite (UnlnEN converge vers
zéro. Soit A > O. Par définition de la limite, il existe N E N tel que O < Un < 1/ A pour tout
n 2: N, soit encore 1/Un > A, ce qui démontre que la suite (1/UnlnEN tend vers +oo. Dans
le cas où Un< 0 pour tout n E N, on se ramène au cas strictement positif en considérant la
suite de terme général -1 /Un- ■

EXEMPLE 22.57. On peut faire des variations sur les résultats précédents. Par exemple, la
3
1 suite de terme général Un= 1/[(-l)n (2 + cosn)n 4] converge vers O.

Test 22.33. Test 22.34.


Soit (unlnEN une suite réelle dont tous les Déterminer la limite des suites de terme général
termes sont non nuls. Peut-on affirmer que si
(unlnEN converge vers zéro, alors I) ✓n 2 +2- ✓n2 +1.
lim 1/un = +oo ou lim 1/un = -oo?
n------t+oo
2) 1/( ✓n2 +1-n).
n------t+oo

VII. LIMITE SUP ET LIMITE INF


Une suite réelle n'a pas toujours de limite, finie ou infinie. En revanche, dans le cas d'une
suite croissante, soit la suite est majorée et elle converge vers une limite finie, soit elle est
non bornée et elle tend vers +oo. On a une propriété analogue dans le cas des suites décrois-
santes. Ainsi, l'étude de la limite d'une suite monotone est bien plus simple que celle d'une
suite quelconque. Cette remarque de bon sens conduit aux notions de limites inférieure et
supérieure, qui vont nous offrir un nouveau critère de convergence pour les suites réelles.
Une suite réelle (Unln20 bornée donne naissance à deux suites monotones (u;;:)n2o et
(u:;;Jn20 définies par les formules
u;;: = inf {Un, Un+1, Un+z, ... }; u~ = sup {Un, Un+1, Un+z, ...}.
La preuve de la proposition suivante est immédiate et laissée au lecteur.
Proposition 22.58. Toute suite '/telle bornée (ttn}ko vérifie les .cond#iQns s1J,ivt1tÀtœ :
1) Vtt.E N1 u;:s~'S
u;t";
2). ·la suite. (u;}~°: ~~tt'1$S~nte maj~f ....
3) la• suitë {~j~)i~~Et!~~~nte mi'li;oréf!, ..
Notons lim(Un) la limite de (u;;:)n20 et lim(Un) celle de (u~ln20- Ces deux limites existent
bien d'après le théorème 22.30. De plus, la première propriété de la proposition 22.58, combinée
avec la proposition 22.26, montre que
lim(Un) S lim(Un).
Dans le cas où la suite (unln::=:o n'est pas majorée nous posons lim(Un) = +oo. Dans le cas où
(Unln20 n'est pas minorée, nous posons lim(Un) = -oo.
615

Définition 22.59. Soit une suite réelle (Un)n:,, 0. On dit que lim(11n) est la limite inférieure
de (Un)n2:o et que lim(Un) est la limite supérieure de (11nln20- Ces deux limites sont éléments rn
de R. ~
o.
L'intérêt du critère de convergence donné par le théorème ci-dessous vient du fait que les a
0
limites inférieure et supérieure, en tant que limite de suites monotones, sont plus faciles à CJ
::,
étudier que la convergence de la suite d'origine. 0
rJJ
~
4)
Théorème 22.60. Soit (unln>o une suite réelle. La suite (Un)n>o est convergente si et ...
,d)

=
seulement si lim(11n) lim(11nf ER. Dans ce cas, la suite (Un)n.e; converge vers la valeur rJJ
B
commune des limites inférieure et supérieure.
~
rJJ
PREUVE. Montrons que la condition est nécessaire. Supposons que (Un)nEN converge vers ~
CE Il et soit t: > O. Il existe N 2: 0 tel que C- E <Un< C+ t: pour tout n 2: N. On en déduit N
N
que ..d
u
C- E:::; UN:::; lim(un):::; lim(un):::; u~:::; f + L
Comme cela vaut pour E > 0 quelconque, il s'ensuit que f :::; lim(un) :::; lim(un) :::; C, ce qui
montre l'égalité des limites inférieure et supérieure, et de la limite.
Inversement, supposons que les limites inférieure et supérieure sont égales dans Il et soit
E > O. Alors, en écrivant la définition de lim(Un) et lim(Un) et en posant f = lim(un)
lim( 11n), nous obtenons les deux propriétés suivantes
o limite inférieure : :3p EN tel que u; 2: f - t:, donc Un 2: C- t: pour tout n 2: p;
o limite supérieure : :3q EN tel que u! :::; C+ t:, donc Un:::; C+ t: pour tout n 2: q.
On en déduit que C- t: :::; Un :::; C+ t: pour tout n 2: max(p, q). ce qui démontre que la
suite (UnlnEN est convergente, de limite C. ■

EXEMPLE 22.61. Soit (unlnEN la suite définie par U2n = (-l)n et U2n+l = n~l.
► Déterminons les suites (u~ln2:o et (u~ln2:o• On peut remarquer que tous les termes de la
suite (unln2:o sont compris entre -1 et 1. Nous avons, pour n EN, U2(2n+ll = -1 et U4n = 1,
on déduit alors que u~ = -1 et que u~ = 1. Nous avons donc lim(un) = -1 et lim(un) = 1.
Ces deux nombres étant distincts, la suite (unlnEN ne converge pas.

Test 22.35. Test 22.36.


Soit (unlnEN une suite réelle bornée. Que peut- Soit (unlnEN une suite réelle. Que peut-on
on dire des suites (u;;:)n:,,o et (utln20 dans le dire de la suite (unlnEN si, pour tout n E N,
cas où (unlnEN est monotone? u;;: =ut?

VIII. LES VALEURS D'ADHÉRENCE D'UNE SUITE

Commençons par une définition qui formalise l'idée qu'à partir d'une suite de valeurs de 1K
on obtient encore une suite en ne retenant qu'une partie des termes de la suite d'origine.

Définition 22.62. Soit (Un)nEN une suite de 1K. Une sous-suite, ou suite extraite, de
(unlnEN est une suite de la forme (vk)kEN, avec vk = U<j>(k) et cp : N ----, N une applica-
tion strictement croissante.
616

Définition 22.63. Soit (unlnEN une suite de 1K. On dit qu'un nombre t E OC est une valeur
d'adhérence de (UnlnEN s'il est limite d'une suite extraite de (UnlnEN·

EXEMPLE 22.64.
► La suite (Un+1 lnEN est une sous-suite de la suite (unlnEN : on a oublié le terme d'indice
nul et sélectionné tous les autres. La fonction cp : N ---, N correspondante est définie par
cp(n) = n + 1.

► La suite (u2nlnEN est une sous-suite de (unlnEPJ dont on a retenu les termes d'indices pairs
et dont on a oublié ceux d'indices impairs. La fonction cp : N ---l N correspondante est définie
par cp(n) = 2n. De même, la suite (u2n+1lnEN est une sous-suite de (unlnEN• avec cp: N---, N
définie par cp(n) = 2n + 1. Si par exemple Un= (-1)n, les suites (u2nlnEN et (U2n+ilnEN
sont les suites constantes de valeurs 1 et -1 respectivement.
► La suite (U(n+ll'lnEN est une sous-suite de (UnlnEN dont le nombre de termes oubliés entre
deux termes consécutifs retenus tend vers +oo.

On peut noter que dans tous les exemples que nous avons cités, on a cp(n) 2 n. En fait,
c'est toujours le cas comme le montre le lemme suivant.

Lemme 22.65, Si q>: N -t N est une application strictement croissante, alors q:,(n) 2: n
pour tout n EN.

PREUVE. On démontre par récurrence sur n l'inégalité (Hnl : cp(n) 2 n. Par hypothèse,
cp(O) E N donc cp(O) 2 0, ce qui montre (H 0 ). Soit n E N quelconque. On suppose que
pour cet entier n, l'inégalité (Hnl est vérifiée. Alors la croissance stricte de cp montre que
cp(n+ 1) > cp(n) 2 n, ce qui entraîne que cp(n+ 1) 2 n+ 1, où on reconnaît (Hn+il- On a
donc établi, par récurrence, l'inégalité (Hnl pour tout n E N. ■

Nous laissons le soin au lecteur de vérifier qu'une sous-suite d'une sous-suite est encore
une sous-suite (ce qui peut rendre bien des services). Nous allons maintenant étudier le lien
entre la notion de valeur d'adhérence et celle de convergence.

Proposition 22.66. Soit (Un)n.EN une suite convergente de limite e. Alors toute sous-suite
de (Un)nEN est convergente, de même limite e.

PREUVE. Soit (Uq,(nJlnEN une sous-suite de (unlnEN, avec cp : N -+ N une application


strictement croissante. On suppose que (Un)nEN converge vers t. Soit t: > O. Par définition
de t, il existe N E N tel lun - fi < t: pour tout n 2 N. Mais cp(n) 2 n 2 N d'après le
lemme 22.65. Il en résulte que iu<t>(nl - tl < t:, ce qui montre la suite (uq,(nJlnEN converge vers
f et prouve notre assertion. ■

La proposition suivante donne une caractérisation des valeurs d'adhérence d'une suite.

Proposition 22.67. Le nombre t E ][( est une valeur d'adhérence de la suite (un)n.EN si et
seulement si
Ve E IR~, 'vN EN, 3n EN, n 2 N tel que !Un - t! < ê..
PREUVE. Montrons que la condition est nécessaire. Soit (unlnEN une suite de OC et soit
(U4>(kJlkEN une sous-suite, de limite t. Soient t: > 0 et N EN. Par définition de f, il existe un
617

entier N' tel que lu<l>(kJ - fi < E pour tout k 2 N '. Il suffit de choisir n = cp (max( N, N ')).
Comme cp est une application strictement croissante, on aura n 2 cp(N) 2 N et lun - fi< E. r/l

Inversement, on suppose que la condition de la proposition est satisfaite pour tout E > 0
et pour tout N 2 O. Pour E = 1 et N = 0, il existe un entier n 0 2 0 tel que luno - fi < 1.
On pose cp(0) = n 0 • Soit p 2 0 un entier quelconque. Supposons np = cp(p) construit tel que
l8
IUnp - €1 < 1/2P, alors la condition de la proposition appliquée à E = 1/2P+l et à N = np + 1 ;:l
0

montre qu'il existe np+ 1 2 np + 1 telle que IU-n,,+ 1 - fi < 1/2P+ 1. On pose cp (p + 1 ) = np+ 1 et r/l
J:l
on constate que cp(p + 1) > cp(p). On obtient ainsi par récurrence sur p EN une application aJ
•Il)
1-,
cp : N ---1 N strictement croissante telle que la sous-suite (Uq,[nJlnEN converge vers C, ce qui r/l

prouve que C est une valeur d'adhérence de la suite (UnlnEN et qui montre l'équivalence
annoncée. ■ ir/l
~
De manière équivalente, on voit que f E 1K est une valeur d'adhérence de la suite (unlnEN si
et seulement si pour tout E > 0, il existe une infinité d'indices n EN tels que f-E <Un< f+E.
Dans la preuve précédente, notons qu'on aurait pu choisir n'importe quelle quite (Ep)pEN
tendant vers 0, à la place de la suite (1/2P)pEN·

Valeurs d'adhérence multiples


Une suite peut posséder plusieurs valeurs d'adhérence; par exemple pour la suite de
terme général Un = (- 1) n ses valeurs d'adhérence sont 1 et -1.

La proposition suivante établit le lien entre les valeurs d'adhérence d'une suite réelle bornée
et ses limites supérieure et inférieure.

Proposition 22.68. Toute suite (Un)nEN réelle bornée vérifie les deux conditions suivantes:
1) la limite inférieure de la suite (Un)nEN est la plus petite
t
de ses valeurs d'adhérence;
2) la limite supérieure de la suite (un)nEN est la plus grande de ses valeurs d'adhérence.

PREUVE. Montrons par exemple que la limite inférieure est une valeur d'adhérence de la
suite (unlnEN, le cas de la limite supérieure étant parfaitement analogue. Soient E > 0 un
nombre réel strictement positif et N un entier naturel. On pose f = lim(unl- Comme e est
la limite de la suite (u;;-)nEN, on peut trouver un entier N' tel que C- f. < u;;- < C+ E pour
tout n 2 N'. Posons m = max(N, N'). Nous avons donc C- E < u;:;:,_ < C+ f.. Par définition,
le réel u;:;:,_ est la borne inférieure de l'ensemble des uk pour k 2 m. Il existe donc un entier
p 2 m tel que u;:;:,_ s Up < l + E. Pour résumer, l'entier p vérifie les deux conditions p 2 N
et IUp - Cl < E, ce qui montre que C = lim(unl est bien une valeur d'adhérence de la suite
(unlnEN, par la proposition 22.67.
Soit maintenant une valeur d'adhérence Cde (UnlnEN· Il existe donc une sous-suite (uq,(k)lkEN
qui converge vers t Pour tout k EN, l'inégalité cp(k) 2 k entraîne que uk S U4>(kJ sut En
passant à la limite, on obtient lim(un) SC S lim(Un). ■

La proposition précédente montre en particulier que toute suite réelle bornée admet au
moins une valeur d'adhérence. Cette propriété est connue sous le nom de théorème de Bolzano-
Weierstrass.

Théorème 22.69. Toute suite bornée de 1K. admet au moins une valeur d'adhérence.
618

PREUVE. Si OC = JR, alors la suite admet au moins pour valeurs d'adhérence ses limites
supérieure et inférieure. Supposons que OC= C. On note (xnlnEN et (YnlnEN les parties réelle
et imaginaire d'une suite (UnlnEN complexe et bornée. Les inégalités lxnl S IUnl et IYnl S IUnl
montrent que (xnlnEN et (YnlnEN sont deux suites réelles bornées. Il existe une sous-suite
(Xcp(nJlnEN convergente. Or, la sous-suite (1J<1>(nJlnEN est bornée. En appliquant une seconde
fois le cas des suites réelles à la suite (1J4>(nJlnEN, on obtient qu'il existe une application
t)> : N --+ N strictement croissante telle que (1J4>(tJ,(nlJlnEN soit une suite convergente. Comme
la suite (Xcp(tJ,(nlJlnEN est également convergente d'après la proposition 22.66, il en résulte que
la suite (U4>[tJ,(nlJlnEN est convergente, ce qui démontre la proposition dans le cas des suites
complexes bornées. ■

Pour terminer, nous allons donner une caractérisation séquentielle très utile des éléments
adhérents à une partie de lR (voir le chapitre 21, partie 11.5).

Proposition 22. 70. Soit A une partie de R Un élément a est adhérent à A si et seulement
si il existe une suite ( a 11JnEN d'éléments de A qui converge vers a.

PREUVE. Soit a E AdhA. Alors tout intervalle de la forme ]a-1/n, a+ 1/n[, pour n EN*,
doit rencontrer A, ce qui signifie qu'il existe un élément CXn E] a - 1/n, a+ 1/n[ n A. La suite
(anlnEN* ainsi obtenue est donc une suite d'éléments de A, et elle converge vers a puisque
1<Xn - al < 1/n. On obtient aisément une suite indexée par N, vérifiant les mêmes propriétés,
en considérant Un= <Xn+l pour n EN.
Réciproquement, soit a E lR tel qu'il existe une suite ( anlnEN d'éléments de A qui converge
vers a. Soit E > O. Alors l'intervalle ]a - t:, a+ d contient un point am, et même une infinité,
par définition de la convergence. Donc am E]a - t:, a+ dnA. Si I est un intervalle ouvert
contenant a, il est clair que I contient un intervalle de la forme ]a - t:, a+ d avec t: > O. On
aura donc aussi A n I -1- 0, ce qui termine la preuve. ■

En retour, la notion d'adhérence d'une partie permet de donner une définition ensembliste
des valheurs d'adhérence d'une suite réelle, dont nous laissons la preuve au lecteur.

Proposition 22. 71. Soit ( Un)nEN une suite de R. On note, pour m E N

Alors l'ensemble des valeurs d'adhérence de la suite (ctnlnEN est nmENAm.

Test 22.37. au moins une valeur d'adhérence.


Soit n un entier naturel non nul. Donner Test 22.39.
l'exemple d'une suite bornée ayant exactement
Soit (unlnEN une suite de lK. Soient <P: N--, N
n valeurs d'adhérence.
et 1j> : N --+ N deux applications stricte-
ment croissantes. La sous-suite (ucp(tJ,(n))lnEN
Test 22.38.
est-elle une sous-suite de (ucp(nJlnEN ou de
Donner l'exemple d'une suite non bornée ayant (litJ,(n)lnEN?
619

IX. EXERCICES
<Il

22.1. 2. Majorer Uzn à l'aide de Un-


3. Trouver la limite de (unln2'.l•

Soient a> 0, b > 0 et (unlnê'.O la suite définie C)

par, 22.6.
g
an-bn <Il
u =--- 11)
n an+bn· ~
Montrer que si les suites (u2nlnEN, (u2n+1lnEN •11)
1--
Etudier la convergence de (unlnê'.O· et (u3nlnEN sont convergentes, alors la suite rll

22.2.
(unlnEN est convergente.
i<Il
22.7. ~
Soit (unlnEN la suite réelle définie, pour tout
C'I
n EN, par C'I
Soient (un)n2'.0 et (vnln2'.0 deux suites bornées. ..d
ü
uo = 1 et Un+l = ✓ 1 +un. 1. Comparer lim(un+vn) et lim(un)+lim(vnl-
2. Montrer que si (vnln>o est convergente,
1. Montrer que pour tous n, m E N
alors lim(un +vnl = lim(u~) + lim Vn.
n------t+oo
lun-Uml 3. On suppose dans cette question que les deux
IUn+l -Um+ll S Z •
suites sont à termes positifs.
2. La suite (UnlnEN est-elle convergente? a. Comparer lim(unvn) et lim(Un)lim(vnl-
b. Montrer que si (vn)n2'.0 est convergente,
22.3. alors lim(UnVn) = lim(Un) lim Vn.
n------t+oo

Soit (unlnEN une suite réelle. Pour n E N, on


uo+u1 +··•+un 22.8.
pose Vn = n+
1
1. Montrer que si (unlnEN est monotone, alors Donner l'exemple d'une suite (unlnê'.O bornée
(vnlnEN est monotone. tel que l'ensemble de ses valeurs d'adhérence
2. Montrer que si (unlnEN est convergente de soit infini et contenu strictement dans l'inter-
limite l, alors (vnlnEN est convergente de limite valle llifil(unl,lim(un)l.
l.
22.9.
3. Que peut-on dire de (vnlnEN si (unlnEN tend
vers l'infini?
Soit (unln2'.1 une suite à valeurs dans 1K telle
4. Si (unlnEN est une suite divergente, (vnlnEN que pour tout n, m E N*
est-elle divergente?
lun+m-Un-Uml S 1
22.4. Montrer que la suite de terme général Un/n est
convergente.
Soit p un entier tel que p :::: 2. Pour n E N*,
on pose Un = 1 + 1/2P + • · · + 1/nP et 22.10.
Vn =Un+ l/nP- 1. Montrer que (unlnEN* et
(vnlnEN* sont deux suites adjacentes Pour n E N et O :s; k :s; n, on pose C~ =
n!
(n-k)!k!"
22.5. 1. Montrer que sin:::: 2 et 2 :s; k :s; n-2, alors
C~:::: C;.
On considère la suite (unln>1 définie par 2. En déduire l'inégalité
Un=l(_l_+_l_+···+_l__) -
vn . n-2
n v'1 v'2
1. Montrer que la suite (unln2'.1 est monotone
L _2__ < z(n-3)
k=Z C~ - n(n-1)
et qu'elle est convergente.
620

3. Déterminer la limite de la suite de terme gé- 22.14.


néral Un donné par
Montrer que la suite de terme général sin n
n'est pas convergente.

22.15.
22.11.
1. Montrer que pour tout n E N, il existe
Soient k un réel positif et (Un)n?,:o une suite à
un unique réel Un dans l'intervalle ] - n/2 +
valeurs dans K tels que pour tout n E N
nn, n/2 + nn[ tel que tan Un = Un-
1Un+2 -1.1.n+1I S klun+l -1.1.nl. 2. Montrer que limn---->+oo Un = +oo.
l. Montrer que si k E [O, 1[, alors la suite 3. Que peut-on dire de la suite de terme général
(Un)n?,:1 est convergente. Un/n?
2. Etudier la convergence de la suite (un)n?::1
dans le cas où k 2:: 1.
22.16.

22.12.
Le terme uo étant donné dans un sous-ensemble
de lR convenable, que l'on déterminera, étudier
Soit (Un)n?,:o une suite à valeurs dans lRi. Pour la convergence des suites homographiques suc-
n EN, on pose Vn = Un+1/un et Wn = (un) l/n. cessivement associées aux homographies
On suppose (vnlneN convergente de limite l.
Montrer que (Wn) nEN est convergente de limite f()=4x+2 ()=7x-12
l. X X+5 ' g X 3x - 5 .

22.13.

Si (Un)n> 1 est une suite réelle à termes positifs, 22.17.


on lui as;ocie la suite (vn)n?,:1 définie par
Le terme uo étant donné dans un sous-ensemble
Vn = Ju1 + ✓u2 + · · · + Ju;;:. de lR convenable, que l'on déterminera, étudier
la convergence des suites homographiques suc-
1. Montrer que la suite (vn)n?,:1 est croissante. cessivement associées aux homographies
2. Prouver que si la suite (Un)n?,:1 est
x-1 X
constante, alors (vn)n?,:1 est convergente. f(x) = - - , g(x) = - - .
x+ 1 x+ 1
3. Que peut-on dire de (vn)n?,:1 si (un)n?,:1 est
majorée?
COMPLÉMENT 1. JEUX ET INTÉRÊTS

Les tours de Hanoï et les intérêts bancaires

(a) Dans le jeu des tours de Hanoï, des anneaux, de tailles décroissantes, sont enfilés sur un
axe (voir la figure 22.1). On dispose de deux autres axes libres. La règle du jeu impose que
l'on ne puisse sortir qu'un seul anneau à la fois du haut d'une tour pour l'enfiler sur un autre
axe, à condition qu'il repose sur un anneau plus grand. Elle interdit d'autre part de poser
l'anneau ailleurs que sur un axe. Est-il possible de déplacer tous les anneaux d'un axe sur un
autre et si oui, quel est le nombre minimum d'opérations nécessaires?

FIGURE 22.1. une tour de Hanoï de neuf anneaux

(b) Une personne contracte un emprunt de 100 000 euros sur 10 ans auprès d'un établissement
bancaire à un taux nominal annuel de 4%. A combien s'élèvent ses annuités mensuelles? Au
bout de deux ans, elle hésite entre rembourser par anticipation 50 000 euros en maintenant
le montant de ses annuités, et investir cette somme sur un placement sûr à un taux nominal
également de 4% pendant les 8 années restantes. Que lui conseillez-vous?
Ces deux problèmes ont l'air très différent. Et pourtant, leur résolution mathématique
conduit à des calculs similaires! Nous allons voir en effet que dans les deux cas, et contraire-
ment à ce que voudrait vous faire croire votre conseiller bancaire, il suffit de savoir calculer
les termes d'une suite arithmético-géométriq ue. Ceci montre bien le caractère universel des
méthodes que nous introduisons.

1.1. Les suites arithmético-géo métriques


Définition 22.72. On appelle suite arithmético-géométrique toute suite (UnlnEN de lR ou C
définie par une relation de récurrence de la forme Un+ 1 = UUn + b, pour tout n E N, où a
et b sont deux nombres fixés.

On distingue trois cas. Les deux premiers sont bien connus.


◊ Si u = 1 , la suite définie par la relation Un+ 1 = Un + b est appelée suite arithmétique de
raison b. On a Un= u 0 + nb pour tout n EN.
◊ Si b = 0, la suite définie par la relation Un+l = UUn appelée suite géométrique, de raison
a. On a Un= Uo · un pour tout n EN.
◊ Supposons que a -/= 1 et b -/= O. L'idée est qu'il suffit de trouver une suite particulière
(vnlnEN qui vérifie la relation Vn+l = uvn + b pour les connaître toutes les suites. En effet, on
a alors
La suite de terme général Wn = Un -Vn est donc géométrique, de raison a, et on a Un - Vn =
(Uo-Vo)an. Inversement, on vérifie immédiatement qu'une suite de terme général de la forme
Un= Vn + an(u0 -v 0) satisfait la relation de récurrence souhaitée. Il ne reste donc plus qu'à
trouver une suite particulière (vnlnEN et l'idée est ici de la chercher sous la forme la plus
simple possible, c'est-à-dire constante. On pose donc Vn = C, avec C solution de l'équation
C= aC + b, ce qui est toujours possible car a-/- 1. On a donc démontré le résultat suivant.

Proposition 22.73. Soient (a, b} E C 2 tel que a =/:- 1 et (Un)T\EN une suite de C qui 'Uérifie
la relation Un+1 = UUn + b pour tout n EN. Alors

'v'nEN, U n = b
--+a
1-a
n( b ) .
Uo---
1-a

b
PREUVE. On a montré que Un= C+ an(u0 - C) avec C= aC + b, soit encore C= - - - . ■
1 -a

1.2. Le problème des tours de Hanoï


Commençons par fixer les notations. Soit N le nombre d'anneaux. On ordonne ces anneaux
par tailles croissantes et on les identifie à leur rang. Une tour est donnée par la liste de ses
anneaux, énumérés de la base au sommet. Une position du jeu est alors une liste ordonnée
des 3 listes obtenues. Par exemple, la position de la figure 22.1 est donnée par les listes
(9,8,7,6,5,4,3,2,1) 0 0.
La règle du jeu impose que chaque liste (n 1 , ... , np) vérifie la condition n 1 > n 2 > • •• > np.
En particulier, un coup est légal si et seulement si il consiste à modifier deux listes parmi les
trois, de la manière suivante :

On peut, grâce à ces notations, commencer à expérimenter le jeu. Un déroulement raison-


nable du jeu suit les premières étapes suivantes :

a) (N, N - 1, ... , 1) 0 0·
b) (N,N-1, ... ,2) (1) 0·'
c) (N,N-1, ... ,3) (1) (2);'
d) (N, N - 1, ... , 3) 0 (2, 1) ;
e) (N,N-1, ... ,4) (3) (2, 1).

a) ---+ b) Le premier coup n'est pas très intelligent. Il s'agit de déplacer l'anneau 1 dans l'une
des deux autres tours. Comme le rôle des deux dernières tours est symétrique au début du
jeu, on a choisi de placer 1 sur la deuxième tour.
b )---+ c) Le deuxième coup est forcé. Il est en effet interdit de ramener 2 au dessus de 1. Il
serait possible, mais stupide, de ramener 1 à sa position de départ. Placer 1 sur la troisième
tour donnerait une position équivalente.
c)---+ d) Ramener 2 au dessus de 3 au troisième coup serait idiot. Il est interdit de bouger 3.
Mais 1 a deux options. Si on ne veut pas poser 1 au dessus de 2, alors 1 va indéfiniment aller
et venir entre la première et la deuxième tour.
d)--t e) Ne pas toucher à 3 obligerait 1 à faire indéfiniment des va-et-vient entre la première
et la troisième tour, à moins de revenir dans la position c). L'anneau 3 ne peut aller sur la
troisième tour. On obtient donc bien la position e) en quatre coups.
Remarquons que l'on a déplacé la pile (2, 1) du premier axe au troisième axe en 3 coups
(à l'étape d)), ce qui résoud le problème pour N = 2. Pour N ? 3, le jeu étant maintenant
dans la position e), nous arrivons au point clef du raisonnement. Imaginons par la pensée que
l'on enfonce les deux premières tours dans le socle du jeu. On obtient la nouvelle position
0 0 (2, 1).
Mais on sait maintenant déplacer une tour (2, 1 ). On obtient donc en 3 coups
0 (2, 1) 0.
En fait, les anneaux ne s'enfoncent pas dans le socle. Ce n'était pas prévu par le fabricant.
Par une même opération magique de la pensée, ils refont donc surface et on observe que les 3
mouvements précédents des anneaux 1 et 2 restent légaux. On a donc en réalité la position
(N,N-1, ... ,4) (3,2, 1) 0.

On a donc réussi à déplacer la pile (3, 2, 1 ), ce qui résoud le problème pour N = 3, et de


proche en proche, pour tout N.

Proposition 22.74. Le nombre de coup$ minimum pour déplacer une pile de N anneaux
dans le jeu de Hanoi est 2N -1.

PREUVE. o On vient de se convaincre qu'un tel nombre existe. Démontrons le formellement


par récurrence sur N. On note UN ce nombre, s'il existe. Pour N = 0, on a évidemment
1
u 0 = 0 = 2° - 1. Pour les inquiets, on a tout aussi immédiatement que u 1 = 1 = 2 - 1.
Soit N ? O. On suppose que UN existe et on considère la position
(N + 1, . .. , 1) 0 0.

Par hypothèse de récurrence, il est possible de déplacer la pile (N, ... , 1) sur le troisième
axe en UN coups. On obtient
(N + 1) 0 (N, ... , 1) (22.1)

On déplace ensuite l'anneau N + 1 sur le deuxième axe. On obtient


0 (N +1) (N, . .. , 1). (22.2)

On utilise une seconde fois l'hypothèse de récurrence pour déplacer la pile (N, ... , 1) du
troisième axe sur le deuxième en UN coups. Et c'est gagné. On en déduit que UN+l existe et
que UN+l ~ UN+ 1 + UN = 2uN + 1.
o Inversement, soit un enchaînement de coups qui déplace la première tour sur le deuxième
axe. On considère la première position pour laquelle il est possible de déplacer l'anneau N + 1.
Cette position doit comporter nécessairement un axe libre, par exemple le deuxième, puisque
qu'on ne peut déposer N + 1 sur aucun autre anneau. Elle est donc de la forme (22.1) et elle
se présente après au moins UN coups car seuls les anneaux 1, ... , N ont été déplacés.
De même, considérons la position du jeu juste après avoir touché pour la dernière fois
l'anneau N + 1. Elle est de la forme (22.2), quitte à échanger les axes extrêmes, et il reste au
moins UN coups pour déplacer la pile (N, N - 1, ... , 1 ). Comme on a déplacé au moins une fois
l'anneau N + 1, nous comptabilisons déjà 2uN + 1 coups, ce qui montre que UN+l ? 2uN + 1.
Ainsi, le nombre UN existe pour tout N ? O. On obtient une suite (unlnEN qui vérifie
les conditions Uo = 0 et Un+l = 2un + 1 pour tout n E N. L'équation f = 2f + 1 donne
l = -1. D'après la proposition 22. 73, Un -1 + zn( 0 - (-1)) = zn - 1, ce qui prouve
notre assertion.

Remarque. Pour N = 9, si on considère qu'il faut en moyenne une seconde pour déplacer
un anneau, il faut environ 8 minutes et 30 secondes pour terminer le jeu. Pour N = 15, il faut
environ 9 heures 6 minutes et 7 secondes pour gagner, ce qui est déjà une performance, certes
complètement idiote. Pour N = 30, si on ne se trompe jamais, en travaillant à raison de 12
heures par jours, 7 jours sur 7, 365 jours sur 365, il faut un peu plus de 68 années, avec un
jour de repos gracieusement offert chaque année bissextile ... Pour N = 64, il faut, dans les
mêmes conditions, "un peu" plus de 11 milliards de siècles soit près de 100 fois l'âge connu de
l'univers. Seriez-vous surpris d'apprendre que ce jeu a été inventé7 par un mathématicien?

1.3. Le problème des intérêts compensés

Revenons maintenant au problème des intérêts dus au banquier. Soit N E N le nombre total
des échéances mensuelles d'un emprunt. Pour O :S: n :S: N, soit Un le restant dû. Le nombre
Uo est donc le capital emprunté, et pour n = N la dette est épongée : UN = O. On note 't
le taux nominal annuel. Généralement, les banques prennent pour règle 8 que le taux mensuel
vaut 't 1 = 't/12. L'intérêt dû à la banque au mois n + 1 s'élève donc à In+l = 't 1Un. Soit b la
mensualité payée chaque mois. Le restant dû au mois n + 1 est donc
1
Un+l =Un+ 't Un - b,
soit encore 't
Un+i = UUn - b, avec u = 1 +
12 .
Au nième mois, la quantité In revient en intérêts à l'organisme prêteur, seule la somme
An = b - In = Un-1 - Un rembourse le capital emprunté. On l'appelle l'amortissement.
L'emprunt est donc entièrement décrit par la donnée de la famille (Un, In, Anlo,;;;n,;;;N- On
l'appelle l'échéancier.

Proposition 22.15. Soit (Un)ne111 une suite réelle et soit (a, b} E R2 tel que a > 1. On
suppose que Un+1 = aUn - b pour tout-n EN et qu'il existe N ~ 0 tel que UN= O. Alors

: a-1
'v'nEN, Un=~+an(Uo--b-) et . b =:uo 1-a-N
a-1 a-1

PREUVE. L'expression de Un est donnée par la proposition 22. 73. De plus,

UN= 0 # ~1
u-
+ UN (uo - ~1) = 0 #
u-
b= Uo lu- l-N .
- u ■

On obtient les résultats suivants, avec des calculs très simples laissés à la charge du lecteur.

7
Par le français Édouard Lucas (1842-1891) connu aussi pour ses travaux en théorie des nombres.
8 12
C'est tout à leur avantage puisque ( 1 + TI) > 1 + -r pour -r > O.
Règle 22.76.
Soit C le capital emprunté, N le nombre d'échéances, b la mensualité et 'T le taux annuel.
On pose a= 1 + -r/12. On a alors les propriétés suivantes :
. -rC/12
1) pour (C, N,-r) donné, la mensualité est b = _ _,.;
1 0
2) la nième échéance donne b =In+ An avec
an- 1
(restant d{J.j et C - Un = Ca N _ (capital amorti),
1
-rC an-1
et An=u aN-1 (amortissement}.

3) pour (C, b,-r) donné, le nombre d'échéances est bien défini si et seulement si -rC < 12b.
C'est le plus petit entier N tel que a-N:::; 1 - ~;
. . b(l -a-N)
4) pour (b, N, 'T) donné, la capacité d'emprunt est Uo = -r/l2 .

EXEMPLE 22. 77. On revient sur la question (b) du début de la partie.

1 4 1
C = 100000; N = 12 · 10 = 120.
T = 12 · 100 = 300 ;

D'après la règle 22.76.1), les mensualités sont de b '.: : '. 1012,45 euros et. au bout de 2 ans,
le restant dû est u 24 '.::::'. 83 060 euros. Si l'emprunteur rembourse par anticipation 50 000
euros, alors C' = 33060 euros restent dus. La règle 22.76.3) montre qu·en gardant les mêmes
mensualités, il ne reste plus que 35 échéances. L ·emprunt aura donc été remboursé en 5
ans. Sur les 5 autres années, on peut investir la somme b chaque mois sur un placement,
par exemple à 4%. Cela signifie que l'on capitalise chaque mois une somme Vn telle que
Vn+l = a'vn + b avec v 0 = 0 et, cette fois-ci . a'= (1 + T)
9 1112
. L'expression des termes Vn
est donnée par la proposition 22.73. Cinq ans plus tard. on dispose donc de

a'60 - 1
V Go = b ~ 67 003 euros.
a'- 1
Si, en revanche, on place C"=50 000 euros à -!o/c. l'évolution du capital est donnée par une
suite géométrique (v~lncN de raison a' et telle que Vo = C", soit au bout de 8 ans

v~ 6 = C"(l + T) 8 '.::::'. 68428 euros.

La différence n'est donc pas très sensible et il faudra prendre en compte d'autres aspects
de la question (comme la facilité de mise en œuvre, la disponibilité de l'épargne, le coût de
l'assurance, l'évolution des taux d'intérêts, le facteur humain ... ) pour prendre une décision.

12
9
Car 1 + -r < (1 + TI) pour -r > O. Un banquier ne se trompe pas non plus dans ce sens-là.
COMPLÉMENT 2. LES SUITES HOMOGRAPHIQUES

Quelques notions de dynamique dans (['.

Une fonction homographique est une fonction rationnelle, définie comme le quotient de deux
fonctions polynomiales à coefficients complexes, et injective sur son domaine de définition. On
peut montrer qu'une fraction rationnelle est injective si et seulement si elle est de la forme

f(z) = az+ b, (22.3)


cz+ d
avec a, b, c, d E C satisfaisant la condition ad - be -/- O. Une telle fonction est donc définie
sur le plan C sic= 0 ou sur le plan épointé C\{-d/c} sic-/- O.
Dans cette partie, nous allons étudier la dynamique engendrée par une telle fonction.
Partant d'un point u 0 E C, nous voulons décrire le comportement asymptotique de ses itérées
par la fonction f. Autrement dit, nous voulons étudier la nature de la suite de terme général
de la forme Un = fn(u 0 ), où fn = f o • • · of désigne la composition de n fois la fonction f.
Nous allons donc considérer la suite complexe (UnlnEN définie par la condition initiale u 0 E C
et par la relation de récurrence
aUn+b
Un+l = CUn + d.
On remarque que cette suite nous est bien connue pour certaines valeurs de a, b, c et d.

EXEMPLE 22. 78. Cas où c = b = O. La suite définie par Un+i = ~Un est une suite géo-
métrique de raison a/ d.
On montre facilement par récurrence que Un= Uo ( ~) n_
► Si Uo = 0, (unlnEN est constante de valeur nulle.
► Si u 0 -/- 0 et la/ dl < 1, alors la suite converge vers zéro.
► Si u 0 -/- 0 et Ia/ dl > 1, alors lunl tend vers +oo.
► Si u 0 -/- 0 et Ia/ dl = 1, nous laissons le soin au lecteur de vérifier que
◊ soit a/ d est une racine qème de l'unité et la suite (UnlnEN est périodique de plus
petite période q,
◊ soit ( a/ d) q -/- 1 pour tout q E N et tout point du cercle de centre zéro et de rayon
luol est valeur d'adhérence de (unlnEN·

EXEMPLE 22.79. Cas où c = 0 et b-/- O.


► La suite définie par Un+i = ~un+ ~ est une suite arithmético-géométrique. Nous avons
beaucoup parlé de cet exemple dans le complément précédent et nous n'y reviendrons pas.
Contentons nous de rappeler que le cas où~ -/- 1 se ramène à l'étude d'une suite géométrique,
traité dans l'exemple précédent, en considérant la suite de terme général Vn = Un - ex, où ex
est l'unique solution de l'équation x = ~x + l

EXEMPLE 22.80. Cas où a= d = O.


► La suite donnée par Un+l = ~nd est définie si Uo-/- O. On remarque que Un+2 = (b/1:;';~un =
Un. Si u§ = b/c, alors (unlnEN est constante. Sinon, (unlnEN est périodique, de plus petite
période 2, de valeurs u 0 et d~ qui sont donc aussi ses deux seules valeurs d'adhérence.
2.1. Étude des fonctions homographiques
Dans tout ce qui suit, nous supposerons désormais que e -1- 0 et que ad-be -1- O. L'exemple des
suites arithmético-géométriques suggère que l'étude des points fixes 10 d'une fonction homo-
graphique jouera un rôle important dans la compréhension des suites homographiques qu'elle
définit. Aussi allons nous y consacrer l'essentiel de cette partie. Commençons par vérifier que
les fonctions de la forme (22.3) sont injectives.

Proposition. 22.81. Soient a, b, c,d dans C. On suppose que c 1- 0 et ad- be 1- O. Soit f


la fonction définie par f(z) = (az+ b)/(cz+ d). Alors f réalise une bijection de l'ensemble
C \ {-d/c} sur l'ensemble C \ {a/c}. On a donc

az+b wd'-b
w::; - - d E C \ {a/c} # z = - - - E C \ {-d/c} (22.4)
cz+ · -cw+a
PREUVE. o Montrons d'abord que f prend bien ses valeurs dans C\ {a/e}. Supposons en effet
qu'il existez E C \ {-d/e} tel que f(z) = a/e. Alors
az+ b a a ad ad
- - = - # az + b = -( ez + d) = az + - # b = - # ad - be = 0,
ez+ d e e e e
ce qui est contraire aux hypothèses. Ainsi, f réalise bien une application de C \ {-d/c} dans
C \ {a/c}.
o Montrons maintenant que si w E C \ {a/c}, alors il existe un unique antécédent z dans
C\ {-d/c} tel que f(z) = w. Notons qu'évidemment -c -1- 0 et da- (-b )(-c) =ad-be -1- O.
Le point précédent, appliqué à la fonction définie par g(w) = ( a'w+ b')/(c'z+d) avec a'= d,
b' = -b, c' =-cet d' = a, montre donc que (wd - b )/(-cw + a) -1- -d/c. On a donc
az+ b wd-b
w = - - #w(cz+ d) = az+ b # z(a-cw) =wd- b # z= - - - ,
cz+ d -cw+ a
ce qui démontre l'existence d'un unique antécédent par f donné par la condition (22.4). ■

Si une suite 11 homographique de la forme précédente converge vers une limite e E C, on


ne peut avoir f = -d/ e. Sinon, en passant à la limite la relation Un+ 1(Clin+ d) = aUn + b et
en tenant compte des opérations sur les limites, on aurait O = a(-d/c) + b, ce qui contredit
l'hypothèse ad - be -1- O. Passant à la limite la relation Un+1 = (aUn + b)/(cUn + dl, on
obtient que f = (ai+ b )/(cf+ d) = f(e), c'est-à-dire€ est un point fixe de f. Cette condition
se traduit de manière équivalente par le fait que f est racine de l'équation du second degré
cx 2 + (d- a)x- b = O. (22.5)

Deux cas se présentent sur C pour cette équation, selon que le discriminant ~ = ( d- a )2 +4bc
s'annule ou non. Nous allons les étudier en détail.

Premier cas : ~ = 0 et l'équation (22.5) admet une racine double !X.


La condition~= 0 s'écrit encore (a+ d) 2 = 4(ad- be) et on a !X= 2 Posons
0
t
1
g(z) = - - pour tout z E C \ {!X}.
z- (X

10
C'est-à-dire des solutions de l'équation f(x) = x.
11
On ne se préoccupe pas ici de savoir pour quelles valeurs de u 0 les itérées Un = fn ( Uo) sont toutes bien
définies, c'est-à-dire que Un # -d/c. Nous renvoyons cette discussion à la partie 2.2.
Alors pour z i= a, on a f(z) i= f(a) = a puisque f est injective, et
1 1 = (ea+d)(ez+d) = ea+d(ez+d) (z)
go f(z) = f(z) _ a f(z)-f(a) (ad-be)(z-a) ad-be g ·
Mais z =a+ /zr Aussi (ez + d)g(z) = (ea + d)g(z) + e. On a donc
9

2
f(z) = (ea + d} (z) + e(ea + d}.
0
g ad - be g ad - be
2
Enfin, ea + d = aid et ad - be= (a~dl • La formule ci-dessus se simplifie et on obtient

2e
go f(z) = g(z) + --d.
a+
Pour résumer, on a donc montré le résultat suivant.

Proposition 22.82. Soient a, b, e, d dans C. On suppose e i= 0, ad - be i= 0 et  =


(a + d )2 - 4{ ad - be) = O. Alors la fonction homographique définie par

f(z) = az+ b
ez+d
admet un unique point fixe <X= 01:/ E C \ {-d/e} qui est racine double de l'équation (22.5).
De plus, si an pose g{z} = 1/(z - a), alors, pour tout z i= a, an a

2e
go f(z} = g(z) + ___.;___d'
a+ (22.6)

Second cas : Â i= 0 et l'équation {22.5) admet deux racines simples a et 13.


Considérons la fonction homographique définie pour z E C \ {13} par

z- a l3g(z) - a
g(z) = --a. # z = ( ) .
z- JJ g z - 1

Alors un calcul analogue au cas précédent montre que pour z i= 13 on a f(z) i= 13 et


f(z) - f(a) e/3 + d
g O f(z) = f(z) - f(/3) = ea + d g(z).

Pour résumer, on a donc montré le résultat suivant.

Proposition 22.83. Soient a, b, e, d dans C. On suppose e i 0, ad - be i= 0 et  =


( a + d )2 - 4( ad -. be) i- 0. Alors la fonction homographique définie par

f(z} = az+ b
ez+d
admet exactement deux points fixes a et f3 dans C \ {-d/e} qui sont racines simples de
l'équation (22.5). De plus, si an pose g(z) = {z-oc)/(z- f3), alors, pour tout z i a., on a

go f(z}
ef3 + d
= --d"g(z}. (22.7)
ecx+
2.2. Domaines de définition des suites homographiques
Dans cette partie, nous étudions la question du choix de la condition initiale pour qu'une
suite homographique soit bien définie. Il faut non seulement que Uo soit dans le domaine de
définition de la fonction homographique associée à la suite, mais aussi que toutes les itérées le
soient aussi. Nous allons voir que notre travail préliminaire sur les fonctions homographiques
va nous être d'un grand secours.

Proposition 22.84. Soient a, b, e, d dans C. On suppose e -::/- 0, ad - be -::/- 0 et i\ =


(a+d} 2 -4{ad-bc} = O. On pose f(z) = (az+b}/{cz+d). Alors la relation 1Ln+1 = f{Un)
définit bien une suite sur N si et· seulement si Uo E C \ S, avec

PREUVE. Posons ex = (a - d)/(2c) et g(z) = 1/(z - ex). La suite (fn(uollnEN est bien
définie si et seulement si fn(u 0 ) i= -d/c, soit encore, puisque g est injective, si g(fn(uo)) i=
g(-d/c) = -2c/(a+ d). Mais il est facile de montrer par récurrence sur n 2 1 à partir de la
relation (22.6) de la proposition 22.82 que
2cn
g (fn(uo)) = g(uo) + a+ d.

On doit donc éviter la condition g(u0 ) +2nc/(a+ d) = -2c/( a+ d), ce qui donne exactement
l'ensemble S annoncé. ■

Proposition 22.85. Soient a, b, c, d dans <C. On suppose c -::/- 0, ad - be i= 0 et A =


(a+ d) 2 - 4(ad- be) :;/=: O. On note ex et j3 les deux racines de l'équation {22.5). On pose

cj3+d f(z)=az.+b_
r=--- et
ccx+d · cz+d

Alors la relation Un+t = f(Un) définit bien une suite sur N si et seulement si Uo E <C \ S,
avec
S= {
cxrn+
rn+l -
1
-j31 }
1 n EN .

PREUVE. Posons g(z) = (z-cx)/(z-j3 ). La suite (fn(UollnEN est bien définie si et seulement si
fn(u 0 ) i= -d/c, soit encore, puisque g est injective, si g(fn(Uo)) i= g(-d/c) = 1/r. Mais il est
facile de montrer par récurrence sur n 2 1 à partir de la relation (22. 7) de la proposition 22.83
que

On doit donc éviter la condition g(uo) 1/rn+l, ce qui donne exactement l'ensemble S
annoncé. ■

2.3. Propriétés asymptotiques


Dans cette partie, nous étudions la limite d'une suite homographique ayant pour condition
initiale Uo (/_ S. Ici encore, nous allons voir que notre travail sur les fonctions homographiques
va nous être très utile.
Théorème 22.86. Soient a, b,e, d dans C tels que e #- .0 et ad - be -i- O. Soit f la
fonction homographique définie part: C \ {-d/e}-t C \ {a/e}, z H {az+ b)/(ez+ d). Soit
Uo E C; On suppose que la relation Un+1 = f(Un) définit une suite sur N. On suppose que
Ll = {a+ d) 2 -4( ad- be) = O. On note ix E C \ {-d/e} l'unique point fixe de f. On a alors
l'alternative suivante :
◊ soit la suite (Un)nEN est constante, de valeur (X,
o soit la suite (Un)nEN ne prend jamais la valeur (X; mais elle converge vers ix.

PREUVE. Supposons que u 0 = (X. Alors f(uo) = f((X) = (X et il est immédiat que la suite
(UnlnEN est constante. Inversement, supposons qu'il existe n 2: 1 tel que Un = (X. alors
Un-l = f- 1 ((X) = (X et, de proche en proche, on en déduit que (X= (f- 1 Jn(un) = Uo, ce qui
montre que la suite (UnlnEN est constante de valeur (X. On a donc montré que (UnlnEN prend
la valeur (X si et seulement si elle est constante.
Supposons maintenant que (UnlnEN ne prend jamais la valeur (X. On peut donc considérer
la suite définie par Vn = 1/(un - (X). Alors, la proposition 22.82 montre, avec les mêmes
notations, que Vn = g (Un) et que

le
Vn+l =Vn +--d.
a+
On reconnaît une suite arithmétique de raison 2c/(a+ d). Il en résulte que Vn = v 0 +2nc/( a+
d). Ainsi (a+ d)(u.o- (X)
Un= (X+ 1/vn = (X+ - - - - - - - - , - - - - - -
a+ d + 2nc(uo - (Xl
et la suite (UnlnEN converge bien vers (X.

Théorème 22.87. Soient a, b,e, d dans C tels que e #- 0 et ad-be f: O. Soitf la fonction
homographique définie par f :C \ {,-.d/e}---¾ C\ {a/t}, ZH {oz+ b)/(cz+d). Soit u.o E C.
On suppose que la relation Un+1 = f(Un) définit une suite sur N. On suppose que

Ll = (a+ d)4-4(ad- be)#- 0


et on note (X et /3 dans C \ {-d/c} les deux points fixes de f. On pose 1' =~!:.Alors on a
l'alternative suivante :
o soit Uo E {ix, /3} et la suite (Un)nEN est constante.
◊ soit la suite (Un)nEN ne prend jamais les valeurs (X ou /3.
De plus, dans ce second cas, la suite (Un)nEN se comporte comme suit:
(a) si !rl < 1, alors la suite (Un)nEN converge vers 0t;
(b) si !Tl> 1 alors la suite (Un)neN converge vers~;
(c) sir est une racine qième de l'unité, alors la suite (Un)nEN est périodique, de plus petite
période q;
(d) si rq f: 1 pour tout q 2: 1, alors la suite (Un}nEN a pour ensemble de valeurs d'adhérence
dans C un cercle non réduit à un point ou une droite.

PREUVE. La démontration de l'alternative entre suites constantes et suites ne prenant jamais


les valeurs (X ou 13 est analogue à celle du théorème 22.86. Nous allons nous concentrer sur
la description des propriétés asymptotiques de (UnlnEN en fonction de r. On suppose donc
que Un #- ex et Un #- j3 pour tout n E N. On peut donc former une suite de terme général
Vn = g(un), avec les notations de la proposition 22.83, soit encore

Un- (X
Vn= ---P..
u.n-1--'

Or, l'équation (22.7) s'écrit Vn+l = g(f(u.n)) = rg(Un) = rvn. On reconnaît la définition d'une
suite géométrique de raison r. Ainsi Vn = rnv 0 et
ex - j3vorn
Un= .
1 -vorn

o Si lrl < 1, la suite (unlnEN converge bien vers ex car vorn converge alors vers zéro.
· 11 1 , ·
o S1 r > , on ecnt Un = ( /
(cx/vo)r-n_
) j3 et 1·1 est a1ors 1mm
· édi" t
a que Un converge vers 1P. car
J
1 Vo r-n _ 1
( 1/v 0 )r-n converge vers zéro.
o Si r est une racine qième de l'unité, alors la suite de terme général rn est périodique et de
plus petite période (strictement positive) q. La périodicité de la suite (Un)nEN en résulte.
o Enfin, si lrl = 1 et sir n'est pas une racine de l'unité, nous ne donnons qu'une esquisse de
la démonstration et laissons au lecteur le soin de vérifier les détails. On peut montrer à partir
de l'étude des sous-groupes de IR que le groupe multiplicatif {rn I n E Z} est dense dans le
cercle 1U = {z I lzl = 1} et que cela entraîne que l'ensemble de ses valeurs d'adhérence est le
cercle unité 1U tout entier. L'ensemble des valeurs d'adhérence de (Un)nEN est alors exactement
l'image de 1U\ {1 /vo} par l'application z H ( ex- j3v 0 z)/( 1-v0 z). On obtient un cercle si v 0 (/.1U
et une droite si v 0 E 1U. ■

Remarque. On peut préciser le cas des suites homographiques réelles. On suppose que
a, b, c, d E IR et Uo E IR, que ad- be i- 0 et que ci- O. Le cas ll i- 0 comporte deux sous-cas
selon le signe de ll.
o Le cas ll > 0 est identique au cas complexe.
o Dans le cas ll < 0, la fonction f n'a pas de point fixe réel et donc la suite ne peut pas
converger. Ceci est cohérent avec notre discussion dans (C puisque dans ce cas ex et j3 sont
conjugués, et donc lrl = 1.

3
EXEMPLE 22.88. Étudions la suite homographique définie par Un+i = un -/, u 0 ER
Un+
► L'équation aux points fixes s'écrit ici x - 2x + 1 = O. dont la seule racine est 1. On pose
2

donc Vn = un1_ 1 et on vérifie que Vn+ 1 = Vn + 1/2. Ainsi Vn = Vo + 1- Il en résulte que


1
Un=--+1
1 +vo
converge vers 1. En outre, Un= -1 si et seulement si 't'1vo + 1 = -1, soit encore si u 0 = ~:;:;
comme le montre un calcul facile. Pour que la suite de terme général Un soit bien définie
pour tout n E N, il faut et il suffit donc que
COMPLÉMENT 3. CONSTRUCTION DE fi;.

Des suites de Cauchy aux nombres réels

Nous proposons ci-dessous, sous forme d'un problème, une autre construction de lR que
celle vue en complément dans le chapitre précédent. Elle s'appuie sur la notion de suite de
Cauchy et elle est due à Cantor et Méray.
Dans cette construction, nous allons nous laisser guider par le fait que nous savons a
posteriori que les réels seront « approchables » par des rationnels en ce sens qu'ils seront
des limites de suites rationnelles. Nous avons donc envie de définir ce corps des réels comme
l'ensemble de toutes les limites possibles de suites rationnelles. Nous ne pouvons pas faire cela
directement ainsi car précisément nous ne pouvons pas définir ce qu'est une suite rationnelle,
qui convergerait vers une limite non rationnelle, avant d'avoir défini les réels. Pour éviter ce
cercle vicieux, nous allons introduire une nouvelle notion, celle de suite rationnelle de Cauchy,
qui est une cas particulier de suite d'éléments de Q.
Nous définissons pour cela une suite rationnelle de Cauchy comme étant une suite (unlnEN
de rationnels vérifiant

VE E Q~, :3N EN tel que V(n, m) E N 2 , si N s; ms; n, alors IUn - uml s; L

Notons alors C (pour Cauchy ou Cantor) l'ensemble de ces suites.


1. Vérifier que l'ensemble C est un sous-anneau de l'anneau commutatif des suites rationnelles.
2. Montrer, en donnant un élément non nul et non inversible, que cet anneau n'est pas un
corps.
3. Définissons sur C la relation suivante :

Vu= (UnlnEN E C, Vv = (vnlnEN E C, u R V si et seulement si u-v a pour limite O.

3.1. Vérifier que cette relation est une relation d'équivalence sur C. On note C = C/R et
C -, C la surjection canonique.
7t :
3.2. Vérifier que C = C/R hérite d'une structure naturelle d'anneau commutatif pour
laquelle 7t est un morphisme d'anneaux.
4. On veut montrer que C est un corps, c'est-à-dire que tout élément non nul est inversible.
Soit donc il = 7t( u) un élément non nul de C.
4.1. Montrer que si une suite de Cauchy ne tend pas vers zéro, seul un nombre fini de ses
termes peuvent être nuls.
4.2. En déduire que u n'a qu'un nombre fini de termes nuls.
Posons alors M = max lukl + 1 et considérons la suite m dont les n 0 premiers termes sont
k:C:no
égaux à M et les autres sont nuls.
4.3. Vérifier que il= n(u) = n(u + m) et que la suite de Cauchy v = u + m = (vnlnEN a
tous ses termes non nuls.
4.4. En déduire que la suite v' = (1/vnlnEN est bien définie et que v'
= n(v') est un inverse
de il.
5. Donner une injection de Q dans C. Désormais nous identifierons Q et i(Q) et parlerons
abusivement de rationnels appartenant à C.
6. On définit dans cette question une relation d'ordre sur C.
6.1. Montrer que si une suite u de C a tous ses termes strictement positifs à partir d'un
certain rang, il en sera de même pour toute autre suite équivalente à u. On note alors P la
partie de C constituée des suites ù de C qui admettent un représentant (et donc tous leurs
représentants) avec des termes strictement positifs à partir d'un certain rang.
6.2. Vérifier que la relation définie sur C par

ù :S: v # v- ù E P U {O}

est une relation d'ordre total, prolongeant celle de Q.


Ainsi, la présence sur C d'une relation d'ordre total permet d'y définir une valeur absolue
que nous noterons encore 1 1 et donc la notion de suite convergente.
6.3. Vérifier que cette relation d'ordre total est compatible avec les opérations.
7. Montrer que Cest archimédien.
8. Montrer que tout élément de C est limite d'une suite de rationnels, c'est-à-dire d'éléments
de i(Q).
9. Montrer que toute suite de Cauchy d'éléments de ë est convergente.
10. Montrer que la même construction effectuée à partir des suites de Cauchy d'éléments de
C ne donne rien de plus que C lui-même.
Chapit re 23
REPRÉ SENTA TION ET APPRO XIMAT ION
,,.
DES REELS

,EST en particulier dans le calcul numérique qu'apparaît toute l'importance de la

C notion de représentation des réels dans une base donnée. Dans la pratique courante,
pour représenter les réels, on utilise la base dix et le développement décimal bien
connu; on sait alors poser des additions, des divisions, etc. l\Iais d"autres bases ont été utilisées
dans l'histoire (16 et 60) et certaines le sont encore, par exemple la base 2 en informatique .
La numération décimale de position avec « chiffres arabes » a été inventée en Inde dans
les premiers siècles de notre ère, puis transmise à l'Europe par les Arabes au xe siècle. Au
XIIe siècle, les mathématicie ns arabes utilisent les fractions décimales mais c'est Simon Stevin
qui les introduit en Europe et qui développe le calcul décimal. Notons qu'il s'oppose à Stifel
(1487-1567), ce dernier ne reconnaissan t pas aux irrationnels le statut de nombre à part
entière ; Stevin s'oppose même à la terminologie d'irrationnels trop péjorative à l'égard de ces
nombres.
Dans La Disme en 1585, il donne les définitions ci-dessous.
Définition I: La disme est une espece d 'Arithmetique, inventée par la disiesme progression,
consistente es characteres des ciffres, par lesquels se descript quelque nombre, et par laquelle
l'on depesche par nombres entiers sans rompuz, tous comptes se rencontrans aux affaires des
hommes.[. .. ]
Définition III: Et chasque dixiesme partie de l'unité de commenceme nt nous la nommons
Prime, son signe est 1; et chasque dixiesme partie de l'unité de prime nous la nommons
Seconde, son signe est 2. Et ainsi des autres chasque dixiesme partie, de l'unité de son signe
precedent, tousiours en l'ordre un avantage.
Le principe du développement décimal est donc ainsi précisé. Un autre type de représenta-
tion des réels, dont il sera beaucoup question dans ce chapitre, est celui fourni par les fractions
continuées (ou continues). Pour donner une idée de ce dont il s'agit, revenons au problème des
grandeurs commensurab les : étant donnés deux segments a 1 < a 0 , admettent-ils une commune
mesure, c'est-à-dire existe-t-il e tel que a0 = me et a 1 = ne pour certains entiers m et n,
auquel cas le rapport ao/a1 sera rationnel? Euclide a décrit dans ses Éléments une technique
(connue sous le nom d'algorithme d'Euclide lorsqu'elle est appliquée aux entiers) pour trouver,
lorsqu'elle existe, une telle commune mesure, mais en fait cette technique artisanale était
connue bien avant lui. Elle consiste à ôter du plus grand segment a 0 le petit segment a
1
autant de fois que possible, soit n 1 fois; ce qui reste est alors par nature strictement inférieur
à a 1. On a ainsi a 0 = n 1 a 1 + U2 avec U2 < a 1 . On recommence alors le procédé avec les
segments U1 et U2 et ainsi de suite. L'écriture du procédé donne, avec des notations évidentes

1 1
ao/a1 =n1 + a2/a1 =n1 +-- =n1 + / =n1 +
1
U1 U2 n2 + U3 U2 n2 + a,/a,
1

Si les segments initiaux sont commensurables, alors le procédé s'arrête au bout d'un nombre
fini d'étapes (c'est toujours le cas pour a 0 et a 1 entiers). Avant la découverte par les pytha-
goriciens des grandeurs incommensurables, on croyait que cet algorithme prenait toujours fin
636

au bout d'un certain nombre d'itérations. Or justement, il semblerait 1 que c'est en étudiant
le symbole de l'ordre des pythagoriciens, à savoir le pentagramme (étoile à cinq branches),
qu'Hipparque découvrit que deux des segments apparaissant dans cette figure étaient incom-
mensurables, il s'agissait de la diagonale du pentagone régulier circonscrit à l'étoile et le côté
de ce pentagone. Pour ce faire, Hipparque appliqua la méthode précédemment décrite et se
rendit compte qu'elle bouclait indéfiniment! Il obtint en fait la fraction continuée (c'est-à-dire
qui continue ainsi indéfiniment) dont tous les termes sont égaux à 1, que l'on peut encore
écrire
1+ 1
1+ 1+ 1
l+nc::-:
Cet objet étrange n'est autre que le développement en fractions continuées du nombre d'or
cl>= (1 + v'S)/2 dont nous avons parlé dans l'introduction du chapitre précédent, à propos de
la suite de Fibonacci.

1. DÉVELOPPEMENT D'UN RÉEL DANS UNE BASE DONNÉE

La première initiation à l'idée de nombre se fait dans la petite enfance, lorsque l'on apprend
à compter. On mémorise alors une suite bien ordonnée de sons : un, deux, trois, quatre, cinq,
six, sept, etc. que l'on relie à l'énumération d'objets. Puis on apprend à noter ces sons, au
moyen de symboles que l'on apprend à reconnaître et à écrire: 1,2,3,4,5,6,7, etc. Peu de temps
après, on affronte des symboles susceptibles de désigner des quantités plus grandes : 45, 67,
89, 124, etc. On observe que seuls apparaissent dans ces nouveaux symboles, que l'on appelle
nombres, les 10 premiers chiffres que l'on a rencontrés.
Bien plus tard, on montre, comme nous l'avons esquissé, l'existence d'un ensemble N de
nombres entiers naturels, contenant 0, 1, muni d'une addition, d'une multiplication, et d'une
relation d'ordre, et on montre qu'il est possible de désigner chaque élément de N par une suite
de symboles, dès lors qu'un entier b ~ 1 + 1 a été fixé. Il est seulement nécessaire pour cela de
disposer de symboles pour désigner les entiers compris entre O et b - 1. Comme nous l'avons
vu, on peut en effet toujours écrire un entier naturel sous la forme
n = <Xmbm + <Xm-1 bm-l + · · · + <X1 b + <Xo,
où les <Xj sont des entiers compris entre O et b - 1. Si on connait des symboles pour chacun de
ces entiers, il est donc possible d'avoir une écriture explicite pour le nombre n. On condense
cette écriture en <Xm<Xm-1 · · · <X1<Xob (dans laquelle les <Xj sont désignés par leur symbole), ou
encore plus simplement en <Xm<Xm-1 · · · cx 1 CXo s'il n'y a pas d'ambiguïté possible, ce que nous
supposerons ici. Nous allons dans la suite examiner dans quelle mesure le procédé que nous
venons de rappeler s'étend à la représentation de tous les réels.
Dans toute cette partie on fixe un entier b supérieur ou égal à 2.

I.1. Le développement d'un réel dans la base b


Dans la pratique courante, nous manipulons souvent des nombres décimaux, de la forme
3,257 ou 45, 6856, que nous savons additionner, multiplier et diviser entre eux. La notion

1
C'est dans ce cas une version alternative à celle proposant la découverte des grandeurs incommensurables par
la diagonale d'un carré de côté 1 (cf. chapitre sur la droite réelle).
..:.,_
intuitive de nombre est certainement liée à l'existence d'une représentation de la forme pré-
cédente. Mais nous avons introduit les rationnels, que nous concevons encore comme des r/J '
al
nombres, pour lesquels cette représentation n'est pas valable puisque par exemple 1/3 ne •<Il
1-<

possède pas de développement décimal fini. Cependant on peut écrire, dans un sens intuitif, r/J
<Il

1/3 = 0, 3333333333333 .... Notre but est de montrer qu'il en est de même pour tous les réels.

1
Nous avons rappelé qu'il est possible de représenter tout entier naturel dans la base b. Au
moyen d'opérations élémentaires, on conçoit qu'il reste seulement à représenter des réels de
[O, 1 [, c'est ce problème que nous allons étudier maintenant. La différence majeure avec le cas
des entiers est que nous allons être amenés à manipuler des « sommes infinies », alors que les §<
entiers ne demandaient que des additions en nombre fini. La notion de suite va donc être une ...,
<Il
nouvelle fois mise à l'honneur. On notera 9 l'ensemble des suites indexées par N* à éléments
dans {O, ... , b -1}. Introduisons aussi les ensembles s
<f? = {(PnlnEN* E 9 1 :3no tel que Pn = b - 1, Vn?: no}, fYJ = 9 \ <f?.
ir/J
•<Il

Le principe du développement des réels en base b est donné par la proposition suivante. 1
M
Proposition 23.1. Soit x E [0, 1[. n existe une unique suite (Pnlne~• de fYJ qui vérifie C'I
..d
ü
lim ( Pl
x= n-Hoo
P2 . Pn)
-+-+···+- .
b b2 bn

PREUVE. Soit x un réel de l'intervalle (0, 1 [. Comme xb est dans (0, b[, sa partie entière
vérifie O:::; [xb] :Sb - 1. On pose
P1 = [xb].
Nous avons alors p 1 :::; xb < p 1 + 1 par définition de la partie entière et, en divisant par b, on
voit que le réel
Pl
X1 =X-b
appartient à l'intervalle (0, 1/b[. L'entier [x 1b 2] est donc à son tour compris entre O et b - 1.
On pose

Le réel
P2 Pl P2
X2 = X1 - - 2 = X- - - - 2
b b b
2
appartient donc à l'intervalle (0, 1/b [. Après n étapes analogues, nous obtenons des entiers
P1, pz, ... , Pn compris entre O et b - 1 et tels que le réel
Pl Pz Pn
Xn = X - b - b2 - ... - bn

appartienne à l'intervalle [O, 1/bn[. Pour le réel x, la suite (Pnln>1 est bien définie par ré-
currence: pour obtenir Pn+l, il suffit en effet d'appliquer le mêm; procédé à bn+lxn, ce qui
entraîne que Pn+l = [bn+lx,J.
Maintenant, puisque 1/bn tend vers O (car b?: 2) et comme

le théorème des gendarmes montre que la suite (xnlnEN* converge vers O. Il en résulte que la
suite de terme général
Pl Pz Pn
-b+ -b2+···+- bn= x - xn
638

converge donc vers le réel x.


La suite (Pnln2 1 ne peut être dans 'f?. En effet, supposons qu'il existe un entier n 2: 1 tel
que, pour tout m 2: n, Pm = b - 1. Nous avons dans ce cas

x _1 = x _ P1 _ P2 _ ... _ Pn-1 = lim (b -1 + b -1 + ... + b-: 1).


n b b2 bn-1 i->oo bn bn+l b'
On voit (suite géométrique) que cette limite est égale à 1/b n-l ; or par construction, Xn- l est
inférieur strictement à 1/b n- l, ce qui est contradictoire.
Ceci montre l'existence de la suite (PnlnEN*, il nous reste maintenant à montrer son unicité.
Supposons qu'il existe une suite (Pnln>i de [!1J telle que x = lim (P 1 + pb 2 + • .. + Pn).
- n->+oo b 2 bn
Pl 1· (P2 p3
3
Pn) C 1 ·t
Nous avons x - b = n_l;~ b 2 + b + · · · + bn . omme a sm e es d ans ;::;r, 1·1 existe
t = .
un entier m 2: 1 tel que Pm vérifie 0 :::'.: Pm :::'.: b - 2. Si n est un entier plus grand que m, nous
avons
P2 p3 Pm Pn b- 1
b- 2 b- 1
b- 1
0 <
- -b2 +-+•·· +bm - <
- + ··· +bn - -b2
- + -b3
- + ··· + -
b3 bm- +··· + -
bn- '
ou encore
P2 p3 Pn b- 1 1 b- 1 b- 1 1 b-
0 <
- -
b2+ - - <
b3+ ··· +bn - -b2
- + -b3
- + ··· + - - + ··· + -
bm bn- - -bm'
et enfin
P2 p3 Pn b - 1 ( 1 - 1/bn-l) 1
o::;b2 +b3 +···+bn:::'.:1J2 1-1/b -bm·
En passant à la limite, on obtient

P1 1
0<x--
-
< - - -1
b - b bm.
Les inégalités O :::'.: xb -pi :::'.: 1 - b 1-m < 1 entraînent que p 1 = [xb]. En fait, nous venons de
prouver que P1 est le premier terme de la suite que nous avons obtenue dans ce qui précède. Par
récurrence, on vérifie facilement que Pn correspond au terme d'ordre n de la suite précédente,
ce qui prouve l'unicité. ■

Nous introduisons maintenant une notation qui prolonge celle que nous utilisons couram-
ment pour les décimaux.

Définition 23.2. Soit x E [0, 1 [ et soit (PnlnEN* l'unique suite vérifiant les propriétés de la
proposition précédente. Posons Po= 0 et considérons la suite (PnlnEN ainsi obtenue. On dit
que (PnlnEN est le développement de X en base b. On note alors

X = 0, P1P2P3 • • • PnPn+l · · ·
et on dit encore que cette écriture est le développement de x en base b.
On prendra garde au fait que l'écriture x = 0, P1P2P3 ... PnPn+l ... n'est qu'une notation
pour la propriété
r (Pl P2 Pn)
X = n_l;1J1oo b + b2 + · · · + bn ·

On peut maintenant très facilement passer au cas d'un réel quelconque. Pour x E JR, l'idée
évidente est simplement d'écrire x = [x] +{x} et de juxtaposer le développement de {x} E [0, 1 [
à celui de l'entier relatif [x]. Ceci conduit à la convention suivante.
639

Définition 23.3. Soit x un réel, soit 0, P1PiP3 ... PnPn+l ... le développement de {x} en
base b et soit [x] = qm ... q 0 b le développement de la partie entière de x. L'écriture x =
qm ... qo, P1P2P3 ... PnPn+l ... s'appelle le développement de x en base b .
Là encore, ce n'est qu'une notation. La notation que nous venons d'introduite pour les
développements prolonge bien celle que nous utilisons habituellement. Si x est un réel décimal
(c'est-à-dire de la forme m/lOn), par exemple x = 6785456785876/10 13 , on écrit usuellement
x = 0, 6785456785876, ce qui est exactement le développement de x en base 10, dans lequel
on omet les termes nuls. Le développement en base 10 est appelé le développement décimal.
Faisons maintenant une remarque importante.
Soit (Pnlnè'.l une suite d'entiers entre O et b - 1, qui est constante de valeur b - 1 à partir
d'un certain rang. Notons n le plus petit entier tel que pour tout m ~ n, Pm= b - 1. Le réel
. (P1
X= m~~oo b
P2 Pn-1 b- 1
+ b 2 + · · · + bn-l + ~ + · .. + bm
b- 1)
a pour développement 0, P1P2P3 ... p~_ 1p~P~+l ... où P~-l = Pn-1 + 1 et Pm= 0 pour tout
m ~ n. A un tel réel sont associées deux suites dont les termes sont des entiers compris entre
0 et b - 1 et qui sont constantes à partir d'un certain rang, la première de valeur b - 1 et la
seconde de valeur O. Nous dirons que la première suite définit un développement impropre de
x en base b, et la seconde est le développement de base b que nous avons défini.

Atte11tiu11 Nombres de la forme m/bn


Les réels de la forme m/bn, pour deux entiers m E N et n E N*, vont jouer un rôle
particulier. On voit facilement que x est de cette forme si et seulement si son dévelop-
pement en base b est nul à partir d'un certain rang. Un tel nombre possède aussi un
autre développement, dit impropre.

Test 23.1. Test 23.4.


Les affirmations suivantes sont-elle vraies? Donner le développement de 1/3 en base 2.
1. 1 = 0, 999 ... 99 ... en base 10.
Test 23.5.
2. 1 = 0, 111 ... 11 ... en base 2.
Peut-on poser une addition pour des nombres
Test 23.2.
réels, en utilisant leurs développements dé-
Le réel 1/ 11 possède-t-il un développement im- cimaux, de la même manière que pour des
propre en base 10 ? nombres décimaux ?
Test 23.3. Test 23.6.

Soit (Pnln21 la suite d'entiers définie par Peut-on comparer (pour la relation d'ordre
P3k+i = i où k E N et i = 0, 1,2. Détermi- usuelle) deux réels lorsqu'on connaît leurs dé-
ner le réel a= 0, P1P2P3 ... Pn ... en base 3. veloppements en base b ?

I.2. Le développement d'un rationnel


Les rationnels sont des réels très particuliers, on peut imaginer qu'ils sont plus «simples» que
les irrationnels. On peut donc s'attendre à ce que leurs développements dans une base aient
des propriétés remarquables. Nous aurons besoin d'une définition pour le voir.
640

Définition 23.4. Une suite (PnlnEN est dite périodique s'il existe k EN tel que Pn+k = Pn,
Cl) pour tout n E N, et k est alors une période de la suite. Elle est dite périodique à partir d'un
rn
.Q
ro
certain rang s'il existe k EN et no EN tels que Pn+k = Pn pour n ~ no, e t ~ k est
~ encore appelé période de la suite.
;:; Le théorème que nous énonçons maintenant montre bien la simplicité du développement
Cl)
des rationnels.
~ Théorème 23.5. Un nombre réel de [O, 1[ est un rationnel si et seulement si son dévelop-
pement dans la base b est périodique à partir d'un certain rang.

PREUVE. Soit p/q un rationnel avec p et q premiers entre eux et vérifiant O :S: p < q.
La division euclidienne de bp par q nous donne deux entiers positifs a1 et r1 vérifiant bp =
a 1q +r 1 et O :S: r1 < q. Cette dernière inégalité entraîne que a 1 = [bp / q], donc a 1 est le premier
terme du développement en base b de p/q. En effectuant la division euclidienne de br 1 par q,
nous obtenons deux entiers positifs a 2 et r2 vérifiant br1 = Uzq +r 2 et O :S: r2 < q. L'entier a 2
est dans ce cas le deuxième terme du développement de p/q en base b. En continuant ainsi,
nous avons, d'une part, le développement en base b de p/q donné par la suite des quotients
(unln:::: 1 et, d'autre part, la suite des restes (rnln::,:1 constituée d'entiers compris entre O et
q -1. S'il existe un rang m tel que Tm= 0, alors par construction la suite des restes (rnln::,:l
est constante et égale à O à partir du rang m. Dans ce cas, le développement en base b est
périodique à partir du rang m, et de période 1.
Si maintenant tous les r n sont non nuls, ils sont tous compris entre 1 et q - 1. Comme
il n'y a qu'un nombre fini d'entiers entre 1 et q - 1, il existe deux indices k et h vérifiant
k < h et rk = rh. Par construction, nous avons ak+i = ah+i pour 1 :S: i :S: h - k. En fait la
suite ( Un)n::,:1 est périodique à partir du rang k et sa période ne peut dépasser q - 1. Nous
avons ainsi montré que le développement en base b d'un rationnel p/q, avec O::; p < q, est
périodique à partir d'un certain rang, avec une période inférieure à q - 1, et que ce rang est
inférieur à q - 1.
Réciproquement, soit x un réel de [O, 1 [ dont le développement est périodique à partir d'un
certain rang et dont m est la période, c'est-à-dire

Nous avons

et

Le nombre
bn+mx- bnx = q1qzq3 • • • qnP1P2 •••Pm - q1qzq3 · · · qn
est un entier, donc x est rationnel. ■

Remarque. Il est important de noter que la propriété de périodicité précédente est valable
pour toute base b ~ 2.

EXEMPLE 23.6. Le réel 0,01001000100001000001 ... écrit dans la base b, avec b ~ 2, est
1 un nombre irrationnel.
On peut parfois encore préciser la forme du développement d'un rationnel.
)
641

EXEMPLE 23. 7. Soient b :;:, 2 et q 2' 1 deux entiers premiers entre eux.
1) Le développement en base b de 1/ q est périodique à partir du rang 1.
2) Si la période est q - 1, alors pour tout entier 1 ~ p ~ q - 1. le développement en base
b de p / q se déduit de celui de 1/ q par une permutation cyclique des termes.
► Soit q 2' 2 un entier. Nous savons maintenant que

où m est la période de son développement dans une base b. L'écriture précédente est équiva-
lente à bn+m_ bn = (q,qzq3 ... qnP1P2 ... Pm - q,qzq3 ... qn)q. :'\ous avons donc un entier
naturel k vérifiant (bm - 1 )bn = kq. Si nous imposons à q et b d"ètre premiers entre eux,
nous avons l'entier bm- 1 divisible par q. '.'\otons m' 2' 1 le plus petit entier tel que bm' -1
soit divisible par q. Notons (anln21 (resp. (Tnln21) la suite des quotients (resp. des restes)
obtenus lors de la division euclidienne de 1 par q: ces deux suites Yérifient pour tout n EN,

Il est facile de vérifier par récurrence que, pour tout f E N. il existe un entier naturel k, tel
que be= keq +Te; en particulier bm' = km,q + Tm'· La condition imposée sur m'entraîne
que Tm' = 1. Comme T1 = 1, l'entier m' est supérieur ou égal à m, donc m = m'. :'\ous
venons de montrer que le développement en base b de 1/ q est périodique à partir du rang 1.
Nous noterons dans la suite T( q) cette période. Supposons que pour un entier q 2' 3, on
ait T( q) = q - 1 ; la suite des restes (T nln2 1 associée à 1/ q prend alors toutes les valeurs
entières entre 1 et q - 1. Pour un entier 1 ~ p ~ q - 1, il existe un entier 1 ~ k ~ q - 1
tel que Tk = p. Par construction, la suite des restes (T~)n2 1 associée à p/q vérifie T~ = Tn+k·
Nous avons la même relation pour la suite des quotients. En résumé, le développement en
base b de p / q s'obtient à partir de celui de 1/ q par une permutation cyclique des termes.

Remarque. Il arrive que la période T( q) soit égale à q - 1 ; par exemple, pour q = 7 et


b = 10, nous avons 1/7 = 0, 142857142857 ... 14285714 ... donc T(7) = 6.
A l'opposé, on peut avoir T(3) = 1 (pour b = 10) puisque, par exemple, on a
1/3 = 0, 3333333 ... 33333 ...

Test 23.7. Test 23.8.


Soit q = zn5m avec net m deux entiers naturels Soit q E N*. Que peut-on dire de q si le déve-
non nuls. Que peut-on dire du développement loppement décimal de 1/ q est nul à partir d'un
décimal de 1/ q ? certain rang ?

I.3. Nombres-univers, nombres équirépartis


Un nombre x de l'intervalle [O, 1[ est appelé nombre-univers si son développement décimal
contient toutes les séquences finies possibles de chiffres. Si l'on utilise la suite des entiers en
base 10 comme développement décimal, on obtient par exemple le nombre remarquable

0, 12345678910111213141516 ...
642

connu sous le nom de nombre de Champernowne . Par construction, ce nombre est un nombre-
univers. Un nombre-univers ne peut avoir un développement décimal périodique, donc il est
irrationnel.
Soient x un réel de l'intervalle [0, 1 [ et k un entier compris entre 0 et 9. Pour un entier
n 2'. 1, on note kn(x) le nombre de fois où le chiffre k apparaît dans les n premières décimales
de x.
Définition 23.8. Le réel x est dit équiréparti si pour tout entier O ::; k ::; 9, la limite de
kn( x) /n, quand n tend vers l'infini, est égale à 1/10.

Proposition 23.9. Soit x un rationnel, de développement décimal de période -r,

Soit i(k) le nombre de fois où le chiffre k apparaît dans a1a2 ... °'r• Alors x est équiréparti
si et seulement si i(k) = -r/10 pour tout entier 0 $ k ::; 9. En particulier la période d'un
nombre rationnel équiréparti est un multiple de 10.

PREUVE. Supposons que x soit un rationnel, de développement décimal de période -r,

Pour un entier n assez grand, on a kn(x) = [n/-r]i(k) + €n où €n est un entier compris entre
0 et 't + m. Nous avons
lim kn(x) = lim [n/-r]i(k)
n-->+oo n n-->+oo n
i(k)
ce qui entraîne que lim ■
n---++oo n 't

EXEMPLE 23.10. Le nombre 0, 1234567890123456789012 ... 12345678901 ... est équiré-


1 parti.

Test 23.9. Test 23.10.


Donner l'exemple d'un nombre rationnel équi- Le nombre 1/17 est-il équiréparti?
réparti.
643

Il. EXERCICES

23.1. 23.6.

Soient a et b deux réels. Soit f l'application définie sur lR par f(x) =


1·1m - 10x - [1 0x]. Si n est un entier naturel non nul,
1 . S1. b > O, d't ·
e erm1ner [na]
[
b] .
n--t+oo n on note f(n) l'application obtenue en composant
n fois f.
2. Si a> 0 et b 2 1, déterminer lim [[bun]].
n--t+oo n 1. La fonction f est-elle périodique?
2. Soit x un réel de l'intervalle [0, 1]. Montrer
23.2.
que x est un rationnel si et seulement si la suite
(f(n) (x) ln21 est périodique à partir d'un certain
Soient x et y deux réels. Montrer que
rang.
[x] + [-y] + [x + y] :S: [2x] + [2-y]. 3. Déterminer tous les réels x de [0, 1] tels que
f(x) =X.

23.3. 23.7.

Soient p E N et q E N*. Montrer l'égalité sui- Déterminer le développement décimal de 1/47.


vante
23.8.

Montrer qu'un nombre-univers est irrationnel.

23.9.
23.4.
Soit (xnln21 la suite définie par Xn = 1. si n
Soit n 2 2 un entier naturel.
est un carré et Xn = 0 sinon. l\lontrer que le
1. Résoudre l'équation : [nx] = n[x]. nombre 0, x1x2 · · · Xn · · · est irrationnel.
2. Déterminer les x > 0 vérifiant [x] = [xn]_
23.10.
23.5.
Montrer que dans les deux cas ci-après, le
Soient 0 un irrationnel et f l'application définie nombre 0, x1x2 · · ·Xn ···est un nombre-univers.
sur N par f(n) = ne - [n0].
1. (xnln21 est la suite des entiers pairs non nuls
1. Montrer que f est à valeurs dans [0, 1[. en base 10.
2. Montrer que f est injective. 2. (xnln21 est la suite des nombres non-
3. L'application f est-elle surjective? premiers en base 10.
COMPLÉMENT 1. FRACTIONS CONTINUÉES

Comment former les meilleures approximations rationnelles

La notion de fraction continuée a été utilisée de manière fondamentale dans les travaux d'Euler,
par exemple pour prouver en 1737 que e est irrationnel. En 1761, J.H. Lambert utilisa la même
méthode pour prouver l'irrationnalité du nombre n. Lagrange, pour résoudre une équation de
Pell, s'intéressa aux fractions continuées et en développa la théorie. Enfin, dans l'élaboration
de la notion même de nombre réel, les fractions continuées ont joué un rôle majeur.
L'idée initiale est assez voisine de celle que nous avons décrite dans la partie I de ce
chapitre, il s'agit de trouver des suites de rationnels qui convergent vers un réel arbitraire, ces
suites devant être construites de manière algorithmique. Pour établir ce que nous avons appelé
le développement en base b d'un réel x de [O, 1[, on commence par former une subdivision de
[0, 1] de la forme [0, 1/b, 2/b, ... , (b - 1 )/b, 1] et on repère l'unique entier k 1 E {0, b - 1} tel
que x E [ki/b, (k 1 + 1 )/b[.
On procède alors à ce qu'on appelle une renormalisation de cette figure. Il reste en général
un écart entre les barreaux de l'échelle et le réel à représenter. On se place donc dans l'échelon
[ki/b, (k1 + 1)/b[, que l'on va considérer de nouveau comme l'intervalle [O, 1 [ initial. Pour
cela, on fait une translation de -ki/b et on multiplie toutes les quantités par le facteur b.
L'échelon se transforme donc en b x [ki/b - ki/b, (k 1 + 1}/b - ki/b [ = [O, 1 [, et le réel x
devient x1 = b x (x- ki/b}.
Cette renormalisation améliore évidemment la précision de la représentation, puisque nous
avons multiplié par un facteur b. On obtient après la première étape

on a donc un rationnel k1 /b dont l'écart avec x est majoré par 1/b. On répète l'opération
pour X1, ce qui conduit à un nouvel entier k 2 E {0, ... , b} tel que x 1 E [k2/b, (k2 + 1 )/b[, soit

avec x1 - k2/b < 1/b, et maintenant l'écart entre x et ki/b 1 + k 2/b 2 est majoré par 1/b 2. On
poursuit alors la renormalisation en multipliant cette fois par un facteur b 2 le reste (xi -~z/bl,
et ainsi de suite. On obtient ainsi ce que nous avons appelé le développement de x dans la
base b.
Par exemple, dans le cas où b = 4, appliquons cette méthode pour x = 2/3. On a k 1 = 2, le
nouveau réel x1 est donc 4 x (2/3-2/4) = 2/3 (ce n'est pas un hasard, nous avons prémédité
notre choix de x).
Le développement de 2/3 en base 4 s'écrit donc 2/3 = 0, 22222222 ....
À la deuxième étape

et ensuite
2 2 2 2
-=-+-+-+···
3 4 4 2 43
0 1/4 2/4 X 3/4

1 ''
1 ''
1 ''
1 ''
1 ''
x,' 3/4 ' ',,.,. 1
1/4 2/4

FIGURE 23.1. Renormalisation de base b

Bien que cette méthode paraisse très naturelle, ce n'est pas la seule possible. Il faut en
particulier bien voir que la renormalisation que nous avons décrite (essentiellement la mul-
tiplication par le facteur b) est très arbitraire. Tout ce que l'on cherche est à produire une
situation analogue à la situation de départ. Nous allons dans ce complément en présenter une
autre, que nous appellerons algorithme de Gauss (ce qui ne veut pas dire que Gauss en est le
seul inventeur).
L'idée va être maintenant de considérer la totalité de la droite réelle lll, et de n'utiliser
que la subdivision donnée par l'ensemble Z des entiers naturels. Si on choisit x E lll, il existe
ainsi un unique entier [x] tel que [x] :S: x < [x] + 1, que nous avons appelé la partie entière de
x. Nous allons ici le noter plutôt E[xl, pour éviter des ambiguïtés dans la suite. La première
étape de notre procédé d'approximation s'écrit simplement

x = E[x] +{x}
où {x} E (0, 1[ est la partie décimale de x.

0 2 X 3 4
;; ______ __.. ..........
;;;

;;; ;;

;; ;;;
;;
{x}
oI I 1
1
--
-- ---
-- --
-- --
2 3 x, 4

FIGURE 23.2. Algorithme de Gauss

Il faut maintenant continuer, et chercher à représenter {x} de la même manière que x. On


ne peut clairement pas le faire directement, puisque {x} E (0, 1 [, la partie entière ne donne
donc aucune information supplémentaire. Mais il existe une manière très naturelle pour se
ramener à la situation initiale. On remarque d'abord que l'on peut supposer {x}-/- 0, puisque
si {x} = 0 le procédé d'approximation est terminé à sa première étape, x = E[x]. Il existe alors
un moyen très tentant pour transformer JO, 1[ en ]1, +oo[, qui consiste à utiliser l'application
x H 1/x. L'étape de renormalisation consiste ici à considérer 1/{x} à la place de {x}, et à
rechercher de nouveau sa position sur l'échelle des entiers naturels, ce qui revient à considérer
l'entier E[l/{x}]. À cette étape, nous avons donc obtenu les égalités
1 1
x = E[x] + {x} = E[x] + 1/{x} = E[x] + E[l /{x}] + {l /{x}}.

À nouveau, {1 /{x}} E [O, 1 [. Si {1 /{x}} = 0, c'est terminé, sinon, on considère son inverse, et
on réitère le procédé.
On peut déjà imaginer la forme du résultat. Supposons que l'algorithme que nous venons
de décrire se poursuive indéfiniment. Alors il conduira à une représentation de x sous la forme
d'une fraction indéfiniment continuée

x =no+ - - - - - - - ~ - - - - -

n2+--------

où les np sont des entiers naturels. Nous allons en préciser le sens dans ce complément.

1.1. Développement d'un rationnel en fractions continuées


Pour nous familiariser avec cette écriture fractionnaire, nous allons d'abord considérer le cas
où l'algorithme de Gauss (que nous allons définir de manière précise plus loin) s'arrête au
bout d'un nombre fini d'étapes. Comme nous allons le voir, c'est le cas si et seulement si x
est un rationnel.

1. Algorithme d'Euclide et algorithme de Gauss. Considérons d'abord x E Z. Alors


x = E[x], et l'algorithme est terminé. Supposons donc que x = a/b E (Ql \ Z avec a E Z et
b E N*, premiers entre eux. Notons que b ~ 2. L'algorithme d'Euclide appliqué à a et b
fournit les identités suivantes (avec b 0 = b)

a= aobo + b1 0 < b1 < bo


b = a1b1 + b2 0 < b2 < b1
b1 = a2b2 + b3 0 < b3 < b2

bn-3 = Un-2bn-2 + bn-1


bn-2 = Un-1 bn-1

La première égalité montre que


a b1 1
x= b = ao + b = ao + b/b1
et la deuxième donne

En utilisant successivement toutes les identités, on obtient la relation suivante


a
b= ao + - - - - - - - - - - - - - -
ai+------~,-----
a2 + ------- ---
Un-3+---~1,-
Un-2+--
On-1

qui est donc une expression de x sous forme d'une fraction du même type que celui que nous
avons décrit en introduction.
Revenons maintenant sur l'idée de l'algorithme de Gauss. Pour x E lR donné, on pose
d'abord x 0 = x Si x 0 E Z, on arrête l'algorithme. Si x 0 E lR \ Z, on pose

Alors x 1 E] 1, +oo[. Si x 1 E N, on arrête l'algorithme. Sinon, on pose

et ainsi de suite. L'algorithme s'arrête au premier xk ainsi construit qui est dans N, et continue
indéfiniment sinon. Notons que dès la première étape l'algorithme ne met en jeu que des réels
de [1, oo[.
C'est l'algorithme d'Euclide qui va nous montrer que si x E (Q, l'algorithme de Gauss
s'arrête. En effet, d'après les inégalités des divisions euclidiennes, on voit que E[x 0] = a0 ,
donc que {xo} = bi/bo, donc que
bo
X1 = b,"
Comme b2 > 0, X1 ,f. N, et l'algorithme continue, montrant de la même manière que
b1
X2=-
b2
et ceci jusqu'au rang n - 1, avec
bk-1
Xk=~, 1 :S:k:S:n-1.

Comme Xn-l est entier, l'algorithme de Gauss s'arrête.


Réciproquement , supposons que l'algorithme de Gauss s'arrête à un rang p. Alors Xp EN,
et donc
1
{Xp-1} = - E (Q
Xp
donc Xp-1 E (Q. Il en résulte que {xp-2} = 1/xp-1 E (Q, donc aussi que Xp-l E (Q. Ainsi, de
proche en proche, on montre que x 0 E (Q. Nous venons donc de montrer que l'algorithme
de Gauss s'arrête si et seulement si x est rationnel, et dans ce cas nous avons obtenu une
écriture de x sous forme de fractions itérées ne comportant qu'un nombre fini de termes.-Ces
termes ak sont donnés par l'algorithme d'Euclide aussi bien que par celui de Gauss. Dans
l'algorithme d'Euclide, ce sont les quotients successifs des divisions. Dans l'algorithme de
Gauss, il apparaissent comme les parties entières des xk, puisque
bk-1 bk+l
Xk = -- = Uk +- -
bk bk

avec bk+1/h E [O, 1 [.


2. La notation des fractions. Reprenons l'algorithme d'Euclide précédent. Comme a/b
n'est pas entier, b 1 -/- 0 et donc n 2: 2. Rappelons que dans l'algorithme d'Euclide, le dernier
reste non nul, c'est-à-dire bn-l, est le pgcd de a et b. Dans notre cas, ce pgcd est 1, nous avons
donc bn-1 = 1. Cette dernière égalité montre que bn-2 = Un-1. Comme bn-2 > bn-1 = 1, on
déduit que Un-l 2: 2. Les entiers uk, 0:::; k:::; n - 1, que nous avons mis en évidence vérifient
donc uk 2: 1 pour 1:::; k:::; n-1, Un-1 2: 2.
Nous allons maintenant étudier de manière plus précise les propriétés des expressions
fractionnaires du type précédent. Si u 0, u 1, ... , Up est une suite finie de réels où uk > 0 pour
tout k 2: 1, on note

[uo, u1, u2, ... , Up] = uo + - - - - - - ~ - - -


u1 + - - - - - - - -
u2+------
l
Ui:,-1 +-
liµ
Signalons une petite ambiguïté : si p = 0, [u0 ] = u 0 , ce qui ne correspond pas à la notation
usuelle de la partie entière, c'est pourqoi nous avons ici changé de notation. Par ailleurs,
remarquons que si p 2: 1
1
[uo, u1, u2, ... , Up] = uo + [U1, ... , liµ ] '
et plus généralement, si O :::; j :::; p - 1,
1
[Uo,U1,U2, ... ,Up] = [uo, ... ,Uj-J,Uj+ [ .
Uj+1, ... , liµ
1J·
En fait, ces égalités peuvent être prises pour point de départ d'une construction par récurrence
des expressions que nous souhaitons, c'est la manière correcte de les définir.
Avec la notation que nous avons introduite, ce que nous avons montré au début du para-
graphe s'écrit
a
b = [ao, a,, a2, ... , Un-il
où les uk sont les quotients donnés par l'algorithme d'Euclide, donc ak 2: 1, avec de plus
Un-1 2: 2 si n 2: 2.
Cette écriture est en fait unique, comme le montre le lemme suivant.
Lemme 23.11. Soient {1¼)0::;isp et (t1tjfo5 ;::;q deu:tsûitês finies â'ë'fliiers?. 1 qufvérijient
np 2: 2 si p ?. 1 et mq ?. 2 si q ?. t. Dans ces conditions, si

alorsle-s deux suites,simt égales.


PREUVE. Si p = 0, alors [m0, m1, m2, ... , mq] = n 0 est un entier et nous avons forcément
q = 0, puisque [mo, m 1, m 2, ... , mq] = m 0 + 1/[m1, ... , mq] (f. N si q 2:: 1, d'où l'égalité des
deux suites.
Etudions le cas p 2:: 1. Supposons, par exemple, que no 2:: mo et montrons que m 0 = no.
L'égalité [n 0 , n 1, n2, ... , np] = [m0 , m 1, m2, ... , mq] entraîne que
1 1
no-mo= -
[m1, ... , lnp [n1, ... , np]
Le second membre est strictement plus petit que 1, et le premier est un entier positif. Ils sont
donc nuls, d'où m 0 = n 0 . Nous avons donc une nouvelle égalité

[m1, ... ,mp].

On peut donc déduire de proche en proche que nk = mk et p = q. ■

En conclusion, nous avons montré le théorème suivant.


Théorème 23.12~ Six= a/b, avec a et b premiers entre eux, est un nombre mtionnel
non entier; il existe tt.ne umque suite jime:d'ermers ao. a1,· «2, . .. , a., vérifiant

x == Iao. à1t42;) ···" o,.l .


avecp 2:: 1, av?: .2 et OJc. ~ l pour tqui~ iJ~ Ces entie,1:s a:~ks gÛo:t~.del'al,gorithme
d'Euclide appliqui à à. et b... · · ·
Ce résultat mérite bien une définition.
Définition 23.13. Une identité de la forme

avec p 2:: 1, ap 2:: 2 et ak 2:: 1 pour tout k 2:: 1 est appelée développement du nombre x en
fractions continuées.

EXEMPLE 23.14. Décomposons 122/15 en fractions continuées. Si on applique l'algorithme


d'Euclide à a= 122 et b = 15, on obtient 122 = 8 x 15 + 2 et 15 = 7 x 2 + 1. On peut donc
écrire la décomposition

Par ailleurs, nous avons aussi montré que l'algorithme de Gauss des irrationnels se poursuit
indéfiniment.
Proposition 23.15. Soitx..E R\ Q, Alors la suite de Gauss de x, dont le terme généml
vérifie là relation de récurrence . . . . . . . . .

Xo =X, Xk+l = 1/{Xk}


est bien définie pour k È J:t Ell~ vérifie X1ç 2:: 1 pour tout k 2:: l.
La suite (nklkEN dont le terme général est défini par nk = [xJ est appelée suite des
quotients de x, les entiers nk sont 2:: 1 pour k 2:: 1. La relation de récurrence définissant la
suite (xk)kEN est appelée algorithme de Gauss. La suite (nklkEN est la suite des quotients de x.
1.2. La suite des réduites d'une suite d'entiers
Nous allons maintenant mettre en œuvre de nouvelles idées pour permettre la décomposition
des irrationnels en fractions continuées.
1. La suite des réduites d'une suite d'entiers. Soit maintenant une suite (nkl1<2:o d'entiers
vérifiant nk 2 1 pour tout k 2 1. On peut alors associer à (nkl1<2:o deux autres suites d'entiers
(-pkk:o et ( qkl1<2:o définies par les relations
1) Po= 1, Pi = no, et Pk+l = Pknk + Pk-1 pour tout k 2 1;
2) qo = 0, q1 = 1, et qk+l = qknk + qk-1 pour tout k 21.

Proposition 23.16~ Les suites(pt<}~o- e.t (q1,Jiqo vf:rifoent lès proprüttés suivantes :
1) la suite (qk}kÇ::2 est strictement croi9sa~te et à flale~rsd~~ N*;
2) pour toutkEN, P.kQk+l -'--l'k+t<lk = (-t)k;
3) pour tout k EN*, pJqk = [no, rt1, n.2, ... , n:k-1J.

PREUVE. Montrons par récurrence la première propriété de la proposition. Pour tout entier
k 2 2, on note Pk la propriété: qk EN*, qk+l EN* et qk+l > qk. Nous avons qz = q,n, +qo =
n, et comme n1 EN*, on déduit que qz EN*. La relation q3 = q2n2 + q, = q2n2 + 1 et la
condition n 2 E N* prouvent que q 3 > q 2 . La propriété P2 est vraie.
Supposons maintenant que Pk est vraie. L'inégalité qk+l > qk montre que qk+l est bien un
entier non nul. De l'identité qk+2 = qk+lnk+l + qk, on déduit que qk+l EN et qk+2 - qk+ 1 =
qk+l (nk+l - 1} + qk. Cette dernière égalité, le fait que nk+l - 1 2 0, et l'hypothèse qk EN*
prouvent que qk+2 - qk+l > 0, c'est-à-dire qk+2 > qk+l, donc aussi qk+2 EN*. Nous avons
donc montré que Pk+l est vraie.
Pour prouver la seconde propriété de la proposition, posons dk = pkqk+l - Pk+l qk pour
tout k 2 1. Nous avons dk = Pk(qknk+ qk_,)-(pknk+Pk-1} qk = Pkqk-1-Pk-lqk = -dk-1·
Ceci implique que dk = (-1 )kd0. Comme d 0 = 1, alors dk = (-1 )k. Quant à la dernière
propriété de la proposition, elle résultera immédiatement du lemme qui suit. ■

Letnme 23.17. Soit (a11J~1<:,:;n. ur,,e 811,ite finie de. rée.ls véri,ft;ant a"-> 0 pourk > 1. Soient
(pk.){½;k$n.+l et {Q1<.)QSk$n+1 les suites finies définies par

pour 1 s k s n... Alors

PREUVE. Elle se fait par récurrence sur n. On la laisse au lecteur à titre d'exercice. ■

Remarque.
1) La propriété 2) de la proposition précédente et l'identité de Bézout montrent que, pour
tout k, Pk et qk sont premiers entre eux, ainsi que Pk et Pk+l, qk et qk+l· En fait, le rationnel
[no, n,, ... , nJ est donné sous sa forme irréductible Pk/ qk.
2) Certains auteurs utilisent une autre indexation des réduites, c'est alors la suite des termes
de rang pair qui est croissante et celle des termes de rang impair qui est décroissante.
Définition 23.18. Soit (nk)JQo une suite d'entiers vérifiant nk 2: 1 pour tout k 2: 1. On
dit que le rationnel Pkl qk est la réduite d'ordre k associée à la suite (nk)JQO·

2. La convergence de la suite des réduites. Nous allons maintenant montrer que les
sous-suites de rangs pair et impair d'une suite de réduites sont adjacentes, ce qui montrera la
convergence de la suite initiale.

~ro~ftiô,n ,3.l,t). ~Giï'{'tt~lkâô '.'U~ $~itt d'entiers tels que nk ~ t pour toot 1ç 2 1, et
s<>it(,p.Jqk)k?!t la suitr:. de sis réâ${tes; jllors,:
l:) pour toot k2:: 1, 'Plk-titJZk--'1 < ~21Jq2k i
i.} ~ suites {P2kltl2k}1e1 et {'P2k-i/q:zic..:..t}JQ1 sont respectivement décroissante et crois-
sante;
3) les MU$ suites {'P21../Q21c)JQ1 et l'P2k..:..1/421c-1)1Q1 sont adjacentes.

on obtient
Pk Pk+l (-l]k
----
qk qk+l qkqk+l
Pour k >
-
1, on posq}k = Pk/ qk. La suite (Ykh>1-
vérifie pour tout k >
-
1, Yk-Yk+l = --1=!1".__
QkQk+l
Soit h E N*. Si on applique l'identité précédente à k = 2h - 1, on obtient que
-1
Yzh-1 -Yzh = - - - - < 0,
qzh-lq2h
d'où l'on déduit que, pour tout h 2: 1, YZh-1 < Yzh-
Montrons que la suite (pzk/ q 2k)JQ 1 est décroissante. En sommant les deux identités
(-l]k (-l)k+l
Yk - Yk+l = - - - et Yk+l - Yk+Z = ----,
qkqk+l qk+lqk+2

on obtient l'égalité Yk - Yk+2 = (-JJk(qk+i-qkl. Si on pose maintenant k = 2h où h est un


qkqk+1 qk+2
entier supérieur ou égal à 1, alors Yzh - Y2h+2 = qlhqlh+rq,h
qlh+ 19_2h+2 - est
. Comme la suite ( qkh>o à
termes positifs et strictement croissante à partir de k = L, on voit que Y2h - Y2h+2 2: O. On
peut donc conclure que, pour tout entier h 2: 1,

La croissance de la suite (P2k-ifqzk-J)JQ1 se prouve de la même manière.


Pour montrer que les deux suites (P2k/q2k)JQ1 et (P2k-ifqzk-l)JQ1 sont adjacentes, il reste
seulement à prouver que la limite de leur différence est nulle. Mais
1
lim (Yzk - Yzk+l) = lim
k-+too k-Hoo qzkq2k+l
Or lim qk = +oo car la suite (qk) est à valeurs dans N et strictement croissante à partir de
k--->+oo
k = 2. On en déduit donc que lim (Yzk -Y2k+1l = O. ■
k--->+oo

Notation. Soient (nk)JQo une suite d'entiers tels que nk 2: 1 pour tout k 2: 1. La limite de
la suite des réduites associées à (nk)JQo est notée [n0, n 1, n 2, ... ] , soit donc

lim [no,n1, ... ,niJ = [no,n1,nz, ... ].


k--->+oo
Le théorème suivant précise la vitesse de convergence d'une suite de réduites (nk)JQ:o vers
sa limite [no, n1, n2, ...].

Tliéorênte 23.20. Soient (nk)JQ:o une suite d'entiers tels que nk ~ 1 pour tqut k ~ 1.
Alors la suite {pJqk)k>t des réduites de (nk)k>o est convergente et sa limite x vérifie pour
tout k ~ 1 l'inégalité - -
lx- Pkl < 2...
qk qf
PREUVE. La suite (pk/ qk}JQ: 1 est convergente car ses deux sous-suites extraites, (P2k/ qzk}JQ:1
et (P2k-ifq2k-J)JQ:i sont convergentes et ont la même limite. Notons x cette limite. Comme
les deux suites sont adjacentes, P2k-if q2k-l < x < P2k/q2k-
Soit h E N* impair. Nous avons alors

Ph/qh <X< Ph+if qh+l,


d'où on déduit que O < x - p h /q h < p h+l /q h+l - p-hl'q h = Ph+i Qh+l%
q,,-qh+il'h. Or ,

Ph+lqh - qh+lPh 1 1
Ph+ifqh+l - P i J % = - - - - - - = - - - :::; 2·
qh+lqh qh+lqh qh
Si h est pair, avec les mêmes inégalités, on peut prouver que -1 / q~ < x - Phi qh < 0, d'où
le résultat. ■

1.3. La décomposition d'un irrationnel


Lorsque la suite (nk}kEN considérée est celle des quotients d'un irrationnel x, la suite des
réduites associées converge précisément vers x. C'est ce qui conduit à la notion de dévelop-
pement d'un irrationnel en fractions continuées (en fait indéfiniment continuées), que nous
allons voir maintenant.
Soient x un irrationnel et (nk}JQ:o sa suite de quotients définie au moyen de l'algorithme
de Gauss. Rappelons que la suite (xk}JQ:o associée à x est définie par xo = x et xk+1 = 1/{xk}
pour tout k ~ 1 avec nk = [xkl. On laisse au lecteur le soin de montrer par récurrence sur k
que les réduites (pk/qk}JQ: 1, associées à la suite (nk}JQ:o, vérifient pour tout k EN* la relation

X
PkXk +Pk-1
= ------'--
qkXk + qk-1
Théorème 23.21. Pour tout nombre irrationnel 'X 1 û e:tîstë: une unique suite (n0k:>o d'en-
tiers vérifiant nt.: ~ 1 pour tout k ~ 1 et telle que - - -

PREUVE. Commençons par montrer l'existence d'une telle suite. Pour cela, il suffit de
prouver que la suite (nk}JQ:o, des quotients de x, vérifie x = [n0, n 1, ...]. Cela signifie que
x = lim [no, n1, ... , nk-1], ce qui revient encore à montrer que la suite (pk/ qdk>i des ré-
k-+too -
duites de (nk}JQ:o converge vers x. Calculons donc x - Pk/ qk. On a,

_t PkXk+Pk-1 / Pk-lqk-pkqk-1 (-l)k-l


X -pk/ qk = -pk qk = - - - - - - - = - - - - - - ,
qkxk + qk-1 qkf qkxk + qk-1) qk( qkxk + qk_i)
d'où l'on déduit que lx - Pk/ qkl :::; 1/ qk, Comme lim qk = +oo, on peut conclure que x est
k-+too
bien la limite des réduites Pk/ qk,
Il reste à prouver l'unicité d'une telle suite. Pour cela, supposons qu'il existe une se-
conde suite d'entiers (mk)JQo vérifiant les conditions du théorème. Comme x est irrationnel,
il est compris strictement entre E[x] et E[x] + 1, donc pour un rang k assez élevé, la fraction
[m0 , m 1 , m 2, ... , mJ se trouve strictement comprise entre E[x] et E[x) + 1. Le fait que mo soit
la partie entière de [m0 , m 1 , m 2, ... , mJ entraîne que mo = E[x) =no.L'égalité

1
[mo,m,,mz, ... ,mJ =mo+ [ J
m 1 ,m2, ... ,m

implique que 1/[m 1 , m 2, ... , mJ converge vers x - no; par suite [m,, m2, ... , mJ converge
vers x 1 = 1/(x - n 0 ). Le même argument prouve que m, = E[x,J = n,.' Ainsi par récurrence
on peut voir que les deux suites coïncident. ■

Concluons maintenant cette étude par quelques observations que nous retrouverons dans
le cadre des cours de L2 et L3.
Remarque.
1) On peut vérifier par récurrence que pour un irrationnel x, et pour tout k E N, on a
Xk = [nk, nk+l, ... ].
2) Si (pk/qk)JQ 1 est la suite des réduites des quotients de x, alors pour tout k 2: 1,

3) Il est possible de montrer, en utilisant cette dernière propriété, qu'une réduite Pk/ qk
des quotients d'un irrationnel x réalise la meilleure approximation possible de x pour un
dénominateur inférieur à lqkl- Plus précisément, on laisse à titre d'exercice la preuve du fait
que si pet q sont des entiers vérifiant lql < lqkl, alors lx-pk/ qkl < lx-p/ql. Cette remarque
montre bien tout l'intérêt du procédé pour l'approximation des réels.

EXEMPLE 23.22. Déterminons le développement en fractions continuées du nombre d'or


,h
4'
= l+v'S
2 •
2
► Le réel cp est la solution strictement supérieure à 1 de x - x - 1 = 0, il vérifie donc
cp - 1 = 1/ cp. Avec les notations utilisées ci-dessus, nous allons montrer par récurrence sur
k que xk = cp et nk = 1, pour tout k 2: O. Si on pose x = cp, par définition x = x 0 = cp et
comme E[cp] = 1, on a alors no= 1. Supposons le résultat vrai à l'ordre k. Les relations

1 1
Xk+l = - - - = ~ l et cp-1 = ~•
Xk - nk 4' - 4'

entraînent alors que xk+l = cp, d'où l'on déduit que nk+l = 1. La propriété est donc vraie à
l'ordre k + 1. On peut en conclure que

cp
+ v15
1
= -2- = [1, 1, 1, ... , 1, 1, 1, ... ].
EXEMPLE 23.23. Soit n un entier naturel non nul. Montrons que

Jn 2 + 1 = [n,2n,2n, ... ,2n, ... ].

► Le nombre n est la partie entière de ✓n 2 + 1. Par suite, x1 =


n + -n
Rk
= ✓n2 + 1 +net
donc la partie entière de x 1 est 2n. Le nombre x2 = -/nl+f 1
n + +n-2n
Rk
= n + -n coïncide donc
avec x 1. En fait la suite (xk)JQo est stationnaire à partir du rang 1. Il en est de même pour
la suite (nk)JQO· Nous avons ainsi montré ce que nous souhaitions.

EXEMPLE 23.24. Si on applique l'exercice précédent à n = 2, on obtient ✓5 = [2,4,4, ... ].


Déterminons un rationnel u/b tel que 1 ✓5- u/bl < ,0-4_
► Pour cela calculons les six premières réduites de ✓5 qui sont 2, 9/4, 38/17, 161 /72, 682/305.
Le nombre rationnel 682/305 convient.

EXEMPLE 23.25. En utilisant l'algorithme de Gauss, nous allons déterminer les 6 premières
réduites du développement en fractions continuées de ::r
► Il suffit de construire la suite de Gauss à partir d'une approximation de ::~- On obtient

(po,qo)=(l,1), (p1,qil=(2,1), (P2,q2)=(3,2),

(p3,q3) = (8,5), (p4,q4) = (19, 12), (p5,q5) = (65,41).

1.4. Et si le développement est périodique ?


Nous avons vu que la périodicité (à partir d'un certain rang) du développement en base b
d'un réel caractérisait les rationnels. Il est naturel de se demander ce que traduit la périodicité
du développement en fractions continuées. Soit x un réel dont le développement en fractions
continuées [n0 , n 1 , •.. ] est périodique à partir du premier rang, c'est-à-dire qu'il existe un
entier T vérifiant lt-r+k = nk pour tout entier k. Nous savons que x = PT""!PT- 1 où P-r-l, P-r,
QTJC,c QT-1
q-r-1, q-r sont des entiers, et que X-r = [n-r, n-r+ 1, ... ]. Par périodicité, X-r = x, donc x = PTx:pT 1
Q-rX QT-1
et q-rx2 + ( q-r-1 - P-rlx - P-r-l = O. Le nombre x est racine d'un polynôme de degré deux à
coefficients entiers.
Prenons maintenant un réel x dont le développement en fractions continuées [n0 , n 1, ...]
est périodique à partir d'un certain rang m. Ceci entraîne que le développement en fractions
continuées de Xm = [nm, nm+l, ... ] est périodique à partir du premier rang. Donc Xm est
solution d'une équation du second degré à coefficients entiers. Comme x = PmXm!Pm- 1 où
QmXm Qm-1
Pm-1, Pm, qm-1 et qm sont des entiers, on peut déduire facilement que x est racine d'un
polynôme de degré deux à coefficients entiers. En résumé nous avons montré le théorème
suivant.

Théorème·. 23.26. Si le développement en fro.çti<>ri, .e<>ntmù.ées d.'un, ~fe11t pé.tifxl'U}J.f.e


partir d'un certain rang,.alors ce réel estsolutîond't1;ne é(futii,tori:J:lu ~ecônd degré à coefficients
entiers. · · ·
EXEMPLE 23.27. Calculons le nombre [1,2,3, 1, 2, 3, ... , 1,2, 3, ... ].
► Six= [1,2,3, 1,2,3, ... , 1,2,3, ... ], alors

1 = 1+ 1 _ 1 + 3x + 1
X = 1+ l 2+ x - 7X + 2.
2+ 3+~ 3x+l

Le réel x est la solution positive de l'équation 7x 2 - 8x - 3 = 0 qui n'est autre que 4


+f7.
EXEMPLE 23.28. Soit n un entier naturel non nul. 1Iontrons que

Jn 2 + 2 = [n, n,2n, n,2n, ... , n,2n, ... ].

► En effet, le nombre n est la partie entière de Jn 2 + 2. Par suite.

1 v'n2+2+n
X1=-----
✓n2+2-n 2

et donc la partie entière de x 1 est n. Le nombre 2n est la partie entière de

2
x2 = v'n2+2 =Jn 2 +2+n.
n 2 +2+n-2n
Donc le nombre x 3 coïncide avec x 1 . Nous avons ainsi montré l'égalité annoncée.

COMPLÉMENT 2. LES GAMMES

Des fractions continuées à la musique

Notre gamme musicale classique, formée des notes DO, RÉ, MI, FA, SOL, LA, SI, DO, et de leurs
altérations (dièses et bémols), est souvent qualifiée de gamme pythagoricienne. Son origine est
très ancienne et il n'est pas très facile de remonter aux idées qui ont conduit à sa construction.
Il est cependant clair qu'elle a une origine empirique, provenant par exemple de la nécessité
de concevoir et d'accorder des instruments de musiques à cordes ou à vent.
Dans ce complément, nous montrons comment quelques considérations physiques et ma-
thématiques simples sur la structure des sons musicaux permettent de reconstruire notre
gamme de manière très naturelle. Nous y verrons intervenir de manière cruciale les propriétés
du développement des réels en fractions continuées, ainsi que celles des sous-groupes de R
Nous nous sommes inspirés de la discussion de Y. Hellegouarch parue dans la Gazette des
Mathématiciens, n° 81, juillet 1999.

2.1. Production et perception des sons musicaux


Les bruits que nous percevons sont dus aux vibrations de l'air autour de nous qui induisent
des vibrations de nos tympans, elles-mêmes transformées en impulsions transmises au cerveau
qui les analyse. Nous sommes encore loin de comprendre exactement les mécanismes mis en
jeu dans ce processus, nous n'en aurons heureusement pas besoin. De plus, nous ne nous
intéresserons qu'à des bruits très particuliers : les sons musicaux.
1. Les sons musicaux. Nous appellerons ici son musical un «bruit» engendré par un
instrument de musique (convenablement joué ... ). C'est donc une vibration de l'air ambiant,
qui sera caractérisée par le fait qu'elle a une fréquence bien définie et constante sur un intervalle
de temps donné. Par exemple, les cordes à vide de la guitare produisent des sons musicaux
lorsqu'on les pince, de même que celles du violon lorsqu'on les frotte avec l'archet.
Il est intéressant de comparer ces sons musicaux aux sons produits par des oscillateurs
électriques élémentaires dont le signal de sortie est une vibration purement sinusoïdale.
Pour de tels systèmes, la pression de l'air à la sortie de l'appareil suit une loi de la forme
p(t) = Asin(2nwt), où t désigne le temps 2 •
Les sons émis paraissent totalement neutres, sans "timbre" particulier. Ils sont complè-
tement caractérisés par deux quantités : leur amplitude A, que nous percevons comme liée à
l'intensité du son, et par leur fréquence w, que nous percevons comme liée à sa hauteur. Nous
appellerons ici de tels sons des sons purs.
Les sons produits électriquement, comme les signaux d'alerte (fermeture des portes d'un
métro, etc.) ou les sonneries (non musicales) des téléphones numériques, ne sont pas purs en
général, mais sont cependant perçus par l'oreille comme beaucoup plus pauvres que les sons
musicaux.
Ces derniers, en revanche, ont une structure très riche. Comme pour les sons purs, on
peut leur associer une intensité et une hauteur, mais cela ne suffit pas à les caractériser :
ils ont aussi un timbre, que nous n'aurons pas besoin de définir ici très exactement. Notons
simplement pour commencer qu'une même "note" (son de fréquence donnée), jouée avec la
même intensité sur deux instruments différents (comme par exemple le piano et le violon),
sera perçue très différemment dans les deux cas; le timbre de ces deux notes n'est pas le
même. C'est une analyse un peu plus détaillée de cette notion de timbre qui va nous donner
le point de départ de notre étude.

2. La structure d'un son musical : d'où vient le timbre? Si nous observons le mou-
vement d'une corde de guitare, nous nous apercevons que son mode de vibration est très
complexe, et ne peut être décrit par une simple sinusoïde. On peut donc s'attendre à ce que
la vibration transmise à l'air ambiant (par l'intermédiaire de la vibration très complexe de la
table d'harmonie) soit nettement plus riche qu'un son pur et donc beaucoup plus difficile à
décrire.
Il existe cependant une remarquable méthode pour analyser ces sons, ainsi que la presque
totalité des phénomènes vibratoires, c'est l'analyse de Fourier. Joseph Fourier (1768-1830)
était un physicien et mathématicien de génie qui inventait des méthodes mathématiques ra-
dicalement nouvelles pour analyser les problèmes physiques qui se posaient à lui. Son œuvre
majeure porte sur l'analyse des fonctions périodiques générales et consiste à les décompo-
ser en une superposition de nombreuses fonctions périodiques, de fréquences toutes multiples
d'une fréquence fondamentale, et d'amplitudes de plus en plus petites à mesure que la fré-
quence grandit. On appelle harmoniques ces fonctions de fréquences multiples de la fréquence
fondamentale.
Donnons un exemple. Soit w E JR~ une fréquence donnée. Un polynôme trigonométrique

2
Notons comme toujours que le passage d'un modèle mathématique à un modèle physique exige une convention
d'unité : l'unité physique de fréquence est le Hertz, correspondant à une oscillation par seconde. Dans la suite,
nous supposerons implicitement que les fréquences sont exprimées en Hz.
de fréquence w est par définition une fonction de lR dans lR définie pour t E lR par
n=N
f(t) = L. Ancos(2mtwt) + Bnsin(2mtwt),
n=O

où les amplitudes An et Bn sont des réels. L'entier N est le degré du polynôme. En suivant les
méthodes introduites par Fourier, on peut montrer que toute fonction continue de fréquence
w peut être uniformément approchée avec une précision arbitraire par un polynôme trigono-
métrique bien choisi (dont le degré croît en général avec la précision souhaitée), c'est-à..-dire
que si f est une fonction continue périodique, et si t: > 0 est donné, il existe un polynôme
trigonométrique P tel que lf(t) - P(t)I < t: pour tout réel t.
Comme notre oreille n'a qu'une sensibilité limitée, un son musical quelconque, de fréquen-
ce donnée, peut donc être convenablement décrit par un polynôme trigonométrique. Un tel
polynôme est caractérisé par la fréquence et les coefficients (An, Bnl, 0::; n::; N, qui décrivent
les amplitudes des harmoniques. Le timbre du son considéré provient en fait de la répartition
de ces amplitudes.
Nous n'aurons pas besoin d'approfondir davantage cette question et retiendrons seulement
qu'un son musical de fréquence donnée w n'est jamais composé par un seul son purement
sinusoïdal, mais contient aussi un grand nombre d'harmoniques, dont les fréquences sont des
multiples entiers de w (et dont l'amplitude est en général beaucoup plus faible que celle du
son sinusoïdal de fréquence w).
3. La perception des sons et la notion de note. Une premiêre constation est facile à
établir : deux sons musicaux de fréquences w et w' suffisamment différentes, émis l'un aprês
l'autre, sont distingués par l'oreille quels qu'en soient les timbres. De plus, le son à la fréquence
la plus élevée est spontanément décrit comme plus aigu que l'autre.
Par ailleurs, lorsque deux sons purs de fréquences w et 2w sont émis en même temps,
on constate qu'une grande majorité d'auditeurs n'entend qu'un seul et même son. Seuls des
musiciens expérimentés arrivent à entendre ce son comme son composé. De la même maniêre,
une oreille non éduquée différencie assez difficilement deux sons musicaux de fréquences w et
2w. On dit que ces deux sons sont séparés d'une octave.
Maintenant, si ces deux derniers sons musicaux sont émis successivement, l'oreille a encore
tendance à les « identifier », le son de fréquence 2w étant cependant perçu comme plus aigu
que l'autre. Pour tenir compte de ce paradoxe, on dit que ces deux sons représentent une
même « note », jouée à des hauteurs différentes. j
En itérant la remarque précédente, on voit qu'une même «note» possêde une infinité de
variantes différentes, dont les fréquences appartiennent à un ensemble de la forme

pour un réel w donné. En effet, nous avons vu que le son à l'octave du son de fréquence w a
pour fréquence 2w et représente la même « note ». Il en est donc de même pour les sons de
fréquence 2w et 4w, puis pour tous les sons de fréquence znw avec n EN. Mais il faut aussi
considérer que les sons de fréquence w /2 et w représentent la même « note », de même que
tous les sons de fréquences znw avec n E Z, n::; O. Nous obtenons ainsi l'ensemble N(w).
Dans la suite, nous appellerons donc note tout sous-ensemble N de IR~ de la forme {2nw 1
n E Z} où w E IR~. Un tel réel w sera appelé référence de la note N. Remarquons que les
réels positifs w et w' sont des références de la même note si et seulement s'il existe un entier
relatif m tel que w' = zmw. Les éléments de l'ensemble N seront appelés les représentants
de la noteN.
4. Les familles musicales naturelles. Imaginons maintenant qu'une corde de violon, jouée
à vide, donne un son musical de fréquence w. Nous avons vu que ce son est en réalité une
superposition d'harmoniques de fréquences nw, pour n E {O, ... , N} avec N assez grand.
Dans ces harmoniques, ceux de fréquences 2w, 4w, 8w, ... représentent tous la même note,
de même que le son musical initial.
En revanche, l'harmonique de fréquence 3w représente une nouvelle note, et tous les har-
moniques de la forme 3w, 6w, 12w, 24w, ... la représentent aussi. Et on peut ainsi continuer.
Si on veut maintenant concevoir un instrument de musique comportant plusieurs cordes,
dont la plus grave émet un son de fréquence w, on constate empiriquement que pour éviter des
phénomènes de dissonance, les autres cordes à vide devront être accordées sur les fréquences
qui apparaissent dans la série de notes que nous venons de décrire.
Prenons l'exemple du violon, dont les fréquences des cordes à vide sont données dans le
tableau suivant (elles sont arrondies à l'entier le plus proche).

Note SOL RÉ LA MI
Fréquence 196 293 440 660

On constate que le rapport entre deux fréquences consécutives est toujours très voisin de
3/2. Ce rapport de fréquences est appelé rapport de quinte. Si w est la fréquence de la corde
la plus grave du violon, la corde suivante est accordée à la fréquence !w
et on voit que cette
fréquence représente la note N(3w ). La note suivante est accordée à la fréquence 32 2-2 w,
3 3
elle représente la note N(9w), et la suivante à la fréquence 3 2- w, qui représente N(27w).
Entre chacune de ces cordes il y a donc un rapport de quinte.
Une mélodie sera pour nous une suite finie de sons musicaux joués successivement (nous
ne tiendrons pas compte de leur durée, c'est-à-dire du rythme). Nous supposerons dorénavant
qu'une fréquence conventionnelle w a été fixée, par exemple w = 440. On peut donc décrire
toute autre fréquence au moyen de son rapport avec w. Nous travaillerons donc maintenant
avec les rapports de fréquences plutôt qu'avec les fréquences elles-mêmes.
La question est donc : de quels rapports de fréquences dispose-t-on pour écrire des mélo-
dies? Notre postulat est que ce rapports devront appartenir à l'ensemble

que nous appellerons famille musicale naturelle. On voit facilement que <;§ =< 2, 3 > est
un sous-groupe de (Q~, ·). Son étude va nous permettre de retrouver de manière « cano-
nique» notre gamme usuelle (et d'autres aussi, qui ont déjà été utilisées).

5. La notion de gamme. Nous disposons donc maintenant d'une liste de rapports de fré-
quences que nous pouvons utiliser pour écrire des mélodies. Le problème est que cette liste
est beaucoup trop riche ! En effet, on peut montrer que <;§ est dense dans IR~, au sens où tout
intervalle ouvert non vide contenu dans IR~ contient au moins un point de <;§. Nous allons
donner l'idée de cette démonstration. Introduisons le réel
ln3
ix ~ 1, 584962500721156,
ix = ln2'

que nous retrouverons souvent dans la suite. On admettra que ix est irrationnel (la preuve
n'est d'ailleurs pas difficile). Notons l l'application de IR~ dans IR définie par l(x) = ln x et
par E son inverse, de IR dans IR~, défini par E(x) = ex. Ces deux fonctions sont continues, et
lest un homomorphisme du groupe multiplicatif (IR~,.) sur le groupe additif (IR,+). Comme
<§est un sous-groupe de (Q:, x), c'est aussi un sous-goupe de (JR:, x) et donc l(<§) est un
sous groupe de (JR, +) de la forme
l(<§) ={p ln2+ q ln3 I (p,q) E Z:,2}.

On sait donc que l(<§) est soit dense, soit de la forme bZ, avec b E JR:. Mais l(<§) ne peut
pas être de cette dernière forme. En effet, comme ex E lR \ Q, on peut trouver une suite de
rationnels (Pn/ qn)nEN qui converge vers ex et vérifie Pn/ qn-# ex pour tout n EN. Alors il est
clair que la suite (Pn ln 2 - qn ln 3 lnEN tend vers O. On en déduit facilement (là encore, c'est
un bon exercice) que pour tout réel b > 0, l(<§) contient un élément strictement positif et
strictement inférieur à b, ce qui montre quel(<§) -# bZ. En conséquence l(<§) est dense dans
JR, et on peut montrer que la continuité de la fonction E entraîne que<§= E(l(':ff)) est dense
dans JR:, ce que nous avions annoncé.
Nous allons donc devoir sélectionner certains rapports de fréquences privilégiés, leur en-
semble<§ étant beaucoup trop gros pour être intéressant dans la pratique. Nous nous limiterons
à des rapports contenus dans l'intervalle [1, 2], c'est-à-dire entre deux octaves. Une gamme
naturelle sera une partie de [1, 2] n <§ utilisable pour écrire des mélodies. Ce n'est évidemment
pas une définition mathématique et nous allons dans la suite préciser comment construire
de telles gammes. L'idée essentielle sera la suivante : il va être possible de définir un sous-
groupe G de <§ tel que le groupe quotient <§ /G soit isomorphe à Z. On pourra donc écrire
<§ /G = {cm I m E Z} où chaque Cm est une classe d'équivalence d'éléments de<§. Nous allons
ensuite donner un procédé naturel pour choisir dans chaque classe Cm un unique représentant
Pm E <§. Nous obtiendrons donc un ensemble fi!= {Pm I m E Z} de rapports de fréquences et
l'intersection [1, 2] n fi! nous donnera la gamme cherchée.
Nous allons en fait définir une suite ( GnlnEN· de tels sous-groupes et nous obtiendrons donc
ainsi une suite de gammes possibles, de plus en plus riches lorsque n croît. Nous constaterons,
ce qui est très remarquable, que ce procédé en apparence très abstrait reconstruit en fait notre
gamme usuelle, ainsi que d'autres utilisées en musique tonale, ou d'autres encore plus riches
que notre gamme usuelle. Les résultats qui suivent sont dus au mathématicien Y. Hellegouarch.

2.2. La notion de comma


Deux sons suffisamment voisins ne sont pas distingués par l'oreille. Le rapport de fréquences
minimal en-deçà duquel deux sons sont indiscernables dépend de la capacité propre de l'oreille
et de son niveau d'éducation. L'idée que nous allons développer est que si l'on fixe un tel seuil
et si l'on identifie deux fréquences dont les rapports sont inférieurs à ce seuil, il devient possible
de construire les gammes que nous cherchons. Les musiciens connaissent ce seuil sous le nom
de comma.
1. Valeur d'un rapport. Considérons un rationnel r E Q:. On peut écrire de manière
unique r = ~, où p E N* et q E N* avec p et q premiers entre eux. On définit la valeur -v( r)
de r comme le maximum des entiers p et q :
-v(r) = max(p, q).

Cette valeur est donc une indication de la «complexité» du nombre r, en ce sens qu'une
fraction comme 3/2 peut être considérée comme simple, alors que 5674/6789, 7896/5 et 3/8977
peuvent être considérées comme compliquées.
2. Les commas. C'est la notion de valeur d'un rapport qui va nous permettre de définir
convenablement les seuils minimaux de différenciation que nous cherchions, c'est-à-dire les
commas des musiciens. Commençons par fixer une famille musicale 'i§. Nous dirons qu'un
élément y de <;§ est un comma pour <;§ si y est différent de 1 et vérifie la propriété

VrE'iff\{l}, (llnrl<llnyl )=}(-v(r)>- v(y)).

Il est possible de traduire cette condition en termes multiplicatifs . Par exemple, si y > 1,
l ln ri < l ln YI si et seulement si r E ]1 /y, y[, et si y < 1, l ln ri < l ln YI si et seulement si
r E]y, 1/y[.
Ceci donne l'interprétati on naturelle de la condition (*). Un élément r de la famille <;§
ne peut être plus proche de 1 que y qu'à condition d'avoir une valeur plus grande que y.
Un comma est donc une meilleure approximation possible de 1 dans un ensemble de rapports
de valeurs données. Une famille musicale possède donc en général plusieurs commas, qui
dépendent de cette valeur.

3. La suite des commas pour la famille musicale <;§ =< 2, 3 >. Dans ce paragaphe
nous allons montrer comment le développeme nt en fractions continuées du réel ex permet de
déterminer les commas pour la famille<;§=< 2, 3 >. C'est l'objet du théorème suivant, pour
lequel nous aurons à utiliser quelques propriétés des fractions continuées que nous rappelons
au préalable.
Pour respecter la convention adoptée par Hellegouarch, nous décalerons ici l'indexation
des réduites d'une unité. Nous noterons donc (pkhEN et ( qk)kEN les suites définies à partir de
la suite (nk) des quotients de ex par

q_J = 0, qo = 1, qk+l = qknk + qk1


Ce sont donc les numérateurs et dénominateu rs des réduites de la décompositio n en fractions
continuées de ex. Compte tenu du décalage, nous avons vu que la suite des réduites (Pzk/ qzk)kEN
est croissante et converge vers ex, et que la suite (pzk+if qzk+llkEN est décroissante et converge
vers ex. On sait aussi que la suite (IPk - qkexllkEN est strictement décroissante. Enfin, pour
k EN, on a la relation classique qkPk+l -pkqk+l = (-l)k_
Il est facile de calculer les premières réduites de ex en appliquant l'algorithme de Gauss.
On obtient par un calcul direct la table suivante (voir aussi l'exemple (23.25)).

Numérateurs Po = 1 P1 = 2 pz = 3 p3 = 8 p4 = 19 Ps = 65
Dénominateu rs qO = 1

Thoorèlllè 23.~. Avec les notati<17!'8 Pfécédentes, ,f>st1ns,p~


(-1)nqn. Alors la suite dé terme génêml ·
= {---J)n~lP1i et ;<fn =
· · ·· ·
yn:::::: 2Pii. 3if..
décroit strictement vers 1, et r ={yn:·!il E N} est un ensemble de commas supérieurs à 1. de
la famille 'd. ·

PREUVE. Montrons d'abord que Yn > 1 pour n E N. D'après les propriétés


des suites de
réduites de rangs pair et impair, on voit que la différence Pn - exqn est du signe de (-1 in-l _
On en déduit que
et donc
lnyn = Pn ln2 + ëîn ln3 = (Pn + ëfnex) ln2 > 0,
donc Yn > 1, comme nous l'avons annoncé.
Montrons que (YnlnEN est décroissante. Notons que

lnYn+l Pn+l +ëfn+lex Pn+l - qn+lex IPn+l - qn+1exl


lnyn Pn + ëfnex Pn - qnex IPn - qnexl '

la dernière égalité provenant de la positivité de ln Yn pour tout n E N. Mais, comme nous


l'avons rappelé, IPn+l - qn+1exl < IPn - qnexl, ce qui montre que lnYn+l < lnyn, et donc que
la suite (YnlnEN est décroissante.
Notons maintenant que p 0 = q 0 = 1 et, compte tenu de la valeur de ex, on voit que
IPo - qoexl < 3/4. Il en résulte que IPn - qnexl < 3/4 pour n EN.
Fixons n EN et montrons que Yn est un comma pour la famille W. Pour cela, nous devons
donc montrer que si r est un élément de(§ qui vérifie l ln ri < ln Yn• alors la valeur de r est
strictement plus grande que celle de Yn· Commer E W, il existe (p, q) E 'li} tel que r = 2P 3q
et donc, après division par ln2, l'inégalité llnrl < lnyn s'écrit:

On en déduit donc en particulier que IP + qexl < 3/4 et donc les termes p et q sont nécessai-
rement de signes opposés. On en déduit que

Comme -v(yn) = max(2Pn,3qn ), pour montrer que -v(r) > -v(yn) il suffit de montrer que
IPI > Pn et lql > qn.
Comme Pn/qn est une réduite de ex, on déduit de l'inégalité(**) que lql > qn. De plus
-lpl + lqlex < IPn - qnexl donc

Par ailleurs

Pn :s: qnex + 3/4 :s: (lql - l)ex + 3/4 = lqlex - ex+ 3/4 :s: lqlex - 3/4

ce qui montre que lpl > Pn· On en déduit donc que -v(r) > -v(yn), ce qui montre que Yn est
un comma pour la famille t;ff. ■

On déduit du théorème précédent et des premières réduites de la décomposition de ex les


valeurs suivantes des premiers commas de t;ff.

22 32 312 265
Commas de t;ff Yo =~ Y1= 5 Y2=3 Y4 = :.i9 Y2=4T

On peut montrer que r est en fait l'ensemble de tous les commas > 1 de t;.1.
2.3. La construction des gammes
Nous sommes maintenant en mesure de donner une définition naturelle pour les gammes
musicales extraites de la famille t§.
1. Définition abstraite d'une gamme naturelle. La famille musicale t§ représente, comme
nous l'avons dit, l'ensemble de tous les rapports de fréquences que nous avons décidé de consi-
dérer. L'idée est d'interpréter les commas de t§ comme les seuils minimaux de différenciation
des rapports par l'oreille humaine. Bien entendu, lorsque n--, oo, Yn--, 1 et le seuil corres-
pondant devient très vite trop petit pour être réaliste. En revanche, lorsque n = 0, y 0 = 3/2.
C'est le rapport de quinte qui est immédiatement discernable par toute oreille, même non
éduquée. On s'attend donc à observer des effets intéressants pour n de l'ordre de 3 ou 4.
Fixons n E N*. Convenons donc d'identifier deux éléments r et r' de t§ lorsque r /r' est un
multiple du comma Yn· Ceci revient à considérer le quotient de la famille t§ par le sous-groupe
multiplicatif engendré par Yn, que nous noterons Gn· Le théorème suivant donne les propriétés
du groupe quotient 22n = t§ /Gn- Nous noterons TT la surjection canonique de t§ sur 22n, donc
par définition Ker TT = Gn.

Théôr,tt1e 23~00. Le groupe gùotient Sn= <§/Gn est engendré pàr lù:êl1t$_el)~ ,;,,,ft(yn:C.1f
et est isomorphe à (Z, +). · · · ·

PREUVE. Nous allons utiliser l'isomorphisme 1J' de (li,+) sur (t§, x) défini par

(le fait que 1J' est un isomorphisme se vérifie facilement par unicité de la décomposition en
facteurs premiers). Posons
Un= (Pn, ëïn}.
On a donc y n = 1J'( Un)- Soit Hn le sous-groupe de Z 2 engendré par Un, on a donc par définition
Hn = {fun If E Z}. Comme 1J' est un isomorphisme, on vérifie facilement que Gn = 1J'(Hnl-
On pose Qn = Z:2/Hn. Notons n la projection canonique de Z 2 sur Qn. Par définition,
Ker 7t = Hn.
Considérons maintenant le morphisme composé TT o 1J' : Z 2 --, 22n- Comme 1J' est un
isomorphisme, il est facile de voir que le noyau de l'homomorphisme composé TT o 1J' est
exactement Hn, en effet

Ker (TT o 1J') = 1J1-1 (Ker TT)= 1J1-1 (Gnl = Hn.

Il en résulte donc par le théorème du passage au quotient qu'il existe un homomorphisme


injectif lj., de Qn = Z 2 /Hn dans 22n tel que

TT o 1J' = lj., o n.
De plus, comme 1J' est surjectif, il en est de même pour TT o 1J' et donc aussi pour lj.,. Il en
résulte que lj., est un isomorphisme de Qn sur 22n, ce qui va nous permettre de montrer plus
facilement les propriétés cherchées, en raisonnant d'abord sur Qn et en « transportant ensuite
les résultats au moyen de lj., ».
Nous allons d'abord montrer que Qn est engendré par un élément. Pour cela, remarquons
que les propriétés des fractions continuées entraînent l'égalité IPnëïn-l - Pn-l ëïnl = 1. Notons
maintenant
L'égalité précédente montre que le couple B = (Un-l, Un) constitue une base de JR2 et montre
aussi que la matrice de passage
p = (~n-1 ~n)
qn-1 qn
est de déterminant ± 1, donc P est inversible et p- 1 est à coefficients entiers.
Soit maintenant un élément w quelconque de Qn- Fixons v E 1c1 (w). Comme v E 'li},
ce qui précède montre que les composantes de v dans la base B sont entières, soit donc
v = KUn-1 +Cun avec (K,C) E Ji. Il en résulte que w = n(v) = rr(KUn-1) = K7I(Un_,). Posons
ûl = rr(Un-1 ). Tout élément de Qn est de la forme Kûl avec K E Z, ce qui montre que ûl
engendre Qn et prouve notre assertion : Qn est monogène.
Nous allons maintenant vérifier que Qn est isomorphe à Z. Pour cela, notons <D l'applica-
tion de Z dans Qn définie par <l>(K) = Kûl pour K E Z. Cette application est clairement un
homomorphisme de (Z, +) dans ( Qn, +), surjectif d'après ce qui précède. Montrons qu'il est
injectif en cherchant son noyau. Supposons que KE Z vérifie <p(K) = Kûl = 0, c'est-à-dire

K7I(Un_,) = 7I(KUn_,) = 0,
ou, de manière équivalente
Kl.Ln-1 E Ker 7I = Hn
ce qui équivaut à l'existence de C E Z tel que KUn-l = Cl.Ln. Mais comme Best une base,
ceci entraîne que K et m sont nuls. Ceci montre donc que Ker <D = {O} et que <D est injective.
Comme <D est surjective, nous avons montré que Qn est isomorphe à Z.
Comme 11-' est un isomorphisme, il en résulte que .I2n est isomorphe à Z, et comme l'image
d'un générateur par un isomorphisme est encore un générateur, on voit que .f2n est engendré
par 11-'(ûl) = TT(Yn-il- Ceci termine la preuve. ■

2. Les gammes naturelles successives. Le groupe quotient .I2n a donc une description très
simple
.I2n = {g: 1 m E Z}
et nous avons fait un grand pas en avant. En identifiant les éléments de la famille '§ suivant le
sous-groupe Gn, nous avons considérablement limité les possibilités de choix pour constituer
une gamme. En particulier, un élément c de .I2n est complètement caractérisé par l'entier m
tel que c = g:. Nous appellerons degré de c cet entier m.
Rappelons qu'une gamme sera pour nous un ensemble d'éléments de'§ contenu dans [1, 2]
et possédant des propriétés spécifiques qui permettent de la caractériser de manière unique.
Ces propriétés seront issues de notre étude précédente du groupe quotient .I2n.
Commençons par examiner les classes des bornes de l'intervalle [1, 2]. La classe TT (1 ) est
bien comprise, c'est la classe de l'élément neutre, c'est donc l'élément neutre g~. Son degré
est donc O. Il est maintenant intéressant de connaître le degré de la classe TT(2) E .I2n.

Propositi<>n 23.31 . .Lë degré d~ la classeTT(2} dans $n estlè dénominateur qn de la réduite


d'ordre n de tx.
PREUVE. En utilisant l'isomorphisme 1l' du paragraphe précédent, il suffit de montrer qu'il
existe un entier m E Z tel que 1l'-1(2) = qn 1l'-1(Yn-il + m1l'- 1(yn), c'est-à-dire, en utilisant
les notations du paragraphe précédent
soit encore en explicitant les termes

et on voit immédiatement que l'entier m = qn convient. ■

Les deux extrêmes de l'octave, les éléments 1 et 2, ont donc des classes de degrés O et qn.
Il est donc naturel pour constituer une gamme de considérer l'ensemble des éléments de I2n
dont les degrés sont compris entre O et qn

Il nous reste maintenant seulement à passer de cette construction « abstraite », portant sur
des classes d'équivalence, à une construction explicite portant sur des éléments de'#. Si nous
arrivons à extraire de chaque classe d'équivalence un représentant privilégié, nous aurons
terminé. Or il se trouve qu'une classe d'équivalence c E I2n contient un unique élément > 1
de plus petite valeur. C'est évidemment celui-ci que nous allons choisir comme représentant
pour sa classe. Vérifions d'abord cette assertion.
Fixons une classe c E I2n. L'existence d'un élément > 1 de valeur minimale dans c est
évidente. Montrons l'unicité. Supposons que c contient deux éléments r = 2P 3q et r' = 2P' 3q'
distincts > 1 et de même valeur minimale. Supposons que p et q, et p' et q', soient de même
signe. Alors -v(r) = r = -v(r') = r', ce qui est impossible. Donc par exemple p et q sont de
signes distincts avec (l'autre cas se traitant de la même manière) 2P > 3q, donc -v(r) = 2P
L'égalité des valeurs entraîne facilement que p' et q' sont aussi de signes distincts. On en
déduit que p = p' et donc r' = 2P /3q' avec 3q' < 2P (puisque r' > 1). Mais comme r = r'ym
pour m E Z, ceci est impossible, ce qui termine la preuve de notre assertion.
Notre étude est donc terminée. pour construire une gamme, l'entier n étant donné, nous
allons former le groupe I2n et considérer ses éléments de degrés compris entre O et qn. Nous
obtendrons ainsi qn+l éléments dans I2n, qui sont des classes d'équivalence dans'#. De chacune
de ces classes, nous allons extraire un élément privilégié, celui qui est > 1 et dont la valeur
est la plus petite. C'est donc un élément de'# (donc un rationnel de la forme 2f3K), que nous
prendrons comme élément de notre gamme. On vérifie sans peine que ces éléments privilégiés
sont dans [1 , 2].
Pour c E I2n, nous noterons Pn(c) l'unique élément > 1 de c de valeur- minimale. Nous
pouvons maintenant conclure en donnant notre définition de la gamme naturelle de '# associée
au comma 'Yn·
Définition 23.32. Soit n EN*. La gamme naturelle de'# associée au comma 'Yn est l'en-
semble

Et il s'agit enfin de vérifier que nous avons reconstruit les gammes connues ! Il n'est pas
difficile de déterminer explicitement les valeurs de p(gk) pour les petites valeurs de n et k,
par un calcul direct. Nous laissons au lecteur le soin de vérifier les résultats suivants :
• pour n =1
'51 ={ 1,2}.
c'est simplement l'octave;
• pour n =2
c'est le rapport de quinte;
• pour n =3
2 2 2
3 2 3 2 }
IB2= { 1,23'3'2'3'2 .
c'est la gamme dite pentatonique;
• pour n =4
2 5 4 2 7
2 3 2 3 2 3 6 3 2 33 2 35 }
8 4

IB2= { 1,3s'23'33'26'3'29'2'34'24'32'27'2 .
c'est la gamme dodécaphonique usuelle avec une très bonne approximation ! Pour permettre
au lecteur de s'en convaincre, nous donnons ci-dessous le tableau des fréquences (en Hz) des
notes de notre gamme classique (dite tempérée) arrondies à l'entier le plus proche.

Note DO RÉ MI FA FAU SOL LA LAU SI DO


Base 262 277 293 330 349 370 392 415 440 466 494 523

Rien n'interdit de continuer ... On trouve effectivement alors d'autres gammes, qui ont aussi
été utilisées, celles de Janko et Mercator. Nous ne prétendons pas que la contruction que nous
venons de décrire explique la genèse de toutes ces gammes, mais elle décrit leur structure d'une
manière parfaitement unifiée et cohérente, en montrant les relations qu'elle entretiennent avec
la décomposition en fractions continuées de ln 3/ ln 2.
Chapitre 24
LA NOTION GÉNÉRALE DE FONCTION
EN ANALYSE

'IDÉE de fonction que nous connaissons aujourd'hui est une notion moderne, fondée

L sur la théorie des ensembles, qui s'élabore seulement au début du XXe siècle. Dans ce
chapitre d'introduction à l'analyse, nous allons bien sûr rappeler cette notion, mais
nous allons aussi essayer de montrer ce que pouvait être une fonction avant la création de la
théorie des ensembles. En particulier, le titre du présent chapitre reprend celui du premier
chapitre de l'ouvrage Intrnductio in analysin infinitorum que publia Euler en 1748, à savoir De
Functionibus in genere: « Des fonctions en général». Nous citerons en complément quelques
extraits des écrits de cet illustre mathématicien sur les fonctions, que nous commenterons
ensuite dans les chapitres suivants.
Avant la fin du XIXe siècle, il n'existe pas encore de définition précise de ce qu'est une
fonction, mais cela n'empêche pas les mathématiciens de savoir ce qu'ils entendent par là et
de les étudier. Le besoin impérieux de disposer de définitions formelles pour les ensembles et les
fonctions ne se fera sentir que dans la deuxième moitié du XIXe siècle, lorsque commenceront à
apparaître des problèmes complexes qui nécessiteront de poser des bases solides sur lesquelles
asseoir la quantité déjà impressionnante de résultats mathématiques accumulée dans les siècles
passés.
Toutes ces définitions, qu'un étudiant est censé connaître de nos jours, sont donc le fruit
d'un très long processus de réflexion et de maturation, bien qu'elles paraissent maintenant
parfois parfaitement immédiates 1 . Un cours de mathématiques est en général une suite de
réponses et de solutions. Mais pour qu'il y ait une réponse, il faut en principe qu'il y ait eu
une question au préalable. Donner arbitrairement une réponse à une question non formulée
n'est en général pas très utile. Nous essayerons donc, dans cette partie dédiée aux fonctions,
de combiner la rigueur telle qu'on la pratique de nos jours avec une mise en perspective
historique et des raisonnements heuristiques qui auront pour but de montrer que, comme
toutes les disciplines, les mathématiques ne se sont pas faites en un jour.
Ce chapitre ne présentera pas de théorème. C'est essentiellement un exposé de diverses
notions, agrémenté de nombreux exemples, et comportant quelques définitions générales qui
nous seront utiles dans les chapitres ultérieurs. Ces notions seront plus longuement développées
dans les chapitres suivants, lorsque nous disposerons des outils adéquats.

1. LA NOTION MODERNE DE FONCTION

De notre point de vue moderne, fondé sur la théorie des ensembles, une fonction (ou applica-
tion2) est la donnée de deux ensembles E et F, qualifiés respectivement d'ensembles de départ
et d'arrivée et dotés d'une certaine façon de faire correspondre aux éléments du premier des

1
Il en va de même pour la plupart des notions mathématiques dont un enseignement à rebours de l'histoire
laisse penser qu'elles sont formidablement dogmatiques.
2
Nous emploierons indistinctement les deux termes.
668

éléments du second. Nous rappelons dans ce qui suit quelques éléments sur les fonctions,
comme elles apparaissent en analyse.

I. 1. Fonctions ou applications ; graphes, niveaux et images


Le problème est donc de donner une définition formelle de ce que l'on entend par le fait de faire
correspondre un élément à un autre. Nous avons déjà rencontré des situations analogues lors
de l'étude des relations sur un ensemble. Rappelons d'abord que si E et F sont des ensembles,
leur produit cartésien E x F est l'ensemble de tous les couples formés d'un élément de E et
d'un élément de F, c'est-à-dire

E x F = {(x, y) 1 x E E, y E F}.

Définition 24.1. Une fonction (ou application} f d'un ensemble E vers un ensemble F est
la donnée d'une partie (h de E x F telle que, pour tout x E E, il existe un unique y E F
vérifiant (x, y) E 9t- La partie

9t = {(x, f(x)) 1 x E E}

est appelée le graphe de la fonction f. L 'unique élément y E F associé ainsi à un élément


donné x de E est appelé l'image de x par l'application f et noté y = f(x); l'élément x est
alors appelé un antécédent de y. L'ensemble E est dit ensemble de départ de f, l'ensemble F
est dit ensemble d'arrivée de f.

On voit donc qu'une fonction est définie au moyen de trois objets: un ensemble de départ,
un ensemble d'arrivée, et une correspondance. Pour le rappeler, on emploie souvent la notation
f : E -1 F pour désigner une fonction de E dans F.
On voit aussi qu'on peut représenter une fonction f: E -1 F de deux manières équivalentes:
soit par la donnée de son graphe (vu comme une partie de Ex F soumise à certaines conditions),
soit par la donnée de l'image de tout point x de l'ensemble de départ E. Pour mettre en relief
la notion de correspondance, ou aussi la définition explicite de cette correspondance, on peut
utiliser la notation
f: E -1 F, x H f(x).
En pratique, il arrive souvent que des fonctions soient définies par des formules explicites.
C'est par exemple le cas de x H 1/x. Pour cette fonction, x varie dans R., mais le réel O n'a
pas d'image. Il faut dans ce cas préciser quel ensemble de départ il est légitime de considérer.
On choisit en général le plus gros ensemble de départ possible, que l'on appelle domaine de
définition de la fonction. Le domaine de définition de x H 1/x est R.*.
Pour des fonctions numériques d'une variable réelle, c'est-à-dire des fonctions dont l'en-
semble de départ et l'ensemble d'arrivée sont des parties de R., on donne le plus souvent la
fonction sous la deuxième forme et on la représente ensuite en dessinant son graphe, qui est
une partie de R.2 . Mais nous allons aussi avoir à nous intéresser à des fonctions plus générales,
par exemple définies sur un ensemble produit R.n, ou sur C, ou encore à valeurs dans un
ensemble produit R.n, ou dans C. La représentation la plus agréable et intuitive des fonctions
varie alors suivant les cas.
Nous allons en voir des exemples. Commençons par un exemple «abstrait» qu'il ne s'agit
pas de représenter sinon par des diagrammes de Venn, comme on l'a vu au chapitre 7.
669

EXEMPLE 24.2. Soient E = {1, 2, 3, 4, 5} et f = {a, b, c}. La partie de E x f donnée par

Çf = {(1, a), (2, a), (3, a), (4, b), (5, b)},
détermine bien une fonction (ou application) de E vers f. On peut aussi écrire f: E ---, f,
avec
f(l) = f(2) = f(3) = a, f(4) = f(5) = b.
En revanche la partie Ji de E x f définie par

Ji = {(1, a), ( 1, b), (2, al, (4, b), (5, b )},

ne détermine pas une fonction.

Voici maintenant un exemple de fonction de lR dans R

EXEMPLE 24.3. La fonction, f: IR---, IR, x H x 2 , a pour graphe Çf = {(x, x 2 ) 1 x E IR}.


1 Ce graphe est représenté sur la figure suivante.

FIGURE 24.1. Graphe de x H x 2

Rappelons maintenant quelques définitions classiques.


Définition 24.4. Soient E et f deux ensembles. Si f: E---, f, x H f(x) est une fonction et
si A est un sous-ensemble de E, on appelle restriction de f à A et on note f1A l'application

XH f(x).

En d'autres termes, la fonction f1A est la fonction qui à tout point x de A associe la valeur
de f en ce point. Elle diffère de f par le fait que son ensemble de départ est A et non E. En
termes de graphes, on voit facilement que Çf1A = {(x, f(x)) x E A}= Çf n (A x f).
1

Définition 24.5. Soient E et f deux ensembles, et A une partie de E. Si f: A---, f, x H f(x)


est une fonction, on appelle prolongement de f à E toute application g : E ---, f dont la
restriction 91A est égale à f.

Définition 24.6. Soient E, f et G trois ensembles. Soient f : E ---, f et g : f ---, G deux


applications. Alors la composée go f est l'application de E dans G définie par

go f(x) = g(f(x))
pour tout élément x de E.
L:. Soit E un ensemble. Si A est une partie de E, l'injection canonique iA de A dans E est
l'application définie par iA(x) = x pour tout x de A. On vérifie facilement que si f est une
application de E dans F, la restriction f1A de f à A vérifie f1A = f o iA.
671

Test 24.1. Test 24.3.


La partie de lR x lR définie par Même question pour la partie

{(x, 11) E (0, +oo[xlR 1 11 2 = x}.


est-elle le graphe d'une fonction? Si oui écrire la
correspondance, x H 11 = f(x). Même question Test 24.4.
pour {(x, 11) E lR x lR 1 11 2 = 0}.
Soient f et g deux fonctions de E dans F. Que
Test 24.2. peut-on dire des assertions suivantes?
La partie de lR x (0, +oo[ définie par 1. 9t n Ç 9 est le graphe d'une fonction de E
2 2 dans F.
{(x,11) E lR x [0,+oo[ 1 x +11 = l}
2. 9t U Ç 9 est le graphe d'une fonction de E
est-elle le graphe d'une fonction? dans F.

Il est traditionnel de représenter les fonctions de lR dans lR par leur graphe, la raison
principale est que ce graphe est alors une partie de JR 2 (on dit aussi que c'est une courbe).
Imaginons maintenant que l'on ait à représenter une fonction de lR 2 dans R Son graphe est
donc une partie de JR 2 x lR = JR 3 (on dit aussi que c'est une surface), il est donc moins facile et
moins précis de le dessiner. Et si maintenant il s'agit de représenter une fonction de JR 2 dans
JR 2 le recours au graphe devient impossible, puisque c'est dans ce cas une partie de lR4 . Il faut
donc trouver d'autres moyens de représenter ces fonctions.
Pensons à la manière de dessiner les reliefs d'une montagne sur des cartes géographiques,
ou encore les relevés de pression sur une carte météorologique. Dans les deux cas, en assimilant
la région concernée à une partie P de JR 2 , il s'agit de représenter une fonction de P dans lR :
la fonction altitude ou la fonction pression. On n'utilise jamais pour cela la représentation
du graphe des fonctions, on préfère dessiner sur la région concernée des lignes régulièrement
espacées correspondant aux points d'égale altitude (une ligne tous les 50 mètres par exemple),
ou les points d'égale pression (une ligne tous les 10 hectopascals par exemple). Ces lignes sont
ce que l'on appelle des lignes de niveau pour les fonctions considérées. Nous allons maintenant
en donner la définition générale.

Définition 24. 7. Soient E et F deux ensembles. Soient f: E -, F une Jonction, A une partie
de E et B une partie de F. L'image réciproque de B par f est définie comme le sous-ensemble
de E constitué par les antécédents des éléments de B ; on note cette partie

f- 1 (B) ={x E E I f(x) E B}.

L'image directe de A par f est définie comme le sous-ensemble de F constitué des images par
f de tous les éléments de A ; on note cette partie

f(A) = {f(x) 1 x E A}.

L'image réciproque d'un singleton {y} s'appelle la fibre au-dessus du point y, c'est donc
l'ensemble des antécédents du point y.
672

.\ttcntion Images réciproqu es d'ensembl es


On prendra garde au fait que, pour définir l'image réciproque d'une partie par une ap-
plication, il n'est pas nécessaire que cette application soit bijective. Il faut en particulier
prendre garde au fait que la notation pour la fibre au-dessus de -y est f- 1 ({-y}), et non
f- 1 (-y). Cette dernière écriture est valable seulement lorsque f est bijective, f- 1 désignant
alors l'application réciproque.

EXEMPLE 24.8. Soit f: lR ----, JR, x H x 2 ; f n'est pas bijective. On a alors par exemple

f- 1 ([-1,4]) = [-2,2] et f([-2,2]) = [0,4].

Définition 24.9. Pour une fonction à valeurs réelles f : E ----, lR et pour c E JR, la fibre
f- 1 ({c}) s'appelle aussi le niveau de hauteurc.

EXEMPLE 24.10. Le niveau de hauteur c de la fonction f : lR ----, JR, x H x 2 , est vide si


1 < 0, c'est le singleton {O} si c = 0 et c'est la paire {VC,
c si c > O. -vc}
Il faut noter que la donnée de tous les niveaux d'une fonction permet de la reconstruire
complètemen t. La description de ces niveaux donne donc un moyen de décrire la fonction
qui ne passe plus par la représentatio n de son graphe, ce qui peut être très intéressant. En
effet, pour une fonction de lR. 2 dans JR, le graphe est alors une partie de lR. 3 (une surface dans
l'espace), ce qui est difficile à représenter. En revanche, dans ce cas, la représentatio n des
niveaux est encore possible puisque ce sont encore des parties de lR. 2 ( des courbes dans le
plan).
EXEMPLE 24.11. Considérons les fonctions g eth définies par
g: lR. 2 ----, JR, (x, -y) H x 2 +-y 2 et h: lR. 2 ----, JR, (x, -y) H x 2 - -y 2 .
Les niveaux g- 1 (c) sont alors vides sic< 0 et sont des cercles de centre (0,0) et de rayon
Je, sic ), O. Les niveaux de h ne sont jamais vides, ce sont des hyperboles de sommets situés
sur l'axe des abscisses si c > 0, des hyperboles de sommets situés sur l'axe des ordonnées si
c < 0 et la réunion de deux droites (la première et la seconde bissectrices) si c = O. Si on
pense à une carte de montagne, on voit que la fonction g est un bon modèle pour la fonction
altitude au voisinage d'un sommet ou du fond d'une cuvette, alors que la fonction h est un
bon modèle pour la fonction altitude au voisinage d'un col. On peut aussi voir la fonction h
comme la fonction hauteur d'une selle de cheval, qu'on invite le lecteur à dessiner.
Il est aussi intéressant de savoir changer de coordonnées pour représenter des fonctions,
ou les étudier. Par exemple, pour étudier h, on peut poser

x(u,v) = (u+v)/2, -y(u,v) = (u-v)/2


et étudier la fonction H définie par
H(u, v) = h(x(u, v),-y(u, v)) = uv
dont les niveaux sont les courbes d'équation uv = c, qui sont bien sûr encore des hyperboles.
Le changement proposé revient à se placer dans le repère dont les vecteurs sont portés par
les bissectrices, qui sont aussi les asymptotes communes aux hyperboles. La représentatio n
des niveaux de g et h est donnée dans la figure suivante.
673

Il.)
f/l

~
§

1
..8
Il.)
i:,
Il.)

]
•Il.)
i::
,Il.)
'QI)

1
j

FIGURE 24.2. Niveaux des fonctions g et h

Si l'on considère maintenant une fonction f définie sur une partie D de lR et à valeurs dans
JR 2 ou dans JR 3 , il est naturel d'en considérer plutôt l'image, c'est-à-dire l'ensemble f(D). Cet
ensemble est en effet une partie de lR 2 ou JR3, et il est possible de le représenter graphiquement.

EXEMPLE 24.12. Voici les images des fonction f et g de lR dans R 2 définies par

f(t) = (sin(2t),cos(3t)), g(t) = (sin( 1Ot), cos( 1lt) ).

Ce sont des courbes de Lissajous.

f(JR)

FIGURE 24.3. Courbes de Lissajous

Il. QUELQUES PROPRIÉTÉS DES FONCTIONS DE 1R DANS ]R

Nous connaissons déjà, depuis les premiers chapitres de base du présent ouvrage, les propriétés
ensemblistes qu'une fonction est susceptible de posséder, à savoir être injective, surjective,
bijective. Dans les chapitres qui suivent nous allons définir toute une série de propriétés de
674

«régularité» : continuité, dérivablité, intégrabilité, etc. L'étude de ces propriétés est l'objet
même de l'étude analytique des fonctions. Dans cette partie, à titre d'exemple, nous allons
énumérer quelques propriétés des fonctions que l'on rencontre en analyse, pour permettre au
lecteur de bien discerner le domaine de l'analyse de celui de l'algèbre. Ces fonctions sont en
général définies sur une partie de Rn (ou en) et à valeurs dans Rm (ou cm), mais nous nous
limiterons ici aux fonctions de R dans R Ces propriétés reposent alors de manière essentielle
sur la relation d'ordre de R Certaines des définitions que nous allons donner ont déjà été vues
dans le cadre des suites.
Définition 24.13. Soit E une partie de R
1) Une fonction f: E CR-, R est dite croissante si pour tout (x, y) E E1 , six,::;; y, alors
f (x) ,::;; f (y). Elle est dite strictement croissante si pour tout (x, y) E E1 , si x < y, alors
f(x) < f(y).
2) Une fonction f: E CR-, Rest dite décroissante si pour tout (x, y) E E2, six,::;; y, alors
f(x) ~ f(y). Elle est dite strictement croissante si pour tout (x, y) E E1 , six < y, alors
f(x) > f(y).
3) Une fonction f : E C R -, R est dite monotone si elle est croissante ou décroissante, et
strictement monotone si elle est strictement croissante ou strictement décroissante.

EXEMPLE 24.14. La fonction (affine) f: R-, R, x H 2x - 5 est strictement croissante,


la fonction (affine) g : R -, R, x H -x + 8 est strictement décroissante et la fonction
h: R-, R, x H x 1 , n'est pas monotone.

Les règles de calcul sur les inégalités entraînent facilement la proposition suivante, dont
nous laissons la preuve au lecteur.
Proposition 24~1s. Soient E Ùne partie non 1ritTe de R~ fe:t g deûffonctions définies de
E dansR.
1) Si f et g sont croissa~tes (resp. décroissantes), alors leur somme f+ g est.croissante
(resp~ décroissante);~
2) Si f et g ':sont à ~eui:s 0
6;~
R+ et toutes les deui croissantes (resp/ déetoissantes)1 alors
le produitfg êst crQfuant (resp. décroissante).

Test 24.5. Test 24.6.


Soient E un ensemble non vide de lR et f une ap- Soient E un ensemble non vide de lR et f une
plication croissante de E dans lR'i-. Que peut-on application monotone de E dans JR*. La fonction
dire de 1/f? 1/f est-elle monotone?

En utilisant les propriétés de la composée de deux fonctions, on obtient facilement la


proposition suivante.

Proposition 24.16. Soient t et F dem parties non vides de R, f : E -, R et g : f ~ R


de'tl,X applications, âvec-:f(E} c E
1) Si .f et g sont eroissante.s, alors)eur yo_mwsée g o f est. c:roissan!e.
2) Si f et g sont diiJroissanies1 alors letir composée g o f est croissànte.
3) SH est. C'("(Jj$Sant.e .et 9 décr<J~~n{e, ~lQrS 9 0 t es_t dét:roissan~.
4) SH est décroissante et g croissànte, alors g of est déc1Wsante.
675

Test 24.7. Test 24.8.


Soient n E N et f une fonction monotone de lll Étudier les réciproques des assertions données
dans R La fonction f 2n +1 est-elle monotone ? dans la proposition ci-dessus.
Même question pour f 2n?
Définition 24.17. Soient E une partie non vide de lR et f une fonction de E dans R
1) La fonction f est dite majorée s'il existe un réel M tel que f(x) ~ M pour tout x E E.
2) La fonction f est dite minorée s'il existe un réel m tel que f(x) ?: m pour tout x E E.
3) La fonction f est dite bornée si elle est à la fois majorée et minorée, ce qui équivaut à
dire qu'il existe un réel k vérifiant, pour tout x E E, lf(x)i ~ k.

Si f : E --+ lR est majorée, on peut alors définir sa borne supérieure supE f de la manière
suivante ·
supEf = sup{f(x) x E E}. 1

La borne supérieure de l'ensemble {f(x) x E E} est en effet bien définie puisque cet ensemble
1

est une partie de JR, non vide (E est non vide) et majorée (f est majorée). De même, on définit
la borne inférieure de f lorsque f est minorée de la manière suivante

infE f = inf {f(x) 1 x E E}.

EXEMPLE 24.18. La fonction f : lR --+ JR, x H x 2 est minorée, avec infm;. f = 0, et non
majorée. La fonction g : IR --+ IR, x H sin x est bornée, avec infm;. g = -1 et supIR g = 1, et la
fonction h: IR --+ IR, x H x n'est ni majorée, ni minorée.

Nous donnons maintenant l'analogue de la proposition 24.15.

Proposition 24.19. .Soient E une partie non vide de R, f et g deux fonctions .définies de E
dans R. Nous avons les propriétés suivantes :
1) sif et g sont màjortes (resp; min11fflès}1 alœrs leur somme f + g est majorée (resp.
m'i,norée} ; .. .. ·
2) si f et g sont à valeurs dans R+ et toutes les deux majorées, alors le'JJ,r produit fg est
majoré;
3) si f et g sont bornées, alors f + g et fg sont bornées.
La relation d'ordre de IR entraîne l'existence de la valeur absolue. À son tour, cette va-
leur absolue permet de définir la notion de fonction lipschitzienne, que nous donnons à titre
d'exemple.

Définition 24.20. Soit I un intervalle de IR Une fonction f : I --+ lR est dite lipschitzienne
s'il existe un réel positif k tel que, pour tous x et y éléments de I, on ait l'inégalité

lf(x)-f(y)I ~ klx-yl.

Le réel k est un rapport de Lipschitz pour f.


Les fonctions lipschitziennes sont à penser comme plus « régulières » que des fonctions
générales, en ce sens que le graphe d'une fonction lipschitzienne de rapport k est contenu
dans tout secteur angulaire de pente k centré en un point de ce graphe.
676

FIGURE 24.4. Fonction lipschitzienne et secteur

EXEMPLE 24.21. Une fonction affine f lR -, JR, x H ax + b, est lipschitzienne de


1 rapport a.

EXEMPLE 24.22.Montrons que la fonction t H vt est lipschitzienne sur (1, +oo[.


► Soient t et t' dans (1, +oo[. L'identité t' - t = (Jtï - vt) (vit'+ vt) entraîne que

lv't' - vtl = lt' - tl .


v't'+vt
Comme vit'+ vt? 2, on a lvlt' - vtl ,,;; ~Jt' - tJ.

2 3 4 5

FIGURE 24.5. Le graphe de la fonction x H ,jx

Test 24.9. Test 24.10.


La fonction t H v't est-elle lipschitzienne sur Le produit et la somme de deux fonctions lip-
le segment [O, 1]? schitziennes sont-ils lipschitziens?

Il est possible de définir d'autres indications de régularité, plus souples que le caractère
lipschitzien.

Définition 24.23. Soit I un intervalle de JR, soit ex > O. Une fonction f : I -, lR est dite
cx-holdérienne s'il existe un réel positif C tel que, pour tous x et y éléments de I, on ait

lf(x)-f(y)J ,s; CJx-yJ".


Le réel ex est un exposant de Holder pour f.
677

En conséquence, une fonction 1-holdérienne est lipschitzienne. Mais il existe des fonc-
tions holdériennes qui ne sont pas lipshitziennes, dès que ex < 1. La fonction x H y'x est
1/2-holdérienne sur ~+, mais elle n'est pas lipschitzienne, comme on aura pu le remarquer
grâce au test précédent. Pour une fonction cx-holdérienne f, le graphe est contenu dans les
régions de la forme

S(x,f(x)),C,cx = {(u, v) E ~
2
1lv- f(x)I ~ Clu- xi''}, XE~,

qui sont plus «grosses» que des secteurs angulaires. au voisinage du point (x, f(x)).

FIGURE 24.6. La région S(o,OJ,1,1/2

Terminons ce paragraphe par une dernière notion, basée sur la structure d'espace affine
de la droite réelle R
Définition 24.24. Soit I un intervalle ouvert non vide de R Une fonction f : I ---1 ~ est
dite convexe si, pour tout (x, y) E 12 et tout t E [O, 1]

f((l - t)x + ty) ~ (1 - t)f(x) + tf(y).


Une fonction f : I ---1 ~ est dite concave si -f est convexe.

Géométriquement, si f est convexe, la portion de son graphe comprise entre deux points
quelconques A et B est située au-dessus du segment [A, B] (voir le chapitre 29).

EXEMPLE 24.25. La fonction f : ~ ---1 ~, x H x 2 , est convexe alors que la fonction


1 g : ~+ ---1 ~, x H y'x, est concave.

Test 24.11. Test 24.12.


Soit f : I ----, ~ une fonction convexe sur l'inter- Montrer que la somme de fonctions convexes
valle 1. Que peut-on dire des fonctions -f, lfl est convexe.
et f 2 ?
COMPLÉMENT 1. HISTORIQUE

La notion de fonction chez les Anciens

Dès l'Antiquité, des correspondances entre essence même, comportent des listes finies
deux listes de quantités, les secondes dé- et sont utilisées uniquement à des fins pra-
pendant des premières, apparaissent sous la tiques; on ne trouve pas dans tout cela l'idée
forme de tables, par exemple chez les Ba- d'une grandeur variable continue, à laquelle
byloniens, avec des tables sexagésimales de on assignerait une autre grandeur variable
carrés et racines carrées, de cubes et racines qui en dépendrait.
cubiques etc., utilisées essentiellement en as-
tronomie. Un peu plus tard, on les retrouve
chez les Grecs, avec les Pythagoriciens qui
étudient le lien entre les longueurs de cordes
pincées et les sons qu'elles émettent et qui
fondent ainsi les bases des gammes musi-
cales. Encore plus tard, au début de notre
ère, Ptolémée dresse, toujours pour des be-
soins de calculs astronomiques, des tables
trigonométriques. Toutefois, ces tables, par
Claude Ptolémée (vers 90-168)

Au XIVe siècle, les écoles de philosophie naturelle de Paris et d'Oxford font un pas de plus
vers la notion actuelle de fonction ; en particulier, Nicole Oresme, chez qui de surcroît va
apparaître leur représentation graphique. Dans son ouvrage Sur la configuration des qualités,
il écrit (vers 1350) :

Donc, toute intensité susceptible d'être ac-


quise d'une manière successive doit être
imaginée au moyen d'une ligne droite éle-
vée verticalement à partir de chaque point
de l'espace ou du sujet qu'affecte cette in-
tensité.{... j
La quantité d'une qualité linéaire, se doit
Nicole Oresme (1320-1382) imaginer à l'aide d'une surface dont la lon-
gitude ou base est une ligne tirée au sein du
« A l'exception des nombres, toute chose me- sujet qu'affecte cette qualité, comme le dit
surable doit être imaginée à la manière d'une le chapitre précédent, et dont la latitude ou
quantité continue. Pour la mesure, il faut l'altitude est représentée par une ligne élevée
imaginer des points, des surfaces, des lignes, sur la base qu'on a tracée, comme le dit le
selon l'avis d'Aristote.{... } second chapitre. »

Nicole Oresme distingue alors les qualités de la fonction selon la forme que possède sa
représentation graphique ; il parle en particulier de « qualité uniformément difforme terminée
à un degré nul» (entendre fonction linéaire) lorsqu'on a affaire à un triangle rectangle, de
« qualité uniforme ou d'intensité égale en toutes ses parties » (entendre fonction constante)
pour un rectangle et de « qualité uniformément difforme terminée de part et d'autre à un
certain degré » (entendre fonction affine) pour un trapèze. Et il ajoute
« Si la ligne d'intensité ou ligne de sommet est une courbe ou est composée de plusieurs
lignes, alors la qualité imaginable à partir d'une telle figure est dijformément difforme. »
Le traité d'Oresme comporte bien des aspects novateurs au-delà de la zoologie des qualités
précédemm~mt mentionnées mais qui seraient trop longs à rapporter ici.

D C

A B A B A

FIGURE 24.7. Classification des qualités selon Oresme

Mais ce n'est vraiment qu'à partir du XVIIe siècle que nous allons \Taiment trouver la
notion de fonction telle que nous l'envisageons encore aujourd'hui.

D'un point de vue pratique, le symbo-


lisme que François Viète dégage à la fin du
XVIe siècle va être primordial car il va per-
mettre d'exprimer de manière concise des
formules algébriques où figurent des quanti-
tés inconnues et des coefficients arbitraires.
À cela s'ajoute la philosophie de l'époque,
parfaitement représentée par Galilée (1564-
1642) qui pense que les mathématiques sont
le langage permettant de comprendre le
François Viète (1540-1603) monde.

L'étude de la chute des corps par Galilée, les lois régissant le mouvement des planètes
données par Kepler sont des exemples fondamentaux de mise en correspondance de quantités
spatiales en fonction du temps et si l'on note souvent t H f(t) une fonction de nos jours,
cela est dû à cette vision cinématique première des fonctions dans laquelle la variable est le
temps 3 .
En dehors des lignes trigonométriques manipulées depuis déjà bien longtemps, la première
fonction non algébrique (on dit alors qu'elle est transcendante) qui apparaît vers 1615, est le
logarithme de Neper dont nous parlerons longuement dans un chapitre ultérieur.
En 1637, Descartes publie sa Géométrie dans laquelle il introduit la notion de coordonnées
et d'équations algébriques P(x, y) = 0 qui relie ces coordonnées et qui définit des courbes.
Il y écrit :
« Prenant successivement infinies diverses grandeurs pour la ligne y, on en trouvera aussi
pour la ligne x, et ainsi on aura une infinité de points tels que celui qui est marqué C, par le
moyen desquels on décrit la ligne courbe demandée »

3
Dans le chapitre sur la dérivation des fonctions, nous verrons comment cette interprétation en termes de
mouvement est importante pour comprendre la notion de dérivée comme vitesse instantanée.
Ces lignes expriment clairement l'idée de dépendance fonctionnelle entre quantités va-
riables.

Mais tandis que Descartes se limite essen-


tiellement aux équations polynomiales, cette
restriction va bientôt être abandonnée avec
l'apparition d'opérations algébriques « se ré-
pétant à l'infini », en particulier de som-
mations infinies faisant apparaître certaines
fonctions comme de telles sommes. Cette ré-
volution se fera sous l'impulsion de Merca-
tor, Wallis et surtout Newton, ce dernier
donnant les développements en séries en-
tières des fonctions x H 1/ ( 1 + x), x H sin x
et x H cos x. Comme nous le verrons dans
le chapitre sur les fonctions dérivables, New-
ton introduira les notions de fluentes et de René Descartes (1596-1650)
fluxions.

Puis vint Euler au XVIIIe siècle qui développa de manière considérable l'analyse, c'est à
dire l'étude des fonctions. Dans le paragraphe qui suit, nous allons examiner avec quelques
détails, sa vision des fonctions en général.
La vision qu'ont les mathématiciens de la notion de fonction ne s'est évidemment pas figée
au XVIIIe siècle; elle est devenue de plus en plus générale au fur et à mesure que de nouveaux
problèmes émergeaient. Nous en donnerons quelques idées dans les chapitres ultérieurs. Nous y
verrons comment de fonctions très régulières, comme les fonctions polynomiales par exemple,
on est progressivement passé à des fonctions simplement dérivables puis seulement continues,
notion qui ne s'est clairement dégagée qu'au xrxesiècle (chapitres 25 et 26). Au chapitre 27,
nous verrons aussi comment Riemann a voulu encore élargir cette famille de fonctions pour
construire la notion d'intégrale. Au chapitre 28, nous montrerons enfin plusieurs procédés
explicites pour définir des fonctions et étudier leurs propriétés.

1.1. Des fonctions en général selon Euler


Dans la perspective historique présentée ici, il convient d'approfondir la conception de la
notion générale de fonction présentée par Euler dans son fameux ouvrage Introductio analysin
infinitorum. Le chapitre premier De functionibus in genere du livre premier de l'Introductio
analysin infinitorum d'Euler, paru en 1748, est divisé en 26 points dont nous allons donner
quelques extraits. Nous éviterons de paraphraser ce beau texte et nous nous contenterons de
quelques notes de bas de page pour éclairer certains termes qui pourraient être obscurs.

« 1. Une quantité constante est une quantité déterminée, qui conserve toujours la même valeur.
Tels sont les nombres de toute espèce, qui conservent constamment la valeur qu'ils ont une
fois obtenue. Lorsqu'il s'agit de représenter ces sortes de quantités par des caractères, on se
sert des premières lettres de l'alphabet, a, b, c etc. À la vérité, dans J'analyse ordinaire qui n'a
pour objet que des quantités déterminées, on désigne ordinairement celles qui sont connues
par les premières lettres de l'alphabet, et celles qui ne le sont pas, par les dernières; mais
c'est une distinction à laquelle on a moins d'égard dans la haute géométrie; on y envisage les
quantités sous un autre aspect particulier, les unes étant considérées comme constantes et les
autres comme variables.
2. Une quantité variable est une quantité indéterminée, ou, si l'on veut, une quantité universelle,
qui comprend toutes les valeurs déterminées.
Une valeur déterminée quelconque pouvant être exprimée en nombre, il s'ensuit qu'une
quantité variable comprend tous les nombres de quelque nature qu'ils soient. Il en est de la
quantité variable, comme du genre et de l'espèce à l'égard des individus; on peut la concevoir
comme embrassant toutes les quantités déterminées. Au reste, on a coutume de représenter
les quantités variables par les dernières lettres de l'alphabet z, y, x etc.
[. .. ]
4. Une fonction de quantité variable est une expression analytique4composée de quelque manière
que ce soit, de cette même quantité et de nombres, ou de quantités constantes.
Ainsi toute expression analytique, qui outre la variable z contiendra des quantités cons-
tantes, est une fonction de z. Par exemple, a+ 3z: az - 4zz: az + b ✓ aa - zz; cz; etc., sont
des fonctions de z.
5. Une fonction de variable est donc aussi une quantité variable.
En effet, comme on peut mettre à la place de la variable toutes les valeurs déterminées", la
fonction recevra elle-même une infinité de valeurs, et il est impossible d'en concevoir aucune,
dont elle ne soit susceptible, puisque la variable comprend même les valeurs imaginaires6.
Par exemple, quoique cette fonction ✓9 - zz ne puisse donner un nombre plus grand que 3,
tant qu'on mettra des nombres réels à la place de z; cependant, en introduisant pour z des
nombres imaginaires, tels que S ✓=î, il n'est pas possible d'assigner une valeur déterminée,
qui ne puisse être déduite de la formule ✓9 - zz. Au reste, il n'est pas rare de rencontrer des
expressions qui ne sont que des fonctions apparentes; car, quelque valeur qu'on donne à la
variable, elles conservent toujours la même valeur, comme z0 , F, a~=~·
Ces expressions sous
la forme apparente de fonctions de variables, sont réellement des quantités constantes7 .
6. La principale différence des fonctions consiste dans la combinaison de la variable et des quan-
tités constantes qui les forment.
Elle dépend donc des opérations par lesquelles les quantités peuvent être composées et
combinées entre elles. Ces opérations sont l'addition et la soustraction; la multiplication et la
division; l'élévation aux puissances et l'extraction des racines; à quoi il faut ajouter encore la
résolution des équations. Outre ces opérations, qu'on appelle algébriques, il y en a plusieurs
autres qu'on nomme transcendantes : comme les exponentielles, les logarithmes, et d'autres
sans nombre, que le calcul intégral fait connaître.
Distinguons cependant certaines espèces de fonctions; à savoir, les multiples 2z; 3z; ~z;
az, etc. et les puissances de z; comme z2 ; z3 ; z 112 ; z- 1 ; etc. quantités formées par une seule
opération, et qui, comme celles qui résultent de la combinaison de plusieurs, ne laissent pas
de porter de même le nom de fonctions.

4
Ce terme n'est pas précisé par Euler. Il faut entendre par là toute combinaison d'opérations algébriques
(sommes, multiplication, division) ou transcendantes (application de fonctions telles que l'exponentielle, le
logarithme ou les fonctions trigonométriques), certaines de ces opérations pouvant éventuellement être répétées
une infinité de fois. Ces divers types d'opérations sont détaillés un peu plus loin par Euler.
5
Euler ne s'embarrasse pas des problèmes d'ensemble de définition!
6 Comme nous le verrons dans le chapitre sur les fonctions élémentaires, le fait de considérer aussi les valeurs
complexes de la variable, ce que fait systématiquement Euler, est une idée extrêmement féconde même si elle
peut conduire à certaines difficultés que nous allons voir avec les fonctions multiformes.
7
Euler distingue fonctions et constantes, ce que nous ne faisons plus de nos jours; des fonctions peuvent être
constantes.
7. Les fonctions se divisent en algébriques et transcendantes; les premières sont formées par
des opérations algébriques seulement, et les dernières supposent pour leur formation des opérations
transcendantes.
[. .. ]
8. Les fonctions algébriques se subdivisent en rationnelles et en irrationnelles. Dans les dernières
la variable est affectée de radicaux, et dans les premières elle n'en est point affectée.
[. ..]
9. Les fonctions rationnelles enfin, se divisent en entières et en fractionnaires.
{. .. }
1O. Il faut ensuite remarquer principalement la division des fonctions en uniformes et en multi-
formes.
La fonction uniforme est celle qui n'obtient qu'une seule valeur déterminée, quelque valeur
déterminée qu'on donne à la variable z. La fonction multiforme est celle qui, pour chaque
valeur déterminée qu'on met à la place de la variable, donne plusieurs valeurs déterminées.
Toutes les fonctions rationnelles, soit entières, soit fractionnaires, sont des fonctions uniformes,
parce que ces sortes d'expressions, quel que soit le nombre qu'on substitue à la variable,
n'obtiennent qu'une seule valeur; mais les fonctions irrationnelles sont toutes multiformes, à
cause de l'ambiguïté des signes radicaux, et de la double valeur qu'ils indiquent. Il y aussi
parmi les fonctions transcendantes des fonctions uniformes et multiformes, on peut même
admettre des fonctions infinitiformes; tel serait l'arc de cercle qui répondrait au sinus z, car
il y a une infinité d'arcs circulaires qui ont tous le même sinus.

COMPLÉMENT 2. DES CONSTRUCTIONS

Divers modes de définition des fonctions

Nous indiquons dans cette partie quelques-unes des méthodes les plus utilisées pour définir
des fonctions dans la pratique.

2.1. Fonctions définies par des formules explicites


On peut donner explicitement la correspondance x H f(x). Le plus courant est de donner la
valeur f(x) au moyen d'une formule dans laquelle x intervient. Il peut n'y avoir qu'une seule
formule valable pour tous les éléments de l'ensemble de départ, ou bien plusieurs formules
correspondant à une partition de cet ensemble. Nous donnons quelques exemples de ces divers
types de situations dans ce qui suit. Commençons par une seule formule.

EXEMPLE 24.26. Les fonctions f, g et h respectivement définies sur JR, JR* et (C par

1
f(x) = vY+J, g(x) = -,
X
h(z) =z4 +3z 2 -z+5,

sont des fonctions explicites de la variable x ou z exprimées à l'aide d'une seule formule.

Voici maintenant des exemples de fonctions définies au moyen de plusieurs formules.

EXEMPLE 24.27. On peut avoir envie de prolonger la fonction g du précédent exemple à


1 lR tout entier, c'est-à-dire avoir une fonction G définie sur lR dont la restriction à JR* est g.
Pour cela il faut donc assigner à O une image. Par exemple on peut définir

G . lR 4
lR { 1/x si x # 0
. ' X H O si X = 0

Cette fonction n'est pas vraiment définie par deux formules mais par une formule et une
valeur ponctuelle.

EXEMPLE 24.28. Définissons la fonction f sur lR par

. m, Til) { cos x si x E lIL


f • l& -+ 1&, X H X • 1TI>•
e SI XE"'""--

Cette fonction est définie par deux formules.

Anticipant un peu sur les chapitres ultérieurs8 , on voit que, malgré la présence de ces
deux formules, la fonction f est continue en O (sur JR* c'est clair puisque f est donnée par
deux « formules de fonctions continues ») : il y a raccord des deux expressions avec une
valeur commune en O égale à 1. Pour Euler, une telle fonction définie par deux expressions
«analytiques» était considérée comme une fonction discontinue9 . On voit aussi que la fonction
f n'est pas dérivable en 0, comme le lecteur peut le vérifier.

EXEMPLE 24.29. Définissons la fonction f sur lR par,

0 si XE ]R_
f: JR-+ JR, X H { e -l/x2 Sl. Til)*
XE J&+

Là encore, cette fonction est définie par deux formules.

Le lecteur pourra, à titre d'exercice classique (voir le chapitre 29) montrer que la fonction
ainsi définie est indéfiniment dérivable sur R
Cette manière de définir une fonction par plusieurs formules est souvent utilisée pour
produire des exemples ou des contre-exemples.

EXEMPLE 24.30. Donnons un exemple de fonction définie sur lR qui, en tout point de R
n'admet ni limite à gauche, ni limite à droite. Si nous cherchons dans nos formules toutes
faites, nous aurons du mal à produire un tel exemple en combinant les fonctions élémentaires
par des sommes, produits ou composées. Voici pourtant une idée très simple, basée sur la
densité de Q et de lR \ Q dans lR : la fonction

f . lR 4
lR { 0 si x E lR \ Q
. ' X H 1 si X E Q.

Il y a ici deux formules, et la partition de l'ensemble de départ n'est certainement pas un


simple découpage en deux intervalles.

8
Le lecteur a en fait déjà rencontré les notions évoquées ici dans la partie Bases du présent ouvrage.
9
Il ne s'agissait pas d'une erreur d'Euler mais simplement d'un autre point de vue, d'une autre définition, la
continuité au sens où nous l'entendons n'ayant été définie que beaucoup plus tard, dans la seconde moitié du
XIXe siècle.
On laisse au lecteur le soin de vérifier que la fonction f n'admet ni limite à gauche, ni
limite à droite, en un point quelconque de R

EXEMPLE 24.31. Considérons l'assertion suivante


« Toute fonction f: lR'.--+ lR'. tendant vers +oo en +oo est croissante« à partir d'un certain
moment», c'est-à-dire qu'il existe a E JR'., tel que f est croissante sur [a, +oo(. »
On pourrait la croire vraie et pourtant elle ne résiste pas longtemps à la réflexion. Pour
montrer qu'elle est fausse, il suffit de mettre en avant un contre-exemple. À cette fin, on peut
bien sûr chercher une fonction définie par une seule formule mais il est plus simple d'exhiber
une fonction f, définie comme suit. Rappelons que si x E JR'., on note [x] sa partie entière,
définie comme l'unique entier n E Z vérifiant n ='( x < n + 1. On pose alors

. m, 11]) { (x] + 1 si [x] pair


f . m. --+ m., x >----+ ( ] 1 SI. (X] 1mpair
. .
X -

On laisse au lecteur le soin de se convaincre que la fonction f est bien un contre-exemple


à notre assertion.
Il est aussi possible de définir des fonctions par composition. Notons que l'application go f
ne peut être définie que si l'ensemble de départ de g contient l'image f(E) de f.

EXEMPLE 24.32. Soient f : lR'. --+ lR'. définie par f(t) = i1t
2 et g : lR'.+ --+ lR'. donnée par

g(x) = )t1 1 . On peut définir go f car f(JR'.) C lR'.+. Nous avons pour t E lR'.

1 2+t2
(g O f)(t) = g(f(t)) = ~ +
f(t) + 1

Les fonctions f et g de l'exemple précédent sont elles mêmes composées de fonctions. Par
exemple f est la composée de u H 1/u et x H 1+x2 . La composition de fonctions est un moyen
important pour fabriquer d'autres familles de fonctions à partir des fonctions élémentaires.

2.2. Deux familles de fonctions fondamentales


L'énumération de « toutes les sortes de fonctions qui existent » faite par Euler dans son
Introductio, que nous avons donnée dans le complément précédent, nous a déjà permis de
rencontrer quelques grandes familles. Nous allons retrouver nombre d'entre elles en détail
dans la suite du cours de série L, nous commençons ici par les deux exemples les plus simples.
Les fonctions polynomiales. Ce sont celles qu'Euler qualifie d'entières 10 parmi les ration-
nelles. L'ensemble F(JR'., JR'.) des fonctions de lR'. dans lR'. est muni d'une structure d'algèbre
associative unitaire, par l'addition, la multiplication des fonctions et la multiplication des
fonctions par les réels; l'algèbre P des fonctions polynomiales n'est autre que la sous-algèbre
engendrée par la fonction identité lR'. --+ JR'., x H x, et la fonction constante de valeur 1,
c'est-à-dire l'ensemble des fonctions de la forme

10
1a dénomination « fonction entière» recouvre de nos jours un sens plus large.
avec n E N, a 0 , a 1 , ••• , Œn E R
Elles son
« tout es les propriétés souhaitables>>, t définies sur lR tou t entier. Ces fonctions possèdent
ce sont les fonctions les plus régu
extension à une variable complex lières possibles. Leu r
e z ne pose auc un pro blèm e; elles
tou t entier, à valeurs dan s C. son t alors définies sur C
On définit de man ière plus gén
érale les fonctions polynomiales
exemple à plusieurs variables. Par
P(x, y)= x\ / + 5x3y + x 2 -4
est une telle fonction, qui peu t
être définie sur lR ou C.
Fon ctio ns rati onn elle s. Les fonc
tions rationnelles son t celles qui
tien t de deu x fonctions polynom s'ob tien nen t comme quo-
iales, de même que les nombres
quo tien ts de deux entiers. Là enc rati onn els s'ob tien nen t comme
ore, leur extension à une variable
problème. Par mi elles, figurent complexe ne pose pas de
évidemment les polynômes. En
finies sur lR (ou q tou t entier, général, elles ne son t pas dé-
mais sur cet ensemble priv é d'un
sont les racines du dén omi nate ur nom bre fini de points, qui
et son t appelés les pôles de la fonc
tion rationnelle.
EXE MP LE 24. 33.
► La fonction

f: lR --t lR, X H -1-1-2•


est rati onn elle et n'a pas de pôle +x
. Elle est donc définie sur lR tou
► La fonction t entier.

g:C----,IC, 1
ZH -1- -2•
est rationnelle et a deu x pôles,
+z
t et -i, donc elle est définie sur C \ {-t
► La fonction , t}.
x4 -3x 2 + x + 8
f: lR --t lR, x H (x - 3)(x2 - 3x + 2)'
est rationnelle et a troi s pôles,
1, 2 et 3, donc elle est définie
sur lR \ {l, 2, 3}.
Ces fonctions rationnelles peuven
t s'écrire sous la forme d'un e som
tionnelles plus simples appelée me de fonctions ra-
décomposition en éléments simples
calculer leurs dérivées et primitive , ce qui est très util e pou r
s.
EXE MP LE 24. 34. La fonc
tion rati onn elle

f : lR 1
--t JR, x H _ x2 ,
1
s'éc rit

1 x = (, X + 1~ 2~ ~ ~X) '
ce qui perm et de calculer aisémen
t sa dérivée n-iè me :

(n) n! ( l (-l) n )
f (x) = 2 (l -x)n +T + (1 +x) n+l '
ainsi que ses primitives

J1 -
dxx2 = :z1ln (l1 -+ x) + C, x XE ) -1, 1[,
où C est une con stan te réelle arbi
trai re.
2.3. Fonctions implicites
Nous avons jusqu'à maintenant rencontré des fonctions définies de manière explicite, soit au
moyen dè formules, soit par composition à partir de fonctions élémentaires. Mais il y a un
autre moyen très important, dit implicite de définir des fonctions.
Pour le montrer, considérons d'abord une fonction f, de R dans R par exemple, et l'équation
f(x) = 0 qu'elle définit. On s'attend à trouver en général un nombre fini de racines isolées
dans R, c'est-à-dire intuitivement « éloignées les unes des autres ». L'ensemble de ces racines
peut être considéré comme défini par la donné de la fonction f. Dans le cas le plus favorable,
celui où f n'admet qu'une racine ex, ce réel ex peut donc être pensé comme implicitement défini
par f.
On considère maintenant une fonction F de R 2 dans R et, pour y E R, on définit une
fonction fy de R dans R par fy(x) = F(x, y). On suppose que l'équation fy(x) = 0 a une seule
solution, pour tout y de R, et on note cette solution Xy. Nous avons ainsi défini une nouvelle
fonction X de R dans R, par X : y H Xy, Cette fonction est dite définie implicitement par
l'équation F(x, y)= 0, elle est caractérisée par l'égalité F(X(y), y) = 0 pour tout y de R Nous
allons donner dans ce qui suit quelques variations autour de cette situation.

EXEMPLE 24.35. Équation implicite tan x - x = O.


► Cette équation a des solutions puisque par exemple x = 0 en est une. Précisément, pour
tout entier n E Z, elle a une unique solution appartenant à l'intervalle In =]nn - n/2, nn +
n/2[; en effet, si nous notons, f(x) = tan x-x, cette fonction est dérivable, de dérivée donnée
par f'(x) = tan 2 x. Il en résulte que f est strictement croissante sur In et donc, puisque ses
limites aux extrémités gauche et droite de l'intervalle sont respectivement -oo et +oo, le
théorème des valeurs intermédiaires et la croissance stricte de f montrent que f s'annule une
fois et une seule sur In. Notons Xn E In cette unique solution. On peut ainsi définir une
fonction sur l'ensemble Z des entiers relatifs, par

X : Z -----, R, n H Xn.

On peut donc ainsi définir une fonction sur Z, dont les valeurs sont les solutions d'une
même équation dans différents intervalles indexés par Z. On s'intéresse dans la suite au cas
plus important où les fonctions implicites obtenues sont définies sur un intervalle de R

EXEMPLE 24.36. Équation implicite F(x, y) = 0, avec F(x, y)= eX -y.


► Le réel y étant donné, cette équation d'inconnue x s'écrit ex= y. Son ensemble de solutions
est exactement la fibre f- 1 ({y}) au-dessus de y, où f est la fonction exponentielle, f(x) = eX.
Si y ( 0, cette fibre est vide et si y > 0, c'est le singleton {ln y}. Ainsi, lorsque y varie
dans JO, +oo[, les solutions de l'équation d'inconnue x, ex= y, définissent bien une fonction
implicite de la variable x; cette fonction est bien sûr la bijection réciproque de la fonction
exponentielle, c'est le logarithme.

EXEMPLE 24.37. Équation implicite F(x, y)= 0, avec F(x, y) = x 2 -y.


► Pour y fixé dans R, cette équation d'inconnue x s'écrit x 2 = y, elle a pour ensemble de
solutions la fibre f- 1 ({y}) au-dessus de y, où f(x) = x 2 . Cet ensemble est soit vide dans le
cas où y < 0, soit comporte deux réels opposés dans le cas où y ) 0 (confondus si y = 0).
On peut choisir dans cette fibre l'élément positif, que l'on note y"y, ce qui conduit à définir
la fonction R+-----, R+, y H y"y, réciproque de la bijection, R+-----, R+, x H x 2 .
EXEMPLE 24.38. Équation implicite f(x, y)= 0, avec f{x, y)= x 2 -y, sur C.
► Examinons maintenant le même exemple sur C. Pouru fixé dans C, l'équation z 2 = u a
pour ensemble de solutions la fibre f- 1 ({u}) au-dessus de u, avec f: C--+ C, z H z 2 . Dans ce
cas la fibre n'est jamais vide et contient deux complexes opposés (confondus si u = 0). Mais
il n'y a plus de choix naturel dans cette fibre, contrairement au cas réel où l'on dispose de
l'ordre, des positifs et des négatifs. Nous verrons dans le cours de 12 et 13 qu'on ne peut pas
définir l'équivalent d'une fonction racine carrée complexe. du moins si on lui impose d'être
continue. Plus précisément, la racine carrée sur C définit ce que l'on appelle une fonction
multiforme, qui a un point associe deux valeurs. notion que nous avons déjà rencontrée dans
le paragraphe concernant les fonctions selon Euler. et que ce dernier considérait comme une
fonction à part entière.

EXEMPLE 24.39. Équation implicite f{x, y)= O. awc f{x, y) = x 2 + y 2 - c, c > O.


► Considérons maintenant une courbe de niYeau de la fonction f : IR. 2 --+ IR définie par
(x, y) H x 2 + y 2 , soit pour c > O.

Nous savons que celle-ci est un cercle de centre (0, 0) et de rayon .,je.
Pour chaque x donné dans ] - .,je, .,je[, l'équation d'inconnue y, x 2 + y 2 = c. a deux
solutions, ✓c - x 2 et - ✓c - x 2 . La courbe C n'est donc pas, bien entendu, le graphe d"une
fonction x H f(x). En revanche, pour tout point Mo= (xo, 1Jol E C avec 1Jo # 0, il existe un
«morceau» de C contenant M 0 , qui est le graphe d'une fonction x H f(x). Cette fonction f
est une fonction implicite définie par la fonction f.
Précisément sur cet exemple, si 1Jo > 0 (resp. 1Jo < 0), on peut prendre

f: [-.,/c, vcl --+ IR., X H ✓ C - x 2 (resp. X H - ✓ C - x 2 ).

Dans le cas où Mo # (-.,je, 0) et Mo # (VC, 0), ces graphes contiennent M 0 , sans que
celui-ci soit à une de leur« extrémité». Si en revanche, Mo= (-.,/c,0) ou M 0 = (.,/c,0),
on ne peut plus avoir cette propriété. Nous reverrons cet exemple classique au chapitre 30.

La notion de fonction implicite nous permet maintenant d'introduire deux classes de fonc-
tions, fondamentales dans l'histoire de la notion.

Les fonctions algébriques. Une fonction f: E C IR.--+ IR. est dite algébrique s'il existe une
fonction polynomiale non identiquement nulle, à deux variables

IR. 2 --+ IR., (x, y) H P(x, y)=


L
telle que pour tout x E E, P(x, f(x)) = O.
EXEMPLE 24.40. Toute fonction rationnelle est évidemment algébrique. Mais il existe des
fonctions non rationnelles qui sont algébriques; par exemple

f : JR. --+ JR., X H ✓îh2

qui vérifie bien pour tout x E IR., P(x, f(x)) = 0, avec P(x, y) = x 2 + 1 -y 2 .
Les fonctions transcendantes. Les fonctions transcendantes sont celles qui ne sont pas
algébriques ; parmi elles on trouve les fonctions usuelles classiques, par exemple

X H eX, X H lnx, X H sinx, X H cosx, etc.

EXEMPLE 24.41. Montrons que la fonction exponentielle est transcendante.


► Si ce n'était pas le cas, il existerait Pi- 0, fonction polynomiale à deux variables, telle que
pour tout réel x on ait P(x, eX) = O. En ordonnant les coefficients, la fonction P peut s'écrire

où les fonctions Un, ... , a 1 , a 0 sont polynomiales en x. Ainsi, pour tout x E IR, on aurait

(24.l)

Faisant tendre x vers -oo dans cette égalité, on voit, comme l'exponentielle l'emporte sur
les polynômes, que la fonction polynomiale x H a 0 {x) devrait tendre vers O en -oo, ce
qui n'est possible que si elle est identiquement nulle. Divisant alors la relation (24.1) par
ex i- 0 et refaisant tendre x vers -oo, on obtient cette fois que la fonction x H ai(x)
doit être identiquement nulle et ainsi de suite. Tous les coefficients x H adx) sont donc
identiquement nuls, entraînant avec eux la nullité de P, d'où une contradiction.

Nous n'irons pas plus loin dans cette direction, les preuves nécessitant des techniques qui
ne seront vraiment mises en place que dans la suite du cours.
Chapitre 25
LES FONCTIONS CONTINUES
A notion de limite d'une fonction en un point trouve son origine dans le calcul différentiel.

L Ce dernier, comme nous le verrons dans le chapitre suivant, a été inventé par Leibniz et
Newton, et a permis de résoudre deux grands problèmes qui occupé les mathématiciens
du XVIIe siècle, à savoir le problème de la détermination des tangentes puis, grâce au calcul
intégral qui lui est intimement lié, celui du calcul des aires.
Déterminer la tangente au graphe d'une fonction f, en un point a, revient à trouver le
nombre vers lequel tend la quantité 't(x) = f(~=~al quand x s'approche de a. Cette fonction
't n'est évidemment pas définie en a car son évaluation en ce point donne lieu à une division
par O. Il semble cependant possible de lui donner un sens puisque le numérateur est aussi égal
à O en a; il s'agit de comprendre vers quelle valeur tend 't lorsque x se rapproche indéfiniment
de a, où encore lorsque x - a est infiniment petit. Mais la formalisation de cette notion a
nécessité plusieurs siècles.

L'utilisation abusive et imprécise des infini-


ment petits et le recours à l'intuition géomé-
trique ont d'abord semé la confusion et en-
traîné de nombreuses polémiques au cours
du XVIIIe siècle. Ce fut d'Alembert qui le
premier entreprit de débarasser le calcul dif-
férentiel de ce qu'il appelait la métaphysique
des quantités infiniment petites. Ces ques-
tions de formalisation ne furent complète- Jean Le rond d'Alembert (1717-1783)
ment résolues que vers le début du xxesiècle.
L'idée d'infiniment petit a été progressivement abandonnée dans les textes classiques au
profit de la notion de « rapprochement infini» d'une variable vers un point donné, qui conduit
à la notion de limite. La notion même de continuité, qui est une évolution de celle de limite,
est elle aussi apparue de manière tardive, vers le début du du XIXe siècle.

Il faut dire que, pour Euler par exemple, le


sens du mot «continu» n'était pas le même
que celui qu'il recouvre de nos jours, et qui
va faire l'objet du présent chapitre. En ef-
fet, pour Euler, une fonction continue était
une fonction définie par une seule expression
« analytique ». Ainsi, la fonction définie sur
lR parf(x) = x six~ 0 et f(x) = 2x six> 0
n'était pas une fonction continue pour Eu-
ler, puisqu'elle nécessite pour la définir deux
expressions analytiques, alors qu'elle le sera Leonhard Euler(l 707-1783)
pour nous.

Au sens moderne et actuel, une fonction continue sur un intervalle est une fonction dont le
graphe n'est pas «déchiré» en plusieurs morceaux; alors que pour Euler, c'était l'expression
690

de définition qui ne devait pas être constituée de plusieurs morceaux distincts. Les mathéma-
ticiens considéraient implicitement que toutes les fonctions « définies par une seule formule »
qu'ils étudiaient étaient «continues», ou à tout le moins ils ne se posaient pas complètement
la question de la continuité au sens où nous la connaissons aujourd'hui.
C'est à Cauchy, Bolzano et Weierstrass que l'on doit la rigueur des définitions et des preuves
en ce domaine, permettant ainsi d'asseoir l'analyse sur des bases solides et cohérentes. Voici
comment Cauchy présente la continuité des fonctions dans son Analyse algébrique de 1821.

supposons que, pour chaque valeur de x


intermédiaire entre deux limites données,
cette fonction admette constamment une va-
leur unique et finie. Si, en partant d'une va-
leur de x comprise entre ces limites, on at-
tribue à la variable x un accroissement in-
finiment petit ex, la fonction elle-même re-
cevra pour accroissement la différence f (x +
ex) - f(x), qui dépendra en même temps de
Augustin-Louis Cauchy (1789-1857) la nouvelle variable ex et de la valeur de
x. Cela posé, la fonction f(x) sera, entre
« Parmi les objets qui se rattachent à la
les deux limites assignées à la variable x,
considération des infiniments petits, on doit
fonction continue de cette variable, si, pour
placer les notions relatives à la continuité ou
à la discontinuité des fonctions. Examinons
chaque valeur de x intermédiaire entre ces
d'abord sous ce point de vue les fonctions limites, la valeur numérique de la différence
d'une seule variable. f(x+ex)-f(x) décroît indéfiniment avec celle
de ex.»
Soit f(x) une fonction de la variable x, et

On mesure la difficulté de donner un sens précis à ce type de définition. De plus, la


distinction entre ce que nous allons appeler la continuité et la continuité uniforme n'apparaît
pas clairement dans ce texte de Cauchy. De même, la notion de dérivabilité n'était pas encore
à cette époque complètement dissociée de celle de continuité.

Bernhard Bolzano (1781-1848) et Karl Wilheim Weierstrass (1815-1897)

L'un des théorèmes remarquables sur les fonctions continues est celui des valeurs intermé-
diaires. Stevin l'utilisa, sans le prouver, pour approcher les racines d'un polynôme. La preuve
complète et rigoureuse de ce résultat revient à Bolzano, qui rejetait les démonstrations fondées
691

sur la «géométrie» et la «mécanique», parce qu'il les jugeait insuffisantes (de même que
celles qui montraient ainsi la possibilité de décomposer tout polynôme à coefficients réels en rJJ
(l)
produit de termes du premier ou du second degré à coefficients réels).
C'est finalement à Weierstrass que l'on doit la définition formelle des notions de limite et
de continuité, en termes de E et de TI, que nous utilisons aujourd'hui. Signalons pour conclure
cette introduction que la définition et la manipulation des quantités infiniment petites est
i(.)
rJJ

l'objet de l'analyse non standard qui s'est développée dans la deuxième moitié du xxe siècle,
mais que nous n'étudierons pas dans ce cours. 1
sa
rJJ
Avertissement . Dans ce chapitre, pour donner des exemples explicites, nous ad- j
mettrons les propriétés des fonction élémentaires, rappelées dans la partie Bases. l!'Î
IN
Ces propriétés seront démontrées au chapitre 28. On présentera par ailleurs une
..d
construction complète des fonctions puissances d'exposant rationnel dans la partie ü
111.3 de ce chapitre.

1. LIMITE D'UNE FONCTION EN UN POINT

Dans tout ce chapitre 1K désigne lR ou C. Sauf mention contraire, les fonctions considérées
dans cette partie seront à valeurs dans K

I.1. Première approche de la limite d'une fonction en un point


La notion de limite d'une fonction f en un point a est une propriété locale c'est-à-dire qu'elle
ne dépend que des valeurs de f en des points assez proches de a. Intuitivement, un nombre l
est la limite de f en a si f(t) s'approche de l quand t s'approche de a. Nous verrons, grâce
à la proposition 25.6 ci-dessous, que cette notion est intimement liée à celle que nous avons
déjà rencontrée lors de l'étude des suites.
Nous allons donner dans cette partie une première définition de la notion de limite d'une
fonction en un point. Cette définition est en fait un cas particulier d'une définition plus
générale, que nous donnerons en 1.6, qu'il aurait été possible de donner dès le départ. Mais nous
préférons commencer par une approche plus intuitive. Essentiellement, nous considérerons
pour commencer des fonctions qui sont définies pour toutes les valeurs de la variable assez
proches du point où l'on se pose le problème d'évaluer la limite.
Pour établir cette définition, rappelons d'abord qu'une partie V de lR est un voisinage d'un
point a si elle contient un intervalle ouvert contenant a.
Définition 25.1. On dit qu'une partie V est un voisinage épointé de a s'il existe un inter-
valle ouvert contenant a, tel que I \ {a} soit contenu dans V, et si a(/: V.

Par exemple, l'ensemble V= ]-1, O[U]O, 1[U]2, +oo[ est un voisinage de 3, et un voisinage
épointé de O. Ce n'est pas un voisinage épointé de 1, 2 ou 3.
Définition 25.2. Soient a un point de lR et f une fonction définie sur un voisinage épointé
V de a et à valeurs dans OC. Nous dirons que f admet une limite l au point a si, pour tout
E E JR~, il existe TI E JR~ tel que si t est dans V, et vérifie O < it - ai < TI, alors If (t) - li < L

Cette définition, une fois le nombre l fixé, comporte une donnée E E JR~ et une inconnue
TI E JR~. Il est important de remarquer que, si un nombre TI > 0 est solution de ce problème,
tout nombre ri' compris entre O et TI est lui aussi une solution. Il ne s'agit pas de déterminer
tous les nombres TI possibles, mais seulement de prouver l'existence de l'un d'entre eux.
On notera que l'inégalité O < lt - al insiste que le fait que t i= a.
692

On peut remarquer aussi que la fonction f peut être ou non définie au point a (en effet, on
exige dans la définition que f soit définie sur un voisinage épointé de a, c'est-à-dire que son
ensemble de définition doit contenir un tel voisinage, mais cet ensemble de définition peut être
plus gros, et en particulier peut contenir aussi le point a). On note d'ailleurs que le fait que
f soit définie au point a, et la valeur éventuelle de f au point a, n'interviennent aucunement
dans la définition.
Le lemme suivant montre l'unicité de la limite l.
Lemme 25.3. s~i(J;) un point de JR et f unéfonèticnâé/tnie sur ùnv&isinage éJ)OîntlV
dea;·Si f fJÂmet.'ilêtlimv.eeJ et:t1•·etn1-, e.l(Jf's l= F, . .
PREUVE. Soit I un intervalle ouvert inclus dans V et contenant a. Pour E E JR~ fixé, il
existe T] E JR~ (resp. TJ 1 E JR~) tels que si t et t' sont dans I et vérifient O < lt - al < T] et
O < lt' - al< TJ', alors lf(t) - li< E et lf(t') - li< E.
Soit t" E I tel que O < lt"-al < min(TJ, TJ 1 ). En utilisant l'identité l-l' = l-f(t")+f(t")-l'
et l'inégalité triangulaire, nous obtenons

Il- l'i~ lf(t") - li+ lf(t") - l'i< 2L

Donc, pour tout E E JR~, Il- l'i< E, ce qui entraîne quel- l' = 0, donc l = l'. ■

Notation. Ce nombre l, quand il existe, est appelé la limite de la fonction f en a et sera


noté
lim f(t).
t->a

EXEMPLE 25.4.
► Soit f 1 la fonction constante de lR dans C, de valeur IX. Alors pour tout a E JR,
limx->a f1 (x) = IX.
► Soit f 2 la fonction de JR* dans lR définie par f 2 (x) = 1 six< 0 et f 2 (x) = 1/2 six> O.
Alors f 2 n'a pas de limite au point O.
► Soit f 3 la fonction de JR* dans lR définie par f3(x) = -x si x < 0 et f 3(x) = x si x > O.
Alors limx-,o f3(X) = O.
► Soit f 4 la fonction de lR dans lR définie par f 4(0) = 8, f 4(x) = -x six< 0 et f 4(x) = x si
X> O. Alors limx-,of4(X) = O.

FIGURE 25.1. Les graphes

On peut être étonné du fait que la valeur éventuelle de f au point a n'intervienne pas. Il
s'agit là simplement d'une convention, nous verrons comment résoudre cette difficulté dans la
partie 1.6. Comme nous l'avons dit, nous abordons ici graduellement la difficulté de la notion
de limite.
Il est important de noter qu'il existe plusieurs formulations équivalentes de la définition
de la limite. A titre d'exercice, on laisse au lecteur le soin de se persuader de la validité de la
remarque suivante.
693

Inégalités strictes ou larges [/J


(l)

~
Dans la définition de la limite, il est toujours possible de choisir arbitrairement le type
d'inégalités utilisé. Par exemple, avec les notations de la définition, fa pour limite l au 0
point a si et seulement si pour tout E > 0, il existe T] > 0 tel que pour tout x E V
(.)
[/J

vérifiant lx - al < TJ, on ait l'inégalité lf(x) - li ~ E.


1
<2
[/J
j
2
EXEMPLE 25.5. Soit fla fonction définie par f(0} = 1. f(t) = t si t < 0 et f(t) = t pour
tout t > 0, représentée sur figure suivante. l\Iontrons que limt~o f( t) = O.
► Pour E E lR"i- donné, on doit trouver TJ E JR:_ tel que si 0 < it! < TJ. alors lf(t)I < E. Pour
t < 0, le réel TJ qui convient doit satisfaire à lïnégalité T] 2 ~ E. :.Iaintenant pour t > 0, il
doit vérifier TJ ~ E. En conclusion, il suffit de prendre TJ = min( ,/f., E) = E si E < 1.

FIGURE 25.2. Le graphe de la fonction f

Test 25.1. Test 25.3.


Que peut-on dire des affirmations suivantes? Soit fla fonction définie sur IR* par f(t) = i si
1. L'intervalle [O, 1[ est un voisinage de O. t < 0 et f(t) = 1 si t > O. Étudier l'existence
2. Q est un voisinage de 1/2. de la limite de f en O.
3. IR \ Q est un voisinage de v'Z. Test 25.4.
Test 25.2. Soient f une fonction définie de IR dans IC et I
Avec les notations de la définition 25.2, la pro- un intervalle ouvert contenant un point to. On
priété suivante est-elle équivalente à 25.2? définit la fonction g sur I \ {to} par g(t) = f(t).
Pour tout f E IR"i-, il existe T] E IR"i-, tel que Que peut-on dire de g, si f possède une limite
si t est dans V, et vérifie O < lt - al ~ T], alors en to?
lf(t) - li ~ e.

Une autre formulation de la notion de limite d'une fonction, qui ne fait intervenir que la
notion de convergence des suites, est donnée par la proposition suivante.

Pi~ptisitfc,n 25.6. •. Soient a un point de R .et f ittf;ê Jonct11on 4î/f,nie .sur tt.n. tJOÎSinàge épointé
Y.de a. Iio,Jd@ction f admet uneJimite l au point à si et seûij}tnetit. si p<mi-wute suite {t~} n)>Q
ile. V\{âl,c eoit'lierg1;nte de limite o.; la sit.ite {f(tn:}}:tQo•·est Cônverf,entè: de limitet -

PREUVE. Si lim f(t) =let si E E lR"i- est fixé, il existe TJ > 0 tel que si test dans V et vérifie
t.-,u
0 < lt- al< TJ, alors lf(t) - li< E.
Soit (tnln20 une suite de V\ {a} convergente de limite a. D'après la définition de la limite
d'une suite appliquée à TJ, il existe N EN tel que sin> N, alors 0 < ltn - al < TJ. On peut
694

donc déduire que lf(tnl - li< E pour tout n ~ N. Ceci prouve quel est la limite de la suite
(f(tn))n;:,:o-
Nous allons montrer la réciproque par l'absurde. On suppose donc quel n'est pas la limite
de f en a, c'est-à-dire qu'il existe Eo E lR't- tel que, pour tout TJ > 0, il existe t E V vérifiant
0 < lt - al < TJ et If (t) - li 2 Eo. En donnant successivement à TJ les valeurs 1/ (n + 1), quand
n décrit N, on obtient l'existence d'une suite (tnln>o vérifiant pour tout n EN les inégalités
0 < ltn - al< n:l et lf(tn) - li 2 Eo- -
Le théorème des gendarmes montre que (tnlnEN tend vers a, alors que la deuxième inégalité
montre que la suite (f(tnllnEN ne tend pas vers l. ■

Remarque. En utilisant l'unicité de la limite, cette proposition peut servir à prouver qu'une
fonction f n'a pas de limite en un point a. Il suffit pour cela d'exhiber deux suites (tn)n;:,:o et
(t~)n;:,:o de limite a, dont les suites (f(tnlln2:o et (f(t~)ln20 ne convergent pas vers un même
nombre.

EXEMPLE 25. 7. Soit f la fonction défi-


nie sur "JR* par f(t) = sin(l/t) (figure ci-
contre). Montrons que f n'a pas de limite
en O.
► Pour n E N, on pose tn = (ln+i/Z)n et
t~ = (ln-i;zin· Les deux suites ainsi défi-
nies convergent vers O alors que f(tnl et
f( t~) sont convergentes, puisqu'elles sont
constantes, de limites respectives 1 et - 1
distinctes. Donc f ne peut avoir de limite
en O. FIGURE 25.3. Le graphe de la
fonction t H sin(l/t)

Test 25.5. Test 25.6.

Soit fla fonction définie sur R par f(t) = 1 si Soit fla fonction définie sur R par f(t) = t si
t E Q et f(t) = 0 sinon. Étudier l'existence de t E Q et f(t) = 0 sinon. Etudier l'existence de
la limite de f en tout point de R la limite de f en tout point de R.

I.2. Opérations sur les limites des fonctions en un point


Dans cette partie, nous établissons les règles générales de calcul sur les limites des fonctions
en un point en appliquant directement les résultats du chapitre sur les suites. Les fonctions
considérées ici sont à valeurs complexes.
Proposition 25.8. Soient à un point âe R.. et f une Jonction définie sur ùn voisinage
épointé V .de a, à. valeurs d<iru K. $i f admet ~€ limite l au :,>oint a, alors la fÔ~ctionJfl
admet Ill comme limite en a, On ~t.t/ocnt êcrirê · · ' , · · ·· · · ·

um
t-la
!f(tll =llün f{t)I:
t-Hl

PREUVE. Soit (tnln2:o une suite de V\{ a} convergente de limite a; d'après la proposition 25.6,
la suite (f(tn)ln20 converge vers l. On peut donc conclure que la suite (lf(tn)l)n;:,:o converge
vers Ill, ce qui montre l'assertion, encore par la proposition 25.6. ■
695

Prophsition 25.9, Soit .a un PfJint de B.. Soient f et g de'/1,X for,i;twns définits sur un
voisinage épointé V de a, à valeurs dtJns K. [/J
Cl.)

i) La limîte âe'la somidef+ {1 âû poit,l a existe, et est égale il lasorntne


dM litnttês, (lé t
j
et· g tiu point a, s()it · ·· · ·
0
· lWi.(f,,fJl}ft}.~tnnf{t) + lim g(t). (.)

1
t,-t~ .• ........ . ..::i . ; 'l""+Q t-tQ

2~ .LaÙmite<iû proâ'l1.itfgÔ..ltpoliirô'~iistê; et est eyale au produit âes .lîïriites a~Cfefg a'U


point.a, so.ît. . . ~
lùn(fg){t)
t...;a · ·. ·
=lim f(t) lim g(t).
t➔ a t-ta ~
LC)
C"i
PREUVE. Posons limt-rn f(t) =let limt-rn g(t) = l'. Si (tnln2'.o une suite de V\ {a} conver- ..d
gente de limite a, d'après la proposition 25.6, les suites (f(tn))n2'.0 et (g(tnlln2'.o sont conver- ü
gentes respectivement vers let l'. La somme et le produit de ces deux suites sont convergentes
de limites l + l' et ll', et la la proposition 25.6 permet de conclure. ■

Si on applique la proposition précédente à une fonction g constante de valeur À, on obtient


pour tout À de lK l'identité limt_,u(,\f)(t) = ÀlimHu f(t).

Proposition 25.ïO. SoiêntàPtJlli Jjôinft dé R, f èt g deux fonctions définies sur un voisinage


épointé V de a, à wleuf'K lla~K..}Sî fifèjf; ~ $'IJ/I" V\ {o.} et 1li g Il une limite nulle au
point a,. lÛ01'S le p~uit f9 ,a, une
lwiitfo rndlé en a. .. .
PREUVE. Soit (tnln2'.o une suite de V\ {a} convergente de limite a. La suite (f(tn)g(tnlln2'.o
est le produit d'une suite bornée par une suite convergente de limite nulle; donc elle est
également convergente de limite nulle. ■

EXEMPLE 25.11. Soit h la fonction définie sur JR* par h(t} = tsin(l/t}. Posons f(t} =
sin( 1/t} et g (t} = t. Les fonctions f et g vérifient au voisinage de O les hypothèses de la
proposition 25.10 ci-dessus. On peut donc affirmer que lim h(t} = O.
t....+O

Proposition 25.12. Soit f ·unéJonction à valeurs dans K* ayant 'lf,né limite l .non nulle en
un point _a! _Alortlafonc#on 1/f a pour limite 1/t en a, soit
l
lim-·-.. • ::;: _,___..,..
l
t'"4a:f{t} lîmf{t} ·
t-4a

PREUVE. Soit (tnlnEN une suite de V\ {a} de limite a où V est un voisinage de a. La suite
(f(tnllnEN a tous ses termes non nuls et comme elle converge vers l, qui est non nulle, alors
la suite (1 /f( tnl lnEN est convergente de limite 1/l. ■

Test 25.7. Test 25.8.


Soit f la fonction de IR. dans IC définie par La proposition 25.10 est-t-elle vraie si f et g
f(t) = i + t si t E [-1, 1] et f(t) = 0 sinon. sont définies sur deux voisinages distincts de
Donner un voisinage de O sur lequel la fonction a?
1/f est bien définie et calculer limHo 1/f(t).
696

I.3. Limite et inégalités


Nous abordons dans cette partie la question importante du passage à la limite dans
les inégalités.

Pro~wii.2~.13;. Sment; a tt'n pointde R ··etf<unêr~nri{ti1Jif va~urs~Jlêt(défini~ S'at


ùnvoïsinàgl épointé \lâe'.à.,• etayànt ttne·lim#e en a; Si f(t).~•Oppur:toji:t-fE V\{ô},
âlors'limf{tf~ ô. .. . . . ·.. ·.·. .· •' ··. . . .,· . . ... ... . .,·.
t._.a

PREUVE. Soit (tnlnEN une suite de V\ {a} de limite a. La suite (f(tnllnEN a tous ses termes
positifs et elle est convergente de limite lim f(t). On peut alors conclure que lim f(t) ~ 0 par
t--+a t--+a
les résultats de passage à la limite sur les suites. ■

Test 25.9. Test 25.10.


Soit f une fonction à valeurs réelles définie au Soit f une fonction à valeurs réelles définie au
voisinage d'un point a et ayant une limite l au voisinage de a telle que lfl possède une limite
point a. =p O en a. Que dire des propriétés suivantes?
Montrer que si l > 0, alors il existe un voi-
1. Il existe un voisinage I de a tel que pour tout
sinage I de a tel que
t E I \ {u}, f(t) > O.
\lt E I \ {u}, f(t) > 0.
2. Il existe un voisinage I de a tel que pour tout
t E I \ {u}, f(t) < O.

Le corollaire suivant s'obtient en appliquant la proposition 25.13 à la fonction f - g.

Corollaire 25.14. Soient a· un point de R, f et g deux fonctions à valeurs réelles définies


sur un voisinage épointé V de a. Si les limites de f et g en n existent et sif(tJ? g(t) pour
tout t EV\ {a}, 1.dorsiim f{t}~ fun g(t}. ·
t--+a 1:-ta

En appliquant la proposition 25.6 et le théorème des gendarmes aux deux suites (f(tnllnEN
et (h(tnllnEN où (tnlnEN est une suite quelconque de V\ {a} de limite a, on peut déduire
facilement la proposition qui suit.

Propositiqn 25.15. Soient a un f)(iint de R, f, >g et h trois Jonction,;.à 1faléifs· fiefJiis


définies surun 1J.oisi00ge:épointéV de a; telles que f(t) ·~. g(t} ~ h{tJ pour toutt E V\{a}.
Si leslîmîtes de f eth .en a existe.nt et spnt égàles .à t; aluFs },a limite de g . e.n o exi!Jtè eJ;
vérijielim9(t}:::=;l; · · ·
t➔ a

Att('lltÎOll Pas d'inégalités strictes


Même si une fonction est strictement positive sur un voisinage du point a, sa limite au
point a peut être nulle. C'est le cas par exemple pour x H x, avec a= O. De même, si f
et g vérifient f(t) > g(t) dans un voisinage de a, on peut avoir limt->a f(t) = limHa g(t).
Un passage à la limite conduit donc en général à des inégalités larges.
697

1.4. Limite à droite et limite à gauche


Nous avons jusqu'à maintenant demandé que les fonctions que nous considérions soient définies
sur un voisinage épointé du point a en lequel se pose le problème d'évaluer la limite. Ces
fonctions sont donc au moins définies sur des ensembles de la forme ]a - li, a[U ]a, a+ li[,
avec li > O. Nous allons maintenant commencer à relaxer les contraintes sur l'ensemble de
définition, en envisageant d'abord le cas où les fonctions ne sont plus définies que sur des
intervalles de la forme ]a - li, a[ ou ]a, a+ li[.
Définition 25.16. Soient a un point de lR et f une fonction définie sur un intervalle ouvert
I dont la borne supérieure est a. On dit que f admet le nombre l comme limite à gauche L()
en a si pour tout E E JR~, il existe T] E JR~ tel que, si t E I vérifie 0 < a - t < TJ, alors IN
.d
lf(t) - li < E. ü
On peut montrer facilement, comme dans le lemme 25.3. l'unicité d'une telle limite. Nous
pourrons désormais parler de la limite à gauche en a. On la notera lim f(t). Nous définirons
t--->a-
de même la limite à droite. Elle sera notée lim f(t).
t------,a-----

EXEMPLE 2 5 .1 7. Pour t E R on note E (t) la partie entière de t. On peut Yérifier que pour
tout n E Z, lim E(t) =net lim E(t) = n-1.
1 t-----+n+ t-----+n-

On voit facilement que les résultats énoncés précédemment demeurent valables lorsque lim
t-,a
est remplacée par lim ou lim .
t----ta+ t-----+a-

Ptopœitiôn •·95'.. l*i:•i(lt-,.« ~ jîiJillit, rl~;R ;~ff t.EffitcJiiilétwn têJErilè"'iif.ilii ftoisinage


êpoirité V. dê-O.; Âl01'$•tàff-i:.tî~.f âtltn~•.ti'ff,lpJiriiftll"tti a',st··~~~ni~18î'lt?i''4é~1,mfites
à droite et à gauche ief.en:ri exîslem et sont eyàles, soit · · ·

limf{tl
t➔ a
= lîtn f(t)·=. linrf(t);
t➔ a+ · ·t➔ a~

PREUVE. Il résulte directement de la définition de la limite que si lim f(t) = l, alors lest la
t-->a
limite de f à gauche et à droite en a.
Pour prouver la réciproque, supposons que ces deux limites existent et qu'elles sont égales
à un certain l. Si E E JR~, il existe T] E JR~ et T] 1 >E JR~ tels que si t est dans V et vérifie
0 < a - t < T] et 0 < t - a< T] 1 , alors lf(t) - li < E. En posant T] 11 = min(TJ', TJL on peut
affirmer que si test dans V et vérifie 0 < lt - al < T] 11 , alors lf(t) - li < E. ■

EXEMPLE 25.19. Soit fla fonction définie sur JR* par f(t) = tE(l/t). Par définition de la
partie entière, nous avons E(l/t) ,( 1/t < E(l/t) + 1. En supposant t > 0 et en multipliant
ces inégalités part, on obtient 0 ,( 1-tE(l/t) < t. Ceci entraîne que lim (1-f(t)) = O. On
t-->O+
déduit alors lim f(t) = 1. On peut prouver de la même manière que lim f(t) = 1. Grâce à
H~ H~
la proposition 25.18, on peut conclure que la fonction f admet 1 comme limite au point O.

. \.tte11ti011 Existence simultanée


L'existence simultanée de la limite à gauche et à droite n'entraîne pas en général celle
de la limite. On peut le vérifier par exemple sur la fonction f(t) = -1 si t < 0, f(t) = 1
si t > 0 et f(0) = O. La limite de f en 0 n'existe pas, alors que les limites à gauche et à
droite existent. Elles sont évidemment distinctes.
698

Th~ti;?5~2 0..· ·. Sôit ·f· une fonction 1li valeurs réelles, déjime sur 11Jn:.1int:eroolle ouf.Jert li
Si f est monotone sur I, alors elle admet une limite à ilroite et une limite à gauche en tout
PQint'ne'I.
PREUVE. Supposons par exemple que f est croissante et fixons un point t 0 dans I. Soit J
l'ensemble des f(t) pour tous les t de I tels que t < t 0 . L'ensemble J, qui est non vide, est
majoré par f(t 0 ), donc il possède une borne supérieure l qui vérifie l ,(; f(to). On déduit
directement de la définition de la borne supérieure que l est la limite à gauche de f au point
t 0 . La limite à droite s'obtient en utilisant l'ensemble des f(t) pour tous lest de I tels que
t>~- ■

Si l'intervalle I contient sa borne inférieure (resp. supérieure), le même raisonnement établit


l'existence de la limite à droite (resp. à gauche) en cette borne. De la preuve du théorème
ci-dessus, on déduit aussi que si f est croissante, alors ses limites à gauche et à droite en tout
point a de I vérifient lim f(t) ,(; f(a) ,(; lim f(t).
t----ta- t----,a+
Test 25.11. voisinage épointé V d'un point a. On suppose
Donner un exemple de fonction de IR dans IR que f possède une limite à gauche en a et g à
qui n'est monotone dans aucun voisinage de 0 droite au même point. Que dire de l'assertion:
(penser à utiliser la fonction sin). le produit fg possède une limite en a? Même
question pour : la somme f + g possède une
Test 25.12. limite à droite en a.
Pour t E IR, on pose f(t) = (-l)[tl où [t] dé- Test 25.14.
signe la partie entière de t. Tracer le graphe de
Donner un exemple de fonction croissante de IR
la fonction f et étudier l'existence des limites à
dans IR vérifiant pour tout n E Z,
gauche et à droite en tout point de IR.
Test 25.13. lim f(t) < f(n) < lim f(t).
t----,n- t--+n+
Soient f et g deux fonctions définies sur un

I.5. Extensions de la notion de limite


Avant de donner la définition générale de la notion de limite, nous en envisageons encore une
autre extension, au cas où les fonctions sont définies sur des intervalles dont une extrémité est
±oo. Nous verrons aussi, comme pour les suites, comment définir la notion de limite infinie,
bien que cela ne soit pas sur le même plan que la généralisation précédente, qui portait sur
les domaines.

1.5.1. Limite d'une fonction à l'infini

Nous dirons qu'une partie de li est un voisinage de +oo (respectivement -oo), si elle contient
un intervalle ouvert de la forme ]a, +oo[ (resp. ] - oo, a[).
Définition 25.21. Soit f une Jonction définie sur un voisinage V de +oo à valeurs dans K
Nous dirons que f a pour limite un élément l de OC en +oo si, pour tout E E li~, il existe
B Eli+ tel que, si t EV et t > B, alors lf(t) - li < E. On note dans ce cas lim f(t) = l.
t-.+oo
Définition 25.22. Soit f une fonction définie sur un voisinage V de -oo à valeurs dans K
Nous dirons que f a pour limite un élément l de OC en -oo si, pour tout E E li~, il existe
B Eli+ tel que, si t EV et t < -B, alors lf(t) - li < E. On note dans ce cas lim f(t) = l.
t---t-oo
699

Il est facile de voir que les résultats prouvés dans les parties précédentes restent valables
en remplaçant dans les énoncés le point a par ±oo. rJl
V
Pour les exemples suivants, nous admettons les propriétés usuelles des fonctions puissances
d'exposant rationnel, qui seront montrées en partie 111.3 de ce chapitre.
§
~
rJl
EXEMPLE 25.23. Soit r E (Q)'_. Alors lim tr = O. §
t-----1+00 p
1
► En effet, si E E JR~, il suffit de prendre B ;?: E l/r_
~
..s
rJl
~
EXEMPLE 25.24. Montrons que lim v1t+Î -vt = O. U"Î
t--->+oo N
► Fixons t > 0 et multiplions v't+l - vt par son expression conjuguée. Nous obtenons ..d
u
(v1t+Î - vt)( v1t+Î + v't) = (✓t + 1J2- (v't)2 = 1,
1
d'où l'identité v't+l - vt = v't+l vt qui conduit à la majoration.
t+l+ t

1
Maintenant, puisque lim h = 0, on a la conclusion.
t--->+oo yt

EXEMPLE 25.25. Soit f une fonction définie sur ]A, +oo[ avec A> O. Pour t E]O, 1/A[, on
pose g(t) = f(l/t). Nous avons lim f(t) = l si et seulement si lim g(t) = l.
1 t--->+oo t--->O+

Test 25.15. Test 25.16.


Soit f une fonction définie de~ dans K A-t-on La fonction sin(t) possède-t-elle une limite en
l'équivalence [f est bornée sur~] si et seulement +oo?
si [la limite de f en +oo existe] ?

1.5.2. Limite infinie d'une fonction en un point

Notons que les fonctions considérées ici sont à valeurs réelles.

Définition 25.26. Soient a un point de lR et f une fonction à valeurs réelles définie sur un
voisinage épointé V de a.
1) Nous dirons que f a pour limite +oo au point a, ou tend vers +oo quand t tend vers a
si, pour tout A > 0, il existe T] > 0 tel que si t est dans V et vérifie O < lt - al < TJ, alors
f(t) > A. On note dans ce cas lim f(t) = +oo.
t--->u
2) Nous dirons que f a pour limite -oo au point a ou tend vers -oo quand t tend vers a
si, pour tout A > 0, il existe T] > 0 tel que si t est dans V et vérifie O < lt - al < TJ, alors
f(t) < -A. On note dans ce cas lim f(t) = -oo.
t--->u
700

EXEMPLE 25.27. Remarquons que suivant notre définition, une fonction peut être définie
en un point, et même en tout point de la droite réelle, tout en ayant une limite infinie en ce
point.
► C'est le cas par exemple de la fonction f définie sur lR par f(0) = 1 et f(t) = 1/t2 pour
tout t E JR*. Pour prouver que limHo f( t) = +oo avec les notations de la définition, il suffit,
étant donné A> 0, de prendre T] ~ 1/#.

Soient a un point de JR, f et g deux fonctions définies sur un voisinage épointé V de a.


On suppose que f et g ont chacune une limite infinie en a. On ne peut décider a priori de la
limite de la somme f + g, au point a, que dans les deux cas suivants

lim f(t)
t-ta
= t-ta
lim g(t) = +oo (resp. lim f(t) = lim g(t) = -oo),
t-ta t-ta

auxquels cas on obtient, à partir de la définition, que

lim(f(t) + g(t))
t---)U
= +oo (resp. lim(f(t)
t---)Q
+ g(t)) = -oo.
Il en va de même par exemple si limHa f(t) = +oo et si g est minorée, comme pour le cas des
suites. Dans les autres situations nous sommes en présence, comme dans le cas des suites, de
la forme indéterminée oo - oo. Nous de redonnerons pas ici toutes les propositions relatives
aux formes indéterminées, qui sont calquées sur celles que nous avons énoncées pour les suites,
et nous limiterons à quelques résultats.

f•
Proposititm • 25.~6. Soient n.uh '[IÔint de R, et,g deu:c J<11Jètwns à valeurs réelles définies
V
sur un voisînagè ~inte âe à/ On suppose qu<i ta fonctÙ'J1t g est'mino.rée S'!SrV ]Jar un 'réel
strictement positif. Dans 'ce cas, si mn f(t) =+oo, alors fun fg{t) = +oo. · · ·
t-Hl t➔ Q

PREUVE. Soit m > 0 un réel tel que g(t) ~ m pour tout t EV\ {a}. Fixons un réel A> 0 et
appliquons la définition de lim f(t) = +oo au réel A/m. Il existe dans ce cas un réel T] > 0 tel
t---)U
que si t EV vérifie 0 < lt- al < TJ, alors f(t) > A/m. En multipliant par g(t) cette inégalité,
on obtient que f(t)g(t) > g(t)A/m ~ A. Nous avons ainsi montré que lim fg(t) = +oo. ■
t---)Q

En remarquant qu'une fonction ayant en un point a une limite l E JR~ U { +oo} est minorée
dans un voisinage épointé de ce point par un réel strictement positif, on montre facilement
le corollaire ci-dessous, en tenant compte des conventions classiques, l x +oo = +oo si l E
JR~ U {+oo} et lx +oo = -oo sil E lR:'._ U {-oo}.

Corollaire 25;29. Soient a unpoint de R,f


effJ Je'lix Jonctions avaleurs rielles 1éflnies
sur un voisinage épointé V de a., On suppose que lim. f{t) = +oo et que g posside au point
. . . •·.. . .. · . . . . • ;: . · .. · •.t..,.;a ··
a une lîmite.t ER* U{+og}. Alorst~fg(tJ lx.+oo. = · • '

EXEMPLE 25.30. Soient a un point de lR et f une fonction à valeurs réelles définie sur un
voisinage épointé V de a. Montrons que les deux propriétés suivantes sont équivalentes :
1) lim f(t) = +oo:
t-,a

2) il existe un voisinage épointé de a sur lequel f > 0 et lim 1/f(t) = O.


t---,a
701

► Si lim f(t) = +oo, fixons E E lR"t et appliquons la définition à A= 1/E. Il existe dans ce
t-->a
cas TJ > 0 tel que si t EV et vérifie O < it- ai< TJ. alors f(t) > 1/c. On peut conclure que
1/f(t) < E pour tout t E Vn ]a -TJ, a+ T][. Ce qui se traduit par lim 1/f(t) = O. De plus
t-->a
V n] a - TJ, a + TJ [ est un voisinage épointé de a sur lequel f est > 0.
Pour la réciproque, étant donné A> 0, il suffit d"appliquer la définition de lim 1/f(t) = 0 t-;a
à E = 1/ A et tenir compte du fait que f prend des rnleurs strictement positives au voisinage
du point a.

Test 25.18. in
Test 25.17. (N
,.d
Soient f, g deux fonctions de JE. dans JE.+ et a Soient f et g deux fonctions de JE. dans JE. telles ü
un point de JE. tels que lim f(t)g(t) = +oo. que lim f(t)g(t) = O. Peut-on affirmer que
t-;a t--++oo
Peut-on affirmer que lim f(t) = +oo ou lim f(t) =Oou lim g(t) =0?
t-->a t-->+= t-;+=
lim g(t) = +oo?
t-->a

I.5.3. Limite infinie à droite et à gauche

On peut maintenant envisager le cas où la fonction (toujours à valeurs réelles) est simplement
définie sur un voisinage à droite où à gauche de a.

Définition 25.31. Soient a un point de JR.


1) f une fonction définie sur une partie contenant un intervalle ouvert dont la borne supé-
rieure est a. Nous dirons que f a pour limite +oo à gauche au point a si, pour tout A> 0,
il existe TJ > 0 tel que si t est dans V et vérifie O < a - t < TJ, alors f(t) > A. On note dans
ce cas lim f(t) = +oo.
t--+a-
2) Soit f une fonction définie sur une partie contenant un intervalle ouvert dont la borne
inférieure est a. Nous dirons que f a pour limite +oo à droite au point a si, pour tout A> 0,
il existe TJ > 0 tel que si t est dans V et vérifie O < t - a < T], alors f (t) > A. On note dans
ce cas lim f(t) = +oo.
t---ta+

Nous laissons au lecteur le soin de vérifier que les résultats précédents demeurent valables
en remplaçant la limite par la limite à gauche ou à droite.

I.5.4. Limite infinie à l'infini

Examinons rapidement le cas des fonctions à valeurs réelles définies sur des voisinages de
l'infini.

Définition 25.32.
1) Soit f une fonction définie sur ]a, +oo[ à valeurs réelles. Nous dirons que f a pour limite
+oo en +oo si, pour tout A> 0, il existe B > a tel que si t > B, alors f(t) > A. On note
dans ce cas lim f(t) = +oo.
t-->+oo
2) Soit f une fonction définie sur] - oo, a[ à valeurs réelles. Nous dirons que f a pour limite
+oo en -oo si, pour tout A> 0, il existe B < a tel que, si t < B, alors f(t) > A On note
dans ce cas lim f(t) = +oo.
t--+-oo
702

On laisse le lecteur écrire les définitions analogues pour -oo.

EXEMPLE 25.33. En admettant les propriétés des fonctions puissances d'exposant ration-
nel, nous avons lim tT = +oo pour tout r E Q"t-- En effet, si A > 0, il suffit de choisir
t-i+-oo

EXEMPLE 25.34. Soit Pla fonction polynôme P(t) = Untn+ Un_,tn-l + · · · + u,t + uo, où
- .
n EN* et Un non nul. Ecnvons ( ) = tn ( Un+ -
Pt - + · · · + -U1-1 + -Uo) . s·1 f est la fonction
Un--1 .
t tn- tn
définie sur JR* par
Un--1 U1 Uo
f(t) = u n + - + · · · + - + -
t tn--1 tn'
alors lim f(t) =Un-On peut donc conclure que lim P(t) = +oo, si Un> 0, et lim P(t) =
t------'i+oo t-----;+oo t--++oo
-oo, si Un < O.

EXEMPLE 25.35. Considérons les deux fonctions polynômes

où n et m sont dans N* et Un et bm deux réels non nuls de même signe. Montrons que
lim P(t)/Q(t) = +oo sin> m, lim P(t)/Q(t) = Un/bn sin= met lim P(t)/Q(t) = 0
t----1+00 t-----++oo t-----t+oo
dans le cas où n < m.
En mettant tn et tm en facteur dans Pet Q, on obtient que P(t)/Q(t) = tn-mf(t)/g(t),

f(t) = Un + -
Un--1
t - + . . . + tn--1
u, + tn
Uo et

L'égalité lim f(t)/g(t) = Un/bm entraîne le résultat.


t--->+oo

I.6. Approche définitive de de la notion de limite


Nous avons jusqu'à maintenant parlé de limite d'une fonction en un point dans le cas où
la fonction est définie sur un voisinage épointé de ce point, en ensuite généralisé au cas des
limites à droite ou à gauche. Ces définitions ont pour avantage de faciliter l'intuition de la
notion, mais elles ne sont nullement indispensables. De plus, nous avons laissé en suspens le
problème de la définition et de la valeur de la fonction au point ou l'on évalue la limite. Nous
allons voir qu'au prix d'une petite modification de la définition, il est possible de former une
notion satisfaisante dans tous les cas, ce qui va s'avérer être très avantageux dans la suite.
Pour cela, il faut d'abord rappeler une notion très importante, introduite au chapitre 22.

Définition 25.36. Soit A une partie de R Un point u est dit adhérent à A lorsqu'il existe
une suite d'éléments de A qui converge vers u. L'adhérence de A est l'ensemble des éléments
adhérents à A. On la note A ou AdhA.

Revenons aux limites. Lorsqu'une fonction est définie sur une partie, il est possible de
définir sa limite en tout point adhérent à la partie.
703

Définition 25.37. Soit A une partie de JR., et f une fonction de A dans lK. Soit a E A.
On dit que f a pour limite C lorsque x tend vers a, suivant la partie A, si pour tout E E JR.~,
il existe TJ E JR.~ tel que pour tout x E A vérifiant lx - al < TJ, alors lf(x) - Cl < E. On note
alors
lim f(x) = €.
x4a,xEA

La définition que nous venons de donner est donc formellement la même que la définition
initiale, seule la contrainte sur la nature de l'ensemble de définition de f a changé. On demande
seulement maintenant que le point a soit adhérent à l'ensemble de définition de f. Ceci se
comprend bien : pour pouvoir parler de limite d'une fonction en un point, il faut que ce point
tri
puisse être approché arbitrairement près par des points en lesquels la fonction est définie. ~
..d
C'est exactement ce que l'on demande en imposant l'existence d'une suite de points de A qui u
converge vers a. Il est en fait inutile que f soit définie sur tout un voisinage épointé de a.
La deuxième amélioration est que nous parlons maintenant de limite suivant une partie.
C'est ce qui permet de lever l'ambiguïté sur l'influence du comportement de f au point a.
Pour le voir, prenons un exemple. Supposons que la fonction f soit définie sur ] - 1, 1 [, et que
le problème de la limite se pose en O. On peut alors considérer la partie A =] - 1, 1 [ ou la
partie A*=] -1, 1[\{0}. La limite de f suivant la partie A* sera exactement celle que nous
avons définie jusqu'à maintenant, et sera indépendante de la valeur de f au point a, alors que
la limite de f suivant la partie A dépendra de la valeur de f au point a, et ne pourra qu'être
égale à cette valeur, en cas d'existence. Donnons des exemples plus précis.

EXEMPLE 25.38.
► Soit f: lR----, lR. définie par f(x) = 0 six< 0, f(0) = 3 et f(x) = 0 six> O. Alors la limite
de f suivant lR n'existe pas. En effet, si elle existait, elle serait égale à 3, puisque pour tout
réel TJ > 0, Xo = 0 vérifie lxo - 0I < TJ et f(xo) = 3. Si f a pour limite C en 0, on doit donc
avoir If( x 0 ) - Cl < E pour tout E > 0, donc C = 3. Mais si E = 1 par exemple, il est impossible
de trouver un réel TJ > 0 tel que lf(x) - 31 < 1 pour tout x tel que lxl < E, ce qui montre
que la limite ne peut être égale à 3. La fonction f n'a pas de limite suivant lR au point O. En
revanche, il est clair que
lim f(x) = O.
x---------,0,xEIR*

► Soit f: lR----, lR définie par f(x) = x six< 0, f(0) = 0 et f(x) = -x six> O. Alors il est
clair que
lim f(x) = lim f(x) = O.
x------tO,xEIR* x-tO,xEIR

Mais si f(0) = 8, la limite de f suivant lR. n'existe pas, alors que la limite suivant JR.* est O.
En résumé, lorsque f est définie sur un voisinage épointé V du point a, la notion initiale de
limite que nous avons définie coïncide exactement avec la limite au point a suivant la partie
V, mais ce n'est plus le cas si V contient le point a.
Signalons maintenant une autre forme de la définition, clairement équivalente à la définition
25.37, qui est aussi très utile en pratique et que nous retrouverons dans la partie IV.

F~~.~~•~~•··· ;tJ~r~:t; ~~Jl~t~~·«~:~.itri~tc.·.,(jj,t.,â.~Ji..


Ai<11f fi ~f'lifldt~j .. , .. ·. . . ..·.• . •· . •!'iiu~1(1,;~e A; si ëflte~Îru:,ttf si pont' tom
e ER+, il.-èxiste itninterv~leouvertl ciMtenanta tël qÙe sixElf"IA, alot$1f(x}-tl< e;
Il est aussi clair que le cas des limites à droite ou à gauche se traite de manière unifiée
gràce à notre nouvelle notion. En effet, si une fonction f est définie sur un intervalle de la
forme A =] u - b, a[, la limite à gauche de f au point a est exactement la limite de f suivant
la partie A, et il est légitime d'en parler puisque a E A= [u - b, a]. On peut faire la même
remarque pour les limites à droite.
Signalons enfin que le cas des limites ±oo en un point a E A, dans le cas des fonctions à
valeurs réelles, peut être formalisé de manière analogue, on en laisse le soin au lecteur.
Voici maintenant un exemple de parties plus exotiques en apparence.

EXEMPLE 25.40.
► Soit f une fonction de N dans R Alors pour tout n EN, limx--ln,xENf(x) = f(n).
► Soit A= {1/n In EN*}. Alors O E A. Soit f: A-----+ lR définie par f(l/n) = (10 + 3n)/n.
Alors limx--lO,xEA f(x) = 3.

Considérer le cas où la partie A est égale à N n'est en fait pas sans intérêt. En effet, il
nous reste maintenant à formaliser dans notre cadre général le problème des limites aux points
±oo. Il faut pour cela étendre la définition de l'adhérence d'une partie.

Définition 25.41. Nous dirons que +oo est adhérent dans ÏR à une partie A de lR lorsqu'elle
n'est pas majorée, et que -oo est adhérent à A dans ÏR lorsque A n'est pas minorée.

On voit bien que cette définition est compatible avec la caractérisatio n séquentielle des
points adhérents donnée au chapitre 22, puisque +oo est adhérent à A si et seulement si il
existe une suite de points de A qui tend vers +oo (propriété analogue pour -oo).

Définition 25.42. Soit A une partie non majorée de lR, et f une fonction de A dans JK. On
dit que f a pour limite e lorsque x tend vers +oo, suivant la partie A, si pour tout E E lR"t-, il
existe ME lR"t- tel que pour tout x E A vérifiant x > M, alors lf(x) - fi < E. On note alors

lim
x--++oo,x.EA
f(x) = e.
On a une définition analogue pour les limites en -oo.

Avec cette définition, on voit facilement que une suite (UnlnEN converge vers e au sens
habituel si et seulement si elle a pour limite eau point +oo, suivant la partie N.
On vérifie par ailleurs facilement que toutes les propriétés élémentaires des limites que nous
avons montrées au paragraphe I.1 de ce chapitre se transposent au cas des limites suivant une
partie. Nous laissons au lecteur le soin de le prouver. On peut aussi énoncer sans difficulté les
définitions relatives au cas des limites ±oo aux points ±oo.
Terminons cette partie par un résultat fondamental, que nous pouvons maintenant énoncer
dans sa pleine généralité.

Thêorènie 25.43. Sotènt A et B dè,w; parties de. R, et. Q EA


et be;iÏ. .Oti considère :une
fonction f de A dansJlf,, telle que f{A) ç B, et teUe queHmx,<1<;xeA f(xf;,,, bi et '.Une fonct,ion
g de B dans JK. On suppose que limx--lb,xE-B g(x) = e. Alors .
·urn g of(x)
X4<1<,xE-A · •
=t

PREUVE. Soit E > 0 fixé. Alors il existe TJ > 0 tel que si 1J E B vérifie Ill-b < TJ, 1g (1J )-€1 < E.
1

Mais il existe a> 0 tel que six E A vérifie lx - al < a, lf(x) - bl < TJ. Il en résulte, puisque
f(x) E B par hypothèse, que lg(f(x))-€1 < E, ce qui montre la propriété. ■
705

On vérifie sans difficulté que le théorème précédent s'étend au cas où A et B sont considé-
rées comme des parties de 'i, et a= ±oo et b = ±oo.
Avertissement. Dans la suite, sauf mention contraire, nous utiliserons la notion
de limite que nous venons de définir. Si le contexte est clair, il arrive que l'on
omette de préciser que la limite est prise suivant la partie A considérée.

Il. CONTINUITÉ D'UNE FONCTION

Nous en venons maintenant à la formalisation de la notion de continuité, qui comme nous tr.i
C'I
l'avons montré en introduction ne s'est que graduellement précisée au cours des âges. .d
ü

11.1. Continuité d'une fonction en un point

La propriété de continuité décrit en partie le lien entre la limite d'une fonction en un point
et sa valeur en ce même point (ce qui suppose qu'elle est définie en ce point). Une fonction f
est continue en un point u si elle prend des valeurs proches de f(u) dans un voisinage de a.
Intuitivement, une fonction est continue si le tracé de son graphe ne présente aucun saut.
Définition 25.44. Soit f une fonction définie sur une partie A de IR, à valeurs dans OC, et
un élément a de A. On dit que f est continue au point a si sa limite en a suivant A est égale
à f(a). En d'autres termes, f est continue au point a si et seulement si pour tout t: > 0, il
existe TJ > 0 tel que pour tout x E A vérifiant lx - al< TJ, alors lf(x) - f(u)I < f.

EXEMPLE 25.45.
► Toute fonction constante est continue.
► La fonction f: lR----, lR définie par f(x) = x est continue en tout point de R
► La fonction f: lR----, lR définie par f(x) = 0 six :s; 0 et f(x) = x six;?: 0 est continue au
point O.
► La fonction f: lR----, lR définie par f(x) = 0 six S O et f(x) = 1 six> 0 n'est pas continue
au point O.
► La fonction f : lR ----, lR définie par f(x) = 0 si x E lR \ Q et f(x) = 1 si x E Q n'est
continue en aucun point de R En effet, si x 0 E Q, et si TJ > 0 est donné, on sait qu'il existe
un irrationnel x tel que lx - xol < TJ, donc lf(x) - f(xo)I > 1/2, ceci montre que f ne peut
être continue en Xo. De même, si Xo E lR \ IQl et si TJ > 0 est donné, on sait qu'il existe un
rationnel x tel que lx - x 0 < TJ, donc lf(x) - f(xo)I > 1/2, et ceci montre que f ne peut être
1

continue en x 0 .
► La fonction x H lxl est continue en tout point x 0 E R

La proposition 25.6 entraîne que la continuité en a d'une fonction f peut s'établir en


considérant l'image des suites qui convergent vers a.
Proposition 25.46. Soit t une fonttiœn définie sut une partie A de R, ci. valeurs dans K,
et un élément a de A. Alors f est· continue en a si et seulement si pour toute suite (tn)n>o
de A, convergente et de limicte a, .alors.la suite (f(tn))rQ:o est convergente et de limite f(aj.
PREUVE. C'est une conséquence immédiate de la proposition analogue pour les limites. ■

Avec les mêmes notations, on peut donc écrire lim f(tn) = f( lim tn), dès que f est
n---,+oo n---,+oo
continue.
706

Test 25.19. Test 25.20.


Soit f : ~ --, ~ une fonction continue en un Soit f : ~ --, <C une fonction continue en un
point a. Montrer que si f( a) > 0, alors f est point a. Montrer que si f(a) fi, alors il existe
strictement positive dans un voisinage de a. un voisinage V de a tel que pour tout t E V
f(t) # i.
Cl)

~ Définition 25.47. Soit f une fonction définie sur une partie A de JR, à valeurs dans JK., et
un élément a de A. On dit que f est continue à gauche au point a si sa limite en a suivant
la partie An]-oo, a] est égale à f(a). De même, on dit que f est continue à droite au point
a si sa limite en a suivant la partie A n [a, +oo [ est égale à f (a).

Notons que si a est le plus petit élément de A, alors f est toujours continue à gauche en a,
et de même f est toujours continue à droite en a si a est le plus grand élément de A. On voit
aussi qu'une fonction est continue en un point si et seulement si elle est continue à gauche et
à droite en ce point.

EXEMPLE 25.48. Pour t E lR, on note E(t) la partie entière de t. Nous savons que

-~ -0 ~~ ~~
lim E(t) = n - 1 et lim E(t) = n sin E Z et lim E(t) = lim E(t) = v = E(v) si
v E lR \ Z. On déduit alors que E est continue en tout point de lR \ Z, continue à droite en
tout n E Z et discontinue à gauche en tout point de Z.

Soit f une fonction définie sur un voisinage épointé V d'un point a. On suppose que f
possède une limite l au point a. On définit une nouvelle fonction f sur V par t(t) = f(t) si
t E V\ {a} et t( a) = l. La fonction f est continue au point a. Par définition f s'appelle le
prolongement par continuité de f au point a. Le prolongement par continuité à droite ou à
gauche se définit de la même manière.

EXEMPLE 25.49. Pour t E JR*, on pose f(t) = tsin(l/t). Nous avons déjà montré que
lim f( t) = O. La fonction f se prolonge alors par continuité au point O.
1 t---;0

Lespropriétés opératoires suivantes de la continuité sont des conséquences directes des


propriétés analogues pour les limites.

Proposition 25:50. Seientf et y desfonctions définies sùr une partie A de R, à valeùrs


dans K, soit >\ E K, sàit a·€ A: ·
1) Si f et g sont êuntinues au point a, la somme f +g et le produit fg sontconÜnues àu
point a.
2) Si f est continue en a, M est continue en a.·
3) Sif ne s'annule pas .mr "'ët estcontinu{e~ n, 1/f'est êontinue en a..
4) Si f et- g sont
--
-
continues
- '
- -
!ZU'J1()inta
- -, __---
ecfts.Îg
- -
,.,,;,1J1annÙfepas
' --' -
surA1 alo~s f/g est- coriti~ue
-: ' -- :',---- ,

enà.
La propriété fondamentale suivante est immédiate à partir de la proposition 25.43.

Proposition 25.51. Soi.·ent A et B des· parties de R., f une Jonctiori de A dans lR, avec
. . .

f(AJ ç B, et g une fonction de B dans K. Alors si.f est continue en!J: ti;.A et si g est
continue en f(a),. alors Q Of est continue en a.
707
-~
II.2. Continuité globale •
[/J
(L)
Étudions maintenant les problèmes de continuité sur des sous-ensembles de lR. ;:l
.s.....,
Définition 25.52. Soit f une fonction définie sur une partie A de JR, à valeurs dans 1K. On i::
0
dit que f est continue sur A si f est continue en tout point de A. "i::
[/J

0
:p
EXEMPLE 25.53. "i::
..8
► Les fonctions constantes sont continues sur R [/J

~
► La fonction x H x est continue sur R
LCi
► La fonction f : x H x 2 est continue sur R On peut le rnir en utilisant le point préédent et "1
la proposition 25.50, mais nous allons le montrer directement. Fixons x 0 dans lR et montrons ..d
u
que f est continue en x 0 . Soit f > 0 fixé. Posons T] = min( 1, e/(2lxol + 1) ). Alors si lx-x 0 1 < 11,

ce qui montre que f est continue en x 0 .

Un bon exercice consiste à montrer par des méthodes directes la continuité dans lR de
la fonction x H x\ où r est un rationnel positif donné. Nous verrons au chapitre 28 que la
fonction x H x"' est continue dans lR lorsque ex E JR+ et dans JR* lorsque ex E JR:_.
La proposition 25.50 a bien sûr sa conséquence globale.

Prop913fü<>t1 ;z,~if
0
891,t!:tJJ f ~t g ties/C1iiitww,)1éfiinjes ,.- pne•:f!IJ,rtie A ~le R"
dqns lK, SQÏrns.e JK,~~«•i Ai i . . . ~ • • • . •
à valeurs

1) f et g sont continues sur A, la somme f + g et le prodüit fg sont. cc1ntinues sur A


2) S{lést continu~ sûrA~ Mest œntinuê'sur A,
3~ S(f ne s7annule past~~ A,yf estconm,nuesur A. . . •·•· .... ·.. •.... ··•···. ·.• ..·. > ..·.•··
~) ·Sifefg.sônf'eoiitirioosJtiji>itïi aeîsi g" ne s'ànnûlê pas sùrA,. àlo1's f/g est d>~tini&e
en a.
On en déduit facilement que toute fonction polynôme est continue sur JR, et que les fractions
rationnelles sont également continues sur leur ensemble de définition, comme quotient de
fonctions continues.

F"füpôsitiôn ':25.55i , Soient A et B des P«rti~s tle' lltj f 1une fonction dé A dans R, avee
f{Aj C B, et :g ürte:fm,,t:tiion .1.ùt'B dans K., A1ors sif eet continue sur A et si11 ·f;St C(mtinue
:sttr B~ alvrs g o f Mt oontinué sur A. .
La proposition 25.8 montre que la continuité de f entraîne celle de lfl.

EXEMPLE 25.56. Soient f et g deux fonctions réelles définies et continues sur R Pour
t E JR, on note, h(t) = max(f(t), g(t)). À l'aide de l'identité

_ ex+ f3 + lcx. - /31 ,


max (ex, /3) -
2

la fonction h peut s'ecrire h( t) = f(tJ+g(tJif(tJ-g(tll, elle est donc continue. Une récurrence
prouve que le résultat reste valable pour une famille finie de fonctions, c'est-à-dire que la
fonction h( t) = max( f 1 ( t), f2( t), ... , f n( t)) est continue si f 1 , f 2, ... , f n le sont.

1
708

Test 25.21. 2. Si f est continue en a, alors g est continue


au point f(a).
Soit f une fonction continue de R dans C. Que
peut-on dire de f si elle est nulle sur IQ) ? 3. Sig est continue en f( al, alors f est continue
en a.
Test 25.22.
Soit f une fonction de R dans C. Que peut-on Test 25.24.
dire de l'assertion suivante? Soient f et g deux fonctions définies de R dans
Si lfl est continue, alors f est continue. R Étudier les affirmations suivantes où a est
Test 25.23.
un réel fixé.
1. Si f et g sont continues à droite respective-
Soient f et g deux fonctions définies respecti-
ment en a et f (a), alors g o f est continue à
vement sur les intervalles I et J avec f(I) C J.
droite en a.
On suppose que go f est une fonction continue
en un point a de I. Les assertions suivantes 2. Si f est continue en a et g continue à gauche
sont-elles vraies ? en f(a), alors go f est continue à gauche en a.
1. f et g sont continues respectivement en a et 3. Si f est continue à droite en a et g continue
f(a). en f(a), alors go f est continue à droite en a.

Le résultat de l'exemple 25.56 n'est plus vrai pour une famille infinie de fonctions continues,
en remplaçant le max par le sup. Prenons par exemple fn( t) = -tn si t E [O, 1], fn(t) = 0 si
t < 0 et fn(t) = -1 si t > 1. La fonction h(t) = supnEN.(fn(t)) est donnée par h(t) = 0 si
t < 1 et h( t) = - 1 si t 2'. 1. Elle est bien discontinue au point 1.

III. PROPRIÉTÉS GLOBALES DES FONCTIONS CONTINUES

Nous allons considérer maintenant les propriétés des fonctions continues sur des segments,
c'est-à-dire des intervalles fermés et bornés.

Théorêm~ 25:57. '.l'ott,t~ fo11;1ili1l 9-.'l!al,e~~. 'tf~l!es <lêJinîtr~f; rifmtfr,iu{ it11-r: ttn s ~ t ë:it
barn~: · · ·
PREUVE. Soit f : [a, b] ---, JR, avec ( a, b) E JR 2 et a < b. On suppose la fonction f non
majorée. Dans ce cas, pour tout réel M, il existe t dans [a, b] vérifiant f(t) ? M. En prenant
M = n pour n dans N, on a un réel tn E [a, b] tel que f(tn) ? n. Comme la suite (tnlnEN
ainsi obtenue est bornée, on peut en extraire une suite convergente (tn, lkEN de limite ex. Nous
avons donc f(tnkl ? nk pour tout k EN. La continuité de f entraîne que la suite (f(tnklkEN
converge vers f(ex); or on constate, à cause de l'inégalité précédente, qu'elle tend vers +oo.
On aboutit ainsi à une contradiction. Pour établir que f est minorée, il suffit d'appliquer ce
qui précéde à -f. ■

Soit f une fonction à valeurs réelles définie sur une partie A non vide de R Rappelons que
les bornes de f sur A sont suptEA f(t) = supf(A) et inftEA f(t) = inff(A).

Thêorème 25~58. ·.(Thêorème<le HêineJ.. Toutefonctio11,à valeurs réelles définie et conti-.


nue sur un segment [a.,b] attei.,j,t seibornes sur œ segment.

PREUVE. D'après le théorème précédent, la fonction f est bornée sur [a, b]. Notons ex sa
borne inférieure sur cet intervalle et supposons qu'elle n'est pas atteinte par f. Considérons
alors la fonction
1
g : [a, b] ---, JR, g(t) = f(t) - ex'
709

qui est bien définie et continue sur [a, b], par composition de t H f(t) - ex (continue et à
valeurs dans IR*) et de t H 1/t (continue sur IR*).
Soit M > 0 donné. Par définition de la borne inférieure, nous savons qu'il existe t dans
[a, b] tel que ex ( f(t) < ex+ 1/M, et donc g(t) > M. Comme M est arbitraire, ceci montre
que g n'est pas majorée; or ceci contredit le théorème 25.57 appliqué à g. ■

At tcnt ion L'intervalle doit être fermé et borné


Les deux théorèmes ci-dessus ne sont plus valables si on remplace le segment [a, b] par l.Q
IN
un intervalle non fermé ou non borné. Ainsi, la fonction t H 1/t est continue mais .d
ü
non bornée sur JO, 1]. On peut dire la même chose de la fonction t H t 2 sur l'intervalle
[0,+oo[.
Même si la fonction t H t définie sur [O, 1[ est bornée, elle n'atteint pas sa borne
supérieure. La fonction définie sur IR par t H 1/( 1 + t 2 ) est bornée mais 0, qui est sa
borne inférieure, n'est pas non plus atteinte.

EXEMPLE 25.59. Soit f une fonction continue de [a, b] dans [a, b] telle que pour tout x
et 1J distincts lf(x) - f(y)I < lx -yl. Montrons qu'il existe un unique Xo dans [a, b] tel que
f(x 0 ) = Xo.
► Pour x E [a, bl, on note g(x) = lf(x)-xl. La fonction g étant continue (par composition),
elle atteint son minimum en un point Xo de [a, b]. Si f(x 0 ) est distinct de x 0 , alors

g(f(xoll = lf(f(xo)l - f(xo)I < lf(xo) - xol = g(xol,


c'est-à-dire g(f(x 0 )) < g(x 0 ); or ceci est impossible puisque g(x 0 ) est le minimum de g sur
[a, bl, donc f(xo) = x 0 . Il en résulte que f(xo) = x 0 . L'unicité du point xo vient directement
de l'inégalité lf(x) - f(y )1 < lx - yl.

IIl.1. Le théorème des valeurs intermédiaires


Commençons par énoncer un théorème dont on donnera plusieurs applications à connaître.
Il exprime que si une fonction continue sur un intervalle [a, b] prend des valeurs de signes
contraires aux deux bornes, elle doit nécessairement s'annuler dans l'intervalle.

TllêotèJtlé 2t..GPL(Thêôtême d~ valê,'11'5 Jntêt~~~ 1;,. S~ f >otrte fo1icti6n à


. elle.s 'rJ,éJi.n. ïe .et ciJ.ntin.tt.e.· sur l'inte'l'VaUe, [ci, b}; Si ('à}f.{.b}.. $ O,.:,alo'is J'l existe c
vak.·.urs m f.

dans [à, b] tel que f( c) = O. · ·· ·

PREUVE. Si f(a)f(b) = 0, on peut prendre c = a ou c = b. Supposons maintenant que


f( a)f(b) < 0 c'est-à-dire que f( a) et f(b) sont de signes contraires. Le réel f( aibl, s'il n'est
pas nul, est du signe de f( a) ou de celui de f(b ). Dans le premier cas, on pose [a 1 , b 1] = [aib, b]
et dans le second [a,, b 1] désignera l'intervalle [a, aib]_ Le segment [a 1 , b 1] est de longueur b 2a
et la fonction f vérifie f( ai)f(b 1 ) ( O. Si on applique une deuxième fois l'opération précédente
à [a1,bil, on obtient un nouveau segment [a2,b:zl inclus dans [a 1 ,b 1], de longueur b:;:° sur
lequel f vérifie f(a2)f(b2) ( O. En réitérant ce procédé, on obtient une suite ([an, bn.llnEN de
710

segments emboîtés de longueur b2-;:;0 avec la condition f(un)f(bnl :( O. Comme b;a tend vers
0 quand n tend vers l'infini, il existe alors un point c E [a, b) qui est la limite des deux suites
(unln>1 et (bn)n>1- En passant à la limite dans l'inégalité f(un)f(bn) :( 0 et en utilisant la
contin~.üté de f, o; obtient f(c) 2 :S 0; ce qui entraîne que f(c) = O. ■

Donnons un premier exemple quelque peu imagé.

EXEMPLE 25.61. Un alpiniste commence à escalader une montagne un samedi à 7 heures


du matin. À 5 heures de l'après-midi, il atteint le sommet, où il décide de passer la nuit. Le
dimanche matin à 7 heures, il entame sa descente. Il arrive à son point de départ à 17 heures.
On suppose que son altitude varie continument au cours du temps. Nous allons prouver qu'à
un même moment de la journée du samedi et celle du dimanche, il était à la même altitude.
► Pour t E [7, 17), on note S(t) (resp. D(t)) l'altitude de l'alpiniste au moment t de la journée
du samedi (resp. dimanche). La fonction f = S - D est continue et vérifie f(7) :( 0 :( f(17).
D'après le théorème des valeurs intermédiaires, il existe c E [7, 17) tel que f( c) = 0, c'est-à-
dire S(c) = D(c). L'instant c répond à la question.

L'exemple précédent repose bien entendu sur un modèle pour l'alpiniste, qu'on laisse au
lecteur le soin de préciser.

AttC'lltiou Le point n'est pas unique


Le réel c donné par le théorème des valeurs intermédiaires n'est pas forcément unique.
Considérer par exemple la fonction f définie par f(x) = x 3 - x sur [-2, 2).

EXEMPLE 25.62. Il est même possible que l'équation f(t) = 0 possède une infinité de
solutions sans que f soit la fonction nulle. Prenons par exemple la fonction continue f définie
sur [-1, 1] par f(t) = t 2 sin(l/t) si t E [-1, 1) \ {0} et f(0) = 0 (la continuité se montre
en admettant celle de la fonction sin). Tous les 1/nn, pour n E Z*, sont des solutions de
f( t) = 0 sur l'intervalle [-1, 1].

Corollaire 25.68, Tout polva°'~ ~tfJlegft? impaif: à Ct>è/Ji,cwnt,s~réela,s'af1,ntJ,le;a,u tnCinp "f(J,!!


fois surR.
PREUVE. Soit P un polynôme à coefficients réels et de degré impair. Quitte à remplacer P
par -P, on peut supposer que le coefficient dominant de Pest strictement positif. Nous avons
donc lim P(t) = +oo et lim P(t) = -oo. Si on applique les définitions de ces limites avec
t--H-oo t--> --oo
A= 1, on obtient deux réels B > 0 et B' > 0, tels que si t ~ B et t' s; -B', alors P(t) > 1 et
P(t) < -1. L'inégalité P(B)P(-B') :S 0 et le théorème des valeurs intermédiaires entraînent
l'existence d'un réel t 0 entre -B' et B tel que P(t 0 ) = O. ■

Cc>r6ïfuir~·•2J.~; ~té(• tit'tt~_~vâlêuri~iièl1i}~é/iti~'. el'~rtfinfiestir l'tit.~~J


[a,ôÎ,Sîi,êst'ertiref{à) it )•î.Z:ê#st~è àîini[a}bttel~e f(è}:;,,1J: ·· · · · · · "
PREUVE. Pour t E [a, b], on pose g(t) = y - f(t). Comme y est entre f(u) et f(b), alors
g(u)g(b) :( O. On obtient le résultat en appliquant le théorème 25.60 à la fonction g. ■

Voici une autre forme du théorème des valeurs intermédiaires, fondamentale elle aussi.
711

Remarque. La preuve du théorème des gnifie que ex est dans l'intervalle [3/4, 25/32]
valeurs intermédiaires consiste à partager, à c'est-à-dire qu'on connaît ex avec une erreur rfJ
<I)
chaque étape, un segment en deux segments de 0,031.
égaux et ensuite à choisir l'un des deux sui- §
vant les signes des bornes. Cette méthode §
u
est désignée sous le nom de dichotomie. Elle rfJ

fournit un algorithme qui permet de cal-


culer des valeurs approchées de la solution
f(x) = O. Appliquons par exemple cet algo-
1
<-8
rfJ

rithme au polynôme P(t) = t 5 +t-1 afin de 0 ~


donner une approximation de sa racine dans lÔ
C'I
l'intervalle [O, 1]. Comme P est strictement ..ci
u
croissant, avec P(0) = -1 et P(l) = 1, cette
racine existe et est unique, on la note ex. À
l'étape 1, on montre que P(l/2) < 0 donc ex
est comprise entre 1/2 et 1. L'étape 2 fournit
P(3/4) < 0 donc ex se trouve entre 1 et 3/4.
Si nous effectuons les calculs jusqu'à l'étape
FIGURE 25.4. La représentation graphique
5, on constate que P(25/32) > 0 ce qui si- de P.

•Théorèmê 25.6ft !'fhool'ê111e ' • ' VâleÙi-s ÙdÊ!m~ 1}1. Soientl im intervalle
et f une fooo#on 6, vàlèU!/'$ réellesiléfi,fiîe ;ifiir J. SH èstd:J1i,tir1iae, I.ÛM's ffl) est tin intervalle.

PREUVE. Soient -y ::::; -y' deux éléments de f(I). Il existe t et t' dans I tels que -y = f(t)
et -y' = f(t'). Si z E [-y, -y'], d'après le corollaire 25.64 ci-dessus, il existe t" E [t, t'] tel que
f(t") = z. Le réel z se trouve alors dans f(I). Nous venons de prouver que [-y, -y'] C f(I). En
résumé, nous avons montré que si -y ::::; -y' sont deux éléments de f(I), l'intervalle [-y, -y'] est
alors contenu dans f(I). Cette dernière propriété est une caractérisation des intervalles de JR,
comme nous l'avons vu au chapitre 21. ■

Soit f une fonction à valeurs réelles définie et continue sur un intervalle I. Nous savons
maintenant grâce au théorème des valeurs intermédiaire que f(I) est un intervalle. Si I est
fermé et borné, c'est-à-dire de la forme [a, bl, alors le theorème de Heine sur les extrema
montre que f(I) est aussi fermé et borné. Ceci donne lieu à un autre théorème très utile en
pratique.

' l ' ~ e ~$.G(i~ {!l'hêorJlme des valeurs intermédiaires III). Soient l = [a. bJ un
interual.le fermé b<.>mé1 .et soit. f. une fonction· à '/JtÛeursréelles défime sur L Si f ·est continue,
al,ors f·.est 'fJornée sur.I, ·eile attéint ses .bornes ainsi .que toute·valeur comprise entre ses
bornes. En d'autres termes, f(I) = [à,, 131, r.wec infteI f{t) = <X $13 = suptEI f(t).
Nous allons maintenant donner un exemple d'utilisation du théorème des valeurs intermé-
diaires. Soit f une fonction de [O, 1] dans lR. On dira ici qu'un réel c > 0 est une corde de
f s'il existe t E [0, 1 - c] tel que f(t + c) = f(t). Sic est une corde de la fonction f et si t
est le point donné par la définition, alors le segment horizontal joignant les points (t, f (t)) et
(t + c, f(t + c)) a ses deux extrémités sur le graphe et sa longueur este (voir figure suivante).

't'lîêorême 35.67~ Soient n un entier naturel non nul et f .: [0,.1} -t R une fonction
continue vérifianH(O} = f(l). Alors 1/il ê.St une corde de f.
712

0 t t+ C

FIGURE 25.5. Un graphe avec une corde

PREUVE. Pour t E [0, 1 -1/n], posons g(t) = f(t + 1/n) - f(t). Comme la somme

g(0) + g(l/n) + g(2/n) + • • • + g ( n-1)


~ = 0,

il existe deux entiers p et q entre 0 et n - 1 tels que g (p /n) ::;: 0 ~ (q/n). Le théorème des
valeurs intermédiaires appliqué à g entre p/n et q/n montre l'existence de t E [0, 1 - 1/n]
qui vérifie g (t) = 0, c'est-à-dire f (t + 1/n) = f (t). ■

Disons maintenant qu'un réel c > 0 est une corde universelle sic est une corde pour toute
fonction f de [0, 1] dans JR., continue sur [0, 1] et vérifiant f(0) = f(l ). D'après le théorème
25.67, les inverses des entiers naturels non nuls sont donc des cordes universelles. Voici une
application imagée de ce résultat.

EXEMPLE 25.68. Un cycliste parcourt 20 km en une heure: existe-t-il au cours de sa balade


un intervalle de temps d'une demi-heure durant lequel il aura fait exactement 10 kilomètres?
► Pour t entre 0 et une heure, on note D(t) la distance (en km) parcourue entre l'instant 0
et l'instant t. On suppose évidement la fonction D continue.
La fonction définie sur [0, 1] par f(t) = 20t- D(t) est continue et vérifie f(0) = f(l) = O.
L'équation f(t+c) = f(t) devient 20c = D(t+c)- D(t). En posant c =½,le théorème 25.67
appliqué à la fonction f assure l'existence d'un t E [0, 1] vérifiant D(t + 1/2) - D(t) = 10.

La question est maintenant de savoir s'il existe d'autres cordes universelles que les inverses
des entiers positifs. Soit c un réel strictement positif qui n'est pas l'inverse d'un entier naturel
non nul. On considère la fonction f définie sur [0, 1] par
2
f(t) = t _ sin nt/c.
sin 2 n/c

En admettant que la fonction sin est continue sur JR., on montre facilement que la fonction f
est continue, et elle vérifie f(0) = f(l). Mais l'équation f(t + c) = f(t) n'a aucune solution
dans [0, 1 - cl, comme on le vérifie immédiatement. Le nombre c ne peut donc être une corde
universelle.
Si on reprend l'exemple du cycliste ci-dessus, on peut affirmer qu'il n'existe pas forcément
d'intervalle de temps de trois quarts d'heure durant lequel il aura fait exactement 15 kilo-
mètres. Il suffit que le cycliste (certes tourmenté) effectue un parcours décrit par la fonction
713

D définie par
2
D(t) = 19t+ sin 4nt/3
sin 2 4n/3
comme on peut le vérifier.

Test 25.25. Test 25.26.


Soit f une fonction continue de [u, b] dans JR. Peut-on trouver une fonction continue f de [O, 1]
Que peut-on dire de f si f( [u, bl) C Q? Idem dans R telle que f([O, ll) = {1/n In EN*}?
avec f([u, bl) C lR \ Q?
tr.i
C"I
.d
IIl.2. Continuité et monotonie u

Étudions maintenant les relations entre la continuité et la structure d'ordre de R

flt~~ition 2fi.6~. Soit t : I. --t R une f ~ . 4 ualeurs ri.elle$ définie et continue sur
'1/Jl/, intervalle l. Là Jonction f est stric~m.ent monotone si et. ~ e n t si elle est injective.
PREUVE. Il est évident que toute fonction strictement monotone est injective. Pour prouver
la réciproque, supposons que f n'est pas strictement monotone, c'est-à-dire qu'on peut trouver
trois points x, y et z de I tels que x <y< z et f(y) ne soit pas entre f(x) et f(z). Dans le cas
où f(y) < f(x) < f(z), d'après le théorème des valeurs intermédiaires, il existe x' dans ]y,z[
tel que f(x) = f(x'). Comme x < y < x', x =/. x' et comme f(x) = f(x'), f n'est pas injective.
Les autres cas conduisent également à la non-injectivité de f. ■

Soit f est une fonction à valeurs réelles définie et continue sur un intervalle I. Si f est
injective, on peut définir sa fonction réciproque f- 1 sur l'intervalle f(I).

~r,~. ~ire, .S(Jitf~


.'lt'l):t::[<>~~ în:ie<:tive à v~s ~{k,tf '4i~~·. e,t..
•w.i,; ~'meivàllê, IZSa fonitwn' ~i~'f:':'1 • est t:fJ'ntinue sur l'i1ltérv~lir{clf .; .•·
~~yt:·>,~·,.,",.
PREUVE. Supposons pour fixer les idées que f est strictement croissante sur I. Sa fonction
réciproque f- 1 est aussi strictement croissante. Nous savons (voir le théorème 25.20) qu'une
telle fonction admet une limite à gauche et à droite en tout point de f(I). Afin de prouver
la continuité de f- 1 en un point, il suffit de montrer que ces deux limites coïncident avec la
valeur de f- 1 en ce même point.
Soit y un point de f(I), qu'on suppose intérieur à f(I), et soit (YnlnEN une suite de f(I)
1
de limite y telle que Yn < y pour tout n 2: O. Nous avons lim f- (s) = lim f- (yn)
1
s--+y- n--++oo

sup f- 1 (Ynl- Grâce à la continuité de f, nous avons les égalités


nEN

f( lim f- 1 (s)) lim f- 1 (Ynll = lim f(f- 1 (1:ln)) = lim Yn,


= f( n--++oo
s--+y- n--++oo n--++oo

d'où l'on déduit que f( lim f- 1 (s)) = y ou encore lim


s--+y- s--+y-
r 1
(s)) = f- 1 (y). Une preuve similaire

montre que lim f- 1 (s)) = f- 1 (y), et notre assertion en découle. Si maintenant y est une
s--+y+
borne de f(I), le même raisonnement vaut pour la continuité à droite où à gauche, suivant les
cas. ■
714

Test 25.27. Test 25.29.


Donner l'exemple d'une bijection de (0, 1] sur Soit fla fonction définie sur lR par f(t) = t si
lui-même qui possède 2 points de discontinuité. t E Q et f(t) = 1 - t si t E lR \ Q.
1. La fonction f est-elle une bijection de lR? Si
Test 25.28.
oui, déterminer sa fonction réciproque.
Soit f la fonction définie sur lR par f(t) = 2. L'image par f d'un intervalle est-elle un in-
tsin(l/t) si t E JR* et f(O) = O. Peut-on trouver tervalle?
un voisinage de O sur lequel f est injective?
3. Etudier la continuité de f.

III.3. Application : les fonctions puissance d'exposant rationnel


Nous sommes depuis longtemps habitués à manipuler des puissances rationnelles de nombres
positifs, en particulier, la racine carrée d'un nombre est d'utilisation permanente. Mais nous
savons depuis le chapitre 21 que vx est un rationnel si et seulement si x est un carré parfait.
Et nous savons depuis le chapitre 23 que définir un irrationnel n'est pas une chose facile. Il
faut donc que l'existence de ces puissances rationnelles soit fondée sur une étude clairement
posée, c'est l'objet de cette partie, qui va nous permettre d'appliquer le théorème des valeurs
intermédiaires, et de le faire apparaître comme un théorème d'existence et d'unicité.
Lorsque n E N*, on définit x n pour tout réel x comme le réel obtenu en multipliant n
facteurs égaux à x (ceci cache une définition par récurrence que nous invitons le lecteur à
écrire). La seule opération nécessaire est la multiplication x, l'objet obtenu est donc bien
défini (dans le cadre même de l'algèbre associée à la structure de corps de fi'.).
Si maintenant n = -m E Z:'._, et six -=fa 0, on pose xn = 1/xm, et là encore le réel obtenu
est bien défini par une opération algébrique dans R On convient de poser x 0 = 1 pour tout
réel x, et les puissances entières de réels non nuls sont donc bien définies.
Pour définir les puissances rationnelles, nous aurons besoin du lemme suivant.

PREUVE. La fonction Pn est le produit den facteurs égaux à P 1 . Nous avons montré que
P 1 est continue, donc Pn est continue en vertu de la proposition 25.54, par une récurrence
imédiate. Les propriétés de parité proviennent de la règle des signes dans R La fonction P 1
est positive et strictement croissante sur R+, on en déduit aussi par une récurrence facile que
Pn est strictement croissante sur fi'.+. Compte tenu des propriétés de parité, il suffit d'étudier
la limite de Pn en +oo. Mais pour x ~ 1, Pn(x) ~ P 1 (x) = x, et on voit immédiatement que
limx-->+oo P,(x) = +oo. Il en résulte aussi facilement que limx-->+oo Pn(X) = +oo. La dernière
propriété est claire. ■

Compte tenu de la proposition 25.69, et du fait que Pn( 0) = 0 pour tout n E N*, on en
déduit le corollaire suivant.

Corollaire 25. 72. Pour n E N*, la fonction Pn est une bijectio~ dé R+ sur R+.
La propriété de surjectivité nous intéresse ici au premier chef. En effet, ce corollaire nous
montre que pour tout réel positif b il existe un réel positif a tel que un = b. En d'autres
715

termes, c'est un théorème d'existence d'une solution pour l'équation xn = b. La propriété


d'injectivité nous indique alors que cette solution est unique.
Définition 25. 73. Soit n E N*. Pouru E lR+, on note ul/n ou y'u l'unique réel positif
solution de l'équation xn = u. On dit que ul/n est la racine nede u. On définit donc ainsi
une fonction yl : ~+ ----+ lR+, réciproque de la fonction Pn, qui est strictement croissante, et
vérifie v'O = 0 et limx---;+oo y'x = +oo.
La première question est de savoir comment se comporte cette nouvelle fonction vis-à-vis
des opérations algébriques sur n et x.
Lemme. 25. 74. tlÎ
C'I
l) Si (J. etb. stirtt des. riels positifs, (abJlfn = a l/nb l/n. .d
ü
2) Sin ~tm; Sônt dans .N*, et ;i a ER+, {a 11n)l/m = a 1/nm.
3) Si Ji· et m.. sont dans .N*, et si a ER+, (a1fn)m = (am)l/n.
PREUVE. Par associativité et commutativité de x : (a 11nblln)n = (a 11n)n(b 1/n)n = ab,
donc a 11nbl/n= (ab) 1/n par définition. Le deuxième point provient de l'égalité
-1
Pnm = (P

p )-1
m
= p-1
m O p-1
n ·

Le troisième point est immédiat à partir de l'égalité Pn o Pm= Pm o Pn.



Nous avons tout pour définir maintenant une fonction puissance d'exposant rationnel.
Soit r E (Ql~. Alors r = n/m, avec n et m dans .N*, et il est tentant de poser pour a E lR+,
ur = (a 11m)n = (an)l/m_ Mais il faut s'assurer que cette définition ne dépend pas du choix
des entiers net m. Soient donc n' EN* et m' E .N* tels que r = n'/m'. Alors n' = fn et
m' = fm avec f E N*, et
(al/m')n' = (a1/fm)tn = [[a1/m)1/1tr = (al/m)n

ce qui prouve l'indépendance. On vérifie par des considérations élémentaires que


(abJT = a~r, (ar)s = ars
pour tous a, b dans lR+ et r, s dans Ql';.. Il suffit alors de prolonger cette définition à toutes
les puissances rationnelles en posant

ao = 1.
La dernière question à examiner est celle de la continuité des applications que nous venons
de construire. Elle ne pose pas de problème dans le cas des exposants entiers, il s'agit donc
de la vérifier lorsque l'exposant est rationnel non entier. Pour les exposants de la forme 1/n,
n E N*, la continuité de P1;n résulte de la définition et du théorème 25.70. Maintenant, si
r = n/m E (Ql, comme P,. = Pn o P 1;m, on en déduit par le théorème de composition la
continuité de P,. sur lR';_. On peut donc énoncer le théorème suivant.

Proposition 25.75. PÔur r E Q, l'appliœtien t>,.: R';. -+ R';. définie par P..-(xJ = xr est
continue. Pour (x\ Y},E {R';.)2 et (r, s) E (f, on a les propriétés

Si,- > ô, Îimx-+I·<><> P,.(x} = +oo ét la fonction P,. se prol.onge par oontinuité en O par P( 0) = 0.
SiT <0; limx.....,+oo Pr(X) =0 et limx. . . o+ P..-(x} =+oo.
716

PREUVE. La continuité a été montrée. Les autres propriétés sont élémentaires, on en laisse
la vérification au lecteur. ■

On renvoie le lecteur au chapitre 4 pour des compléments. En particulier, les propriétés


de dérivabilité des fonctions introduites ici sont élémentaires, et peuvent être considérées
maintenant comme acquises.

III.4. La continuité uniforme


Nous introduisons maintenant une notion plus forte de continuité.
Définition 25. 76. Une fonction f définie sur un intervalle I à valeurs dans 1K est uniformé-
ment continue si, pour toute E lî';_, il existe TJ E lî';_ tel que, si (x, y) E 12 vérifie lx-yl < TJ,
alors lf(x) - f(y)I < e.
La continuité uniforme est une propriété qui fait intervenir le comportement de f sur tout
l'intervalle I. Le nombre TJ associé à un e donné ne dépend ici que de e alors que dans la
définition de la continuité en un point, il dépend à la fois de e et du point considéré. Il est
donc évident que la continuité uniforme entraîne la continuité.
Proposition 25.77. Une fritwtwn ùni]ormément ·Clffltir#f,t sûr ûn i,itervolle· est continue
sur cet intervalle.
Nous verrons dans le théorème 25.80 que la réciproque est vraie sur un intervalle fermé et
borné.
Comme pour la continuité, nous avons, à l'aide des suites, une autre caractérisation de la
continuité uniforme.
Proposition 25.'78. Une Jonction f définie sur un intervalle 1 à . ~ dattM K .elit uni~
formément continue, si et seuleµieµt si pour toutes suites fXn.)nzo et {!ln)nzo de I telles que
lim (Xn -yn} = o, on a lim (f(xfl,c) - f(yn,)) ,,; e.
n-H-oo •. n➔ +oo ' .
PREUVE. Supposons la fonction f uniformément continue. Si e E lî';_ est fixé, il existe TJ > 0
tel que si lx-yl < TJ, alors lf(x)-f(y)I < e. Soient (xnln2:o et (Ynln2:o deux suites de I telles que
lim (xn -Ynl = O. Pour TJ > 0, il existe N EN tel que pour tout n ~ N, lxn -Ynl < TJ. Nous
n--1+oo
avons dans ce cas lf(xn) - f(ynll < e pour tout n ~ N c'est-à-dire lim (f(xn) - f(yn)l = O.
n--1+oo
Afin de prouver la réciproque, supposons que f n'est pas uniformément continue sur I,
c'est-à-dire qu'il existe e0 E R';_ tel que, pour tout TJ > 0 il existe x et y dans I, vérifiant
lx -yl < TJ et lf(x) - f(y)I ~ eo. En donnant successivement à T] les valeurs 1/(n + 1), quand
n décrit N, on prouve l'existence de deux suites (xnln>o et (Ynln>o vérifiant pour tout n EN
les inégalités lxn -ynl < n:l et lf(xn) - f(yn)I ~ eo. - -
La première inégalité montre que lim (xn - Ynl = 0, alors que la seconde contredit le
n-->+oo
fait que lim f(xn) - f(yn) = 0; ce qui prouve la réciproque par contraposition. ■
n--1+oo

EXEMPLE 25.79. Montrons que la fonction f: R ---, R définie par f(t) = t 2 n'est pas
uniformément continue sur R
► Posons Xn = vnTI et Yn = y'rl. On voit facilement que lim (Xn - Ynl = 0 alors
n---t+oo
que lim f(xnl - f(yn) = n + 1 - n = 1 n'est pas nulle. On peut affirmer à l'aide de la
n----++oo
proposition 25.78 ci-dessus que la fonction f n'est pas uniformément continue. On invite le
lecteur à donner une autre preuve, directe, de ce résultat.
717

~ f i î i j i5:8tk{~~de\ft~'1~ ctè
continuité· unifôrmi).
:Scitfj'nefonétio'I!, àyol(hûr:s40/l,fJ K.{lêftniêet continue sur lè segnîtntïa;bJ. Aliirs f est rJl
Cl)
iriîfonnê11ient œnfinue:iur f4;2bt . .. .. ;:l

i::
0
PREUVE. Nous allons montrer le théorème par l'absurde. Supposons que f ne soit pas uni- (.)
rJl
formément continue sur [a, b]. Il existe alors t:o Elit;. tel que pour tout T] > 0, il existe x et 1J
dans [a, b] tels que lx - YI < T] et lf(x) - f(y)I 2 t:o. En prenant T] = n~l pour n E N, on a ~
~
l'existence de Xn et 1Jn vérifiant lxn -Ynl < n~l et lf(xn) - f(yn)I 2 Eo. ..s
rJl
La suite (xnln2o étant bornée, on peut en extraire une suite convergente (xnk)JQo, de j
limite t Comme la limite de Xnk - 1Jnk est égale à zéro quand k tend vers l'infini, la suite in
"1
(Ynk )JQo converge aussi vers t Mais par continuité de f, nous savons que les suites (f(xnk )lkEN ..d
et (f(y~)lkEN tendent vers f(C). Ceci contredit l'inégalité lf(xnl - f(yn)I 2 t:o à partir d'un ü
certain rang. ■

Test 25.30. Test 25.31.


Soit fla fonction définie sur R* par f(t) = 1/t. Soit f une fonction définie sur R à valeurs dans
Etudier la continuité uniforme de f sur les in- 1K. Les assertions suivantes sont-elles vraies si f
tervalles ci-après. est supposée uniformément continue ?
1. JO, +oo[. 1. f 2 est uniformément continue.
2. [a, +oo[ où a> O. 2. lfl est uniformément continue.

3. JO, bJ où b > O. 3. lim f(t) est finie.


t-l+oo

Test 25.32. Test 25.33.


Soient f et g deux fonctions définies sur R à va- Soient f et g deux fonctions de R dans R. On
leurs dans 1K. On suppose f et g uniformément suppose g of uniformément continue sur R. Que
continues. Que peut-on dire des affirmations peut-on dire des assertions suivantes?
suivantes?
1. Le produit fg est une fonction uniformément 1. L'une des deux fonctions est continue sur R.
continue sur R.
2. L'une des deux fonctions est uniformément
2. La somme f + g est uniformément continue
continue sur R.
sur R.
3. Si f est à valeurs dans R, alors g o f est uni- 3. Les deux fonctions sont uniformément conti-
formément continue. nues sur R.

IV. COMPARAISON DES FONCTIONS

Nous introduisons dans cette partie des définitions et une terminologie qui vont s'avérer être
d'une utilisation permanente dans tout le cours d'analyse. Il est très important de les ap-
prendre et de les manipuler suffisamment pour qu'elles deviennent intuitives.

IV.1. La domination des fonctions au voisinage d'un point


On se donne dans cette partie une partie A de lR et un point a adhérent à A. On note
§ l'ensemble des fonctions définies dans A et à valeurs dans 1K = lR ou C On note Y(a)
l'ensemble des intervalles ouverts contenant a.
718

Définition 25.81. Soient f et g deux fonctions de §. On dit que dit que f est dominée
par g au point a lorsqu'il existe un élément I E Y(a) et un réel ex> 0 tels que

Vx E In A, lf(x)I ~ cxlg(x)I.

On note alors f ~a g, ou g ~a f.

EXEMPLE 25.82.
► La fonction nulle est dominée par toute fonction de §.
► Si f E § est dominée par la fonction nulle au point a, il existe un intervalle I E Y (a) tel
que f est nulle sur I.
► Plus généralement, si f, g sont dans§ et vérifient f ~a (g), il existe I E Y(a) tel que si
x E In A et g(x) = 0, alors f(x) = O.
► Soit A = lR et a = O. Alors si f(x) = x 2 et g(x) = x, f ~o g. En effet, lx 2 1 :::; lxl si
x E] - 1, 1[.
► Soit A= lR"t- et a= O. Alors si f(x) = 1/x et g(x) = 1/x 2 , f ~o g. En effet, 1/x ~ 1/x2 si
x E]-1, l[nlR"t-.
► Soit A = lR et a = O. Alors si f et g sont définies par f(x) = 0 si x ~ 0 et f(x) = x si
x 2: 0, et g (x) = 0 si x ) 0 et g (x) = x si x S: 0, alors f ~ a g et f 'if, a g.

Autres formulations
1) Conformément à ce que nous avons déjà remarqué pour les limites et la continuité,
on peut donner des formulations équivalentes de la définition 25.81 en utilisant la forme
explicite des intervalles. Par exemple, f ~a g si et seulement si il existe ex > 0, T] > 0,
et E > 0 tels que six E A vérifie lx - al < T], alors lf(x)I :::; cxlg(x)I.
2) Il est aussi toujours possible de choisir arbitrairement des inégalités strictes ou des
inégalités larges, sauf pour la dernière d'entre-elles. Par exemple, f =;(a g si et seulement
si il existe ex> 0, T] :::; 0 et E ) 0 tels que six E A vérifie lx-al ~ ex, alors lf(x)I :::; cxlg(x)I.

La première conséquence de la définition est une simple remarque.


Propôsitfon 25.83: I,a relàtîon ile ]irlpondémnce "est réflexive et tro,V,SitifJé,
PREUVE. La réflexivité est évidente. Pour voir la transitivité, considérons des fonctions f, g, h
de § telles que f ~a g et g ~a h. Alors il existe deux intervalles ouverts I et J et des réels
ex > 0 et 13 > 0 tels que
Vx E In A, lf(x)I ~ cxlg(x)I et Vx E Jn A, lg(x)I ~ /31h(x)I.
Donc pour tout x E (I n J) n A, lf(x)I :::; cx/31h(x)I, ce qui montre que f =;<a h puisque
In JE Y(a). ■

Définition 25.84. (Notation de Landau). Lorsque f =;<a g, on note f = Oa(g), ou


simplement f = O(g) s'il n'y a pas d'ambiguité. Il faut prendre garde au fait que cette
notation est un peu trompeuse. En effet, il serait plus correct de noter Oa(g) l'ensemble de
toutes les fonctions qui sont dominées par g, et d'écrire f E Oa(g). Cependant il est d'usage
de remplacer le signe E par le signe = dans la notation précédente, et l'expérience montre
que cette convention simplifie beaucoup les énoncés. Mais on prendra garde au début aux
nombreuses sources de confusion qu'elle entraîne.
719

Donnons un premier exemple de manipulation de la notation de Landau.

PREUVE. Montrons 1). Il existe des intervalles I et J de "f/ (a) tels que

Vx E In A lf(x)I ~ cxlh(x)I et Vx E Jn A lg(x)I ~ 131h(x)I.


tri
Il en résulte que pour tout x E (In J)nA, lf(x)+g(x)I:,:; (cx+l3)1h(x)I (inégalité triangulaire), C"1

ce qui montre que f + g = Üa{h). Le point 2) est une simple vérification. ..d
■ ü

Dans la proposition précédente, nous avons f = O(h), g = O(h), et f + g = O{h). On


peut donc écrire O(h) + O(h) = O{h). Ceci peut paraître un peu curieux, mais c'est légitime.
Il faut en tout cas réfléchir au sens de la notation de Landau pour l'utiliser correctement.

Sommes de 0
On prendra garde au fait que si f = O(h) et g = O(k), alors il est faux d'en déduire
que O(f + g) = O{h + k). En effet, si par exemple A = lR. et a = 0, on peut choisir
f(x) = g(x) = x et h{x) = 1 et k{x) = -1. On a bien f = O{h) et g = O{k), mais
(f + g)(x) = lx et {h+ k)(x) = 0, et il est bien sûr faux de dire que f + g = O(h+ k).

Voici maintenant une proposition sur les produits, qui est une simple vérification.

La notation de Landau est un peu ambigüe, mais très utile. On lui adjoint en général un
autre abus de notation, qui la rend encore plus pratique.
Notation. On désigne en général une fonction par son expression explicite, écrivant ainsi
x 2 au lieu de x H x 2 . De plus les domaines de définition sont souvent sous-entendus. Par
exemple, on écrit simplement x 2 = 0 0 {x) ou 1/x = 0 0 (1/x 2 ).

EXEMPLE 25.87. En utilisant la définition des puissances fractionnaires vue dans la partie
111.3, on peut écrire, pour tous r et s rationnels, xr = 0 0 (x•) si r :;:;, s 2: 0 et xr =
O 0 (x 5 ) si s ~ r :S O.

Terminons cette partie par une remarque sur les limites, de démonstration immédiate par
encadrement.

PtÔ~l~i)s~8'r~t:i;ent f;:g ~rts:f:; OnrsuPwstt}que.f = Oafg). S( li~Jg(1<;} :;z 0,


al9rs lilll"''"H'ffxl = o . ·
720

Test 25.34. Test 25.36.


Si f = 0 0 (9), peut-on dire que -f = 0 0 (9), Peut-on dire que si f et g sont dans §, avec f
lfl = Oa(g), f = Oa(lgl), lfl = Oa(lgl)? majorée et g minorée, alors f = 0 0 (9)?
Test 25.35. Test 25.37.
Si A= ffi. et a E ffi.*, et sin EN, peut-on dire Même question si l'on suppose que g est mino-
qu'une fonction polynôme est toujours dominée rée par un réel strictement positif.
par la fonction x H xn, au point a?

IV.2. La prépondérance des fonctions au voisinage d'un point


Définition 25.89. Soient f et 9 deux fonctions de§. On dit que dit que f est négligeable
devant 9 au point a, ou que 9 est prépondérante devant f au point a, lorsque pour tout réel
E > 0, il existe I E Y (a) tel que

't/x E In A, lf(x)I ~ El9(x)I.

On note alors f «a 9, ou 9 »a f. On utilise aussi la notation de Landau f = 0 0 (9), ou


simplement f = 0(9) s'il n'y a pas d'ambiguïté.

Là encore, il existe d'autres formulations explicites de cette définition, sur le même modèle
que pour la relation de domination.

EXEMPLE 25.90.
► La fonction nulle est négligeable devant toute fonction.
► Une fonction de § négligeable devant la fonction nulle est nulle sur l'intersection In A,
pour un intervalle I E Y (a).
► Soit A= lR et a= 0, et soit (r,s) E «:;)!2. Si f{x) = xr et 9(x) = xS, avec 0 ~ s < r, alors
f = 0 0 (9). On écrit aussi, par abus de notation, xr = o 0 (x 5 ).
► Soit A= JR~ et a= 0, et soit (r, s) E «:)!2. Si f(x) = xr et 9(x) = xS, avec s < r ~ 0, alors
f ~o 9, ce qu'on écrit aussi xr = o 0 (x 5 ).
► Soit f E §. Dire que f = Oa(l) équivaut à dire que limx-,a f(x) = O.

Contrairement à la relation de domination, on voit que la relation de prépondérance n'est


bien sûr pas réflexive. Mais on a encore la propriété suivante.

Proposition 25.91. La relation de prépondérflnèe es(. ~&Je,,

PREUVE. Soient f, 9 eth des fonctions de§ telles que f = Oa(9) et 9 = Oa(h). Soit E >0
fixé. Alors il existe I et J dans Y (a) tels que

't/x E In A, lf(xll ~ v'El9(xll et Vx E JnA, l9(xll ~ v'E lh(x)I.

Il en résulte donc que 't/x E (In J) n A, lf(x)I ~ E lh(x)I. On a donc montré que f = 0 {h). 0 ■

Passons aux propriétés opératoires de la relation de prépondérance.


721

Pri>pŒ1Îtron 25.1.n.;; S~t>f,g/h.;lG dàns §, et soit ;\ E IC; 0ft. ri. ies propriété$ SY,i,11antes.:
1.) .rif ::::00 (gl, alorsf::;, O~{:g);
+
2) si f= Où{h.} et g =()a,(h.), alors f g = Oa,(h};
3) si f= Où{liJ; alors M=dù{h.);
4) sif = ô~(g) dg= 0 0 fh), t1lôrs f = Oa(h);
5) si f = 0 0 (9) et. g =0 0 (h.), alors f = Oa(h);
6) si f = 0 0 (h.) et g = Oti(k), alors fg = o.. (hk).

PREUVE. Nous allons par exemple montrer la propriété 5). Soit t: > 0 fixé. Comme f = 0 0 (9),
il existe un intervalle I E Y(u) et un réel <X> 0 tels que Vx E In A, lf(x)I :S <Xlg(x)I. Comme
g = 0 0 (h), il existe un intervalle JE Y(u) tel que
E
Vx E In A, lg(x)I ~ -lh(x)I
(X

et donc Vx E (I n J) n A, lf(x)I ~ t: lh(x)I, ce qui montre que f = oa(h). Les autres preuves
sont du même type et laissées en exercice. ■

Ces propriétés sont d'utilisation constante, et font l'intérêt de la notation de Landau. Nous
les retrouverons par exemple au chapitre 29 sur les développements limités. Il est conseillé de
donner toutes les démonstrations, à titre d'exercice.
Il existe plusieurs manières équivalentes de traduire la relation de prépondérance. Nous en
donnons une pour terminer, qui est souvent utile dans la pratique.

Pl.'oposition·u.93. ···Soientt ét g ilew/Jonctii>ns dè§} .Atorsf ==.tfJlfitstét·ttèulèinent


,si tl ~ste ?ln ~e'1"11alk l;E 1"(0.) et <4ne fonctiQn: Tl :) n ~....+• K., de lirtJ.i# !1,U{lilr1n •• ,telle
qudf{x} ==11(xJg(i)pourt&utie lriA. .· . ·. . . . : .' .

PREUVE. La condition est suffisante. En effet, s'il existe une fonction T] vérifiant les conditions
énoncées, et si t: > 0 est fixé, il existe un intervalle J contenu dans I et contenant a tel que
ITJ(x)I < t: pour x E J n A. Il en résulte que lf(x)I < t:lg(x)I pour tout x E J n A, ce qui prouve
que f = Oa(g).
Réciproquement, si f = 0 0 (9), on note d'abord qu'il existe un intervalle I E Y(a) tel que
lf(x)I :S lg(x)I pour x E In A. En particulier, six E InA et g(x) = 0, alors f(x) = O. On peut
donc définir une fonction Tl: In A-) JI{ par TJ(X) = (f(x))/(g(x)) si g(x) f:. 0, et TJ(x) = 0 si
g(x) = O. Cette fonction vérifie clairement f(x) = TJ(x)g(x) six E In A.
Soit maintenant t: > 0 fixé. Alors par définition il existe un intervalle J E Y(u) tel que
lf(x)I :S t:lg(x)I pour x E J n A, ce qui entraîne que ITJ(x)I :S t: six E (In J) n A. Ceci montre
que limx-->a TJ(X) = 0, et termine la preuve. ■

Test 25.38. Test 25.40.


Pourquoi peut-on parler de la limite de TJ en a La relation de prépondérance est-elle symé-
dans la proposition précédente? trique?
Test 25.39. Test 25.41.
2
Si f(x) = o 0 (x), a-t-on f(x) = O(x )? Si f E §, que veut dire f(x) - e= Oa(l)?
722

IV.3. L'équivalence des fonctions au voisinage d'un point


On conserve les notations de la partie précédente pour A, a, §, et 'P' (a).

Définition 25.94. Soient f et g deux fonctions de §. On dit que dit que f est équivalente
à g au point a (ou au voisinage de a) lorsque f- g = 0 0 (9). On note alors f ~a g.

EXEMPLE 25.95.
► Soit A= lR et a= O. Si f(x) = x4 et g(x) = x 6 +x4, alors f ~0 g. En effet, f(x)-g(x) = -x6
6 4
et -x = o 0 (x ) = o 0 (x 6 + x 4 ).
► Soit A= JR~ et a= O. Si f(x) = 1/x3 et g(x) = x 5 + 3x3 + 1/x + 1/x3 , alors f ~0 g. En
effet, f(x) - g(x) = -(x5 + 3x3 + 1/x) et -(x5 + 3x 3 + 1/x) = o 0 (1 /x 3 ).
► Soit A= lR et a= O. Si f(x) = 2x 4 et g(x) = x4, alors f fo g. En effet, f(x) - g(x) = x 4
et x 4 n'est pas négligeable devant x 4 en O.

Signalons une première difficulté, qui est une source d'erreurs très courante.

.\ttcnti<ln Équivalence à 0
Si une fonction f de§ est équivalente à 0, il existe un intervalle I E 'P'(a) tel que f soit
identiquement nulle sur I n A. En toute autre circonstance, il est faux de dire qu'une
fonction est équivalente à O au voisinage de a.

La proposition suivante confirme ce que l'on pouvait attendre.

Propôsîtion 25.00.· L'h[Ûivalence dèsJorwtions i,,ii,


d'tquivalènce dans l'ensemlile §.
~ism• .dê.it "tJ.lji,ii,t"wt1,fi''irdf.1i!i,oo
· · · · ·· · · · ·

PREUVE.

◊ Si f E §, alors 0 = f - f est négligeable devant f. Ceci montre que ~a est réflexive.


◊ Soient f et g deux fonctions de§ telles que f ~a g. Alors f - g = 0 0 (9), ce qui entraîne en
particulier l'existence d'un intervalle I E 'P'( a) tel que [f(x) - g(x)[ :( [g(x)[/2 pour x E In A.
On en déduit en utilisant l'égalité g = -(f - g) + f et l'inégalité triangulaire, que [g(x)I :(
[g(x)[/2+[f(x)[ et donc que [g(x)[ :( 2lf(x)I pour tout x E InA, ce qui montre que g = O 0 (f).
Mais nous avons donc f - g = 0 0 (9) et g = O 0 (f), donc g - f = 0 0 (f) d'après la proposition
25.92. Donc g ~a f, et la relation est symétrique.
o Soient f, g, h dans § telles que f ~a g et g ~a h. Alors on a d'abord g - h = 0 0 (h), et
comme f- h = (f-g) + (g- hl, d'après la proposition 25.92, pour montrer que f- h = 0 0 (h)
il suffit de montrer que f- g = 0 0 (h). Mais on sait que g = 0 0 (h) d'après le point précédent,
et comme f - g = 0 0 (9), la conclusion résulte encore de la proposition 25.92. Donc f ~ah et
la relation est transitive. ■

En raison de cette proposition, si f ~a g, on dit aussi simplement que f et g sont équivalentes


au point a ou au voisinage de a.
Nous allons maintenant voir une conséquence très importante de la relation d'équivalence
des fonctions.
723

PropO;Sition ~5.97\ .Soiem f ,et, g des. Jonctions de § telleiHJue f ~a g:. Si g,admet une
limite t aupQinf a, alor:s f admet Q/USSi.la limite t au point a. [fJ
Il)
;:l

PREUVE. Soit e > 0 fixé. Comme g admet une limite au point a, g est bornée au voisinage
de a. On peut donc trouver I E 'P'(a) et m E IR~ tel que lg(x)I ,:;; m pour x E In A. Alors t(.)

comme f - g = o a ( g), il existe un intervalle J1 E 'P' (a) tel que


f, f,
J(.)

lf(x) - g(x)I :S lmlg(x)I :S


2, n A.
Vx E J1 i::
'8
[fJ

Comme limx-rn g (x) = C, il existe un intervalle Jz E 'P' (a) tel que ~


in
f, C\I
lg(x) - Cl ,:;;
2, Vx E Jz n A. ..d
ü

Il en résulte par inégalité triangulaire que


f, f,
lf(x) - Cl ,:;; lf(x) - g(x)I + lg(x) - Cl ,:;;
2+ 2 = e
pour XE (In J1 n hl n A, ce qui prouve que limx--,a f(x) = C, ■

On peut donner d'autres formulations de la relation d'équivalence des fonctions. Par


exemple, on obtient immédiatement la proposition suivante en utilisant la proposition 25.93.

·Proposition 25.~. ~J>Îe~t f,et fJ â~f<me~ d~ f·


~fors f -<f;JI .s~iihi il
=
•ex4ste. un i:aterwlle I ii• 1".f~fe~ um f~e1n rf:~i!PiX<½:ll{ ~e/~:4tJ!ié(l:"f-11{x})g(x}
•'fKJ'Ur x E ln A; èt lim~c-4ti,ll(x} o. · ·
Nous avons donné la preuve de la proposition 25.97 en utilisant la définition directe, à
titre d'exercice de manipulation de la notion d'équivalence. Mais il est évidemment possible
de la déduire de la proposition précédente. Montrons maintenant une propriété opératoire
importante en utilisant la proposition 25.98.

:Prt>position ~5~99,. Saiem.t,g,]¾ k des fonctions de§ telles quef,,.o. h. et g:"'co. k. Alqrs
fg~nh.k.

PREUVE. En effet, on voit (par intersection) qu'il existe un intervalle I E 'P'(a) et des
fonctions E, et ri de I n A dans JK, de limite nulle en a, telles que pour tout x E I n A,
f(x) = (1 + E,(x))h(x) et g(x) = (1 +ri(x))k(x). Donc

fg(x) = (1 + (E,(x) +ri(x) + E,ri(xll)hk(x),


et limx_,a(E,(x) +ri(x) + E,ri(x)) = 0, ce qui montre l'assertion. ■

La proposition 25.98 entraîne aussi directement le corollaire suivant, d'utilisation très


fréquente.

Cor<1llaÛ'è 25400. ;· s~~n~t( et g tle~Jwi~ di§;· :dn SU'/)pQlJf!} qtt'il ~tel e: '7'(a}
tef:tpte g né s'Mntdé:pds sttr lflA;· A~s / .
724

Un autre corollaire immédiat, tout aussi important, est le suivant.

Côro1~25.J;QîS•:$~iirit]'·ehtiletJifô1ù;tîi>iis';âê'~;;~~t1:ntê8'1iIÙJX)î;dt'o.. ··.A.tor1(ü
eœiste,un inte1ivJill.èl E 't:(<i) tt:L <W,e sî ,c,EJOA.,A{x;) ..;,-0# g{x}~;O, etsif(.:x) ~ O,f{x}
et.g(xJsont'tlë1Mnie sig-ue,
On en déduit enfin une autre conséquence, par application du corollaire précédent.

Corolhûre ,~5.102,, Soiènt f et rj iJ.è~fonctioifs dé $1 /,qfi1JIJfilenteS aupoi'rl,t a. On suppose


qu'il erciste Ie. -ffa):telqueg ne s'anntslePflS $U1'lf1A. Alors
1 1
f{x,j ~a g(X)"
PREUVE. En effet, il existe un intervalle J E Y (a), J C I, tel que les fonctions f et g ne
s'annulent pas sur J. Dans ces conditions, lim f(x)/g(x)
1, et on conclut par le le corollaire 25.100. -a -a
= 1 si et seulement si lim g(x)/f(x) =

Nous avons donc vu que le produit et le quotient laissent stable la relation d'équivalence.
Une difficulté classique est qu'il n'en va pas de même pour la somme.

~ \trent ion Somme d'équivalents


Soient f, g, h, k des fonctions de §. Alors on peut avoir f ~ah et g ~a k, et pourtant
f + g fa h + k. Par exemple, si A= lR et a= 0, on choisit f(t) = 1 + t, g(t) = -1 + t
et h(t) = 1, k(t) = -1. Alors f ~0 h et g ~o k, mais (f + g)(t) = 2t n'est pas équivalent
en O à (h+ k)(t) = O.

Test 25.42. Test 25.44.


A-t-on x 1/x; x 2 3
~1 ~2 2/x ; x ~2 1/x? Montrer que si f1, ... , fn et 91, ... , 9n sont des
Test 25.43. éléments de§ tels que fi ~a 9i pour 1 :( i :( n,
alors f1 · · •fn ~a 91 · · · 9n-
Si f ~a 9, a-t-on f = 00 (9), f = 0 0 (9)?

IV.4. Comparaison des fonctions au voisinage de l'infini


On considère maintenant une partie A de lR non bornée. Alors nous avons vu que l'on peut
considérer A comme partie de IR, et que dans ce cas +oo E A si A est non majorée, et -oo E A
si A est non minorée. On note 'P'(+oo) l'ensemble des intervalles de la forme ]a,+oo[, avec
a E JR, et on note 'P'(-oo) l'ensemble des intervalles de la forme] - oo, f3[, avec f3 ER Alors
les définitions 25.81, 25.89 et 25.94 se transposent sans aucun changement en remplaçant
simplement a par +oo.
Par exemple, si f et g sont dans §, on dit que f est dominée par g au voisinage de +oo,
et on écrit f = Ü-too(g), lorsqu'il existe I E 'P'(+oo) et un réel a> 0 tels que lf(x)I ~ alg(x)I
pour tout x E An I.
Toutes les propriétés démontrées dans les trois parties précédentes demeurent vraies dans
ce contexte.
725

EXEMPLE 25.103.
► Avec l'abus de notation usuel,
1 1 rJJ
--- = Ü+oo (~), - - = O+oo ( 1). Q.l

1 +x
(
► ✓x4 + x + 1- ✓x4 - x+
1 +x
1) ~+00 1/x
x
§
§
(.)

~
Proposition 25.104. Soit A une po,rtie non majorée de IR.. On suppose que·0 1/..A, et on 0
:;::l
nt)te B z {l/x<! x' E A}, alors O E lL Soient f et g deux fonctions de A dans C. On a les ~
~
tfijuiv(lien~ S'fl,i!Jantes rJJ
j
t(x) =o+oo (g(x)) suivant A# f(l/x) = Oo(g(l/x}) suivant& ir.i
<N
f{x} = o+oo{g(x)) suivant A# f(l/x) = oo(g(l/x)) suivant B ..d
f(xJ ~-too (g(x)) suivant A # f(l/x) ~o (g(l/x)) suivant B ü

Lorsqu'on considère la partie A = N, les fonctions définies sur A sont les suites, et on
obtient ainsi les notions de suites dominantes. prépondérantes, ou équivalentes. Toutes les
propriétés démontrées dans les parties précédentes demeurent valables dans ces conditions
pour les suites.

V. EXERCICES
25.1. point xo. Comparer les deux propriétés sui-
vantes
Soit f : lR ---t C T-périodique avec T > O. Que
peut-on dire de f si lim f( t) existe?
t->+oo 1. lim(f(xo+h)-f(xo))=0
h->0
25.2.
2. lim (f(xo + h) - f(xo - h)) = 0
h->0
Soit f une fonction définie sur [0, +oo[ à valeurs
dans JK. On suppose que f est bornée et que
lim (f(t + 1) - f(t)) est finie. Montrer que
t->+oo
lim f(t)/t = lim (f(t + 1)-f(t)) 25.6.
t->+oo t->+oo

Soit f une fonction de lR dans 1K telle que


25.3.
f(x + 11) = f(x) + f(11) pour tout (x, 11) E JR 2 .

Soient k E lR et h > O. Déterminer


lim E(kt)/E(ht) où E(t) est la partie entière 1. Montrer que f est continue en 0 si et seule-
t->+oo
de t. ment si elle est continue sur lR tout entier.

25.4. 2. Montrer que f(n) = nf(l) pour tout n E z.

Déterminer toutes les fonctions continues de


3. En déduire que f(r) = rf(l) pour tout r E Q.
[0, 1] dans lR vérifiant pour tout t E [0, 1]
f(t 2 ) = f(t).
4. Prouver que si f est continue, alors f(t) =
25.5. tf(l) pour tout t E JR.

Soit f une fonction définie au voisinage d'un


726

25.7. Montrer qu'il existe c E [a, b] tel que

Soit f une fonction continue de [a, b] dans f(c) = g(c).


R. Montrer que pour tout a E [O, 1] il existe
c E [a, b] tel que
f(c) = af(a) + (1 - a)f(b)
25.10.

Soit f une fonction continue de R dans 1K. Mon-


25.8. trer que si f est périodique, alors elle est uni-
formément continue sur R
Soit f une application réelle, continue sur un
segment I telle que I C f(I). Montrer qu'il 25.11.
existe to E I tel que f(to) = ta.
Soit f une fonction uniformément continue de
25.9. R dans 1K. Montrer qu'il existe a ER et b ER
tel que pour tout t E R,
Soient f et g deux fonctions continues de [a, b]
dans R+ telles que lf(t)I :S alti+ b.

min f. max f = min g. max g


[u,b] [u,b] [u,b] [u,b]
Chapitre 26
LES FONCTIONS DÉRIVABLES

E calcul différentiel et intégral, dont seul l'aspect différentiel nous concerne dans ce cha-

L pitre, est né des travaux indépendants de Gottfried Wilhelm Leibniz et Isaac Newton
au XVIIe siècle. La revendication de la paternité de cette nouvelle théorie fut l'objet de
vives polémiques entre les deux hommes et cette controverse affecta beaucoup Leibniz sur la
fin de sa vie.
Entre 1664 et 1671, Newton travaille sur son ouvrage Methodus fluxionum et serierum
infiniturum qui ne sera publié qu'après sa mort en 17361 . Il y introduit notamment ce qu'il
appelle le calcul des fluxions :

ment fluentes, ces quantités que je considère


comme augmentées graduellement et indéfi-
niment, je les représenterai par les dernières
lettres de l'alphabet v, x, y et z pour les dis-
tinguer des autres quantités qui, dans les
équations, sont considérées comme connues
et déterminées, qu'on représente par les
lettres initiales a, b, c, etc., je représenterai
par les mêmes dernières lettres surmontées
d'un point v, x, ... ,y et i les vitesses dont
Isaac Newton (1642-1727) les fluentes sont augmentées par le mouve-
ment qui les produit, et, que par conséquent,
« J'appellerai quantités fluentes, ou simple- on peut appeler fluxions ... »

Ainsi pour Newton les quantités fluentes x, y sont des fonctions soumises à des variations,
à des changements, et les fluxions x, ... ,y de ces fluentes mesurent leurs variations.
Il s'intéresse un peu plus loin dans l'ouvrage au problème inverse de la détermination des
fluentes x, y, etc. à partir de la connaissance des fluxions x, y, etc. C'est le problème réciproque
du calcul différentiel, à savoir le calcul intégral que nous avons mentionné ci-dessus et que
nous aborderons dans le chapitre suivant.
Leibniz publie pour là première fois ses travaux sur le calcul différentiel en 1684, dans les
Acta eruditorum sous le titre de Nova methodus pro maximis et minimis, itemque tangentibus,
qua nec irrationales quantitates moratur que l'on peut traduire par une nouvelle méthode pour
les maxima et les minima, aussi bien pour les tangentes, laquelle peut aussi être appliquée aux
quantités irrationnelles. Cependant, de nombreuses notes manuscrites produites sur les dix
années antérieures contiennent déjà ses idées sur la question.
Le point de départ de Leibniz sur ce sujet est plutôt celui des séries de nombres, pour
lesquelles il calcule les différences des termes successifs qu'il va sommer. Cette idée présente
dans son De arte combinatoria de 1666 repose sur sa vision philosophique du monde qui

1
C'est dans son fameux ouvrage Philosophiae naturalis principia mathematica que Newton publiera en 1687 sa
théorie du calcul différentiel et intégral.
728

consiste à vouloir relier le tout et la partie2. Par exemple la série de nombres 1, 5, 9, 15, 22, 30
donne lieu aux différences de termes successifs 4, 4, 6, 7, 8 dont la somme 4 +4 + 6 + 7 + 8 = 29
est évidemment la différence entre le dernier et le premier terme de la série initiale, à savoir
30 - 1. À partir de cette idée qu'il étendit aux séries infinies de nombres, puis au « cas d'une
variable continue», il obtint son calcul différentiel et intégral.

Notons que la relation 4 + 4 + 6 + 7 + 8 =


30 - 1 n'est autre qu'une version discrète
et finie du fameux théorème fondamental
du calcul différentiel et intégral, que nous
verrons dans le chapitre consacré aux fonc-
tions intégrables. Ce théorème relie dérivées
et intégrales, c'est-à-dire différences infini-
tésimales et sommation de toutes ces diffé-
rences3par l'expression

f{b) - f(u) = f f(x)dx.


Gottfried Wilhelm Leibniz (1646-1716)

C'est Leibniz qui introduisit en particulier les notations dx, dy et ~~, très intuitives et
très utilisées par les physiciens.
Après ce bref aperçu historique, voici en termes plus usuels une idée de ce que peut être la
notion centrale du calcul différentiel, à savoir celle de dérivée. Si un automobiliste se rend de
Marseille à Paris en huit heures, sachant que la distance est d'environ 800 kilomètres, il peut
dire que sa vitesse aura été de 100 km/h. Cette vitesse correspond au rapport distance/durée.
Mais évidemment, cette vitesse n'a peut-être pas été constante tout le long du trajet. Donc,
pour être plus précis, ces 100 km/h ne représentent en fait qu'une moyenne, c'est sa vitesse
moyenne entre Marseille et Paris. Si maintenant il fait un relevé régulier de ses positions en
fonction du temps, il peut par exemple se rendre compte qu'entre Avignon et Valence, sa
vitesse moyenne était de 120 km/h, alors qu'entre Lyon et Mâcon elle a été de 90 km/h. S'il
veut savoir quelle était sa vitesse à 9 heures du matin tandis qu'il passait à Avignon, sachant
qu'il a parcouru entre 9 heures et 9 heures et 1 minute la distance de 1, 5 km, il en déduira
que sa vitesse moyenne sur cet intervalle de temps était de 90 km/h. Est-ce que cela lui donne
sa vitesse à 9 heures exactement? Non, bien entendu car en une minute il a pu grandement
faire varier sa vitesse. Mais s'il sait qu'il a parcouru 30 mètres, entre 9 heures et 9 heures et
1 seconde, il pourra dire, avec une assez grande précision, que sa vitesse à 9 heures était de
108 km/h, même si en réalité ce nombre n'indique que sa vitesse moyenne entre 9 heures et
9 heures et 1 seconde. La question est de définir sa vitesse à l'instant précis où sa montre
indiquait 9 heures. Pour désigner ce nombre idéal, on parle de vitesse instantanée. Comme on
l'aura compris, cette vitesse instantanée se définit comme une limite de vitesse moyenne sur
un intervalle de temps de plus en plus court. Précisément, si d: t H d(t) désigne la distance
parcourue à l'instant t depuis le départ, cette vitesse à 9 heures va se définir comme

v( 9 ) = lim d(9 + h) - d(9).


h---lO h
C'est cette idée de limite du taux d'accroissement qui va nous donner la notion de dérivée.
Dans tous les cas, voir une dérivée comme une vitesse peut être un très bon guide.

2
Qu'il expose dans sa fameuse Monadologie (1714).
729

Avertissement. Dans ce chapitre, pour construire des exemples explicites, nous


admettrons les propriétés usuelles des fonction élémentaires, rappelées dans la
partie Bases. Ces propriétés seront démontrées au chapitre 28.

I. DÉFINITIONS GÉNÉRALES ET PREMIÈRES PROPRIÉTÉS

1.1. Dérivabilité d'une fonction d'une variable réelle


Commençons par rappeler la définition du type de parties de lR avec lesquelles nous serons
amenés à travailler.
Définition 26.1. Une partie U de lR est dite ouverte si pour tout a E U, il exister E JR~
tel que l'intervalle ]a - r, a+ r[ soit contenu dans U. On dit aussi qu'une partie ouverte est
un ouvert.

EXEMPLE 26.2. Un intervalle ouvert est ouvert au sens de cette définition. Une réunion
d'ouverts est clairement ouverte donc en particulier une réunion dïnten-alles ouwrts est un
1 ouvert.

En fait, tout ouvert de lR est la réunion disjointe d'intervalles ouverts (InlnEN mais nous ne
le montrerons pas ici. Cependant le lecteur peut systématiquement imaginer un ouvert comme
une telle réunion d'intervalles ouverts. Pour simplifier les énoncés, il peut aussi simplement
remplacer l'hypothèse U ouvert par l'hypothèse U intervalle ouvert, un peu moins générale,
mais cependant utile pour l'intuition.

Définition 26.3. Soit U un ouvert non vide de lR et soit f : U --, lR une fonction numérique
à valeurs réelles définie sur U. Si a EU, soit Ta la fonction

hH f(a+h)-f(a)_
h
La fonction Ta est définie dès que h =/= 0 et a+ h E U. Puisque U est ouvert et contient
a, son domaine de définition est donc un voisinage épointé de O. On dit que Ta est le taux
d'accroissement de f d'origine a.

Définition 26.4. Soit U un ouvert non vide de lR et soit f : U --, lR une fonction numérique
à valeurs réelles définie sur U. On dira que la fonction f est dérivable au point a E U si son
taux d'accroissement d'origine a possède une limite quand h tend vers O. Dans ce cas, cette
limite sera appelée la dérivée de f au point a, ou le nombre dérivé de f au point a, et sera
notée f'(a).

>" 0

: "f{a+1'tf =fra) ftfî+ ltéè(li} (26.1)


pourliè: V.Dans ce ê<l$l>~(:'{o:J;
730

PREUVE. Supposons d'abord f dérivable en a. Posons l = f'(a) et considérons la fonction


f: = f'(a), qui est définie, comme 'Ta, dans un voisinage épointé de O. Il est clair que
'ta -
l'équation (26.1) est satisfaite, et que e a pour limite O en O.
Réciproquement, s'il existe let f: satisfaisant (26.1), alors 'ta(h) - l = E:(h) sur V. Ceci
montre que 'ta(h) a pour limite l quand h tend vers 0, puisque limh---,o E:(h) = O. Donc f est
dérivable en a, et f'(a) = l. ■

Notons que la fonction f: peut se prolonger par O en 0, on peut donc aussi énoncer la
proposition précédente en disant que la fonction f: est définie au voisinage de 0, nulle en 0, et
continue en O.
La définition équivalente de la dérivabilité donnée par (26.1) est très commode. Nous
allons, pour en donner une autre version, utiliser à nouveau la notation de Landau que nous
avons introduite au chapitre 25.
Notation. Avec la définition précédente et la notation associée, (26.1) s'écrit de manière
équivalente

f(a + h) = f(a) + f'(a)h+ o 0 (h) ou f(x) = f(a) + f'(a)(x - a)+ o 0 (x- a).
En effet, par définition même, hf:(h) = o(h)

Test 26.1. Test 26.2.


Pour i E {1, 2, 3}, définissons la fonction fi sur Laquelle des deux fonctions f ou g est-elle né-
IR par fi(x) =xi.Pour i,j E {1,2,3}, lesquelles gligeable devant l'autre au point O si f(x) =
des neuf relations fi = o(fj) sont vraies au xln(l +x 2 ) et g(x) =x?
voisinage de O?

Proposition· 26.6. Toute Jonctimt dérivàble. èn a est oontinu"ec en a. ·

PREUVE. Si f est dérivable au point a, on a

f(a + h) = f(a) + f'(a)h+ o 0 (h)


donc par le théorème d'addition des limites limh_, 0 f(a + h) = f(a), et par conséquent la
fonction f est continue au point a. ■

Ainsi, intuitivement, si f est continue au point a, on peut dire que, pour x proche de a, f(x)
est « à peu près égal à f( a) ». Si maintenant f est dérivable au point a, cette approximation est
améliorée en ce sens que, pour x proche de a, f(x) est « à peu près égal à f(a) +f'( a)(x- a) ».
Mais il faut se garder de donner un sens trop précis à cette intuition. On ne peut pas calculer
explicitement la différence entre f(x) et f(a) + f'(a)(x - a) si on sait seulement que cette
différence est négligeable devant x - a. Nous retrouverons plus en détail ce problème dans la
suite.
Définition 26.7. Soit U un ouvert non vide de lR et soit f: U--, lR une fonction numérique
à valeurs réelles définie sur U. On dira que la fonction f est dérivable sur U si f est dérivable
en tout point a E U. Dans ce cas, la fonction

f': U--, JR, a H f'(a)

sera appelée la fonction dérivée de f, ou plus simplement la dérivée de f.


731

Notation. Comme nous l'avons vu, la dérivée d'une fonction dérivable f se note le plus sou-
vent f'. Une autre notation, plutôt utilisée dans un contexte de cinématique ou de mécanique
consiste à écrire f au lieu de f'; c'est la notation des fluxions de Newton que nous avons vue
en introduction. L'usage veut qu'on l'emploie lorsque la variable représente le temps physique.
Une autre notation, comme nous l'avons aussi déjà dit dans l'introduction, est due à Leibniz
et consiste à écrire
f'(a) =::(a).

Elle est plutôt utilisée en physique. Nous verrons un peu plus tard que cette dernière notation
est très pratique et très pertinente, mais qu'elle doit être manipulée avec précaution.

EXEMPLE 26.8.
► Toute fonction constante est dérivable sur IR. et sa dériYée est la fonction nulle puisque
pour une telle fonction le taux d'accroissement est nul en tout point.
► Pour tout n E N*, la fonction f n : IR - l R x H xn est dérivable sur IR et sa dérivée est
donnée par f~(x) = nxn-l _En effet. d"après la formule du binôme de Newton,

1 1
EXEMPLE 26.9. La fonction f: x H - est dérivable sur IR* et pour x E JR*, f'(x) = - 2 .
X X
► En effet,
1 ( 1 1) 1 4 1
'rx(h)=h x+h-x =-x(x+h) 1t-->O-x2 ·

1
EXEMPLE 26 .10. La fonction f définie sur lR par f (x) = x2 sin - si x -/- 0 et f (0) = 0 est
X
dérivable en 0, et sa dérivée est nulle.
► En effet le taux d'acroissement -r0 a clairement une limite nulle en O.

Les deux questions test suivantes reposent sur les acquis rappelés dans les bases. En par-
ticulier, elles ne peuvent être considérées comme des preuves définitives de la dérivabilité des
fonctions sin et cos. Nous y reviendrons évidemment (voir le chapitre 28).

Test 26.3. Test 26.4.


a. Rappeler la formule donnant sin ( a + b). a. Rappeler la formule donnant cos( a + b).
b. En déduire que la fonction x H sin x est dé- b. En déduire que la fonction x H cos x est dé-
rivable et que sa fonction dérivée est donnée par rivable et que sa fonction dérivée est donnée par
X H COSX. x H -sinx.

Si on représente une fonction f par son graphe, la propriété d'être dérivable en un point a
se traduit géométriquement par le fait que le graphe possède une tangente au point (a, f(a)).
Précisément, -r 0 (h) n'est autre que la pente de la droite sécante Da,lt passant par les points
( a, f( a)) et ( a+h, f(a+h)), autrement dit Da,lt passe par ( a, f( a)) et est dirigée par le vecteur
( 1, -r 0 (h)). Dire que -r 0 (h) - l f'( a) signifie que lorsque h tend vers 0, les droites sécantes D a,lt
tendent vers une position limite, à savoir la droite passant par ( a, f (a)) et dirigée par le
vecteur (1, f'(a)).
732

Sécante

FIGURE 26.1. Une sécante et une tangente au graphe

Définition 26.11. Soit I un intervalle ouvert de li, et f : I -t li. Soit a E I. On suppose f


dérivable en a. La tangente au graphe de f au point (a, f (a)) est la droite passant par ( a, f (a))
et dont un vecteur directeur est (1, f' (a)). Une équation cartésienne de cette tangente est donc

y= f'(a)(x - a)+ f(a).

Att('lltÎOll Intersection du graphe et de la tangente


«Loin» du point de contact A= (a, f(a)), une tangente peut évidemment recouper le
graphe. «Près» du point (a, f( a)) on peut être tenté de penser que la tangent ne coupe
le graphe de la fonction f qu'au point A. Il n'en est rien car évidemment si on prend
pour f une fonction linéaire, son graphe est une droite et donc graphe et tangente sont
confondus! Mais ce n'est pas le seul contre-exemple. En effet, la fonction f définie sur
li par
1
f(x) = x 2 sin - six=!= 0 et f(0) = 0
X
est dérivable en O et sa dérivée est nulle. Par conséquent son graphe a pour tangente en
(0,0) la droite des abscisses d'équation y= O. Or, dans tout intervalle] - a, a[, a> 0,
l'équation x 2 sin~ = 0 a une infinité de solutions (lesquelles?) et donc le graphe et la
tangente se coupent une infinité de fois dans tout voisinage de (0, 0). Ce type d'exemple
est cependant assez exceptionnel.

Test 26.5. Test 26.6.


Donner une équation de la tangente au graphe r
Soient le graphe de la fonction x H x 3 et D
de la fonction f définie sur lR par f(x) = x 4 en la tangente à r en ( 1, 1 ) . Déterminer les points
a=2. d'intersection de r avec D.

Définition 26.12. Une fonction f définie sur un ouvert non vide U est dite continûment
dérivable, ou encore de classe C 1 , si elle est dérivable sur U et si sa fonction dérivée f' est
continue sur U.
733

Test 26.7. Test 26.8.


Vérifier que la fonction définie sur lR par La fonction définie sur JR* par f(x) = 1/x est-
f(x) = x3 est de classe C1 sur R elle de classe C1 sur lR * ?

I.2. Extensions de la notion de dérivée


Définition 26.13. Soit f une fonction définie sur une partie A de lR et soit a E A. Suppo-
sons qu'il existe ex E lR';_ tel que [a, a+ ex[ CA (resp. ]a- ex, a) CA}. On dit alors que f est
dérivable à droite (resp. à gauche) au point a si, lorsque h --l 0 avec h > 0 {resp. h < 0),
'ta(h) a une limite réelle. On note dans ce cas f~(a) (resp. f~(a)) cette limite et on l'appelle
la dérivée à droite (resp. à gauche) de f au point a.

EXEMPLE 26.14. Considérons la fonction f définie sur l'inten-alle fermé [0, +oo[ par

f(x)=x 2 lnxsix>0 et f(0)=0.

Cette fonction est dérivable à droite en 0 puisque hln h --l 0 lorsque h --l o+.
Si f admet une dérivée à droite (resp. à gauche) au point a, le graphe de f admet au point
(a, f(a)) une demi-droite tangente; on appelle cette demi-droite une demi-tangente. On peut
encore généraliser de la manière suivante : si 't 0 (h) tend vers +oo ou -oo lorsque h --l o+, le
graphe admettra au point (a, f (a)) une tangente verticale.

EXEMPLE 26.15.
► La fonction f : lR --l JR, x H lxl est dérivable en tout point a =/- 0 mais en a = 0, elle est
seulement dérivable à droite et à gauche, sans être dérivable puisque f~(0) = 1 et f~(0) = -1.
► La fonction f: JR+ --l JR, x H y'x est dérivable en tout point x > 0 avec f'(x) = 1/2y'x.
Lorsque h --l o+, 'to(h) --l +oo et le graphe admet une tangente verticale en O.

Rappelons une définition importante.

Définition 26.16. Si A est une partie de lR, un point a E A est appelé un point intérieur à
A s'il exister E lR';_ tel que ]a - r, a+ r[ CA. En d'autres termes, un point a est intérieur
à A si et seulement si A est un voisinage de a.

Évidemment, si a est un point intérieur à


A, f est dérivable au point a si et seulement
si f est dérivable à droite et à gauche en a
et si f~ (a) = f~ (a). Si les dérivées à droite
et à gauche existent sans être égales, géo-
métriquement le graphe présentera un point 0
"anguleux" (voir la figure ci-contre).
FIGURE 26.2. Point anguleux typique : la
valeur absolue

Nous voulons maintenant définir la notion de dérivée pour des fonctions définies sur des
ensembles ayant des "points frontières", comme par exemple les intervalles fermés bornés [a, b).
Nous introduisons pour cela la définition suivante.
734

Définition 26.17. Soit A une partie de 1R; notons I l'ensemble de ses points intérieurs et

Id= {a E A 1 :lr > 0, [a, a+ r[ CA}, I 9 = {a E A 1 :lr > 0, ]a - r, a] CA}.

Supposons que A = I U Id U I 9 . Une fonction numérique f définie sur A sera dite dérivable
sur A si elle est dérivable en tout point de I, dérivable à droite en tout point de Id et
dérivable à gauche en tout point de I 9 .

L'exemple type de partie A possédant la propriété A = I U Id U I 9 est donné par les


segments [a, bl, avec a < b. Mais toute réunion disjointe de tels segments a aussi cette
propriété.

EXEMPLE 26.18. Dire que f : [a, b] -----, :IR est une fonction dérivable signifie qu'elle est
1 dérivable sur ]a, b[, dérivable à droite en a et dérivable à gauche en b.

Ici encore, la plupart du temps, les fonctions que nous aurons à considérer seront définies
sur des intervalles. La définition précédente n'est donnée que pour montrer comment formaliser
le contexte nécessaire à l'utilisation de certaines notions.

1.3. Opérations sur les dérivées

Commençons par un petit préliminaire à propos de la notation o(h) utilisée dans l'une des
définitions équivalentes de la dérivabilité. Rappelons qu'elle désigne une quantité qui est de
la forme ht:(h) avec limh---,O E(h) = O. Compte tenu des opérations sur les limites, il est alors
clair que la somme de deux telles quantités est encore de cette forme et que le produit d'une
telle quantité par une fonction bornée est encore de ce type comme cela a été montré dans le
chapitre précédent. Ceci étant, les preuves des principaux résultats concernant les opérations
sur les fonctions dérivables sont assez simples à écrire. Le lecteur qui ne se sentirait pas
encore très à l'aise avec la notation de Landau est invité à expliciter les termes o(h) dans les
démonstrations qui suivent afin d'être convaincu de leur bien fondé.

pr<)p~iti~ ~-1~- ,sùi.é,~t tJ.t ri ~f~tt,~io~ nitrnéffiû~ ~Jir1Je,s ~r:tJ,1t ~vettij~'mili


0

U deR et dt!rivaliks en n.et.L Al-àrsî+g est déri:ùabl'! ~tt et. . ...


(f:+ gy{a) =f'{a) + g'(a}.

PREUVE. Cela est immédiat si on somme les deux relations donnant la dérivabilité de f et g
au point a à savoir :

f(a + h) = f(a) + f'(a)h+ o(h) et g(a + h) = g(a) + g'(a)h+ o(h) (26.2)

puisque o(h) + o(h) = o(h). ■

Proposition 2~.~~ .$orent f et g .tJes;ftm,eti()}i/,s m'rliérîqut$ définies ê1i,r 11iiîhtttiM tùnf11ide


U deRJ dérîvâblês'ffl<î:e:u. Altirs<fg ~tâérittabl~én<t. êt"''
~ . - . ··.·
-
.
735

PREUVE. Cette fois-ci on multiplie les deux égalités de (26.2). On obtient dans ce cas que le
produit f(a + h)g(a + h) est la somme de neuf termes, soit

f(a + h)g(a + h) = f(a)g(a) + (f'(a)g(a) + f(a)g'(a)) h+ R(h),


= (f(a) + g(a))o(h) + (f'(a) + g'(a))ho(h) + f'(a)g'(a)h2 + o(h)o(h).
R(h)
Comme h 2 = o(h) et o(h)o(h) = o(h), les théorèmes classiques montrent que R(h) = o(h),
le résultat annoncé en découle. ■

'P~~tfC)~,2ût2~.i$tî~~f>dg,àesJ~ AUmériqt,es· mspectivement dtfin.îètltmrun


~v~J~1Jrt;1!idrt\J,:,~e,JltJjftt~oo11~ V~ R tels pf(Ulc:V.Si f est dérivable ena EU
et. !,fèdf~vJiklG'ert f(~f ~V; alors go f est Mriva6le en Cl et
' -0 __ -

PREUVE. Notons b = f( a). Puisque f est dérivable en a, donc continue en a, on sait que
pour h suffisamment petit, f (a+ h) sera suffisamment proche de b = f (a) pour que la quantité
g (f (a+ h)) soit bien définie (V est ouvert). Écrivant la dérivabilité de f au point a on obtient
que
g(f(a+ h)) = g(f(a) +f'(a)h+o(h)) = g(f(a) +f'(a)h+ ht: 1(h)).
Nous préférons ici expliciter le terme o(h) sous la forme ht:1 (h) car la situation est un peu
plus délicate que dans les deux résultats précédents. Si on pose k = f'(a)h + ht: 1(h), on a
k ---1 0 quand h ---1 O. Écrivant maintenant la dérivabilité de g au point b = f(a), on obtient

g(f(a + h)) = g(b) + g'(b)k + kt:2(k),


d'où en développant

g(f(a + h)) = g(f(a)) + g'(f(a))f'(a)h + R(h)


où R(h) est un terme du type o(h) pour les mêmes raisons que dans la proposition précédente
et la raison en remarquant ici de plus que, comme k ---1 0 quand h ---1 0, on a t:2(k) ---1 0 quand
h ---1 O. Le résultat en découle. ■

Lorsque nous avons présenté les différentes notations utilisées pour désigner la dérivée d'une
fonction f, nous avons mentionné que la notation !!,
due à Leibniz, était particulièrement
commode et pertinente. C'est lorsqu'il s'agit de dérivée des fonctions composées qu'elle se
révèle particulièrement efficace. Illustrons cela par un exemple. Nous voulons calculer la dérivée
de la fonction définie par f(x) = sin2x. On« sait» que la dérivée du sinus est le cosinus, donc

df , , df
- () = cos2x d ou - = 2cos2x,
d 2x dx

en écrivant de manière formelle que d(2x) = 2dx ou encore que d(2x)/dx = 2. Plus générale-
ment si u est une fonction de x, la dérivée de la fonction composée x H g(x) = (f(u(x)) sera
donnée par
dg df du
dx dudx·
736

Pro~itJ.n{\Jo i»\f U1îè fiine'tirm 'iiuméiî,fùi àé/inte'~ ùn t>iivertU'<lëltt; dtrî11oble


en 0: 6J1,,t~jle que g(a} i O. AtorsJ/9 est âérivàble,e<fia,et:

PREUVE. Cela résulte immédiatement de la proposition sur la dérivée d'une composée ap-
pliquée aux fonctions f : x H 1/x et g. ■

PREUVE. On voit d'abord par continuité que g(x) =/= 0 pour x dans un voisinage convenable
de a. En écrivant

le résultat découle immédiatement de la proposition précédente et de la formule donnant la


dérivée d'un produit de fonctions. ■

Le lecteur a déjà vu au lycée les dérivées de nombreuses fonctions usuelles dont nous
avons redonné ici quelques exemples, et les revoirdans la partie Bases du présent ouvrage.
Au chapitre 28, consacré aux fonctions élémentaires, nous détaillerons l'étude des fonctions
usuelles, et prouverons leur dérivabilité. Mais en anticipant un peu, il est utile de se familiariser
avec le tableau récapitulatif suivant.

fonction dérivée
constante 0
xn, x E :IR, n E Z* nxn-1
sin x, x E lR cosx
cosx, XE lR -sinx
tan X, x E :IR, x =/= n/2 + kn, k E Z 1 + tan2 x
expx, x E lR expx
ln x, x E JO, +oo[ l
X
x 0 , a E :IR, x E JO, +oo[ axa-1

Test 26.9. Test 26.10.


Calculer les dérivées des fonctions définies sur Calculer les dérivées des fonctions définies sur
lR suivantes : lR suivantes :
a. f(x) =3x 2 +7x-sinx; a. f(x) = ✓x 2 + 1 ;
b. g(x) =x2 sinx+x 3 expx; b. g(x) =sinx2 +xln(l +x2 );
h( _expx2 !n(l+x4 )
c. h(x) = '~J~f- C. 1
X - vl+~ .
737

I.4. Premier aperçu des dérivées d'ordre supérieur


1
Si une fonction f est dérivable sur un ouvert U de IR, on peut se demander si, à son tour,
sa fonction dérivée f' est dérivable. Si elle l'est, on dira que f est deux fois dérivable sur U
et on notera f" = (f')'. Évidemment on peut poursuivre ainsi de suite. Cette notion sera
abordée en détail au chapitre 29 qui lui sera entièrement consacré. Cela ne nous empêchera
pas d'utiliser librement ces dérivées successives, si besoin, d'ici là. Pour une fonction n-fois
dérivable, n E N, on note f, f', f", f( 3 l, • • • , f(kl, · · · f(nl les dérivées successives, dites dérivées
k-ièmes (k = 0, 1, · · · , n) de f. On a bien sûr f(nl = (f(n-ll)'.

Test 26.11. Test 26.12.


Calculer les dérivées f', f" et f( 3 l
de la fonction Calculer les dérivées f'. f" et f( 3 l de la fonction
f définie sur lR par f(x) = x 4 + 3x2 - S. f définie sur R par f(x) = x 2 expx.

On dit qu'une fonction définie sur un ouvert U est de classe Ck, avec k E N*, si elle est k
fois dérivable et si sa dérivée d'ordre k est continue sur U.

I.5. Propriétés de la dérivée résultant de propriétés de la fonction


~:~ ~ par#e ouverte U

=p~=tz,~:~{t,t~t~,âûg~ê-~-J¼:l;! Sur la
PREUVE. Supposons par exemple qu'au point c E U, f possède un minimum local (le
cas d'un maximum est analogue). Il existe dans ce cas un réel strictement positif r tel que
]c- r, c + r[ CU et tel que pour tout x E ]c - r, c + r[, on ait f(x) ~ f(c). Or f est dérivable
au point c donc f(x) = f(c) + f'(c)(x - c) + (x - c)E(x) avec E(x) --t O quand x --t c. Il en
résulte que pour tout x E]c -r, c + r[, f'(c)(x- c) + (x- c)E(x) ~ 0 et donc que
VxE]c,c+r[, f'(c)+dx)~O et VxE]c-r,c[, f'(c)+E(x)~O.
En faisant tendre x vers c, successivement par valeurs supérieures, puis par valeurs inférieures,
il en résulte que f'(c) ~ 0 et f'(c) ~ 0, donc que f'(c) = O. ■

Évidemment, on peut avoir f'(c) = 0 sans


que f ne présente en c un minimum local,
ou un maximum local. En effet, prenons
par exemple la fonction définie sur IR par
f(x) = x 3 . On a f'(O) = 0 et pourtant f ne
présente en O ni minimum local, ni maxi-
mum local, puisqu'au voisinage de 0, f n'a
FIGURE 26.3. Graphe de la fonction x >-l x 3 •
pas un signe constant (voir figure ci-contre).

Attention Points frontière


Il est essentiel dans la proposition 26.24 de supposer que U est ouvert. Par exemple
x H x sur [O, 1] est dérivable, maximale en 1 et minimale en 0, mais sa dérivée ne
s'annulle pas en ces points.
738

Test 26.13. Test 26.14.


Quels sont les points en lesquels la fonction Quels sont les points en lesquels la fonction
f( x) = x 4 + 2x 3 + 1 peut présenter un extremum f(x) = 2x 6 - 3x5 + x 3 peut présenter un extre-
local? En présente-t-elle effectivement un en mum local? En présente-t-elle effectivement un
ces points? en ces points ?

Propositi~n 26~~s. · St f. est/une fotu:tion <lérivable efcroisfafife (rest,. rlécrois~ante). srir


t1n ôuvert U de llfalors, pàur toutx EU, çn a f 1 (x} ~ 0 {resp. f'(x) ~ 0). · · ·· ·

PREUVE. Cela résulte immédiatement du fait que si une fonction est croissante (resp. dé-
croissante) son taux d'accroissement en un point quelconque est positif ou nul (resp. négatif
ou nul) et du passage à la limite dans les inégalités. ■

Là encore la réciproque est fausse comme le montre l'exemple de la fonction f(x) = tan x
définie et dérivable sur Il \ g+ kn: k E Z} dont la dérivée est f' (x) = 1 + tan2 x ? 0 et qui
1

n'est pas croissante puisque tan(n/4) = 1 > tan 'TC= O.

II. LE THÉORÈME DES ACCROISSEMENTS FINIS

Nous venons de voir un exemple de fonction dérivable, de dérivée positive, et qui pourtant n'est
pas croissante sur son domaine de définition. Ceci est dû au fait que ce domaine n'est pas un
intervalle. Sur un intervalle, en revanche, il est possible de traduire l'information locale donnée
par la dérivée en termes globaux, comme par exemple le sens de variation de la fonction. C'est
une des conséquences du théorème des accroissements finis que nous allons voir maintenant,
et qui est l'outil majeur dans ce passage du local au global.

IL 1. Le théorème de Rolle
Le théorème de Rolle est un cas particulier du du théorème fondamental des accroissements
finis, qu'il permet aussi de démontrer. Nous le voyons donc comme un lemme préliminaire,
intéressant à connaître pour lui-même.

Théorème 26.26,{Théorème de Rolle). Soit (u,b) E R2 .Boitr; {a,bJ ---fR un~


fonction continue (a,b ER, a< b). Si f est dérivable.sur Ja,b{ei si fta} =J(b), il e:,;iste
alors c E ]a, bltel que f'(c) = O. · · · ·

PREUVE. Puisque f est continue sur le segment [a, b), on sait, d'après les propriétés des
fonctions continues vues au chapitre précédent, que f est bornée sur [a, b] et y atteint ses
bornes. Donc il existe ci, Cz E [a, b] tels que

m = inftE[a,bJ f(t) = f(c,) et M = sup f(t) = f(cz).


tE[a,b]

Si f est constante le théorème énoncé est trivial puisque f' est identiquement nulle sur] a, b [. Si
maintenant f n'est pas constante, on am< Met donc, puisque f(u) = f(b), nécessairement
l'un au moins des deux nombres ci, i E {1, 2}, appartient à l'intervalle ouvert ]a, b[. Soit c ce
nombre; on sait alors par la proposition 26.24 que f'(c) = O. ■

On notera que le fait que U soit un intervalle ouvert est crucial dans la preuve précédente.
739

Géométriquement, cela signifie que sous


les hypothèses du théorème, nécessairement
l'une des tangentes au graphe de la fonction
f doit être horizontale (voir figure ci-contre).
Test 26.15.
Montrer que les hypothèses sont nécessaires
dans le théorème de Rolle, c'est-à-dire que la
conclusion portant sur l'existence d'un point c
a tel que f'(c) = 0 cesse d'être valide dès lors que
l'on est dans l'une des situations suivantes.

a. f(a) ,6 f(b).
f(a) = f(b)
b. f n·est pas continue en un point de [a, b].

FIGURE 26.4. Tangente horizontale c. f n·est pas dérivable en un point de ]a, b[.

II.2. Le théorème des accroissements finis


Thêorème 26.27. (Théorème des
acç,,-oi$sements finis). Soit (à, b l E R2, a < b. Soit
pour a,b Eli, <l <¼>, f t{o,bl ➔ li. 'll!lif!;/rtncf;go11. éômimi-t'sîlr{a,:bJ,.tlémJiJIJle sur ]a, b[.
On a alQ~,:·_:~st~~?~f~ak:'ù:,:i~t{1~k ~~,~\?\/'-: ,i~- ;y,-;:•
1) Égalit~ d~skcê~iJê~~s"fJtits\
' " t~ -~, ,,•" ~-: --
+. __ ',
f~e ,c ·té]a'"b{.te{~e
',-c ' - - <-,_:_ ',_ ; " ' - -- - ,_ ,- , , •;_ - --.- - -a_

. ..

2) lnéqâ,litt tl.e~ âeçro46emen,tp finÙ! :•.sï en Qutre il existe des réels Tt\ et M.tels. fJUt!,~ Pf)Uf
touh~J.1,t,f) iin ait~•~ f'(~} ~ M,·/.ÛO!f's . .. . ' .

jn(bL nt is.; f(b}-'- f{ aJ ~ M{b .;.. a).


Br,,. poiiiêttl'îer ~ pour toutt E }à, b[, lf1(t )1 ~ ·M, alors

lf{b}-f{a}I ~ M{b - a).

On a. donc la majoration

• ~f(b}...,.f(a}! ~- .sup !f'(t)l{b-a). (26.3)


·,, ·tehl;bl '

PREUVE. La preuve de l'inégalité des accroissements finis est immédiate à partir de l'égalité
des accroissements finis. Nous avons donc seulement à montrer cette égalité. Pour cela nous
allons nous ramener au théorème de Rolle par l'introduction d'une fonction auxiliaire bien
choisie. Posons à cet effet, pour t E [a, b],

cp(t) = f(t) - f(a) + k(t- a), k ER

Quelle que soit la valeur de la constante k, cette fonction cl> est continue sur [a, b] et dérivable
sur ] a, b [, par les résultats généraux sur les opérations sur les fonctions continues et dérivables,
et vérifie cp( a) = O. Maintenant, on peut choisir k de sorte que cp(b) = 0, à savoir k = f(a~=:(bl.
740

Nous sommes donc dans les conditions d'application du théorème de Rolle et par conséquent,
il existe c E]a, b[ vérifiant cp'(c) = 0, c'est-à-dire f'(c) + k = 0, ou encore

Géométriquement le théorème de Rolle s'in-


terprétait comme l'existence d'une tangente
horizontale. L'égalité des accroissements fi-
nis s'interprète comme l'existence d'une
tangente parallèle à la corde joignant les
points (a, f(a)) et (b, f(b)) (voir la figure
ci-contre). Le théorème de Rolle en est un
cas particulier.
L'interprétation de la dérivée en termes de
vitesse rend intuitive l'inégalité des accrois-
sements finis : si on ne va pas vite pendant
un temps donné, on ne va pas loin. FIGURE 26.5. Tangente parallèle à la corde

II.3. Des propriétés des dérivées aux propriétés des fonctions


Le théorème des accroissements finis permet d'obtenir des renseignements sur une fonction
définie et dérivable sur un intervalle, connaissant des informations sur sa dérivée. Typiquement,
si sa dérivée est nulle, elle est constante ou, si sa dérivée est positive, elle est croissante.

P1'f>pasit\Ôll26.~~;.·$~ l.11,~inte~le nôn/1:#de•·•~f(iJt;rl'.k,,~jp~ÎP.'4.djri~.~~kJ


dans• I .. Si f' =0,. ale.rsf èst wnsïante~ Or,,·a •do.nt :e~ fei,t l'&:{ui:~ir.œ'{. egt constante•là. . ~
seulement<si f' =O. · ·· · · · ·· · · ·
PREUVE. En effet si a, b E I, avec a < b, alors [a, b] C I car I est un intervalle. Puisque
f est dérivable sur I, les hypothèses du théorème des accroissements finis sont satisfaites : f
est continue sur [a, b] et dérivable sur ]a, b[. Comme f' est identiquement nulle, on a d'après
l'inégalité des accroissements finis (26.3), f(b) - f(a) = O. On en déduit que f est constante
dans I en fixant l'un des termes. ■

.\ttC'lltim1 Faux si f n'est pas définie sur un intervalle


Si f est définie sur une partie qui n'est pas un intervalle et si f est dérivable de dérivée
identiquement nulle, f n'est pas forcément constante. En effet il suffit par exemple de
prendre la fonction définie sur ]0, 1[ U ]1, 2[ et qui vaut 0 sur ]0, 1[ et 1 sur ]1, 2[ pour
avoir un contre-exemple.
741

Test 26.16. fonction t H (1 + t 2 )f(t)).


Montrer que les seules fonctions t H f(t) défi- Test 26.17.
nies et dérivables sur IR. qui vérifient, pour tout Quelles sont les fonctions t H f(t) définies et
t E IR., dérivables sur IR. vérifiant
(1 + t 2 )f 1 (t) + 2tf(t) = 0
tf'(t) - f(t) = 0
sont les fonctions de la forme t H ~ où C
est une constante réelle quelconque (dériver la pour tout t E IR.?

P~tSsltion;·26.29. ·Soient I un intervalle. non vide et f : I -¼ lR une fonction dérivable.


lJ Si pour toutt E I, .on a f'(t) .~ 0 (resp. f'(t) ~ 0) alors la fonction f est croissante (resp.
décroissante} sùr I. ·
'l}Sipour foutt E I, on a f'(t) > 0 (resp. f'(t) < OJ alors la fonction f est strictement
croissante (resp. strictement décroissante) sur I.

PREUVE. Comme dans la proposition précédente, l'égalité des accroissements finis s'ap-
plique sur tout intervalle [a, bl, a < b étant deux points quelconques de I, et donc le
taux d'accroissement de f entre a et b, c'est-à-dire f(b~=~al, est du signe de f'. Le résultat
en découle. ■

Grâce à ce résultat, on a un outil pour étudier les variations d'une fonction dérivable,
c'est-à-dire pour déterminer sur quelle partie de son ensemble de définition elle est croissante
et sur quelle partie elle est décroissante.

EXEMPLE 26.30. La fonction f: x H x 2 , définie et dérivable sur JR., a pour dérivée f'(x) =
2x, qui est négative sur] - oo, 0] et positive sur (0, +oo[. Donc la fonction f est décroissante
sur ] - oo, 0] et croissante sur (0, +oo[.

Test 26.18. Test 26.19.


Étudier les variations de la fonction définie sur Étudier les variations de la fonction définie sur
IR. par IR. par
f(x) = x4 + 2x 3 - 2x + 1. x3
f(x) = -2-1·
X -

.\tt c11ti011 Réciproques


Compte tenu de la proposition 26.25, si f est définie et dérivable sur un intervalle, f est
croissante (resp. décroissante) si et seulement si f' )', 0 (resp. f' ::::; 0).
En revanche, pour le cas strictement croissant (resp. décroissant), on n'a pas l'équivalent
de la proposition 26.25 car le passage à la limite dans les inégalités strictes ne donne
en général que des inégalités larges. Ainsi la fonction définie sur lR. par f(x) = x 3 est
strictement croissante alors que sa dérivée s'annule en 0 et donc ne reste pas strictement
positive sur lR..
Corollaire 26.31. Sorentl un inte~e uon vide ~ f:l.-+ R 'âr,,èfoottwn dérit1tibW. tk).1.1,t
la.1'érivéee$t strictement pPsiti:ve(ou str:it;temeut it~titk} siit t: AZr,rs:f(Il ·êst.J11, întêf7i,itt~;
f~t une bijection del surf(I}et sà bijection réc.ip,;oqy,eJ-1 e,t dirivabk ;,urf(Il, de #rivée
donnée pàr . .. . . . .. .. .. .
'-f)·., . . 1
(f. =; f' 0 f~ 1 •

PREUVE. En effet, d'après la proposition précédente, sous l'hypothèse faite, f est strictement
monotone donc injective. Comme f est dérivable, elle est continue et donc (voir le chapitre 25
partie III.2) f(I) est un intervalle et f est bijective de I sur l'intervalle f(I), et sa réciproque
est continue.
Maintenant, si b = f(a) E f(I), alors pour tout 1J = f(x) E f(I), on a

f- 1 (y)-f-1 (b) x-a


(26.4)
y-b f(x) - f(a)"

Or quand 1J tend 4 vers b, par continuité de f- 1 au point b, on a f- 1 (y) -+ b, c'est-à-dire


x-+ a et donc, puisque f est dérivable au point a et en vertu de (26.4), on obtient

Définition 26.32. Soit f : I -+ f(I) une application bijective d'un intervalle de lR sur son
image. On dit que f est un difféomorphisme si f est dérivable ainsi que sa bijection réciproque.
On dit que f est un C 1 -difféomorphisme si f et f- 1 sont de classe C 1 .

D'après le résultat précédent, une fonction dérivable sur un intervalle I de JR, dont la
dérivée ne s'annule pas et garde un signe constant, est un difféomorphisme de I sur f(I).

Test 26.20. Test 26.21.


Déterminer un intervalle I de lll sur le- Déterminer un intervalle I de lll sur le-
quel la fonction x H sin x réalise un C 1- quel la fonction x H tan x réalise un C 1-
difféomorphisme de I sur son image. Expliciter difféomorphisme de I sur son image. Expliciter
la dérivée de la bijection réciproque. la dérivée de la bijection réciproque.

Proposition 26.33• . SQ!l,1, f une jonction réelle définie et conti'f:liue sùr le segment [n,b],
a < b, et dérivable sur}a,b]. Si f 1(t) a une limite réelle 1' quand t ➔ a.+, .ala.r;, f. es.t
dérivable à droite au point a et f'(n) = F. · · ·

PREUVE. Considérons la fonction auxiliaire cjJ(t) = f(t) - l't, t E [a, b]. Fixons E E JR~;
comme f'(t) -+ l' quand t-+ a+, il existe a E JR~ tel que, pour tout t E]a, a+ a[, on ait
lf'(t) - l'i :::;; E. En particulier, la fonction f' est bornée sur l'intervalle ]u, a+ a[ et il en
est de même pour la fonction cjJ'. Si donc x E]u, a+ a], on peut appliquer l'inégalité des
accroissements finis à la fonction cjJ sur l'intervalle [u, x] et on obtient

lcjJ(x) - cjJ(u)I :::;; (x - a) sup W(t)I = (x - u) sup Jf'(t) - l'i :::;; (x - a)E,
tE ]x,a[ tE ]a,x[

4
On fera tendre y vers b seulement à gauche ou à droite si éventuellement on se trouvons à une extrémité de
l'intervalle f(I).
743

ce qui s'écrit encore


lf(x) - f(a) - l'(x- a)I::;; (x - a)L
Comme f est arbitraire, ceci montre que f(x) - f(a) - l'(x - a) = o(x - a), pour x > a,
c'est-à-dire que f est dérivable à droite au point a, de dérivée égale à l'. ■

Théorème 26.34; Soit f une fonction à valeurs réelles, définie et de classé C1 sur l'inter-
valle Ja., bh u <b. Si f'(t} a·wrte/li1!literéelle quand t-+ a.+, alors f se prolonge de manière
unique,en unefonetion de classe(Yffir [a., b]. · ·

PREUVE.
coN
..ci
◊ Nous allons d'abord montrer que fa une limite réelle quand t--, a+ en utilisant le critère ü
de Cauchy pour les fonctions, c'est-à-dire en montrant que

VE E JR'.;_, :lcx. E JR'.;_, V(x, y) E ]a, b]2, si lx - al ::;; ex. et IY - al ::;; ex. alors lf(x) - f(y li ::;; L

Nous laissons au lecteur le soin de justifier que ce critère entraîne l'existence de la limite de
f en a. Fixons donc E. E JR~; puisque par hypothèse f'(t) tend vers un certain l' E lR quand
t--, a+, il exister E JR~ tel que, pour tout t E]a, a+ rl, on ait lf'(t) - l'i::;; 1 et donc, en
vertu de l'inégalité triangulaire, lf'(t)I ::;; 1 + ll'I. Par l'inégalité des accroissements finis, on
déduit donc que pour tout (x, y) E] a, a + rJ2, on a

lf(xl - f(y)I ::;; (ll'I + lllx -yl.

Posant alors ex= min(r, e/(ll'I + 1)), on voit que V(x, y) E]a, a+ cx.]2, lf(x) - f(y)I::;; e, d'où
le résultat.
◊ Puisque fa une limite, notée l, lorsque t--, a+, en définissant la fonction f par

f(t) = f(t) si t E]a, bl, f(a) = l,


on obtient un prolongement continu de f à [a, b] et c'est du reste le seul prolongement continu
possible. En appliquant la proposition 26.33, on en conclut que f est dérivable à droite au
point a avec f'(a) = l' et donc puisque f'(t) = f'(t) --, l' quand t--, a+, f est de classe C 1
sur [a, b]. ■

EXEMPLE 26.35. La fonction définie sur JR* par f(x) = x 3 sin ~ est de classe C 1 sur JR* par
les théorèmes généraux et sa dérivée pour x # 0 est donnée par

f'(x) = 3x2 sin ! - xcos !X


X

qui tend clairement vers O lorsque x tend vers O. Il en résulte que f se prolonge de manière
unique en une fonction C 1 sur lR et que la dérivée en Ode ce prolongement est O. le prolon-
gement s'obtient bien sûr en posant f(O) = 0, et on peut vérifier directement la propriété
énoncée.

Test 26.22. Test 26.23.


Peut-on prolonger la fonction définie sur JR* par Peut-on prolonger la fonction définie sur JR* par
f(x) = In:2 en une fonction de classe C 1 sur lR? f(x) = x 2 sin ben une fonction de classe C 1
vlxl
sur lR?
744

Remarque. Le théorème des accroissements finis est aussi un outil pour montrer des inéga-
lités simples 5 • Nous en verrons des exemples en exercices. Rappelons enfin que le calcul des
dérivées et les résultats obtenus dans ce paragraphe, joints au calcul des limites, permettent
d'étudier des fonctions et de tracer leur graphe, c'est un type d'exercice classique que le lecteur
a déjà largement rencontré en terminale et qui a été revu dans la première partie du présent
ouvrage.

Test 26.24. Test 26.25.


Étudier la fonction définie par Étudier la fonction définie par
4x f(x) = xlnx
f(x)=-1-2
+x x-3
puis tracer son graphe. puis tracer son graphe.

III. CAS DES FONCTIONS À VALEURS COMPLEXES

Nous allons reprendre rapidement les deux sections précédentes pour les fonctions f définies
sur un intervalle I de JR, à valeurs complexes. Nous allons souligner ce qui demeure valable
des résultats précédents, et ce qui ne l'est plus.

111.1. Dérivabilité
Concernant la dérivabilité, la définition demeure vraie. En effet, pour f : I --+ C, on peut
définir son taux d'accroissement comme pour une fonction à valeurs réelles et on dira donc
qu'elle est dérivable en un point a E I si ce taux d'accroissement T 0 (h) a une limite dans
C quand h --+ 0 (avec éventuellement h restreint à être strictement positif, ou strictement
négatif, si a est une borne de l'intervalle I). Si on pose f, (t) = ~ef(t) et f 2(t) = Jm f(t),
alors f (t) = f 1(t) + if 2 ( t), il résulte alors immédiatement des propriétés des limites que

f'(t) = f\(t) +if~(t).

Pour de telles fonctions à valeurs complexes, on ne s'intéresse plus en général à leur graphe
mais plutôt à la représentation de l'ensemble

C = {f,(t) +if2(t) t E I}
1

qui est ce que l'on appelle une courbe paramétrée, ou un arc paramétré, et sera étudié au
chapitre 30. Nous y verrons en particulier le lien entre la dérivée de f et les tangentes à
l'ensemble C.
Tous les résultats concernant les opérations sur les fonctions dérivables restent bien évi-
demment vrais dans le cadre des fonctions à valeurs complexes.

5
Diverses méthodes sont utilisées en analyse pour l'obtention d'inégalités. Nous en rencontrerons plusieurs au
long de cet ouvrage : inégalité des accroissement finis, étude d'une fonction auxiliaire, formules de Taylor,
convexité, etc.
745

III.2. Accroissements finis


Concernant maintenant le théorème de Rolle et des accroissements finis ainsi que ses corol-
laires, rien ne subsiste plus, ou du moins peu de choses. En effet, le théorème de Rolle est faux
pour les fonctions à valeurs complexes comme le montre le contre-exemple suivant. Prenons

f:JR----,C, tHcost+isint.

Cette fonction est dérivable sur JR, vérifie f(0) = f(27t) et pourtant sa dérivée ne s'annule
jamais.
Par la même occasion, l'égalité des accroissement finis est aussi mise en défaut, et ce par
cci
le même contre-exemple. En revanche l'inégalité des accroissement finis est encore vraie sous C'I

la forme ci-dessous. ..d


ü

'f~r;rè1tte 26.~n: Jin~galitl¼ des âêcroissements &nis). Soit f : [a,b] 4 C une


ftirictiôn continûe sùr [o~ bJ ét difrîvabli sur ]a, b[. Si f' èst bornée sur ]a, b[, en posant
M =SûPteJa,,biJflftJ!;on a .
Jf(b} - f(a)I ~ M(b - a).

PREUVE. L'égalité des accroissements finis n'étant pas vraie dans le cas complexe, on ne peut
évidemment pas en déduire directement, comme nous l'avons fait dans le cas réel, l'inégalité
des accroissements finis.
Notons f(t) = f 1(t) +if2(t) et introduisons la fonction auxiliaire à valeurs réelles définie
sur [a, b] par
<p: t H f1 (t)(f1 (b) - f1 (a)) + f2(t)(f2(b) - f2( a)).
Cette fonction est continue sur [a, b] et dérivable sur ]a, b[ par les théorèmes généraux. Sa
dérivée est donnée par

et par l'application de l'égalité des accroissements finis à cette fonction réelle, il existe c dans
]a, b[ tel que cp(b) - cp(a) = (b - a)cp'(c) qui s'écrit après simplication

(f1(b) -f1(a)) 2 + (f2(b) -f2(a)) 2 = (b - a)cp'(c),

c'est-à-dire
lf(b) - f(a)l 2 = (b - a)cp'(c).
Compte tenu de l'expression de cp', cela s'écrit encore

(26.5)

Or, pour tous réels x, x', y, y', on a l'inégalité de Cauchy-Schwarz

(26.6)

qui résulte immédiatement de l'identité algébrique (dite de Lagrange)

(xx' + yy')2 + (xy' -yx')2 = (x 2 + y 2)(x' 2 +y'2)

et que le lecteur vérifiera sans peine en développant les deux membres. Grâce à cette inégalité
(26.6), la relation (26.5) nous donne l'inégalité

lf(b) - f(a)l 2 ~ (b - a)lf'(c)llf(b) - f(a)I.


746

Si lf(b )-f( a)I = 0, ce que l'on veut montrer est trivial donc on peut supposer lf(b )-f( a)I -1- 0
et simplifiant alors par cette quantité l'inégalité précédente, on obtient

lf(b) - f(a)I:::;; (b - u)lf'(c)I,

donc a fortiori, si M = suptE]a,b[lf'(t)I,


!f(b)- f(a)!:::;; M(b- a).

ce qui termine la preuve. ■


Quant aux résultats que nous avons déduits, dans la précédente section, du théorème des
accroissements finis et concernant des propriétés que possède une fonction selon les propriétés
de sa dérivée, il est clair que tout ce qui est relatif_à la monotonie n'a pas de sens dans le cadre
complexe, mais le résultat affirmant qu'une fonction dérivable à dérivée nulle est constante
reste vrai, ainsi que le théorème relatif au prolongemen t des fonctions de classe C 1 .

IV. APPLICA TION : RETOUR SUR LES SUITES Un+l = f(Un)


Nous avons déjà rencontré de nombreux exemples de suites définies par une relation de récur-
rence. Nous allons examiner dans cette partie ce qu'apportent les outils du calcul différentiel
à l'étude de telles suites. Nous allons d'abord montrer un théorème de point fixe, dû à Picard,
qui s'applique dans le cas où les fonctions considérées sont contractantes , c'est-à-dire lipschit-
ziennes de rapport< 1. Comme nous l'avons vu, pour montrer le caractère lipschitzien d'une
application dérivable, il est en général possible de faire appel au théorème des accroissements
finis. Nous présenterons ensuite une méthode, due à Newton, pour calculer les racines d'une
équation de la forme F(x) = 0, où la fonction F est supposée de classe C 2 sur un segment.
Cette méthode consiste à former une suite récurrente, formée par les intersections successives
de tangentes au graphe de F avec l'axe des abscisses. Là encore, le calcul différentiel joue le
premier plan, puisque l'équation de la tangente fait appel au nombre dérivé au point considéré.
Les preuves de cette partie seront rédigées de manière plus succincte que dans le reste de
ce chapitre, quelques détails faciles seront laissés au lecteur à titre d'exercice.

IV.1. Le théorème du point fixe de Picard


Le théorème que nous allons présenter ci-dessous dans le cadre des suites numériques est
certainement l'un des plus importants des mathématiqu es. Ce théorème, dû à Émile Picard, est
un théorème de point fixe, c'est-à-dire qu'il permet de montrer que, sous certaines hypothèses,
une certaine fonction envoie un point de son ensemble de définition sur lui-même. Il existe
de très nombreux théorèmes de point fixe en mathématiqu es. Celui-ci, au moins sous sa
forme générale (que nous ne présenterons pas ici, mais dont la preuve est rigoureuseme nt
la même que celle qui va suivre) est à la base de très nombreux résultats d'analyse et de
calcul différentiel, comme le théorème d'inversion locale, le théorème des fonctions implicites,
le théorème de Cauchy-Lipschitz, qui seront exposés dans les cours de 12 et 13. Il permet à
la fois de prouver l'existence théorique d'objets mathématiqu es comme objets limites, tout en
donnant un procédé explicite et constructif permettant de calculer des objets approchant ces
objets limites, à la précision que l'on souhaite. En outre il donne un contrôle de la vitesse de
convergence de ces objets approchés vers l'objet limite. Comme nous le verrons, il est basé
747

sur la complétude de :IR, c'est-à-dire sur le fait que toute suite de Cauchy de réels converge
dans R
Rappelons que si f est une application d'un ensemble E dans lui même, un élément a de
E est un point fixe de f lorsque f(a) = a. Commençons par une simple remarque, qui sera à
la base de beaucoup de nos raisonnements.

LetUUl~ 26.37. SoiU. UMPJ&~ie qe"J f,tf une fonction continue de I dans L. One conseillère
la:suite {~}tW;:N tléfirti,e z,ar *wrrence par Uo E I et Un+1 = f(1.tn). Alors si cette .suite
a~oc
corw.veri,e, f=Jim11.'--too Un~ 1 · •. · · · ··
l = f(t).
En d~autres t~es limn.➔i:i:i•l..ttt est un piiint Ji,xe. de f.
PREUVE. Si la suite (UnlnEN converge vers f, la sous-suite (Un+1 lnEN converge aussi vers f.
Cette suite a pour terme général f(u.nl, donc elle converge vers f(f), par continuité de f. Il en
résulte que f( €) = € par unicité de la limite. ■

Rappelons une définition introduite au chapitre 24.


Définition 26.38. Une fonction f : l ---t C, définie sur un intervalle non vide l de :IR, est
dite lipschitzienne s'il existe k E JR+ tel que pour tout (x, y) E 12 , on ait

lf(x) - f(y)I ~ klx -yl.

Le réel k est alors un rapport de Lipschitz de f.


Pour une telle fonction lipschitzienne, l'ensemble

K = {k E JR+ l 'v'(x, y) E 12 , lf(x) - f(y)I ~ klx -yl}

est ainsi non vide et minoré donc admet une borne inférieure que nous noterons ;:\(f). Il est
clair que À( f) est un rapport de Lipschitz de f.

EXEMPLE 26.39. Si f : l ---t C est dérivable et possède une dérivée bornée sur l alors
d'après l'inégalité des accroissements finis, f sera lipschitzienne avec À(f) ~ suptETlf'(t)I. En
particulier, si f est de classe C 1 sur un segment l = [a, b], cette condition sera satisfaite.

Définition 26.40. Une application f est dite contractante si elle est lipschitzienne avec un
rapport de Lipschitz À( f) < 1.

Prop~~tit:>n Ï(l:41~ Sif : l -4.~ est lî~7hliîètlntf alôrif est umformément continue et a
fQrtiori continue, ·· ·
PREUVE. Si f est constante, f est trivialement uniformément continue. Sinon, le rapport de
Lipschitz À(f) est non nul. Soit f: E :IR~; si on pose <X= e/;:\(f), on a, pour tout (x, y) E 12 tel
que lx - y ~ <X,
1

lf(x)-f(y)I ~ t\(f)lx-yl ~ t\(f)e/t\(fl = e


et donc f est uniformément continue. ■
748

Test 26.26. Test 26.28.


La fonction lR -1 JR, x H x2
est-elle lipschit- La somme de deux fonctions lipschitziennes est-
zienne? Et sa restriction à l'intervalle [0, 10]? elle lipschitzienne ?
Test 26.27. Test 26.29.
La fonction lR -1 JR, x H 100x + 23 est-elle Le produit de deux fonctions lipschitziennes
lipschitzienne ? est-il lipschitzien?
Définition 26.42. Soit A une partie de IR et f une fonction de D C IR dans IR, avec A C D.
On dit que A est stable par f lorsque f(A) CA.

Proposiiion 26;43. Soitf :I ~ :l unefo~tîim tell~"f/t!el lH:>it $,ta6lêpaff~ Onpifut<dors


= =
définir ies itérées f"- de f par f 1 f et f"- f o F-1 pour n. E N*. ·
Danfl. le èaS où f est lipschitzienne; ·toutts ses itérées sonflitJschi.tziennes èt pour tout entier
neN• ona

PREUVE. Par récurrence sur n EN*. Sin= 1, c'est évident. Si fn-l est lipschitzienne avec
;\(fn- 1 ) ~ ;\(f)n- 1 , alors, pour tout (x, y) E 12 , on a

donc fn est lipschitzienne et en outre ;\(fn) ~ ;\(f);\(fn- 1 ), d'où ;\(fn) ~ ;\(f)n. ■

Rappelons maintenant une notion appelée à être revue à maintes reprises.

Définition 26.44. Soit (Àµ)pEN une suite de termes positifs; on dit que la série de terme
générol Àp converge si la suite (SnlneN de terme générol Sn = I:;=0 Àp converge dans lR.
Dans ce cas, sa limite S est notée
+oc
s = L Àp
p=O

et est appelée la somme de la série. La suite (SnlneN est appelée suite des sommes partielles
de la série.
Proposition 26.45.
1) Soit {À11 )peN une suite de termes positifs. La série de terme général A11 co,nverge sp~t
seulement si là àûite (Sn)n.eN ·est ma,jorée. .. .
2) Soient {Àp)PEJ!if et (µ,,)peN des suites de termes positifs vérifiant Àp i Jti,. Alors si ia série
de terme général µ,, converge, la série de terme général Àp converge et

3) Soit (Àp )peN une suite de termes positifs. Si la série de terme général Ap converge, op, a
alors limn.:.ioo Àp =O.
PREUVE.

1) En effet, les Àp étant positifs, la suite (SnlneN est croissante donc converge si et seulement
si elle est majorée.
749

2) On voit facilement que dans ce cas la suite (SnlnEN est majorée par la somme L~ ~,
donc la série correspondante converge. L'inégalité est immédiate par passage à la limite.

3) Avec les mêmes notations, Àp = Sp+l - SP est la différence des termes généraux de deux
suites qui convergent vers la même limite, donc Àp -) O. ■

Si la série de terme général Àp converge et a pour somme S, alors par définition, lorsque
n-) +oo, la suite dont le n-ième terme est Rn= S - Sn tend vers O. Ce terme Rn est appelé
reste d'ordre n de la série. On peut noter aussi


N
..d
ü

EXEMPLE 26.46. On a déjà étudié les séries géométriques dont le terme général est de la
forme Àp = kP, k E [O, +oo[ et vu que ce type de série converge si et seulement si O ,( k < 1.
Puisque pour tout non a Sn= 1~k_";;', la somme de cette série et son reste d'ordre n sont
donnés par

Rappelons qu'un fermé de IR est une partie dont le complémentaire est ouvert, ou encore
une partie qui est égale à son adhérence. Si A est une partie fermée de IR, et si (unJnEN est
e
une suite d'éléments de A qui converge verse, alors nécessairement E A. En effet, si rf_ A,e
il existe un intervalle ouvert contenant e qui est contenu dans Ac_ Il existe donc ô > 0 tel
que Je - ô, e+ ô[ soit contenu dans Ac. Donc aucun élément Un ne peut être contenu dans
]€ - ô, e+ ô[ , ce qui contredit la définition de la convergence de (unlnEN verse. Donc e E A.
Signalons enfin qu'un intervalle fermé de IR est un intervalle de IR qui est fermé au sens
précédent. En particulier, les intervalles de la forme [u, +oo[ et] - oo, u] sont fermés.
Si f : I -1 IR est une application lipschitzienne laissant stable l'intervalle I, c'est-à-dire
vérifiant f(I) CI, on peut considérer la série de terme général Àp = À(fP). On l'appellera par
commodité (dénomination non universelle) la série de Lipschitz associée à f. Compte tenu de
la proposition 26.43, si f est contractante de rapport k, alors sa série de Lipschitz converge
et, en vertu de la proposition précédente, son reste d'ordre n est majoré par Rn= ~":~.

Théorème 26.47. (Théorème du point ~e). Soient I 'U'/1, intervalle fermé de R et


f : 'I -1 R une Jonction lipschitzienne télle que I soit stable par f, c'est-à-dire f(I) c I.
Sùpposons que la série de Lipschitz associée à f soit convergente ( ce qui est satisfait en
particulier dans le cas où f est contmctante). Alors:
1) f possède un et un seul point fixe a E I, c'est-à-dîre tet que f(a) = a,
2} pour tout c E I, la suite définie par r&urrence par

Uo = c, Un+1 = f(Un), n EN, (26.7)


750

- ,- - ,'>c:_:J-...•: :__-, - ,~7~


~ e ,___ :- - , (Suit•} - _-
.. - ~'IJ:fJ1YE!
-, --- - .- _,_-
-pers.- _,cet iioofilirtlf9mli~ <11• .·
- - - ' -_ -~- -- :- --- - -o._ -,,

l)f,ôûr~iteN;•ô na
. . .

ff.>.{~f\.,fu~f~f
fa.;..u.pf.~
. \n=v J
et dans. le êai pàrffeitlit:r â'un1/cpJlli~tion·cont:rt1iit~nt(it1;:' iùppcnjtt
, , 'f<;tur~~I ( ·
0
··..
la-Upf ~. f;;.. k .

PREUVE.

o Si f a un point fixe, celui-ci est unique.


En effet, si a et b sont des points fixes pour f, ce sont aussi des points fixes pour toute itérée
fP de f, donc fP( a) = a et fP(b) = b. On a donc, pour tout entier p ?: 1,

la- bl = lfP(a) - fP(b)I ~ À(fP)la- bl

et comme la série de Lipschitz associée à f converge, son terme général À(fP) tend vers 0,
donc est strictement inférieur à 1 à partir d'un certain rang Po, il en résulte que la - bl = 0,
c'est-à-dire a= b.
o Toute suite définie par (26. 7) a une limite.
Nous allons montrer que (UnlnEN est une suite de Cauchy. À cette fin, nous allons contrôler
chaque différence Un+l - Un et établir une chaîne reliant Up et Uq par des différences de tels
termes consécutifs. Précisément, pour tout n EN, on a clairement Un= fn(Uo) donc

(26.8)

Remarquons que si u 1 = Uo alors Uo est un point fixe de f, donc la suite est constante et en
particulier convergente. On peut donc supposer u 1 i- u 0 .
Donc si pet q sont des entiers, avec p < q, on a, grâce à l'inégalité triangulaire

d'où, compte tenu de la majoration (26.8),

(26.9)

Or, puisque la série de Lipschitz associée à f converge, pour tout e E IR~, il existe un entier
n 0 EN tel que
q-1
0 ~ L, À(fn) = Sq-1 - Sp-1 ~ e/lu1 - Uol
n=p

si q ?: p ?: no et par suite luq - Upl ~ e, donc la suite (UnlnEN est une suite de Cauchy.
Puisque IR est complet, elle converge dans R Mais l'intervalle I est supposé fermé et (UnlnEN
est une suite de points de I donc sa limite appartient à I.
751

◊ L'application f a un point fixe et toutes les suites définies par (26. 7) convergent vers la
même limite. C'est clair d'après le lemme 26.37, puisque f est continue, en vertu du premier
point de cette preuve.
◊ Vitesse de convergence.
Revenons à la majoration (26.9). En faisant tendre q vers +oo, on obtient

Dans le cas particulier d'une application contractante de rapport k


cc:i
+oo +oo +oo kP (N

L. À(fn) ~ L. À(f)n = L. kn = 1 - k ë5
n=p n=p

d'où


L'outil essentiel pour vérifier que nous sommes bien dans les hypothèses du théorème
précédent va évidemment être le théorème des accroissements finis, qui nous permettra souvent
de montrer qu'une application est contractante.

PREUVE. Conséquence immédiate de l'inégalité des accroissements finis. ■

EXEMPLE 26.49. Considérons la suite définie par la relation de récurrence

Uo = 0 et Vn EN, Un+l = J12+un.


Introduisons la fonction

f:I=[O,+oo[-)JR, xH ✓ 12+x.

L'intervalle I est fermé, stable par f et Un+l = f(un)- De plus, f est dérivable sur I et, pour
tout x ~ 0, on a
f'( ) 1
X = 2✓12+x'
donc d'après le lemme 26.48, f est contractante, de rapport k ~ )u =
2 4
1.Il résulte donc
du théorème du point fixe que la suite (UnlnEN converge vers l'unique point fixe de f, dont
il n'est pas difficile de calculer la valeur, à savoir 4, en résolvant l'équation

✓ 12 +X= X, X~ 0.

Ainsi, limn-->+oo Un = 4. En outre, on peut remarquer que le choix de u 0 = 0 ne joue aucun


rôle, toute autre condition initiale u 0 E [O, +oo[ aurait conduit à la même limite en vertu du
théorème du point fixe.
752

EXEMPLE 26.50. Considérons maintenant la suite définie par la relation de récurrence

Uo = 0 et \ln EN, Un+1 = J2-un.

Introduisons la fonction
f : [0, 2[----, JR, X H ✓2 - X.
Cette fonction laisse stable l'intervalle [O, 2[, est dérivable, de dérivée donnée pour x E [O, 2[
par
-1
f'(x) = 2 ✓2=x·
2-x
Quand x est proche de 2, lf'(x)I est très grand et le théorème des accroissements finis inopé-
rant. Mais en fait on voit bien que l'action va se dérouler "loin" de 2. En effet, tous les termes
de la suite sont clairement majorés par v1 donc en fait on peut se placer sur le segment
I = [O, vll, qui est stable par f (f(I) C I). On a alors

1 1
sup-== = - - - - < 1.
xEI2 ✓2-x 2J2-vl
On est donc dans le cadre de l'application du théorème du point fixe, la suite (UnlnEN
converge vers l'unique point fixe de f, à savoir 1.
On se doute bien, à la vue des exemples précédents, que la valeur de la dérivée de f au
point fixe est déterminante pour le comportement et la vitesse de convergence de la suite.
Nous ne donnerons pas ici de résultats généraux à ce propos mais nous en verrons un exemple
explicite avec la méthode de Newton traitée plus loin.

IV.2. Sens de variation et propriété de la borne supérieure


Comme nous l'avions dit en introduction de cette section, le théorème du point fixe est basé sur
la complétude de JR, c'est-à-dire sur le fait que dans lR les suites de Cauchy convergent. Dans
ce qui suit, nous allons proposer une méthode alternative à ce théorème. Plutôt que d'énoncer
des théorèmes difficiles à retenir, nous préférons illustrer cette méthode en reprenant les deux
exemples du paragraphe précédent. Elle est basée cette fois sur la notion de monotonie et le
théorème essentiel qui affirme que toute suite croissante majorée converge.
Notre premier exemple, associé à la fonction x H ✓ 12 + x dont nous représentons le graphe
ci-dessous, va nous montrer un premier type de convergence. La figure ci-dessous montre la
suite formée à partir du premier terme x 0 = O.
EXEMPLE 26.51. Considérons la suite définie par la relation de récurrence

Uo = 0 et \ln EN, Un+l = J12 + Un.

Introduisons la fonction

f: I = [O, +oo[----, JR, x H ✓ 12 + x.


On peut remarquer que puisque f est croissante, fn l'est aussi et donc Un+l -Un= fn(u 1) -
fn(uo) est du même signe que u1 -u0 . La suite (UnlnEN est donc monotone, en l'occurrence
croissante puisque u 1 - uo > O. D'autre part, elle est clairement majorée par 4 comme le
montre une récurrence immédiate, donc elle converge; comme f est continue, sa limite l
753

FIGURE 26.6. Graphe de la fonction x H J12 + x, convergence en escalier

doit vérifier f(l) = l, d'où l = 4. La com-ergence est qualifiée dans ce cas. pour des raisons
évidentes, de convergence en escalier.
Que se passe-t-il si on change de condition initiale? On sait d·après la méthode du point
fixe que cela ne change rien, mais on le vérifie directement ici. Si par exemple. on part de
u 0 = 5 cette fois-ci, on aura u 1 = Jl 2 + 5 < Uo = 5. donc la suite sera cette fois décroissante.
mais toujours convergente vers 4.

Notre deuxième exemple, associé à la fonction x H J2 - x, nous montre un autre type de


convergence.

EXEMPLE 26.52. Considérons la suite définie par la relation de récurrence

Uo E [0,2], et \ln E N,un+l = J2-un.


Introduisons la fonction
f : [0, 2] --+ ffi., X H J2 - X.

Remarquons tout d'abord que f est décroissante. Il en résulte que dans la suite des itérées
2 1
fn, les itérées paires f 2 P sont croissantes et les itérées impaires f v+ sont décroissantes. Par
conséquent les sous-suites (u 2p)pEN et (Uzp+l lvEN sont monotones; en outre elles sont de
sens de variation contraires car si par exemple u 0 ~ u2, alors puisque f est décroissante,
U1 ~ U3 donc (uzvlvEN est croissante et (u2v+1 )pEN décroissante. Si au contraire, u 0 ~ u 2, on
aura U1 ~ U3 donc (uzvlvEN sera décroissante et (u2p+1lvEN croissante. En tout cas les deux
sous-suites (u2p)pEN et (uzv+ilvEN sont convergentes puisque monotones et bornées (entre 0
et 2) ; la fonction f étant continue, f 2 aussi, elles convergent chacune vers un point fixe de
f 2 . Or, f 2 (x) = f o f(x) = J2 - J2 - x, donc

f 2(x) =x# J2-J2-x=x

ce qui implique par élévation au carré que 2-J2-x = x , d'où 2-x = J2-x, impliquant
2 2
2 )2 = 2 - x. Cette dernière équation est du
à nouveau par une élévation au carré que (2 - x
quatrième degré, x 4 - 4x 2 + x + 2 = 0, mais, évidemment, la solution x = 1 qui est point
fixe de f l'est a fortiori de f 2 donc on peut facilement factoriser ce polynôme du quatrième
degré en (x - l)(x 3 + x 2 - 3x - 2) = O. Or si on pose cp(x) = x 3 + x - 3x - 2, on a
2

cp'(x) = 3x + 2x - 3 qui est clairement strictement croissante et donc, puisque cp'(O) = -3


2

et cp'( ✓2) = 3 + 2)2, s'annule en un seul point x 0 E [O, ✓2]. Sur [O, x 0], cp est décroissante.
754

sur [x 0 , v'll, cp est croissante; or cp(O) = -2 et cp( v'l) = -v'l, donc cp reste strictement
négative sur l'intervalle I = [O, v'l] et donc en particulier elle ne s'annule pas. Il en résulte
que le seul point fixe de f 2 sur I est 1 et donc que les suites (u2p)pEN et (uzv+ilvEN convergent
toutes les deux vers 1, l'une en croissant et l'autre en décroissant (elles sont donc adjacentes).
La suite (unlnEN converge donc vers 1. Pour des raisons graphiques évidentes, la convergence
est dite en spirale.

FIGURE 26. 7. Graphe de la fonction x H ✓2- x, convergence en spirale

Le lecteur aura pu constater que la méthode du point fixe est plus rapide. Les autres
méthodes ont l'avantage de bien montrer l'utilisation directe de la structure de la droite
réelle.

IV.3. Un cas d'école : l'algorithme de Babylone


Nous allons étudier ici la suite (UnlnEN définie par

u0= c > 0, Vn E N, Un+1 = 1 (Un+ : )

où a est un réel strictement positif donné. Nous avons déjà évoqué cette suite dans l'intro-
duction du chapitre sur les suites à propos du texte Les Métriques de Héron d'Alexandrie.
Commençons par utiliser le théorème du point fixe. Introduisons pour cela la fonction

f :JO, +oo[---, JO, +oo[, x H 1( x + ~).

Puisque, pour tout x E ~~,

f'(x) = 1(1 - :Z),


les variations de f sont données par le tableau suivant :

X 0 va +oo
f' - 0 +
f 0 "-,, va /' +oo
755

Ainsi, en particulier l'intervalle fermé [fo, +oo[ est stable par f. De plus, f est contractante
sur cet intervalle puisque pour tout x E [va, +oo[, 0 :(; f'(x) :(; 1/2. Si c ;:::, VU, le théorème
du point fixe s'applique et montre que la suite (UnlnEN converge vers l'unique point fixe de la
fonction f sur [va, +oo[, à savoir fo. Si maintenant C :(; VU, on remarque que puisque f est
décroissante sur ]0, y'a], la condition Uo = C :(; VU implique que U1 = f(uo)) f(val = VU
et donc qu'à partir du terme u 1, tous les termes Un sont dans l'intervalle fermé [fo, +oo[ et
que, par conséquent, dans tous les cas la suite (UnlnEN a pour limite le nombre fo.
Utilisons maintenant la méthode basée sur l'étude du sens de variation des suites. Il
convient de remarquer qu'à partir de u,, tous les termes sont dans [va, +oo[, quelle que
soit la valeur initiale de u 0 . Sur cet intervalle, la fonction f est croissante donc la suite est
monotone à partir de u 1 . Introduisons alors la fonction cjJ définie sur [fo, +oo[ par

cjJ(x) = f(x) -x = 1( x+ ~) -x = 1 (-x + ~).

Cette fonction est décroissante. Puisque cjJ( fol = 0, elle est négative sur [fo, +oo[, impli-
quant ainsi que pour tout XE [va, +oo[, on a f(x) :(; X. Ainsi, en particulier U2 :(; U1 et donc
la suite (unlnEN est décroissante à partir de u 1. Comme la suite est minorée, elle converge
vers l'unique point fixe de f appartenant à (Un)nEN• à savoir fo.

IV.4. La méthode de Newton


Si on veut résoudre une équation du type F(x) = 0, il est bien rare que l'on puisse y parvenir
de manière exacte. Par exemple, pour une équation polynômiale de degré supérieur ou égal à
5, on sait depuis les travaux de Galois et Abel qu'il n'existe pas de formule générale exprimant
les racines de cette équation en fonction des coefficients du polynôme, comme on en connaît
pour les équations du second degré. Pour les équations polynômiales de degré 3, il existe en
revanche de telles formules, dites de Cardan, et pour les équations de degré 4 aussi, ce sont
les formules de Ferrari. Cependant, même si ces formules existent, elles ne sont pas commodes
et on a plutôt intérêt en pratique à avoir une bonne approximation des racines plutôt que des
formules exactes inutilisables. Pour de telles équations, polynômiales ou non, l'idée est donc
d'essayer de construire une suite (UnlnEN de réels convergeant vers la racine cherchée. Si la
suite converge vite, on pourra ainsi avoir une bonne approximation de cette racine au moyen de
la valeur de l'un des termes de la suite, sans avoir besoin de calculer une multitude de termes.
Parmi, toutes les méthodes que les mathématiciens ont déployées pour remplir ce programme,
l'une des plus classiques est celle qui est connue sous le nom de méthode de Newton, méthode
itérative où la suite proposée va être une suite récurrente du type Un+l = f(unl- C'est ce que
nous allons expliquer maintenant.
L'idée est la suivante : on veut résoudre F(x) = 0 où F est une fonction de classe C1 sur
un intervalle I. Soit c E I. La tangente au graphe de Fau point (c, F(c)) a pour équation

y - F(c) = F'(c)(x - c).


Si F'(c) -1- 0, cette tangente coupe l'axe des abscisses au point

F(c)
xo = c - F'(c).

Repartons alors de ce point Xo. Considérons la tangente au graphe de Fau point (x 0 , F(x 0 )),
et calculons l'intersection de cette tangente avec l'axe des abscisses, on obtient un point x 1,
756

et ainsi de suite. On obtient ainsi un procédé itératif qui définit une suite (un)nEN avec

F(Un)
Uo = c, Un+l = Un - F'(un)

qui continuera indéfiniment pourvu que F'(un) reste non nul.


La fonction f : x H x - F(x)/F'(x) étant continue, si (unlnEN converge, ce sera vers un
point fixe de f donc vers un point a tel que F(a) = 0 et nous aurons gagné.

FIGURE 26.8. La méthode de Newton

Avant de préciser cette méthode par un théorème, donnons un exemple.

EXEMPLE 26.53. Appliquons cette idée à l'équation x 2 = a, x, a> 0, visant ainsi à calculer
le nombre y'a. Dans ce cas, F(x) = x 2 - a et donc

f(x) x - -a = -1 ( X+ -a) .
= X- -
2

2x 2 X

Cela conduit à la suite récurrente définie par

Uo =c> 0, Un+l = ~ (Un+ :J ,


c'est-à-dire à la suite du paragraphe précédent, celle de l'algorithme de Babylone, qui n'est
donc qu'un cas particulier de la méthode de Newton.

Le théorème suivant précise cette méthode.


757

Théotême 26;54. Supposons (flf,e f soit de classe C2 sur un segment. (oc, il vérifiant F( «) <
0, F(t3)>0etpourtou txE [oc,[3], f'{x)>O etF"(x) ~O.
1) Alors Fâdmet un zéro et un seul, notons-le a, dans le segment [oc, f3].
2) Pour tout c E [oc, [3], la suite définie par
F(Un)
'll() = C, Un+l = Un - f'(Un) .(26.10)

est bien tl€finie et converye vers le réel a, en décroissant à partir du rang 1.


3) Puisque fi et fit sont continues sur le segment [ix, f3], elles sont bornées et atteignent
leurs bornes. Notons

m1 = xE[oc,~]
min F'(x) et M2 = max F"(x).
xE[oc,~]

On a alors, pour fout n E N

PREUVE.

1) Puisque F est continue et vérifie F(a) < 0 et F(f3) > 0, par le théorème des valeurs
intermédiaires, F a un zéro sur le segment [a, [3]. En outre, F' est strictement positive donc F
est strictement croissante, en particulier injective, et donc ce zéro est unique. Notons le a.
2) Considérons la fonction f définie sur [a, [3] par
F(x)
f(x) =X--(-)'
f' X
1
Puisque F' est strictement positive, f est bien définie sur [a, [3] et de classe C . En outre,
puisque F(a) < 0 et F(f3) > 0, on a f(a) > a et f([3) < [3, et, par conséquent, f laisse
stable le segment [a, [3]. Il en résulte que la suite définie par (26.10) est bien définie pour tout
entier naturel n. La remarque cruciale est que l'équation f(x) = x est équivalente à l'équation
F(x) = O. Les points fixes de f correspondent donc aux zéros de F.
La dérivée de f étant donnée par

f'( ) = F(x)F"(x)
X f'(x)2 ,

il en résulte que f est décroissante sur [a, a] et croissante sur [a, [3], et on voit que chacun de
ces deux sous-intervalles est stable par f. Si Uo = c E [a, [3], la suite (UnlnEN est monotone
et comme f(x) - x = -F(x)/F'(x) ~ 0 pour tout x E [a, [3], on a u1 ~ u 0 et donc la suite est
décroissante. Si maintenant au contraire u 0 = c E [a, al, puisque f est décroissante sur [a, al,
on a f(u 0 ) ~ f(a) = a donc u 1 appartient à [a, [3] et on est ainsi ramené au cas précédent dès
le terme u 1 . Il en résulte que la suite est décroissante à partir de n = 1 et donc convergente
puisque minorée. De plus, f est continue donc la limite de f doit être un point fixe de f, et
donc un zéro de F.
3) Pour ce point concernant la vitesse de convergence de la suite (unlnEN, nous avons besoin
d'un résultat (la formule de Taylor-Lagrange) qui ne sera développé que plus tard dans le
livre, au chapitre 29. Comme nous n'avons en fait besoin de cette formule qu'à l'ordre 2, nous
758

allons l'énoncer dans ce cas seulement et la prouverons à la suite de la présente démonstration,


afin de ne pas surcharger la preuve en cours.
Admettons donc momentanémen t que, pour tout x E [a, f3], il existe y E )a, x[ tel que

F(a) = F(x) + (a-x)F'(x) + (a ~ x)2 F"(y). (26.11)

Ceci étant, puisque dans notre cas F(a) = 0, on déduit de cette formule que

f( ) _ _ F(x) _ (a-x)2F"(y)
x -X F'(x) - a+ 2 F'(x).

Mais alors, pour tout x E [a, /3)


(a-x)2M2
0 ~ f(x) - a~ .
2 m1
Notons que F' étant supposée strictement positive, on a m1 > 0 puisque m1 est une valeur de
F'.
Appliquant cet encadrement à x = Un, il en résulte que pour tout entier naturel n,

M2 2
0 ~ Un+l - a~ - -(un - a) .
2 m1

Prouvons maintenant la formule (26.11). On procède exactement comme pour l'égalité des
accroissements finis. Le réel x étant fixé dans )a, f3], considérons la fonction auxiliaire <j> définie
pour t E [a, x] par
(t x) 2
<j>(t) = F(t) - F(x) - (t-x)F'(x) - k
2
où k est choisi de telle sorte que <j>(a) = 0 (inutile d'expliciter k qui clairement existe et
est unique puisque x =f. a). On a donc <j>(a) = 0 par définition mais aussi <j>(x) = O. Par le
théorème de Rolle appliqué à <j> sur le segment [a,xl, il existe c 1 E)a,x) tel que <!>'(ci)= O.
Or
<j>'(t) = F'(t) - F'(x) - k(t- x),
donc on a aussi <!>'(x) = O. On peut donc appliquer le théorème de Rolle à la fonction<!>' sur
le segment [c 1 , x] (ne pas oublier que Fest deux fois dérivable donc <j> est dérivable) et on
obtient ainsi l'existence d'un réel y E]c 1 ,x[ tel que <!>"(y)= O. Or, <!>"(y)= F"(y) - k, d'où
k = <!>"(y). Reportant cette valeur dans la formule définissant la fonction <j> nous obtenons
l'égalité cherchée (26.11).
Remarque. Le dernier point du théorème précédent montre que la méthode de Newton
est efficace car la suite (UnlnEN convergera vers le point a plus vite que ce que l'on pouvait
espérer a priori. En effet, par le théorème général du point fixe on pouvait s'attendre à ce f
soit contractante sur un petit intervalle contenant a puisque f'(x) = F(x)F"(x)/F'(x) 2 et que
f'(a) = 0 (F(a) = 0) et donc à ce que l'on ait

oû k désigne le rapport de contraction, conduisant ainsi à la majoration de l'erreur


759

Ici, le fait que If' (a) 1soit nul, et pas seulement plus petit que 1, nous a fait gagner en rapidité
car la majoration
M2
lun+l - al :(; - !Un - al 2
2m1
conduit à une majoration nettement plus performante de l'erreur. En effet, si on note K =
M2/lm1, on a KIUn - al :(; (KIUn-1 - al) 2, d'où en posant .Sn= KIUn - al, .Sn:(; .S~_ 1, qui
conduit immédiatement à .Sn:(; .Sf, c'est-à-dire

Si (Klu0 - al) < 1, la suite de terme général (KIUo - aj).zn converge bien sûr beaucoup plus
vite vers O qu'une simple suite géométrique kn, k < 1.
En pratique, on aura cependant intérêt à partir d'une condition initiale Uo = c proche de
a afin que le début du processus ne soit pas trop lent. Cela nécessite d'avoir au préalable assez
bien cerné le zéro a de la fonction F.

EXEMPLE 26.55. Reprenons, pour illustrer ce que nous venons de dire. l'exemple de la
méthode de Babylone. On a dans ce cas

F(x) = x 2 - a, F'(x) = lx et F"(x) = 2.


Nous sommes donc bien dans le cadre d'application du théorème précédent et, ici, m 1 = lfo
et M2 = 2. Il en résulte que l'on a le contrôle

au lieu de l'attendu
1
IUn+l -val:;;;; 21un -val
donné par le fait que dans cet algorithme la fonction f est contractante avec un rapport
inférieur à 1/2.
760

V. EXERCICES
26.1. 2. Plus généralement, montrer que si f est dé-
rivable à droite et à gauche au point a alors f
Soit f la fonction définie sur ll par admet une dérivée symétrique en a et expliciter
f~(u) en fonction de f~(u) et f~(u).
f{x) = x 2 sin ~ six=/= 0 et f(0) = O. 3. Etudier la réciproque en considérant la fonc-
X
tion f définie par
Montrer que f est dérivable mais n'est pas de
classe C 1 sur ll. f(x) = xsin ~six=/= 0 et f{0) = O.
X

26.2.
26.6.
Déterminer toutes les fonctions f : ll -+ R,
dérivables en 0 et vérifiant les équations fonc- En utilisant le théorème des accroissement finis,
tionnelles suivantes montrer les inégalités suivantes :

1. Vx E ll, f{2x) = 2f(x). Vx E ll, 1 sin xi :c; lxl


2. Vx ER, f(2x) = f(x)2. Vxè::0, 0:c;ln{l+x):c;x.

26.3.
26.7.
Soit [u, b] -, R, a < b, dérivable sur [u, b]
et telle que f( u) = O. Montrer que s'il existe Soit f une fonction définie sur un intervalle non
ex 2 0 tel que pour tout x E [u, b], on ait vide I, à valeurs réelles. Montrer que s'il existe
lf'(x)I :c; cxlf(x)I, alors f est identiquement nulle. ex > 1 et k 2 0 tels que pour tout (x, y) E I2 ,
on ait
lf{x) - f{11ll :c; klx -11l'X,
26.4. alors f est constante sur I.

Montrer que la fonction f définie sur ll par 26.8.


2
f{x) = e-l/x six=/= 0 et f(0) = 0, Soit f: [0, +oo[-+ R une fonction continue telle
que f(0) = O. On suppose que f est dérivable sur
00
est de classe C et que toutes ses dérivées suc-
]0, +oo[ et que sa fonction dérivée est croissante.
cessives à l'origine sont nulles. On dit, d'une
On définit sur ]0, +oo[ la fonction g par
telle fonction, qu'elle est plate à l'origine.
g(x) = f(x).
26.5. X

Montrer que la fonction g est croissante.


Si f est une fonction définie sur un intervalle
]a - r, a+ r[, a ER, r E R't, on pose lorsque 26.9.
cela existe
Soit f : [u, b] -, R une fonction continue sur
f'( )·= r f{u+h)-f(u-h) [u, b], vérifiant f(u) = f{b), et admettant en
s a · h1.To 2h
tout point de ]u, b[ une dérivée à droite et une
et on appelle ce nombre la dérivée symétrique dérivée à gauche.
de f au point a. 1. Montrer qu'il existe c E]u, b[ tel que
1. Montrer que si f est dérivable au point u f~(c).f~(c) :c; O.
alors f admet une dérivée symétrique au point 2. Quel théorème retrouve-t-on si f est déri-
a et que f~(u) = f'(u). vable sur ]u, b[?
761

26.10. et supposons que

Soit f : [a, +oo[---+ IR une fonction continue


sur [a, +oo[, dérivable sur ]a, +oo[ et telle que
limH+oo f(t) = f(a). Montrer qu'il existe alors c E]o, b[ tel que
f(nl(c) = O.
Montrer qu'il existe c E]a, +oo[ tel que
f'(c) =0.
26.14.
26.11.
Cette génémlisation du théorème de Rolle
Soient f et g des fonctions à valeurs réelles permet de démontrer la formule de Taylor-
définies et continues sur un segment [a, b] et Lagmnge que nous verrons dans un chapitre
dérivables sur ]a, b[. ultérieur.
Soient n E N*. I un intervalle non vide de
1. A l'aide de la fonction auxiliaire définie sur JR, a, b E L a < b et f une fonction à valeurs
[a, b] par réelles, n fois dérivable sur I. Supposons que
<l>(x) = (f(b) -f(a))g(x)- (g(b) - g(a))f(x), f(a) = f'(a) = ••• = f(n-ll(a) = f(b) = O.
montrer qu'il existe c E]a, b[ tel que
Montrer qu'il existe alors c E]o, b[ tel que
(f(b)-f(a))g'(c) = (g(b)- g(a))f'(c). f(nl(c) = O.

2. Quel théorème retrouve-t-on si g(t) =t pour 26.15.


tout t E [a, b] ?
Cet exercice présente un théorème dû au ma-
26.12.
thématicien Gaston Darboux, qui montre que
le fait de posséder la propriété des valeurs in-
termédiaires, n'est pas l'apanage des fonctions
Soient f, g et h trois fonctions à valeurs réelles
continues, puisque toute fonction dérivée la pos-
définies et continues sur un segment [a, b] et
sède. Soit f une fonction dérivable sur un inter-
dérivables sur ]a, b[.
valle non vide I. Soit <X= f'(a) < 13 = f'(b),
1. A l'aide de la fonction auxiliaire définie sur a, b E I, deux valeurs de la fonction f'. Nous
[a, b] par voulons montrer que pour tout y E]<X, /3[, il
existe c E]a, b[ tel que f'(c) = y.
f(a) f(b) f(x)
<t>(x) = g(a) g(b) g(x) , 1. Soit g la fonction définie sur I par g(x) =
h(a) h(b) h(x) f(x) -yx. Montrer que g'(a) < 0, g'(b) > 0
et en déduire que g n'est pas injective, donc
montrer qu'il existe c E]a, b[ tel que qu'il existe xo, x1 E [a, b], xo < x1, tels que
g(xo) = g(xi).
f(a) f(b) f'(c)
2. En déduire le résultat annoncé en appliquant
g(a) g(b) g'(c) = O.
h(a) h(b) h'(c) le théorème de Rolle à la fonction g entre les
points xo et x 1.
2. Quel théorème retrouve-t-on s1 h(t)
pour tout t E [a, b]? 26.16.

26.13. Etudier la convergence de la suite (Un)nEN dé-


finie par la relation de récurrence
Soient n E N*, a, b E IR, a < b et f une fonction
de classe cn-l sur ]a, b[, n fois dérivable sur uo = c 2 0 et \fn EN, Un+l = J4 + Un.
]a, b[. Soient

ao = a < a 1 < · · · < Œn =b


762

26.17. 26.18.

Etudier la convergence de la suite (unlnEN dé- En utilisant la méthode de Newton, donner une
finie par la relation de récurrence valeur approchée à 1o-9 près de l'unique racine
strictement positive de l'équation
2
uo = C 2 0 et Vn EN, Un+l = -,--2.
+un x 6 -x-1 = O.
Chapitre 27
LES FONCTIONS INTÉGRABLES

OMMENT déterminer l'aire d'une figure plane? Cette question s'est posée, dès !'Anti-

C quité, aux mathématiciens grecs. La figure la plus simple est le rectangle dont l'aire
est le produit de la longueur par la largeur, puis le triangle rectangle, qui n'est que
la moitié d'un rectangle; l'aire d'un triangle quelconque se calcule alors en le partageant, à
l'aide d'une hauteur, en deux triangles rectangles. Nous arrivons ainsi, comme les Grecs, à
calculer l'aire d'un polygone quelconque; il suffit de le décomposer en triangles, puis de faire
la somme des aires de ces triangles.
Mais que faire si le contour de la figure est une courbe non rectiligne, par exemple un cercle?
C'est Archimède qui répond partiellement à la question, en donnant une approximation de
cette aire par le moyen d'un encadrement de celle-ci entre celles des polygones inscrits et
circonscrits au cercle. En appliquant la même méthode, il calcule aussi l'aire sous l'arc d'une
parabole, puis l'aire et le volume de la sphère.

L'introduction des coordonnées au xvvne maticiens de l'époque, celle de savoir com-


siècle, par Descartes et Fermat, facilite ment on peut obtenir une quantité finie en
en partie la résolution de ce problème. additionnant des termes à l'infini.
Une courbe est représentée dans un repère
(OXY) par le graphe d'une fonction f défi- -y
nie sur un intervalle [a, b]. Le problème se
réduit alors à la détermination de l'aire com-
prise entre le graphe de f, l'axe (OX) et les 1Jk
deux verticales x = a et x = b.
En 1636, Fermat calcule l'aire sous la courbe
d'équation -y = x'", entre les bornes x = 0 et
x = l, avec l > 0, et ex un rationnel distinct X

de -1. 0
Dans sa preuve, il choisit astucieusement a
une famille de rectangles verticaux de plus
en plus fins (voir figure ci-contre), dont la
somme des aires approche la surface cher- FIGURE 27.1. Une famille de
rectangles
chée. Une question se pose alors aux mathé-

Expliquons d'abord en quoi consiste cette somme infinie. Divisons le segment [u, b] en
n parties [u,x,l,[x,,x:zl, ... ,[xn-1,bl et posons 1Jk = f(xk) pour k = 0,1, ... ,n- l. La
somme des surfaces des rectangles verticaux, de bases les [xk, Xk+iL et de hauteurs 1Jk, est
Sn= 1JoLho+· · ·+-Yk~xk+· · ·+1Jn-1~Xn-1 où ~Xk = Xk+1-Xk· On observe bien que sin est
de plus en plus grand, la somme Sn contient un nombre croissant de termes. Leibniz à l'aide
de sa théorie des infinitésimaux, décide que Sn est une quantité finie quand n devient infini
et la désigne par J-y dx. Pourquoi cette notation? Simplement parce que le symbole J est
la première lettre du mot latin summa qui veut dire somme; quant à l'expression intégrale,
du latin integer signifiant entier, elle a été proposée par son élève Jean Bernoulli, afin de
distinguer une somme ordinaire de la somme d'une infinité de termes.
764
~
Maintenant, faisons varier la borne b et calculons, comme le faisait Leibniz, la différence
Il)
Ill
de deux termes consécutifs de Sn, soit .1Sn = Sn - Sn-1 = f(xn).1xn. En divisant par .1xn,
~
t'CI
on obtient ~L>Xn
= f(Xnl- En prenant .1xn infiniment petit, en termes modernes tendant vers
~ 0, Leibniz conclut alors que l'intégration est l'opération inverse de la dérivation puisqu'en
dérivant l'intégrale, on retrouve la fonction. Ainsi, grâce au calcul infinitésimal, un lien est
:=:
établi entre la dérivée et l'intégrale. Malgré ses étonnants exploits, le calcul infinitésimal,
~
o..
inventé indépendamment par Newton et Leibniz, resta juqu'à la fin du XVIIIe siècle source
d'erreurs et de confusions.
Dès le début du XIXe siècle, Cauchy et Weierstrass débarrassent l'analyse des infinité-
simaux, et de leurs incohérences, en forgeant le concept de limite et en exigeant une parfaite
rigueur dans les démonstrations. Le problème qui se pose alors n'était plus comment calculer
une intégrale, mais déterminer quels types de fonctions on peut intégrer. Il est remarquable
qu'une grande classe de fonctions, introduite ici dans un contexte apparemment différent, les
fonctions continues, soient le principal exemple de fonctions « intégrables ». Mais les séries
de fonctions élémentaires et les séries de Fourier 1 vont faire apparaître, comme limite, des
fonctions peu régulières, en particulier non nécessairement continues.
Riemann travaille alors l'élaboration d'une théorie permettant d'intégrer d'autres fonc-
tions que les fonctions continues. Il propose à cette fin une définition de l'intégrale que nous
reproduisons ci-dessous.

« L'incertitude qui règne encore sur quelques la propriété, de quelque manière que les ô
points fondamentaux de la théorie des in- et les é: puissent être choisis, de s'approcher
tégrales définies nous oblige à placer ici indéfiniment d'une limite fixe A, quand les ô
quelque remarques sur la notion de l'inté- tendent tous vers zéro, cette limite s'appelle
grale définie, et sur la généralité dont elle la valeur de l'intégrale définie J! f(x)dx. Si
est susceptible. Et d'abord que doit-on en- la somme S ne tend vers aucune limite, la
tendre par J! f(x)dx? notation J!f(x)dx ne peut avoir aucune si-
Pour répondre à cette question, pre- gnification. »
nons entre a et b une série de valeurs
X1, Xz, · · · , Xn-1, rangées par ordre de gran-
deur, depuis a jusqu'à b, et désignons pour
abréger x1-a par ô1, x2-X1 par ô2, ... , b-
Xn-1 par Ôn; soient, en outre, ti des nombres
positifs plus petits que l'unité. Il est clair que
la valeur de la somme S = ô1f(a + é:161) +
· · · + Ônf(Xn-1 + é:nÔn) dépendra du choix
des intervalles ô et des fractions é:. Si elle a G. F. B. Riemann (1826-1866)

C'est en particulier avec Lebesgue que l'intégrale moderne trouva son cadre général et
prouva son efficacité en analyse, mais un exposé sur l'intégrale de Lebesgue dépasse largement
le cadre du présent ouvrage, et ne sera présenté que dans le cours de L3. Il ne sera donc question
dans ce chapitre que de l'intégrale au sens de Riemann. Toutes les fonctions considérées dans
la suite, sauf indication contraire, seront à valeurs réelles.

1
C'est Fourier qui nota J~ f(t)dt l'intégrale J f(t)dt avec ses deux bornes a et b.
765

Avertissement. Dans ce chapitre, pour donner des exemples explicites, nous


admettrons les propriétés usuelles des fonction élémentaires, rappelées dans la
partie Bases. Ces propriétés seront démontrées au chapitre 28.

1. INTÉGRALE D'UNE FONCTION EN ESCALIER


L'objectif principal de ce chapitre est d'associer à une fonction f définie sur le segment [u, b]
un nombre qui mesure l'aire de la portion du plan comprise entre le graphe de f, l'axe des
x et les droites verticales x = a et x = b. L'idée consiste à diviser [u, b] en n segments
[u, x 1], [x 1, x:zl, ... , [xn-1, b] et à approcher cette partie du plan par des familles de rectangles c-:
C"'I
dont les côtés horizontaux sont les [xi, Xi+1L en faisant varier le nombre n de points Xi et les ..d
ü
longueurs des côtés verticaux.
À chaque famille de rectangles correspond une fonction dite en escalier, définie sur [u, b],
qui représente simplement les longueurs algébriques des côtés verticaux (voir les figures sui-
vantes).

y y

r7
1 1 r,
1 1 1 1
1 1 1 r,
1 1 1 1
X 1 11 1 X

0 a 0
b a : : b
L...J

FIGURE 27.2. Une famille de FIGURE 27.3. Le graphe d'une


rectangles fonction en escalier

Dans la suite, on considère deux réels a et b, avec a< b.

Définition 27.1. Une subdivision du segment [a, b] est une suite finie (xdo,;;i,;;n de points
de [a, b] vérifiant a= Xo < X1 < · · · < Xn-1 < Xn = b.

Si (xdo,;;i,;;n et (yj)o,;;j,;;p sont deux subdivisions de [u, b], on note (xdo,;;i,;;n V (yj)o,;;j,;;p la
subdivision de [u, b] dont l'ensemble des points est la réunion de ceux de (xdo,;;i,;;n et (yj)o,;;j,;;p-

Définition 27.2. Une fonction cp définie sur [a, b] est en escalier s'il existe une subdivision
(xdo,;;i,;;n de [a, b] et n réels (cdo,;;i,;;n tels que cp soit constante sur chaque ]xi, XH1[, et de
valeur Ci.
Les fonctions constantes sont évidemment des fonctions en escalier.

EXEMPLE 27.3. Soit fla fonction définie sur [O, 1] par f = -1 sur JO, 1/2[, f 1 sur
1]1/2, 1[, f(O) = 0, f(l/2) = 2 et f(l) = -1/2. La fonction f est en escalier sur [O, 1].
766

EXEMPLE 27.4. Si t est un réel, on note [t] sa partie entière. La fonction E définie sur
1 [a, b] par E(t) = [t] est une fonction en escalier.

Soit cp une fonction en escalier sur [a, b]; une subdivision (xdo,;;i,;;n de [a, b] est dite
adaptée à cp si, pour tout O :::; k :::; n - 1, il existe un réel Ck tel que cp soit constante sur
]xk, Xk+l [, de valeur ck. Par définition, une fonction en escalier possède toujours une subdivision
adaptée.

t-ro,postiî9Jl•?ii,~ s~ü:nt>I. ùpr'étilrffl.;~.


fon~twns l<t>l,. :\<t1; èp'+i i(w1f ~~fen .· ·
PREUVE. Il est clair que les fonctions lcrl et Àcp sont en escalier.
Soient maintenant (xdo,;;i,;;n et (1Jj)o,;;i,;;p deux subdivisions de [a, b] adaptées respective-
ment à cp et 1.j>. La subdivision (xdo,;;i,;;n V (yj)o,;;j,;;p est adaptée en même temps aux deux
fonctions cp et 1.j>. On la note (zk)o,;;k,;;q- Nous avons cp + tl> = ck + c( et cptj> = ckc( sur
]zk, Zk+l [ où ck (resp. c() désigne la valeur de cp (resp. tl>) sur l'intervalle ]zk, Zk+l [ pour
tout entier O :::; k :::; q - 1. Nous venons de prouver que cp + tl> et cptj> sont des fonctions
en escalier. ■

Test 27.1. Test 27.3.


Si t est un réel on note [t] sa partie entière. Soit Soient cp .et 1j, deux fonctions en escalier de
f l'application définie sur [0, 1] par f(0} = 0 et [0, 1] dans [0, 1]. La composée cp o 1j, est-elle en
f(t) = [1/t] si t E]0, 1]. La fonction f est-elle escalier sur [0, 1]?
en escalier sur [0, 1]? Même question pour la Test 27.4.
fonction t H [t 2] sur le segment [0, 10].
Soit cp une fonction en escalier sur [a, b]. Les
Test 27.2. affirmations suivantes sont-elles vraies?
Soit cp une fonction en escalier sur [a, b]. Les
affirmations suivantes sont-elles vraies ? 1. cp est continue sur [a, b].
1. cp est bornée sur [a, b]. 2. cp possède une limite à gauche et à droite en
2. cp est monotone sur [a, b]. tout point de [a, b].

Soient cp est une fonction en escalier sur [a, b] et X= (xdo,;;i,;;n une subdivision adaptée
à cp. Si Ck désigne la valeur de cp sur ]xk, Xk+l [, on pose
k=n-1

Ix(cr) = L. (xk+l -xk)ck.


k=O

Le nombre défini ci-dessus mesure l'aire de la famille de rectangles associée à cp et à la


subdivision X.

PREUVE. Si x est un point de l'intervalle ouvert ]a, b[, on note~ la subdivision constituée
des trois points a, x et b.
Calculons le nombre ly( cp) où ~ = X V~ avec X = (xi)O,;;i,;;n une subdivision de [a, b]
adaptée à cp et x un point quelconque de [a, b]. Nous avons deux possibilités pour le point
x : s'il est égal à l'un des xk, alors ~ = X et dans ce cas I;('( cp) = lx( cp); si en revanche, il
767

est différent de tous les Xk, il existe alors un unique ko tel que x E]xko, Xko+l [. La fonction cp
a la même valeur cko sur les deux intervalles ]xko, x[ et ]xko+l, x[. En tenant compte de cette
remarque nous avons

L'identité ci-dessus montre\ue l,1_>( cp) = lx( cp ). En résumé, nous avons montré que le nombre
l,1_>{ cp) n'est pas modifié si on ajoute un point quelconque à la subdivision X.
Si Y= {yi)O,s::i(p est une autre subdivision adaptée à cp. La subdivision ..YVY est obtenue en
adjoignant successivement à X les p-1 points de Y, c'est-à-dire que ..YVY= XV91 V.· .Vi)p-l ·
Nous pouvons donc conclure que ly (cp) = lx (cp). ■

Test 27.5. Test 27.6.


Soient n E N* et f la fonction définie sur [O, 1] Donner un exemple de fonctions en escalier cp
par f(t) = [nt]. Montrer que f est en escalier et 1j, sur [O, 1] vérifiant J! cp(t)dt = J!lj,(t)dt
sur [O, 1] et calculer son intégrale. et cp # lj,.

PREUVE. Si X= (xdo,e;;i(n est une subdivision de [a, b] adaptée à cp, alors elle l'est également
pour la fonction en escalier Àcp. Notons ck la valeur de cp sur l'intervalle ]xk, Xk+i[ pour
k = 0, 1 · · · , n - 1. Le nombre Àck est la valeur de la fonction Àcp sur ]xk, xk+l [. Nous avons
donc
k=n-1
lx(Àcp) = L (xk+1-xk)Àck=Àlx(cp),
k=()

ce qui montre 1). Pour montrer la propriété 2) de la proposition, nous choisissons deux sub-
divisions X = (xdo,e;;i,;;n et Y = (yj)O,e;;i(P adaptées respectivement à cp, et 1j, et on note
Z = (zk)o,e;;k(q = X V Y. La subdivision Z est adaptée aux fonctions cp et lj,. Donc elle est
adaptée à la somme cp + 1j, qui sur chaque intervalle ]zk, Zk+l [ prend la valeur Ck + cL si ck
(resp. c() désigne la valeur de cp (resp. 1j,) sur ]zk, Zk+l [. Nous avons l'égalité suivante :

k=q-1 k=q-1 k=q-1


lz(cp+lj,) = L (zk+1-zk)(ck+c() = L (zk+1-zk)ck+ L (zk+1-zk)c(.
k=O k=O k=O

L'identité ci-dessus montre bien que lz ( cp + 1j,) = lz (cp) + lz (1j,), ce qui nous permet de
conclure que

f( cp + 1j, )(t)dt = f cp(t)dt + f lj,(t)dt.



768

Test 27.7. Test 27.8.


Soient <p et 1jJ deux fonctions en escalier définies Soit <p une fonction en escalier sur [a, b] à va-
sur [a, b]. A-t-on leurs dans ~•.

r <p(t)1j!(t)dt = (r <p(t)dt)(J: 1j!(t)dt) ?


1. Montrer que 1/ <p est une fonction en escalier
sur [a, b].
2. A-t-on Jb _!_(tl dt= ~ 1
?
a <p O
<p(t)dt

La proposition suivante traduit simplement le fait que l'aire algébrique de la famille de


rectangles au-dessus de l'axe des x est positive.

Proposition 27Jt Sôient q> et1}1 deux fonétions en·êseàlîer définîes sur {n,b'J:Noma11ons
les propriétés suît1àntes : . .
1) si f: estpôsitîvésut {~,bl, .a'lorsf!<ett}dt ~o}·
2) · si ·<i> ~ '1>· sudà,bl, ·ak>~J!~(t)dtz J! lJ,(t}dt,
PREUVE. Si X(xdo,;;i,;;n est une subdivision adaptée à la fonction en escalier <p, alors le
nombre Ix(cp), qui est égal à f! cp(t)dt, est une somme de réels positifs, donc il est positif.
Soit maintenant 1j., une fonction en escalier sur [a, b] telle que cp )! lj.,. La différence cp-tj.,
est une fonction positive en escalier sur [a, b], donc, d'après la propriété 1), son intégrale est
positive. Par application de la proposition 27.7, on en déduit que f! cp(t)dt- f!tJ.>(t)dt 2 0,
ce qui entraîne la propriété 2) de la proposition. ■

~rolùûre 21~,. 'l'ô't4t.JJ/ojj.ctioJ1.• en tscali,er M1ot1îl véri]lé l¾nëg.al~

; n:q>(t}dtj ~ r lcp{t)ldt•.

PREUVE. Nous savons que pour tout t E [a, bl, -lcp(t)I ~ cp(t) :::: lcp(t)I. En utilisant la
propriété 2) de la proposition ci-dessus, on obtient les inégalités

-f lcr(t)ldt ~ f cp(t)dt:::: f lcr(t)ldt,

ce qui nous permet d'affirmer que

If cp(t)dtl ~ f lcp(t)ldt.

Test 27.9. Test 27.10.


Soit <p une fonction en escalier sur [O, 1] par- Soit <p une fonction positive en escalier sur
tout > 0, sauf au point 1/2. Peut-on affirmer [a, b]. Que dire de <psi J~ <p(t)dt = O?
que J~ <p(t)dt;::: 0?
769

Il. FONCTION S RIEMANN-I NTÉGRABL ES

Nous sommes maintenant en mesure d'exploiter la construction précédente de l'intégrale d'une


fonction en escalier pour définir une classe de fonctions qu'il est possible d'intégrer. La réponse
à cette question est intimement liée au problème du calcul de l'aire du cercle que nous avons
déjà évoqué. Nous savons que Archimède, pour calculer cette aire, encadrait le cercle entre
deux familles de polygones, inscrits et circonscrits. dont il savait calculer les aires, puis faisait
tendre le nombre de côtés de ces polygones vers l'infini. Il faut alors montrer que la limite des
aires des polygones inscrits est égale à la limite des aires des polygones circonscrits, pour se
convaincre que cette limite commune ne peut représenter autre chose que l'aire du cercle. Ce
faisant, on montre aussi que le cercle appartient à une classe de figures géométriques dont il
est possible de calculer l'aire. Suivant Riemann, nous utilisons ici exactement la même idée
dans le cadre plus simple des fonctions.

Il.1. Constructio n de l'intégrale de Riemann


Nous allons considérer pour une fonction bornée f sur [a, b] l'ensemble des fonctions en escalier
qui majorent f, et l'ensemble des fonctions en excalier qui minorent f. qui jouent le rôle des
polygones circonscrits et inscrits respectivement dans le calcul d'Archimède (notons que nous
considérons ici toutes les fonctions en escalier, et non simplement une suite particulière comme
Archimède). On introduit donc l'ensemble <D des fonctions en escalier cp sur [a, b] vérifiant
cp ~ f sur [a, bl, et l'ensemble'!' des fonctions en escalier 1), ayant la propriété f ~ 1), sur [a, b]
(voir les figures suivantes).
11 11

X X

b O a b

FIGURE 27 .4. Les graphes de f et qi. FIGURE 27.5. Les graphes de f et ljJ.

Notons I-, l'ensemble des réels J!cp(t)dt où cp E <D, et I+ des réels J!


1),(t)dt, où 1), E '!'.
Pour mettre en place l'analogue rigoureux de la méthode d'Archimède, nous allons d'abord
utiliser de manière cruciale les propriétés de borne supérieure et inférieure de la droite réelle.
Désignons par met M respectivement un minorant et un majorant de f sur [a, b]. L'en-
semble I- est non vide car il contient m(b - a), et il est majoré par (b - a) M. Il possède
donc une borne supérieure, .qui sera notée i~(f). De même, I+ a une borne inférieure qui sera
notée I~(f). Par définition de i~(f) et I~(f), nous avons i~(f) ~ I~(f).
Rien n'indique a priori que ces deux bornes soient égales, de la même manière que dans
l'exemple du cercle, il n'est pas évident a priori que les deux limites d'aires des polygones
inscrits et circonscrits soient les mêmes. La deuxième idée est donc de définir les fonctions
intégrables comme les fonctions pour lesquelles ces deux bornes coïncident. Nous sommes
770

donc partis de considérations heuristiques sur les propriétés intuitives des aires (ici, que l'aire
limitée par le graphe d'une fonction de '1' doit être plus grande que l'aire limitée par le
graphe de f, avec la propriété analogue pour les fonctions de <D), nous avons ensuite utilisé les
propriétés de la droite réelle, et nous en déduisons une définition de la classe de fonctions qui
se comporteront bien vis-à-vis du calcul des aires. C'est donc ainsi qu'une simple idée donne
lieu à la construction de nouveaux objets mathématiques.
Revenons maintenant à la construction détaillée de l'intégrale, et commençons par remar-
quer que si f est une fonction en escalier sur [a, bl, alors J!
f( t)dt est le plus grand élément de
J! J!
I-, donc f(t)dt = i~(f). Il est également le plus petit élément de I+, donc f(t)dt = I~(f).
Nous constatons donc, dans le cas des fonctions en escalier, l'égalité des deux nombres i~(f)
et I~(f) et leur coïncidence avec l'intégrale de la fonction sur [a, b].
Dans les deux exemples suivants, nous allons calculer, pour des fonctions f données ex-
plicitement, les nombres i~(f) et I~(f). Nous verrons dans le premier exemple que i~(f) est
strictement plus petit que I~(f). Ce qui montre que notre méthode du calcul de l'aire ne s'ap-
plique pas à toutes les fonctions. Le graphe de la fonction f utilisée dans le second exemple
n'est que le côté d'un triangle rectangle dont on connaît évidemment l'aire. Nous établirons
que les nombres i~(f) et I~(f) sont égaux et qu'ils coïncident avec l'aire d'un tel triangle.
EXEMPLE 27.10. Soit x la fonction définie sur [O, 1] par x(t) = 0 si t est rationnel, et
x(t) = 1 si test irrationnel. La fonction x est évidemment bornée sur (0, 1]. Montrons que
ib(xl < Ib(x).
► Soit q:> une fonction en escalier telle que q:> ,:;; X sur (0, 1]. Si (xk)o,s:k(n est une subdivision
de (0, 1] telle que pour tout t E]xk, Xk+l [ cp(t) = Ck avec k = 0, 1, ... , n - 1. L'intervalle
]xk, Xk+l [ est ouvert non vide, donc il contient au moins un rationnel, ce qui entraîne que
ck,:;; O. Nous déduisons donc que f ~ cp(t)dt::::; O. En prenant la borne supérieure de tous les
f ~ cp(t)dt, on peut conclure que ib(f) ,:;; O.
En utilisant le fait qu'un intervalle ouvert non vide contient au moins un irrationnel, on
peut prouver comme ci-dessus que IJ(x) 2: 1. En résumé nous avons iJ(f) < IJ(x).

EXEMPLE 27.11. Soit fla fonction définie sur [O, 1) par f(t) = cxt où ex> O. Calculons
f~ cp(t)dt.
► Pour n E N* et k un entier entre O et n, on pose xk = k/n. Soit q:> la fonction en
escalier constante de valeur kcx/n sur chaque intervalle [xk,Xk+d avec cp(b) = (n- l)cx/n.
La fonction 1\> est également constante de valeur (k + 1)cx/n sur chaque intervalle )xk, Xk+ll
avec 1\>(a) = cx/n. Par construction, nous avons q:>,:;; f,:;; 1\> sur [O, 1].
► Calculons maintenant f~ cp(t)dt. Par définition, ce nombre est égal à
k=n-1 k=n-1
L (xk+l -xk)cxxk =; L k.
k=0 k=0
Comme (n-1 )n/2 est la somme des entiers entre Oet n-1, en simplifiant par n, on obtient

, cx(n-1)
o cp(t)dt = 2n .
J
De la même manière on peut montrer que
771

Les inégalités

entraînent les relations

a(n-1):::::: . 1 (f):::::: 11 (f):::::: a(n+ 1)


ln "" ta "' 0 "' 2n ·
En faisant tendre n vers l'infini, nous obtenons que a/2 ~ ib(f) ~ Ib(f) ~ a/2. Nous avons
donc prouvé que i~(f) et I~(f) sont égaux à a/2. Or. la région située entre le graphe de f et
l'axe des x est un triangle rectangle dont l'aire est égale à a/2.

Test 27.11. Test 27.12.


Montrer que la fonction X du premier exemple Calculer i~ 1 (f) et 1~ 1(f) où f est la fonction
ci-dessus vérifie i6(x) = 0 et I6(x) = 1. définie sur [-1,2] par f(t) = ltl.

Voici maintenant la définition formelle de la propriété d'intégrabilité, qui suit ce que nous
avons annoncé.

Définition 27.12. Une Jonction f bornée sur [a, b] est dite intégrable si i~( f) = I~( f); cette
valeur commune est alors appelée l'intégrale de f sur [a, b] et notée f!f(t)dt.

Évidemment, par définition, une fonction en escalier est intégrable; en revanche, la fonction
X du premier exemple ci-dessus ne l'est pas.
Notons que si f est une fonction bornée et intégrable sur [a, bl, et si cp et 1j., sont deux
fonctions en escalier vérifiant cp ~ f ~ 1j., sur [a, bl, alors, par définition de l'intégrale de f,
nous avons les inégalités

f cp(t)dt ~ f f(t)dt:::; f lj.,(t)dt.

11.2. Opérations sur les fonctions intégrables

Dans ce paragraphe, comme nous l'avons fait pour les fonctions continues et dérivables, nous
nous intéressons aux propriétés algébriques de la notion d'intégrale, c'est-à-dire aux rapports
entre les propriétés d'espace vectoriel de l'espace des fonctions bornées sur [a, b] et la nouvelle
notion d'intégrale que nous venons de définir. Notons que nous ne parlons pas encore de la
structure d'algèbre naturelle de l'ensemble des fonctions, nous ne discuterons du produit de
deux fonctions, et de son rapport avec l'intégrale, que plus tard.

Pr.opositiÔtÎ ~1.13/ Soient A Ûn réel, f et g de.'11,$ fonctions bomée,s efint'éJ}mbles sur[a., b].
Alors les fonctions f + 9. et J.f sont intégTQ,bles- De plus

PREUVE. Soient f, g deux fonctions bornées et intégrables sur [a, b] et cp, lj.,, p et 8 quatre
fonctions en escalier vérifiant sur [a, b] cp ~ f ~ 1j., et p ~ g ~ 8. En sommant membre à

i
772

membre les inégalités précédentes, nous obtenons cp +p( f +g ( tl> + 0. Par définition des
nombres i~(f + g) et I~(f + g) nous avons

f (cp(t) + p(t))dt ( i~(f + g) ( I~(f + g) ( f (tl>(t) + 0(t))dt.


Nous savons grâce à la propriété 2 de la proposition 27.7 que

f cp(t)dt + f f(
p(t) = cp(t) + p(t))dt et f tl>(t)dt + f 0(t)dt = f (tl>(t) + 0(t))dt.
Les inégalités ci-dessus deviennent alors

f cp(t)dt + f p(t)dt ( i~(f + g) ( I~(f + g) ( f tl>(t)dt + r 0(t)dt.

Il en résulte, en fixant pet 0, et en prenant la borne supérieure (resp. inférieure) de tous les
nombres J! cp(t)dt (resp. J!tl>(t)dt), que l'on a les inégalités suivantes

f f(t)dt + f p(t)dt ( i~(f + g) ( I~(f + g) ( f f(t)dt + f 0(t)dt.

En faisant de même pour J! p(t)dt et J! 0(t)dt, il vient

f f(t)dt + f g(t)dt ( i~(f + g) ( I~(f + g) ( f f(t)dt + f g(t)dt.

Nous avons ainsi montré que i~(f + g) = I~(f + g) = J! f(t)dt + J! g(t)dt, ce qui établit
l'intégrabilité de f + g et l'identité

f f(t)dt + f g(t)dt = f f(t) + g(t)dt.

Pour prouver l'intégrabilité de Àf, et l'identité i\ f ! f( t)dt f! i\f(t)dt, on procède de la


même façon, en distinguant les cas i\ > 0, i\ = -1 et i\ < O. ■

Test 27.13. Test 27.14.


Soient f et g deux fonctions bornées sur [a, b]. Soient f et g deux fonctions bornées sur [a, b].
On note X l'ensemble des t E [a, b] tels que On suppose f + g intégrable sur [a, b]. Les as-
f(t) # g(t). Montrer que si f est intégrable et sertions suivantes sont-elles vraies?
X est fini, alors g est intégrable et 1. L'une des deux fonctions est intégrable.
J~f(t)dt = f~ g(t)dt. 2. Les deux fonctions sont intégrables.

II.3. Intégrale et inégalités


A l'encontre du paragraphe précédent, ce paragraphe n'a pas d'équivalent immédiat pour les
fonctions continues et dérivables. Il s'agit ici d'étudier les rapports entre la notion d'intégrale
et la relation d'ordre partiel qui existe sur les fonctions à valeurs réelles. Deux fonctions f et
g d'un ensemble E dans ~ peuvent en effet être parfois comparées; on dit par exemple que
773

f:::;; g si pour tout x de E, f(x) :::;; g(x). La relation ainsi définie sur l'ensemble IF'(E,IR} est
manifestement une relation d'ordre, qui n'est évidemment pas total en général (à moins que E
soit un singleton). Compte tenu des rapports que nous avons établis entre l'intégrale et l'aire
limitée par une fonction et l'axe des abscisses, il est crucial d'établir de manière formelle les
relations entre l'intégrale et cette relation d'ordre, pour les fonctions bornées sur un intervalle.

Proposition 27 .14. Soient À un réel, f et g deux fonctions bornées et intégrables sur {a, b].
Nous avons alors les deux propriétés suivantes :
1) si f est positive sur [a, bt alors J! f{t)dt ~ 0;
2) si f~g sur{a,b], alorsf!t(t)dt ~ f!g{t)dt. t--:
<N
..d
PREUVE. Soit f une fonction positive intégrable sur [a, b]. La fonction nulle est en escalier u
f!
sur [a, b] et nous avons O:::;; f. Donc O,::;; i~(f} = f(t)dt.
Soient f et g deux fonctions intégrables sur [a, b] vérifiant f ,::;; g. En appliquant la propriété
1 à la fonction positive g - f et en tenant compte de l'égalité f!(g(t) - f(t})dt = g(t} -f!
f!f(t}dt, on obtient f!f(t}dt:::;; f! g(t)dt. ■

Corolù;û_re.27.}.5~ (Pre~,êr~~;_<lE! 4-tmoy~~}.- .. ··• .·.· < c.


Soîtf wàr,/<11iêUOfi 6omée et in~t~i11f{11;·&j"[aiiefo <'q}.5'( m ~ ~ t :et respec-
tivementla .bor1u1 iriféf'ie'fJ,ré et s~ptr(eûfe;,d~f sùr [a.,bJ, 0,'tÎJrs.'lèt:~•:' • -
. 1 ••······11.... • .
µ= b~aLf(t)dt,

appartient au segment [m, M] ; on l 'appellê la valeur moyenne de f sur {a, b].

PREUVE. Nous avons m:::;; f ,::;; M; en utilisant la propriété 2) de la proposition ci-dessus,

f
on obtient
~ M(b -
m(b - a},::;; f(t}dt a}.

Un critère commode et utile pour prouver l'intégrabilité d'une fonction est donné par la
proposition suivante qui a l'avantage de ne pas faire intervenir les nombres I~(f} et i~(f).

Prp~tîon 27.~6.
Une}onctionf définie. et bornée sur [a,p} e$t intégrable si et seulement sÎJJQU1'tout;r, > 0,
il ~té deux/onctions en e.scalier <() et \11; telles que rp ~ f :$ i,p sur tout {a, bJ et.J!(tl> -
cp)(t)dt < e.

PREUVE, Supposons f intégrable et fixons un réel f. dans IR~. Appliquons à f./2 la propriété
que i!(f} (resp. I~(f)) est une borne supérieure (resp. inférieure). Il existe alors deux fonctions
en escalier <p et 1'> telles que <p ,::;; f :s; 1J> sur [a, b] et

i~(f) - f./2 < rcp(t}dt,::;; i~(f}, I~(f) :s; f 1J>(t)dt < I~(f) + f./2.

En tenant compte de l'égalité i~(f) = I~(f), et en utilisant les inégalités ci-dessus, on peut
conclure que O :s; f!(w(t) - cp(t))dt < f..
114

Prouvons maintenant la réciproque. Pour f. E IR~, soient cp et 1j, les deux fonctions en
escalier données par la propriété de la proposition. Nous avons les inégalités

Nous déduisons alors que

0 ~ I~(f) - i~(f) ~ f lj,(t)dt - f cp(t)dt < E..

Comme le nombre positif I~(f) - i~(f) est indépendant de f., il ne peut être que nul. ■

Soit f est une fonction définie sur [a, b]. Pour t dans [a, b], on note f+(t) = max(0, f(t))
et L(t) = min(0, f(t)).

Test 27.15. Test 27.16.


1. Vérifier que f = f+ + f _ et lfl = f+ - f -· On suppose f :::; g sur [a, b]. Montrer les
2. Exprimer f+ et Len fonction de f et lfl. inégalités suivantes : f+ ::,; g+, L ::,; 9-,
g+-f+:::; g-f.

Pr~i~,îi~!,lf•JS<ift f~~tfrJiJêtio"n~Jê.~,i~@ilill~~r
f+' L aôrit é.fJol~l:in~1,l~$; . . . ..
{~.;hl ·.A~~;lèi;tJfJ.~tf~-
.. . . . . . . . . •.
0

PREUVE. Montrons que f+ est intégrable. Soient f. E IR~, cp et 11> deux fonctions en escalier

vérifiant cp ~ f ~ 1j, et J!(tl>(t) - cp(t))dt < f.. Nous avons

cp+ ~ f+ ~ 11>+ et 11>+ - cp+ ~ 11> - cp.

Comme les fonctions cp+ et 11>+ sont en escalier sur [a, bl, nous avons

Grâce à la proposition 27.16, on peut conclure que f+ est intégrable sur [a, b]. De la même
manière on peut prouver l'intégrabilité de f _. ■

PREUVE. La fonction lfl est la différence de deux fonctions intégrables; donc elle aussi
intégrable. Montrons maintenant l'inégalité. Nous savons que -lfl ~ f :::; lfl. En intégrant
membre à membre ces inégalités, on obtient

-f lf(t)ldt ~ f f(t)dt:::; f lf(t)ldt,

ce qui entraîne If! f(t)dtl:::; J! lf(t)ldt. ■


775

II.4. Intégrale et produit


r/J

Comme nous l'avons annoncé, nous revenons maintenant au problème du produit de fonctions.
Il ne faut bien entendu pas s'attendre à ce que l'intégrale du produit soit le produit des
intégrales. Pour le voir, il suffit de considérer la fonction cp constante et égale à 2 sur [0, 2].
!
,v
~
Alors r/J

I: cp(t)cp(t) dt= 8, J: cp(t) dt I: cp(t) dt= 16. 1


-9
Les propriétés sont donc plus subtiles. Commençons par le problème de l'intégrabilité. r/J
j
Proposition 27.19. Si f et g sont deux fonctions bornées et intégrables s'Ur [a,bL alors la
fonction fg l'est âtJ,Ssi.
PREUVE. Nous savons que le produit de deux fonctions bornées est une fonction bornée.
Commençons par prouver l'intégrabilité de fg dans le cas où f et g sont toutes les deux
positives sur [a, b]. Désignons par M (resp. N) un majorant strictement positif de f (resp.
de g) sur [a, b] et fixons t: dans JR<;_. L'intégrabilité de f et celle de g entraînent, d'après la
proposition 27.16 appliquée à M:N, l'existence de quatre fonctions en escalier cp, 1'>, p, et 8
vérifiant sur [a, b] les inégalités cp ,:::; f :S 1j> et p ,:::; g ,:::; 8, avec les conditions
b E b E
+ N.
J a (1j>(t) - cp(t))dt < M +N et
J a (8(t) - p(t))dt < M

Soient cp ', 1j> ', p' et 8' les fonctions définies sur [a, b] par

cp'(t) = max(0, cp(t)), 1j>'(t) = min(M, 1j>(t)), p'(t) = max(0, p(t)), 8'(t) = min(N, 8(t)).

On peut vérifier facilement que ces fonctions sont en escalier sur [a, b] et qu'elles obéissent
aux inégalités 0,:::; cp' ,:::; f,:::; 1'>',:::; M, 0,:::; p',:::; g ,:::; 8',:::; N. En faisant le produit membre à
membre nous obtenons cp'p',:::; fg,:::; 1j>'8'. Les deux fonctions cp'p' et 1j>'8' sont en escalier, il
reste maintenant à majorer J!1'>'(t)8'(t) - cp'(t)p'(t)dt.
De l'identité, 1j>'8' - cp'p' = (1'>' - cp')8' + (8' - p')cp', on deduit que

f (1j>'(t)8'(t) - cp'(t)p'(t))dt,:::; N f (1j>'(t) - cp'(t))dt + M f (8'(t) - p'(t))dt.

Puisque, 1'>' - cp' ,:::; 1j>- cp et 8' - p' ,:::; 8- p, en passant à l'intégrale, on obtient l'encadrement

f (1j>'(t)8'(t) - cp'(t)p'(t))dt,:::; N f (1j>(t) - cp(t))dt + M f (8(t) - p(t))dt.

Les inégalités J! 1j>(t) - cp(t)dt < M:N et J! 8(t) - p(t)dt < M:N entraînent alors
b E E

J a (1j>'(t)8'(t) - cp'(t)p'(t))dt < N M + N +MM+ N = t:.

Nous avons ainsi prouvé l'intégrabilité de fg dans le cas où f et g sont positives.


Soient maintenant f et g deux fonctions quelconques bornées et intégrables sur [a, b]. Sim
(resp. m') est un minorant de f (resp de g) sur [a, bl, les fonctions f-m et g-m' sont positives,
bornées et intégrables sur [a, b]. On déduit alors, d'après ce qui précéde, l'intégrabilité du
produit (f - m)(g - m'). L'égalité fg = (f - m)(g - m') + m'f + mg montre que fg est la
somme de trois fonctions intégrables; donc elle l'est également. ■
776

Prop~~iQn. 27.20. Jlnêgalitê de Cauchy-Schwartz)~ Si f et 9 sont tie'flll;'.Yjonctions


~mJeeJ:t iritégrables sur [n, b]

(f f(t}g(t)dtf ~{ f 2{t)dt.f gi(t)dt.

PREUVE. Soient À un réel, et f et g deux fonctions bornées et intégrables sur [a, b]. Comme
la fonction f + Àg est intégrable, son carré (f + Àg) 2 l'est également.
Si P(À) désigne f!(f(t) +Àg(t))2dt, il est égal à

f f 2 (t) + 2?-,. f f(t)g(t)dt + ?-,.


2
f g(t)2dt.

Si J! g(t)2dt = 0, Pest une fonction affine et ne peut donc garder un signe constant que si son
coefficient directeur, soit J!f(t)g(t)dt, est nul; dans ce cas l'inégalité cherchée est triviale,
0 ,( O. Si maintenant, J! g(t)2dt c/ 0, Pest un trinôme du second degré, positif sur lR tout
entier, donc son discriminant Li est négatif. Nous avons donc

Li= 4 (
Lb
f(t)g(t)dt
)2
- 4 L L
b
f 2 (t)dt.
b
g 2 (t)dt ,( O. ■

Test 27.17. Test 27.18.


Soient f et g deux fonctions bornées et inté- Soient (xïlo,:;t,:;n et (1/tlo,:;t,:;n deux suites fi-
grables sur [a, b]. Que peut-on dire de f et g nies de réels. Montrer en utilisant l'inégalité de
si Cauchy-Schwarz que

( L
b
f(t)g(t)dt
)2 = L
b
2
f (t)dt. Lb
2
g (t)dt?

II.5. Deux familles de fonctions intégrables


Dans cette partie nous allons prouver l'intégrabilité des fonctions appartenant à deux grandes
familles, à savoir la famille des fonctions continues et celle des fonctions monotones. Les
preuves proposées dans la suite sont basées sur une construction judicieuse de fonctions en
escalier. Dans le cas des fonctions continues, cette construction fait appel à la propriété de
la continuité uniforme vérifiée sur un segment par toutes les fonctions continues. Dans le cas
des fonctions monotones, elle repose sur l'existence de limites à gauche et à droite en tout
point. On peut voir ce paragraphe comme une première voie vers une justification abstraite
du calcul d'Archimède, le cercle étant une courbe continue (il faut bien évidemment encore
travailler pour donner un sens rigoureux au calcul des aires de parties du plan en général).

Théorème 27.21. Toute fonction monotone sur [a, bJ est intégrable.

PREUVE. Soit f une fonction monotone sur [a, b]. Quitte à prendre -f, on peut supposer
que f est croissante. Elle est minorée par f(a) et majorée par f(b) sur [a, b]; donc elle est
bornée sur ce segment.
777

Soient E E lR"t- et n EN* tels que (b - a)(f(b) - f(a))/n < E. Posons pour tout entier k
entre 0 et n, Xk = a + k (b-a).
n
Soient cp et 1j, les deux fonctions en escalier sur [a, b] définies
par cp(a) = f(a) et lj,(a) = f(a), cp(t) = f(xk) et lj,(t) = f(xk+il pour tout t E]xk, Xk+il
et tout k = 0, 1 ... , n - 1. Comme f est croissante nous avons cp ~ f ~ lj,. Le nombre
f!(tl>(t) - cp(t))dt est égal à

k=n-l b- a k=n-l b- a
L (xk+l -xk)(f(xk+il -f(xk)) = ~ L (f(xk+il - f(xk)l = ~(f(b) - f(a)).
k~ k~

Le choix (b - a)(f(b) -f(a))/n < E permet d'en conclure que f!(t!>(t) - cp(t))dt < E. Nous
avons ainsi, grâce à la proposition 27.16, établi l'intégrabilité de f. ■

PREUVE. Soit f une fonction continue sur [a, b]. Nous rappelons qu'une telle fonction est
bornée et uniformément continue sur [a, b]. Si nous appliquons cette dernière propriété à
E = 4 (b~al où E est un réel fixé stritement positif, alors il existe TJ E lR"t- tel que si t et t' de
1

[a, b] vérifient lt' - tl < TJ, alors lf(t') - f(t)I < E 1•


Soit n un entier naturel non nul tel que b~a < TJ. Notons pour tout entier k entre 0
et n, xk = a+ k (b-a). n
Soient cp et 1j, les deux fonctions en escalier sur [a, b] définies par
cp(a) = f(a) - E et tj,(a) = f(a) + E 1 , cp(t) = f(xk) - E 1 et tj,(t) = f(xk) + E pour tout
1 1

t E]xk, xk+il et tout k = 0, 1 ... , n - 1. La propriété de la continuité uniforme, appliquée à


t' = xk et t E]xk, Xk+iL montre que cp ~ f ~ lj,. Le nombre f!(tl>(t)- cp(t))dt est strictement
plus petit que E puisqu'il est égal à
k=n-1

L (xk+
~
1 -xk)(f(xd +E 1
- f(xk) +E 1
) = 2E'(b - a)= i·
Nous avons ainsi, toujours grâce à la proposition 27.16, prouvé l'intégrabilité de f. ■

Grâce au théorème précédent on peut affirmer par exemple que tous les polynômes sont
intégrables. Les fractions rationnelles le sont également sur tout segment contenu dans leur
ensemble de définition.

II.6. Convention et relation de Chasles


Soit f une fonction bornée intégrable sur [a, b]. Considérons la relation suivante, dite de
Chasles, où c est un réel de [a, b]

f f(t)dt = J: f(t)dt + r f(t)dt.

Si on garde à l'esprit l'idée que l'intégrale est une aire (algébrique), l'identité ci-dessus traduit
simplement que l'aire d'une partie est la somme des aires de ses différentes composantes.
On peut se convaincre facilement, en faisant un dessin par exemple, que la relation (*)
est vérifiée par toutes les fonctions en escalier. En revanche pour les fonctions quelconques
intégrables sur [a, bl, sa validité nécessite l'intégrabilité de telles fonctions sur [a, c] et [c, b].
778

~!~:J'i':.ltSi'i. i~fflt~f,~ Jôi~/~6''i'tir;(~,'.J,lt~ê,,iJn."~it&fl~A•i-il>'Noûs

ES~1:f~J~~~ÛJ}~tl•~tfr~1:,i:~·.~1
2) pour toute -E [n,bJ, si î .est intigro,ble surfa1 c] et fc,11}, alôr{êlle"lr'esfstkr[t:t,bJ
3). si f est· intégroble su.r [o., b], alors pour tout t>E fa; b.} f .vérifi~ la 'relati()n de, Okasleg
-- : - --, - , - - - - - -_ " - f_ ,, ' ;- ,,_ - - ' - - - -- - -- - ' - - --· - ' - - ~- o- "c- _- -

PREUVE. Prouvons la propriété 1. Soit f bornée et intégrable sur [a, b]. Fixons E E ~~, x
et y dans [a, b] avec x :::::; y. Il existe deux fonctions cp et 1jJ en escalier sur [a, b] vérifiant
cp :::::; f :::::; 1jJ et J!(ljJ(t) - cp(t))dt < t:. Notons cp 1 et 1)> 1 respectivement les restrictions
de cp et 1jJ à [x, y]. Nous avons évidemment sur le segment [x, y], (f)1 :::::; f :::::; 1)>1. Comme
J~(cp 1(t)-1)> 1(t))dt:::::; J!(ljJ(t)- cp(t))dt, on peut en déduire que J~(cp1(t)-1)>1(t))dt < [.
Nous avons ainsi établi l'intégrabilité de f sur [x, y].
Montrons maintenant la propriété 2). Soient c E [a, b] et E E ~~; l'intégrabilité de f sur
[a, c] (resp. [c, bl) entraîne l'existence de deux fonctions (f)1 et 1P1 (resp. (f)2 et 1)> 2) en escalier
sur [a, c] (resp.[c, bl) telles que

(resp. (f)2 :::::; f :::::; 1P2)


et

Soient cp et 1jJ deux fonctions définies sur [a, b] par cp (t) = cp 1(t) et 1jJ (t) = 1jJ 1 ( t), si t E [a, cl
et cp(t) = cp 2 (t) et ljJ(t) = 1)> 2 (t), si t E]c, b]. Il est facile de voir que cp et 1jJ sont en escalier
sur [a, b] et que

On déduit de la relation ci-dessus que J!(ljJ(t) - cp(t))dt < E, ce qui permet de conclure que
f est intégrable sur [a, b].
Il reste à prouver la relation de Chasles pour c E [a, b] et f intégrable sur ce segment.
Pour E E ~~, il existe deux fonctions cp et 1jJ en escalier sur [a, b] telles que cp :::::; f :::::; 1jJ et
J!(ljJ(t) - cp(t))dt < E. En intégrant sur [a, cl, et sur [c, bl, les inégalités cp :::::; f :::::; 1)>, on
obtient que

f cp(t)dt:::::; f f(t)dt:::::; f 1)>(t)dt et r r r cp(t)dt:::::; f(t)dt:::::; ljJ(t)dt.

La somme membre à membre des inégalités ci-dessus entraîne que

f cp(t)dt + r cp(t)dt:::::; f f(t)dt + r f r f(t)dt:::::; ljJ(t)dt + ljJ(t)dt.

Comme les fonctions en escalier vérifient la relation de Chasles, on en déduit alors l'encadre-
ment
r cp(t)dt:::::; f f(t)dt+ r r f(t)dt:::::; ljJ(t)dt. (**)
779

En intégrant cette fois sur [a, b] les inégalités cp ~ f ~ lj,, on obtient

f cp(t)dt ~ f f(t)dt ~ f lj,(t)dt. (* * *)

La différence membre à membre de (**) et (* * *) donne les inégalités

f cp(t)dt- f lj,(t)dt ~ J: f(t)dt + r


f(t)dt- f f(t)dt ~ f lj,(t)dt - f cp(t)dt.

En tenant compte de J:(lj,(t) - cp(t))dt < f, on obtient l'encadrement i:-.:


tN

-r < J: f(t)dt + r f(t)dt- f f(t)dt < r.


.d
ü

Puisque le nombre J~ f(t)dt + J! f(t)dt - J: f(t)dt est indépendant de f, on peut conclure


que J~ f(t)dt + J: f(t)dt - J: f(t)dt = 0, c'est-à-dire que

J: f(t)dt + r
f(t)dt = f f(t)dt.

Afin de faciliter les calculs, nous adopterons la convention

[ f(t)dt = - f f(t)dt.

Attc11t ion Sens des bornes d'intégration


Désormais, il faudra prêter attention aux bornes de l'intégrale car jusqu'à présent nous
n'avons utilisé la notation J: f(t)dt qu'avec la condition a~ b. Une utilisation hâtive
dans les inégalités peut conduire à des résultats erronés. Prenons la fonction f constante
égale 1 ; f vérifie bien O ~ f sur IR tout entier, donc si on applique la propriété 1 de la
proposition 27.14, nous obtenons O ~ J~ f(t)dt, c'est-à-dire O ~ -2, ce qui n'est pas
1

vrai.

En utilisant la propriété 3) de la proposition ci-dessus et en tenant compte de la convention,


on peut déduire facilement le corollaire suivant.

Coro.lliûre. i!;û: Sâll f'tl.tAeJondi<>n bornëê éf. întlgfubté S'/J,t fa, bJ. Alors, '[}<>Ur t<>US 'X, y
et .z .élémè'nts ilê [a. bl ntÎus:âoons · . .. . . .. . . . .

~f(l;}it·;:rY1rt)dt +efft}dt~ ...


.• ,t.J•
·· x .. ·Jx 111 ·.·
780

Test 27.19. 2. Prouver que f~ f(t)dt = f~ g(t)dt.


Soient c E [a, b] et f une fonction bornée et Test 27.20.
intégrable sur [a, b]. On définit la fonction g
sur [a, b] par g(t) = f(t) si t E [a,c] et g(t) = 0 Soient c E [a, b] et f une fonction continue en
si t E]c, b]. tout point de [a, b] \ {c} et ayant une limite à
gauche et à droite au point c. Peut-on affirmer
1. Montrer que g est intégrable sur [a, b]. que f est intégrable sur [a, b]?

III. PRIMITIVES ET INTÉGRALES

Nous abordons maintenant l'étude du second aspect de l'intégrale, que nous allons chercher à
voir comme l'opération réciproque de la dérivation, au moins dans quelques cas particuliers.
En faisant varier la borne de l'intégrale, on obtient une fonction F définie par F(x) = J:
f(t)dt.
Quand f est continue, la fonction Fest une primitive de f, c'est-à-dire qu'elle est solution de
l'équation F' = f.
Dans toute la suite, sauf indication contraire, les intervalles utilisés ne sont pas réduits à
des singletons.

III.l. Le théorème fondamental du calcul intégral


Dans le cas où f est seulement bornée et intégrable sur [a, bl, la fonction F possède une
propriété de régularité donnée par la proposition que voici.
Proposition 27.25. Soient c E {a, b], f une Jonction bornée et inUgrable sur [a,b] et M
un réel positif tel que If! ~ M sûr fa:, bJ; Pour x E [o:, b},. on pose f(x) J:f(t)dt; La=
fonction F vérifie pour toutx et y dans [a, b} l'inéhàlité

IF{y) - f(x)I ~ Mly -- :ici . .


Soient x:::; y deux réels de [a, b]. La relation de Chasles montre que

r
PREUVE.

F(y) - F(x) = f(t)dt.

En intégrant membre à membre l'inégalité lfl :::; M sur l'intervalle [x, y], on obtient

r lf(t)ldt:::; M(y - x).

Comme nous savons que If~ f(t)dtl :::; f~ lf(t)ldt, on déduit alors l'inégalité
IF(y) - F(x)I:::; M(y -x).
Dans le cas où x ;?! y, en permutant x et y, l'inégalité ci-dessus devient
IF(y) - F(x)I:::; M(x -y).
Nous pouvons conclure que, pour x et y quelconques dans [a, b]
IF(y)- F(x)I:::; Mly-xl. ■

Rappelons qu'une fonction définie sur un intervalle I qui vérifie la propriété de la proposi-
tion 27.25 précédente est dite lipschitzienne sur 1. Une telle fonction est évidemment continue,
mais elle n'est pas toujours dérivable.
781

Test 27.21. Test 27.22. r


r/J
Don~er l'exemple d'une fonction lipschitzienne Soit f une fonction définie et dérivable sur un
sur [-1, 1] mais non dérivable en O. intervalle I. Prouver l'équivalence suivante : f
est lipschitzienne sur I si et seulement si f' est
bornée sur I.
i
,(1)

ÊÎ
r/J

:fiô~llôtt '2'~-~,âot~nft ~Jâi'~J,effitnefonction bornéê et iritégfuôJê:~f îa, tiJ; ·Pô1ir g


if$fa,~L tJ1tptf8ef(x) ""'J:J{tldt. · ....•. · ·.· .. . . . ... ··. . · g
,.E
$if.pè~f,(i,e u'l1;f3limîte/idrtJite{resfl:', ât/ltttcke} au point Xo de [n; b], alors F estdérimable à r/J
drbi'ti:(rosp; i ga'U<:hë)auJllii11:t Xô, de'dérivêe à droite (resp. à gàuche}, F4{xo}= lltn. f(t) ~
. . . • .. . . : .. . • ·. . . . t-;1<0+.
(resp. F~f~o) tl~- f(t)),. · ·

PREUVE. Soit x 0 un point de [a, b[ où f possède une limite à droite, notée l. Si h > 0 est
un réel tel que x 0 + h E [a, b], nous avons, grâce à la relation de Chasles, l'identité

F(xo + h) = J~ f(t)dt + J:+h f(t)dt,

qui fournit l'égalité F(xo + h) - F(xo) = J_:+hf(t)dt.


Comme l est la limite à droite de f en x 0 , il en résulte que pour tout E E IR~, il existe
T] E IR~ tel que si t E [a, b] vérifie Xo < t < Xo +TJ, alors lf(t) - li< E.
Maintenant si O < h < TJ, alors pour tout t E]x 0 , xo+ hl, on a lf(t)- li< E, et en intégrant
membre à membre cette inégalité sur l'intervalle [x 0 , x 0 + hl, on obtient

J:+hlf(t) - lldt ~ ht:.


De l'inégalité (voir proposition 27.14) I s:+h(f(t) - l)dtl :S: s:+h lf(t) - lldt, on déduit
que I s:+hf(t)dt - lhl ~ ht:. En divisant par h, on obtient alors

F(xo + h) - F(x 0 ) _ li
h ~ t:.
1

L'inégalité ci-dessus est valable tant que h vérifie O < h < TJ. Nous venons de prouver que l
est la dérivée à droite de F au point Xo. ■

~~lhlit! ~t:.2t. Soîeint eAE :fct~bl et·r1u+tej,,netilm .bornée etinf,f,grnble su,- fn, b]. Pour
xe;[~,blt, qrtpô,9e t(xl"'?kfftldt, .·;?i, . : • •·· .··. . . .• . . . ..· . .· ·.•
Si f ~ t:,ontinuft à ir<Jitefresf}è• ôrg•~ltif!f!t>#tt,~ tle fa, ·bh. alo.t;$ f e.'ît dérivable à droite
(resp: à gauehê) âu PJ}mtx.o iiè dé~ à iJ~ïté(rêsp.. fi!JaVicke)f{x0 ): ··

Nous obtenons comme conséquence immédiate du corollaire ci-dessus, le théorème suivant


qui établit le lien entre les opérations d'intégration et de dérivation.

Th~m.e' 27.28; ·soient f une/onction continue sur un interoalle I etc· un point de I;


J;r(t).dt, ..Alor:-s lafo1u,tion Fest dérivg,ble sur I,.de dérivée égale
JJC'ltf'.~.E;l, on posef(x}=
à lafo11,ction f;
782

Test 27.23. Test 27.24.


Soit f une fonction définie et continue sur Soient T E JR~ et f une fonction continue sur
(-1, 1]. Déterminer les ensembles de définition JR. Pour X E JR, on pose F(x) = s:+T f(t)dt.
et de dérivabilité de la fonction F définie par Montrer que f est T-périodique si et seulement
F(x) = Jt f(t)dt, puis calculer F'. si F est une fonction constante.
Définition 27.29. Soit f une fonction définie sur un intervalle I. On dit qu'une fonction
dérivable F est une primitive de f sur I, si elle vérifie F'(t) = f(t) pour tout t E I.

Le théorème ci-dessus traduit simplement qu'une fonction continue possède au moins une
primitive définie par son intégrale .

. \tt<·11tio11 Existence de primitives et continuité


Comme le montre l'exemple suivant, l'existence pour une fonction d'une primitive
n'assure pas en général sa continuité. Soit F(x) = x 2 sin(l/x) si x est non nul et
F(0) = O. Un calcul simple montre que F est dérivable sur [-1, 1) de dérivée f défi-
nie par f(x) = 2xsin(l/x) - cos(l/x) six-/= 0 et f(0) = O. La fonction f possède bien
une primitive sur [-1, 1) alors qu'elle est discontinue en O.

Pi'opœition 27:.30. ·SoiH. une fpDètio.n défm,j,eJJtllr up imero<llle L S:i F et G .sq,iti,iks·


primitities de f .sur I, alors il e:i;iste un r6el C tel ~ G idJ=+ C Sîfr f · "· · · ··
PREUVE. Nous avons pour tout t E I G'(t) = f(t) = F'(t). On déduit que (G - F)'(t) = O.
Le théorème des accroissements finis (voir le chapitre 26) entraîne que la fonction G - Fest
constante sur I. ■

Test 27.25. Test 27.26.


Soient F et G deux fonctions définies et déri- La fonction t H [t], où [t] désigne la partie
vables sur JR*. Que peut-on dire de l'assertion : entière de t, possède-t-elle une primitive sur
si F' = G' sur JR*, alors il existe C E lR tel que l'intervalle (-2,2]?
G = F + C sur JR* ?

Corollaire 27.31.
Soiênt f 1t~··fc~on;œntînue
ffxl = JJfftJ.tt. ·
1) 'lbûtè JirftnfflvitG <lé i~ui-J. 11ê ...
- <;,? ~-

2) f est l¼.t.nique primitive def surl telle que F(ç} .:..._o.


PREUVE. Soit G une primitive de f sur I. D'après la proposition 27.30 ci-dessus, il existe un
réel C tel que G = F + C. Nous avons alors G(y) - G(x) = F(y) - F(x) = f~f(t)dt, ce qui
prouve la propriété 1) du corollaire.
783

Pour la propriété 2), le seul point à prouver est l'unicité de F. Soit donc G une primitive de
f sur I telle que G(c) = O. D'après la proposition 27.30, il existe un réel C tel que G = F + C.
Nous avons alors G(c) = F(c) + C, c'est-à-dire C = 0; a fonction Gest donc égale à F. ■

TJî~j~~-~!;t'('rl'.(~fèin$ fbtîël~âl du calcul intêgr~)~ ·.....·


Silt ~t .~~ij.fe'TJ,J;f,{on f]è•èUJ.sse
,~-'-->~:~----,,,---+--:-•' ,,-,__ ,'-~:_: - -,
< _--
cr ~.u}
_, ~-
Ufl:îrl:tervalle l, alors pour
-_ --- ---,_
tousx
- ::
:ef·f
>
plfn,,~ts ((et
\ ; .• ,~
-,,,i_- -,,,-·{:,:- ,,,-,--_/-:-,_~'-""

PREUVE. Posons f = h'. La fonction h est une primitive de f sur I; donc d'après la propriété

r
1 du corollaire 27.31, nous avons

h'(t)dt = h(y) - h(x).


)\tt(•Jlt im1 Dérivées et primitives


Lorsque la fonction h est simplement supposée dérivable, il est faux de dire que

rh'(t)dt = h(y) - h(x).

Notation. Dans ce qui suit, le symbole Jf(t)dt désignera toutes les primitives de la fonction
f, c'est-à-dire que si Fest une primitive particulière de f, alors on peut écrire Jf(t)dt = F+ C,
où C est une constante.
Avec cette notation, l'identité du théorème ci-dessus s'écrit alors Jh' (t) dt = h + C. Elle
fournit les primitives usuelles rassemblées dans le tableau suivant. Le lecteur est invité à
déterminer les intervalles sur lesquels ces primitives sont définies.
fonction primitive
nulle constante
x«+l
t'X, avec ex cf. -1 et+l
1/t ln lxl
sin t -cosx
cost sinx
1
✓ 1-t2
arcsin x
-1
✓ 1-t 2
arccosx
1
î+i2" arctanx
expt expx
cht shx
sh t chx
13\ avec 13 ER~ ~
lnB

Là encore, on a anticipé sur les preuves des propriétés des fonctions usuelles, à la seule fin
de constituer un tableau récapitulatif. On pourra les admettre en première lecture et revenir
à ce tableau après avoir lu le chapitre 28.
784

Test 27.27. Test 27.28.


Déterminer une primitive sur R de la fonction Pour a E R, déterminer une primitive sur R de
tH ltl. la fonction t H exp(at).
Pr<>t)QSition
fdeR. . . 1\.. .~ .Z.,.
. . ...Soient
. 27.33~ .. a, .E: .Jl et·..
f. u1Àe . .. tl~.,~~lç11w.:t··
.....jqry:t,irm" ,. ,._..,' .... 1"ft•· ~{e~l~
..<•, ··•· . .

1) .Sfri ~ D/ à!~ri:t: ê8tune prlmi~tie sur} tl~J #_j· . ·•. ·.· . .·• .• ·•
1

2) Sin. -2 etf lt Vflleùrs àansR•,~·1;:1; rJSt.~.frimitwe su~i.~},~;


0

3) Si :f est â, vàleurs dâtW R*, alors tn tfl est une primitifii de f 1/f.
4) Si a. =,f.:.:C1 ~êtf d valetrs dans R!,· alors :;; est mie primitive de f'f« '~ùrI.

EXEMPLE 27.34. Déterminons une primitive de t H tant sur] - n/2, n/2[.


► Nous avons
tant= sin t/cos t = -cos' t/cos t = -cos' t(cos t)- 1 •
On peut conclure, grâce à la proposition précédente, que - ln( cos t) est une primitive de
tant sur ] - n/2, n/2[.

Test 27.29. Test 27.30.


Soit k E Z. Déterminer les primitives de la fonc- Déterminer une primitive de la fonction et
tion tant sur l'intervalle ]-n/2+ kn, n/2+ kn[. sur R.

IV. DEUX MÉTHODES DE TRANSFORMATION DES INTÉGRALES


Nous présentons maintenant deux méthodes d'utilisation extrêmement fréquente en calcul
intégral. Elles permettent de modifier la forme de certaines intégrales, pour les étudier ou même
parfois les calculer. Il est indsipensable de les connaître parfaitement, avec leurs hypothèses,
qu'il faut vérifier à chaque utilisation.

IV .1. Intégration par parties


Soient u, v deux fonctions de classe C 1 sur un intervalle I et x et y deux points de I. La
dérivée de uv est donnée par (uv)' = u'v + uv'. En intégrant cette égalité entre x et y, on
obtient

[ (uv)'(t)dt = [ u'(t)v(t)dt + [ u(t)v'(t)dt,

r r
Ce qui donne l'identité

u'(t)v(t)dt = u(y)v(y) -u(x)v(x) - u(t)v'(t)dt.

Cette simple remarque est très importante dans la pratique : elle permet de séparer le calcul
d'une intégrale en deux parties, l'une étant une simple prise de primitive. Pour l'exploiter,
rappelons la notation
[f(t)]~ = f(y) - f(x)
si f est une fonction. On obtient alors la proposition suivante.
785

Proposition 27.35. (Intégration par parties) Soient u, v de:ua:f-onctioos tle classe C1


sur un intervalle I et x et y deux points de I. Alors

ru'{tMtldt =[u{t}v(t)]~- ru(t)v'(tldt.


Jx • Jx
Cette identité est souvent utilisée pour le calcul des primitives; elle s'écrit alors sous la
forme
Ju'vdt = uv - Juv' dt.
r.:IN
EXEMPLE 27 .36. Calculons, pour ex E] - 1, 1 [, l'intégrale I = J;
arcsin( t) dt.
..d
► Posons u(t) = t et v(t) = arcsin t, et effectuons une intégration par parties: ü

<X arcsin(t)dt = [u(t)v(t)Jt- J<X ~t = cxarcsin ex - I<X t(l - t 2 )- 112 dt.


I0 0 1- t2 0

Calculons maintenant J;t(l - t 2 J- 11 2 dt. Si, pour t E] - 1, 1 [, on note w(t) = 1 - t 2 , alors


w'(tJw- 112 (t) = -2t(l - t 2 J-l/Z; nous avons donc

Or, w'w- 112 est la dérivée de la fonction 2w 112 ; donc

Enfin, on trouve que I = ex arcsin ex+ ✓ 1 - cx2 - 1.

EXEMPLE 27.37. Déterminons J(arccost)2dt.


► Sion pose u(t) = t et v(t) = (arccost)2, nous avons

I 2
(arccost) dt= t(arccost) 2
I
+ 2 t~
arccos t
2
1 -t
dt.

Une seconde intégration par parties montre que

I V
t
~
1 - l-
arccos tdt = - yr;--;;
1 - t 2 arccos t - I~
~ d t = - yr;--:;
V] - t 2
1 - t 2 arccos t - t + C'.

On trouve enfin

J(arccos t)2dt = t(arccos t) 2


- 2vi-=tz arccos t - 2t + C.

Test 27.31. Test 27.32.


Donner une primitive de la fonction arctan t Pour <X E] - 1, 1[, calculer l'intégrale
sur JR. J;v'f=tïdt.
786

IV.2. Changement de variable

Théorème 27.38. $Ôiétd f.~ne.fenf:ti~~·conti~~e sür,1111, in~f tt '9 a~11.~1atimî


de classeC 1. ~r~
'
inte#ualle
-. .
f·._--
4't!àlmtrs~J:.P~r~ft:~td'~Ji,~~.t•#,g~lîtê;~fttlnte
- - - ____,-~,--- _,-,--- -· - ---- ___ ,_-_,,,-,<~- -."-,-,-:,----;-,-,- -_-',-.-->

r r
PREUVE. Soit Fest une primitive de f sur I. Nous avons

f(cp(s))cp'(s)ds = F'(cp(s))cp'(s)ds

Comme la fonction F'( cp )cp' n'est que la dérivée de F o cp, on déduit alors

Jf( cp( s) )cp'(s )ds = J\F


C
d
C
o cp) '(s )ds = (F o cp )( d) - (F o cp )( c) = Jcp(dJ f(t)dt.
cp(c) ■

Ce théorème est très utile pour le calcul d'intégrales et la détermination de primitives.


On remplace la fonction à intégrer f par f( cp )cp' dont une primitive, si la fonction cp est bien
choisie, est simple à calculer.
Malheureusement, il n'existe pas de régle générale permettant de trouver un changement
de variable convenable, mais nous verrons quelques cas particuliers importants dans la patie
IV de ce chapitre.
Remarque. Nous avons montré lors de la preuve du théorème ci-dessus que si F est une
primitive de f sur I, alors F o cp est une primitive de f( cp )cp' sur le même intervalle; posons
G = F o cp. Afin de pouvoir exprimer F en fonction de G, qui est normalement facile à
déterminer, on choisit cp bijective, c'est-à-dire possèdant une fonction réciproque sur I.

EXEMPLE 27.39. Calculons k2 J! '!:t


2 où k est un réel non nul.
► Posons cp (s) = ks et appliquons la formule du changement de variable ; il vient

f3 dt Jf3/k kds 1 Jf3/k ds


Jex k2 + t2 = ex/k k2 + k2s2 = k ex/k 1 + s2.

On reconnaît alors une primitive de la fonction arctan; ainsi

f3 dt 1
J ex k 2 +t 2 = k(arctan(/3/k)-arctan(cx/k)).

EXEMPLE 27.40. Déterminons Jsin \!'tdt sur lR+·


► Pour cela, effectuons le changement de variable, t = s 2, avec s E
lR+. La formule du chan-
gement de variable consiste formellement à remplacer l'élémentdt par 2sds; nous pouvons
donc écrire Jsin v't = J2s sin sds. Une intégration par parties montre que

Jsin v'tdt = -2s coss + 2 Jcossds = -2s coss + 2sins + C.


787

En revenant à la variable d'intégration t, on obtient

Jsin vtdt = -2\/t cos vt + 2 sin vt.

Test 27.33. Test 27.34.


Soit f une fonction continue sur R Montrer les L'identité donnée par le théorème du change-
affirmations suivantes : ment de variable est-elle valable si f est suppo-
1. Si f est impaire, alors pour tout a E JR, sée en escalier ? r-.:
ea f(t)dt = 0
Test 27.35.
IN
..d
ü
2. Si f est paire, alors pour tout a E JR,
J;f(t)dt = j ea f(t)dt. Donner une primitive de la fonction sin 0.

V. SOMMES DE RIEMANN ET DE DARBOUX


Dans cette partie, nous revenons à l'idée initiale d'Archimède. Pour définir l'intégrabilité
d'une fonction f, nous avons introduit les ensembles de toutes les fonctions en escalier qui
majorent et minorent f. C'est indispensable pour obtenir une définition bien construite, mais
c'est beaucoup trop pour arriver à un procédé commode de calcul. Archimède avait de son
côté introduit des suites de polygones dont les aires encadraient celle du cercle. Nous allons
maintenant montrer comment introduire des suites particulières de fonctions en escalier, dont
les intégrales convergent vers l'intégrale cherchée. Ces suites d'intégrales sont ce que l'on
appelle les sommes de Riemann, ou de Darboux, pour la fonction considérée.
Après avoir associé à une fonction sa somme de Riemann, on prouve le théorème 27.43
qui établit le lien entre l'intégrale d'une fonction sur un segment et sa somme de Riemann.
Il permet alors le calcul des limites des suites qui sont du même type que ces sommes. Dans
le cas où l'on sait évaluer la somme de Riemann, ce théorème peut servir aussi au calcul des
intégrales (voir l'exemple 3 de cette section). On termine cette section par une brève étude
des sommes de Darboux où l'on prouve aussi l'équivalence entre l'intégrabilité et l'égalité de
ces deux sommes.

V .1. Sommes de Riemann


Définition 27.41. Le pas d'une subdivion (xk)o,:;k,:;n du segment [a, b] est le nombre
maxo,:;k(n-1 lxk+l -xkl- Il sera noté b((xk)O,:;k,:;nl-

Le lemme suivant montre, dans le cas où f est une fonction en escalier, que cette somme
a pour limite l'intégrale 'de f sur [a, bl, quand le pas de la subdivision tend vers O.

PREUVE. Soient f E JR~ et ME JR~ tels que lfl :::;; M. On choisit une subdivision (ah)o,:;h,:;p
de [a, b] adaptée à la fonction f. Soit maintenant X = (xk)o,:;k,:;n une subdivision de [a, b]
dont le pas est strictement plus petit que celui de ( ah)O,:;h,:;p• Notons K l'ensemble des entiers
788

Soient f une fonction bornée sur [a, b] et en général, ni au-dessus, ni au-dessous du


X = (xk)O'(k,(n une subdivision de [a, b]. graphe de f.
Une suite finie E, = (E,k)O,(k,(n-1 de points
de [a, b] est dite associée à la subdivision y
(xk)O,(k,(n si E,k E [xk, Xk+1l pour k =
0, 1, · · · , n - 1. On définit alors la somme
de Riemann

k=n-1
S(X,E,,f) = .L, (xk+1-xk)f(E,kl-
X
k=O
0
Ce nombre est la somme des aires des rec- a b
tangles de côtés les [xk, Xk+1l et de longueurs
FIGURE 27.6. Une famille de
(algébriques) f (E,kl- Ces rectangles ne sont rectangles

k entre O et n - 1 tel que [xk, Xk+1l soit inclus dans un certain ]ah, ah+l [. Si E, = (E,k)O,(k,(n
est une suite finie associée à X, posons

kEK kEK'

Comme le cardinal de K' ne dépasse pas p+ 1, nous avons lu'I :S b(X)M(p+ 1 ). Or S(X, E,, f) =
cr+ u', donc IS(X, E,, f) - cri :S b(X)M(p + 1). En imposant à X la condition b(X) < ZM(~+ll'
nous avons
IS(X, E,, f) - cri < c/2. (*)
Si k E K, la fonction f est constante sur [xk, Xk+1l de valeur f(E,k)- Dans le cas où k E K',
l'intervalle [xk, xk+ 1l contient un unique point de la subdivision ( ah)O,(h,(p· En ajoutant ces
éventuels points à (xk)o'(k,(n, on obtient une nouvelle subdivision (yj)O'(j,(q adaptée à f. Le
calcul de l'intégrale de f, à l'aide de cette subdivision, entraîne l'inégalité

En utilisant l'inégalité triangulaire, et les relations (*) et (**), on peut conclure que

If f(t)dt-S(X, E,,f)I < E,

pour toute subdivision X vérifiant b(X) < min(A, Z(p:l)M), où A est le pas de (ah)O'(h'(p· ■

Thêorème "21:43. Sint i une ]orit:tÎ<Jn fiornêë êt}ntëgfâlile"$Ur [O:, &t Âl<>rs jJÔÙr ii>ût e É
itt, . j t ~ ll i5.~;• t~kque.~x e,{.,n~~~ ~~:~ iqf,l>lc~~H{Nl ,<ti,:JJlflrBPPJJ,r
totJtl.âss~.r1.â'/1sfN.l:ntJ!.fîtJâtf~:fz:t•·''"···.')~•,.:·:}}···X,.••·· •. c···· . •.";.• . ??>:?.:~}.'.
PREUVE. Soit f une fonction bornée et intégrable sur [a, b]. Pour une telle fonction, étant
donné E E JR~, il existe deux fonctions en escalier cp et 1j, vérifiant

cp :( f :( 1j, et f (lj,(t) - cp(t))dt < c/2.


789

Le lemme précédent appliqué pour E/2 aux fonctions cp et 1jJ entraîne l'existence de 11 E lî~
et 11' E lî~ tels que si X est une subdivision de [u, b] vérifiant ô(X) < 11 et ô(X) < 11', alors
f!
IS(X, E,, cp) - cp(t)dtl < E/2 et IS(X, E,, 1jJ) - f!
1\J(t)dtl < E/2 pour tout E, associé à X.

r r r
Nous déduisons de cp ( f ( 1jJ les inégalités suivantes :

cp(t)dt ( f(t)dt:::; 1\J(t)dt (*) et S(X, E,, cp) ( S(X, E,, f) ( S(X, E,, 1jJ ). (**)

Comme
r cp(t)dt - E/2 < S(X, E,, cp) et S(X, E,, 1jJ) < r 1\J(t)dt + E/2,

r r
de (**) nous déduisons la double inégalité

cp(t)dt- E/2 < S(X, E,, f) < 1\J(t)dt + E/2.

r r r
En faisant la différence membre à membre de (*) et des inégalités ci-dessus, nous obtenons

(cp(t) -1\J(t))dt- E/2 < S(X, E,, f) - f(t)dt < (1\J(t)- cp(t))dt + E/2.

En tenant compte de f!(1\J(t) - cp(t))dt < E/2, on peut conclure que

IS(X, E,, f) - r f(t)dtl < E.

Cette dernière inégalité est vérifiée pour toute subdivision X telle ô(X) < 11" où 11"
min(11, 11'). Nous avons ainsi établi le théorème. ■

Pour un entier naturel non nul n, on note Xk =a+ k (b~al quand k = 0, 1, • • • , n. Le pas
de la subdivision (xk)o,s;k,s;n est égal à (b - u)/n et il tend vers O quand n tend vers l'infini.
En utilisant cette subdivision dans le théorème précédent, on obtient le corollaire ci-après.
Corollaire 27.44. Si f est une fonction born6! et intégrable sur [a, b], alors

EXEMPLE 27.45. Soit (Un)n::>l la suite définie par


1 1 1
Un=--+--+···+-.
n+ 1 n+2 2n
En factorisant par n, le terme Un devient

Un = n
1(
] +1]/n + ] +12/n + ... + 1 + 1n/n ) .
Si pour t E [O, 1], on pose f(t) = :t'
1 alors le terme Un vérifie
1 (k)
Un=-.[_f
k=n
- .
n n
k=l

On reconnaît donc la somme de Riemann de la fonction f sur le segment [O, 1]. On peut
affirmer que la suite (un)n::>1 est convergente de limite f~ f(t)dt, c'est-à-dire ln 2.
790

EXEMPLE 27.46. Soit (vnln:::1 la suite dont le terme général est

1
Vn = - ,V(n + 1)(n + 2) · · · (2n).
n
En factorisant par n, le terme Vn devient
(1)

~ Vn= V(l +1/n)(l +2/n)··•(l +n/n).

Si on pose Un= ln(vn), nous avons

1 k=n (
Un=-.L,ln l + n .
k)
n k=l
La suite (unln>l est bien la somme de Riemann de la fonction ln(l + t) sur [O, 1]. Elle est
donc convergerrte de limite J~ ln(l + t)dt. À l'aide d'une intégration par parties, on obtient
J~ ln(l + t)dt = 2ln2- l.
Nous avons ainsi prouvé que la suite (vnln:::i est convergente, de limite e21 n 2- 1 = 4/e.

EXEMPLE 27.47. Intégrale de Poisson


► Calculons, à l'aide de la formule donnée par le corollaire, l'intégrale

[ ln(l - 2excost + ex2)dt,

pour ex> 1. Posons, pour tout t E [O,n], f(t) = ln(l - 2excost + ex2). La fonction f est
définie et continue sur [O, n] ; donc elle est intégrable. Si n E N*, notons
k=n-1
Sn=~ .L, k~).
f (
k=O
En utilisant l'identité ln xy = ln x + ln y, on obtient

Sn=~ ln crr (1 -2excos (k~) + ex2)).


De l'égalité 1 -2excost + ex2 = (ex- eit)(ex- e-it), on déduit

Nous avons également les identités


k=2n-1 k=n-1
ex2n-1 = TI 2
(ex-ei 2~")=(ex-l)(ex+1) TI
(ex-é1;f)(ex-e-i~).
k=O k=l
Nous obtenons alors
2
_ ~ ((ex-1)2(ex n- 1))
Sn - n ln (ex_ l )(ex+ l) .
Comme la limite de la suite (snln::: 1 est 2nln ex, on peut conclure que, pour ex> 1,

[ ln(l - 2excost + ex2)dt = 2nln ex.


791

Test 27.36. Test 27.37.


Calculer J;ln(l -2<Xcos t+<X2 )dt sous la condi- Utiliser le théorème 27.43 pour montrer la
tion l<XI i- 1 non-intégrabilité de la fonction X définie par
x(t) = 0 si t E iQ) et x(t) = 1 sinon.

V.2. Sommes de Darboux


Soit f une fonction bornée sur [a, b). Si X= (xk)o,s:;k:s:;n est une subdivision de [a, bl, on note
mk (resp. Mk) la borne inférieure (resp. supérieure) de f sur le segment [xk, Xk+Jl. On définit
les sommes de Darboux
k=n-1 k=n-1

s(X, f) = .L. (xk+l -xk)mk et S(X, f) = .L. (xk+l -xdMk.


k=O k=O

Sim et M sont respectivement les bornes inférieure et supérieure de f sur [a, bl, nous avons
alors, pour toute subdivision X, les inégalités
s(X, f) ::,; (b - a)M , (b - a)m::,; S(X, f).
Désignons par s!(f) (resp. S!(f)) la borne supérieure (resp. inférieure) de toutes les sommes
s(X, f) (resp. S(X, f)) quand X décrit toutes les subdivisions de [a, b); l'existence de telles
bornes est assurée par les inégalités ci-dessus. Nous rassemblons dans la proposition suivante
quelques propriétés utiles de s!(f) et S!(f).
Pl'oposition .2.7.48. Soient f .êt g deuxfonctiâns bornées sur [u,bJ. Nous avons les pro-
priétés .suivantes :
1} s:m~ i!(f} ~ 1~tois; s:ch,
2). si f estpofti,ti~e 11ur {ti?bl,,ator,., s!(f}~ 0;
3) si f::,; g sur la. b], alors s!(f} ~ s!(g) et S!{fl~ S!(1:d;
~)Qi:fëst'~{isCl!liet8Udil,b],, âii>r~·s:(f)::;; S~(f) t:# Jf f(t}d'.1;.
Le théorème essentiel est maintenant le suivant.
Théo:r~me.'/,7.49. Soit.f·t,itle]ont.tîon bornée tJut{a1 bJ. tvok avons alors l'éqti,ivalen.ce,
(;Sfintégrable stJrJo., b] si etseuleineut id&c!ff) = s:fü. Danscé. cas ce nombre est l'intégrale
.fde'J sut {a, b]. · ·· · ·· ··· · · · · · ·

PREUVE. Supposons que s!(f) = S!(f). La propriété 1 de la proposition précédente entraîne


que i!(f) = I!(f), c'est-à-dire l'intégrabilité de f.
Prouvons maintenant la réciproque et supposons f intégrable. Nous avons dans ce cas
i!(f) = f!f(t)dt. Comme i:(f) est une borne supérieure, alors pour é: E lR"t,, il existe cp une
fonction en escalier vérifiant cp ::,; f sur [a, b) et i!(f) - é: < f!
cp(t)dt ::,; i!(f). L'identité
s!(cp) = f!cp(t)dt entraîne l'inégalité i!(f) - é: < s!(cp). Si on applique la propriété 3 de la
proposition ci-dessus à cp::,; f, on obtient s!(cp)::,; s!(f). Nous avons donc
i~(f) - E < s~(cp)::,; s~(f).
On en déduit alors que i!(f) ::,; s!(f). On peut conclure, grâce à la propriété 1 de la même
proposition, que i!(f) = s!(f), c'est-à-dire s!(f) = f!f(t)dt.
En procédant de la même façon, on peut prouver que S!(f) = f!f(t)dt. ■
792

Test 27.38. Test 27.39.


Soit f la fonction définie sur IR par f(t) = t si Soit f une fonction bornée sur [a, b]. Que peut-
t E Q et f (t) = 0 sinon. La fonction f est-elle dire des égalités s~(f) = i~(f) et S~(f) = l~(f)?
intégrable sur [O, 1]?

VI. MÉTHODES USUELLES D'INTÉGRATION


Avertissement. Nous présentons ici rapidement quelques méthodes d'utilisation
courante pour le calcul d'intégrales. Cette étude n'est qu'une première approche
de la théorie, elle sera reprise dans le cours de L2 à l'aide des outils fournis par
le calcul formel.

Vl.1. Intégration des fractions rationnelles à une variable


D'après le théorème de décomposition en éléments simples, la fonction associée à une fraction
rationnelle de la forme P/ Q, où P et Q sont des polynômes premiers entre eux, peut être
écrite comme combinaison linéaire des trois types de fonctions suivantes :
1) les fonctions polynômes ;
1
2) les fonctions rationnelles de première espèce, t H ( ) , avec (a, n) E lR x N* ;
t-an
cü+13
3) les fonctions rationnelles de seconde espèce, t H (tl + bt + c)n' avec (ex, 13, b, c) dans lR4 ,
n EN* et b 2 -4c < O.
Déterminer une primitive d'une telle fonction rationnelle revient donc à trouver les primi-
tives des trois types de fonctions ci-dessus.
1) Cas d'une fonction polynôme P(t) = Untn + · · · + ao. On obtient immédiatement les
primitives

1
2) Cas des fonctions rationnelles de première espèce. Une primitive de t H ( ) , quand
t-a n
n =fa 1, est

(1 - n)(t- a)n-T'
alors que la fonction
t H ln lt- al,
1
est une primitive de t H --.
t-a
3) Déterminons maintenant une primitive d'une fraction rationnelle de seconde espèce, de la
forme t H cxt + l3
(tl+bt+c)n· Nousavons l'"d fl'
1 en1e

cxt + 13 cx(2t + b) 213 - cxb


(t 2 + bt + c)n 2 2
2(t + bt + c)n + 2(t + bt + c)n"
793

Le premier membre de cette somme a pour primitive, quand n =/- 1, la fonction


(X

2(1 - n)(t 2 + bt + cJn- 1 '


et dans le cas n = 1
(X
ln(t 2 + bt + c).
2
Il reste à déterminer une primitive du second membre de cette somme. Écrivons pour cela

(t 2 + bt+ c)n

En effectuant le changement de variable, s = ( v c2


4
-b2) (t + b/2), on obtient

Il suffit donc de savoir calculer cette dernière primitive. Ceci peut se faire par récurrence.
Posons pour n E N*
I
n-
-J (s2
ds
+ l)n
nous avons I 1 = arctan s + C et une intégration par parties montre que pour tout n ~ 2
s
(2n-2)In= (sZ+lJn-l +(2n-3)In-l•

Cette relation permet d'exprimer la primitive cherchée dans tous les cas pratiques, lorsque n
n'est pas trop grand.

:-\( t ('ll1 ÎOll Primitives et changements de variables


Lorsqu'une primitive est obtenue après un changement de variable, il faut toujours faire
le changement inverse dans l'expression obtenue, afin de retrouver les variables initiales.

Dans toute la suite la fonction F désigne, sauf indication contraire, une fonction rationnelle
ou polynomiale à deux variables, à valeurs réelles.

VI.2. Primitives des fonctions de la forme F(cost,sint)


Soit à calculer JF( cos t, sin t) dt. En posant s = tan( t/2), nous avons les formules
2s 1 - s2
sin t = - - -2 , cos t = - --z-
1+ s 1 +s
Nous allons voir qu'il est toujours possible de se ramener au cas précédent. Commençons par
le cas le plus général. En utilisant le changement de variables= tan(t/2), on obtient

I(
2

I F(cost,sint)dt= 1- s 2s )
F - - -2 , -- 2
- - - ds.
1 +s 1 +s 2 l+s 2
794

On se ramène ainsi au calcul d'une primitive de fonction rationnelle, qu'il s'agit d'expliciter
dans chaque cas particulier. Là encore, on prendra garde à revenir aux variables initiales au
moyen du changement de variable inverse.
Distinguons maintenant trois cas particuliers, pour lesquels le calcul est beaucoup plus
simple que dans le cas général précédent.
i) Si F( cos t, sin t) = G(cos t) sin t, où G désigne une fraction rationnelle d'une variable, on
utilise le changement de variable s = cos t qui conduit à

JF(cost, sin t)dt = - JG(s)ds.


On reconnaît ce cas en essayant le changement de variable t H -t, qui doit transformer la
fonction rationnelle initale en son opposée.
ii) Si F(cos t, sin t) = G (sin t) cos t, le changement de variable s = sin t entraîne que

JF(cost,sint)dt = JG(s)ds.
On reconnaît ce cas en essayant le changement de variable t H n - t, qui doit transformer la
fonction rationnelle initale en son opposée.
iii) Si F( cos t, sin t) = G (tant), on utilise s =tant qui donne

G(s)
JF(cost,sin t)dt = J 1 + 52 ds.
On reconnaît ce cas en essayant le changement de variable t H n + t, qui doit laisser la
fonction rationnelle initale invariante.
Dans le cas où F est un polynôme à deux variables, la détermination d'une primitive se
ramène à celle de la fonction cosP t sin q t où p et q sont des entiers naturels. Nous distinguons
trois cas.
i) Si p et q sont pairs, on linéarisera l'expression en utilisant les formules d'Euler.

EXEMPLE 27.50. Déterminons une primitive de sin4 tcos 2 t .

. 4 2 -(eu-e-u)4(eit+e-it)2
sm t cos t - i ,
2 2

d'où
sin4 t cos2 t = ~ ( e6it - 2e4it - e2it + 4 - e-2u - 2e-4it + e-6it) '
ou encore
. 1
sm4 tcos 2 t = (cos(6t) - 2cos(4t) - cos(2t) + 2).
32
Nous avons donc

. 4 2 d -1 (sin(6x) sin(4x) sin(2x)


- - - - - - - + 2x ) + C
Jsm t cos t t = 32 --- -
6 2 2 .

ii) Si p est impair, en notant p = 2p' + 1, nous avons


795

Le changement de variable s = sin t entraîne


rJl
<I)

JcosPtsinqtdt= J(l-s 2 )P'sqds.


~
6b
,<I)

iii) Si q est impair, on pose q = 2q' + 1 et on obtient l'identité suivante en utilisant le â


changement de variable s = cos t
§
p
JcosP tsinq tdt = - J(1 - s 2 )q' sPds. g
..s
rJl
j
VI.3. Primitives des fonctions de la forme F( ch t, sh t) r--:
c,;i
..d
Pour la détermination des primitives des fonctions de la forme F(ch t, sh t), on utilise souvent ü
le changement de variable s = et. Les autres méthodes d'intégration pour de telles fonctions
sont similaires à celles données précédemment concernant les fonctions circulaires cos et sin.
Le lecteur pourra reprendre l'étude faite ci-dessus en remplaçant respectivement cos, sin et
tan par ch, sh et 0.

Test 27.40. Test 27.41.


, .I
Pour ex E R, determmer h dt h .
s t-s ex
.
Détermmer I h dth
2 s t+c t+ 1
.

Vl.4. Intégrales de la forme JF ( t, n ~:!~) dt


at+b n dsn-b
On suppose que ad - be est non nul et on pose s = ---d. Nous avons alors t = - - - .
et+ a-esn
En utilisant s comme nouvelle variable d'intégration, on obtient

I( F t,
n at+b)
- - d dt =n(ad- be)
et+
I (dsn-b )
F - - - , s ( sn~l )2 ds.
a - esn a - esn

On est ainsi ramené au calcul d'une primitive d'une fraction rationnelle en s.

Test 27.42. Test 27.43.


À quoi sert la condition ad - be non nul? , .
Determrner I tdt h.
;:;:-;---,
vt+l+vt

VI.4.1. Intégrales de la forme JF(t, ✓ at 2


+ bt + e)dt

Soient ( a, b, e) E JR* x JR 2 . Mettons le trinôme at 2 + bt + e sous forme canonique


2 2 2
2
at + bt + e = a ( ( b )
t + 2a + 4ae4a2
- b )
= a ( ( b )
t + 2a ll ) ,
- 4a2

où ll = b 2 - 4ae est le discriminant du trinôme at 2 + bt + e. Nous supposons dans la suite


que ll est non nul, et on note f son signe. Nous avons alors

[( ~~ (t+ 2a ~))2 -fl


796

.. .
En ut1hsant le changement de vanable s = 2a (t + b)
#Ï Za , nous obtenons

avec G une fonction rationnelle de deux variables à valeurs réelle et <X = ~. Suivant les signes
de a et de .0., on se ramène au calcul de l'une des trois primitives

I G(s, ~ ) d s , I G(s, ~ ) d s , f G(s, Jsz+l)ds.

Pour la première primitive, on utilise le changement de variables =chu (resp. s = - chu)


avec s E]l, +oo[ (resp. ]-oo, -1 [); la seconde se calcule en posant s = sin u et pour la dernière,
on pose s = sh u. Grâce à ces changements de variable, on se ramène respectivement au calcul
des primitives

JH(chu,lshul)du, JH(sinu,lul)du, JH(shu,chu)du,


où H est une fraction rationnelle de deux variables à valeurs réelles.

Test 27.44. Test 27.45.


2
Pour (a, b) E ffi. et a ± 1/2, déterminer Que peut-on dire de JF( t, ✓ at2 + bt + c) dt
J((t- a)(t- b))cxdt. dans le cas où ô est nul ?

VII. LE CALCUL DES LONGUEURS DES COURBES PLANES

Cette courte section est esssentiellement d'un intérêt théorique, c'est sur elle que seront fondées
les définitions des fonctions trigonométriques que nous verrons au chapitre suivant.

C'est encore Archimède qui le premier uti-


C
lisa, sans pouvoir la définir complètement, la
notion de longueur d'une courbe. Dans son
B
traité La Mesure du cercle, il montre que
l'aire de tout cercle est égale à celle d'un
triangle rectangle dont les côtés de l'angle
droit ont pour longueur respectives le rayon
et la circonférence du cercle. Dans sa preuve
il utilise simplem_j:_nt le fait que si un arc de
courbe convexe AB est contenu dans un tri- A
angle ABC, alors sa longueur est comprise
FIGURE 27.7. Un arc de courbe
entre AB et AC+ BC.
convexe contenu dans un triangle

Nous avons signalé la difficulté de la notion de longueur de courbes dans la préface de la


partie « Bases» de cet ouvrage. Nous commencerons ici par donner une définition préliminaire
de la notion de courbe, qui sera suffisante pour que la longueur en soit bien définie.
797

2
Définition 27.51. Un arc plan est une application d'un segment [a, b] dans JR . La donnée
2 les Jonctions Yx
d'un arc y : [a, b] -, JR est équivalente à celle de ses deux composantes,
etyy de [a,b] danslR telles quey(t) = (yx(t),Yy(t)) pourt E [a,b]. On dit que y est de
1
classe C sur [a, b] si ses deux composantes le sont. Une courbe plane est l'image d'un arc
plan.
Le nombre de pas le long d'un sentier sinueux mesure avec une certaine erreur sa longueur.
La formalisation de ce fait empirique revient à considérer la longueur des lignes polygonales
dont les sommets se trouvent sur la courbe à étudier. G. Peano définit la longueur d'une
courbe comme la borne supérieure des longueurs de toutes ces lignes polygonales associées.
Plus précisément, soit y un arc défini sur [a, b]. Notons I: l'ensemble des subdivisions de
[a, b]. Pour cr = (t 0 , ••• , tnl E I:, on note P cr la ligne polygonale associée à y et cr, c'est-à-dire
la réunion des segments [y( tk), y( tk+ 1 )] pour O :::; k :::; n - 1

Po-= u
o:;;k:;;n-1
[y(tk),y(tk+iJJ.

On désigne par l(P cr) la longueur de P cr, c'est-à-dire la somme des longueurs des segments qui
la constituent
n-1
l(P) = Llly(tk+ll -y(tklll,
k=O

ou l'on a posé comme de coutume

y(a)

FIGURE 27.8. Une ligne brisée associée à un arc

On note l(y) la borne supérieure de l'ensemble de tous les l(P crl quand cr décrit l'ensemble
des subdivisions de [a, bl, soit

l(y) =sup {t(Pcr) 1 crE r:}.


l(y) est un élément de lR+U{+oo} (on convient que l(y) est égal à +oo si l'ensemble {l(Pcr) 1

cr E I:} n'est pas majoré).

Définition 27.52. Un arc y est dit rectifiable si l(y) est fini. Dans ce cas le réel l(y) est
appelé la longueur de l'arc y.
1
Nous allons considérer dans cette partie des arcs de classe C •
798

PREUVE. Nous allons identifier JR 2 à <C de manière habituelle, le couple (u, v) E JR 2 étant
considéré comme égal au complexe u + iv. Dans cette identification, lu+ ivl = Il (u, v) Il- Soit
y: [a, b] --t JR 2 un arc de classe ci. Notons Yx, Yy ses composantes. On va donc considérer y
comme une fonction à valeurs dans <C en posant y(t) = Yx(t) + iyy(t). Comme la fonction y
est supposée de classe ci, ses composantes ont des dérivées continues, donc elles sont bornées
sur [a, bl, on peut définir

M = sup ly'(t)I = sup ✓(y~(t))2 + (y~(t))2.


tE[a,b] tE[a,b]

Soit CY = (tk)O(k(n E I:, et soit P cr la ligne polygonale associée. Utilisons l'inégalité des
accroissements finis (voir chapitre 26, III.2) pour écrire pour tout k entre O et n - 1

Il en résulte en additionnant que

l(Pcrl::;; M(b - a).

En conséquence, l'ensemble {l(Pcr) 1 CY E I:} est majoré par M(b- a), donc l(y)::;; M(b- al,
ce qui prouve que y est rectifiable. ■

Notre théorème principal est maintenant le suivant.

Théorème. 21.54. Soit y un f!f'C ile.cJasse C1 S'lirta,bl, Alors sa longueur est ilonnre par
l'intégrale ·
l[y) =rhii(tJfdt.·

PREUVE. Il faut d'abord justifier que l'intégrale est bien définie. Les fonctions t H y~(t) et
t H y~(t) sont continues, donc la fonction t H ly'(t)I est continue par composition, elle est
donc intégrable sur [a, b].
Nous allons admettre provisoirement un résultat intermédiaire, que nous montrerons après
cette preuve.

Lemme 27.55. Pour toute> 0, ·il, wteœ> 0 tel (J'Uè si{s,t} E fa;b} 2 vérifiels-tl < œ,
alors

Fixons E > O. Considérons une subdivision CY = (tk)O(k(n E I:, de pas inférieur à ex.. Alors
d'après le lemme et l'inégalité triangulaire dans <C

(1)

D'autre part, comme la fonction t H ly'(t)I est continue sur [a, bl, elle est uniformément
continue. On peut alors supposer que ex. est assez petit pour que pour tout k E {O, ... , n - l}

Il en résulte que

(2)
799

On déduit de (1) et (2) que

(3)

En sommant les inégalités (3) pour O ~ k ~ n - 1, et en utilisant l'inégalité triangulaire et la


relation de Chasles, on obtient

1 f ly'(s)lds - l(Pcrll ~ 2é:(b - a) (4)

Il suffit maintenant de choisir une subdivision cr de pas < <X telle que

0 ~ l(y) - l(Pcr) ~ e(b - a). (5)


On peut en effet le faire: il existe une subdivision fr qui satisfait (5) par définition de la borne
supérieure et de l(y), et il suffit de lui ajouter des éléments, le cas échéant, pour obtenir une
subdivision de pas< <X, ce qui ne peut qu'améliorer l'inégalité (5).
Appliquons maintenant l'inégalité triangulaire à (4) et (5), on obtient

1 f ly'(s)lds - l(y)I ~ 3é:(b- a)


ce qui prouve que f! ly'(s)lds = l(y), puisque e est arbitraire. ■

Montrons maintenant le lemme 27.55.


PREUVE. Pour t E [a, bl, nous allons considérer la fonction Q.Jt: x H y(x) - xy'(t). Cette
fonction est dérivable, de dérivée cj.J~(x) = y'(x) -y'(t).
Comme y' est continue dans [a, bl, donc uniformément continue, on peut trouver <X> 0
tel que ly'(r) -y'(s)I < e si 1s -ri< <X.
Il en résulte que pour tout t E [a, bl, lcj.J~(x)I < e si lx-tl <<X.On en déduit par l'inégalité
des accroissements finis que

lorsque 1s - tl < <X. C'est l'inégalité cherchée. ■

VIII. EXERCICES
27.1. positive sur [u, b], on note,

Pour deux entiers naturels n et k 2'. 1, on note fi= {(x, y) E JR 2/ u :S x :S b et O :S lJ :S f(x)}.


Tk le reste de la division euclidienne de n par
Pour tout entier n 2'. 2, on note
k. Etudier la convergence de la suite de terme x1 (n), • • • , Xn-1 (n) les abscisses des parallèles à
général -;;\-(r1
n + r2 + · · · + Tnl- Oy qui partagent fi en n parties égales. Étudier
la quantité,
1
27.2. -(f(x1(n)) + · · · + f(xn-1(n))),
n
Pour une fonction f continue et strictement quand n tend vers l'infini.
27.3. 2. Pour x et 1J dans JR+, prouver l'inégalité,

Soit f une fonction continue sur l'intervalle


[O, 1]. Pour tout entier n 2': 1, on pose,
xy S [ f(t)dt + J: g(s)ds.

3. Étudier le cas d'égalité.


Un= TI
k=n ( 1
1 + nf(k/n)
)
4. En déduire que pour p > 1, x 2': 0 et 1J 2': 0,
k=l on a, en posant q = vS,
l'inégalité,
Montrer que la suite (unln::o:1 converge vers
ef~ f(t)dt_

27.4.
27.7.
Soient f une fonction continue sur [a, b] et 1j.,
une fonction convexe de lR dans JR. Montrer Soient À un réel et f une fonction intégrable sur
l'inégalité, le segment [a, b]. On pose,

F(À) = J: f(t) sin(Àt)dt.

1. Montrer que lim1--Hoo F(À) = O.


2. Montrer que si f est continue, alors
27.5.
lim;,_-,+oo F("A)/"A = O.
Pour un réel a différent de ± 1, on pose,
27.8.
1
I(a)=:z
J2n ln(a 2
-2acos0+1)d0. Soit f une fonction intégrable sur [a, b]. Pour
O
n EN, on pose,
1. Vérifier les identités,

I(a2 ) 1
I(a) = - - et I(a)-1( ) = 2nlnlal.
In= J: f(t)I sin(nt)ldt.
2 0 Montrer que
2. Pour lai< 1 montrer que II(a)I S 2nln(l +
a). En déduire I(a) pour lai< 1. lim In= -2 Jb f(t)dt.
n->+oo 7t a
3. Déterminer la valeur de I(a) pour lai> 1.

27.6. 27.9.

Soit f une fonction dérivable, strictement crois- Soit f une fonction continue et positive sur
sante et surjective de JR+ dans lui-même. [a, b]. Si M est sa borne supérieure sur [a, bl,
1. Si g est la fonction réciproque de f, montrer montrer que,
que pour tout x E JR+, on a l'inégalité,

Jf(x)
I
X
xf(x) = f(t)dt + g(s)ds.
0 0
Chapitre 28
RETOUR SUR LES FONCTIONS
.,. .,.
ELEMENTAIRES

E chapitre revient de mamere approfondie sur les fonctions dites élémentaires ou

C usuelles ; il faut entendre par là les fonctions exponentielles, logarithmes, trigono-


métriques circulaires et hyperboliques, ainsi que leurs inverses.
À ce stade de l'ouvrage, ces fonctions sont déjà bien connues du lecteur qui, en outre, les
a déjà rencontrées au lycée, au moins pour certaines d'entre elles. Ainsi, même si nous faisons
ici un rappel de leurs principales propriétés, leur étude et leur représentation graphique, le but
visé dans les pages qui suivent est plus de présenter les idées qui sous-tendent leur construction
que la technique de leur manipulation.
Pour ce faire, nous avons choisi de multiplier les points de vue. Il est en effet remarquable
que les mêmes objets puissent être construits de manière en apparence totalement différente :
par exemple nous allons donner de la fonction exponentielle quatre approches distinctes. Ce
fait est récurrent en mathématiques, au point qu'on a pu dire qu'elles sont « l'art de donner
le même nom à des objets a priori distincts».
Ce chapitre a donc un statut assez singulier. Les objets qu'on y présente peuvent être
considérés comme déjà connus du point de vue de la pratique, mais nous avons signalé que leur
construction (telle qu'elle est étudiée dans les classes secondaires) ne pouvait être considérée
comme pleinement satisfaisante. Nous faisons ici le point de ce que nous avons acquis dans ce
cours de 11, et sur ce qu'il est maintenant possible de considérer comme bien fondé.
Dans ce problème de la construction des fonctions de base de l'analyse, les mots clés
pourraient être ceux d'extension, de prolongement, dans tous les sens des deux termes. En effet,
les mathématiques procèdent naturellement du simple au complexe; ainsi apparaissent d'abord
les fonctions polynômes, issues des opérations de l'algèbre, l'addition et la multiplication.
Si l'on veut étendre à ces fonctions l'opération algébrique de division, alors interviennent
les fonctions rationnelles, définies comme quotients de deux fonctions polynômes. Ensuite
l'extension des opérations aux racines carrées, cubiques et plus généralement n-ièmes introduit
de nouvelles fonctions; comme nous l'avons vu dans le chapitre 24, cela constitue ce que l'on
peut appeler les fonctions algébriques, qui se divisent en rationnelles et non rationnelles.
L'extension des fonctions peut encore se faire dans plusieurs directions. On peut essayer
de poursuivre indéfiniment les opérations algébriques d'addition et de multiplication qui ont
conduit aux polynômes, et obtenir ainsi des sommes d'une infinité de termes (appelées séries),
de la forme .L~ UnXn. Ce faisant, on quitte nécessairement le domaine de l'algèbre, car cette
sommation infinie ne pourra acquérir un sens que par un passage à la limite, qui appartient
au domaine de l'analyse. Cette théorie sera exposée dans le cours de 12.
Une autre extension va se réaliser aussi par le passage à la variable complexe, qui consiste,
lorsque cela a un sens, à remplacer la variable réelle par la variable complexe dans les fonctions
étudiées. Toutes les fonctions élémentaires que nous allons rencontrer dans ce chapitre peuvent
se définir par ce biais, qui constitue la manière la plus conceptuelle et unifiée de les construire.
Cependant, comme ces méthodes nécessitent la manipulation de séries, elles ne seront exposées
que dans les cours de 12 et 13.
802

Mais il existe encore d'autres mameres naturelles de construire des fonctions à partir
d'autres fonctions : on peut aussi considérer leurs primitives, par exemple lorsqu'elles sont
continues. On peut montrer en effet qu'il existe alors des fonctions algébriques (continues)
très simples dont les primitives ne sont plus algébriques mais transcendantes. L'exemple le
plus fameux et le plus simple est celui de la fonction algébrique rationnelle x H 1/x dont une
primitive conduit à une fonction transcendante : le logarithme néperien. Les primitives de la
fonction algébrique rationnelle x H l~x2 ou de la fonction algébrique irrationnelle x H vl~x2
conduisent aussi respectivement aux fonctions transcendantes x H arctan x et x H arcsin x.
Ces derniers exemples incitent tout naturellement à mentionner encore une extension natu-
relle des fonctions, qui consiste à prendre les bijections réciproques de bijections déjà connues.
Notons en particulier que dans le cas des fonctions algébriques l'introduction de radicaux re-
lève déjà de cette idée, puisque par exemple la fonction x H y'x est la bijection inverse de la
fonction x H x 2 (ces fonctions étant vues comme définies et à valeurs dans~+). Par exemple,
l'introduction de la bijection inverse du logarithme déjà mentionné conduit à l'exponentielle,
et l'inversion des fonctions x H arctan x et x H arcsin x donne lieu aux fonctions x H tan x et
x H sin x. Ces dernières sont cependant traditionnellement définies « directement », les fonc-
tions x H arctan x et x H arcsin x étant alors définies comme leurs réciproques respectives
sur des intervalles convenables. Nous allons néanmoins ici introduire les fonctions trigonomé-
triques à partir de l'inverse de la fonction cos, en insistant sur les relations entre cette méthode
et la définition des lignes trigonométriques à partir de la longueur des arcs du cercle unité.
Cette étude reposera donc en grande partie sur le calcul des longueurs d'arcs plans, tel qu'il
a été introduit à la fin du chapitre précédent.
Enfin, certaines fonctions élémentaires peuvent être vues comme les solutions de certaines
équations. Par exemple, la bijection réciproque d'une bijection f est bien, par nature, définie
comme l'unique solution de l'équation f o g = go f = Id. À ces équations fonctionnelles s'en
ajoutent d'autres, très importantes, les équations différentielles. Nous verrons comment ces
idées permettent de donner d'autres présentations des fonctions exp et ln.
Dans ce qui suit, nous allons survoler toutes ces techniques pour construire les fonctions
élémentaires et les montrer sous divers aspects. Nous introduirons de manière complètement
formalisée les fonctions ln et exp, puis les fonctions hyperboliques et leurs inverses, qui ne né-
cessitent que la connaissance de l'exponentielle. Puis nous consacrerons une longue étude aux
fonctions trigonométriques, et nous reviendrons ensuite sur quelques équations fonctionnelles
et différentielles donnant lieu de nouveau par exemple à la fonction exponentielle.

I. LOGARITHMES ET EXPONENTIELLES

Dans cette partie, nous allons donner diverses présentations des fonctions exponentielles et
logarithmes, directement basées sur les propriétés de la droite réelle.
La première d'entre elles, pour la fonction exp, est inspirée de celle que donne L. Euler dans
son Introductio in analysin infinitorum. C'est certainement la plus naturelle : elle est basée,
comme nous l'annonçions dans l'introduction, sur l'étude préliminaire de fonctions simples,
les fonctions de la forme n H un, où a est un réel positif, définies sur l'ensemble des entiers
relatifs. Il s'agira ensuite d'étendre le domaine de définition de ces fonctions à toute la droite
réelle, ce qui se fait en deux étapes : la première, algébrique, consiste à définir ces fonctions
sur (Q), la seconde, analytique, consiste à prolonger par continuité les fonctions ainsi obtenues à
la droite réelle. Cette dernière étape utilise la densité de (Q) dans ~ et la complétude de ~ ; elle
peut donc être considérée comme complètement rigoureuse, après notre étude des chapitres
803

21 et 22. Nous verrons ensuite comment le nombre e se distingue dans ce cadre d'un réel a
ordinaire, donnant lieu à l'exponentielle usuelle.
Une autre approche, elle aussi pleinement satisfaisante du point de vue de la rigueur,
consiste à définir d'abord le logarithme comme la primitive sur JR~, nulle en 1, de la fonction
continue x H 1/x. Notre étude des fonctions continues permettra ensuite de montrer que
cette fonction est une bijection de JR~ sur lR ; et il est donc possible de définir la fonction
exponentielle (de base e) comme sa bijection réciproque.

1.1. Les fonctions exponentielles comme prolongement de n H an

1.1.1. Un préliminaire historique

Une fonction puissance est une fonction du


type x H xn, où n est un entier fixé. Le
dictionnaire nous apprend d'autre part que
le terme exponentiel a été introduit en 1711
par Jean Bernoulli à partir du latin expo-
nere (exposer), pour désigner une fonction
à exposant variable. En d'autres termes, on
s'intéresse cette fois à une fonction x H ax,
a constante (positive) fixée, c'est-à-dire que
c'est l'exposant qui varie. C'est ce type de
fonction qui va nous occuper maintenant.
Jean Bernoulli (1667-1748)

Voici précisément ce qu'écrit L. Euler


dans son Introductio in analysin infinitorum
(livre premier, chapitre VI, De quantitatibus
exponentialibus ac logarithmis, p. 103) :
« f. .. ] Sit igitur proposita huiusmodi quanti-
tas exponentialis a Z, quae est pot estas quan-
titatis constantis a exponentem habens va-
riabilem z f. ..J. », ce que l'on peut traduire
par « [... ] Soit donc proposée la quantité ex-
ponentielle aZ, c'est-à-dire une puissance de
la quantité constante a ayant un exposant
variable z [... ]. »

Leonhard Euler (1707-1783)

Euler définit ensuite ce qu'il entend par là, car en dehors des exposants entiers les choses
ne sont pas claires. Il commence donc justement par le cas où z est un entier positif, ce qui
donne successivement

Suivons toujours Euler, en épargnant le latin au lecteur ; il envisage après cela le cas des
entiers négatifs -1, -2, -3, -4, ... pour lesquels les valeurs de la fonction présentée seront
804

successivement

fIl)

a' a2' a3' a4'' ..


.;j et enfin le cas de l'entier O pour lequel a 0 = 1.
t::: Euler continue à définir sa fonction en passant aux z qui sont des fractions

i 1/2, 1/3, 2/3, 1/4, 3/4, ... ,


pour lesquelles les valeurs de la fonction seront respectivement

va, va, ¼w, ra, vaJ, ....


Restent les valeurs irrationnelles de z, sur lesquelles Euler passe en une phrase; c'est en
encadrant z entre deux rationnels proches qu'il obtiendra la valeur de uz. Il cite alors l'exemple
de av'? qui sera compris entre u 2 et u 3 , ce qui ne peut être considéré comme un encadrement
très serré!

Test 28.1. Test 28.2.


Montrer que les réels suivants sont entiers Ranger par ordre croissant les nombres sui-
gl/3, 323/5, 272/3_ vants: 3114, 5915, 81 113 , 12318 .

1.1.2. Un peu de formalisation

Nous allons donner un sens rigoureux à cette présentation de la fonction x H ux due à Euler.
Notre étude va reposer sur la présentation des fonctions puissances d'exposant rationnel,
présentée au chapitre 25, partie 111.3. Le lemme suivant nous sera utile pour la suite.

Leminê 2sà~ Soif~ ê R. ?iéf'î]Îânt ci~ 1; êt sôifi ê,ttt:::"'ôn>ll Ïei priipfîêtls iùî~ri.Eiis :· ,
r
_ _ -:' a ' ', _ ' ~' _ ,_, ,- ' , _ -C , ,,, ,, , ',, c'a'~, - , _ ' a ,-, -, ,

1). la/rÎtidi<Jn ~ etCtit.~~rif:t({metd~arte'.sl6<t . ~


2}.ies;de~~Ût~~:.~~t>c1~U,~~ . rff~} ~iita~JsJ
3f1ipèür·:toutë8' s1.ite;;1~ n ~1(1'.€lf1>': Jléc~srmteff} tli
cont1êfyea11.iJl/efflJ'Xic(â.tr ~ei;;,iitii,t~~~t), ·on•c(J · ·
1:.s.. 1"ti .. · ·~;,:L: .,; ,;."7 , ~ ..1
~~<k • ""f~P,# ,fso·"'•"-f,•lk~·"'J· , ~.,
,,,.

PREUVE.

o Le réel a étant > 1, la fonction rH ur est strictement croissante sur (Ql, puisque si s > r
as
-ar = as-r > 1,

par construction de la fonction Ps;r (voir chapitre 25, partie III.3). Pour x E JR, notons

L'ensemble Rx est non vide, car il existe bien des rationnels inférieurs à x; il est majoré, car
il existe aussi des rationnels supérieurs à x et si s est un tel rationnel, Rx est majoré par as
puisque r H ar est croissante sur (Ql. Ainsi, on peut définir sup Rx, et sup Rx ~ as. Pour
des raisons analogues on peut définir inf Sx et par définition des bornes sup et inf, on vérifie
facilement que
805

◊ Six est un réel quelconque et si (rnlnEN est une suite croissante de rationnels convergeant
vers le réel x, alors la suite croissante ( uTn lnEN converge vers le réel sup Rx. En effet, la suite r/)
V
( u Tn lnEN est clairement croissante et majorée, donc elle converge et sa limite, notée l, vérifie
l :( sup Rx. Si on avait l < sup Rx, par définition d'une borne supérieure, il existerait un
rationnel r :( x tel quel< uT. Mais alors, pour tout entier naturel n, on aurait uTn :( l < uT
et donc Tn < r :( x, ce qui contredirait le fait que limn-Hoo Tn = X. De la même manière, on
1
•V
:V
r/)
a la propriété correspondante sur la borne inférieure, ce qui achève la preuve du point 2).
◊ Soient donc (rnlnEN une suite croissante de rationnels convergeant vers le réel x et (snlnEN
une suite décroissante de rationnels convergeant vers le réel x. On a alors, pour tout n E N
1
.8
r/)
~
3
r/)

Nous allons montrer que les deux suites ( u Tn) nEN et ( u sn) nEN convergent vers la même limite, 3
ce qui prouvera l'égalité des nombres sup Rx et inf Sx. On a en effet .B
&!
cxi
C"I
donc, comme la suite ( uTn lnEN converge et est donc en particulier bornée, il s'agit de prouver ..d
ü
que
lim USn-Tn - 1 = o.
n---++oo
Or, la suite (sn -rnlnEN converge vers O (en décroissant), donc pour NE N* fixé, il existe un
entier no E N*, tel que sin ~ no, alors O :( Sn-r n :( 1/N. Par suite, 0 :( u sn -Tn - 1 :( u l/N _ 1.
Or, d'après la formule du binôme de Newton, si ex> 0, on a

l+cx::;(1+~r,
d'où, en passant à la racine N-ième (qui est une fonction croissante)
(X
(1 + cx)l/N :( 1+ N.
Appliquant cela à ex= u - 1, on obtient donc que u l/N :( 1+ aNl, et donc en définitive que

0 :,:'. Usn-Tn -1 :,:'. Ul/N


u-1
-1 < __
~ ~ - N '
ce qui montre bien que lorsque n tend vers +oo, usn-Tn - 1 tend vers 0, donc limn-rno uTn =
limn-,oo usn, ce qui termine la preuve du point 3) et donc aussi celle du lemme. ■

Ceci étant, on peut énoncer le théorème principal, que nous allons complètement montrer,
et qui fonde l'existence des fonctions exponentielles sur les propriétés de la droite réelle.

Théorème 28.2. Soit u > 1. Il existe une unique fonction f strictement croissante prolon-
geant la fonètion Q -t R, r H or, à R tout entier. Elle est à valeurs dans R~, et est définie
pourx;eJl~ par

f(x) =sup{ar Ir E Q, l'·:( x}= inf{aS,I s E Q, s ~ x}, (28;1)


et on là notera encore f : R -t R, X. H (lx. En outre, cette applieàtion,ffé.rifie l'équation
fonctionnelle
V{x, y) E R2 , ax+v = axav. (28.2)
c'est donc un homomorphisme de (R, +) dans {Ri,·}.
806

PREUVE.

o Unicité
Si f est un prolongement strictement croissant de la fonction Q-----, JR, rH ur, à lR tout entier,
alors par définition des bornes sup et inf et avec les notations de la preuve précédente

pour x E lR donné (le vérifier soigneusement) et donc les deux membres extrêmes de cet
encadrement étant égaux d'après le lemme précédent, il en résulte qu'ils sont égaux à f(x).
◊ Existence
Posons, pour x E lR
f(x) = sup Rx = inf Sx,
La fonction f ainsi définie prolonge la fonction rH ur à lR. En effet, six E Q, l'ensemble Rx
possède un plus grand élément, qui est ux, et donc f(x) = ux. Cette fonction f est de plus
strictement croissante. En effet, si (x, y) E JR 2 , avec x < y, alors, par densité de Q dans JR,
il existe des rationnels s, s' tels que x < s < s' < y. Pour tout rationnel r ::::; x, ur < as
donc f(x)::::; as. Mais aussi as' ::::; f(y) puisque s' < y, et donc f(x)::::; as< as' ::::; f(y), donc
f(x) < f(y).
◊ Équation fonctionnelle
Il nous reste à vérifier l'équation fonctionnelle satisfaite par la fonction f. On sait que, pour
tous rationnels r et s, on a ur+s = urus. Si maintenant x et y sont des réels quelconques,
soient (r nlnEN et (snlnEN des suites croissantes de rationnels convergeant respectivement vers
x et y. Alors (r n + snlnEN est une suite croissante de limite x + y et, puisque pour tout entier
naturel n, on a urn+sn = arnasn, en passant à la limite et en utilisant la propriété 3) du
lemme précédent, nous obtenons que

Bien évidemment, si a= 1, la fonction x H ux se définit comme la fonction constante et


égale à 1. Si maintenant O < a < 1, on se ramène au cas du théorème en considérant le réel
1/u au lieu du réel a et en posant ux = (1/u)-x. La fonction sera dans ce cas strictement
décroissante. On renvoie au chapitre 4 pour d'autres propriétés.

Définition 28.3. Pour a > 0 donné, la fonction de lR dans lR définie par

donc l'existence est montrée dans le théorème précédent, est appelée la fonction exponentielle
de base a.

PREUVE. Montrons d'abord la continuité en O. Il s'agit de voir que pour toute suite (xnlnEN
de réels, de limite 0, on a axn -----, 1 quand n-----, +oo, ce qui se fait exactement comme la fin de
la preuve du lemme 30.1. Il est ensuite facile de voir que la propriété fonctionnelle 28.2 assure
la continuité en tout point, dès lors que la continuité en O est vraie. On laisse les détails au
lecteur. ■
807

Test 28.3. Test 28.4.


Donner un autre prolongement à JR, de la fonc- La fonction
tion
Q----, JR, TH a\ Q----, JR, TH a\
que celui construit dans ce qui précède. Est-ce
que cela contredit ce qui vient d'être fait? ne prend-t-elle que des valeurs rationnelles?

I.1.3. La correspondance fondamentale : logarithme et exponentielle

La relation entre une suite géométrique de raison a et la suite arithmétique de ses exposants

aoala2a3a4 ...
l l l l l···
01 234-··

est déjà connue d'Archimède. Elle est redécouverte par Chuquet dans son Triparty en 1484
puis complétée par Stifel en 1544 et conduit à la notion de logarithme. Ces mathématiciens
remarquèrent, en effet, que si on multiplie deux éléments de la suite géométrique, on obtient
l'élément dont l'exposant est la somme des exposants des termes dont on a fait le produit.
Galilée aussi s'intéressa à cette correspondance qui montre (bien que ce ne soit pas le moyen le
plus simple), en prenant a entier naturel, que l'on peut avoir deux sous-ensembles (infinis) de
N dont l'un est strictement contenu dans l'autre (sur le diagramme ci-dessus, celui représenté
par la première ligne dans celui représenté par la seconde ligne), et qui pourtant sont en
bijection.
C'est l'écossais John Napier, dit Neper, qui construisit en 1614 la première table de loga-
rithmes et considéra véritablement le logarithme dans le cas d'une variable continue et pas
seulement entière.
Revenons une nouvelle fois à L. Euler et à son Intmductio. Après avoir défini la fonction
z H aZ, (a> 0, a=/= 1) il continue dans le même chapitre à s'intéresser à l'équation en z,
az = y, y > 0 donné, et définit le logarithme de base a de y, qu'il note ly, comme étant
l'unique z vérifiant az = y. Qu'un tel z, s'il existe, soit unique, est évident en vertu de la
stricte croissance de l'exponentielle. En revanche son existence est basée sur la continuité de
la fonction exponentielle, notion qui n'est pas encore bien définie à l'époque d'Euler 1 . Nous
donnerons en exercice une construction rigoureuse du logarithme de base a dans le même
esprit que la construction de l'exponentielle de base a que nous venons d'exposer.

1.2. Le logarithme comme primitive de la fonction x H 1/x


Dans le paragraphe précédent, nous avons vu l'exponentielle de base a comme prolongement
de N à Z puis à Q, et enfin à JR, de la fonction x H aX, initialement définie pour x E N de
manière strictement algébrique. Ensuite, le logarithme de base a d'un réel y > 0 est apparu

1
D'ailleurs, pour Euler, une fonction continue est une fonction définie par une seule formule et ne correspond
pas à ce que nous appelons aujourd'hui une fonction continue. Par exemple, pour Euler, la fonction définie
par
f(x) = 0 six,,; 0 et f(x) = x six> 0

n'est pas une fonction continue alors que, bien sûr, elle l'est pour nous.
808

comme l'unique solution z de l'équation uz = 1J, autrement dit en langage moderne comme la
bijection réciproque de la fonction exponentielle de base a.
Dans ce qui suit, nous allons voir une autre idée extrêmement importante et fructueuse, qui
nous permettra de définir d'abord le logarithme puis, au moyen de sa réciproque, la fonction
exponentielle.
Cette nouvelle idée 2 consistera à définir une nouvelle fonction comme primitive d'une
fonction connue. Notre remarque de départ est que dans les fonctions puissance x H x"', une
seule ne possède pas de primitive issue de la même famille, à savoir celle qui correspond à
l'exposant -1,
1
I : JO, +ooh lR, X H I(x) = -.
X
Ce fait est suffisamment singulier pour que l'on s'y intéresse. Il s'avère être d'une importance
cruciale comme nous le verrons plus tard dans l'étude des fonctions de variable complexe, et
en particulier dans ce que l'on appelle le calcul des résidus (cours de L3). Mais, pour l'instant,
nous savons déjà, par la théorie développée lors du chapitre précédent, que la fonction I,
puisqu'elle est continue, admet une primitive sur l'intervalle JO, +oo[ et que deux primitives
de cette fonction diffèrent d'une constante. Cela conduit à la définition suivante.
Définition 28.5. La fonction logarithme néperien est définie comme l'unique primitive sur
]0,+oo[ de la fonction x H 1/x s'annulant en x = 1. On la notera ln. Ainsi, pour tout
x E ]O, +oo[, le logarithme néperien est défini par l'expression

x dt
ln(x)=
J
1
-.
t
Évidemment, par définition même, la fonction logarithme néperien est dérivable et même
de classe C 1 , a fortiori continue et on a

1
ln 1 = 0 et Vx E ]O, +oo[, ln'(x) = -.
X
En particulier la fonction ln est donc strictement croissante, négative sur JO, 1 [ et positive
sur ]1, +oo[. Nous allons maintenant donner la propriété fonctionnelle fondamentale du loga-
rithme, à savoir qu'il« envoie produit sur somme», en d'autres termes que c'est un morphisme
du groupe multiplicatif (lR"t-, x) sur le groupe additif (JR, +).

Prop<>sitioil 28:6;. (&tuation fonctionnelle du Jogm-ithmè);


Pour tout (x,y) E}0,+00[2, on a

ln(xy) = lnx+ lny.


En d'aut,res termes, la fonction ln est un homomorphisme de (JR"t-, ·) dans (IR,+).

PREUVE.

1) Montrons d'abord que pour x > 0, ln(l /x) = - ln(x). En faisant le changement de variable
u = 1/t dans l'intégrale définissant ln(l/x), nous obtenons

ln! = Jl/x dt = Jx -du/u2 = Jx -du = - ln X.


X 1 t 1 1/u 1 U

2
Idée que nous allons revoir plusieurs fois à l'œuvre au cours de ce chapitre.

J
809

2) Si (x, y) E JO, +oo[2 , en faisant le changement de variable t = yu dans l'intégrale définissant


ln( xy), nous obtenons gJ

ln(xy) =
xy dt
J
, t
- =
Jx
1/y
ydu
-
yu
=
Jx
1/y
du
- =lnx-ln(l/y) =lnx+lny,
u
l'avant-dernière égalité résultant de la relation de Chasles pour les intégrales, et la dernière
1
,Q)

~
rJJ

du point 1).

Nous pouvons déduire de cette équation fonctionnelle le comportement de la fonction


i
..8
rJJ
logarithme aux bornes de son intervalle de définition, à savoir que ~
3rJJ
lim lnx = -oo et lim lnx = +oo.
x---.+O+ x-----t+oo

En effet, puisque ln 1 = 0 et ln est strictement croissante, on a par exemple ln2 > O. Soit
l&
A > 0 quelconque ; comme IR. est archimédien, il existe n E N tel que n ln 2 > A. Or, par la cxi
C'I
propriété fonctionnelle, n ln 2 = ln 2n, donc, puisque ln est strictement croissante, pour tout .d
x > 2n, on a ln x > ln 2n > A. On a ainsi prouvé que ü

VA E JO, +oo[, :3B E JO, +oo[ (B = 2n) tel que si x > B, alors ln x > A,
ce qui est la définition même du fait que limx-Hoo ln x = +oo. Maintenant, puisque ln(l /x) =
- ln x, il en résulte immédiatement que limx-,o+ ln x = -oo.
Résumons nos résultats dans le théorème fondamental suivant.
'rhêo~. . - 28!T/ l,5 JJtù:ti~ togo,ri~e ~péritn ·ést ·.· rtti· :01 .-diff~~'flJ~t~ ~rîcte--
me~t croiMant de JO, +oo[ sur R: En outre, c'est un isomorphisme du groupe mûltiplicatif
(16, +oo{; .f;urie groupe additif fR, +). · · · ·· · ·
En particulier, il existe un unique réel strictement positif en lequel la fonction ln prend la
valeur 1. Cela conduit à la définition suivante.
Définition 28.8. On note e l'unique réel strictement positif vérifiant ln e = 1. Ce nombre
est appelé nombre de Neper. Une valeur approchée en est 2, 7182818284590 · · ·

Examinons maintenant deux « formes indéterminées» classiques concernant le logarithme.

lim xlnx = 0 et lim lnx = O.


x-;O+ x--i+oo X
Puisque
_ -ln(l/x)
x 1nx - l/x ,

la première de ces limites se déduira de la deuxième (et réciproquement). Établissons donc la


seconde. Considérons la fonction définie pour x > 0 par q,(x) = ln x/x. Elle est dérivable et
sa dérivée est donnée par
q,'(x) = 1-;nX,
X

donc la fonction q, est positive et décroissante sur l'intervalle [e, +oo[ et donc a une limite
l E IR. lorsque x tend vers +oo. En particulier, la suite de terme général est Un = q,( en), doit
donc tendre vers l quand n--, +oo. Or, q,(en) = n/en, donc la suite (unlnEN converge vers 0
comme on le voit facilement puisque le quotient Un+ if un tend vers 1/ e < 1 (par comparaison
à une suite géométrique). Par unicité de la limite, il en résulte que l = O.
810

Test 28.5. Test 28.7.


Le nombre (de Mersenne) 2 44497 -
1 est premier. Vérifier que, pour tous réels x et -y strictement
Combien son écriture décimale comporte-t-elle positifs, on a
de chiffres ?
Test 28.6.
Calculer pour n E Z,
lim xnlnx et lim xnlnx. Test 28.8.
X-lÛ+ X-l+oo
Montrer que pour tout réel x > 0, ln x < y'x.

I.3. L'exponentielle comme réciproque du logarithme


Compte tenu du théorème 28.7, nous pouvons donner la définition et le théorème suivants.
Définition 28.9. On appelle fonction exponentielle la bijection réciproque du logarithme
néperien. On la note
exp: lR-+ JO, +oo[, x H expx.
Notons qu'on considère habituellement l'exponentielle comme une fonction à valeurs dans JR,
et non dans JR~.

Th~rème .28.10. .. La f oricti,nn ~eritît(Je êst y,n ç~ ..,iiJ!fiottJlfptift#ie stfjètement croîs~


sant de R srit JO,+ooi> EtnJuirt./tPésif tin iJrimorpli~ ilti !JfàUpe. addfiif OR~+ J le sur
~·~jili~l}tît,+-&>f,~l:•··
En particulier, on rappelle ici les propriétés suivantes, qui peuvent être maintenant consi-
dérées comme fondées.

Les propriétés de log et exp

1
ln(l) = 0 ln' lxl = -, x E JR*
X
lim log x = +oo lim log x = -oo
X----)+oo x-...+O+

ln(xy) =lnx+lny ln(~) =lnx-lny


exp(0) = 1 exp'x = expx
limx->+oo expx = +oolimx->-oo expx = 0
exp(x)
exp(x +y)= expxexpy exp(x -y)= --(-)
exp y

Comme nous disposons maintenant de plus des notations de Landau, nous pouvons les
utiliser pour faire une mise au point. Introduisons la relation d'ordre lexicographique sur JR 2
définie par

[(ex, f3) ::s (ex', f3')] si et seulement si [ex< ex' ou (ex= ex' et f3::::; f3')]
avec la convention (ex, f3) -< (ex', f3 ') si et seulement si ( ex, f3) ::s (ex', f3 ') et ( ex, f3) =1- (ex', f3 ').
On introduit aussi la relation d'ordre lexicographique sur JR 3 définie par
[( ex, f3, y) ::s (ex', f3 ', y')] si et seulement si [ex < ex' ou (ex = ex' et ( f3, y) ::s (f3 ',y'))]

j
avec la même convention. Ceci nous permet de donner un tableau récapitulatif, qu'il ne s'agit
pas de mémoriser ainsi, mais de pratiquer couramment.

Comparaison des x'V, exp et ln


Pour tous réels a, f3, y et a', f3 ', y'

Pour tous réels l3 > 0,y et 13' > 0,y', et pour x > 0

x 13 !lnx!Y = o 0(x 13 '!Inx!Y') si et seulement si (/3',y)--< (/3,y').

Les autres cas de figure s'en déduisent facilement par changement de variables. On renvoie au
chapitre 4 pour les autres résultats sur les fonctions exp et ln, que nous pouvons considérer
comme acquis, leurs preuves étant élémentaires.

t H lnt

FIGURE 28.1. Les graphes de l'exponentielle et du logarithme

I.4. Logarithmes et exponentielles de base a


Définition 28.11. Soit a un réel strictement positif. On définit le logarithme de base a d'un
réel x strictement positif par
lnx
log 0 x = - -.
1na
En particulier, pour a = 10, on obtient le logarithme dit décimal, simplement noté log x ; le
logarithme néperien n'est autre que le logarithme de base e.

Pour a réel strictement positif donné, a -/- 1, la fonction

]O, +oo[ -t lR, X H log 0 X

est bijective. Cela permet de donner la définition suivante.


812

Définition 28.12. Soit a un réel strictement positif, a =I= 1. On définit la fonction exponen-
tielle de base a comme la bijection réciproque de la fonction logarithme de base a. Notons-la
temporairement expa.

Pour a réel strictement positif différent de 1 donné, il est immédiat que la fonction lo-
garithme de base a a la même propriété fonctionnelle que le logarithme néperien. Pour tout
(x,y) E]0,+00(2, on a donc
loga(xy) = loga x + loga y.
Il en résulte que la fonction exponentielle de base a a aussi la même propriété fonctionnelle que
la fonction exponentielle « ordinaire », définie dans le paragraphe précédent comme fonction
réciproque du logarithme néperien, et qui n'est autre que la fonction exponentielle de base e.
Précisément, on a pour tout (x, y) E JR 2

Cette propriété, jointe au fait que expa 1 = a, montre immédiatement que cette fonction
prolonge à lR la fonction n H an définie sur N, puis Z puis IQ. D'autre part, elle est strictement
croissante pour a > 1 et strictement décroissante pour a < 1. C'est donc bien la même fonction
que celle d'Euler définie précédemment. Nous la noterons donc plutôt que expa, sous la forme
x H ax. En particulier, on pourra désormais noter aussi l'exponentielle «ordinaire» sous la
forme x H ex.
813

li. FONCTIONS HYPERBOLIQUES ET LEURS INVERSES


La définition et les propriétés des fonctions hyperboliques se déduisent directement de celles de
l'exponentielle réelle. Leur étude peut donc maintenant être considérée comme parfaitement
établie.

II.1. Le problème de la chaînette


Nous allons commencer par étudier un problème de mécanique, précisément de statique. Consi-
dérons un fil pesant inextensible, accroché à deux clous situés à la même hauteur sur un mur.
Le problème est de déterminer la forme que prend alors ce fil.

Supposons-le homogène et notons À sa


masse linéique, et raisonnons en physiciens.
A B
Notons A et B les deux points de suspen-
sion du fil ; choisissons un repère orthonormé
pour lequel l'axe des ordonnées est la média-
trice du segment [A, B]. Tout d'abord, il est
intuitivement évident que si l est la longueur
du fil suspendu entre les deux points A et B,
on peut repérer un point du fil par la lon-
gueurs (le long du fil) qui le sépare du point
0 A, s variant donc entre O et l. Un petit élé-
ment de fil situé entre s et s + ds a alors
pour masse Àds.
FIGURE 28.2. Le problème de la chaînette.

La loi fondamentale de la statique appliquée à cet élément de fil nous donne donc

Àdsg + df = 0,
où dT = f(s + ds) - f(s)
représente la résultante des tensions entre les deux extrémités s et s + ds. Nous avons ainsi

Si on note ex l'angle que fait la tension au point s (qui est dirigée suivant la tangente) et
l'horizontale, cette dernière équation vectorielle équivaut aux deux équations scalaires

d(T cos ex) = et _ À d(T sin ex) _


ds 0 g+ ds - 0,
qui par intégration nous donne

T cos ex= c 1 et Tsin ex= Àgs + c 2 ,

où C1 et Cz sont des constantes.


Il en résulte que tan ex= (Àgs + c 2 )/c 1 , d'où s = (c 1 tan ex- c 2 )/Àg, soit

ds = c1dex .
Àg cos 2 ex
814

Or, si le petit élément de longueur ds a des composantes dx et dy sur les axes de coordonnées
choisis, alors dx = ds cos <X et dy = ds sin <X, d'où

x=
f C1
coscxds = :,-
/\Q
f -d<X
-
cos (X
et y= f. C1
smcxds = :,-
/\Q
f sin<Xd<X •
cos 2 (X
Posons a = c,/Àg; il vient (la constante d'intégration de x est nulle par choix de l'axe des
ordonnées)
a
et y= --+Yo•
cos (X
Ces relations donnent
x/a _ (~ ~) _ 1 + tan(cx/2)
e - tan 4 + 2 - 1 - tan(cx/2)'
et ainsi
ex/a+ e-x/a = 1 + tan(cx/2) + 1 - tan(cx/2) = _2__
1-tan(cx/2) l+tan(cx/2) coscx
Mais alors,
a ex/a+ e-x/a X
y-yo=--=a =ach-,
cos <X 2 a
en posant pour t E lR
et+ e-t
cht= - - -
2
Ainsi le fil épouse la forme du graphe d'une fonction définie très simplement à l'aide de
la fonction exponentielle. Cette fonction est appelée le cosinus hyperbolique. Le problème
précédent est appelé le problème de la chaînette, car le cas d'une fine chaîne portée autour du
cou est un exemple approximatif de cette situation de fil pesant inextensible accroché à deux
points.

II.2. Présentation et étude des fonctions hyperboliques


L'exemple précédent nous invite à définir des fonctions hyperboliques comme suit.

Définition 28.13. On définit les fonctions sinus hyperbolique (sh) et cosinus hyperbolique
(ch) par les expressions

'v't E lR, 'v't E lR,

Elles vérifient la relation fondamentale

'v't E lR, (ch t) 2 - (sh t) 2 = 1.

La relation fondamentale se montre immédiatement par simple calcul, en utilisant les proprié-
tés de l'exponentielle. C'est précisément cette relation qui explique les liens entre les fonctions
hyperboliques et les hyperboles.
Considérons d'abord une branche .Yt' d'hyperbole équilatère, graphe de la fonction <I> de
JR~ dans lR définie par <l>(x) = 1/x, dans un repère orthonormé; c'est aussi l'ensemble des
points dont les coordonnées (x, y) dans ce repère vérifient x > 0 et x y = 1. On montre
facilement que .Yt' se décrit aussi de la manière suivante
815

(/J

1
•CI.J
~

FIGURE 28.3. Les coordonnées des points de l'hyperbole

En effet, tout point de la forme (et, e-tJ appartient bien à .Ye, et inversement si (x, y) E .Ye, il
suffit de choisir t = ln x pour voir que (x, y)= (et, e-1 ), ce qui montre notre assertion. On dit
que la fonction 11: IR H IR2 définie par 11(t) = (et, e-1 ) est une paramétrisation de la branche
d'hyperbole considérée.
Soit maintenant l'application <D de IR2 dans IR 2 définie par

x+y x-y)
(x,y)H ( X=- - , Y = -- .
2 2

Elle est linéaire, son effet sur les parties du plan est facile à étudier. On voit en particulier
que <D(.Ye) = X, où
X= {(X, Y) E IR 2 IX> 0, X2 - Y2 = l}

(il suffit de raisonner par double inclusion); X est bien sûr encore une branche d'hyperbole,
dont les asymptotes sont les droites d'équations X = ± Y. Il est donc possible de déduire une
paramétrisation de X de celle de .Ye : puisque .Ye = 11(IR), alors X= <D(.Ye) =<Do 11(JR).
Posons E, = <D o 11, on vérifie immédiatement que E,( t) = (ch t, sh t) ; nous venons donc de
montrer que
X={(cht,sht) itElR}.

Notons une analogie certaine avec les fonctions circulaires usuelles : si on remplace la
branche d'hyperbole X par un cercle, les fonctions ch et sh sont les analogues des fonctions
sin et cos. Mais il faut insister sur le fait que cette analogie est loin d'être complète; nous
laissons pour le moment au lecteur le soin de comprendre pourquoi et nous y reviendrons plus
loin dans ce chapitre.
Par analogie avec le cas des fonction circulaires, on définit aussi les tangente et cotangente
hyperboliques par

sh t cht
\lt E IR, tht=-h,
C t
VtElR*, cotht = -h.
s t

Rappelons rapidement quelques formules fondamentales sur ces fonctions hyperboliques. Leur
preuve est immédiate à partir de leur expression et des propriétés de l'exponentielle réelle.
816
11 = chx 11 = sh x

11 = th x
11 = coth x

7
FIGURE 28.4. Les graphes des fonctions hyperboliques.

Relations entre fonctions hyperboliques

1) 1::/x E JR, ch2 x-sh 2 x = 1.


2) \::/(a,b)ElR2 , ch(a+b)=chachb +shashb.
3) 1::/(a, b) E JR 2 , sh(a + b) = sh ach b + sh bcha.
4) 1::/x E lR, ch' x = sh x et sh' x = ch x.
5) 1::/x E lR, th' x = 1 - th x = 1/ ch 2 x.
2

2
6) 1::/x E lR, coth' x = 1 - coth 2 x = -1/ sh x.

À partir de ces formules, l'étude de ces fonctions est très simple et a déjà été menée au
chapitre 4. Rappelons simplement que la fonction x H ch x est paire, alors que les trois autres
fonctions hyperboliques sont impaires; d'autre part, la fonction x H ch x est strictement
décroissante sur ]R_ et strictement croissante sur lR+, les fonctions x H sh x et x H th x sont
strictement croissantes sur lR et la fonction x H coth x est strictement décroissante sur chacun
des deux intervalles constituant son ensemble de définition. Voici les graphes des fonctions
hyperboliques. À titre d'exercice, nous laissons au lecteur le soin de vérifier directement que
la fonction E, introduite plus haut réalise une paramétrisation de la branche d'hyperbole X.
817

Test 28.9. Test 28.11.


Pour a E R et n E N, exprimer ch na et Pour a E R et n E N*, déterminer la dérivée
sh na comme expressions polynomiales en ch a d'ordre n de la fonction t H ch(at).
et sh a. Test 28.12.
Test 28.10. Calculer
4 5 4 5
Linéariser ch a, ch a, sh a, sh a, (les expri- n n

mer sous forme de sommes de termes du type L. ch(a + kb) et .L_ sh(a + kb).
k=O k=O
ch ka et sh ka).

Il.3. Fonctions hyperboliques inverses


La fonction x H ch x n'est pas bijective, mais sa restriction à R+ l'est, puisque elle est
strictement croissante et continue. On définit la fonction argch comme la bijection réciproque
de cette restriction. Ainsi

argch: (1, +oo[--) R+, y H argch y,

où argch y est l'unique solution x E R+ de l'équation ch x =y. On a donc

'v'y E (1, +oo[, ch( argch y) = y et 'v'x E R+, argch( ch x) = x.

AttclltÎull Argument d'un cosinus hyperbolique


Il faut noter que l'on a pas, pour tout réel x, argch(chx) = x. Par exemple
argch( ch -1) = l. En fait, argch( ch x) = x si et seulement si x E JR+.

Quant aux fonctions x H sh x et x H th x, ce sont sont des fonctions continues et stric-


tement croissantes respectivement de R dans R et de R dans ] - 1, 1[. Elles réalisent donc
des bijections de R dans R et de R dans ) - 1, 1[ respectivement. On note leurs réciproques
respectives

argsh : R --) R, y H argsh x et argth : ] - 1 , 1[--) R, y H argth x.

Ainsi nous avons les formules ci-dessous, résultant de la définition même des fonctions
réciproques.

'v'y ER, sh(argsh y) = y et 'v'x ER, argsh(sh x) = x.

'v'y E] - 1, 1[, th(argthy) = y et 'v'x ER, argth(th x) = x.

Compte tenu de la formule donnant la dérivée d'une fonction réciproque, on obtient les
expressions rationnelles des dérivées des fonctions hyperboliques inverses, qui sont souvent
très utiles dans les problèmes de calcul de primitives.
818

Dérivées des fonctions hyperboliques inverses

1 1 1 1
Vx E [1,+oo[, argch x = ~, Vx E ffi., argsh x = R+î"
vx2 - l X +1
2

1 1
Vx E] -1, 1[, argth x = - - -2 .
1 -X

-y= argthx

y= argshx
y= argchx

FIGURE 28.5. Les graphes des fonctions hyperboliques inverses.

Ces fonctions hyperboliques inverses ne sont pas vraiment de nouvelles fonctions trans-
cendantes, car elles s'expriment à l'aide de la fonction logarithme et de fonctions algébriques.
Nous avons par exemple pour la fonction x argth x
, 1 21( 1 + +1)
argth x = 1 - x 2 = 1- x 1 x '
qui donne donc par intégration, puisque argth0 = 0, l'expression

Vx E] - 1 , 1[, argth x = ; ln ( ~ ~: ) .

Pour les deux autres fonctions, le calcul par primitive est moins évident ; procédons autre-
ment. Par exemple pour y H argch y, si y E [1, +oo[, on veut résoudre en x E lî+ l'équation
eX + e-X
chx= =y.
2
Posant t = ex, cela conduit à l'équation t + 1/t = 2-y, donc à l'équation du second degré
t 2 - 2ty + 1 = O.
Les solutions de cette équation sont t1 = y - ~ et t2 = y + ~ - Or, t = eX avec
x;?: 0 donc t;?: 1 et, par suite, la solution qui convient est t 2, d'où l'expression
Vy E [1,+oo[, argchy = ln(y + ~ ) .
Raisonnant de la même manière, on obtient l'expression suivante de la fonction argument
sinus hyperbolique
Vy E ffi., argshy = ln(y + Jyï"+î).
Il nous reste maintenant à représenter ces trois fonctions, dont les graphes s'obtiennent évi-
demment à partir des fonctions directes, par symétrie par rapport à la première bissectrice.
819

Ill. FONCTIONS TRIGONOMÉTRIQUES ET INVERSES

Nous abordons maintenant la partie centrale de ce chapitre. Nous avons mis l'accent sur le fait
que, dans les classes secondaires, l'étude des fonctions trigonométriques ainsi que la définition
du nombre 7t étaient basées sur une intuition géométrique et ne pouvaient donc être considérées
comme complètes. Nous sommes maintenant en mesure de construire ces objets de manière
rigoureuse. Notre approche sera basée sur la structure de la droite réelle, ainsi que sur notre
définition de la longueur des « courbes planes». Appliquant ces idées au cercle, ainsi qu'aux
segments de cercle, il est possible de donner un sens précis aux lignes trigonométriques à partir
de la présentation géométrique classique. Cette méthode nous permettra de fonder tous les
résultats que nous avons rencontrés au chapitre 3 de cet ouvrage. Signalons cependant qu'une
autre approche, basée sur l'étude de l'exponentielle complexe, est plus rapide et directe, mais
elle repose sur des idées qui ne seront pleinement développées que dans le cours de L2.

111.1. Les fonctions trigonométriques : présentation géométrique


Nous rappelons d'abord une présentation élémentaire des fonctions (ou lignes) trigonomé-
triques, vue dans l'enseignement secondaire et revue au chapitre 3.

Les fonctions trigonométriques apparaissent sin IX AB


tan1X= - - = - -
dans l'enseignement dès le collège, et sont in- coslX OA'
troduites comme des fonctions qui, à la me- cos IX OA
sure d'un angle aigu d'un triangle rectangle, cotan IX = -.-- = - - .
SlillX AB
associent un nombre défini comme le quo-
tient des longueurs de deux des côtés. Pré- B
cisément, si OAB est un triangle rectangle
en A, et si IX est une mesure (par exemple
en radians) de l'angle géométrique ÂOB, on
définit (voir figure ci-contre) respectivement
le cosinus, le sinus, la tangente et la cotan-
gente du réel IX par
0 A

OA . AB FIGURE 28.6. Lignes trigonométriques


COSIX =OB' SlillX= OB' dans un triangle rectangle

On introduit ensuite au lycée une définition de ces lignes trigonométriques, valable pour
toute mesure d'angle, en utilisant le cercle trigonométrique de centre O et de rayon 1. Préci-
sément, en orientant les droites horizontales par le vecteur OI et les verticales par le vecteur
ÔJ, on définit les lignes trigonométriques
COS IX= OX, sin IX= OY,

(voir figure suivante). Ces définitions sont bien un prolongement des précédentes, et on
conserve celles de tan et cotan. La tangente (resp. la cotangente) n'est donc définie que pour
des réels IX distincts de n/2 + kn, k E Z (resp. kn, k E Z). Sur la figure, elles sont repérées
par les points T et C.

Le problème crucial est que la mesure de l'angle n'est pas clairement définie. Exprimée en
820

FIG URE 28. 7. Le cercle trigonométrique

radians, c'est en effet la longueur du segment de cercle limité par le point I = (1, 0) et le point
M. Nous pouvons maintenant faire mieux.

III.2. Une définition des fonctions trigonométriques


Toute l'étude qui va suivre est basée sur une définition préliminaire du cercle, des segments
sur le cercle, et de leur longueur.

IIl.2.1. La longueur des segments du cercle

Commençons par définir les objets principaux, qui seront des parties de JR. 2 .

Définition 28.14. Le cercle trigonométrique est le sous-ensemble 'ef' de JR. 2 défini par

Le demi-cercle supérieur 'ef'+ et le demi-cercle inférieur 'ef'_ sont définis par

'ef'+ = {(x, y) E 'ef' 1 y~ 0}, 'ef'_ = {(x, y) E 'ef' 1 y :S: 0}.

Notons que ces définitions ne reposent sur aucun a priori géométrique. Le cercle est une
partie de JR. 2 formée par les couples dont les coordonnées satisfont une certaine égalité. On
choisit de représenter ce cercle par notre cercle familier, mais nous n'utiliserons jamais de
propriétés issues de cette représentation. En particulier, les mots supérieur et inférieur ne
sont que des moyens mnémotechniques pour repérer les demi-cercles.
Nous ne chercherons pas dans cette partie à donner les démonstrations les plus courtes,
mais plutôt à montrer plusieurs variations sur un même thème, invitant ainsi le lecteur à se
forger sa propre intuition des diverses questions que nous allons aborder.
Pour (u,v) E JR. 2 , rappelons que l'on note ll(u,v)II = ✓u2 +v 2 . Pour A= (u,v) et
A= (u', v') dans JR. 2 , on définit la distance entre A et A' par d(A, A') = IIA-A'II (c'est aussi
par définition la longueur du segment [A, A')). Le cercle 'ef' est donc l'ensemble des éléments
M de JR. 2 qui vérifient d(M, 0) = 1, où O = (0, 0).
Nous allons montrer que le cercle a une longueur bien définie. Pour cela, nous allons nous
limiter au demi-cercle supérieur, et donner en même temps les définitions des fonctions cosinus
et sinus, ainsi que celle du nombre n.
821

Pour x E [-1, 1], on note Ax le point du demi-cercle 'if+ d'abscisse x, c'est-à-dire le point
Ax = (x,vl -x2 ). On note I = (1,0), J = (0, 1) et K = (-1,0). Si Met M' sont des points
de 'if+, dont les abscisses m et m' vérifient -1 ~ m ~ m' ~ 1, on note

(MM') = {Ax / m ~ x ~ m'}.


le segment de cercle compris entre M et M' (là encore, noter que la définition est purement
ensembliste, basée sur la relation d'ordre de JR, et ne fait appel à aucune intuition de type
géométrique).
On note 6(m, m') l'ensemble des subdivisions de l'intervalle [m, m']. Pour une subdivision
cr= (so, ... , Sn) E 6(m, m'), on pose

l(cr) =~
n-i
IIAsi+, -AsJ L, 11 (si+i - Si, ✓1
= n-i - s~+i - ✓1 - sf)
Il
(28.3)
l=Ô l=Ô

c'est donc la longueur de la ligne brisée associée aux points As; (noter que A 50 Met
Asn = M'. On notera aussi que 6(m, m) = {(ml}.
Définition 28.15. Soient M et M' des points de 'if+, dont les abscisses m et m' vérifient
-1 ~ m ~ m' ~ 1. On définit la longueur du segment de cercle (MM') par

lg MM'= sup l(cr) = sup { l(cr) 1 cr E 6(m, m') }- (28.4)


crE6(m,m'l

Comme la partie {l(cr) cr E 6(m,m')} est non vide, la borne supérieure est bien définie
1

dans ~ : elle est égale à +oo si cette partie n'est pas majorée, et c'est la borne supérieure
usuelle si cette partie est majorée. En particulier, lg MM'= 0 si M = M'.
Insistons sur le fait que cette définition de la longueur est aussi purement ensembliste, et
ne repose pas sur la donnée préalable d'une fonction d'un intervalle de lR dans JR 2 dont l'image
serait le cercle. Elle diffère donc de celle que nous avons donnée au chapitre 27. Nous allons
voir au paragraphe suivant comment relier les deux notions.
Le lemme suivant est de démonstration facile, basée sur les propriétés de la borne supé-
rieure, et laissée au lecteur à titre d'exercice.

Lemme 28.16.
1) S<ii~n(x,x',~";dans [-l, 1] avec X:~ x'.,;;; x.1'; .Alors

lg A,:Ax" 7" lg AxAx' + 1g Âx,A~~' . .


~J Sment x,x1, y, y' dans [-1, 1Javec y <x ~ x' ~ y'. Alors
lg AxAx, $ lg A 11A 11, •.

III.2.2. La longueur des arcs plans et la longueur des segments du cercle

Rappelons maintenant quelques propriétés de la longueur des arcs de classe Ci.


◊ Un arc plan est une application d'un intervalle [a, b] de lR dans JR 2 . On dit qu'un arc plan
cp = (cl>x, cpy) est de classe ci si ses deux composantes cl>x, q>y sont de classe ci. L'image d'un
arc plan s'appelle une courbe plane. Nous reverrons plus en détail ces notions au chapitre 30.
822

Q)
<Il
.Q
al
'if+
~
t:: K I
Q) m m
~
c..

FIGURE 28.8. Le cercle trigonométriq ue et le segment (MM')

o Soit <j:> : [a, b] ---i JR 2 un arc plan de classe ci. Pour toute subdivision O' = (s 0 , •.. , sn) de
[a, b] (qui vérifie par définition a= s 0 <si ... < Sn= b), on note
n-i
f(<P, O') = L. ll<P(si+i) - <j:>(silll- (28.5)
i=O

On voit donc que f( <j:>, O') est la longueur de la ligne brisée associée à O', union des segments
dont les extrémités sont les points consécutifs de la suite <j:> (0'1), 0 ~ i ~ n.
o Alors la longueur 2(4>) de l'arc <j:> est définie par

2(4>) = sup{f(<j:>, Œ) 1 O' E 6(a, b)}, (28.6)


où 6(a, b) est l'ensemble des subdivisions de [a, b]. On notera que l'on définit ainsi la longueur
de l'application <P, et non de son image <j:>([a, bl}. Une même courbe plane peut être l'image
de deux arcs de longueurs différentes.
,o On montre (voir le chapitre 27) que 2( <P) est un réel positif, qui vérifie

2(4>) = f ll<P'(tlll dt.

Ces préliminaires étant posés, revenons à notre problème. Pour étudier la longueur du
demi-cercle 'if+, l'idéal serait de connaître une fonction de classe ci ayant 'if+ pour image.
Mais jusqu'ici nous n'en avons pas à notre disposition (notre travail va d'ailleurs conduire à la
construction d'une telle fonction, à savoir t H (cos t, sin t)). Cependant, il existe une fonction
très intéressante, dont l'image est le demi-cercle 'if+, il s'agit de la fonction <1> de [-1, 1] dans
JR 2 définie par
<l>(t) = (t, ✓i-=='t2).
Il est clair que que six E [-1, ll, Ax = <l>(x) = (x, ✓ 1 -x2 ), et que <1>([-1, ll) = 'if+· La
fonction <1> n'est pas de classe ci sur [-1, 1], car ses deux composantes ne sont pas dérivables
en -1 et +1, mais elle est de classe ci sur l'ensemble] - 1, 1[, puisque ses deux composantes
le sont. C'est évident pour t H t, et la fonction t H ✓ 1 - t 2 est la composée de t H (1 - t2 ),
qui est clairement ci et à valeurs dans JR*, par x H VX, qui est de classe ci dans lR"t., Il en
résulte donc que pour tout intervalle fermé [m, m'] contenu dans ]-1, 1[, l'arc <l>l[m,m'l obtenu
par restriction de <1> à l'intervalle [m, m'] a une longueur 2(<1>nm,m'J) bien définie.
823

De plus, par définition de <D, si u est une subdivision de [m, m'], la longueur f(<D, u) définie
en (28.5) coïncide avec la longueur l(u) définie en (28.3). Par passage à la borne supérieure,
en utilisant les égalités (28.4) et (28.6), on obtient donc

(28.7)

Notons que si t E] -1, 1[, ll<D'(t)II = 1/v'f=tï. Comme <D est de classe C 1 sur] -1, 1[,
la fonction t H 1/ v'f=t2 est continue sur ] - 1, 1 [ (on le vérifie directement) ; elle est bien
intégrable sur [m, m'], et on obtient

m' dt
lg AmAm' =
J
m V
~.
2 1- t
(28.8)

On peut maintenant énoncer la proposition principale de cette partie.

Proposlfiôt\·38.17. Poorx E [-:1~1}5oittû>teL{x).;,.lgÀ,J


1) .Pour ~x E {ël, H,I.(x}.~ Itt;.etJ,(J}~O; ·
3). Poït:r to11,f~ eJ:.;..î, lf;• ·
L. • ·•· ·• .

PREUVE. Nous allons commencer par une étude préliminaire du comportement asymptotique
d'intégrales du type précédent. Soit a E] - 1, 1[. Pouru E [a, 1[, posons

u dt
f(u)=
J
a V
~-
1- t2
La fonction f : [a, 1[-, lR que nous venons de définir ainsi est dérivable, sa dérivée est donnée
par f'(u) = 1/ ✓ 1 -u2 ; f est donc strictement croissante. Remarquons que

f(u)=Ju dt <-1-Ju ~=-l-[-2✓f=t]u ~2v'f=a_ (28.9)


a J(l + t)(l - t) - v'f+u a v'f-=-t v'f+u a v'f+u

Il en résulte donc que f est majorée, et possède une limite lorsque u -, 1- , avec

2v'f=a
lim f(u) ~ v'f+u .
u-ll 1+ a

On voit de la même manière que pour v E] - 1, a]

a dt 2v'f+u
fV vT=t2 ~ yl-a • (28.10)

Par ailleurs, on déduit en particulier de (28.9) et (28.10) que pour -1 < m ~ 0 ~ m' < 1

Jm' -v'f=t2
m
--dt
~
Io ---===
m
dt
+ Jm' - -
v'f=t2
dt
- ~ 4.
0 v'f=t2
Cette majoration est encore clairement valable pour tous m, m' vérifiant -1 < m ~ m' < 1.
824

Revenons à la proposition et montrons le point 1). On voit que L(l) = 0 par définition,
et on vérifie que la fonction L est décroissante, en vertu du lemme 28.16. Il suffit donc de
démontrer que L(-1) < +oo et, pour cela, de vérifier que l'ensemble {l(cr) cr E 6(-1, 1)} est
1

majoré. Pour simplifier l'exposition, nous considérerons seulement des subdivisions de ~-1, 1]
de la forme (s 0, ... , snl avec n ): 3, qui vérifient s1 < 0 et Sn-I > 0 et noterons 6 leur
ensemble. Il est en effet facile de voir que

sup{l(cr) 1 cr E 6(--1, 1)} = sup{l(cr) 1 cr E 6}.

Pour -1 < m < 0 < m' < 1 , nous noterons

6(m, m') = {cr= (so, ... ,snl E 6 I s1 = m, Sn-1 = m'}.

Alors, si cr E 6(m, m'), et= (s 1, ... ,sn_1) est une subdivision de [m, m'l, et on voit immé-
diatement que d'après les égalités (28.3) et (28.5)

l(cr) = [[K -Am[[+ f(<D1[m,m'], et)+ [[Am' - If[.

Les hypothèses sur met m' montrent que [[K -Am[[ ~ ,/2 et [[Am' - If[ ~ ,/2. On sait de
plus que

ce qui montre que


l( cr) ~ 4 + 2v'2.
L'ensemble {l(cr) cr E 6(m, m')} est donc majoré par 4+2,/2.. Mais comme 6 est la réunion
1

des ensembles 6( m, m') lorsque m décrit ]-1, O[ et m' décrit JO, 1[, il en résulte que l'ensemble
{l(cr) 1 cr E 6} est aussi majoré par 4 + 2,/2. C'est ce que nous voulions montrer; il en résulte
queL(-1) ~4+2,/2.\
Pour montrer l'égalité du point 2), nous allons vérifier deux inégalités. On voit d'abord
d'après l'égalité (28.8) et le lemme 28.16 que pour tous x et u vérifiant -1 < x ~ u < 1
u dt
fX
~ = lgAxAu ~ L(x).

Il en résulte par passage à la limite que


u dt
lim
U---ll- f
X
~~L(x).
1 - t2
(28.11)

Montrons l'inégalité opposée. Soit E: > O. Par définition de L(x), il existe une subdivision
cr= (s 0 , ••. , Sn) de [x, 1] telle que l(cr)): L(x) - t:/2 (par définition de la borne supérieure).
On peut de plus supposer que Sn-l vérifie

En effet, si ce n'est pas le cas, il suffit d'ajouter un point s E Jsn-1, 1[ à la subdivision, qui
vérifie [[As - If[ ~ t:/2, et de considérer la nouvelle subdivision cr' ainsi obtenue, qui vérifie

l(cr')): l(cr):;: L(x)-t:/2.


825

Nous supposerons donc dans la suite que IIAsn-, - Ill !( E/2. Notons alors fr= (s 0 , ••• , Sn-l),
donc fr E 6(x, Sn-il- On a d'une part

et d'autre part

Il en résulte que, si u?,: Sn-1


u dt J 5
n-l dt
J
X
v'f=t2 ?::
X
v'f=t2
1 - t2
2: L(x) - t:,

ce qui prouve par passage à la limite que limu_,1- f~ ✓ id~t2 ?,: L(x)-t:. Comme é: est arbitraire,
on en déduit que
u dt
v'f=t2?,:
lim
u-,J- X 1 - t2 J L(x).

Ceci montre l'égalité cherchée grâce à (28.11), et termine la preuve du point 2).
Pour montrer le point 3), on voit d'abord facilement en utilisant le lemme 28.16 que Lest
strictement décroissante. En effet, si -1 !( x < y !( 1

L(x) - L(y) = lgAxA1-J > O.


La continuité peut se montrer de plusieurs manières. Par exemple, si x 0 E] - 1, 1[, on voit que
pour h assez petit pour que x 0 + h E] - 1, 1[

u dt Ju dt
L(xo + h) - L(xo) = limu-,1- v'f=t2
2
- lim v'f=t2
2
" J "<J+h 1-t u->J- "<l 1-t

u dt Ju dt
- lim -
- u-,J- (J"<J+h v'f=t2 "<l v'f=tï)
"<J+h dt J"<J+h dt
-
-
lim
u->J- (
-
J "<J v'f=tï) -- - "<J v'f=t2
et il est évident que
"<J+h dt
lim(L(xo + h) - L(x 0 )) = lim v'f=t2 = 0,
~o ~o"<>
J 1-~

la fonction à intégrer étant continue en x 0 . Ceci montre la continuité de L au point x 0 .


Pour montrer la continuité en 1, on doit voir que limx_, 1- L(x) = O. Ceci résulte de
l'encadrement
. Ju dt 2y'î"=x
0 < 1lm
-
---=== ~ -----c=~.
U-)]- X vT=t2 yÎ+x

La continuité en -1 s'établit de la même façon, en utilisant la majoration (28.10). ■

La proposition que nous venons de montrer va nous permettre maintenant d'établir toutes
nos définitions de manière satisfaisante.
826

IIl.2.3. La définition de 7t et des fonctions cos et sin


4)
(/J
R Commençons par le nombre n, pour lequel nous formalisons la définition géométrique intro-
ro
.,ê duite par Archimède, grâce à notre étude préliminaire de la longueur des segments.
Définition 28.18. On pose

7t
- = L(0) = lim
Jb -Jf=xî'
dt
2 b--lJ·- O 1 - x2

Le réel n/2 est donc par définition la longueur du segment de cercle compris entre les
points J = (0, 1) et I = (1,0). Pour des raisons intuitives, nous avons l'habitude de considérer
ce segment comme un « quart de cercle». De même, nous avons dès le début qualifié 'ti+ de
«demi-cercle». On peut espérer que la longueur du demi-cercle soit le double de celle du
quart de cercle, c'est ce que nous allons montrer.

Proposition 28.19. La longueur du ~i-cercle sùpérieur llf+ est égale à 1t.

PREUVE. La longueur de 'ti+ est par définition L( -1), soit, par continuité de L

Jb
L(-1) = lim L(a) = lim
O--l-1+ a--l-]+ ( I vT=t2
o
a
dt
+ lim
b--l]- 0
dt
vT=tï) ,
donc
L(-1) = lim ( Io dt + ~) = ~ + lim Io vT=t2
dt .
a--l-1+ a vT=t2 2 2 a--l-1+ a

Remarquons que le changement de variable s = - t dans l'intégrale précédente conduit à

I Jî--=îZ- 1-a
o
a
dt
0 ~,
ds

donc
.
11m Io ---c=~
dt = 1·1m Ju ds 7t

0--l-]+ a ✓ 1 -x2 U--ll- 0 ~

Il en résulte que
7t 7t
L(-1) = 2+2= n. ■

La fonction L que nous avons construite dans la proposition 28.17 est donc une application
continue et strictement décroissante de [-1, 1) dans l'intervalle [L(l), L(-1)) = [O, n]. Nous
savons donc que c'est une bijection sur cet intervalle. Ceci nous permet de définir les deux
premières fonctions trigonométriques de manière rigoureuse.
Définition 28.20. On note cos la bijection réciproque de la fonction L. La fonction cos est
donc définie sur [0, n], et à valeurs dans [-1, 1], elle est continue et strictement décroissante.
Pour tout x dans [O, n], on pose sin x = Jl - (cos x)2. La fonction sin est donc continue sur
[0,n] et à valeurs dans [O, 1). En d'autres termes, pourx E [0,n], les réels cosx et sinx sont
définis de telle manière que la longueur lg AI du segment de cercle compris entre les points
A= (cos x, sin x) et I = ( 1, 0) soit égale au réel x.

Nous n'avons en fait défini que les restrictions à [O, n] des fonctions sin et cos usuelles, nous
les notons cependant de la même manière pour simplifier l'exposé. Il est maintenant possible
d'étudier les propriétés de régularité des fonctions sin et cos.
827

Elles 'Sont donc de classe C00 •


PREUVE. Sur l'intervalle ] - 1, 1[, la fonction L est dérivable, et sa dérivée est donnée par
-1
L'(x) = v'f=xl'
1-x
Pour le voir, il suffit de calculer le taux d'accroissement

-r h = L(x + h) - L(x) = ~ lim ( fb dt -fb dt ) = -~ ( fx+h dt )


x( ) h h b-->1- x+h vT=tz x vT=tz h x vT=tz
et on en déduit que limh-->O 'tx (h) = -1 / Jl - x 2 par continuité de la fonction intégrée, d'après
le théorème de la moyenne.
La dérivée de L ne s'annulant pas dans] - 1, 1[, la réciproque cos est donc dérivable dans
]O, n[, et vérifie
1
cos'{x) = L' ( ) = -Jl - (cosx) 2 = -sinx, Vx E]O,n[.
o COS X

Il en résulte que sin est dérivable sur JO, 7t[ par composition. La dérivabilité à droite en -1
et à gauche en 1 provient de la proposition 26.33. En particulier, cos~(O) = 0 et sin~(O) = 1,
cos~(n) = 0 et sin~(7t) = -1. Le reste de la proposition en résulte facilement. ■

Pour retrouver toutes les propriétés usuelles des fonctions cos et sin, il nous reste seulement
à montrer la formule « d'addition des angles». Pour la prouver, nous allons utiliser un peu
2 2
d'algèbre linéaire. Soient u et v des réels tels que u + v = 1. Considérons l'application
2 2
linéaire 'l' de IR dans IR définie par

'l'( X, 1J) = ( UX - V1J, VX + U!:J) , (28.12)

2
c'est-à-dire l'application dont la matrice dans la base canonique de IR est

2
Cette application 'l' a la propriété de conserver les distances entre couples de points de IR ;
en effet, si (x, y) et (x', y') sont donnés, et si 'l'(x, y)= (X, Y) et 'l'(x', y') = (X', Y'), alors

ll(X- X', Y- Y')II = Il u(x-x') -v(y -y'), v(x -x') + u(y -y')) Il
(u2 +v 2 )((x-x')2 + (y-y')2) = ll(x-x',y-y')I I-
1
Elle est de plus bijective, et on vérifie facilement que son inverse 'l'- a pour matrice la
transposée de la matrice M. Elle préserve donc aussi la distance entre couples de points du
plan. Il en résulte, comme le cercle C(f' est l'ensemble des points du plan M dont la distance
IIOMII à Oest égale à 1, que 'l'(<:(l) = C(f'_
Nous connaissons l'interprétation géométrique de l'application 'l'; il s'agit d'une rotation
de centre O = (0, 0), dont l'angle est le réel <p E [O, 2n[ tel que cos <p = u et sin cp = v.
828

Mais bien évidemment il n'est pas question d'utiliser cette interprétation avant que toutes les
relations trigonométriques usuelles aient été prouvées. Cependant il peut être utile de garder
cette vision géométrique présente à l'esprit pour comprendre la structure de la démonstration
qui va suivre. Elle sera basée sur le lemme suivant.

t~~~'~.22. ~~ty,e(v.de1Jc#&~Jl()8,itjfJJ+;U_z;fyl-::: \,.,~,!Pte,ff~ ~~


définie par: (28.12); Soient m et tll1 des réels véf'.ifiantjk~ m ~ m' ~ 1. Alors l~ ~
'Y(Am) et \l'{Am,) s~nt dans 'il+, et'leuris a6$etssM µ./et·µ 1 1Jérifient ,....1 _-~- µ :$ µ.'c~-1; De
plus . . . . .·•·· .•· ..... · ,
JgAntJtm, = lgli'(A11i}'Vt~nt"Ε·..
- ,._ -- - ' -- <" ,- J -, ,,-

PREUVE. Par définition Am= (m, ✓1 - m 2 ) et Am'= (m', J1 - m' 2 ). D'après (28.12), les
ordonnées des points 1J'(Aml et 1J'(Am,) sont positives, puisque les coordonnées de Am et Am,
sont positives, et puisque u ~ 0 et v ~ O. Ceci montre que 1J'(Aml E 'ti+ et 1J'(Am,) E 'ti+· Les
abscisses de ces points sont données par

µ=um-vJl -m2 ,

et par définition on a donc Aµ= 1J'(Am) et Aµ, = 1J'(Am, ). Comme met m' sont positifs et
vérifient m ,( m', ✓1 - m 2 2: J1 - m' 2 , et comme u 2: 0 et v ~ 0, on en déduit que µ ,( µ'.
Notre définition (28.4) de la longueur du segment (AµAµ,) s'applique donc.
Considérons maintenant une subdivision cr= (sk)o,;;;k,;;;n E 6(m, m'). Alors si

rk = usk -vJl - s~

on voit en utilisant le même raisonnement que p = (rk)o,;;;k,;;;n est une subdivision de [µ, µ'],
et elle vérifie par construction

Vk E {O, ... , n},

Comme 1J' préserve les distances, on voit que


n-1 n-1

l(cr) = .L_ IIA"k -A"k+' Il= .L_ ll1J'(A"k) -1J'(A"k+' lll = l(p).
k=O

On en déduit que sup{l(cr) 1 cr E 6(m, m')} ,( sup{l(p) 1 cr E 6(µ, µ')}. Réciproquement, si


p = (rk)o,;;;k,;;;n E 6(µ, µ'), on vérifie que si

alors cr = (sk)o,;;;k,;;;n E 6(m, m') et Vk E {O, ... , n}, A"k = 1J1- 1 (ArJ On en déduit que
l(p) = l(cr) et il en résulte que que sup{l(cr) 1 cr E 6(m, m')} ~ sup{l(p) 1 cr E 6(µ, µ')}.
Nous avons donc montré que lgAmAm, = lg1J'(Am)1J'(Am, ). ■

Nous pouvons maintenant prouver la formule d'addition des lignes trigonométriques.


829

PREUVE. Les expressions étant symétriques en ex et f3, on peut supposer O ~ f3 :S: ex :S: n/2.
Posons A = (cos ex, sin ex) et considérons l'application linéaire 1J' définie précédemment, avec
u = cosf3 et v = sinf3. Notons I' = 1J'(I) = (cosf3,sinf3), et A'= 1J'(A). On a clairement
A' E 'i&'+, puisque si A'= (X', Y')

Y'= sin f3 cos a+ cos f3 sin a 2 O.

Par ailleurs
X'= cos a cos f3 - sin a sin f3 :S: cos (3.
Il en résulte que le segment [X', 1] est la réunion des segments [X', cos (3] et [cos (3, 1], et que
les arcs de cercle [A', I '] et [I', I] correspondants vérifient

lg A'I = lg A'I' + lg I'I.

On sait par définition que lg I'I = (3. De plus, le lemme précédent nous montre que

lgA'I' = lgAI = ex.

Il en résulte que lg A 'I = a + (3. Mais par définition, ceci entraîne que

A'= (cos(a+ (3),sin(a+ (3)),

donc cos(a+ (3) = X' et sin(a+ (3) = Y', ce que nous voulions montrer. ■

On en déduit en particulier les relations

cos(n/2 +a)= -sin a, sin(n/2 +a)= cos a, VcxE [0,n/2].

III.2.4. Le prolongement à la droite réelle

Notre but est maintenant de construire les fonctions cos et sin sur la droite réelle. Tout
d'abord, nous allons les prolonger à l'intervalle [O, 21t] en posant

cos a= -cos(a-n), sin ex= -sin(cx-n), Va E [1t,21t].

Nous laissons au lecteur le soin de vérifier (par une étude au point n) que les fonctions ainsi
obtenues sont dérivables sur [O, ln], et vérifient encore les relations cos' = - sin et sin' = cos.
En particulier, elles sont encore de classe cxi sur [0,2n].
Il est intéressant de remarquer que l'on peut encore interpréter les fonctions ainsi pro-
longées comme les «inverses» d'une fonction longueur définie sur le cercle. Pour un point
A E 'i&'_ \ {I}, on définit la longueur du segment (IA) comme la longueur 7t du demi-cercle
supérieur (KI), à laquelle on ajoute la longueur du segment de demi-cercle inférieur compris
entre les points K et A. Cette dernière longueur se définit de manière exactement analogue à
la longueur des segments du demi-cercle supérieur; on laisse au lecteur le soin d'écrire cette
définition en détail.
La proposition suivante est alors de démonstration immédiate.

P~itiOtl 2$.24,' , Si A est un j,oirtt q~que du œrèk ~; ig-JA = « E .{O; 211:[ sf et


seulement si A = (cos«, sin ex). ·
830

t H cost t H sint

0 7t

FIGURE 28.9. Les graphes des fonctions cosinus et sinus

Les graphes des fonctions cos et sin ainsi prolongées se déduisent immédiatement de l'étude
des variations, basée sur l'expression des dérivées et leur étude sur [O, n], en utilisant la relation
de prolongement.
Enfin, on obtient des fonctions définies sur la droite réelle en prolongeant les fonctions cos
et sin que nous venons d'obtenir par Zn-périodicité, c'est-à-dire en posant pour x E lR
cosx = cos~, sinx = sin~,
où ~ est le seul élément de [O, 2n[ tel qu'il existe k E Z vérifiant x = ~ + 2kn. En d'autres
termes,~= 2n{x/2n}. On vérifie encore facilement par une étude aux bornes que les fonctions
ainsi obtenues sont dérivables et vérifient cos' = - sin, et sin' = cos. Elles sont donc de classe
C 00 sur R De plus, elles sont Zn-périodiques par définition même. Enfin, on vérifie facilement
que les formules d'addition sont valables sans changement pour ces nouvelles fonctions. On
en déduit toutes les propriétés usuelles par une étude directe.

111.2.5. La fonction exponentielle complexe

Pour x E JR, on pose


exp(ix) = e'x = cos x + isin x.
La fonction ainsi obtenue est donc Zn-périodique, elle vérifie ei.x = e-i.x pour tout x dans JR,
et de plus

d'après les formules d'addition pour les fonctions cos et sin. En particulier,
le'xl = e'x e-,x = ew = 1.
La fonction g : x H e'x est donc un morphisme du groupe additif (JR, +) dans le groupe
multiplicatif (U, -), où U est l'ensemble des complexes de module 1. En voici maintenant une
propriété fondamentale.

J>~tîqlï· ~i.~m9tpli~·tjtst:jiirjootî{ ~Jil~e't ~ïi'~:i•:i&J~;·11tr':~


inj~tive.,·••· •l\;.'t;• ,;x·"• ., •
PREUVE. Elle est immédiate à partir de l'étude des variations des fonctions sin et cos. ■

Cette propriété sera utilisée à de multiples reprises. Elle est en particulier à la base de la
mesure des angles. On peut aussi rapprocher cette propriété de la construction précédente. En
effet, en identifiant JR 2 à C, l'ensemble U s'identifie au cercle CC, et le point e'x = cos x+ isin x
s'identifie au point du cercle CC de coordonnées {cos x, sin x). La proposition précédente est
donc une reformulation de la proposition 28.24.
831

Test 28.13. primer sous forme de sommes de termes du type


cos ka et sin ka).
Pour a E lR. et n E N, exprimer cos na et sin na
comme expressions polynomiales en cos a et Test 28.15.
sin a. Rappeler en les justifiant les formules de trigo-
nométrie donnant
Test 28.14. 1. cosp + cos q, cosp - cos q,
Linéariser cos4 a, cos 5 4
a, sin a, sin 5 a, (les ex- 2. sin p + sin q, sin p - sin q.

111.2.6. Les fonctions tangente et cotangente

À l'aide des fonctions sinus et cosinus, on définit les fonctions tangente et cotangente.

Définition 28.26. Les fonctions tangente et cotangente sont définies respectivement sur les
ensembles~\ {n/2 + kn I k E Z} et~\ {kn I k E Z} par
sinx cosx
tanx=-- cotan x = -.--.
cosx smx

Il est facile de vérifier que ces deux fonctions sont n-périodiques. Compte tenu des opéra-
tions sur les fonctions dérivables, ces deux fonctions sont dérivables, de dérivées respectivement
données par
2
tan' x = 1 + tan2 x et cotan' x = -1 - cotan x.
On voit aussi par une étude directe que

lim tant= -oo, lim tant= +oo, lim cotant= +oo, lim cotant= -oo.
t--l-n/2+ t--l+n/2- t--lO+ t--ln-

Voici les graphes des fonctions tangente et cotangente, en restriction à] - n/2, n/2[ et ]O, n[.

t H tant t H cotant
1 1
1 1
1 1
1 1
1 1
1 1
1 1
1 1
1 1
ni ln 0
-2, 12
:n
1 1 1
1 1 1
1 1 1
1 1 1
1 1 1
1 1 1
1 1 1

FIGURE 28.10. Les graphes des fonctions tan et cotan

On renvoie le lecteur au chapitre 3 pour les autres propriétés des fonctions trigonomé-
triques, qui peuvent maintenant être considérées comme complètement établies.
832

Test 28.16. Test 28.17.


Rappeler en les justifiant les formules donnant Exprimer cos a, sin a et tan a à l'aide de
tan( a+ b) et tan( a - b) en fonction de tan a et tan(a/2).
tan b.

III.3. Des fonctions trigonométr iques à leurs réciproques


Les quatre fonctions trigonométrique s précédemment définies sont périodiques donc non in-
jectives, il n'y a donc pas lieu de parler de leurs réciproques. Cependant, en les restreignant
à des intervalles convenables, il est possible de le faire, comme nous allons le montrer.

111.3.1. Les fonctions arcsinus et arccosinus

Sur l'intervalle [-rr/2, rr/2], la fonction x H sin x est strictement croissante; puisqu'elle est
continue, elle définit donc une bijection de [-rr/2, rr/2] sur son image [-1, 1]. La bijection
réciproque est appelée la fonction arcsinus et notée

arcsin: [-1, 1] ----, [-rr/2, rr/2], -y H arcsin -y.


On a évidemment, par définition d'une fonction réciproque

\/x E [-rr/2, rr/2], arcsin(sin x) = x, V-y E [-1, 1], sin(arcsin-y) =-y.


De la même manière, comme la fonction cos est continue et strictement décroissante de [-rr, rr]
dans [-1 , 1] elle admet une fonction réciproque appelée arccosinus et notée

arccos: [-1, 1] ----, [0, rr], -y H arccos-y,

qui vérifie par définition

\/x E [0, rr], arccos( cos x) = x, \/-y E [-1, 1], cos(arccos-y) =-y.

Att CllîÎOll Aux intervalles de définition


Six ri. [-rr/2,rr/2], arcsin(sinx) -1- x et six ri. [0,rr], arccos(cosx) -1- x. Par exemple,
arcsin(sinrr) = 0, arccos(cos(-rr/2 )) = rr/2.

La fonction sinus étant dérivable sur ] - rr/2, rr/2[, avec une dérivée non nulle, la fonction
arcsinus est dérivable sur ] - 1 , 1 [ et pour tout x E ] - 1 , 1 [

. 1
arcsm' x = - - - - -
sin' (arcs in x) cos (arcs in x) ·

Puisque cos 2 (arcsinx) = 1-sin2 (arcsinx) = 1-x2 , et comme la fonction cosinus est positive
sur l'intervalle ] - rr/2, rr/2[ dans lequel la fonction arcsinus prend ses valeurs, on en déduit
que

\/x E] - 1, 1[, arcsm 1 x = ~ 1
.
vl -x 2
833

De même, la fonction arccos est dérivable sur ] - 1, 1 [, avec

Vx E] -1, 1[, arccos ' x -1 .


= ~ 2
vl -x

On reconnaît là évidemment la fonction que nous avons rencontrée dans la construction de


la fonction cosinus. Ce que nous avons fait est précisément une construction des fonctions
trigonométriques à partir d'une interprétation géométrique des fonctions trigonométriques
inverses.

-1 0

FIGURE 28.11. Les graphes des fonctions x >--l arcsinx et x >--l arccosx.

Test 28.18. Test 28.19.


Calculer Montrer que la fonction définie sur [-1, 1) par
arccos(cos(Sn/4)), arccos( cos(-n/3)), x H arccos x + arcsin x est constante et déter-
miner la valeur de cette constante.
arcsin(sin(3n/2J), arcsin(sin(-9n/4) ).

111.3.2. La fonction arctangente

La fonction tangente, en restriction à l'intervalle ] - n/2, n/2[, réalise une bijection sur IR. La
fonction réciproque de cette bijection est appelée la fonction arctangente et notée

lR--,] - n/2, n/2[, y H arctan y.

On a ainsi par définition

Vx E] - n/2, n/2[, arctan( tan x) = x, Vy E JR, tan( arctan y) = y.

Aux intervalles de définition


Pour x r/.] - n/2, n/2[, on a arctan( tan x) -/= x.
834

La fonction arctangente est dérivable et on a

1 1
Vx E JR, arctan x = - --2"
1 +x
La proposition suivante établit deux formules importantes concernant le comportement de
cette fonction vis-à-vis de la somme.
Proposition 28.27'.
1) Poor tout réel x non nul on a
.a,rctanx
· ·..... .. t .7t

+ arctatl.-.=
X
e-:;,. ·
.t.

=
avec t = 1 six > 0 et E- -,-cl ilx < O.
2) PfhJ,r}o'JJJ5 réels x et y non nuls et non inverses l'un. de l'a,tre (X.lf'F 1)
. .•. x.if.· • .
3rctat1x+ arctan-y ·. · y + C;
= arctan -1·-xy
> ,, C - ~ -

où C = 0 si xy < l, C = ....:.n six•< 0, y< 0 et xy> let C=1t sî i > 0, y> 0 et xy > 1.
PREUVE.

1) Posons f(x) = arctanx+arctant; cette fonction est dérivable sur JR*, et sa dérivée est
nulle. Par suite, elle est constante sur chacun des intervalles J - oo, 0[ et JO, +oo[. Ainsi, pour
tout réel x E JO, +oo[, on a
1
arctan x + arctan - = f(l) = arctan 1 + arctan 1 = n/4 + n/4 = n/2.
X

De même, en prenant la valeur de f en -1, on obtient que, pour tout x E J - oo, 0[, on a
- 1
arctan x + arctan - = -n/2.
X

2) Fixons y= b dans JR* et posons pour x E JR* \ {1/b}

x+b
g (x) = arctan x + arctan b - arctan - - - .
1 -bx
Cette fonction est dérivable et là encore, comme le lecteur pourra le vérifier à titre d'exercice,
sa dérivée est nulle. Elle est donc constante sur chacun des intervalles dont JR* \ {b} est
réunion. Si par exemple b > 0, on a JR* \ {b} =J - oo,0[UJ0, 1/b[U]l/b,+oo[, et donc en
utilisant le fait que la fonction arctangente est continue et impaire, et la propriété 1), on
a Vx EJ-oo,0[, g(x) = limt--t_00 g(t) = -n/2+arctanb-arctan(-l/b ) = O. De même,
Vx E JO, 1/b[, g(x) = limt--,o+ g(t) = arctan b - arctan(b) = O. Enfin, Vx E Jl/b, +oo[, g(x) =
limt--t+oo g(t) = n/2 + arctan b - arctan(-1 /b) = 7I.
On a ainsi prouvé que si y = b > 0, pour tout x non nul vérifiant xb = xy < 1, g(x) = 0
et pour tout x non nul vérifiant xb = xy > 1, g(x) = 7I. En procédant de même si b < 0,
on obtient que, pour tout x non nul vérifiant xb = xy < 1, g(x) = 0 et pour tout x non nul
vérifiant xb = xy > 1, g(x) = -7I. La propriété est donc prouvée. ■

Nous renvoyons le lecteur au chapitre 3 pour les autres propriétés des fonctions trignomé-
triques réciproques.
835

Test 28.20. Test 28.21.


Résoudre dans R les deux équations Donner l'ensemble de définition et simplifier les
cos(arctanx) =0, cos(2arctanx) =0. fonctions x H tan (arccos x), x H arcsin (sin x),
x H cos(arcsinx).

III.4. Des fonctions réciproques aux fonctions trigonométriques


Nous allons maintenant montrer comment utiliser l'inverse de la fonction tangente pour in-
troduire rapidement les fonctions trigonométriques. Nous ne donnerons qu'un rapide aperçu
de la méthode, et laissons les vérifications soignées au lecteur à titre d'exercice.
La fonction t H 1/ (1 + t 2) est continue sur lR. Pour x E JR, posons

f(x) = Ix 1 dt 2.
0 +t
La fonction intégrée étant paire, la fonction f est donc impaire. D'autre part, elle est évidem-
ment dérivable et même indéfiniment dérivable et, pour tout réel x, on a f'(x) = l~xz > O.
La fonction f est donc strictement croissante sur JR. Montrons que f est majorée, ce qui mon-
trera qu'elle admet une limite lorsque x tend vers +oo (et donc aussi lorsque x tend vers -oo
puisqu'elle est impaire). En effet, on a clairement, pour x ~ 0

f(x) = IX dt
0
1 + t2 =
Il
0
dt IX dt Il dt IX dt
1 + t 2 + 1 1 + t 2 :S O 1 + t 2 + 1 t 2
Il dt
= o 1 + t2 +
[-1] x
t 1
'

d'où finalement

f(x) =
IX dt
-1--2 :S
o +t
Il dt
-1--2
o +t
+ 1- -1
X
( 1+
Il dt
-1--2·
o +t
Notons l = limx---Hoo f(x). On vérifie que l > 0 et on peut définir le nombre n par l'égalité
n = ll. La fonction continue f est alors une bijection strictement croissante de lR sur l'intervalle
] - n/l, n/l[; c'est même un C 1--difféomorphisme. Notons alors
tan : lR \ {n/l + kn, 1 k E Z} -----, JR, x H tan x
l'unique fonction n-périodique prolongeant la fonction f~l à lR \ {n/l + kn, 1 k E Z}. On a
alors, pour tout x E] - n/l, n/l[,

tan' x = - -1- - = - -11- = 1 + tan 2 x,


f'( tan(x)) l+tan2 X
cette égalité étant encore vraie sur lR \ {n/l + kn, k E Z}, par n-périodicité.
1

Définissons maintenant la fonction cosinus sur lR comme la fonction paire et ln-périodique


dont la restriction au segment [O, n] est donnée par
1 -1
cos x = -----;===== si x E [O, n/l[, cos x = -----;===== si x E ]n/l, n] et cos n/l = O.
✓ 1 + tan 2 x ✓1 + tan2 x
Puisque limx---->n/2 tan x = +oo, cette fonction est continue sur le segment [O, n] et on vérifie
qu'elle l'est sur lR tout entier. On définit alors la fonction sinus sur lR comme la fonction
impaire et ln-périodique dont la restriction à [O, n] est donnée par

sin x = J1 - cos2 x.
836

La fonction x H cosx est évidemment dérivable sur [0,n/2[U]n/2,n]; elle l'est aussi en n/2
puisque, en dérivant son expression à gauche, puis à droite de n/2, on obtient respectivement
-tanx tanx
et
✓1 2
+ tan x
et ces fonctions ont la même limite -1 lorsque x tend vers n/2 respectivement par valeurs
supérieures et inférieures. Les dérivées à droite en O et à gauche en 7t étant nulles, et la fonction
étant paire et 2n-périodique, la fonction est finalement dérivable sur IR. En outre, on a, pour
tout réel x, cos' x = - sin x. Les autres propriétés sont laissées au lecteur (en particulier la
formule d'addition ... ).

IV. LES FONCTIONS COMME SOLUTIONS D'ÉQUATIONS

Nous avons vu au chapitre 24 que certaines fonctions pouvaient être définies comme solutions
d'équations, c'est par exemple pour la réciproque d'une bijection. Nous allons voir dans ce
qui suit deux types d'équations particulières dont les inconnues sont des fonctions. Nous
distinguerons de manière un peu arbitraire les équations ne faisant intervenir aucune dérivée
de la fonction inconnue, que nous appellerons équations fonctionnelles, de celles qui font
effectivement intervenir ces dérivées, que nous appellerons équations différentielles. Notre but
est ici de montrer quelques exemples de telles équations, dont les solutions nous permettront
de retrouver les fonctions élémentaires que nous avons construites au début de ce chapitre.

IV .1. Les équations fonctionnelles


Plutôt que d'essayer de définir précisément ce que l'on entend par équation fonctionnelle, nous
allons traiter quelques exemples. Pour ce faire, suivons Cauchy qui, en 1821, dans son Analyse
algébrique, au chapitre V intitulé « Détermination des fonctions continues d'une seule variable
propres à vérifier certaines conditions », nous donne quatre exemples et par la même occasion
un point de vue très intéressant sur les fonctions continues. Précisément, voici ce qu'il écrit à
ce propos. « Lorsque, au lieu de fonctions entières, on conçoit des fonctions quelconques, dont
on laisse la forme entièrement arbitraire, on ne peut plus réussir à les déterminer d'après un
certain nombre de valeurs particulières, quelque grand que soit ce nombre ; mais on y parvient
quelquefois dans le cas où l'on suppose connues certaines propriétés générales de ces fonctions.
Par exemple, une fonction continue de x, représentée par cj)(x), peut être complètement dé-
terminée lorsqu'elle est assujettie à vérifier, pour toutes les valeurs possibles des variables x
et y, l'une des équations
cj)(x +y)= cj)(x) + cj)(y),
cj)(x +y)= cj)(x) x cj)(y),
ou bien, pour toutes les valeurs positives des mêmes variables, l'une des équations suivantes :

cj)(xy) = cj)(x) + cj)(y)


cj)(xy) = cj)(x) x cj)(y).
La résolution de ces quatre équations présente quatre problèmes différents que nous allons
traiter l'un après l'autre. »
Et nous allons étudier aussi ces quatre équations. Mais auparavant, nous allons commenter
les premières lignes du texte que nous venons de citer. Cauchy, ici, fait allusion au fait que
837

certaines fonctions possèdent une grande « rigidité », en ce sens que si on les connaît sur
une « petite » partie de leur ensemble de définition, on les connaît partout. Par exemple,
les fonctions polynômes possèdent une telle propriété de rigidité, puisque la donnée de n + 1
valeurs pour une fonction polynôme de degré n la détermine complètement. Plus généralement,
Cauchy parle de fonctions entières, qui seront étudiées dans les cours de L2 et L3. Ces fonctions
entières, qui sont des « polynômes de degré infini », ne sont pas aussi rigides que des polynômes
et leur restriction à un ensemble fini de points ne les caractérise pas complètement. Ce fait
est intuitivement compréhensible, puisqu'il faut de plus en plus de valeurs pour déterminer
un polynôme à mesure que son degré grandit. Cependant, on peut montrer que si on connaît
la restriction d'une fonction entière à un intervalle non réduit à un point (ou même seulement
à l'image d'une suite convergente et son point limite), alors on la connaît cette fonction en
tout point.
Jusqu'à l'époque de Cauchy, la plupart des fonctions manipulées par les analystes ont
cette propriété, et ce n'est qu'à partir des « temps modernes» que l'on se met à envisager des
fonctions beaucoup plus générales, qui ne se comportent donc pas aussi simplement. Parmi ces
nouvelles fonctions, les fonctions continues jouent un rôle central. Elles sont beaucoup moins
rigides que les fonctions entières, mais Cauchy avait déjà remarqué qu'elles ne sont pas si
imprévisibles que cela. En fait, leur propriété fondamentale, qui va être utilisée pour résoudre
ces diverses équations fonctionnelles, est qu'elles sont parfaitement déterminées lorsqu'on les
connaît sur une partie dense de leur ensemble de définition. C'est demander beaucoup plus
que pour les polynômes ou les fonctions entières, mais cela suffit pour traiter les problèmes
posés par Cauchy. Nous allons énoncer un lemme préliminaire qui met en relief cette propriété
de rigidité des applications continues.

tëmm.e 28.2!; .•··•Soit A ùne· partie ilt;ni~ ·de lt.. s;;îènt f .• et ·g p,euxffJnttions contirfaes. de R
dans RJelles.quêf(x.}= g(xJpour toutx de Â; .Alors f(x),,.;: g{x)~~rtout x de R, donc.
f :=; g. .

PREUVE. Notons h = g - f, alors h est continue et nulle en tout point de A. Il suffit de


montrer que A est nulle sur R Soit x E R Par densité de A dans JR, il existe une suite (r nlnEN
d'éléments de A qui converge vers le réel x. Puisque h est continue, on a alors

lim h(rnl lim rn) = h(x),


= h( n-----"-t+oo
n-----"-1+00

et comme pour tout n;


h(rnl = 0, la limite est aussi nulle, donc h(x) = O. Ceci étant vrai
pour tout réel x, la preuve est terminée. ■

Commençons par la premiere équation de Cauchy.

ThêorênÎe ts.~. Les fonctions continv.e's f :R ·~ ·lll s11,ti$faîsant


v'(x,11) E If\ f(x +y)== f(x}" +fh,); (El)

sont les fonctions linéai~s ax, où ô ést une constailte réelle arbitraire. Ên tem,es
.?iJgéb.~, .et;la iignifiei;'D!ê7 les~ ei1,dèrrÛ>'iphîsme$
H
continw ·d11r• urO'JJ4JfJ ct,dd'ib,J {R:v+) sont
·ex.actement les Jonctions lm~ires. •. ·

PREUVE. Il est clair que les fonctions linéaires satisfont cette équation (E 1).
Réciproquement, montrons que toute solution est linéaire. En appliquant l'équation à
x =y= 0, on voit que f(O) = O. Il en résulte que pour tout réel x, on a f(-x) = -f(x) en
appliquant l'équation à y = -x.
838

Posons alors a = f(l); utilisant l'équation fonctionnelle, une récurrence immédiate nous
montre que pour tout n EN, on doit avoir f(n) =an.Donc puisque f(-n) = -f(n), on voit
que f(n) = an pour tout n E Z.
Maintenant, si q E N*, en écrivant 1 = 1/ q + 1/ q + · · · + 1/ q ( q fois), on montre par une
récurrence immédiate que
a= f(l) = f(l/q + 1/q + · · · + 1/q) = f(l/q) + f(l/q) + · · · + f(l/q) = qf(l/q),
d'où f(l/q) = a/q. Mais alors, si p EN, en écrivant le rationnel p/q comme p fois la somme
de 1/q, on obtient f(p/q) = pa/q = ap/q et donc finalement, en utilisant la propriété
f(-x) = -f(x),
\/r E Q, f(r) = ar.
La fonction g : lR -) lR définie par g(x) = ax est continue. Les fonctions f et g sont égales
sur Q, et Q est dense dans R Il résulte donc du lemme 28.28 que f = g, ce qui montre notre
assertion. ■

Nous allons donner une autre preuve du théorème précédent, basée sur le fait qu'une
fonction continue satisfaisant l'équation (El) est automatiquement dérivable. Soit f continue
satisfaisant pour tous réels x et y
f(x +y)= f(x) + f(y).
Fixons x E lR et intégrons en y entre Oet 1, ce qui est possible puisque les fonctions considérées
sont continues. Il vient alors

{ f(x + y)dy = f(x) + { f(y)dy.

Effectuant le changement de variable t = x + y dans la première intégrale nous obtenons


x+l f(t)dt = f(x) + Jl f(y)dy.
Ainsi, pour tout réel x, on a
fx
0

f(x) = F(x + 1) - F(x) - { f(y)dy,

où F est une primitive de f sur R Il en résulte 'facilement que f est dérivable en vertu des
théorèmes usuels. Mais alors, revenant à l'équation initiale, fixant y E lR et dérivant par
rapport à x, nous obtenons que f'(x+y) = f'(x). Ainsi, pour tous réels x et y, on a f'(x+y) =
f'(x), donc f'(x) = f'(O) pour tout x, donc f' est constante. Notant a la valeur de f', et posant
g = f - a, on a donc g'(x) = 0 pour x ER Nous savons, par le théorème des accroissements
finis, qu'il existe alors b E lR tel que g(x) = b pour tout x E JR, soit f(x) = ax + b. Mais
f(O) = 0 donc b = 0 et le résultat est prouvé.
Passons maintenant à la deuxième équation de Cauchy.

~~-~~?:~'~Î!J~J~ tttij~~'}~~,Ri~•: t·'


.\\:.vî~ij){ii, . i(~.{y};Jtl1t€i},'. ·•
"':;_~,-

;~rite l~ Ji,tè'i{@.n1iil#t iês/mi~ti,ôlis ~~ll68 X H a,11:r l)j, ~ e.,t u~~c~tq.fli#,Y'ée_lle


1Jétiet~imtf1lJSÎ~~~uj,~Ji1,i,~~.les'#uitrt•1o/))'Jm~'~us;d_,~iM$d,itîf
{JR,,+J. tlans·le 7l}TOUJm' mult~fOtk+oo[, ..}.sont..e:ta.ct&me1it œsfooctions:,fJfJ;pfit,tmÎklle.s;.
839

PREUVE. La fonction nulle est évidemment solution et on a vu que les fonctions exponentielles
de base a > 0 le sont aussi.
Réciproquement, soit f une fonction continue, non identiquement nulle, solution de cette
équation fonctionnelle. Alors f ne peut jamais s'annuler car si on avait un réel xo tel que
f(x 0 ) = 0, on aurait pour tout réel x
f(x) = f(x - x 0 + x 0 ) = f(x - x 0 )f(xo) = 0,
et donc f serait identiquement nulle. En outre, on a alors f(x) > 0 pour tout réel x, car
f(x) = f(x/2 + x/2) = f(x/2)2. On peut donc définir une fonction g par g(x) = ln f(x) pour
x E lR. Cette fonction composée est continue et satisfait l'équation fonctionnelle
V(x, y) E Ile, g(x +y)= ln f(x + y) = ln(f(x)f(y)) = ln f(x) + ln f(y) = g(x) + g(y),
donc g est solution de (El). Il s'ensuit qu'elle est de la forme g(x) = Ax où A est une constante
réelle arbitraire. Posons a = exp A, alors, pour tout réel x,
f(x) = exp g(x) = exlnu = ax,

ce qui termine la preuve. ■

Nous allons utiliser la même stratégie pour résoudre le troisième problème de Cauchy.

T1-éôrêJriê ,28.:J:t:•. kes/i!ti~tion.s' contïn~ f : JO,:+oo[ -i 'fil siJ,tisfàis~t .


··•Vt~~yJ~i•}Ô~+œfr--- ,f(~{)=;ffx:J
, -: - - - -
; -
-~ - ,, -
+f{vK· .
- -

sint.lesf(!1>~tia,ns, id ~~x,. ,iê. ~fj~é,~e.


no'
homomorphismes conti'1mll du"groÎupe multiplicatif
rt,;tlê.irbit~fi~ Çeiir,,iefq~çjes
}:dtm's lé grf)t1ipc\1J,lt!,.it:if fR;rH:
+oq(l •
PREUVE. Là encore, on voit que la fonction nulle et les fonctions logarithmes sont solutions.
Réciproquement, soit f une fonction, non identiquement nulle, solution de cette équation
fonctionnelle. Posons cette fois g = f o exp ; cette fonction est définie et continue sur IR et
vérifie pour tous réels x et y
g(x +y)= f(exp(:' +y))= f(exe11) = f(ex) + f(e 11 ) = g(x) + g(y),
donc elle est solution de (E 1). Elle est donc de la forme g (x) = Ax pour une constante réelle
arbitraire A. Ainsi, pour tout réel x strictement positif, on a
f(x) = f(explnx) = g(lnx) = Alnx.
Comme f a été supposée non identiquement nulle, A est différent de O et f(x) = ln x/ ln a
avec a= exp(l/A). ■

Les solutions de l'équation (E3) sont donc la fonction nulle et les fonctions logarithmes de
base a, x H log a x = ln x/ ln a, où a est une constante réelle strictement positive et différente
de 1.
Th~"1ê' $:;32:"; .kslJitfflèii~ ~tî~s'. fn 10.+r/lbf➔ lit s~Jai,ant ·.
V{x1 y} ElO,+CX1{2, f{xu) =f{x)f{y},

&1:•t ~t·~'
840

PREUVE. À nouveau, la fonction nulle et les fonctions puissances sont solutions.


Réciproquement , soit f une fonction, non identiquement nulle, solution de cette équation
fonctionnelle. Alors f ne s'annule jamais, car s'il existait x 0 > 0 tel que f(x 0 ) = 0, alors pour
tout réel x > 0, on aurait f(x) = f(x 0 x/x 0 ) = f(xo)f(x/xo) = 0, ce qui a été exclu. En outre,
f est alors à valeurs strictement positives car pour tout X> 0 on a f(x) = f( y'x2 ) = f( y'x)2.
On peut donc poser, pour tout x > 0, g(x) = ln f(x). Cette fonction continue g satisfait alors
à l'équation fonctionnelle (E3)

V(x, y) E]O, +oo[2 , g(x-y) = ln f(x-y) = ln(f(x)f(-y)) = ln f(x) + ln f(-y) = g(x) + g(-y).
Par conséquent, il existe un réel ex tel que, pour tout x > 0, g(x) = cxln x, d'où f(x) = xcx (le
cas ex = 0 correspondant à la fonction constante de valeur 1), ce qui termine la preuve. ■

IV.2. Une équation différentielle


Une équation différentielle est une équation faisant intervenir une fonction inconnue et cer-
taines de ses dérivées. Par exemple,

(1 + x 2 )f'(x) + xf(x) = x 4 ou f"(x) + 3f'(x) - f(x) = ex


sont des équations différentielles. Nous verrons des exemples d'équations différentielles de
manière détaillée au chapitre 31. Pour le moment, nous aurons seulement à utiliser le lemme
suivant. Il arrive que l'on prescrive à la solution certaines de ses valeurs (par exemple on exige
que f(x 0 ) = a en un point x 0 du domaine de définition); on dit alors qu'on a une équation
différentielle avec donnée de Cauchy.

L~tnllle ~$.3$. .· Soient I un inter;1Jalle de lit et g ·une fonétionContinue surf ,Alqri Î 1équ<.Jtïrm
t/:ilférentfel,le
f'(x) = g(x), VxE I
a pour ense:mple de solutions S ={G + c l c E JR.}, où.Gest u11,e primitive quelconque de g.
Si Xo E I et a ER, l 'éqù.ation ·différentielle avéc donnée• de Caùchy ·
~
f'(x) = g{:xj; V:x E I, et f(Xo) =a f~C):
admet une unique solution.

PREUVE. Comme la fonction g est continue sur I ; elle possède une primitive G sur I. On
voit que toute fonction de S est solution de (E). Réciproquement , si f est une solution de
E, alors f - G a une dérivée nulle sur I ; elle est donc constante puisque I est un intervalle,
donc f = G + c, où c E JR, ce qui montre que toute solution est dans S. Enfin, il en résulte
directement l'existence et l'unicité des solutions de (EC). ■

Dans ce paragraphe nous allons étudier l'exemple fondamental donné par le théorème
suivant.

Tlt~~~ is.~~-. 11 éxiste.une et uné sew.le fonction définie: et dérit1ablèJiiJir,Jl:;·~~îfsi~i11/1/rit


t'éq+,tatjJJ1;c#i,fferent?,èlle a'IJeC donnre de 6a1u:hy suivantè :· · · · ·• · · ·
841

Ce théorème peut être démontré de deux manières très différentes. Si l'on connaît au
préalable l'existence et les propriétés de la fonction exponentielle, la preuve est très simple.
L'existence provient directement des propriétés de exp, qui est clairement solution, et l'unicité
est presque immédiate. Si en revanche on ne suppose pas connue la fonction exponentielle, il
est possible de donner du théorème une preuve directe, basée sur une méthode due à Euler,
qui peut être vue comme une nouvelle construction de l'exponentielle.
Pour commencer prouvons le théorème en utilisant les résultats de la partie I sur l'expo-
nentielle.
1) Existence. La fonction x H ex satisfait bien (P).
2) Unicité. Soit f une solution de (P). Considérons la fonction qi définie par qi(x) = f(x)e-x.
Cette fonction est dérivable sur lR et sa dérivée est donnée par qi'(x) = f'(x)e-x - f(x)e-x.
Elle est donc identiquement nulle puisque, pour tout x, f'(x) = f(x). Il en résulte que qi est
constante et puisque qi(O) = 1, on a f(x)e-x = 1 pour tout réel x, soit f(x) = ex.
La première preuve est donc presque immédiate. Passons maintenant à l'exposé de la
méthode d'Euler.
Résolution de (P) par la méthode d'Euler. Il s'agit d'une méthode d'approximation de
solutions d'équations différentielles, dont la portée est plus large qu'une simple application à
(P). Elle consiste à remplacer la dérivée par le taux d'accroissement sur un petit intervalle,
c'est-à-dire, géométriquement, la tangente par la corde. Ainsi, si l'on veut approcher une
fonction f vérifiant (P) sur l'intervalle [O, x], x réel fixé, on découpe, pour n E N*, cet intervalle
en n sous-intervalles de longueur x/n, et on écrit
X
= 1 + -,
X
f ( -X) ;;:;; f(O)
X
+ -f'(O) = f(O) + -f(O) n
n n n

et ainsi de suite. On obtient en définitive que

ce qui invite à penser que l'on a exactement

f(x) = lim
n-t+oo
(1 + ~)n,
n
ce qui nous reste à prouver maintenant que nous avons expliqué pourquoi nous allons nous
intéresser à cette suite. Pour x fixé dans JR, notons

et Vn(X) ( nx)-n .
= 1-
Nous désignerons plus simplement ces suites par Un et Vn lorsqu'il n'y aura pas d'ambiguïté
sur le réel x. Nous allons montrer que ces deux suites sont adjacentes et donc, en particulier,
que la suite (unlnEN* converge, puis que la limite constitue ainsi une solution de (P) lorsque
x varie.
◊ Montrons que (UnlnEN* est croissante à partir d'un certain rang. On a

n+l ( )n+l
Un+l = ( 1 + n: 1 ) = 1 + ~ - n(n\ 1) '
842

et donc comme 1 + x/n est non nul pour n assez grand, on peut écrire
(1.)

~ Un+i=(l+~)n+l (l- x )n+l=(l+~)n+l( l- X )n+l


~ n n(n+l)(l+x/n) n (n+l)(n+x)
è:
(1.)
Or, pour tout réel a< 1 et tout entier naturel n, on a l'inégalité

~ (1 - a)n? 1 - na. (28.13)


Admettons cela un instant et concluons. Puisque pour n assez grand (n+l)(n+xl < 1 cette
inégalité s'applique et conduit à

Un+l ::::: ( 1 + nx)n+l( 1 - x) (


(n + X) = 1 +
x)n+l n
n (
n +X= 1 +
x)n
=Un; n
et donc la suite (unlnEN* est croissante à partir d'un certain rang.
o Prouvons maintenant l'inégalité (28.13). Cela se fait par récurrence; c'est vrai pour n = 1
et si pour un entier n donné, on a (1 - a)n? 1 - na, alors, puisque 1 - a? 0,

(1-a)n+l? (1-na)(l -a)= 1-(n+ l)a+na2 ? 1-(n+ l)a,

ce qui achève la récurrence.


o Prouvons maintenant que la suite (vnlnEN* est décroissante à partir d'un certain rang. Il
suffit pour cela de remarquer que, puisque pour n assez grand Un n'est pas nul, on peut écrire
Vn(x) = 1/Un(-x) ce qui assure, la suite (UnlnEN* étant croissante à partir d'un certain rang,
la décroissance de (vnlnEN* à partir d'un certain rang.
o Montrons que Vn - Un-, 0 lorsque n-, +oo. On a

-Un = ( 1 -xz)n
-
2
x2
? 1--,
Vn n n
d'après l'inégalité (28.13) qui s'applique puisque x2 /n2 < 1 pour n assez grand. Ainsi

d'où
xz
0 ,:;; Vn - Un ::;; -Vn.
n
Mais la suite (vnlnEN* est décroissante à partir d'un certain rang, donc est majorée, et par
suite (vn - Un) -, 0 lorsque n -, +oo.
o Posons maintenant pour x E JR,

f(x) = lim Un(x) = lim


n--->+oo n--->+oo
(1 + n~)n.
On a clairement f(O) = 1 ; donc pour prouver que f est solution de (P), il nous reste à vérifier
que f est dérivable et que, pour tout réel x, on a f'(x) = f(x).
Soit x un réel fixé et soit h un réel non nul ; on suppose toujours n assez grand pour que
1 + x/n =/- O. On a

x+
Un(X + h) = ( 1 + ~
n (
= 1+
h)
x) n (
n
1 + n (1 + x/n)
n ( h )
= Un(x) 1 + (n + x)
n h)
843

Or, pour n assez grand, ;! < 1 ; donc en vertu de l'inégalité (28.13), nous avons
1.1.n(x + h) = 1.1.n(x) h( )n), 1.1.n(x) (1 - n -h ) = 1.1.n(x) (1 + nh ) ,
(1 + -n+x 1 n+x n+x
d'où
nh
1.1.n(x + h) -un(x)), 1.1.n(x)--.
n+x
Faisant tendre n vers +oo dans cette inégalité, on obtient que, pour tous réels x eth-/- 0, on
a
f(x + h) - f(x) ): hf(x).
Soient alors t et k des réels fixés, k -/- 0 ; appliquant cette inégalité à x = t et h = k puis à
x = t + k eth= -k, on obtient

f(t + k) - f(t) ): kf(t) et f(t) - f(t + k) ): -kf(t + k).

La seconde de ces deux inégalités conduit si 1 - k > 0 à f(t + k) :S ;~L, d'où nous déduisons
finalement l'encadrement
f(t) kf(t)
kf (t) ~ f (t + k) - f (t) ~ l _ k - f (t) = l _ k ·

Si donc k > 0, nous avons


f( ) ~ f(t + k) - f(t) ~ f(t)
t"' k "'1-k'
et donc lorsque k tend vers 0 par valeurs positives, le taux d'accroissement de f au point
t, f(t+~-f(tl, tend vers f(t). Ainsi, f est dérivable à droite au point t et f~(t) = f(t). Si
maintenant on a k < 0, alors
f(t) f(t + k) - f(t) f( )
--~ ------ ~ t'
1-k k
et donc là encore, lorsque k tend vers 0 par valeurs négatives, le taux d'accroissement de f au
point t, soit f(t+ktfltl, tend vers f(t). Ainsi, f est dérivable à gauche au point t et f~(t) = f(t).
En définitive, / est dérivable en tout point et f' = f.
La fonction de cj) lR dans lR définie par

cj)(x) = lim
n------HXJ
(1 + ~)n
n
est donc solution de l'équation (P).
Pour conclure, nous allons voir comment montrer l'unicité de la solution de (P) sans faire
appel à l'exponentielle. Nous pouvons remarquer que, si f est une solution de (P), alors f
ne peut pas s'annuler sur R En effet, si nous considérons la fonction auxiliaire définie par
cj)(x) = f(x)f(-x), cette fonction est dérivable et
cj)'(x) = f'(x)f(-x) - f(x)f'(-x) = f(x)f(-x) - f(x)f(-x) = 0,

donc cj) est constante sur JR, de valeur cj)(0) = 1. Il en résulte que f ne peut s'annuler.
Si donc maintenant f et g sont des solutions de (Pl, aucune des deux ne peut s'annuler
assurément. On peut donc considérer la fonction auxiliaire définie comme leur rapport, soit
par exemple lj,(x) = f(x)/g(x). Cette fonction est dérivable sur lR et
ll>'(x) = f'(x)g(x) - f(x)g'(x) = f(x)g(x) - f(x)g(x) =
0
g2(x) g2(x) ,
844

donc 1J, est à nouveau constante sur R, de valeur 1J, (0) = 1 ; donc f = g.

Nous avons déjà montré que la fonction exponentielle est solution de (P). L'unicité montre
que
Vx ER, expx = lim
n--->oo
(1 + ~)n,
n
ce qui nous conduit donc à une nouvelle manière de définir cette fonction.

V. EXERCICES
28.1. 28.3.

Montrer qu'il n'existe qu'un seul prolongement Montrer que la fonction rationnelle x H 1/x ne
continu de la fonction possède pas de primitive rationnelle et donc en
particulier que la fonction logarithme néperien
Q ~ JR., TH a\ n'est pas rationnelle.
à lR tout entier.
28.4.
28.2.
Montrer que pour tout réel positif, on a l'enca-
Avec les notations d'Euler, nous voulons mon- drement,
trer que si a> 0, a fc 1, et y > 0, il existe
un unique réel z tel que az = y. Ce réel z sera x2 x2 x3
x- -
2 -
< ln(l +x) <
-
x- - + - .
2 3
appelé le logarithme de base a de y.
1. Montrer qu'on peut se ramener au cas où
a > 1, hypothèse qui sera faite dorénavant.
2. Montrer que pour tout entier n E N*, on a 28.5.
an - 1 2': n( a - 1), et en déduire que
Déterminer les endomorphismes de l'anneau JR,
a-12':n(a 1/n_l). i.e. les applications f : lR ~ !R., satisfaisant
f(l) = 1 et les deux équations fonctionnelles,
3. Montrer qué si,.\> 1 et n > (a-1)/(,.\- l),
alors al/n < ,.\.
f(x +y)= f(x) + f(x) et f(xy) = f(x)f(y).
4. En appliquant ce qui précède à ,.\ = ya~t,
montrer que si t vérifie a t < y, alors pour n
(indication : on ne suppose pas ici que f conti-
assez grand, on a
nue ; on montrera que cependant elle est néces-
sairement croissante, ce qui permettra tout de
même un passage des rationnels aux réels.)
5. Montrer maintenant que si t vérifie at > y,
alors pour n assez grand, on a 28.6.

Déterminer les fonctions f : lR ~ JR, continues


en 0, satisfaisant l'équation fonctionnelle,
6. Montrer que le réel z défini par
Vx E JR., f(2x) = f(x).
z := sup{t E JR., 1 a t < y}

vérifie bien az = y.

j
845

28.7. 28.9.

Déterminer les fonctions continues f : lR ----, lR Étudier la fonction x H x 1/x_ En déduire que
vérifiant, pour tout couple d'entiers naturels non nuls
(m, nl, l'un des deux nombres y'n ou y'nÏ est
inférieur ou égal à {/3.

28.10.
28.8.
Montrer que la fonction
Déterminer les fonctions continues f : lR ----, lR
vérifiant, 1 + 3thx
x H argth h ,
3 +t X

est une fonction affine définie sur R


Chapitre 29
DÉRIVÉES D'ORDRE SUPÉRIEUR ET
APPLICATIONS

NE partie importante des mathématiques dites appliquées consiste à introduire les ou-

U tils permettant de modéliser les phénomènes issus des sciences exactes ou des sciences
humaines, puis à poser en termes précis les problèmes obtenus. Un tel problème est
bien posé lorsqu'il admet une solution et une seule, et si de plus cette solution est peu modi-
fiée lorsque les données du problème varient légèrement. Ceci assure une certaine robustesse
du modèle relativement aux diverses sources d'imprécisions inhérentes à toute formalisation
(erreurs de mesures, d'arrondis, etc).
Parmi les nombreux exemples connus de problèmes bien posés, on se rend compte rapide-
ment que ceux qui possèdent une solution explicite, que l'on peut écrire au moyen de formules
exactes, sont très exceptionnels. Ce constat a été à l'origine du développement d'une nouvelle
discipline mathématique, l'analyse numérique, dont nous donnerons un aperçu dans la suite
du cours de série L.
Il existe cependant une classe très importante de problèmes dont la résolution est, sinon
toujours possible, au moins à la portée de techniques bien établies : ce sont les problèmes
dits linéaires. Nous n'aurons pas besoin d'en connaître une définition générale, il suffira de
considérer que ce sont les problèmes posés au moyen d'applications linéaires entre espaces
vectoriels convenables. Par exemple, un système linéaire de la forme Ax = a (où A est une
matrice carrée d'ordre net a E !Rn, et où l'inconnue x est dans !Rn), ou encore une équation
différentielle linéaire comme ü = -u (où u est une fonction de IR dans IR), qui intervient
souvent en physique élémentaire.
Lorsque- les problèmes envisagés font intervenir des fonctions non linéaires, comme par
exemple x H x 2 de IR dans IR, leur résolution est presque toujours hors de portée de méthodes
générales, et donc beaucoup plus difficile. On cherche alors à se ramener au cas de problèmes
linéaires en approchant les fonctions non linéaires considérées, au voisinage de points bien choi-
sis, par leurs applications affines tangentes. Ces dernières sont en effet sommes de constantes
et d'applications linéaires, et la résolution des problèmes obtenus relève des méthodes linéaires
précédentes. On peut alors souvent obtenir sur le problème initial des renseignements précieux.
Par exemple, l'équation différentielle décrivant le mouvement du pendule simple s'écrit (aux
unités près) ë = -sin 0, où e est l'angle du pendule par rapport à la verticale. Si on se limite
à des mouvements voisins de la position basse du pendule, correspondant à 0 très petit, on
peut en première approximation remplacer sin 0 par 0 (on a donc remplacé la fonction sin
par son application affine tangente au point 0), ce qui conduit par exemple à la propriété
d'isochronisme des petites oscillations bien connue en physique 1 : la période d'une oscillation
est indépendante de son amplitude, pourvu qu'elle reste petite.
Mais lorsqu'on cherche à étudier des mouvements de plus grande amplitude, cette ap-
proximation linéaire de la fonction sin ne suffit plus. Il est clair, en effet, qu'une oscillation

1 La justification complète de cette propriété est un peu délicate et repose sur la propriété de conservation de
l'énergie du pendule.
848

de grande amplitude aura une période plus grande qu'une oscillation de faible amplitude : la
propriété d'isochronisme n'est plus valable. Il est donc tentant d'essayer d'approcher la fonc-
tion sin par une fonction un peu plus compliquée que 0 H 0, mais qui reste assez simple pour
autoriser des calculs effectifs. Il s'avère que les fonctions polynômes sont de bonnes candidates
pour de telles manipulations, à condition qu'elles soient bien choisies (le cas des applications
tangentes que nous venons de décrire est d'ailleurs celui des polynômes de degré égal à 1). La
base de la construction des applications tangentes est la notion de dérivée. Pour obtenir des
polynômes de degré supérieur, et donc de meilleures approximations au voisinage d'un point,
nous allons être amenés à itérer cette opération de dérivation.
C'est ainsi que la première section va introduire les dérivées successives d'une fonction, qui
nous permettront de construire ses polynômes de Taylor de degrés quelconques en un point,
qui sont les polynômes de meilleure approximation au voisinage de ce point. Nous verrons
ainsi que si un entier n est donné, et si une fonction f est « assez régulière », son polynôme
de Taylor P de degré n en un point x 0 vérifie

lf(x) - P(x)I ~ Clx - xoln,

où C est une constante positive. L'approximation locale ainsi obtenue est donc remarquable
lorsque n est assez grand (par exemple sin= 10, et si lx-xol ~ 10-2 , l'erreur est majorée par
C 10-20 !). La notion de développement limité, que nous introduirons aussi dans ce chapitre,
conduira ensuite à des méthodes de calculs de ces polynômes de meilleure approximation qui
ne nécessiteront pas le calcul (souvent fastidieux) des dérivées successives.
Avertissement. Ce chapitre constitue une première introduction aux problèmes
de dérivation à l'ordre supérieur. Nous avons centré l'exposé sur les résultats théo-
riques, et limité le nombre d'exemples et applications qu'il est possible de donner.
Toute l'étude sera reprise et amplifiée dans le cours de 12, lorsque les outils de
calcul formel nous permettront d'obtenir rapidement des développements limités
dans des cadres très variés.

I. DÉRIVÉES SUCCESSIVES
Comme nous l'avons vu, la notion de dérivée a été introduite pour une raison fondamentale
chercher à la meilleure approximation locale d'une fonction par une fonction affine, qui lui est
alors tangente. Nous avons ensuite montré que la notion de dérivée permettait de faire l'étude
du sens de variation des fonctions, et donc d'obtenir des renseignements de nature globale,
basés sur le signe de la fonction dérivée. Mais parfois l'étude de ce signe n'est pas simple, et
ne peut se faire qu'au moyen de l'étude des variations de la fonction dérivée elle-même, ce qui
demande de répéter l'opération de dérivation. Cet exemple, parmi beaucoup d'autres, montre
l'intérêt de la notion de dérivées successives, que nous introduisons dans cette partie.

I. 1. Définitions et premières propriétés


Soient I un intervalle ouvert (non vide) de lR, x 0 E I et f: I--. lR dérivable sur I. Si la fonction
f' est dérivable en x 0 , sa dérivée se note f"(x 0 } et s'appelle dérivée seconde de f en x 0 . Si
maintenant la fonction f' est dérivable en tout point x de I, on peut définir la dérivée seconde
f"(x) pour tout x E I, et on obtient ainsi une fonction f" : I --. lR. On peut donc réitérer le
procédé. Si la fonction f" est dérivable en x 0 , sa dérivée se note f 111 (x 0 ) et s'appelle dérivée
849

troisième de f en x 0 . Si f" est dérivable en tout point de I, on obtient de la même manière


une fonction f 111 : I-----, R On peut ainsi, par récurrence, définir les dérivées successives d'une
fonction sur un intervalle 1. Nous allons cependant donner une définition plus formelle de la
même notion, et étudier les structures algébriques des ensembles de fonctions ainsi définis.

1.1.1. Les définitions de base

Soit F(I) l'ensemble des fonctions de I dans lll, et P(I) l'ensemble des fonctions dérivables de
I dans R
Définition 29.1. On construit par récurrence une suite décroissante (PP(IllvEN* de sous-
ensembles de P(I), et une suite (<Dµ)pEN* de fonctions, avec <Dv : PP(I) -----, .r(I), de la
manière suivante. Pour p = 1, on pose P 1(I) = P(I) et <D1(f) = f' pour f E P 1(I). Si
PP(I) et <Dv sont donnés, avec p ~ 1, on pose

Une fonction f de I dans lll est dite p fois dérivable dans I lorsqu'elle appartient à Pµ(I). Sa
dérivée d'ordre p, notée f(vl, est alors par définition f(Pl = <Dµ(f).
Cette définition paraît certainement compliquée, ce n'est pourtant rien d'autre que la
formalisation complète de la construction par récurrence des dérivées successives. Notre en-
semble PP(I) est l'ensemble des fonctions p fois dérivables dans I, et l'application <Dv n'est
rien d'autre que l'application qui à une fonction associe sa dérivée d'ordre p, que l'on appelle
aussi dérivée pième_ Par exemple, P 2 (1) est l'ensemble des fonctions f de P 1 (I), c'est-à -dire
dérivables dans I, telles que la fonction dérivée f' = <D 1 (f) soit dans P 1 (1), c'est-à-dire dont
la dérivée f' est dérivable dans 1. On reconnaît bien la construction initiale. Pour les dérivées
d'ordres 1, 2 et 3 d'une fonction f, on note en général f', f", f 111 •
Définition 29.2. Une fonction est dite indéfiniment dérivable dans I si elle appartient à
l'intersection â:e tous les PP(I), pourp EN*. On note P 00 (1) leur ensemble.

Enfin, il est souvent très utile d'imposer une condition de continuité aux dérivées d'ordre
supérieur.
Définition 29.3. Soit p E N*. Soit I un intervalle ouvert de R On dit que f : I -----, lll est
de classe cv sur I si f E PP(I) et si f(Pl est continue dans 1. On dit que f : I -----, lll est de
classe C00 sur I si f est de classe cv pour tout p E N*. Pour p E NU {oo}, on note CP(I)
l'ensemble des fonctions de classe cv sur I, à valeurs réelles.

Remarque. Soit p E N* U {oo} et f de classe CP sur 1. Soit q < p. La fonction f(q) étant
dérivable sur I (puisque q < p), elle est en particulier continue.

Test 29.1. Test 29.2.


Quelle différence y a t-il entre P 00
( I) et C
00
( I) ? On considère la fonction f définie par f(x) = 0
si x ~ 0 et f(x) = x 2 si x 2: O. Déterminer le
plus grand entier p tel que f E CP(JR).

Pour définir les dérivées d'ordre supérieur d'une fonction p en un point, il n'est pas né-
cessaire que cette fonction ait ses dérivées successives (jusqu'à l'ordre p - 1) définies sur tout
l'intervalle initial. Pour mettre en forme cette idée, rappelons d'abord la définition suivante.
850

Définition 29.4. Soit x 0 E R Un voisinage de x 0 est une partie de ]Pl. qui contient un
intervalle ouvert contenant x 0 . Un voisinage à gauche de Xo est une partie de ]Pl. qui contient
un intervalle de la forme ]xo - b, x 0 ], avec b > O. Un voisinage à droite de x 0 est une partie
de ]Pl. qui contient un intervalle de la forme [x 0 , xo + b], avec b > O.

Une fonction définie dans un voisinage de x 0 (on dit aussi au voisinage de x 0 ) est donc
une fonction dont l'ensemble de définition contient un intervalle ouvert de lPI. contenant x 0 .
Une fonction définie dans un voisinage à gauche (resp. à droite) de x 0 est une fonction dont
l'ensemble de définition contient un intervalle ]xo - b, x 0] (resp. [xo, Xo + ô[), avec b > O.
Cette définition est en accord avec une terminologie générale que nous verrons dans la
suite du cours (topologie). Par exemple la fonction x H 1/{x} est définie au voisinage de tout
point x 0 non entier.
Définition 29.5. Soit I un intervalle ouvert de JPI.. Soit Xo dans I. Pour p ) 2, nous dirons
que f est p fois dérivable au point x0 s'il existe un intervalle ouvert J C I, contenant Xo,
tel que f soit p - 1 fois dérivable dans J, et si sa dérivée d'ordre p - 1, définie dans J, est
dérivable en Xo.
Pour résumer la condition intervenant de cette définition, on dit que la dérivée d'ordre
p - 1 de f doit être définie au voisinage de Xo.
Il peut être enfin commode d'introduire une définition de la dérivabilité sur des intervalles
semi-ouverts ou fermés. Nous considérons le cas des intervalles fermés, pour alléger les énoncés
(voir aussi les définitions données au chapitre 26, partie I.2).

Définition 29.6. Soient a et b deux réels, avec a< b.


1) On dit qu'une fonction f: [a, b] -t lPI. est dérivable dans [a, b] lorsqu'elle est dérivable
dans ]a, b[, dérivable à droite en a et dérivable à gauche en b. La dérivée de f sur [a, b] est
alors la fonction de [a, b] dans ]Pl. définie par

a H f~(a), X H f'(x) si X E]a, b[, b H f~(b).

On la note encore f'.


2) On définit alors par récurrence la notion de dérivabilité à l'ordre p E N* sur [a, b],
exactement comme on l'a fait au début de cette partie. Les dérivées successives sont des
fonctions de [a, b] dans JPI., on les note encore flPl_ On note encore E(}P([a, bl) l'ensemble des
fonctions p fois dérivables dans [a, b], et <l>v l'application qui à une fonction de E(}P associe
sa dérivée d'ordre p.
3) On dit que f est de classe CP dans [a, b] lorsqu'elle est p fois dérivable dans [a, bl, et
lorsque sa dérivée d'ordre p est continue dans [a, b].

On peut de la même manière parler de fonctions dérivées successives pour des fonctions
définies sur un intervalle semi-ouvert, et on conserve les notations E(}P(I), <l>v et f(Pl dans ce
cas.

1.1.2. Les structures algébriques

Passons maintenant aux propriétés algébriques de la dérivation. Nous avons déjà étudié ces
notions pour la dérivée première. Rappelons que si Xo E JPI., et si f et g sont deux fonctions
définies au voisinage de x 0 et dérivables en x 0 , alors (f + g)'(x 0 ) = f'(x 0 ) + g'(x 0 ), et si À E JPI.,
(M)'(x 0) = À(f'(x 0)). On a la même propriété pour les fonctions définies sur des voisinages à
851

1
droite ou à gauche de x 0 et dérivables à droite ou à gauche en x 0. Rappelons aussi que E1 (I)
est un sous-espace de l'espace vectoriel .F(I) des fonctions de I dans JR, et que l'application
<l> 1 est linéaire : ceci donnera la première étape de certains raisonnements par récurrence.

PREUVE. Supposons I ouvert. Montrons la propriété pour E1P (I), avec p E N*, par récurrence
sur p. Pour p = 1, c'est la propriété que nous avons rappelée. Supposons la propriété vraie
au rang p - 1, prenons deux fonctions f et g de E1P(I) et deux scalaires À et µ. Les fonctions
f(p-l) = <l>P_ 1(f) et g(p-lJ = <l>P_ 1(g) sont dans E1(I), par définition de E1P(I). Par hypothèse
1
de récurrence, on peut écrire <I>p_ 1(M + µg) = À<l>p-1(f) + µ<I>p-1(9). Comme E1 (I) est un
1
espace vectoriel, À<l>p_,(f) + µ<l>p_ 1(g) E E1 1(I), donc <I>p-1(M + µg) E E1 (I), ce qui montre
que M + µg E E1P(I).
De plus <I>p(M + µg) = <l>1(À<l>p-1(f) + µ<I>p-1(9)) = À<!>1(<I>p-1(f)) + µ<l>1(<I>p-1(g)) =
À<l>p(f) + µ<I>p(g) puisque <1> 1 est linéaire. Il en résulte que <I>p est linéaire, et ceci termine la
00
preuve pour E1P(I). On raisonne de manière analogue pour (P(I). Pour les ensembles S1 (I)
et ( (Il, on utilise le fait qu'une intersection de sous-espaces vectoriels est un sous-espace
00

vectoriel. Le cas des intervalles semi-ouverts ou fermés se traite de la même manière ; on le


laisse en exercice. ■

La proposition précédente a aussi une version ponctuelle (c'est-à-dire portant sur des
fonctions p fois dérivables en un point x 0 E I); on laisse au lecteur le soin de l'énoncer. Pour
l'aider, examinons maintenant les relations entre dérivation et produit dans cette version
ponctuelle.

·Propo~iW~tt· 29~~;; fit~~ dê Leibniz). ~ l r ~~t1e1}dti: i.1 ·s!)it Xo E ],


Soit/ .I . un
et~t-p. N*. Le p~tiit iJ,e âe'll$/Onctwnsfêt 9 définîes,au ~&.{JiUJ,exo·etp ffJîs
dérivables en Xo 6St.p;fois dérivid:Jle en Xo, ètj1érifie · · ·
+ .. ? .. >r;>·
··1>···· ..• ;, , ·. .·•··•.
•{f.g)iPl{~);...;1E,~ttJti{~Jgfvtl9{iêl~; .•.•••
. k=O

PREUVE. L'énoncé se démontre par récurrence sur p. Pour p = 1, nous l'avons déjà montré.
Supposons-le vrai pour p - 1. On a alors, pour x dans un intervalle J contenant x 0
p-1
(fg)(p-ll(x) = L C~_,f(kl(x)g(p-1-kl(x).
k=O

Dérivons cette formule par rapport à x au point x 0 , ce qui est licite car le membre de droite
est dérivable en x 0 . Il vient
p-1
(fg)(Pl(xo) = .L. C~_1[f(k+ll(xol9(p-l-kl(xo) + f(kl(xo)g(p-kl(xo)l.
k=O

Soit k E {1, ... , p -1}; en facteur de f(kl(x 0), nous avons

p-1 + p-1
+ (kp-1 g(p-k)(X)0 = [(k-1 0 = (kg(p-k)(X)
(k-lg(p-1-(k-l)l(x) (k ]g(p-k)(X) p O,
p-1 0
852

le facteur de f(x 0) est g(Pl(x 0) = C~g(Pl(x0), enfin celui de f(Pl(x 0) est g(x 0) = qg(x 0). On
reconnaît bien la formule annoncée, ce qui achève la récurrence. ■

La proposition précédente s'étend immédiatement au cas des fonctions définies dans un


voisinage à droite (resp. à gauche) d'un point, et la dérivée à droite (resp. à gauche) du produit
est donnée par la même formule. On en laisse la preuve au lecteur.

Pr<,p~.:trs ~l.ttn'MîÎ~t Jti(;fiieî~ëj ~&'.'iSf:î~'i tisé~t~(tf;N tP:{J);


munis '~cl1q(lditWJi,::'dù··f!lX
.àÏgêbres/· . .... ·. < ,; J!ltfit..1J1ft ..ftli.·.~: et~ la, tMltfpt{~ti(!'ll. d,~for#::~,.·so nt ·d~
<I>c ·<ç:e· · " ' . . . '..... • • . ,. ' ,.. . . •

PREUVE. Il suffit de montrer que ce sont des sous-algèbres de (F(I), +, ., x), ce qui découle
immédiatement des propriétés que nous venons d'énoncer. ■

Pour terminer notre première approche du problème des dérivées successives, il ne nous
reste plus qu'à examiner les propriétés de la composition des fonctions.

f~~sit~>:i9:Ml,, Sqi(Xo,}E. lit ,tt~~J!tr,,,;il~titlr1, .1éfinie •fl!l »J>#irt,11,(Je Jlç ,~ êt.p foi$
dérifffJ,bJe, ww~nt. ~::.ffo# If ttJie;Ji>.~it:iµ J4init .~f.f:tip~'(le dé; r{~)··ttsp,fti11Ji,trj'V:,~ll!
enf(¾h. ô1<Yt8·99,f est'pfo!is.dê rt~e~~.· ·
PREUVE. Lorsque p = 1, l'énoncé est connu, et de plus (go f)'(x) = (g' o f)(x)f'(x) pour x
dans un intervalle J contenant x 0 . Raisonnons par récurrence, et supposons l'énoncé vrai pour
p - 1. Comme f (resp. g) est p fois dérivable en x 0 (resp. f(x 0 )), on a en particulier que f
(resp. g') est p - 1 fois dérivable au voisinage de x 0 (resp. au voisinage de f(x 0 )). Alors par
hypothèse de récurrence on voit que la fonction x H (g' o f)(x)f'(x) est p - 1 fois dérivable
en x 0 , ce qui signifie que ( g o f)' est p - 1 fois dérivable en x 0 , et donc que g o f est p fois
dérivable en x 0 . Ceci termine la preuve. ■

I.2. Les premiers exemples


Voici le catalogue de base des dérivées successives des fonctions usuelles, qui sont toutes de
classe cxo.

PREUVE. On a fait comme toujours la convention x 0 1 pour x E R On sait que fa


est dérivable sur :IR:; et que f ~ = exf a- l. Montrons par récurrence que fa est indéfiniment
dérivable. Supposons que pour tout (3 réel, la fonction f 13 est k fois dérivable. Soit ex E R
Alors f a-1 est dérivable k fois, donc f~ est dérivable k fois, ce qui signifie que fa est dérivable
k + 1 fois et termine la récurrence.
Pour l'expression de la dérivée, procédons par récurrence également. Supposons que pour
tout (3 réel, ttl = (3( (3-1) · · · ((3-(p- 1) )f 13-p- Soit ex E R Alors f~+lJ = (exf a-l) (pl = exf~~,,
donc f~+ll = ex[(ex - 1 )(ex - 2) ···((ex -1) - (p - l))]f a-1-p = ex(ex - 1) ···(ex -p )f a-(p+l),
ce qui achève notre récurrence. ■

~9$itiô'!•~ .l.i §'oit ~•§;~,lt,,~i#~o~it« € ~fJa}.jJéjinîe .pat E«(:x),:;; ef/R<;;f#J,t


inîfe~J,,f~itn '&lil wf·a::~ tfrl ~ fkï>;tti: · ·· ·
853

PREUVE. Démonstration immédiate par récurrence sur p, puisque E~ = <XEcx, ■

Proposition: 29.13. Les fonctions hyperboliques sh -et ch s(l'fl,t indéfiniment déri:qables, et


sh(lp} = sh, shf2P+ll = ch, chfzvr = ch, ch12v+t} = ~h,

pour tooi entier naturel p.

PREUVE. Démonstration immédiate en utilisant l'expression de sh et ch en fonction de


l'exponentielle. ■

Les dérivées successives des fonctions sin et cos sont un peu plus compliquées à écrire direc-
tement, mais on peut en obtenir une expression simple à condition d'introduire des déphasages
convenables.
Proposition 20,14. Les fonctions sin et cos sont de classe C00 • Pour tout. k. Et N .· et tout
1!'-€lll
sin(kl(x} = sin(x + k.7.C/2},
PREUVE. Démonstration immédiate par récurrence. ■

Test 29.3. Test 29.5.


Calculer les dérivées successives de x H xn, Calculer les trois premières dérivées de la fonc-
lorsque n E Z::*. tion tangente
Test 29.4. Test 29.6.
Que peut-on dire de la dérivée d'ordre n +1 Calculer les trois premières dérivées de la fonc-
d'un polynôme de degré n ? tion tangente hyperbolique

II. FONCTIONS CONVEXES ET DÉRIVATION

Intuitivement, une fonction convexe est une fonction qui reste toujours en-dessous de ses
cordes. Nous allons ici présenter des propriétés de base des fonctions convexes, et notamment
leurs relations avec les dérivées successives.

IL 1. Définition et premières propriétés des fonctions convexes


Rappelons d'abord la définition usuelle des fonctions convexes sur un intervalle de R

Définition 29.15. Soit I un intervalle de R Une fonction f : I --, lR est dite convexe lorsque
854

La figure suivante illustre la définition : une fonction convexe est une fonction dont le
Cl)
graphe est toujours au-dessous de ses cordes.

f
~

~
o..

X1

FIGURE 29.1. Graphe d'une fonction convexe et une corde

EXEMPLE 29.16. Voici trois exemples de fonctions convexes,

XH ax+b, (a,b) ElR 2 , XH!x!.

Pour la première, la vérification est immédiate. Pour la seconde, on constate que

Enfin pour la troisième, le calcul se fait par l'inégalité triangulaire

Donnons maintenant un critère général de convexité, faisant intervenir la notion de bary-


centre.

PREUVE. Lorsque n = 1 cette inégalité est triviale et lorsque n = 2, c'est la définition de


fonction convexe. Si l'inégalité est vérifiée pour tout n E N*, la fonction est donc convexe.
Aussi, nous avons seulement à montrer que si f est convexe, elle satisfait cette assertion pour
tout n. Cette démonstration se fait par récurrence sur n. L'inégalité est vraie pour n = 1,
n = 2, prenons n ~ 3 et supposons la relation vraie au rang n - 1. On remarque que
,n "\ - "\
Li=l /\iXi - t\1X1 + (1 - /\l ,n .\; ) ,n
"\ )( Lj=2 1-.\, Xj , et que Lj=2 Àj - LÎ~2À; - 1 L d'fi ·t· d
1-.\, - ~ - . a e Ill 10n e
la convexité entraîne l'inégalité
855

En appliquant l'hypothèse de récurrence au rang n - 1, on obtient grâce à la remarque


précédente : f( .[_~2 1~~1 xi) ~ .[_~2 1~~1 f(xi), et l'inégalité au rang n en découle grâce à
l'inégalité(*). ■

Interprétons géométriquement cette inégalité. Lorsque (x 1, ... , Xn) est un n-uplet de rn et


(À1, ... , Àn) un n-uplet de [O; l]n tel que À1 + · · · + Àn = 1, le réel .L~=l ÀiXi est le barycentre
f3 des points (xi)l,,;j,,;n affectés des coefficients (Àj)l,,;j,,;n; on dit aussi que c'est la moyenne
du système pondéré de réels (xi, Àj)l,,;j,,;n• L'inégalité de convexité précédente exprime que
l'image f( f3) du barycentre f3 par la fonction convexe f est située au-dessous du barycentre
des images (f(xj))1,,;j,,;n affectées des mêmes coefficients (Àj)1,,;j,,;n•

Test 29.7. Test 29.8.


Si f est convexe croissante et g convexe, alors Soit f : lR --l lR une fonction convexe, soit
f o g est convexe. Si f est convexe sur JR, alors (u, b) E JR 2 . Donner des conditions sur u pour
elle est croissante sur l'intervalle [A, +oo[ si A que la fonction uf + b soit convexes. Même
est assez grand. question pour x H f( ux + b ).

Il.2. Fonctions convexes et dérivation


On se donne un intervalle non vide I, et f: I --1 lR une fonction convexe. Nous allons étudier la
dérivabilité de f et caractériser sa convexité au moyen des dérivées successives. Toute l'analyse
est basée sur le lemme fondamental suivant.

PREUVE. Délhontrons la première inégalité, en utilisant la convexité de f. Comme u < v < w,


le point intermédiaire est le point v. On peut donc choisir dans la définition x 1 = u, x 2 = w,
et ajuster À de sorte que v = Àu + (1 - À)w. Ceci donne À = = :=:: :;=:-
Alors l'inégalité de
convexité de f s'écrit

w-v
f(v) ~ --f(u) + ( 1- w-v)
- - f(w)
w-v
= --f(u) v-u
+ --f(w).
w-u w-u w-u w-u

En multipliant par w - u, on obtient (v- u)f(w) + (w -v)f(u) ~ (w- u)f(v), soit encore

(v -u)(f(w) - f(v)) ~ (w - u)f(v) - (w -v)f(u) - (v - u)f(v) = (w -v)(f(v) - f(u)),

ce qui donne la première inégalité. La seconde se démontre de manière identique. ■

Cet énoncé s'interprète géométriquement en introduisant les trois points A = (u, f(u)),
B = (v, f(v)) et C = (w, f(w)). Il exprime que les pentes des droites (AB), (AC) et (BC)
vérifient les inégalités
Pente(AB) ~ Pente(AC) ~ Pente(BC),

comme le montre la figure suivante.


856

u V w

FIGURE 29.2. Les trois pentes

De ce lemme fondamental, nous déduisons les propriétés essentielles concernant la déri-


vabilité des fonctions convexes.
Théorème 29.li1. $oit 1== l~1 füun :intervalle <YUvert, e.t f : I ---+ la une JonctiofJ. cqn:1,1.t).$e,
1) Pour tout x E I, l'applicàtWTt h. ~ f(x+~~f{~), dCfi,nie sur J« - X, O[U10, f!..'""' xL est
croissante.
2) Po'll:r tout x ~ I, f;tx} et. f~(x) existent.
S) ·Poûrt<f'Ut f:x.'t11YEP·amicx< 11; nom 111oonsC::_

t;{x) ~ f~(x) ~· f{yJ- f(l',}~ f~{'y) ~f~(y}:


... y-x

~n :t:::r:·::~t!{[ônèt~ êfiJisi~tês..

PREUVE. Première assertion Fixons x E I et posons g(h) = f(x+~-f(xl. Nous voulons


montr\n' que si h 1 < h 2, alors g(h 1) ,( g(h2). Pour cela nous allons utiliser le lemme 29.18, en
choisissant les variables u, v, w dans l'ensemble {x, x + h1, x + h2}, suivant l'ordre donné par
les ht. Supposons d'abord que O < h1 < hz. On pose alors u = x, v = x + h1, w = x + hz.
La première inégalité du lemme 29.18 donne immédiatement le résultat annoncé. Lorsque
h 1 < 0 < h 2, prenons u = x + h 1, v = x et w = x + hz. L'inégalité du lemme 29.18 entre les
membres extrêmes s'écrit

À droite, on reconnaît g(h2) et à gauche, en changeant les signes du numérateur et du


dénominateur, on reconnaît g (h1 ) . Le dernier cas se traite de la même manière.
Deuxième assertion. Pour la dérivée à droite, remarquons que g est croissante sur
JO; 13 - x[, et minorée par tout g(u), où u E ]ex - x, O[. Donc la fonction h H g(-h) est
décroissante et minorée si h E] - (13 - x), O[, et elle admet une limite lorsque h -1 o-. Ceci
montre que g admet une limite à droite en O; donc la fonction f est dérivable à droite au point
x, et la dérivée à droite f~(x) est égale à cette limite. On utilise le même type d'argument
(plus simple) pour la dérivabilité à gauche (on notera que f~(x) = limh-lO- g(h)).
Troisième assertion. Nous avons g(-h) ,( g(h) lorsque h > O. Donc, en faisant tendre
h verso+, on trouve que f~(x) ,( f~(x) par prolongement des inégalités. Cet argument donne
857

aussi la dernière inégalité. Pour voir la deuxième, notons que lorsque h < -y - x, on a g(h) ~
g(-y - x), ce qui donne directement
f(x + h) - f(x) f(-y) - f(x)
------ ~ ----.
h -y-x
Donc en faisant tendre h verso+, on voit que f~(x) ~ f(y~=:(xl par prolongement des inégalités.
La troisième inégalité se démontre de la même manière.
Quatrième assertion. Soit a et b des éléments de I, avec a< b. Alors par le point 3),
on voit que six et -y sont dans [a, b], avec x < -y
f~(a)(-y -x) ~ f(-y) - f(x) ~ f~(b)(-y -x),
ce qui montre que lf(-y) - f(x)I ~ Cl-y -xi, avec C = max(f~(a), f~(b )). En conséquence f est
lipschitzienne sur [a, bl, et donc continue sur [a, b). Comme tout point de I est contenu dans
un tel intervalle [a, bl, cela montre que f est continue dans 1. ■

.\((C'll(Îml Aux intervalles fermés.


Sur un intervalle fermé, une fonction convexe peut ne pas être continue, comme le montre
l'exemple de la fonction f: [O, 1) ----, :IR; définie par f(x) = 0 six E [O, 1 [ et f(l) = 1.

C'est le théorème suivant qui montre tout l'intérêt des dérivées d'ordre supérieur vis-à-vis
de la notion de convexité.
t~~e':af1~;c>: SDüJ uMjô~ct,f()ft aftfwii\1#~'11: uV:•· intemùlè l. liflle esf'con*e ~ ~t
;s~tmk,~t ~iJ', . . . tfio_rsqise f~t df:ux/()îs dé~akle ,SUif ), ille: ~8{ÇQ1wexe si et
~~tJJbtf,ènt's~f11' siit I. :,, · ··· · · · · ·· · · · · ·· · ··· · ·· · ·

PREUVE. Tout d'abord, lorsque f est deux fois dérivable, f' est croissante si et seulement si
sa dérivée, qui est f", est positive ou nulle. Ainsi, on voit qu'il suffit de montrer la première
assertion.
Lorsque f est dérivable, on sait que f' = f~, et si f est convexe le théorème 29.19 montre
que f' est croissante. Donc, lorsque f est convexe et dérivable, f' est croissante.
Supposons maintenant que f' est croissante, et montrons que f est convexe. Soient x 1 , x 2
dans I tels que X1 < x2 (par exemple), soit À E [O; 1], et notons -y = Àx 1 + (1 - À)x 2. On a les
inégalités x1 < -y < x2. Grâce au théorème des accroissements finis, on peut trouver E, 1 et E,2
vérifiant X1 < E,, < -y < E,2 < X2 tels que
f(-y) - f(x1) = f'(E,i), f(x2) - f(-y) = f'(E,i).
1,J-X1 X2-1J
On a en particulier E,, < E,2, ce qui impose f'(E,i) ~ f'(E,2). Par conséquent,
f(-y)-f(x 1) f(x 2)-f(-y)
----- ~ -----.
1,J-X1 X2-1J
Mais on a -y - X1 = (1 - ;\)(x2 - x1) > 0 et x2 - -y = À(x2 - x 1) > O. Multipliant l'inégalité
précédente par À(l -À)(x2 - x1) > 0, on obtient À( f(-y) - f(x 1)) ~ (1 - ;\)( f(x 2 ) - f(-y )), soit
après réarrangement f(-y) ~ M(xi) + (1 -À)f(x 2), ce qui montre la convexité de f. ■
858

EXEMPLE 29.21. La fonction fa: JR~-----, lR définie par f a(x) = xa est convexe sur JR~ pour
1 ex E [1, +oo[. La fonction exp est convexe sur R

Test 29.9. Test 29.10.


Donner un exemple de fonction convexe dans lR Sur quels intervalles de lR la fonction sin est-elle
qui est dérivable sur lR \ Z et non dérivable en convexe?
tout point de Z.

Nous avons déjà vu que le graphe d'une fonction convexe est situé sous ses cordes. Montrons
maintenant qu'il est situé au-dessus de ses tangentes.

-- - - --> - - - -~,--- ' -- ; - "'.. - - - - '

· f(v) ~ f{~l + f~(xJt11-*J tt. ffyl )'f(xJ +f~(iH11 Li);


PREUVE. Cet énoncé est déjà inclus dans le théorème 29.19. Il faut simplement étudier les
cas x < y ou x >y.Si par exemple x < y, on a

>- /f'd(X)1>-/ f' (x,)


f(y) - f(x) 1
y-x 9

en multipliant par y-x > 0, on trouve f(y)-f(x) ~ f~(x)(y-x) ~ f~(x)(y -x), et lorsque
x < y, on procède de même en utilisant la relation

f(x) - f(y) ~ f~(x) ~ f~(x),


x-y

pour obtenir f(x)-f(y) ~ f~(x)(x-y) ~ f~(x)(x-y), et on multiplie tout par -1, ce qui
renverse le sens des inégalités. ■

Cet énoncé dit exactement que le graphe d'une fonction convexe est au-dessus des demi-
tangentes, et donc des tangentes lorsqu'elles existent.
Toute l'étude que nous venons de faire se transpose immédiatement au cas des fonctions
dites concaves.

Définition 29.23. Une fonction f de F(I) est dite concave si son opposée -f est convexe.

C'est ainsi que, par exemple dans la définition, une fonction concave est une fonction dont le
graphe est toujours au-dessus des cordes. On laisse au lecteur le soin d'énoncer les analogues
de résultats précédents, en changeant simplement le sens des inégalités. Par exemple, une
fonction dérivable est concave si et seulement si f' est décroissante, et une fonction deux fois
dérivable est concave si et seulement si f" est négative.

E;EMPLE 29.24. La fonction ln est concave sur ]1, +oo[. La fonction fa est concave sur
1 lR+ pour ex E] - oo, 1].
859

Test 29.11. Test 29.12.


Une fonction peut-elle être à la fois concave et Une fonction concave est-elle dérivable?
convexe?

FIGURE 29.3. Fonction convexe, fonction concave, fonction ni concave ni convexe

Terminons par un résultat sur les minima des fonctions convexes.

Proposîtit>tl 29~2ft~ .~oitl un iintètvàlle·o'Uuérl; 8<JÎt f dêfiv~e e(œnveie s~I. Soit i E 1.


et
A.JQro' f1 (il ~J.l,ri,. lreUlemenf ai f. à#~ii1Json mmi'fffllill1, au ;po.int-x., e.1est-t;.~dirNJ/IJ;C pour
t®t 11 E :1, f(y} j f(x:). . . -

PREUVE. Bien entendu, si f est minimale sur un intervalle ouvert en un point x où elle est
dérivable, on a toujours (même si f n'est pas convexe) f'(x) = O. C'est la réciproque qui est
spécifique au cas convexe. Prenons 1J dans I vérifiant y > x. On sait que f(y~=:(xl ): f~(x) =
f'(x) = 0, et donc comme y - x > 0, on obtient f(y) ): f(x). De même, lorsque 1J < x, on
__ Vneut écrire f(x)-f(y)
x-y
( fd' (x) = f'(x) = 0, et donc comme x -y > 0, il vient f(x) ( f(y). ■

Remarque. On notera que l'énoncé précédent est global, au sens où le minimum considéré
est un minimum global pour la fonction f.

Ce résultat, en apparence très simple, est en fait une mine pour les applications de la
notion de convexité. Nous en verrons des exemples dans la suite du cours. En complément de
ce chapitre, nous montrons une application de la convexié en modélisation économique.

III. LES FORMULES DE TAYLOR

Les formules de Taylor utilisent les dérivées successives d'une fonction pour construire des
polynômes de meilleure approximation au voisinage d'un point. Dans la pratique, on peut
y voir un analogue du problème de l'approximation des réels par les rationnels, au sens où
les fonctions polynômes sont explicitement définies au moyen d'un nombre fini de termes, et
donc « complètement connues », alors que les fonctions générales ne peuvent se décrire aussi
simplement. Même une fonction aussi simple que l'exponentielle nécessite pour la définir un
processus de passage à la limite et ne peut donc être décrite au moyen d'un nombre fini
d'opérations. Nous reviendrons sur ces problèmes en des termes beaucoup plus précis dans la
suite du cours de série L
860

IIl.1. Comparaison des fonctions en un point


Nous avons déjà rencontré le problème de la comparaison des fonctions en un point. Nous
rappelons ici les définitions et résultats qui nous seront nécessaires dans la suite. Nous aurons
surtout à comparer des fonctions à des fonctions monômes x H xm pour m ): 1. Nous
utiliserons les notations de Landau, qui permettent d'alléger notablement les énoncés.
Définition 29.26. Soit f une fonction définie dans un voisinage de O. Pour m E N*, on
introduit les notation suivantes :

f(x) = o(xm) {==} [ 1::/t: E R~,3rj E Ill~ 1 Vx E] -TJ,TJ[\{O}, c] ·,


fx( xm) 1 < .,
1

f(x) = O(xm) {==} [:3a E R~,3rj E Ill~ I Vx E] -TJ,TJ[\{O}, fx(xm)l<a]


l
f(x)~xm{==} .
hm f(x)
- =1 ]
[x--->0,x,<-0 xm
Lorsque f = o(xm), on dit que f est négligeable devant xm, lorsque f = O(xm), on dit que f
est dominée par xm, lorsque f ~ xm, on dit que f est équivalente à xm.

Comme nous l'avons déjà signalé, les notations de Landau ne sont pas absolument irrépro-
chables. Pour qu'elles aient un sens, il faudrait par exemple que o(xm) soit une fonction,
puisque f = o(xm) pour une fonction f. Mais alors on ne pourrait pas avoir g = o(xm)
si g est différent de f. Il faut les interpréter en pensant que o(xm) est en fait un ensemble
de fonctions, celui de toutes les fonctions définies au voisinage de x 0 et vérifiant le deuxième
membre de l'équivalence. La notation correcte devient alors f E o(xm). C'est cependant l'usage
mathématique d'écrire le signe = à la place du signe E, ce qui n'entraîne pas d'inconvénient
une fois ces précautions clairement énoncées. Nous utiliserons dans ce chapitre les opérations
usuelles sur les notations de Landau.,

III.2. La formule locale de Taylor-Young


La formule de Taylor-Young est l'analogue de la formule de définition de la dérivée d'une
fonction, pour les polynômes de meilleure approximation en un point.

IIl.2.1. La formule de Taylor-Young

Le problème de la recherche du polynôme de degré 1 approchant au mieux une fonction au


voisinage d'un point a déjà été résolu. Rappelons en effet la relation de définition de la dérivée.

Définition 29.27. Soit f une fonction définie au voisinage de x 0 . Alors f est dérivable en
Xo si et seulement si il existe une fonction E définie au voisinage de O et de limite nulle en
0 telle que
f(xo + h) = f(xo) + f'(xo)h + hE(h),
ce qui s'écrit aussi, avec la notation de Landau, f(x) = f(xo)+f'(x 0 )h+o(h). On peut encore
écrire f(x) = f(xol+f'(x 0 )(x-xol+(x-x0 )dx-x0 ) ou f(x) = f(x 0 )+f'(x0 )(x-x0 )+o(x-x0 ).

Comme nous l'avons déjà signalé, cet énoncé traduit le fait que x H f(x 0 ) +f'(x 0 )(x-x0 )
est la meilleure approximation affine de f au voisinage de x 0 , on l'appelle application affine
861

tangente à f en x 0 . Le but de la formule de Taylor-Young est de déterminer la meilleure


approximation polynomiale de degré supérieur à 1.
Pour cela, laissons-nous guider par un exemple. Il est clair que si f est une fonction affine,
sa meilleure approximation coïncide en tout point avec la fonction elle-même. Posons f(x) =
a 0x + a 1 et étudions f au voisinage de O. On voit que ao = f(0) et que a1 = f'(0). On peut
donc dans ce cas retrouver le polynôme de meilleure approximation au moyen de quantités
associées à la fonction f au point x 0 , à savoir sa valeur et son nombre dérivé.
La première étape vers les degrés supérieurs est donc de se poser une question analogue
pour les fonctions polynômes. Posons donc f(x) = a 0 +a 1x+· · ·+anxn. Là encore, la meilleure
approximation polynomiale de degré n possible au voisinage de 0 est donnée par la fonction
f elle-même. Le problème va être de retrouver cette approximation au moyen des dérivées
successives de f. Il n'est pas difficile de voir que

ao = f(0), a2 -- -1 f "( 0 ) , ... , Un -- 11 f (nl( 0 ) ,


a1 = f ' (0 ) ,
2 n.
et donc la meilleure approximation polynomiale de degré n de f en 0 s'écrit dans ce cas
1 1
P(x) = f(0) + f'(0) x + - f"(0) x 2 + · · · + 1 f(nl(0) xn.
2 n.
Il est donc légitime d'espérer que le polynôme de meilleure approximation aura une forme
analogue dans le cas général. Ceci justifie la définition suivante.
Définition 29.28. Soit f une fonction définie au voisinage de x 0 E ~ et n fois dérivable en
x 0 . Le polynôme de Taylor de f de degré n en x 0 est par définition le polynôme

On note Rt,n,xo le reste d'ordre n de f au voisinage de Xo, défini comme la différence entre
la Jonction f et son polynôme de Taylor de degré n en x 0 . De manière plus précise,

Rt,n,xo (h) = f(xo + h) - Pt,n,xo (xo + h).

La Jonction reste Rt,n,xo est donc définie dans un voisinage de O.

Pour étudier la qualité de l'approximation d'une fonction par son polynôme de Taylor,
nous allons utiliser le lemme fondamental suivant, qui relie l'approximation d'une dérivée à
celle de la fonction initiale, et qui permettra de faire des raisonnements par récurrence.

"~~::e~~t:jJf-}t~titl:~:~~lîlili'!411,~is,h'tÏjf;i~~"?~f~,!i~1:#i
PREUVE. Soit E > 0 fixé. Par hypothèse, lorsque h tend vers 0, g'(h)/hk tend vers O. Donc, il
existe ho> 0 tel que si lhl ~ ho, on a lg'(h)I:::; elhkl. Appliquons l'inégalité des accroissements
finis dans l'intervalle [0, hl, pour 0 ~ h < ho on obtient
lg(h) - g(0)I:::; Ehk+l _
De la même manière, si -ho < h < 0, l'application de l'inégalité des accroissements finis
entre entre h et 0 conduit à lg(h) - g(0)I :::; elhlk+l _ Donc pour lhl ~ ho, on obtient l'inégalité
lg(h) - g(0)I ~ rlhlk+l. Comme E est arbitraire, on a bien g(h)- g(x 0 ) = o(hk+1). ■

Ce lemme permet d'aboutir immédiatement à la première formule de Taylor, dite formule


de Taylor- Young.
862

-• ' ,, ' :.a_r~';>:-,'.Ox-~-~-


.~·tiKù~:~0~{.Jt:,:-c; .· .
PREUVE. Nous faisons une récurrence sur n. La formule est bien entendu vraie si n = 1
c'est la définition même de la dérivée en x 0 .
Supposons-la vraie au rang n - 1. En l'appliquant au rang n - 1 à f' (qui est bien n - 1
fois dérivable en x 0 ), on peut écrire en posant h = x - xo

Appliquons le lemme 29.29 avec k = n - 1 et g(h) = f(xo + h) - Ln _k_!_hk.


f(kl(xo)
On a par
k=O
hypothèse
n-1 f(k+ll( )
g'(h) = f'(xo + h) - ' Xo hk = o(hn-l)
L k!

et comme g(0) = 0, le lemme conduit à g(h) = o(hn), ce qui est la formule cherchée. ■

Définition 29.31. Soit n E N*. On dit qu'une fonction f définie au voisinage de x0 E lR.
possède un développement limité à l'ordre n lorsqu'il existe n+ 1 coefficients a 0 , •.• , Un dans
lR. tels que au voisinage de 0
n
f(x) = L adx-xo)k+o(x-x )n. 0
k=O

La fonction x H .L~=O ak(x - x 0 )k est dite partie polynomiale du développement.

Une fonction est donc dérivable en x 0 si et seulement si elle possède un développement


limité à l'ordre 1 en x 0 , par définition même de la dérivée. La formule de Taylor-Young montre
ensuite qu'une fonction n fois dérivable en x 0 possède un développement limité à l'ordre n en
x 0 • On se pose immédiatement le problème de la réciproque.

Équivalence seulement si n =1
Lorsque n > 1, il n'y a pas équivalence entre la dérivabilité à l'ordre n et l'existence
d'un développement limité à l'ordre n.

EXEMPLE 29.32. Pour mieux voir le problème, considérons la fonction f définie sur JR.* par
f(x) = x 512 sin(1/x). La fonction f est de classe C 00 dans JR.*. Elle vérifie lf(x)I ~ lxl 5/ 2 et est
donc prolongeable en 0 par une fonction (notée encore f) telle que f(0) = O. Cette fonction
est dérivable en 0, et vérifie f'(0) = 0, par définition même de la dérivée.
863

Nous avons aussi lxi 5 / 2 = o(x 2 }, donc f(x) = o(x2 ). C'est un développement limité de f à
l'ordre 2 en O.
Si l'on calcule f' pour x-/- 0, on obtient

f'(x) = ~x 312 sin(l/x) - x 112 cos(l/x}


2
et donc
f'(x} - f'(0) 5 .
x = x 112 sm(l/x)-x- 112 cos(l/x),
2
et l'on voit que ce terme n'a pas de limite lorsque x -t 0 (en raison du second). Donc f"(0)
n'existe pas, et pourtant on peut écrire f(x) = o(x 2 }.

Comme pour le cas de l'approximation par les fonction affines, nous allons voir que lors-
qu'une fonction possède un développement d'ordre n en un point, la partie polynomiale de
ce développement est la meilleure approximation locale par un polynôme de degré n de f. Ce
sera bien sûr le cas pour les polynômes de Taylor des fonctions n fois dérivables. Nous allons
préciser un peu cette question, en montrant d'abord deux lemmes d'unicité.

PREUVE. Écrivons P(x} = .L.~=0 akxk. On sait que la fonction P est nulle si et seulement si
tous ses coefficients ak sont nuls. Supposons que l'un au moins des ak soit non nul, et soit
p = min{k E {0, ... , n} 1 ak-/- 0}. En divisant par xP
n
av= - L. akxk-p + o(l}.
k=p+l

Le membre de droite a une limite nulle quand x -t 0, et il est constant et égal à ap, donc
Up = O. C'est une contradiction. Tous les coefficients Uk sont nuls, et P est nul. ■

Le lemme suivant montre l'unicité du développement limité, lorsqu'il existe.

PREUVE. C'est une conséquence du lemme précédent, il suffit de faire la différence des
développements. ■

La proposition suivante montre que si f admet un développement limité à l'odre n au


voisinage de 0, sa partie polynomiale est le polynôme de degré n réalisant la meilleure ap-
proximation locale de f au voisinage de x 0 •
r
864

Q)
U)

~
~
ê::
Q)

~
PREUVE. Si P = Q, c'est évident. Sinon, notons p la valuation du polynôme P - Q. Alors,
on voit immédiatement que

f(x) - Q(x-xo) - (ap - bb)(x-xoJP = o((x-xoJP+1).


Soit b E JR~ tel que lf(x)-Q(x-x 0 ) - (av- bb)(x-xoJPI ~ lx-xolp+l dès que lx-xol ~ b.
Alors,

Soit bo = min(&, lav - bbl/2). Alors si lx - xol ~ bo,

Comme f(x) - P(x - x 0 ) = o((x - x 0 )n) avec n ~ p, il existe b1 E JR~ tel que

1
lf(x) - P(x - Xo)I ~ zlap - bbllx - Xolp

dès que lx - xol ~ &1. On obtient donc lf(x) - P(x - Xo)I ~ lf(x) - Q(x - xo)I dès que
lx - xol ~ min( bo, b1), ce qui termine la démonstration.

En particulier, si une fonction f est n fois dérivable au voisinage d'un point x 0 , son poly-
nôme de Taylor est le polynôme de meilleure approximation de f au voisinage de x 0 .

III.2.2. Formule de Taylor-Young et premiers développements

1. Développement des fonctions trigonométriques. Les fonctions sin et cos admettent


des dérivées à tout ordre (rappelons que dériver une telle fonction consiste à ajouter n/2 à
l'angle). Ainsi nous avons pour tout n

. ( h)- ~ sin(xo + kn/2) hk - ~ cos(xo + kn/2) k


sm x 0 + - L k! + o (hn) , cos (x 0 + hl - L k! h +o
(hn)
.
k=O k=O

Ces développements sont en général écrits en Oet donnent les développements impairs et pairs
suivants:

N (-l)P
sin(h) = ;.. (-1 )P h2p+l + o(h2N+2) et cos(h) = ' - - h2P + o(h2N+l)
L
p=O
(2p + 1)! L (2p)! .
p=Û

Connaissant ces deux derniers développements, on peut retrouver les premiers grâce aux
formules de trigonométrie (sin et cos d'une somme).
865

2. Développement de la fonction exponentielle. La fonction exponentielle admet aussi


des dérivées à tout ordre. Pour ex E JR, on a

En général, on écrit ce développement avec ex = 1 et x 0 = 0

À partir de celui-ci, on retrouve le précédent, puisque e"'(Xo+h) = e"'"°e("'hl_ Le lecteur aura


aussi remarqué que si l'on pose ex = i dans la première formule, on retrouve les développements
de sinus et cosinus en appliquant la relation eie = cos(0) + isin(0).

3. Développement des fonctions hyperboliques. En posant ex = 1 dans le développement


de l'exponentielle, on a les développements des sinus hyperbolique et cosinus hyperbolique à
partir de leur définition ch(h) = e"ie-h et sh(h) = e"-~r"
N N 1
sh(h) = ~ 1 h2p+l + o(h2N+2) ch(h) = ~ - - h2P + o(h2N+l)
L (2p+l)! ' ;:o(2p)! .
p=O

4. Développement des fonctions puissance. Soit ex E R On peut écrire au voisinage du


point 0
(1 +h)"'= f_ cx(cx-1) ..~icx-k+l)hk+o(hn).
_/ k=O

Lorsque ex est un entier n, le terme o(hn) est nul, c'est la formule du binôme (1 + h)n =
L~=O C~hk_ Il faut aussi savoir écrire très vite cette formule pour ex= -1 ; elle donne
n
(1 + h)-1 = L(-lJkhk+o(hn)
k=O

et est une conséquence de l'étude des suites géométriques, puisque

5. Développement de la fonction logarithme. Passons au cas de la fonction ln au voi-


sinage de 1. Comme la dérivée de x H ln(l + x) est (1 + x)- 1 , le calcul précédent donne les
dérivées successives de ln en 1. Il vient donc
866

IIl.3. L'estimation des restes : Taylor-Lagrange et reste intégral


La formule de Taylor-Lagrange indique seulement un comportement asymptotique pour le
reste, en montrant qu'il est négligeable par rapport à un monôme. Elle ne donne aucune
indication sur sa taille. En effet, il est impossible de le majorer explicitement, puisque les
constantes intervenant dans la relation de comparaison ne sont pas explicites. Nous en venons
dans cette partie à des formules précisant ce reste. Chacune de ces formules a un intérêt
propre, et elles diffèrent fondamentalement par la régularité exigée pour la fonction.

Théorême.~.36. .Scient (l et b deu:r:réel:J, a <b, so# f une f<,uetion dda, bJ dans R.. et
1) Formule a~ 'laylol'-Lagr~ge.· Fonetio" tk:IS'i f .êst de filasse Ct:i 8Ur {a, bJ et n+ 1
Jo1t$ dérivable sur }a,b[, .il. existé c E Ja, b{ tel que ·

fi't.): .;},i. a:.·)···_+_··•.· .'P •. (b~C;i~f{k}r.•.u.


·.·J+.·.·.]b :_,i}1:~1.*(.ni,•.?·'f·l(tJ·.r
\V) \
: . 4-,.
} .·
k=l .. k!·. . . . ·. {n:+l)! •
. ·.· ·..... , , .· •.· ...

2} For611tl~de Tayfhr~~e'Întêgrâl. Si'të$.t âe Cl~t?~~t sûr[tr, ilk


f(b} :6 ffa} +
.
t
_k=l
ftt;}1}lsfflcY(;}
.
+Jt>"fb:t}J\ f(1i+t\r)d't..•
a. .•
,=

:
- ; ~ ' -

PREUVE. Les deux preuves sont de structure très différente.


1. Taylor-Lagrange. Introduisons une fonction auxiliaire g: [a, b] -, li définie par

- n (b-x]k (k) (b-x)n+l


g(x)-f(b)-f(x)-.L_ k! f (x)+C (n+l)!,
k=l

où C est une constante choisie telle que g (a) = 0 (ce qui est bien possible, puisque le facteur
de C est non nul si x =•.a). C'est le calcul de la valeur de C qui va permettre de montrer
l'égalité.
Il est clair que g(b) = 0, et la fonction g est continue dans [a, b) (puisque f est de classe
en dans [a, bl) et dérivable dans ]a, b[ (puisque f est (n + 1) fois dérivable dans ]a, b[). Il
est donc possible de lui appliquer le théorème de Rolle, qui conduit à l'existence d'un réel
c E ] a, b [ vérifiant g 1 ( c) = 0. Mais un calcul immédiat montre que

g'(x) = _ (b-,x)nf(n+ll(x) + C (b-,x)n


n. n.
En posant x = c, on obtient donc l'égalité C = f(n+ll(c). On déduit alors l'égalité annoncée
de l'égalité g (a) = 0, dans laquelle on reporte la valeur de C.
2. Taylor avec reste intégral. La démonstration se fait par récurrence, au moyen d'une
intégration par parties. Lorsque n = 0, comme f est de classe C 1 dans [a, bl, on a

f(b) - f(u) = r f'('r)d'r,

puisque f' est continue et de primitive f. L'assertion est donc vraie.


Supposons-la vraie au rang n - 1. Nous pouvons écrire

n-1 f(kl( ) Jb (b )(n-1)


f(b)-f(u)- ,_a_(b-a?= -'[ f(nl('r)d'r.
L
k=l k'. a (n-1)'·
867

(b -T)n-1
Calculons l'intégrale par parties, en dérivant TH f(nl(-r) et en intégrant TH (n _ 1)! . On
obtient

Ceci permet d'achever la récurrence. ■

Les formules de Taylor possèdent de multiples formes, à adapter suivant les besoins. Par
exemple, un changement de variables dans la formule avec reste intégral conduit à l'expression

f(b) - f(a) -
f(kl( )
LT
n-1
,(b - a)k = (b - a)n
Il (1 e)(n-1)
(~ _ 1)! f(nl(a + 0(b - a))d0.
1=1 O

La formule de Taylor-Lagrange que nous avons donnée est en fait un résultat d'existence.
Elle indique qu'il est possible de trouver un réel c dans l'intervalle ] a, b[ pour lequel une
certaine égalité est réalisée. La figure suivante en donne une interprétation géométrique (pour
l'ordre 2).

Graphe de f"
f"(c)
Graphe de f
f"(c)
2

0 0 C

FIGURE 29.4. Interprétation géométrique de la formule de Taylor-Lagrange

Du point de vue de l'approximation des fonctions, la formule de Taylor-Lagrange est


avantageusement remplacée par la formule de majoration des restes suivante.

Th«.rètiie 2Jf.'$,'t~(YgâÎl~de;·Tayti)r~Lagrange. $oÎent.aitb ®'fl!JJ~lf,,ffo <: b, et.


0

soitf'.'f~~J~nt.it~,dq,;{~.J>}: g~~Jll.,.:.dl:, cl!ls.st1 .C". ,mr: {a bl etn + t,Jàis dé'l'ipa1lk.' sur}ci~t;,J.


1
Al9T$1 .si .kî dérivée fffHLest bornée ~rrQ,,"1,l . . . . .. . ..

.[f(lifcè{( it\·•};iJ~;;"i~.;.ifll)j. ,;·(~::i:t~,~if"'"l(ë),


PREUVE. C'est une conséquence immédiate de la formule de Taylor-Lagrange. ■

Comme nous le verrons dans la suite du cours, l'inégalité de Taylor-Lagrange a le mérite


de se généraliser au cas des fonctions à valeurs vectorielles, contrairement à la formule de
Taylor-Lagrange, qui est spécifique aux fonctions de valeurs réelles.
Nous allons maintenant voir un premier intérêt de la majoration des restes, sur un exemple
très simple.
868

EXEMPLE 29.38. Considérons la fonction exponentielle au voisinage de O. L'inégalité de


Taylor-Lagrange s'écrit, pour x) 0
n k c
-X SUPcE]O·x[
, e
1
ex_
L k!
k==O
I
~

"" (n + 1) ! '

et donc I ex - f_ :~ 1 ~ ( n ~ 1) ! . Fixons x et faisons tendre n vers +oo. On constate que


k=O
le majorant tend vers O. Ainsi, lorsque n tend vers +oo, le polynôme de Taylor calculé à
l'origine tend vers ex pour toute valeur de x, soit

Vx ER, . 'X
hmL-k=e.
n->+oo !
x
n k

k=O

Le développement de Taylor, pourtant de nature locale, permet donc dans ce cas de recons-
truire toute la fonction (on verifiera qu'il en est de même lorsque x < 0), ce qui est très
remarquable.
Ceci n'est pas toujours le cas. Par exemple, dans le complément sur les fonctions plateaux,
nous étudierons la fonctions cp 00 définie sur R par

cp 00 (x)=O si x~O,

On montrera que cp 00 est de classe C00 et que pour tout n, cp):1(0) = O. Ainsi son polynôme
de Taylor est le polynôme O à tout ordre: cp 00 (x) = o(xn). Ces polynômes ont une limite qui
est le polynôme 0, mais bien entendu, cette limite n'est égale à cp 00 sur aucun voisinage (à
droite) de O.
Le comportement des polynômes de Taylor pour l'exponentielle peut donc paraître sur-
prenant. Ce phénomène fondamental (dit d'analyticité) sera étudié plus en détail dans le
cours de L2.

IV. LES DÉVELOPPEMENTS LIMITÉS ET LEURS APPLICATIONS

Rappelons qu'une fonction f définie au voisinage d'un point x 0 de R f admet un développement


limité d'ordre n en x 0 s'il existe une fonction polynôme de degré n telle que pour x voisin de
x 0 f(x) = P(x - x 0 ) + o(hn). Nous avons vu que les fonctions n fois dérivables admettent des
développements limités, dont les coefficients sont à un facteur près les dérivées successives de la
fonction. Nous allons montrer dans cette partie comment obtenir des développements limités
dans beaucoup de circonstances, sans avoir à recourir au calcul de ces dérivées successives.

IV .1. Calculs sur les développements limités


Voici une première remarque sur la forme des développements limités, qui s'avère souvent
utile dans les calculs.

Cor:ollàire 19.39.: Si f· ës.t~im,pai1tt-(t•e,s-j,.,,mîte};; ttfà~èlt!~en~::tim..,,def en o· est ~ r


(resp. pair), a-u sens où tous les coefficients d'ordre pairs (resp. i:m:pai.rs) so'f!.t nuls>
869

PREUVE. Nous allons faire la démonstration pour f paire; la démonstration pour f impaire
n
est identique. Du développement limité f(h) = L. akhk + o(hn), on déduit
k=()

n n

Comme f(h) = f(-h), l'unicité du développement limité fournit pour tout k ak = (-1 ]kuk,
et donc uk = 0 si k est impair. ■

Nous allons voir maintenant que les développements limités de nombreuses fonctions se
calculent aisément à partir des développements obtenus dans la partie III par somme, produit,
et composition.

Prop~ition29c.;1'Ô, Combinaisonli~reetproduit, .· .. ·..·.. f ..·..·. 11, 'J,!;.\ ,


•· Soit X.O·· È R.. Si det;,;efor,,ctions f et g tul~~nt àu voisinagé,de Xo dës tlévéloPfJe.~i#fs:lim~(és
d'onke it etµ, de)a forme · · · ·· · · ·
n , ·. .• Pr<:•< .•
,f(X-0 +Ji,) z
.
L, 0.1çh.k+ o(~n),,
h=O
g(Xt, + li) '? E bih1tc+ Q(bJ'),
k=C '

àlorsJ1i)urto'ftt(À,µ:} Ellt1 ; ;>.f + µg et fg âdmêttoora,u·voisînage de 'ièodeiâëvëloppemènts


limités d'ordre q = IUin{n,p} donnés par
q .
{Àî + µg){XQ + h.) = L. (Àak + µbk)h.k + o{h.q),
k-=O
q m
{fgl(Xo+h.) = _L.Cmh.ni+o{h.q}, avec Cm=;= E:a;:l?m~j•
m=O j:O .

PREUVE. Supposons pour fixer les idées que n ,,:; p. Alors pour la combinaison linéaire, on
peut bien entendu écrire
n P
(M+µg)(xo+h) = L_(Àak+µbk)hk+µ L. bkhk+o(hn)+o(hP),
k=O
la seconde somme étant absente si n = p. Remarquons cependant que si k ?, n + 1, on
p
a hk = o(hn), par conséquent µ L. bkhk + o(hn) + o(hP) = o(hn). Ainsi, nous arrivons
k=n+l
à la formule annoncée. Nous voyons d'ores et déjà dans cette première démonstration le
comportement que devra avoir le virtuose du calcul de développements limités : il est inutile
d'écrire les termes qui entrent dans le o(hn) (ce que nous ferons cependant dans les premières
démonstrations).
De même, pour le produit
n p
(fg)(xo + h) = (r ukhk + o(hnl) (r Ufhf + o(hPJ)
k=O f=O
= L. L. ukbfhk+f + o(hn)g(xo + h) + o(hP)f(xo + h),
kEÔn fEt.p
870

avec ~n E {O, ... , n} et ~P = {O, ... , p}. Comme g est continue en Xo, elle est bornée au
voisinage de x 0 , donc o(hn)g(x 0 + h) = o(hn) ; de même o(hP)f(x 0 + h) = o(hP) = o(hn) (car
p ): n) et donc
(fg)(xo + h) = .L, .L,
akbehkH + o(hn).
kE4n fEL'.p
Notons M, = {(k,C) E ~n x ~PI k+C ~ n} et M2 = {(k,C) E ~n x ~v I k+ C > n}. Alors,
(fg)(xo + h) = .L, akbehkH + .L, akbehk+f + o(hn).
(k,f)EM1 (k,f)EM2
Clairement L(k,f)EMz akbehk+e = o(hn), donc (fg)(xo +, h) = L(k,f)EM, akbehkH + o(hn). Il
reste seulement à remarquer que L(k,f)EM, akbehk+f = t:=oCmhm, avec Cm= I:~aibm-i,
ce qui termine la preuve. ■

Calcul pratique
Dans la pratique, pour calculer le développement limité à l'ordre n d'un produit de
deux facteurs, on considère des développements limités à l'ordre n des deux facteurs, on
multiplie leurs deux parties polynomiales, et on ne tient compte dans ce produit que des
termes de degré inférieur ou égal à n.

Examinons maintenant quelques exemples.


EXEMPLE 29.41. Cherchons un développement limité d'ordre 5 de la fonction

f(x) = x~sin(x).
+x
► Nous allons considérer f(x) comme le produit de g(x) = x 2 sin x et de h(x) = 1/(1 + x),
et nous allons développer chacun des termes à l'ordre 5.
Commençons par g. La fonction g est elle-même un produit. Le premier terme x 2 est un
polynôme de degré 2, son développement à l'ordre 5 est donc égal à x 2 . Nous connaissons
aussi un développement de sin x à l'ordre 5 : sin x = x - x 3 /6 + x 5 /120 + o(x 5 ). Le produit
des deux termes conduit donc à
x 2 sin x = x 3 - x 5 /6 + o(x5 ),
puisqu'on ne tient compte dans le produit que des termes de degré ~ 5. Notons donc qu'il
aurait été suffisant de développer sin x seulement à l'ordre 3. Il est souvent possible d'utiliser
ce type de raccourci, mais il est plus sûr au début d'appliquer strictement les règles de calcul,
au prix de quelques lourdeurs.
Passons maintenant à 1/(1 + x). On sait que
1
- - = 1 - x + x 2 + x 3 - x 4 + x 5 + o( x 5 ).
1+ X
En utilisant la règle du produit, il vient donc
f(x) = (x 3 - x 5 /6 + o(x5 ))(1 - x + x 2 + x 3 - x 4 + x 5 + o(x5 ))
= x 3 - x 4 + 5x 5 /6 + o(x 5 ).
Notons que, là encore, il aurait été possible de ne développer 1/( 1 +x) qu'à l'ordre 2, puisque
x 3 est en facteur dans le premier terme g.
871

Dans les calculs suivants, nous allons utiliser quelques raccourcis permettant d'éviter cer-
tains calculs. Nous conseillons au lecteur d'étudier attentivement la structure des exemples,
pour éviter des erreurs.

EXEMPLE 29.42. Du développement limité de sin d'ordre 5 au voisinage de 0, déduisons


ceux de sin k( x) pour k E N* par récurrence sur k.
► On a bien entendu

sin(x)=x- 0 + 0 +o(x5 )=x ( 1- ~ + 0 +o(x4).


)
6 120 6 120
Et donc
sin 2 (x) = x 2 ( 1 -
xz
+
x4
+ o(x4)
)2 .
6 120
Pour avoir un développement limité d'ordre 5 de sin 2 , il faut faire le développement limité
d'ordre 3 du dernier terme. On fait le produit des éléments en négligeant tous les termes
d'ordre strictement supérieurs à 3 :

x2 x4 4 )) 2 = ( x2 x4 ) ( xz x4 ) x2
1--+-+o(x4) 1--+-+o(x4) = 1--+o(x3 )
( 1--+-+o(x
6 120 6 120 6 120 3 '
et donc

De même

Ici, en raison de la présence du x 3 , il n'est nécessaire de développer le produit que jusqu'à


l'ordre 2 ; il vient

Continuons de même

Il vient alors sin5 (x) = x 5 + o(x 5 ), puis pour tout k? 6, sink(x) = o(x 5 ) .

.Prllposîtion 29,43. lntêgrâtion•. $(i1;1, io·,e Jlt, Soit f uné fondiM déritittblè dàris' un
v<n$i-riaJJe ~ X(). 0Si f' admet à1vvoisinage de x.0 oo dé'#Jêloppement iJrordrè n. ~ la forme
f'tXô +lt) :=-' [ ~ 11):lil,; +o(hnk aiors f admèf tW voisinage dé Xo le dé'!Jèloppement d'ordre
rt + 1 suivant : . . •
n+l
.f{Xo +h.} =fh:i>} +L af k.=1
1
..
h.k +:o(h,~-H).
872

n
PREUVE. Utilisons le lemme 29.29 avec g(h) = f(x 0 + h) - (f(x0 ) + L kakl hk+ 1
). On a
k=O +
par hypothèse g'(h) = f'(x 0 + h) - .L~=0 akhk = o(hn) et donc, comme g(0) = 0

Propositron 29.A~ Oêi-iyat;îàa.. .So# 'x? ~ JR:. f


Sàît· ùne Jonctèâfi. ~?J:able. daitt îi~
:Sf
voist~. ~ X~;· . f/a~'fJÀl;too ~éve!,oppèment Iim~Jd'orttft{'t!. JeJ4•JP~ if{X;ti+:ltl~·
r,~ +
akb.~ Q{lin) .e;t si.f' f!tl:met un 4fve/,(JpPf#ment li:ln:i:té.. d~~ rt.rl, alo;sJ~ fi.~jêfl
s'obt,ient en ilé,jvant terme à terme ee,lui de f . .. . . . . ' .
'. ·. ·.• ·'. tt .• . . . • .· , . ·.
. t{~tt:h.}

~I:. }sa~J\~-l. f o{};l.~:1};:
... ···~1· ·· • .··· . '

PREUVE. C'est la proposition précédente appliquée à f'. ■

A..rtc11ti011 Aux dérivées


Il faut bien noter que la proposition précédente suppose l'existence d'un développement
pour f'. L'existence d'un développement pour une fonction dérivable f ne permet pas
de conclure à l'existence d'un développement pour la dérivée. Par exemple, la fonction
f: x H x 512 sin(l/x) admet un développement limité d'ordre 2 en 0, et elle est dérivable.
Mais sa dérivée f' n'admet pas de développement limité d'ordre 1, puisque elle est non
dérivable en 0 (rappelons qu'à l'ordre 1, existence du développement limité et dérivabilité
sont équivalentes).

Nous donnons maintenant le théorème de composition des développements limités, sous


une forme simple qu'il est facile d'adapter à tous les cas.

Ptoposition•29.45.. ·Coînpœtion.·$oifxoé•Jtf:Sôtlf une Jonctivn 1~itf âu110~11,afe.

~1:~~!~1~-~·--i
r.~t?tlf + o{li~J, ·altJ'e,S ·~() f .adme.t un dévelop~mentlimiti 'ordre. q :;::.tnfü{n, p} obtentJ.
par substitution et troncature li l'orilre, q; ·

PREUVE. Nous allons utiliser pour f et pour g des développements à l'ordre q = min{n, p}
(pour l'une des deux fonctions, on tronque donc le développement initial).
On a (go f)(xo+ h) = g(f(x 0 + h)), et lorsque h tend vers 0, il en est de même de f(xo+ h)
par continuité. Aussi, on peut introduire dans le développement limité de g, l'expression
f(xo + h) (résultat sur la composition des relations de comparaison),
q
(go f)(xo + h) = L bef(xo + h)f + o(f(x 0 + h)q).
f=O
873

De plus, au voisinage de 0, f(x 0 + h) = a 1h + o(h) = 0 (h), donc f(xo + h)q = 0 (hq), d'où
o(f(x 0 + h)q) = o(hq)_ De plus, on peut calculer un développement à l'ordre q de f(x 0 + h)e
par produits successifs

q e q
f(xo+h)e= (Lakhk+o(hql) = .L_Cm,ehm+o(hq)
k=l m=O

et on arrive finalement, par combinaison linéaire, à un terme de la forme


q q

(go f)(xo + h) = L L becm,ehm + o(hq),


f=O m=O

ce qui est bien l'expression cherchée. ■

Remarque. Lorsque a 0 -1- 0, le résultat demeure valable à condition d'utiliser un dévelop-


pement limité de g au voisinage de f(x 0 ). En effet, si l'on a f(xo + h) = L~=0 akhk + o(hq) =
f(xo) + L~=l akhk + o(hq) et g(f(xo) + h) = Li=O behe + o(hq) on peut écrire
q
g(f(xo+ h)) =g(f(xo)l + (f(xo+ h)-f(xo)l = L be(f(xo+ h)-f(xo)le+o((f(xo+ h)-f(xo)lql
e=0

où cette fois f(x 0 + h)-f(x 0 ) admet le développement limité L~=l akhk+o(hq); il est donc
possible d'appliquer le théorème précédent.

EXEMPLE 29.46. Cherchons un développement limité à l'ordre n), 2 de 2 • i1x


► Il s'agit donc de composer le développement limité de 1/(1 + x) à l'ordre n avec celui de
x 2 à l'ordre n. Ce dernier est réduit à x 2 ; on obtient donc en appliquant le résultat précédent
et en utilisant ,!x = L~=0(-l)kxk+o(xn),

EXEMPLE 29.47. Continuons l'exemple précédent et cherchons un développement de


arctan à l'ordre n 2: 2. Comme arctan(0) = 0 et arctan'(x) = on peut obtenir le ,1x2,
développement de arctan par intégration d'un développement limité

n (-l]k
arctan(x) = ' - - - x2 k+l + o(x 2n+ 1 ].
Lzk+l
k=O

Pour mieux illustrer les différentes techniques de calcul, nous allons dans ce qui suit étudier
la formation du développement de la fonction tan à l'ordre 7, par différentes techniques. La
première est d'utiliser le développement de arctan, qui en est la réciproque.
874

EXEMPLE 29.48. Développement limité de la réciproque d'une fonction. Prenons l'exemple


de la fonction tan, à l'ordre 7 en O.
► Ce développement limité existe puisque tan est de classe C 00 • On connaît le développement
limité de arctan (obtenu plus haut) qui est la bijection réciproque de tan. La fonction tan
étant C 00 et impaire, on sait qu'elle admet un développement limité de la forme tan(x) =
3 5 7 7
<XX + f3x + yx + ôx + o( x ). Le développement limité de l'identité (qui est trivial) peut
s'obtenir aussi par composition des développements limités en écrivant tan o arctan ou bien
arctan o tan. Par conséquent, en identifiant

x = tan(arctan(x))

et en faisant le développement limité du membre de droite, on obtient par identification le


développement de tan. C'est un calcul fastidieux. Voici les résultats intermédiaires. Posons

x2 x4 x6 )
u = arctan(x) = x ( 1 - + - + o(x 6) .
3 5 7
On trouve
2 4
2x 23x )
u2=x2 ( 1-3+45+o(xs) '
ce qui permet de calculer

En écrivant que x = tan(arctan(x)) et en identifiant les coefficients, on peut déterminer un


système triangulaire dont sont solutions les coefficients inconnus

Ce système se résout directement et fournit

x3 2x5 17x7
tan(x) = x + + ~+ + o(x 7 ).
3 315

L'exemple de la fonction tangente, quotient des fonctions sin et cos, nous montre qu'il
peut être intéressant d'avoir des méthodes de calcul de développements pour les quotients.
Nous allons en montrer une, basée sur l'utilisation de la division des polynômes suivant les
·puissances croissantes. Nous commençons par énoncer le résultat d'existence.

Corollaire 29.49; .Quotient. Soit xo E R; Soient f. et g d/es !Dictions définies au voisinag~


de Xo· Supposons que f admette un. développement limite d'ordre n. aù voisinage df Xo de la
forme !:,~<lkh.Jt+ o{h,nJ et qùe g admette un développement limité d'ordre p au voisinagè
de Xo de la formei.:f..cbth: +o(ll,P) _avec bo.l O. Alors le quotientf/g. est défini au vois~âge
de xo et tuimei un dévelowement limite d'otilre mîn{p,n.}. .

PREUVE. Le quotient peut être vu comme le produit fi.


Comme g(x 0 ) = bo =/- 0 et que
g est continue, on en déduit que g ne s'annule pas au voisinage de x 0 , d'où l'existence du
875

développement limité du quotient. Montrons l'existence du développement limité de¼ à l'ordre


p, on en déduira alors le résultat grâce au théorème sur les produits.
La fonction cp définie sur JR.* par cp (x) = 1/x admet au voisinage de b 0 un développement
limité à tout ordre, donc en particulier à l'ordre n

Alors, grâce aux résultats sur la composition,¼ = cpog admet un développement limité d'ordre
n en x 0 . Nous avons tous les ingrédients pour conclure que f/g admet un développement limité
d'ordre min{p, n} en Xo. ■

Le calcul du développement limité d'un quotient se fait souvent selon la méthode de la


division selon les puissances croissantes. Prenons l'exemple du calcul du développement limité
de tan à l'ordre 5. On cherche donc un polynôme Q de degré au plus 5 tel que
x3 xs x2 x4
x- 6 + 120 + o(xs) = (1 - 2 + 24 + o(xs))(Q(x) + o(xs)).

Pour fabriquer à droite le terme x, il faut que Q (x) commence par un x. On écrit donc
Q (x) = x + Q 1 ( x), ce qui donne après développement

On trouve alors que Q1 (x) a pour terme dominant x 3/3. On écrit donc Q 1(x) = x 3 /3 + Q 2 (x)
ce qui donne après simplification

2x5 x2 x4
+ o(x 5 ) = (1 - + + o(x5 ))(Q 2 (x) + o(x 5 )),
15 2 24

d'où Q2 (x) = ~x;. Reportant, on tire à l'ordre 5

(Ces calculs sont présentés en général à la manière d'une division euclidienne).

EXEMPLE 29.50. Reprenons l'exemple classique: développement limité en Ode la fonction


tan à l'ordre 7. Examinons plusieurs nouvelles solutions. Tout d'abord, tan étant impaire,
on rappelle qu'il n'y a que des puissances impaires dans le développement.
► Méthode 1. On connaît le développement de sin et cos, à partir desquels on peut former
le développement limité d'un quotient et donc de la tangente. À l'ordre 7,
x3 xs xl x2 x4 x6
sin(x) =x- 6 + 120 - 5040 + o(x7), cos(x) = 1- - + - - - + o(x 7)
2 24 720 .

Il faut tout d'abord déterminer le développement limité de 1/ cos. Il suffit de l'avoir à l'ordre
6, puisque x peut être mis en facteur dans le sin. Pour cela, notant

xz x4 x6
U= - - -+-+o(x 7)
2 24 720
on constate que u-----+ 0 lorsque x tend vers 0 et que costJ = l~u· Comme u = 0 (x 2), pour
avoir un développement limité d'ordre 6 de 1/ cos, il suffit de pousser celui de l~u à l'ordre
3 en u
1
- - = 1 +u+u2 +u3 +o(u3 ).
1 -u
On substitue puis on développe, sans calculer les termes inutiles (c'est-à-dire ceux qui vont
entrer dans le o(x 6)),

1 x2 x4 x6 x2 x4 3
x6 6 x2 x4 x6
cos(x) = 1 + ( 2 - 24 + 720) + ( 2 - 24 + 720)2 + ( 2 - 24 + 720) + o(x ) =

On fait ensuite le produit des deux développements limités, toujours sans calculer les termes
qui vont disparaître dans le o(x 7 ),

► Méthode 2. Utilisons l'équation dont est solution tangente tan(x) = + tan(t)2)dt. J;(l
Du fait que tan'(0) = 1, on a à l'évidence le développement tan(x) = x + o(x), et donc

soit par intégration

X3

I
X

tan(x) = (1 + t 2 + o(t 2))dt =x+ + o(x 3 ).


0 3
On reprend le même argument. On trouve en substituant le nouveau développement

t3 t2
1 + tan(t) 2 = 1 + (t + + o(t 3))2 = 1 + t 2(1 + + o(t 2))2)
3 3
2t 2 2t4
=1 +t 2(1 + +o(t 2)) =1 +t 2 + +o(t4),
3 3
et donc
2t 4 x3 2x5
I
x
tan(x) = (1 + t 2 + + o(t4))dt =x+ + 5
0 3 3 15 + o(x ).

On itère le procédé une dernière fois,

d'où en intégrant
x3 2x5 17x 7
tan(x) =x+ + + + o(x 7 ).
3 15 315
877

► Méthode 3. Cherchons le développement sous la forme tan(x) = cxx+ f3x 3 +yx5 +6x7 +
7
o(x ). L'égalité sin(x) = cos(x) tan(x) permet d'écrire, en faisant les développements limités
d'ordre 7 de chacun des membres,

x3 x5 x7
x- - + - - - - + o(x 7 ) = cxx + (f3- cx/2)x 3
6 120 5040
+ (cx/24- f3/2 +y)x 5 + (-cx/720 + f3/24 -y/2 + 6)x 7 + o(x 7 ),

ce qui donne par identification des coefficients un système linéaire à résoudre. Ce système
étant triangulaire, sa résolution est aisée.

Test 29.13. de 0, alors f est la fonction exponentielle.


Indiquer si les assertions suivantes sont vraies - f(x) = 1 + x + o(x) implique que f(O, 1)
ou fausses et, lorsqu'elles sont vraies, les com- est presque égal à 1, 1.
menter. Test 29.14.
- sin(x) ~ x - x3 /6 lorsque x--, O.
- ex~ 1 + ✓n + 3x lorsque x--, O. Donner le développement limité d'ordre 8 en 0
- Si f(x) = 1 +x+x2 /2+o(x2 ) au voisinage de la fonction x H x 14 sin(l/x).

IV.2. Premières applications des développements limités


Les développements limités interviennent de manière cruciale dans la recherche d'équivalents
ou de limites de fonctions en un point donné. Ils permettent aussi des études plus géométriques,
par exemple celle de la disposition des courbes paramétrées au voisinage de leurs singularités
(ce qui sera vu dans la suite du cours). Nous nous limitons ici à quelques exemples de calculs
de limites, ainsi qu'à l'étude de l'existence d'extrema pour les fonctions d'une variable réelle en
un point où la dérivée s'annule. Nous invitons le lecteur à s'entraîner au moyen des exercices
proposés, leur résolution est essentielle pour une bonne assimilation de toutes les méthodes.

IV.2.1. Recherche d'équivalents et de limites

Ces deux applications étant similaires, nous les citons simultanément. La recherche d'équi-
valents est essentielle dans le cas des limites présentant une forme indéterminée, et les déve-
loppements limités permettent de trouver des équivalents. En voici un exemple.

EXEMPLE 29.51. Soit n EN*. Déterminons la limite en Ode la fonction

f: x H sin(x) ch(x) - sh(x) cos(x).


sin(x)n

► Cette fonction présente une forme indéterminée de la forme 0/0; on chercher un équi-
valent du numérateur et du dénominateur. Le dénominateur est trivialement équivalent à
f,
xn. Un développement limité d'ordre 3 du numérateur fournit l'équivalent 2 ainsi on a au
voisinage de 0, f(x) ~ Zx~-n. La limite est donc O lorsque n < 3, 2/3 lorsque n = 3 et nous
avons deux limites infinies distinctes à droite et à gauche lorsque n > 3.

Nous renvoyons aux exercices pour beaucoup d'autres applications aux déterminations de
limites. Il est essentiel d'en résoudre un grand nombre pour acquérir une pratique suffisante.
878

IV.2.2. Comportement local d'une fonction au voisinage d'un point critique

Soit x 0 E lR et soit f une fonction dérivable dans un voisinage de Xo telle que f'(xo) = O.
Rappelons que x 0 est un minimum local pour f si il existe un intervalle ouvert I contenant
x 0 pour lequel Vx E I, f(x) ~ f(x 0 ), et un maximum local pour f si il existe un intervalle
ouvert I contenant pour lequel Vx E I, f(x) ~ f(xo). Un minimum local est dit strict s'il
existe un intervalle I contenant pour lequel Vx E I \ {x0}, f(x) > f(x 0 ), et on adopte une
définition analogue pour les maxima stricts. Il est évidemment intéressant d'avoir des critères
d'existence de maxima ou minima en un point. Les développements limités permettent en
général de répondre à cette question.

Prripesition2t.5:2.•··Soitf 1mêfilnètîati déjinîe u1u 'llfJfmtdge·tJe~ Sü'P1)(1~~,f ~


0

un dé.vfiloppeli1mt lifmté 4ela fi,rimé . • •. . . . .. . ••· .. ···••· •....·

f(x) =f(XQ)+ ~(x ..:..~)1kf~i(i~:~)îi}C

au vp~e tk~, tl~.A:#:Q.(rù1tef,iJtteJ> ~2puîsftleJ'(iQ)êJ>J.;AZDri,,


1> si P e;t pair etc«i ~,o, ~ ~ èsz un miittimum~ strick
2) si p est pair et « < 0, alors Xo etd; un ma.iimmn ltJcrJ,fstnct;
3) si p est impairfX().1ifest"ffl'tinminimum,'m •$'~ni~

PREUVE. En effet, si p est pair et a > 0, on aura

dès que lx- x 0 1 est assez petit pour que Io((x -xoJP)I ~ 1(x - xo)P /4. Donc

(X,
f(x) ~ f(xo) + (x - x 0)P > f(xo)
2
si x est suffisamment voisin de Xo et différent de Xo. Le deuxième cas se ramène au premier
en considérant -f. Dans le troisième cas, supposons par exemple a> 0 (l'autre s'y ramène
en changeant f en -f). On a alors, en suivant une démarche analogue,

(X,
f(x) ~ f(x 0 ) + (x - x 0 )P > f(x 0 )
2
pour x voisin de x 0 et x > xo, ce qui interdit d'avoir un maximum local ; et lorsque x < x 0
est voisin de Xo

ce qui interdit d'avoir un minimum local. ■

Notre étude est en fait un cas particulier du résultat suivant, qu'on invite le lecteur à
démontrer en se rapportant au précédent.
879

:~~-~a:t~u~~,t~ij·m f"~*tt~aUt1~~~t?. ~a~)~ â~;,}iz;


. . . •. f(X} = f(Xo)'.f:f'{Xol(i:..i.Xo}+ «{X-:'-Xo)l'' +o((x-Xo}1')
~~.~p.Jtp~2: (ma
if~~, ~tJ1{1,ir.•et à >Jl,·•~ Je /~hi: Ile f mte: ~ au-dêssfut t(tJIJa;tiJ.njeme en
(~;ffx,o}}, . . . .
.2) ~Jt~•)t4in êt « < o(alm'S'fêg1tq>luvde f 1'e$le localement en-dessous. de sa tangente en
:(Xo}t{xô)}; • ·
3);i f est. impair, alor$ le gmplu:: f ·trtJ,t1efs;; sâ. tangente en {Xo, f{Xo)) • (an pariê de poîn~
.i,'.infterion).

Le terme localement signifie ici dans un voisinage suffisamment petit de (x 0 , f(x 0 )).

IV.3. Un mot sur les développements asymptotiques


Nous voulons procéder à une opération ressemblant à celle des développements limités. Fon-
damentalement, les développements limités servent à donner le comportement local d'une
fonction f au voisinage d'un point a E JR, en la comparant à une famille de fonctions considé-
rées comme bien comprises; ici les fonctions x H (x - a)n avec n EN. Pour cela, nous avons
écrit des développements du type
n
f(x) = .L. ak(x - a? + o((x - a)n),
k=O

dans lesquels chaque terme de la somme domine le suivant au voisinage de a. Nous voudrions
procéder à des développements du même type, sauf que l'on veut pouvoir étudier les fonctions
au voisinage de +oo, -oo, ou bien pouvoir les développer dans une autre famille que la famille
des (x - a)n. Par exemple, écrire au voisinage à droite de O le développement

Jx2 +X= Xl/2 + X3/2/2 + o(x3f2)


peut être intéressant. Ces développements n'entrent pas dans le cadre des développements
limités; on appelle ces développements des développements asymptotiques. Nous allons nous
contenter ici de fournir un autre exemple, et reviendrons à ce sujet dans la suite du cours.

EXEMPLE 29.54. Cherchons trois termes du développement asymptotique de la fonction f


définie par f(x) = ✓x 2 + x au voisinage de +oo.
► Il est possible d'obtenir certains développements asymptotiques au voisinage de +oo ou
de -oo en posant x = 1/u, ce qui ramène le problème à o+ (ou o-). Posant x = 1/u, on se
ramène à u tendant verso+. Or,
2
✓l
2
1
f(l/u) = J1/u2 + 1/u= +u = +u/Z-u /S+o(u ) = 1/u+ 1/2-u/8+o(u) =
u u
1 1
x+
2- Sx +o(l/x).
Bien entendu, on aurait pu aussi mettre directement le terme dominant en facteur en écrivant
f(x) = x{i+1, ce qui ramène au problème de v'f+u au voisinage de O.
880

Développements usuels au voisinage de 0

x 2 x4 x 2P 2 1
COS X = 1 - 1f + 4Î + · · · + (- l)P [lp) ! + 0 (X p+ )

3 17 x 7 +o(x8)
tanx-x+x
- + 2 x 5 + IB
"3TT5

x3 x5 x 2v+i 2 +z
sh x = x + "3T + 5! + • • • + (lp + 1)! + o(x P )

x3 x5 x 2P 2 1
chx=x+1r+ 5 ! +···+ (lp)! +o(x v+)

'V= ±1

x3 xs xzv+l z z
arctan x = x - -,, + - + • • • + (-1 )P--=----,---, + o(x P+ )
.-, 5 -"'-P+ 1

x3 x5 x2v+i
argth x = x + 5 + :r 2 2
+ ... + 2p+T + o( x v+ )

-yP • 1 · 3 · · · (2p - 1) 2
1 1 + 1-vx2 + 1 · 3 x 4 + .. • + - - - - ~ ~ ~ x P+o(x P+ ) -v -
2 1
±1
J1 _ -vxz 2 T-4 2 • 4 .. • (2p) ' -

arcsinx = x+ ~-x 3 + 1 3 x5 + .. • + 1 · 3 · · · (lp-1) 2 1 + o(x2P+2)


-"'- ..-, m· 2-4- .. (lp) · (2p + 1) x P+
1 x3 + ( -1 )Pl · 3 · · · (2p - 1) 2 1
1 · 3 x 5 + • • • + .,,....-~---~~x
argshx = x- P+ + o(x 2v+ 2 )
T-5 m 2-4··· (2vl · r2v + 1i
881

V. EXERCICES

29.1. 29.6.

Soit P une fonction p fois dérivable sur lR telle Démontrer avec un mm1mum de calculs que
que p(Pl soit la fonction nulle. Montrer que P pour tout 0 > 0 et tout x E ]0; 0[, on a
est une fonction polynôme (on pourra procéder ln(l +e)
par récurrence sur p). e x<ln(l+x)<x.

29.2.
29.7.
Montrer que pour tout n E N*, et tout x dans
] - n/2; n/2[, on a une relation de la forme Soit (x1, ... , Xn) E (lR+ln. On introduit les
tan(nl(x) = Pn(tan(x)), où Pn est un poly- moyennes arithmétiques Sn, géométriques Gn
nôme. Déterminer le degré de Pn et son terme et harmoniques Hn
dominant.

29.3.

Soit (k,j) EN* x N. On note n


Hn=,n l/··
4-i=l Xi
k-1
Sj = ,L_(-l)k-1-fctei. Montrer que Hn ~ Gn ~ Sn. (On pourra com-
f=O mencer par montrer la seconde relation, puis dé-
duire la première de la seconde).
Partant de la formule du binôme
k
29.8.
(x- 1t = ,L_ Ct{-l)k-jXj
j=O
Soit f convexe sur un intervalle 1. Soit K = [a, b]
que l'on dérivera à tous les ordres jusqu'à l'ordre un intervalle borné inclus dans l'intérieur de 1.
k, montrer successivement que So = 0, puis Montrer que f est lipschitzienne sur K. Est-elle
S1 = 0, jusqu'à sk-1 = 0 puis sk = k!. nécessairement lipschitzienne sur I ?

29.4. 29.9.

Soit f : x H y'l+x.
Soit f : I -t f(I) bijective et convexe. Montrer
1. Écrire le développement de Taylor en 0 que f- 1 : f(I) -t I est concave.
d'ordre 2 de f.
2. On cherche à donner une valeur approchée 29.10.
de v'10Î (sans utiliser de calculatrice). Un étu-
diant se propose de poser x = 100 dans la for- Soit I, J deux intervalles.Trouver toutes les fonc-
mule obtenue en l. Que peut-on en dire ? tions bijectives f: I -t Jtelles que f et f- 1 soient
3. Proposer une méthode plus efficace utilisant C2 à dérivées positives (on utilisera les résultats
la même formule. de deux exercices précédents).

29.5. 29.11.

Montrer par un exemple que la composée de Éffectuer les développements limités des fonc-
deux fonctions convexes n'est pas nécessaire- tions suivantes aux ordres demandés :
ment convexe. 1. t H arccos ( sint(t)), ordre 2.
882

2. tHln(at+bt),ordre2(a,b>0). En déduire que J~ 00 2


e-t dt ~ 01 (x) au voi-
sinage de +oo, et un encadrement du rapport
3. t H /1 + J1 + Jf+t, ordre 2. entre deux fonctions de x.
4. t H (1 - t + t 2)11\ ordre 4. 2. En travaillant sur la seconde intégrale, déve-
5. t H JOt e-s 2
ds ordre 2p + 1 ( p entier natu- 1opper Jx+oo e-tzdt comme somme d' un terme
rel). D2(x) sans intégrale et d'un terme propor-
tionnel à J~00 2
e-t /t4 dt. Encadrer le rapport
J+oo e_,2 dt
29.12.
D2(x)

Former le développement limité en Oet un déve- 29.17.


loppement asymptotique en +oo de la fonction
t H ( 1 + t) 1/t (on fera des développements Soit I un intervalle ouvert de JR, qui peut être
d'ordre 6). JR, et f une fonction de classe en sur I. Notons,
pour k E {O, ... , n}, Mk = supxEI lf(kl(x)I; c'est
29.13. a priori un élément de lR+ U {+oo}.
Nous savons depuis longtemps que si une
Déterminer fonction est petite, sa dérivée peut très bien
devenir très grande ; ainsi, la connaissance de
r 1 ( . ( x ) sin(x) )
Mo ne donne aucune information sur M 1. Par
x~ sin(x) 4 sm 1 + x - 1 + sin(x) ·
exemple, prenons sur I = lR la fonction f :
x H rnin(x 2), où E > 0 est donné. On cal-
29.14. cule facilement que Mo = E, alors que du fait
que f'(x) = 2rxcos(x2), on a pour tout n,
Déterminer la limite, lorsque x ----t o+, de M, ;;,= f'(v'znn) = 2rv'znn, qui tend vers +oo
lorsque n tend vers +oo. Par conséquent ici,
X
xx lnx (1 +x)(lnx)/x_x nous avons Mo = E et M 1 = +oo. Même en
xx- 1 ' x(xx- 1) restant sur un intervalle borné, il se peut que
Mo soit petit et que M 1 = +oo (prendre la
fonction V sur I =]0; d).
En revanche, une fonction ayant une pe-
29.15.
tite dérivée aura de petites variations. Si par
exemple I =]a, b[ est borné, prenant xo E I,
Déterminer la limite, lorsque x ----t +oo, de
nous avons, du fait que f(kl(x) - f(kl(xo) =
1/x J~ f(k+ll(s)ds
( e-(1+1/x)x ) ,
lf(kl(x) - lf(kl(xo)I :( Mk+1lx- xol,

lf(kl(x)I ,( lf(kl(xo)I + Mk+1lx-xol,


ce qui donne en particulier une majoration du
29.16.
type
On admettra que pour tout x > 0 et a E JR, l'in-
tégrale J: 2
e-t t 0 dt a une limite lorsque A tend
vers +oo. On la note J:"'
2
e-t t 0 dt. Le but est Les inégalités de Kolmogorov montrent
de fournir une approximation de
2
J:"'
e-t dt qu'en fait si Mo et Mn sont finies, alors il
lorsque x tend vers +oo à l'aide d'un dévelop- en est de rii(me de toutes les Mk pour tout
pement asymptotique. k E {O, ... , n}, et que, de plus, on peut trou-
1. Déterminer un terme 01 (x) de sorte que ver des constantes C(n, k) > 0 telles que pour
toute fonction f
883

Nous allons les démontrer lorsque I = R On suppose maintenant n = 3. Soit f une


Les q1,estions qui suivent présentent les in- fonction de classe C3 sur R telle que Mo et M 3
égalités del Kolmogorov dans le cas n = 2, puis sont finies. Soit x E R, h > O.
dans le cas n = 3. 1. Écrire les formules de Taylor-Lagrange à
On suppose d'abord n = 2. Soit f une fonc- l'ordre 2 entre x, x + h puis entre x, x + 2h.
tion de classe C 2 sur R telle que Mo et M2 sont En déduire un système linéaire dont est solu-
finies. Soit x E R, h > O. tion le couple (f'(x)h, f"(x)h2). On note t(u, v)
1. Écrire la formule de Taylor-Lagrange à le second membre de ce système linéaire.
l'ordre 1 entre x et x + h. En déduire que pour 2. Donner un majorant de lui et lvl en fonction
tout x, h de Mo, M3 et h uniquement.
~ 2 h2 .
1

lf'(x)lh,;;; 2Mo + 3. Résoudre le système linéaire (on laissera u et


v), puis à l'aide de la question précédente, don-
2. Chercher le minimum de cfJ : h H ~ + ner un majorant de lf'(x)I et lf''(x)I en fonction
~ - En déduire l'inégalité de Kolmogorov dans de Mo, M3 et h uniquement.
ce cas (on donnera la valeur de la constante 4. Terminer la résolution de l'exercice en sui-
C(2, 1) ainsi obtenue). vant une démarche analogue à la précédente.
COMPLÉM ENT 1. FONCTION ÉTRANGES

Une fonction C00 en forme de plateau

Notre but dans ce complément est de présenter une construction de fonctions dont le graphe
présente un plateau, représentée dans la figure suivante.

FIGURE 29.5. Une fonction plateau

Sans plus de précision, une telle fonction sera appellée fonction plateau. Il est clairement
possible de définir des fonctions plateau, par exemple la fonction f affine par morceaux donnée
par f(x) = 0 si x < -2 ou x > 2, f(x) = x + 2 si x E [-2, -1], f(x) = -x + 2 si x E [1, 2]
et f(x) = 1 six E [-1, 1]. Cette fonction n'est pas dérivable dans R Notre problème va être
de montrer qu'il est possible de construire des fonctions plateau de classe C 00 , ce qui n'est
nullement évident. De telles fonctions sont très utilisées en mathématiques, notamment en
géométrie différentielle.

1.1. Cas Ck avec k fini


Soit k E N*. Considérons le premier problème suivant : on cherche à construire une fonction
<Pk de classe Ck sur IR., nulle sur IR._ et strictement positive sur IR.~. Nous avons simplement
à définir <Pk sur IR.;, puisque son expression sur IR._ est exposée dans l'énoncé, et donne
une fonction aussi régulière que souhaitée (la fonction nulle est de classe C00 !) sur IR.':_. La
principale difficulté est bien entendu le raccord en O.
Si k = 1, il suffit de choisir sur JR.+ une fonction ayant en 0 une tangente horizontale et de
classe C 1 sur IR.~, ce qui impose cp 1 (0) = cp 1(0) = 0, par exemple x H x 2 .
Plus généralement, pour k 2: 1 donné, on aura les conditions cp~(0) = ... = cp~kJ(O) = 0;
et on vérifie que si cp est de classe Ck sur IR.~, elles sont nécessaires et suffisantes pour que la
fonction cl> soit de classe Ck sur R Une fonction qui les satisfait est par exemple

0 si X:,;; 0
<Pk(x) = { xk+ 1 six> 0 ·

Elle est donc de classe Ck sur IR.. Ce choix est bien entendu non unique. Par exemple, on aurait
pu multiplier <rk par une constante, ou bien remarquer que la fonction <rk+l répond aussi au
problème à l'ordre k.

A partir de la réponse à la question précédente, nous allons examiner une deuxième


question. On cherche maintenant une fonction -Wk, de classe Ck, positive ou nulle, telle que
1'>k 1 (IR.*) = JO; 1[, (donc Wk est nulle sur IR.':.. et sur [1, +oo[) et telle que J~ Wk( t) dt = 1.
Introduisons la fonction polynôme P(t) = t(l - t), qui vérifie P(t) > 0 si et seulement si
t E ]O; 1[. Alors, cherchons 'Vk sous la forme

où cpk est la fonction définie plus haut, et où ck E lR't sera choisi plus bas. Ceci a pour effet
de transformer la condition sur ]O, 1[ en une condition sur JR;:.
La fonction 'Vk est (k par composition d'une fonction (k et d'une fonction C00 ( qui est donc
Ck). Bien entendu 'Vk(x) > 0 si et seulement si x(l -x) > 0, c'est-à-dire si et seulement six E
]O; 1[. On choisit ck de sorte que J~ 'Vk = 1, c'est-à-dire que l'on pose ck = [J~ xk(l -x]kdxJ-1
(la valeur exacte de ck importe peu). On voit donc que l'on peut construire ainsi une fonction
'Vk répondant à notre question.
Nous pouvons maintenant aller plus loin. Posons pour k )! 2

Comme 'Vk-l est nulle sur JR-, llk = 0 sur JR-. La fonction TJk est dérivable, comme intégrale
fonction de la borne supérieure d'une fonction continue. Sa dérivée est 'Vk-1, la fonction TJk est
donc de classe (k sur JR. Par définition de 'Vk, on voit de plus que six )! 1, TJk( x) = J~ 'Vk( t) dt.
La fonction llk présente donc un « plateau infini», sur [1, +oo[, d'ordonnée 1.
Pour tout ex E lR, ceci rend possible la construction d'une fonction de classe (k présentant
un plateau infini d'ordonnée 1 sur [ex, +oo[, et nulle sur ] - oo, ex - 1]; il suffit bien sûr de
choisir 11L'xl(x) = 11dx + 1 - ex). Et on en déduit la construction symétrique d'une fonction
qui présente un plateau infini d'ordonnée 1 sur] - oo, 13] et nulle sur [13 + 1, +oo[, avec 13 E lR
quelconque. Il suffit de poser cj! 1(x) =11L-f3l(-x) (ou aussi cj! 1(x) = l -11j! 1(x-1)).
Il est maintenant facile de répondre à notre question sur les fonctions plateau. Posons par
exemple
F(x) = 11L-2 l(x)(( 2 l(x).

La fonction Fest de classe Ck, elle est nulle sur] - oo, -2] et sur [2, +oo[, et constante égale
à 1 sur [- 1, 1] .

1.2. Cas cxi


Nous voulons maintenant étudier le même problème en classe C00 • Nous allons présenter une
construction de la fonction cp 00 , le reste se transpose sans aucun changement. Cette fois, le
problème du raccord est beaucoup moins trivial. Une réponse est donnée par la proposition
suivante.

Prôpositiou 29~55 . .La fonction '9oo ·défi:nie sut R par


O six~O
{ e-1/xsix > 0
'Poo(x) ....

est ~sitiûe, de class:e COP sur Rtet '9ôo(R+Y~R+-

PREUVE. La principale difficulté de la démonstration est le raccord en O. Bien entendu, sur


lR"_, cp 00 est de classe C 00 avec une dérivée nulle à tout ordre. De plus, cp 00 est dérivable une
infinité de fois à gauche en O et toutes ses dérivées à gauche sont nulles.
Regardons sur lR:'i- l'expression des premières dérivées de cp 00 • On a pour x > 0

Il apparaît sur les premières expressions que cp/!1(x) est de la forme cp 00 ( x) Pk( 1/x), où Pk est
un polynôme. Ceci se démontre par récurrence sur k. On a en effet bien entendu P0 = 1, et si
le résultat est vrai pour k

cp)!+ 11 (x) = [cp 00 (x)Pk(l/x)]' = cp:X,(x)Pk(l/x) + <Poo(x)[Pk(l/x)]' =


cp 00 (x)[1/x 2 Pd1/x) -1/x2 P{(1/x)],
qui est de la forme cp 00 (x)Pk+ 1 (1/x), où le polynôme Pk+l est donné par Pk+l = X2 (Pk - P{).
La récurrence est donc achevée.
Montrons maintenant par récurrence que cp 00 est dérivable k fois à droite en 0, avec
(cpoo)~k)(O) = O.
Pour k = 1, considérons le taux d'accroissement pour t > 0

<Poo(t) ~ <Poo(O) = cp (t)


00
X (1/t) ---1 0,

car lorsque t ---1 o+, on au= 1/t ---1 +oo et donc e-"-u ---1 0, car l'exponentielle l'emporte sur
les polynômes. Ainsi, on a bien l'énoncé au rang 1. Supposons l'énoncé au rang k, et soit Qk
le polynôme XPk. Nous avons
(k)( ) (k1( )
<Poo t - <Poo O = cp 00 (t) X (1/t)Pk(l/t) = <Poo(t)Qdl/t) ---1 0,
t
puisqu'encore une fois, on a une expression de la forme e-uQdu), avec l'exponentielle qui
l'emporte sur le polynôme lorsque u ---1 +oo. Ainsi, on en déduit que <Poo est k+ 1 fois dérivable
à droite en 0 et que (cp 00 )~k+ll(O) = 0, ce qui achève la récurrence.
La fonction proposée est donc de classe C00 • ■

Comme pour la dérivée première, l'argument limx.---,o+ cp;!l(x) = 0 est insuffisant pour
montrer que cp 00 est k fois dérivable en 0 (comme le montre l'exemple de la fonction partie
entière en 0). Il faut avoir auparavant montré la continuité de <Pk-l en 0 (ce qui allègerait à
peine la récurrence).
On laisse maintenant au lecteur le soin de s'inspirer de la construction précédente en classe
Ck pour obtenir une fonction plateau de classe C00 , cela se fait sans aucune difficulté.

COMPLÉMENT 2. CONVEXITÉ

Une idée de convexité en économie

Dans ce complément, nous présentons une application intéressante de la notion de convexité


en sciences économiques. La modélisation micro économique utilise beaucoup les fonctions
convexes (ainsi que les ensembles convexes dont nous reparlerons dans le cours de L2). Les
raisons de l'occurence de la convexité dans cette discipline sont variées : les fonctions convexes
correspondent à des phénomènes interprétables, et d'ailleurs souvent observés. De plus, en
économie, on cherche souvent à minimiser (ou maximiser) des fonctions, ce qui est plus facile
lorsque les fonctions sont convexes (ou concaves) d'après le résultat précédent. Pour illustrer
ces idées, nous allons considérer une situation simpliste décrivant le comportement concurren-
tiel d'une entreprise.
Nous allons faire les hypothèses de travail suivantes. On considère une entreprise produisant
un unique bien de consommation. Elle peut en produire une quantité q, arbitraire, et que l'on
supposera susceptible de varier continûment dans R On supposera que l'entreprise vend toute
la quantité produite. La vente du bien lui rapporte pq, où p > 0 est le prix unitaire du bien.
Mais la production d'une quantité q > 0 lui coûte C(q). La fonction C, dite fonction de coût,
est supposée C 1 sur lR.';_, convexe croissante, et on la suppose prolongée par continuité en 0 en
posant C(0) = limq---;O C(q) (ce que l'on appelle le coût fixe). La fonction C étant convexe, C'
est croissante; nous supposerons même que C' est strictement croissante, ce qui va simplifier
légèrement la discussion qui suivra.

Lorsqu'elle produit une quantité q, l'entreprise fait donc le profit n(q) = pq - C(q). Il est
donc naturel qu'elle cherche à rendre maximum ce profit. On constate que la fonction n est
concave, ainsi une quantité q * E JR.';_ réalise le maximum si et seulement si n' (q *) = 0,
c'est-à-dire si q* E c- 1 ({p}). Rappelons que n'est décroissante. Il y a donc trois situations
possibles (du fait que n'est strictement décroissante).
- limq---;oC'(q)?,: p. Ici le choix optimal est q* = 0 (l'entreprise ne produit rien).
- limq--->+oo C'(q) ~ p. Ici il n'y a pas de choix optimal, le profit est strictement croissant.
- Dans les autres situations, le choix optimal est l'unique élément de l'ensemble c- ({p})
1

(c'est la situation usuelle en microéconomie).

L'hypothèse de convexité des fonctions de coût est très souvent vérifiée en pratique. En re-
vanche, la représentation continue des quantités comme q est certainement une approxima-
tion : il est difficile de produire 5678,547653 voitures ! Cette approximation est faite pour
plusieurs raisons. L'une est bien entendu la possibilité de faire des calculs de maximisation
plus aisément. Pour une autre explication, il faut penser à une entreprise fabriquant des objets
en grande quantité. Ainsi, si l'on pense à une entreprise fabriquant des clous par millions, et
si l'unité de compte est le million de clous, le chiffre pourra atteindre la sixième décimale.
Reprenons cet exemple et imaginons que le calcul donne la valeur optimale q * = 12, 14134567
millions de clous (soit 12141345,67 clous). Comme 7î est décroissante sur [0;q] et croissante
après (du fait que 7î est concave), on vérifie immédiatement que la quantité optimale sur N
est 12141345 clous ou 12141346 clous, ces deux solutions sont pratiquement les mêmes. Le
calcul au moyen de nombres réels est donc parfaitement licite, et conduit à une solution très
satisfaisante.
889

Cinquièm e partie
CALCUL DIFFÉREN TIEL

ETTE très courte partie contient seulement deux chapitres, tous deux d'introduction

C à de vastes constructions mathématiques : le calcul différentiel proprement dit, et les


équations différentielles. Ces deux constructions reposent sur la notion de dérivation
des fonctions, dans le cas général des fonctions vectorielles à plusieurs variables, c'est-à-dire
ici 1 des fonctions de ]Rn dans lRm avec n EN* et m E N*.
Reprenons une nouvelle fois l'idée de dérivée pour les fonctions à une variable. Étant donnée
une fonction f de lR dans JR, et un point a E JR, on définit d'abord le taux d'acroissement 'ta
de f au point a par
'ta(x) = f(x) - f(a)
x-a
pour x E lR \ {a}. Le nombre dérivé f'(a) de f au point a est par définition la limite du taux
'ta au point a, lorsqu'elle existe. On en déduit alors que
f(a + h) = f(a) + f'(a) h+ o(h)

où par définition le terme o(h) désigne une fonction de la forme h H hE(h), avec E de limite
nulle en O (en fait ici nulle en O et continue au point 0). Il apparaît donc deux nouvelles
fonctions : daf: h H f'(a)h, que l'on appelle la différentielle de f au point a, et Îaf: h H
f(a) + daf(h). Cette dernière est construite de telle manière que l'écart
~(h) = f(a + h) - Taf(h)

soit négligeable devant h au point O. C'est une fonction affine, somme d'une constante et
d'une fonction linéaire, et on voit facilement que c'est la seule fonction affine à posséder cette
propriété. On l'appelle application affine tangente à f au point a.
Nous avons rencontré une première généralisation de cette idée lorsque nous avons construit
les polynômes de Taylor de f au point a, qui permettent d'approcher f( a+ h) avec un écart
du type o(hn), pour n;::: 2.
Nous allons donner au chapitre 30 une autre généralisation, plus proche de l'idée initiale,
qui consiste simplement à la transposer de la manière la plus naturelle possible au cas des
fonctions de plusieurs variables. Limitons nous au cas d'une fonction f de ]Rn dans lR. Le point
a E ]Rn étant donné, il s'agit alors de trouver une fonction affine Ta(f) : ]Rn-+ JR, somme de
f(a) et d'une fonction 2 linéaire daf: ]Rn-+ JR, telle que l'écart ~(h) = f(a + h) - Taf(h)
soit négligeable devant h au point O. Mais nous n'avons pas encore défini cette dernière notion
lorsque h E lRn, l'idée est simplement de demander que l'écart soit négligeable devant

11h11 = ✓hf+···+h~
lorsque 11h11 tend vers O. Ainsi cette définition prolonge celle que nous avons donnée dans
le cas n = 1. Il n'est pas toujours possible de trouver une telle fonction da(f), on dit que

1
Il est possible de définir la dérivée de fonctions de icn dans icm, ou même de fonctions dont les variables sont
éléments d'espaces vectoriels de dimension infinie, mais nous ne nous en occuperons pas dans cet ouvrage.
2
Une forme linéaire, dans ce cas.
890

f est différentiable au point a lorsque elle existe. Lorsque f est différentiable au point a,
sa différentielle d 0 f décrit donc au premier ordre, et à une constante près, la fonction f au
voisinage de a.
Dans le cas des fonctions à une variable, ceci permettait d'étudier les variations de la
fonction : croissance ou décroissance, suivant le signe de la fonction dérivée. Ici on peut encore
parler d'une fonction dérivée, qui a tout point a où f est différentiable associe la différentielle
d 0 f, elle est donc à valeurs dans l'espace des formes linéaires L(!Rn, IR) (signalons que L(IR, IR)
s'indentifie à IR, ce qui permet de retrouver la fonction dérivée usuelle dans le cas n = 1). Mais
cette fonction ne peut rendre exactement les mêmes services que dans le cas des fonctions à
une variable: la question du sens de variation de f n'a pas vraiment d'intérêt puisqu'il y a une
infinité de directions suivant lesquelles la variable peut se déplacer (toutes les droites issues du
point a). On pourrait cependant, lorsqu'une courbe 3 est donnée dans !Rn, étudier le sens de
variation de la restriction à f à cette courbe, mais cela n'a pas vraiment d'intérêt en général.
Le calcul différentiel s'oriente plutôt dans une autre direction. Notons d'abord que ce qui
vient d'être dit pour les fonctions de !Rn dans IR se transpose sans changement au cas des
fonctions à valeurs dans !Rm, étant entendu que d 0 (f) est dans ce cas une application linéaire
de !Rn dans !Rm, et que le terme o(h) est lui aussi à valeurs dans !Rm. Notons aussi que tout
ceci n'est rendu possible que par les constructions que nous avons introduites dans la partie II.
Le but du calcul différentiel est, dans un premier temps, de mieux comprendre la structure
de l'égalité f( a+ h) = f( a)+ d 0 (f) + o(h) et en particulier du terme o(h). La question la plus
naturelle étant de savoir s'il est possible de supprimer ce terme, en se livrant à des manipula-
tions sur les variables, c'est-à-dire en procédant à des changements de variables bien compris.
La réponse est affirmative dans le cas ou n =met où la différentielle d 0 f est bijective4, c'est
l'objet du théorème d'inversion locale qui affirme qu'il est possible de« tordre »légèrement les
coordonnées au voisinage du point a pour qu'il soit possible de supprimer le o et pour que
l'application f se comporte dans ces nouvelles coordonnées exactement comme une application
linéaire. Dans le cas des fonctions de IR dans IR, ceci veut simplement dire qu'au voisinage
d'un point en lequel le nombre dérivé n'est pas nul, il est possible de changer la coordonnée
de l'ensemble de départ, par exemple, pour que le graphe de la fonction devienne une droite,
ce qui se comprend assez facilement. Nous ne donnerons cependant pas ici le théorème d'in-
version locale exactement sous cette forme, nous verrons simplement (et sans démonstratio n
complète) qu'au voisinage de tout point où la différentielle d'une fonction est bijective, la
fonction elle même est aussi bijective.
Dans le cas plus général des fonctions de !Rn dans !Rm avec n f= m, il faut modifier un
peu la question précédente pour la rendre plus claire, et se demander comment interpréter
le fait qu'il soit possible de supprimer le terme o(h) dans l'égalité fondamentale. On le fait
en remarquant que dans notre énoncé précédent (n = m), dire que f est localement une
bijection revient à dire que dans un voisinage du point image f (a), tout point admet un
unique antécédent par la fonction f. Il est donc légitime de se demander si dans le cas où
n f= m il est encore possible de décrire simplement l'image inverse f- 1 ({y}), que nous avons
appelée la fibre au-dessus de 1}. On s'aperçoit facilement que cette question n'est pertinente
que dans le cas où m 2:: n. Dans ce cas, sous certaines conditions que nous préciserons,
il est possible de montrer que la fibre f- 1 ({y}) est le graphe d'une fonction entre espaces
convenablement choisie. Cette nouvelle fonction, introduite au moyen de la résolution de
l'équation f(x) = 1J (équation des fibres) est appelée fonction implicite, et le théorème que

3
Notion qui reste à définir.
4
Et ou la fonction dérivée est continue, autre notion à définir.
891

nous évoquons s'appelle le théorème des fonctions implicites. Ce résultat est à rapprocher du
problème des systèmes linéaires, dans le cas où ils ont plus d'inconnues que d'équations. On
choisit alors un système d'inconnues auxiliaires, par rapport auquel les inconnues principales
s'expriment au moyen d'une application linéaire. Cette application est, dans ce cas très simple,
la fonction implicite que nous avons décrite plus haut. Et la possibilité de supprimer le terme
o dans l'égalité fondamentale au moyen d'un changement de variables signifie que ce même
changement ramène l'équation f(x) = y à un système linéaire de la forme que nous venons de
décrire.
La manipulation de ces théorèmes, ainsi qu'une bonne compréhension de leur nature, de-
mande une certaine familiarité avec les nouvelles notions que nous allons introduire. Cette fa-
miliarité demande à son tour l'étude détaillée d'une grande variété de situations et d'exemples.
C'est pourquoi une grande part du chapitre 30 sera consacrée à l'étude des courbes planes,
2
c'est à dire des images des fonctions de li dans 11 , qui permettront d'appréhender plus
concrètement les difficultés propres à cette nouvelle théorie, que nous ne présenterons ici que
de manière très illustrée. Nous remettrons aux cours de 12 et 13 une étude beaucoup plus
fine des théorèmes et de leurs applications.
Le chapitre 31 est lui aussi basé sur la possibilité de dériver des fonctions, dans la mesure
où il devient alors naturel d'envisager des équations fonctionnelles, qui font intervenir à la
fois les fonctions et leurs dérivées. Ces équations s'appellent des équations différentielles. Elles
ont été essentiellement inventées par Newton pour la résolution du problème de l'évolution
des planètes posé par Kepler. De manière plus générale, la théorie des équations différentielles
s'est souvent nourrie de problèmes issus du monde physique, et par là même est l'un des lieux
privilégiés de l'interaction entre mathématiques et physique.
Plus précisément, une équation différentielle est une écriture de la forme

F(t, f(t), f'(t), ... , f(nl(t)) =0 (El

où Fest une fonction de 11n+l dans li, vérifiant certaines conditions de régularité, et où f est
la fonction inconnue, définie sur un intervalle de li et à valeurs dans li, f', ... , f(n) désignant
ses dérivées successives. Résoudre cette équation, c'est trouver toutes les fonctions f définies
sur un intervalle I de li et n fois dérivables sur cet intervalle, telles que pour tout t E I,
l'équation F(t, f(t), f'(t), ... , f(nl(t)) = 0 soit satisfaite.
Il existe de nombreux problèmes physiques donnant lieu à des équations de cette forme.
Si l'on considère un point matériel de masse m dans l'espace soumis à l'action d'une force
cp dépendant de sa position, et si le référentiel dans lequel on repère la position du point
est Galiléen, la dérivée seconde de cette position x(t) par rapport au temps vérifie l'équation
fondamentale de Newton
mx"(t) = cp(x) (N)

qui est bien de la forme (E). Par exemple, l'évolution d'un point matériel de masse m soumis
à l'attraction d'un point matériel fixe de masse M situé au point x 0 sera décrite par l'équation

GM(x-xo)
x"(t) =
llx(t)-xo(t)ll 3

que l'on appelle équation de Kepler. Il est très remarquable que l'on sache résoudre cette
équation, qui montre que les trajectoires suivies par le point matériel sont des coniques, ce
que nous verrons en détail dans le cours de 12. Ces solutions s'avèrent être avec une bonne
précision conformes aux mouvements observés des planètes ou des comètes (ellipses, paraboles
ou hyperboles, suivant l'énergie).
892

Il existe en fait extrêmement peu d'exemples d'équations différentielles qu'il est possible
de résoudre explicitement au moyen de fonctions élémentaires. Le meilleur exemple que l'on
puisse donner est certainement celui du problème des trois corps, qui décrit l'évolution de
trois particules dans l'espace soumises à l'interaction gravitationnelle. Ce problème a une
longue histoire. Après des tentatives infructueuses de résolution jusqu'à la fin du XIXe siècle
(mais qui ont malgré tout ouvert la voie à de très importantes avancées mathématiques) le
mathématicien Henri Poincaré a donné une première preuve du fait qu'il est impossible de le
résoudre (dans un sens qu'il convient de préciser, et qui n'est pas exactement le même que
celui que nous avons posé comme définition).
L'exemple le plus important d'équations différentielles qu'il est possible de résoudre est
celui des équations linéaires à coefficients constants, comme on pouvait peut-être s'y attendre
eu égard de la simplicité des applications linéaires que nous avons déjà maintes fois signalée.
De manière plus précise, une équation de la forme (E) est dite linéaire homogène à coefficients
constants si l'application F est une forme linéaire de !Rn dans IR, ne dépendant pas de son
premier argument t. L'équation (E) a dans ce cas la forme

et on montre qu'il est possible d'expliciter ses solutions au moyen de fonctions élémentaires.
On peut aussi résoudre par des moyens semblables les équations de la forme

(l2)

lorsque g est une fonction continue. L'objet du chapitre 31 est d'exposer les bases de la
résolution de telles équations lorsque n = 1 ou n = 2, ainsi que d'envisager le cas où les
coefficients Un dépendent du temps.
Nous avons inclus ce chapitre dans la partie d'introduction au calcul différentiel, ce qui
correspond d'ailleurs à la tradition. Ceci peut paraître un peu abusif, puisque les dérivées
d'ordre n d'une fonction d'une variable réelle ont été définies et étudiées au chapitre 29. Il
aurait donc été possible d'étudier ces équations dans la partie d'analyse. Mais il faut tenir
compte du fait que, même si cela n'est pas explicitement signalé, ces équations différentielles
linéaires apparaissent en général dans les problèmes, comme approximations locales au premier
ordre d'équations du type (El, dans lesquelles la fonction F (ou la fonction partielle obtenue
en fixant la première variable) est remplacée par sa différentielle en un point donné.
Citons deux exemples. L'équation du pendule simple, repéré par son angle par rapport à
la verticale, est de la forme suivante

0"(t) + sin 0(t) = 0,


(où nous avons omis les constantes physiques). Sous cette forme, il n'est pas possible d'en
donner une solution explicite au moyen des fonctions usuelles, mais au moyen des fonctions
dites elliptiques. Lorsque l'angle 0 est supposé très petit, on est tenté de remplacer la fonction
sin par sa différentielle d 0 sin: 0 H 0 calculée au point O. L'équation devient alors 0" + 0 = 0,
et il est possible de la résoudre très facilement. On peut montrer, mais cela nécessite une étude
de la fonction énergie du problème, que les solutions obtenues sont encore valables au premier
ordre lorsque l'on considére l'équation initiale. Ceci conduit au théorème dit de l'isochronisme
des petites oscillations, puisqu'on voit facilement (cela sera montré dans le chapitre 31) que
les solutions de l'équation 0" + 0 = 0 ont une période indépendante de l'amplitude.
Un autre exemple nous est aussi fourni par la physique, il s'agit de l'étude des circuits
R, l, C, dont la mise en équation conduit à des équations différentielles linéaires d'ordre deux
893

(c'est-à-dire de la forme (ll) ou (l2) avec n = 2), éventuelleme nt avec un second membre g
périodique. Ces constituants R, l, C (résistance, impédance, condensateur ) sont à la base de
la construction des appareils électroniques usuels (bien qu'ils apparaissent maintenant inté-
grés dans des ensembles énormes de constituants de taille extrêmement réduite, et qu'ils ne
soient pas les seuls à intervenir dans ces complexes). Supposons néanmoins par exemple qu'un
système électronique soit formé de ces constituants, par exemple une sonnerie de téléphone
portable (là encore, il est possible de la construire avec des composants R,L,C, mais les mé-
thodes actuelles permettent de le faire beaucoup plus commodémen t). Lorsqu'un tel système
fonctionne par exemple avec une pile de 4,5 V, on entend un air familier. On peut alors se
poser la question de savoir ce qui se passe si l'on branche le système sur une source de tension
beaucoup plus élevée (par exemple 220 V continus). Il est clair pour chacun que le système
va se détériorer. Or si ce système était linéaire, on entendrait le même air, simplement joué
beaucoup plus fort. Même sans aller jusqu'à la détérioration , on peut simplement multiplier la
tension par 4, et on s'aperçoit rapidement que les effets sont beaucoup plus complexes qu'une
simple multiplicatio n de l'intensité sonore. L'explication de ce phénomène tient là encore au
fait que la mise en équation du système sous forme d'équations différentielles linéaires se fait
au moyen d'une approximatio n d'une fonction très complexe par sa différentielle au voisinage
du point correspondan t au régime de fonctionneme nt habituel du circuit.
Il faut donc voir ce chapitre 31 comme une introduction à une théorie plus vaste, dans
laquelle la résolution explicite des équations n'est plus la seule source de questions. On se
pose par exemple aussi le problème de l'existence de solutions vérifiant certaines conditions
initiales, de leur comportemen t en temps fini ou de leur évolution asymptotique . Cette théorie
sera développée dans les cours de 12 et surtout de 13, elle est elle-même à l'origine d'une
théorie plus vaste et encore en plein développement, celle des systèmes dynamiques.
Chapitre 30
INITIATION AU CALCUL DIFFÉRENTIEL

OMME on l'a montré dans les chapitres précédents, il y a une classe de problèmes

C particulièrement bien comprise en mathématiques, ce sont les problèmes linéaires (ou


encore affines). On sait par exemple parfaitement déterminer l'ensemble des solutions
d'un système linéaire : il est soit vide, soit la somme d'une solution particulière et du sous-
espace vectoriel obtenu en résolvant le système homogène associé. En d'autres termes, si f est
une application linéaire de JRP dans ]RQ (où p et q sont dans N*), et si a E IRq, l'équation

f(xl- a= 0 (El
a pour ensemble de solutions Y= a+ Ker f, où a est une solution particulière quelconque de
(El. Cet ensemble est ce que l'on appelle un espace affine, il s'obtient à partir du sous-espace
vectoriel Ker f par translation au moyen du" vecteur a. Les exemples usuels d'espaces affines,
en dimension p = 2 ou p = 3, sont des points, des droites, ou des plans. Ils sont donc faciles
à déterminer et à décrire : il suffit de deux points pour définir une droite, et de trois points
pour définir un plan.
Notons que l'équation (El se met sous la forme F(xl = 0, avec F(xl = f(x) - a, F est
donc une application affine. Nous allons dans ce chapitre généraliser ce problème. Notre but
est de donner les premières bases pour résoudre des équations de la forme F(xl = 0, quand
F: JRP--, ]RQ n'est plus de la forme affine précédente. Par exemple, on peut essayer de résoudre
l'équation obtenue lorsque p = 2 et q = 1, avec

F(xl=xf+x~-1.
Dans ce cas on sait bien que l'ensemble des solutions est le cercle de centre O et de rayon 1.
Cet ensemble est d'une nature plus complexe que les ensembles de solutions précédents, c'est
un objet «courbe», alors que les ensembles précédents étaient des objets «droits». Le cercle
est cependant encore facile à décrire. Mais si nous considérons la fonction

F(xl = xf + x~ - 3x1x2
l'ensemble des solutions est nettement plus difficile à étudier, il s'agit du Folium de Descartes.
On voit donc qu'on peut, lorsque la fonction F n'est plus affine, avoir à affronter des
situations beaucoup plus complexes que celles que nous connaissons.
L'idée générale du calcul différentiel est, comme nous l'avons fait pour les fonctions d'une
variable réelle, d'approcher les fonctions générales par des applications linéaires (ou plus exac-
tement affines), au voisinage de certains points. Nous avons dans ce but introduit la notion
de nombre dérivé en un point pour une fonction à une variable, défini comme la limite du
taux d'accroissement de la fonction en ce point (lorsque cette limite existe), et permettant
de définir la meilleure approximation affine de cette fonction au voisinage du point considéré.
Nous allons dans ce chapitre présenter la notion de dérivée de fonctions ayant plusieurs va-
riables, c'est-à-dire définies dans JRP avec p ~ 2, et nous verrons que comme pour les fonctions
à une variable ces dérivées permettent de définir les meilleures approximations affines d'une
fonction non linéaire au voisinage d'un point.
Nous ne développerons pas ici toute la théorie du calcul différentiel, elle sera étudiée plus
complètement dans les cours de 12, et surtout de 13. Il est en effet indispensable d'aborder
896

cette théorie de manière progressive, au moyen de beaucoup d'exemples, et de les travailler


beaucoup pour qu'ils deviennent intuitifs. Nous étudierons donc les exemples les plus simples
dans ce chapitre : les courbes du plan, qui sont définies (par exemple) par une équation de la
forme F(x) = 0, lorsque la fonction F : IR. 2 -t IR. vérifie certaines conditions de « régularité »,
ou par une équation paramétrique, c'est-à-dire qu'elles se présentent comme l'image d'une
fonction de IR. dans IR. 2 assez régulière. Les courbes de l'espace, définies (par exemple) par
une équation G(x) = 0 avec G : IR. 3 -t IR. assez «régulière», et les surfaces de l'espace
sont elles aussi redevables d'études semblables, mais elles seront ici simplement évoquées, et
étudiées plus complètement dans les cours de 12 et 13. Par ailleurs, comme il s'agit d'un
chapitre d'initiation au calcul différentiel, nous ne donnerons pas ici les preuves complètes
des théorèmes centraux, mais nous attacherons plutôt à en faire comprendre la structure et
l'utilisation.

FIGURE 30.1. Le Folium de Descartes

Une courbe du plan ou de l'espace est un objet « de dimension 1 ». Bien que la notion
de dimension pour des objets qui ne sont pas des espaces vectoriels n'ait pas été définie (elle
ne le sera pas avant le cours de 13 ou Ml), on peut néanmoins lui accorder le sens intuitif
usuel : au voisinage de chacun de ses point, une courbe est bien représentée par une "droite
tordue». Une surface de l'espace est un objet « de dimension 2 » : au voisinage de chacun de
ses points elle ressemble à un « plan tordu». Nous allons maintenant rappeler introduction
les différents modes de représentation des droites et des plans, qui serviront de guide à toute
notre discussion ultérieure.
Droites du plan. On peut représenter une droite ~ du plan de trois manières différentes.
1) Par une équation dite implicite (ou cartésienne):~ est l'ensemble des solutions (x, y) E IR. 2
d'une équation de la forme ax + by + c = 0 avec (a, b)-=/- (0,0).
2) Par une représentation paramétrique de la forme ~ = {(x0 +tu,, Yo + tu2), t E IR.}, avec
(xo, Yol E IR. 2 et (u,, u2) E IR. 2 \ {O}.
897

2
3) Par une représentation en graphe: t;g est l'ensemble des points (x,y) de IR vérifiant
2
y = <XX+ (3 (graphe au-dessus de l'axe des x), ou t;g est l'ensemble des points (x, y) de IR
vérifiant x = yy + ô (graphe au-dessus de l'axe des y), avec <X, (3, î' et b dans R
Il est bien entendu possible de passer de l'une de ces représentations à l'autre sans difficulté.
Le fait marquant est que chacune de ces représentations est valable pour la totalité de l'objet.
Nous verrons que ceci ne subsiste pas dans le cas des courbes.
Droites de l'espace. Calquons notre étude sur la précédente. On peut représenter une droite
t;g de l'espace de trois manières différentes.
1) Par une équation implicite (ou cartésienne) : t;g est l'ensemble des solutions de l'équation
F(x, y, z) = (0, 0), avec F(x, y, z) = (ax + by + cz + d, a'x + b'y + c'z + d') (où les vecteurs
(a, b, c) E IR 3 et (a', b', c') E IR 3 sont non colinéaires). Cette représentation fait apparaître t;g
comme l'intersection de deux plans non parallèles.
2) Par une représentation paramétrique: çg = {j(t) 1 t E IR}, avec

j(t) = (x 0 +tu,, 1Jo + tu2, zo + tu3),


où u = (u1 , u 2, u 3) E IR 3 \ {O} et (x 0 , y 0 , z 0 ) E IR 3. t;g apparaît alors comme la droite passant
par (xo, 1Jo, zo) et de vecteur directeur u.
3) Par une représentation en graphe: t;g est l'ensemble des points (x,y,z) de IR 2 vérifiant
par exemple les relations y = <XoX + ex,, z = f3ox + (3,, dans le cas d'un graphe au-dessus
de l'axe des x. En effet, t;g est alors le graphe de l'application <!> de IR dans IR 2 définie par
<J>(x) = (exox + ex,, f3ox + (3,).
Il est encore possible de passer de l'une de ces représentations à l'autre sans difficulté,
et chacune de ces représentation est globale, c'est-à-dire valable pour la totalité de l'objet.
Passons maintenant au cas des plans dans l'espace.
Plans dans l'espace. On peut représenter un plan f!lJ dans l'espace de trois manières diffé-
rentes.
1) Par une équation implicite : f!lJ est l'ensemble des solutions de l'équation F(x, y, z) = 0,
avec F(x, y, z) = ax + by + cz+ d (avec (a, b, c) E IR3 \ {0}).
2) Par une représentation paramétrique: f!lJ = {j(s, t) (s, t) E IR 2}, avec
1

les vecteurs (u1, u2, u 3) E IR 3 et (v 1 , v 2, v 3) E IR 3 étant non colinéaires.


3) Par une représentation en graphe: par exemple f!lJ est l'ensemble des points (x,y,z) de
IR 3 qui vérifient l'équation z = <XX+ (3y + y, avec (ex, (3, y) E IR3, dans le cas d'un graphe
au-dessus du plan des coordonnées x, y.
Là encore, on peut faire les mêmes remarques que dans le cas des droites.
Le cas des courbes et surfaces est assez analogue, mais présente quelques difficultés sup-
plémentaires. On pourra toujours définir localement (c'est-à-dire au voisinage de l'un de ses
points) une courbe ou une surface par l'une des trois représentations précédentes, une re-
présentation implicite ou cartésienne, une représentation paramétrique (ou paramétrisation),
ou une représentation en graphe. Mais les représentations obtenues ne seront plus toujours
globales, elles devront être modifiées en fonction de l'endroit de la courbe ou surface qu'on
898

essaie de décrire. De plus, alors que les fonctions intervenant dans les représentations précé-
dentes étaient toujours affines, les fonctions que nous aurons à manipuler seront parfaitement
générales (polynômes, fonctions transcendantes, etc).
Considérons l'exemple du cercle 'ef' de centre O et de rayon 1 dans le plan. On le définit
comme l'ensemble
'ef' = {(x, y) E JR.21 x 2 +y 2 = l}.
Il possède donc une équation implicite de la forme F(x, y) = 0, avec F(x, y) = x 2 + y 2 - 1.
Dans ce cas, cette représentation est globale, une seule équation donne tout l'objet. Le cercle
possède aussi une représentation paramétrique

'(f' = {(sint,cost) 1 t E JR.}.

Mais il faut se rendre compte que la situation est ici beaucoup plus complexe que dans le cas
des droites et plans. En premier lieu, alors que le passage d'une représentation à l'autre était
presque immédiat dans le cas des droites, dans le cas du cercle il est nécessaire d'introduire les
fonctions sin et cos, dont l'étude est beaucou plus difficile que celle des fonctions linéaires, ce
sont des fonctions transcendantes dont la définition complètement achevée ne sera obtenue que
dans le cours de L2, grâce à l'utilisation des séries et de l'exponentielle complexe. En second
lieu, on obtient encore une représentation globale du cercle, mais il faut prendre garde au fait
que le même point du cercle est obtenu une infinité de fois, puisque la fonction t H (sin t, cos t)
est ln-périodique.
Enfin, la représentation en graphes peut aussi être obtenue, mais elle n'est cette fois plus
globale, puisque le cercle est la réunion de deux graphes au-dessus de l'axe des x, l'un situé
dans le demi plan lR. x JR.+, et l'autre dans le demi-plan lR. x JR.-. De même, 'ef' est la réunion
de deux graphes au-dessus de l'axe des y. Dans ce cas, la représentation en graphe est donc
seulement locale.
L'objet du calcul différentiel est de donner les outils pour étudier des situations analogues
de manière complètement générale. Il est très remarquable que toute la théorie repose sur le
développement d'une seule idée, celle de dérivée ( ou différentielle) d'une fonction à plusieurs
variables.
Pour terminer cette introduction, et pour développer l'intuition des phénomènes que nous
allons considérer, nous allons essayer de donner une équation de la tangente en un point a
du cercle 'ef', en utilisant successivement ses trois représentations. Nous choisirons le point
a = {1/ \l'l, 1/ v'l). On note que la tangente en a dépend seulement du comportement de la
courbe 'ef' dans un voisinage de a, on peut donc se limiter à la partie supérieure 'ef' n (JR. x lR.+)
pour déterminer la tangente au point a.

FIGURE 30.2. Le cercle et la tangente en a


899

1) Commençons par la représentation en graphe, qui est la plus commode pour déterminer
les tangentes. La partie supérieure du cercle admet la représentation en graphe y = cp(x),
avec cp: x H ✓ 1 - x 2 . Alors l'équation de la tangente est donnée par

y - cp(l /v'l) = cp' ( 1/v'l) ( x - 1/v'l) ,

soit finalement y = -x + v'l. Notons que nous avons là obtenu une représentation en graphe
de la tangente, ce qui est directement lié au fait que nous avons utilisé une représentation en
graphe de notre cercle.
2 2
2) On peut aussi représenter le cercle par l'équation implicite x + y = 1. Plaçons nous au
point a= (x 0 , y 0 ) et regardons à quelle condition un point très proche de a, de coordonnées
(x 0 +<5x, y 0 +<5y) (où <5x et ôy sont des réels supposés très petits), appartient encore au cercle. 0
C")
Ce nouveau point doit donc vérifier l'égalité ..d
ü
2
(xo + ôx) 2 + (yo + ôy) = 1.

En développant et tenant compte de l'égalité X6 + 1J6 = 1 (exprimant que a E '#5'), on obtient

Raisonnons maintenant de manière intuitive. En négligeant les termes carrés, on trouve x 0 <5x+
1Joô1J = 0, soit
Xo
ôy = --ôx = -ôx.
1:Jo
Cette expression est certainement presque « correcte »lorsque ôx et ôy sont extrêmement
petits, puisqu'alors leurs carrés sont totalement négligeables devant ôx et ôy. L'idée est sim-
plement de considérer l'équation que nous avons obtenue comme celle d'un objet défini globa-
lement, qui n'approchera le cercle qu'au voisinage de notre point a initial. Il suffit pour cela
de remplacer ôx par x - x 0 et ôy par y - 1:Jo, et de considérer que x et y varient dans lR
tout entier, en omettant de leur imposer la restriction d'être proches de x 0 et y 0 . On obtient
alors l'équation y -1/v'l = -(x-1/v'l), soit y= -x + v'l, ce qui est bien l'équation de la
tangente que nous avons déterminée grâce à la représentation en graphe.
3) Enfin, on aurait pu représenter paramétriquement le cercle, comme l'image j(JR), où
j : t H (cos(t),sin(t)). Le point a qui nous intéresse est j(n/4). Si l'on calcule j'(n/4) =
(-1/v'l, 1/v'l), on constate que j'(n/4) est un vecteur directeur de la droite que nous avons
obtenue. Il suffit alors de former la représentation paramétrique

(1/v'l-(1/v'l)t, 1/v'l-(l/v'l)t)

de la droite de vecteur directeur j'(n/4) passant par le point a pour obtenir tangente à '#5'
au point a. On vérifie bien que cette droite est la même que celle que nous avons déterminée
dans les deux études précédentes.
Le point remarquable dans ce qui précède est que si l'on considère l'une des trois repré-
sentations possibles pour le cercle, la tangente sera naturellement déterminée dans la même
représentation. Le calcul différentiel nous donnera tous les outils pour manipuler convenable-
ment toutes les situations que nous venons d'évoquer rapidement. Soulignons une fois encore
qu'il s'agit d'une matière délicate, qui nécessite l'étude d'un très grand nombre d'exemples
pour s'en construire une bonne représentation.
900

I. ARCS PLANS ET COURBES PLANES


Comme nous l'avons vu en introduction, la représentation des courbes sous forme de graphe
est insuffisante. Nous allons commencer cette initiation au calcul différentiel par l'étude de
courbes planes définies par une représentation paramétrique, c'est-à-dire des courbes définies
comme images de fonctions définies sur une partie de IR et à valeurs dans IR 2 . Nous en avons
déjà rencontré un exemple, le cercle de '6'(0, R) centre O et de rayon R, défini comme l'image
de la fonction jR : IR ----, IR 2 donnée par jR( t) = (R sin t, R cos t) ; en d'autres termes '6'(0, R) est
l'image de l'ensemble IR par l'application h : '6'(0, R) = jR(IR).
Nous allons voir qu'il est aussi facile de donner une représentation paramétrique des el-
lipses. Rappelons d'abord que si a> 0 et b > 0, l'ellipse 8'(a, b) qui a pour grand axe l'axe
des abscisses et pour petit axe celui des ordonnées, et qui a pour grand rayon a et pour petit
rayon b, est par définition la courbe d'équation cartésienne
x2 112
a2 + b2 = 1.
Nous voulons en trouver une représentation paramétrique, c'est-à-dire une application J de IR
dans IR 2 telle que J(IR) = 8' ( a, b). Notons cjJ l'application de IR2 dans IR 2 définie par cjJ (x, 11) =
(x, ~11), c'est une bijection de IR 2 dans IR 2, de réciproque donnée par cjJ- 1 (u,v) = (u, iv).
Alors l'ellipse 8'(a, b) est l'image du cercle '6'(0, a) par l'application cjJ. Pour le voir, montrons
d'abord que cjJ('&'(0, a)) c 8'(a, b). Soit (x, 11) E '6'(0, R), alors x 2 +11 2 = a 2. Posons cjJ(x, 11) =
(x, ~11) = (X, Y). Alors
x2 y2 x2 2b2 x2 2
- + - = - +11- - = - +11- =1
a2 b2 a2 b2 a2 a2 a2
ce qui montre que cjJ(x, 11) E 8'(a, b), et donc que cjJ('&'(0, a)) C 8'(a, b). Réciproquement,
si (u,v) E 8'(a,b), et si (U,V) = cjJ- 1 (u,v) = (u,iv), on voit de la même manière que
U 2 + V 2 = a 2 , ce qui montre que cjJ- 1(u, v) E '6'(0, a), donc que cjJ- 1 (8'(a, b)) c '6'(0, a). On
en déduit par composition par cjJ que 8'(a, b) C cjJ('&'(0, a)), et on obtient l'égalité annoncée:
8'(a, b} = cjJ('&'(0, a)).
Il en résulte en particulier que l'ellipse 8'( a, b) a pour représentation paramétrique la com-
posée par cjJ de la représentation paramétrique précédente du cercle, c'est-à-dire l'application
J = cjJ o ju: IR----, IR 2 définie par
J(t) = (a sin t, b cos t).
En effet, J(IR) = cjJ o ju(IR) = (cjJ('&'(0, a)) = 8'( a, b), ce que nous voulions obtenir.
Notre but dans cette partie est de montrer comment étudier des courbes définies au moyen
d'équations paramétriques plus compliquées.

I.1. Arcs plans et courbes planes


Nous nous intéressons donc maintenant aux images des fonctions définies sur des parties de
IR, et à valeurs dans IR 2 .

1. 1. 1. Définitions générales

Nous allons commencer par étudier les propriétés des fonctions à valeurs dans IR 2 , et nous
allons d'abord leur donner un nom spécifique.
901

Définition 30.1. Un arc plan est une application y définie sur un intervalle I (non réduit
à un point) de JR, et à valeurs dans JR 2 . Une courbe paramétrée plane est l'image d'un arc
plan. La courbe y(I) est dite courbe représentative de y.
Pour bien mettre en évidence le domaine définition de l'arc considéré, on note parfois cet
arc ( I, y), bien que cette écriture soit redondante (la donnée d'une fonction sous-entend celle
de son ensemble de départ et de son ensemble d'arrivée).
Il est équivalent de se donner un arc plan y de I dans JR 2 et de se donner ses deux
fonctions composantes, c'est-à-dire les deux fonctions Yx et Yy de I dans JR 2 qui vérifient
y(t) = (Yx(t), yy(t)) pour tout t dans I. On notera parfois simplement x(t) = Yx(t), -y(t) =
Yy(t)) ces composantes, lorsqu'il n'y a pas d'ambiguité. Ainsi, chacune des fonctions x, y
est une fonction d'un intervalle I de lR dans R Il arrive aussi qu'on adopte une notation en
colonne pour les arcs, on écrit alors

y(t) = (Yx(t)) = (x(t)) .


Yy(t) -y(t)

On notera en général r = y(I) la courbe représentative de y .

. \\\('lJÎÎUll L'arc n'est pas la courbe


Il ne faut pas confondre l'arc (I, y) avec son image y(I), que l'on appelle sa courbe
représentative. Un arc est une fonction, alors qu'une courbe paramétrée est une partie
de JR 2 , image d'un arc.

EXEMPLE 30.2. Si Fest l'application de lR dans lR définie par F(t) = (cos(t),sin(t)), les
trois arcs ([0,2n), F l[o,2 niL ([0,4n], F l[o,4 nil et ([0,2n], (t H F(-t)) sont de même image mais
ils sont différents. Dans une interprétation de nature cinématique, on voit par exemple que
le premier parcourt le cercle une seule fois dans le sens direct, le second deux fois dans le
même sens, enfin le troisième parcourt le cercle une seule fois dans le sens indirect.

EXEMPLE 30.3. Soit I un intervalle de lR et f une fonction de I dans R Alors on peut


définir un arc plan y de I dans JR 2 par y(t) = (t, f(t)). La courbe représentative de y est
alors le graphe de f
r = y(I) = {(t, f(t)) t E I} = Graphe(f).
1

1.1.2. Limite, continuité, dérivabilité d'un arc plan

Cette équivalence entre la donnée d'un arc et celle de ses composantes permet de définir très
simplement les notions de limite, continuité et dérivabilité des arcs. Rappelons que si I est un
intervalle d'extrémités u :Sv, son adhérence (c'est-à-dire l'ensemble de ses points adhérents)
est l'intervalle fermé [u, v].
Définition 30.4. Soit I un intervalle non trivial de lR et y un arc défini sur I. Soit a un
point adhérent à I. On dit que y a pour limite f = (fx,fy) E JR 2 au point a lorsque les
deux composantes Yx et y1-J ont pour limite fx et fy au point a respectivement. On note alors
limt-rn y( t) = f
902

Cette définition est très simple, elle à l'avantage de n'utiliser aucune nouvelle notion. Mais
il est très important pour la suite de comprendre la notion de limite d'une autre manière,
qui met en évidence la notion de distance entre les points de lR?. 2 . En effet, un arc est une
fonction à valeurs dans lR?.2 . Dire qu'un arc y possède une limite€ E lR?.2 en un point a signifie
intuitivement que la distance entre y(t) E lR?. 2 et € tend vers 0 lorsque t tend vers a. Pour
donner un sens à cette intuition, il faut au préalable donner une définition de la distance entre
les points de lR?. 2 •
Rappelons qu'on peut mesurer la longueur d'un vecteur u de lR?. 2 à l'aide de sa norme
euclidienne, définie par
llull = + y2.Jx2
2
La distance de deux éléments u et v de lR?. est alors par définition la norme euclidienne de
leur différence
distance(u,v) = llu-vll = llv-ull-
Les propriétés suivantes de la norme euclidienne sont élémentaires mais fondamentales.

Proposition 30.5. ·1,a no~e eucliâîennisatisfaifles propriétés suivantes.


1). tl\tlf'2: 0; et Jttt!f = 0 sî et·· seulement. si llutt == O:
,2) Pour tout a ER ettcutu. E Ri>:, Îlciu.R~·l«t.fluU:'
S)>Pourtous.~,v-do.nsRi>, ~u.+ \ill~•tl-ull +Jlvlf (ineyr)lité l:riangv.14ire);
4) · Powr tdm u, v>tâns RP, ll!ufl - llvltt :$ !lu.+ vil {inégalité triângûlaire bis).··.

PREUVE. Les propriétés 1) et 2) sont évidentes. L'inégalité triangulaire 3) est une consé-
quence de l'inégalité de Cauchy-Schwarz. Pour montrer 4), on constate que

llull = ll(u-vl +vll::; llu-vll + llvll

donc llull - llvll ::; llu - vll- De plus, Il - vll = llvll par 2). Il en résulte en changeant v en -v
que llull - llvll ::; llu + vll- En intervertissant u env, on obtient llvll - llull ::; llu + vll- Donc

lllull - llvlll = max (llull - llvll, llvll - llull)::; llu+vll


ce qui prouve 4). ■
Il est maintenant possible de relier la définition précédente de la limite d'un arc à l'approche
intuitive que nous avons décrite.

Proposition SQ.6. ·Soit I un ànter'IJ(J,lle '1,(J'n trima( de J, et y un arç défini fJtJ.1' l,$oit a u~
point àdhérent à I. Alors limt➔ a y{ t) ,:;, l si et seulement si lirilt➔a lly(t) -tJf = o. . ... .

PREUVE. Si limt-rnY(t) = e, alors comme

on obtient limt-ia lly(t) - €11 2 = O. On sait de plus que la fonction cp: t H v't, de JRt+ dans lRt,
est continue en 0, et vérifie cp(0) = O. Par composition, on voit que

lim lly(t) - e11


t-ta
= t-ta
lim cp(lly(t) - €112) = cp(lim
t-ta
lly(t) - ef) = 0,
903

ce qui montre que si y possède une limite au point a, alors la distance de y(t) à cette limite
tend vers O lorsque t tend vers a.
Réciproquement , supposons lly(t) - fil lorsque t -1 a. Notons que

Il en résulte que limt-rn IYx(t)-fxl = 0 par le théorème des gendarmes, et donc que limt-rn Yx(t) =
fx. Le même argument montre que la limite est nulle pour l'autre composante, ce qui termine
la preuve de l'équivalence. ■

Comme pour les fonctions à valeurs réelles, nous pouvons maintenant donner la définition
de la continuité d'un arc plan en un point de son intervalle de définition.

Définition 30.7. Soit I un intervalle non trivial de lR et y un arc défini sur I. Si a E I, on


dit que l'arc y est continu au point a si les fonctions Yx et Y-y sont toutes deux continues au
point a. On dit que y est continu sur I si y est continu en tout point de I.

EXEMPLE 30.8. Voici quelques arcs (dont on pourra à titre d'exercice essayer de tracer
l'image).
► L'arc y: JR~ -11R défini par y(t) = (e-t, t ) est continu sur JR~, et limt--; 0 y(t) = (1, 0).
2 2
2
► L'arc y: JR~ -1 JR défini par y(t) = (sin(l/t), t ) est continu sur JR~, mais n'a pas de
2

limite en O.
► L'arc y: JR~ -1 JR défini par y(t) = (sin(l/t), e-t) est continu sur JR~, et a pour limite
2

(0, 0) en +oo.

On traduit ainsi facilement la continuité en termes de distance : l'arc y est continu ena
lorsque la distance de y (t) à y (a) tend vers O lorsque t tend vers a. De la même manière que
pour la continuité, on peut définir la dérivabilité des arcs composante par composante.

Définition 30.9. Soit I =]ex, 13[ un intervalle non trivial de lR ety un arc défini sur I. Soit
a E I. Alors on dit que y est dérivable au point a lorsque ses composantes Yx et Y-y sont
toutes deux dérivable au point a. On note alors

et on dit que y' (a) est le vecteur dérivé de y au point a.

La proposition suivante est immédiate, compte tenu de la définition de la limite au moyen


des limites des composantes.

Pr:oposiiijpn 30~10~ .So# {::z}«. ~[ 'Un in:teey(Ûleno11. trlwd de 1R ~t y. un "ro déji:ni sur I.
Soit a E I. Alors y t3st dédvable çiu point a si et seùlement sil'e:Epre$sitm, ·· ·
l. . ...
ÎÎ.(Yx[ t+ h.}-y,,,{t), Yy{t + h.) -yy(t))

piJssèd.ê une limite lorsque 'h.· tènd verso:

Passons maintenant au cas des points frontière d'un intervalle.


904

Définition 30.11. Soit I = [ex, f3] un intervalle non trivial de lR et soit y= (Yx, Y-y) un arc
défini sur I. On dit que y est dérivable à droite en ex lorsque ses composantes Yx, Y-y sont
toutes deux dérivables à droite en ex. On définit alors le vecteur dérivé à droite de y en ex,
par
y~(ex) = ((Yxl~(ex), (yy)~(ex)).
On a une définittion analogue pour la dérivée à gauche en f3.
On peut maintenant passer à la définition de la dérivée d'un arc, et de la classe de diffé-
rentiabilité d'un arc.
Définition 30.12. Soit (I, y) un arc plan. Lorsque l'arc y est dérivable en tout point de I,
on dit que y est dérivable dans I, et on définit l'application dérivée y' de I dans JR 2 comme
l'application t H y'(t).
Comme pour les fonctions à une variable, on définit les dérivée d'ordre supérieur d'un arc.
Définition 30.13. Soit (I, y) un arc plan. Soit k EN*.
1) On dit que l'arc y est k fois dérivable si ses fonctions composantes sont k fois dérivables
dans I. On note alorsy(kl(t) = (y~k1(t),y~kl(t)) le vecteur formé par les dérivées d'ordre k
des composantes au point t, on l'appelle vecteur dérivé d'ordre k de y en t.
2) On dit que l'arc y est de classe Ck si ses fonctions composantes sont de classe Ck dans
I.
Nous verrons dans la suite comment définir la dérivabilité sans avoir recours aux compo-
santes. En pratique, nous étudierons des arcs de classe au moins C 1 , sauf éventuellement en
des points isolés. Il faut noter que si l'on suppose seulement qu'un arc est continu, son image
peut réserver quelques surprises. Par exemple, comme nous le verrons dans le cours de 12,
Péano a montré que le carré plein [O, 1]2 du plan est l'image d'un arc continu. En ce sens, le
carré plein est une courbe paramétrée continue !

1.1.3. Développemen ts limités des arcs plans

C'est encore l'équivalence entre la donnée d'un arc et celle de ses composantes qui va nous
permettre de définir facilement la notion de développement limité pour un arc plan.
Définition 30.14. Soit (I, y) un arc plan. Soit a un point adhérent à I. On dit que y
possède un développement limité à l'ordre k au point a lorsque ses deux composantes Yx et
Y-y possèdent des développements limités à l'ordre k au point a.

On pourra donc écrire

Yx(t) = exo + ex1 (t- a)+···+ exk(t - a)k + o((t - a)k),


Yy(t) = f3o + f31 (t- a)+···+ f3k(t - a]k + o((t - a)k).
Il est souvent commode d'utiliser une notation en colonne pour les développements limités
d'arcs plans. On écrit alors

Le dernier terme de ce développement peut aussi se noter o( (t - a Jk). Pour donner un sens
à cette notation, nous avons besoin de la définition suivante.
905

Définition 30.15. Soit a E JR. Soit y un arc plan défini au voisinage de a. Soit k EN. On
dit que y est négligeable devant (t - a) k lorsque t tend vers a (ou au point a) lorsque

On voit facilement que y est négligeable devant (t - a) k lorsque t tend vers a si et seulement
si ses deux composantes Yx et )'y sont négligeables devant (t-a)k lorsque t tend vers a. C'est
ce qui permet de justifier la notation précédente pour le dernier terme du développement
limité d'un arc plan.
Lorsque l'intervalle I est un voisinage de a, et lorsque l'arc y est k fois dérivable au point
a, comme ses composantes sont par définition k fois dérivables en a, nous avons vu qu'elles
possèdent un développement limité à l'ordre k au point a. Par définition même, l'arc y possède
donc aussi un développement limité à l'ordre k au point a.
De manière plus précise, on peut énoncer la proposition suivante.

La preuve de cette proposition est une conséquence directe des définitions précédentes et
de la formule de Taylor-Young appliquée aux composantes de l'arc y.

EXEMPLE 30.17. Développement à l'ordre 3 en O de l'arc y défini sur lR par y(t} =


(cos t, sin t).
► Les dewc-composant es sont de classe C , dont l'arc possède un développement limité à
00

tout ordre en O. A l'ordre 3, on obtient

y(t)= (1) (Ô)1


0 +t t
+2
2
(-1)
0 t
+6
3
(0)
-1 +o(t).
3

Il. ÉTUDE DES COURBES PLANES


Nous allons maintenant donner une méthode générale d'étude des arcs permettant de tracer
leurs courbes représentatives.

Il.1. Équivalence des arcs


Nous avons vu que plusieurs arcs peuvent avoir la même image. Si l'on doit étudier une courbe
paramétrée, on se pose donc d'abord le problème de choisir l'arc dont elle est l'image afin qu'il
soit le plus simple possible. A cet effet, nous allons introduire deux définitions.
Définition 30.18. Soient 11 et li deux intervalles de R Soit k EN*, ou k = oo. Un Ck-
difféomorphisme de I 1 sur I2 est une application bijective <p : I 1 ---+ 12, de classe Ck et telle
que <p- 1 soit de classe Ck.
906

EXEMPLE 30.19. Voici quelques difféomorphismes.


► L'application cp: JR~--, JO, 1 [ définie par cp(t) = e-t est un cxi difféomorphisme de R~ sur
JO, 1 [. Il est strictement décroissant.
► L'application cp :JO, 1[--t]0, 1[ définie par cp(t) = t 3 est un C 00 difféomorphisme de JO, 1[
sur JO, 1 [. Il est strictement croissant.
► L'application cp : [0, 1 [--, [0, 1 [ définie par cp(t) = t 3 n'est pas un C 1 difféomorphisme de
[0, 1[ sur [0, 1 [. En effet l'application réciproque définie par cp- 1 ( t) = t 113 n'est pas de classe
C 1 sur [0, 1 [, elle n'est même pas dérivable en O.

Définition 30.20. On dit que deux arcs (I 1 , yi) et (I2, Y2) sont Ck-équivalents s'il existe un
Ck difféomorphisme cp de I 1 sur I2 qui vérifie

Yl = Y2 o cp.
L'application cp s'appelle alors un changement de paramétrisation de classe Ck.

On notera que si deux arcs sont Ck-équivalents, ils sont aussi Ci-équivalents pour tout
E {1, ... , k}. Pour tout k ~ 1, on voit que deux arcs Ck-équivalents ont la même courbe
représentative, puisque avec les mêmes notations

Si l'on veut tracer la courbe représentative d'un arc, il est donc intéressant de choisir un arc
C 1-équivalent qui soit le plus simple possible.

Test 30.1. Test 30.2.


Vérifier que relation de Ck-équivalence des arcs Les arcs (JO, 1[, Yl) et (JO, 1[, yz) définis par
est une relation d'équivalence dans l'ensemble y1(t) = (1,sint) et yz(t) = (1,cost) sont-ils
des arcs. C1-équivalents?

Le changement de paramétrage peut simplifier l'étude d'une courbe. Signalons un cas


particulier intéressant. Soit (I, y) un arc et supposons que l'application composahte Yx soit
un Ck difféomorphisme de I sur son image J = Yx(IJ. Alors, si fi est l'application de J dans
JR2 définie par ri = y o y; 1, l'arc (J, ri) est Ck équivalent au précédent, par définition même.
Notons (rix, Tiy) ses composantes. On a alors Tix = Yx o y; 1 = Idr, soit donc Tix(t) = t. L'arc
s'écrit donc sous la forme ri(t) = (t, fly(t)). Son image est donc

ri(J) = {(t, Tiy(t)) 1 t E J}

on voit que c'est le graphe de fly• La courbe image de l'arc initial est donc un graphe au-dessus
de l'axe des x.

EXEMPLE 30.21. Soit à tracer la courbe représentative de l'arc (JR, y), avec y(t) = (t 2, t 3 ).
► Découpons notre courbe en trois parties : les courbes de (JR~, y+), (lR'_, y_), où y+ (resp.
y_) est la restriction de y à JR~ (resp. JR'_), et le point O = (0, 0) = y(0). Nous verrons plus
tard que l'on peut déduire l'image de (JR'_,y_) de celle de (JR~,Y+l par des arguments de
symétrie, nous allons pour l'instant ignorer cet aspect des choses.
► Sur JR~ la première coordonnée x : t H t 2 est un C00 difféomorphisme sur JR~, on peut
donc trouver un arc ri+ C 00 -équivalent à y+ en composant par l'application réciproque x- 1 ,
907

312
comme nous venons de le voir. Cet arc est donné par lJ+(t) = (t, t ), sa courbe est le graphe
de la fonction f +: ]R~ -----+ JR définie par f +r X) = x 312 .

► On peut faire la même étude sur lR"._, la courbe représentative de y_ est le graphe de la
2
fonction f_: JR~-----+ lR définie par L(x) = -x31 .
► En cherchant x en fonction de 1}, on aurait pu obtenir un arc « C0-équivalent »à (JR, y),
avec une seule expression x = sgn(y)lyi 213 . Mais cet arc n'est pas ci-équivalent à y puisque
la bijection réciproque de x H x 3 n'est pas dérivable en O.

II.2. Tangente à une courbe paramétrée


Considérons une arc y de classe ci défini sur un intervalle I. On veut définir la notion de
tangente en un point (t 0 , y( t 0 )) à la courbe représentative de y. On aurait envie de dire que
la tangente au point (t 0 , y( t 0 )) est la position limite des cordes reliant les points (t 0 , y (to)) et
(t, y(t)), et donc de poser comme définition que la tangente est la droite passant par (to, y(t 0 ))
dirigée par le vecteur y'(t 0 ). En effet, par définition du vecteur tangent, on obtient

y'(to) = ~~ ~ (Yx(t + h) -yx(tol, Yy(t + h) -yy(tol)

et le vecteur (Yx(t+ h)-Yx(t 0 ),yy(t+ h)-yy(t 0 )) est précisément le vecteur défini par la
corde issue de y(to) et passant par y(to+ h). Si la limite existe, elle indique certainement une
position limite de la corde lorsque le point courant se rapproche du point initial y(t 0 ).
Mais cette « définition »heuristique pose plusieurs difficultés. Tout d'abord, elle exclut le
cas des points en lequels y'(t 0 ) n'existe pas, où encore celui où y'(to) est le vecteur nul. Par
9 9
exemple, la courbe paramétrée définie par l'arc y(t) = (t , 2t ) est en fait une droite (la droite
d'équation 1} = 2x). Sa tangente en tout point est donc évidemment bien définie. Mais pour
t = 0 le vecteur dérivé y'(t) est nul, notre définition préliminaire ne convient donc pas.
On voudrait également pouvoir traiter le cas des demi-tangentes, comme celui de l'arc
y(t) = (t 2 , t 3 ) au point t 0 = 0, que nous avons déjà rencontré dans l'exemple précédent.
Ceci conduit à proposer la définition suivante. Rappelons qu'un point est dit intérieur à
un intervalle s'il n'est pas égal à l'une de ses extrémités.
Définition 30.22. Soit (I, y) un arc de classe ci, et soit t un point intérieur à I. On dit
que la courbe représentative r de y admet une tangente au point y(t 0 ) si y(t) # y(t 0 ) dans
un voisinage de to, et si de plus la fonction u définie au voisinage de t 0 par
1
u(tl = lly(t)-y(tolll (y(tl -y(toll
possède une limite à droite U+ et une limite à gauche u_ en t 0 , et si ces deux vecteurs
limites sont colinéaires. La tangente à r au point t 0 est alors par définition la droite passant
par y(to) et de vecteur directeur u+ ou u_ {le choix est indifférent, puisque U+ et u_ sont
colinéaires).
Nous allons maintenant voir que la définition précédente est compatible avec ce que l'on
souhaitait écrire dans le cas où l'arc est dérivable et de dérivée non nulle en t 0 . Introduisons
d'abord une définition.
Définition 30.23. Soit (I, y) un arc, et t 0 un point intérieur à I. On dit que t 0 est régulier si
y est dérivable en t 0 et y'(to) # O. Si y'(t 0 ) = 0, on dit que l'on a un point stationnaire. Un
arc défini sur un intervalle ouvert est dit régulier s'il est dérivable et sans point stationnaire.
908

~opositiolt 30~:ü~ Soit(!, y}Ùtà tlrê,j~t ~.wf~tj


là eourl>e r == y(l} ad.met' ttne. tangeiÎti è.n Ï'tto).< . .
y(to} et de vectettr ditictèur y'(to}. ·

PREUVE. En effet, par définition de la dérivabilité, on peut écrire au voisinage de t 0

y(t) -y(to) = (t- to)(y'(to) + €(t)),


avec €( t) --+ 0 lorsque t --+ t 0 . On en déduit que
lly(tJ-y(tolll = it-tollly'(tol + e(tlll-
On en déduit
1 1 1
u(tl = lly(tl -y(tolll (y(tl -y(toll = IIY'(tol + e(tl Il it - toi (y(tl -y(toll

Comme limt-->to y'(to) + e(t) = y'(tol, par définition limt->to IIY'(to) + e(t)II = IIY'(to)II- Pour
t > to il vient donc par définition de la dérivée

et de même lorsque t < to

Ainsi, on voit que la tangente existe et qu'elle est de vecteur directeur y'(t 0 ). ■

On peut sans grande difficulté adapter la démonstration précédente au cas de certains


points stationnaires pour arriver à l'énoncé suivant.

Tbéorêtne 30.25.. •~vec l~s mlm~nQtâtî<JM, on'.sttp~ @i'Jf~i.fiJn ~P2:Att3( qùe


y soit V fois dériv<iblè entè et queTo/1. ait i ... ·.·• {·.:i;t( . '.•;·.·.: ~,:i:~; ~;:.;·fr;,/ ,,
y!(tt,) =;...:r;;y<l"":H(tol <Ô.j:·;t'Jt;{ti>Ji:tL: i}î", 1,:~t;:('•V

Alors l'arc admet ~rtë tangente en to ..dom un v~tetf~~t~~;;t;Evirî~j;


PREUVE. La démonstration est tout à fait semblable à la précédente. Les hypothèses per-
mettent d'écrire le développement limité :
y(t) -y(t0 ) = (t- to)P (y(P;~to) + o(l))

qui permet d'obtenir comme dans l'énoncé précédent l'existence des limites u(tt) = limHt+ u(t)
0
et u(t;;-J limt->t;, u(t), et les formules :
+ _ 1 y(Pl(tol
u(t ) - u(t ) - , si p est pair,
0 - 0 - 11-y(P~~tolll p!
- 1 y(Pl(to)
u(tt) =-u(tol = 11-yrP~\tolll p! , si p est impair.


909

Remarque. Dans la démonstration précédente, le seul point utile est l'existence d'un déve-
loppement limité avec un terme non nul (autre que y(t 0 )). L'énoncé pourrait être légèrement
affaibli (et d'ailleurs souvent on se contente du développement limité pour obtenir la direction
de la tangente).

Nous allons maintenant étudier le problème de la position de la courbe par rapport à sa


tangente, au voisinage d'un point y( t 0 ), avec ta intérieur à l'intervalle de définition de y. Nous
supposerons que y est k fois dérivable au point t 0 , nous supposerons l'existence d'un vecteur
dérivé yOl non nul, avec 1 ::; j < k, et nous noterons p le plus petit entier vérifiant 1 ::; p < k
tel que y(Pl(t 0 ) =fa O. Nous supposerons de plus qu'il existe un vecteur yOl non colinéaire à
y(Pl(t 0 ), avec p + 1 ::; j ::; k, et nous noterons q le plus petit entier vérifiant p + 1 ::; q ::; k
tel que y(ql(to) soit non colinéaire à y(Pl(tol-
La fonction y admet donc le développement limité suivant è
C')
..d
ü

où la fonction TJ est négligeable par rapport à (t - t 0 )P lorsque t tend vers to (c'est le terme
complémentaire usuel du développement), et où la fonction e tend vers O lorsque t tend vers
t 0 . En effet, par hypothèse, il existe pour p + 1 ::; j ::; q - 1 un coefficient <Xj E lR tel que
y0l(t 0 ) = <Xff(Pl(t 0 ). En conséquence, le terme d'ordre j dans le développement s'écrit

(t - to)i~y(il(to) = (t - to)i ~! <X;__!_ytvl(to) = (t - to)Pe·(t)__!_ytvl(to)


J! J! p! J p!

avec €j(t) = (<Xj(p!)/(j!)) (t-t 0 Ji-v_ La fonction ei ainsi définie a donc pour limite Olorsque t
tend vers t 0 . Enfin, la fonction € est la somme des fonctions €j obtenues pour p + 1 ::; j ::; q - 1,
elle est donc de limite nulle en t 0 .
Pour étudier la position de la courbe par rapport à sa tangente, nous allons nous placer
dans le repère (y(t 0 ), X, Y), où X et Y sont les vecteurs de lR. 2 définis par

Dans ce repère, le point de lR. 2 défini par y(t) a pour coordonnées

où les fonctions €x et €-y sont de limite nulle en t 0 .


Le point crucial de notre étude est que les expressions précédentes des coordonnées per-
mettent d'en déterminer le signe lorsque test assez voisin de t 0 . En effet, dès que les fonctions
€x et €-y sont > -1 /2 par exemple (ce qui est le cas lorsque lt - toi < TJ pour TJ assez petit,
puisqu'elles sont continues et nulles en 0) les coordonnées x et y sont respectivement du signe
de (t-t 0 )P et (t- t 0 )q_ Le plan se divisant en quatre quartiers Q++ = {(x, y) x > 0, y > O},
1

Q+- = {(x, y) 1 x > 0, y < 0}, Q-+ = {(x, y) 1 x < 0, y > 0}, Q-- = {(x, y) 1 x < 0, y < 0},
si l'on se donne la partité de p et de q, il est donc possible de déterminer le quartier auquel
appartient le point courant de la courbe lorsque t > t 0 et t < ta, assez voisin de t 0 . Comme
nous savons de plus que la tangente à la courbe est dirigée par le vecteur X, il est possible de
conclure aux quatre formes possibles suivantes, en fonction de la parité de p et q.
Si maintenant le point t 0 est l'une des extrémités de l'intervalle, on obtient facilement
l'allure de la courbe pour t voisin de t 0 en utilisant les méthodes précédentes à droite ou à
gauche de to, suivant les cas. On parle alors de manière évidente de demi-tangente, etc.
910

p impair et q pair : tan-


..i y
····Jl-······
..
:
X

p impair et q impair :
l-~~•X
:
.
..
p pair et q impair : p pair et q pair
gente ordinaire point d'inflexion rebroussement de pre- rebroussement de se-
mière espèce conde espèce

FIGURE 30.3. Allure locale en un point singulier

Il.3. Tracé pratique des courbes planes


Nous présentons ici les modalités d'étude d'un arc plan permettant le tracé de sa courbe
représentative. Nous allons procéder pas à pas, en nous appuyant sur l'étude de l'arc plan
y : lR ----, JR 2 défini par

Pour des raisons qui vont nous apparaître clairement, sa courbe représentative s'appelle une
astroïde. Nous allons donner en premier lieu la démarche génerale, et l'illustrer étape par étape
au moyen de notre exemple.

Etape 1. Réduction de l'intervalle d'étude. On commence par examiner la périodi-


cité de y. Si y est T-périodique, alors il suffit d'étudier l'arc sur un intervalle d'amplitude T
pour étudier la courbe. On fera attention que six est Ti-périodique et y est T2-périodique,
on ne peut trouver une période commune que lorsque le rapport T2/T1 est rationnel.
On examine ensuite l'existence éventuelle de symétries. On cherche à écrire l'intervalle I
comme la réunion de deux intervalles 11 et h, de sorte qu'il existe une bijection q:>: 11 ----, 12
telle que la courbe représentative de l'arc y o cp(I 1 ) se déduise par une application très simple
(réflexion, symétrie centrale, etc) de celle de l'arc y(h). Il suffit alors de tracer y(h) et
d'ajouter l'image de cette courbe par l'application précédente pour reconstruire y(I).
En général, les bijections q:> sont à chercher parmi t H -t, t H t+a. (a. E JR), t H a!b-t
(lorsque I =]a, b[ ou I = [a, bl).
Les applications I le plus souvent utilisées sont les suivantes.
1) I(x,y) = (-x,y), la courbe totale se déduira d'une symétrie par rapport à l'axe des
ordonnées.
2) I(x, y) = (x, -y), la courbe totale se déduira d'une symétrie par rapport à l'axe des
abscisses.
3) I(x, y) = (-x,-y), la courbe totale se déduira d'une symétrie centrale de centre O.
4) I(x, y)= (x, y), la courbe totale est déjà tracée entière par le premier morceau.
5) I(x, y) = (x + a, y+ b}, ((a, b) E JR 2) la courbe totale se déduira d'une translation de
vecteur ( a, b}.

EXEMPLE 30.26. Réduction de l'intervalle d'étude pour l'astroïde.


► Les fonctions composantes x et y sont ln-périodiques, donc il suffit d'étudier la courbe
sur un intervalle d'amplitude ln.
911

► Comme pour tout ton a x(-t) = x(t) et y(-t) = -y(t), on peut étudier la courbe sur
[0, 7t] et compléter par une symétrie par rapport à l'axe des abscisses. Ensuite, l'application
t H 7t- t change x en -x et laisse invariant y. Il suffit donc d'étudier la courbe sur [0, n/2]
et de faire une symétrie par rapport à l'axe des ordonnées. Ces restrictions d'intervalles
suffisent à étudier la courbe presque sans calculs. On peut aussi remarquer que l'application
t H n/2 - t échange x et 1J, ce qui signifie que l'on peut étudier la courbe sur [0, n/4] et
faire une symétrie par rapport à la première bissectrice.

Etape 2. Etude au voisinage des bornes de l'intervalle. Dans cette partie, l'uti-
lisation des développements limités ou asymptotiques est souvent indispensable. On notera
t 0 E îR le point d'étude. En pratique, on se trouve soit dans la situation où y a une limite
finie lorsque t-) t 0 (il se peut que l'on étudie seulement la limite à droite ou à gauche), soit
au moins l'une des composantes tend vers l'infini.
Dans le premier cas, on complète l'étude par la présence éventuelle d'une tangente (ou
d'une demi-tangente) et la position de la courbe par rapport à la tangente.
EXEMPLE 30.27. Les points extrêmes pour l'astroïde.
► On a y(0) = (1, 0) et y(n/4) = (1, l)/(2v'2). En n/4, la pente est -1 pour des raisons
de symétries par rapport à la première bissectrice (il n'y a pas de rebroussement car x et 1J
sont strictement monotones au voisinage de n/4). En 0, on utilise un développement limité,
qui conduit à

lorsque t-) O. Ainsi, il vient

ainsi on sait que la tangente est l'axe des abscisses et que la courbe part dans la direction
de l'origine.
Détaillons maintenant la seconde situation. Nous sommes donc dans le cas où

(la limite pouvant être seulement à droite ou à gauche). On dit alors que la courbe admet une
branche infinie quand t -) to.
On étudie d'abord l'existence éventuelle de directions asymptotiques, puis d'asymptotes,
ou de branches paraboliques.
Définition 30.28. On dit que la droite vectorielle dirigée paru E IR2 est la direction asymp-
~i!l
totique de la courbe lorsque t-) t 0 si 11 11 (qui existe au voisinage de to) tend vers u lorsque
t -) t 0 . Si de plus il existe une droite affine 'D de vecteur directeur u telle que la distance de
y(t) à 'D tende vers 0 lorsque t-) t 0 , on dit que 'D est une asymptote. Si l'on a une direction
asymptotique mais pas d'asymptote, on parle de branche parabolique (de direction u).

Très souvent, dans la pratique, on se trouve dans la situation où au moins l'une des égalités
suivantes limlx(t)I = +oo ou limly(t)I = +oo est satisfaite (ce qui n'est pas toujours le cas,
penser ày(t) = t(cos(t),sin(t)) au voisinage de +oo). On a alors les critères simples d'études
suivants.
912

PREUVE. Étudions d'abord le cas 1). La distance entre la droite d'équation y= Yo et y(t)
est majorée 1 par :
11-y(t)- (x(t),Yolll = ly(t)-Yoi-, 0,
et donc la droite y = y 0 est bien asymptote. Réciproquement, notons que si y = Yo est
asymptote, on doit avoir y(t)-, Yo et par conséquent, comme 11-y(t)II-, +oo, !x(t)I-, +oo.
Le cas 2) est analogue.
Cherchons maintenant à quelle condition, sous l'hypothèse que !x(t)! et !y(t)I tendent tous
deux vers +oo, une droite est asymptote. On voit facilement que dans ce cas une droite V
asymptote est nécessairement d'équation cartésienne y = cxx + f3 avec ex -=/ O. On a alors
nécessairement lim(y(t) - cxx(t)) = (3, et donc en divisant par x(t) (dont la valeur absolue
tend vers +oo), lim(y(t)/x(t)) =ex.Ceci explique pourquoi dans les cas 3) et 4) nous n'aurons
pas d'asymptote.
Dans les cas 5) et 6), si la droite est asymptote, on doit avoir ex = a, puis lim(y(t) -
ux(t)) = (3, donc on obtient que l'on a une asymptote dans le dernier cas. Supposons que
lim !y(t)-ux(t)! = +oo, bien entendu il n'y a alors pas d'asymptote, mais comme y(t) ~ ux(t)
et y(t) ~ !x(t)!v'î+a2:

y(t) ( x(t) y(t)) E


11-y(t)II = 11-y(t)ll'y(t) -, ✓1 +u2 (l,a),

:1!;
où é: = lim 1 1 E {-1, l}. Ainsi on a une branche parabolique de direction (1, a) (soit de
direction y = ax).
Pour terminer, traitons complètement le cas 3) (le cas 4) est analogue). Cette fois, en
~1!;
notant é: = lim 1 1 E {-1, l}, nous pouvons dire que 11-y(t)II ~ Ey(t), et donc

y(t) ( x(t) y(t)) (x(t) 1)


11-y(tlll = 11-y(tlll 'y(tl ~ é: y(tl' _, é:(O, ll,

nous avons donc une branche parabolique de direction (0, y). ■

Lorsqu'on a une asymptote, on étudiera la position par rapport à l'asymptote, en étudiant


le signe de la différence entre l'arc et une représentation paramétrique de l'asymptote.

1
et même égale.
913

Etape 3. Etude des variations de x et y. On trace le tableau de variations de x et y.


...
L'idéal pour faciliter la lecture et de présenter sur deux lignes adjacentes les variations de x
et y. On suggère donc l'ordre suivant : t, x', x, y, y'.
Etape 4. Recherche des points multiples. Il s'agit des points en lesquels la courbe
passe plusieurs fois. On cherche donc à résoudre l'équations d'inconnues (t1, t2) :

Si cette équation admet des solutions, le point y(t 1 ) est dit multiple (on parle de double,
1
triple, quadruple, etc. en fonction du cardinal de y- (y(ti)). Bien entendu lorsque la courbe
est périodique, cette notion de points multiples n'a d'intérêt que lorsqu'il y a des points
multiples sur un intervalle [t0 , t 0 + T[, où T est la période.
Etape 5. Etude aux points privilégiés. Pour faire un tracé précis, on peut, aux points
multiples, stationnaires et d'inflexion, faire une étude de l'allure locale de la courbe.
Avant de passer à l'étude d'exemples, résumons les diverses étapes que nous venons de
décrire.

Pour tracer une courbe paramétrée


Etape 1. Réduction de l'intervalle d'étude.
Etape 2. Etude des branches infinies.
Etape 3. Etude des variations de x et y.
Etape 4. Etude aux points singuliers.
Etape 5. Etude aux points privilégiés (points multiples, etc).

EXEMPLE 30.30. Fin de l'étude et tracé de l'astroïde.


► Sur [O; 1t/4] (et même sur [O; n/2]) x est visiblement décroissante comme composée de
u H u 3 croissante et de cos décroissante sur l'intervalle considéré. De même y est croissante.
Ainsi, sans calculs on a les variations des fonctions x et y.
Nous n'avons pas précisé la position par rapport aux tangentes aux points extrêmes,
puisque cette question est ici réglée par le signe et les variations de x et y. On en arrive à la
courbe suivante.

EXEMPLE 30.31.(Lemnis cate de Bernoulli). Traçcons la courbe définie par la paramé-


trisation

y(t) = (1 t3t
4
).

1+ t4
1. On commence par restreindre l'intervalle d'étude. Comme on a pour toute valeur de t
l'égalité y(-t) = -y(t), on peut limiter l'étude à IR+ et compléter le graphe par la symétrie
centrale d'origine O.
On constate de plus que y(l/t) = (y(t), x(t)), ce qui signifie que y([l, +oo[) se déduit de
y(]O, ll) par la symétrie axiale d'axe la première bissectrice. Ainsi, on peut limiter l'étude à
[O, 1].
2. Cet exemple ne présente pas de branche infinie.
914

-1

-1

FIGURE 30.4. L'astroïde

3. 4. Le calcul des dérivées donne

Ainsi, sur [0, 1], on a x(t) > 0 si et seulement si t < to = W'et on a y(t) 2 O. En 0,
comme y(t) ~ (t, t 3 ) on voit que y(t) = t(l, 0) + o(t) et donc la tangente est dirigée par
le vecteur ( 1, 0) (elle est ainsi horizontale). Au voisinage de +oo, on a y( t) = (1/t 3 , 1/t) =
1/t(0, 1) +o(l/t) ce qui indique que lorsque t--) +oo, y(t) tend vers (0,0) verticalement.
En y(t 0 ), la tangente est nécessairement verticale puisque y(t 0 ) = (0;y(t 0 )) avec y(t 0 ) /= O.
On donne les valeurs approchées to ~ 0, 76, et y(to) = (3to/4; ~) ~ (0, 57; 0, 33).
4
5. Enfin, sur ]0, 1 [, il ne peut pas y avoir de points multiples puisque y est strictement
croissante. Au point limite (1, 1), on a y( 1, 1) = (1/2, 1/2) et y( 1, 1) = (-1 /2, 1/2) donc la
tangente est dirigée par (-1, 1) (sachant que y est C 1 en 1 et compte tenu de la symétrie,
aurait-on pu le prévoir?). Pour conclure notre étude, voici le tableau de variations suivi de
la représentation graphique.

t 0 1/v'J 1
x'(t) + 0 -

/x(to)~
x(t) 0 1/2
1/2
/y(to)/
y(t) 0
y'(t) +
915

FIGURE 30.5. Lemniscate de Bernoulli

EXEMPLE 30.32. Traçcons la courbe définie par la paramétrisation

3
(tl = (t (3t--2l).
y t(t-1)
1. On ne détecte pas de symétrie particulière.
2. Il reste à préciser que lorsque t tend vers +oo ou -oo, x et 1J tendent tous deux vers +oo,
et que le rapport 1)/X est équivalent à 1/(3t 2 ) donc tend vers O. On a ainsi des branches
paraboliques de direction (Ox).

3.4. On calcule tout d'abord les dérivées

y
2
'(t) = (6t (2t-
2t-1
l)) .
Ainsi les dérivées sont négatives jusqu'à t = 1/2 puis positives. On remarque aussi que
la dérivée de x s'annule (sans changement de signe) en O. Ainsi, apparaissent deux points
intéressants, correspondant aux valeurs O et 1/2 du paramètre. On calcule

y(0) = (~), y'(0) = ( ~l)


ce qui indique que la courbe passe par le point (0,0) en t = 0 avec une tangente verticale et
que l'on va dans le sens du vecteur (O, -1) en ce point.

On calcule aussi y'(l/2) = (-1/16;-l/4). L'étude en 1/2 est plus délicate puisque
y'(l /2) = (0, 0). On utilise donc un développement au voisinage de 1/2. On pose t = 1/2+ h,
avec h ----1 O. Il faudrait en général utiliser des développements limités, mais ici du fait que les
expressions sont polynômiales de degré inférieur à 3 (degré qui va être nécessaire pour évaluer
la position par rapport à la tangente), les dévloppements s'obtiennent immédiatement. Après
calculs, on trouve
916

On est ainsi dans la situation où p = 2 est pair et


= 3 est impair. On a un point de
q
rebroussement de première espèce. La tangente est dirigée par le vecteur u 1 = ( 3{ 2 ) et on

la traverse en passant en dessous (car u2 = (7/4) 0


).

5. Cette courbe ne présente pas de point multiple.


Pour conclure, voici le tableau de variation et la courbe représentative.

t -00 0 1/2 +oo


x'(t) - 0 - 0 +
x(t) +oo
+oo~o
~-1/16/
y(t) +oo~ +oo
0~
-1/4/
y'(t) - 0 +

FIGURE 30.6. X= t 3 (3t- 2) et 1J = t(t- 1)

EXEMPLE 30.33. Traçcons la courbe définie par la paramétrisation

y(t) ~ ( '~/11)
1. Le domaine de définition est D =] - oo; - l[U] - 1; O(Ullt'+-· Il n'y a pas de symétrie
particulière.

2. Branches infinies. Nous allons voir ici que déjà l'étude aux bornes du domaine permet
de faire une ébauche de la courbe. Aux bornes infinies, on constate que

(t) = t-1 (1/(t+l)) ~ (1/t)


y t t+l t '
917

ce qui permet de dire que la droite x = 0 (axe vertical) est asymptote et de plus qu'au
voisinage de -oo, on est dans le troisième quadrant et au voisinage de +oo, dans le premier.
Au voisinage de -1, on constate que l'on a

y(t) =- -(
t-1
t
1) ( 1)
t+l
t+l
~2
t+l
t+l
'

ce qui permet de conclure d'une part que l'axe horizontal 1J = 0 est asymptote, et que d'autre
part en (-1 )- on est dans le troisième quadrant et en (-1 )+ dans le premier.
Il reste le cas de t = O. Au voisinage de 0, on peut écrire :

y(t) =
1(
t t-l
t 2t~ 1
)
~
1t (-1)
-1 ,

et donc les deux limites sont infinies. On calcule par conséquent la limite de y(t)/x(t). Mais

1J (t) = (t + 1)2 ---+ 1


x(t) '

(ce que l'on aurait pu voir sur l'équivalent), et donc il reste à calculer lim(y(t) - x(t)). On
trouve aisément
2
y(t) - x(t) = (t - ; ~~ + ) ---, -2,

ce qui prouve que la droite D d'équation 1J = x - 2 est asymptote à la courbe. Calculant


y(t) - (x(t) -2) = t,
on voit que la courbe est au dessus de son asymptote au voisinage à gauche de O (lorsque
x( t) et 1J (t) tendent vers +oo) et en dessous de son asymptote au voisinage à droite de 0
(lorsque x(t) et y(t) tendent vers -oo).
Nous sommes donc déjà certains de plusieurs choses : par exemple, la courbe va couper
les deux axes sur IR"t-, sur cet intervalle x aura (au moins) un maximum, la courbe aura au
moins un point double obtenu pour un couple ('T 1 ,T2) E] - oo;-l[xlR"t-, et sur] -1;0[, x
aura un minimum. Enfin, la courbe doit couper D sur ] - oo; -1 [.
3. 4. Calcul des dérivées et variations de x et y. On calcule aisément y' pour obtenir

y'(t) =
-(t2 - 2t-
(t(t + 1)) 2
l)) ,
(
1 + l/t 2

ce qui montre que 1J est toujours strictement croissante et pour la fonction x il y a des
changements aux points t1 = 1 - ,./2. et t2 = 1 + ,./2.. En ces points les tangentes sont
verticales. Remarquons que l'on aurait pu dire à vue que 1J est strictement croissante comme
somme de deux telles fonctions (car 1J (t) = t - 1/t), mais nous avons calculé les dérivées
aussi pour déterminer les tangentes. On donne des valeurs approchées des coordonnées de
ces points remarquables y(t 1 ) ~ (5,83, 2) et y(t 2) ~ (0, 17, 2) (la seconde composante est
exacte). On constate que ces deux points sont sur la droite horizontale 1J = 2.
5. Intersections avec les droites remarquables. Nous avons fait apparaître que la courbe
allait couper la droite D et les axes. Ces points nous permettront d'affiner le tracer, nous les
déterminons. Il est facile de voir que x(t) = 0 est équivalent à t = 1 et y(t) = 0 est aussi
équivalent à t = 1 (car t ED), donc la courbe rencontre les deux axes simultanément lorsque
918

t = 1. On a alors bien entendu y(l) = (0, 0), et l'on calcule y(O) = (1 /2, 2) pour dire que la
tangente a pour pente 4 en ce point. La tangente est donc la droite 1J = 4x et l'on pourrait
calculer
11(t)-4x(t} = (t-1) 2 (t+ l}(t+ 3 } ~ 8(t-1) 2
t
pour constater que la courbe reste (localement) au dessus de sa tangente.
De même, nous pouvons déterminer les intersections avec D. 11(t} = x(t) - 2 aboutit
au système t 2 (t + 3) = 0, soit t = -3. On détermine y(-3) = (-2/3, -8/3) et y'(-3) =
(-7 /18, 10/9), donc la pente de la tangente est : -20/7 ~ -2, 86.
Donnons pour conclure le tableau de variations.

t -00 -1 1 -vil 0 1+ vil +oo


x'(t) - - 0 + + 0 -
x(t) 0 +oo~ /+oo b
~-00 a -00/ ~ 0
/+oo
C
0 / d
/+oo
11(t} -00/ -00/
11'(t) + +

On aura les valeurs suivantes

a~ 5, 83, b = 0, 17, c = 2, d = 2.

Voici maintenant la courbe représentative.

FIGURE 30.7. x = (t- 1)/t(t + 1) et -y= (t 2 - 1)/t


919

III. LES COURBES EN COORDONNÉES POLAIRES

Une courbe définie en coordonnées polaires est en fait une courbe paramétrique où le paramètre
est l'angle t = 0, c'est-à-dire qu'elle possède une paramétrisation de la forme

y(0) = (f(0) cos(0), f(0) sin(0)).

On écrit alors simplement


p = f(0).
Il faut prendre garde au fait que dans cette écriture f peut prendre des valeurs négatives. Le
réel p = f(0) n'est donc pas le module du point y(0), ce module est en réalité lf(0)1. Lorsque
p > 0, le point y(0) a pour coordonnées polaires (p, 0), alors que lorsque p < 0 le point y(0) 0
C')
a pour coordonnées polaires (IPI, 0 + n). ..d
u
Il est d'usage d'introduire pour l'étude des courbes en coordonnées polaires un « repère
mobile» constitué des vecteurs (ua,va) où u 0 = (cos(0);sin(0)) et Ve= (-sin(0),cos(0)).
Le repère (u0 ;v 0 ) est orthonormé direct, le vecteur ua est un vecteur directeur de la droite
d'origine O et faisant l'angle 0 avec l'axe des abscisses. Ainsi la courbe en coordonnées polaires
a une représentation aisée dans ce repère

y(0) = f(0)ua.

0o

FIGURE 30.8. Le repère mobile en coordonnées polaires

On constate aisément que u 0 est dérivable par rapport à 0 et que (u 0 )' = v 0 . Ainsi, lorsque
f est dérivable, y l'est également, et

y'(0) = f'(0)u 0 + f(0)va,


formule que l'on retient sous la forme

y'(0) = p'u0 + pv9.


De là, on peut déterminer les tangentes en tout 0 pour lequel le couple (p, p') n'est pas
simultanément nul. Lorsque p'(0 0 ) = 0 et p(0 0 ) -f. 0, cela indique que la tangente à la courbe
fait un angle V(0o) = n/2 avec la droite dirigée par u 00 , donc l'angle total par rapport à l'axe
920

(0x) est 0 0 + V(0 0) = 0 0 + n/2. Si p'(0 0) =/- 0, soit V(0 0) l'angle compris dans] - n/2;n/2[
tel que
p(0o)
tan(V(8 0)} = p'( 8 o).

Alors la tangente fait un angle V(8 0) avec la droite dirigée par u0 0 , et donc un angle total
80 + V(8o} avec l'axe (0x).
La recherche des points multiples consiste à trouver des couples (81, 82} distincts tels que
p(8,)cos(8 1) = p(82)cos(82)
{ p(8 1) sin(81) = p(82) sin(82)

On a nécessairement lp(8 1)1 = lp(82}I, mais la présence de ces valeurs absolues introduit un
signe. Il faut donc résoudre séparément les deux systèmes

et

L'étude d'une courbe en coordonnées polaires se passe en général comme suit.


1. Réduction de l'intervalle d'étude. On dispose dans ce cas de plusieurs remarques.
1) Si f est T-périodique, on étudie la courbe sur un intervalle d'amplitude Tet l'on récupère
toute la courbe en faisant des rotations d'angles T, 2T,etc. En pratique T/n est rationnel et
donc on a toute la courbe en un nombre fini d'opérations.
2) Si pour tout 8, f(8 + T) = -f(8), alors f est 2T-périodique et on est ramené au cas
précédent.
3) Si f est paire (resp. impaire), on étudie la courbe sur D n R+ puis l'on déduit l'ensemble
de la courbe par la symétrie axiale d'axe (0, x) (resp. (0, y}).
2. Etude du signe de f (et éventuellement des variations). Le signe est particulièrement inté-
ressant puisque lorsque f(8 0) = 0, on peut dire qu'en 8 0, la courbe passe par le pole O.
3. Recherche des points intéressants, ceux donnés par le tableau de variation, mais aussi (par
exemple) les intersections avec les axes (déterminer les p(kn) et p(n/2 + kn}), les points
multiples. Etude des tangentes ces points intéressants.
4. Etude des branches infinies. Nous avons plusieurs situations. La plus facile est lorsque
8----+ +oo (ou -oo). Nous avons alors trois cas.
1) Si lime--,+oo p(8) = 0, alors le point O est asymptote.
2) Si lime--,+oo p(8) = a ER*, alors le cercle de centre O et de rayon lai est asymptote.
3) Si lime--,+oo lp(8}1 = +oo, alors la courbe présente une spirale.
Lorsque 8----+ 8 0 ER (et lp(8)1----+ +oo), on se place dans le repère mobile R 0 = (u80 ,v 80 }
en = 8 0. La représentation (paramétrique) de la courbe dans ce répère est
8
(X(8), Y(8)) = (p(8) cos(8 - 8 0), p(8) sin(8 - 80}).
Dans ce cas, on voit que IX(8)1----+ +oo. Et donc, si Y(8) tend vers un réel a, on a une droite
asymptote dont l'équation est Y= a dans le repère Ra. Sinon, la courbe admet une branche
parabolique de direction (0, X).
Venons-en à plusieurs exemples d'étude de courbes définies par des coordonnées polaires.
921

EXEMPLE 30.34. Le premier exemple classique est la cardioïde dont une équation est

p = a(l + cos(0)),
où a > 0 est un réel fixé. On peut se limiter à l'étude avec a = 1, la cardioïde générale se
déduisant alors par une homothétie de centre l'origine et de rapport a.

On commence par réduire l'intervalle d'étude. Visiblement, p est br périodique, ce qui


permet de limiter l'étude à un intervalle de longueur 27I. De plus, p est paire, ce qui permet
de faire l'étude sur I = [0;7I] puis de faire une symétrie d'axe (0, x).

Sur l'intervalle I, la fonction cos est strictement décroissante de 1 à -1, donc


p est strictement décroissante de la = 2 à O. Pour affiner le tracer, on peut préciser la 0
('")
tangente en 0, la valeur en 7I/2 et la tangente en ce point. Pour cela, on calcule p' = - sin(0). ..d
ü
Pour 0 = 0, on a dans le repère mobile

p'(O)uo + p(O)v 0 = 2v 0 = (;),

donc la tangente est verticale. Pour 0 = 7I/2, on a p(7I/2) = 1 et p'(7I/2) = -1 et donc :


p'(7I/2)Urr/2 + p(7I/2)Vrr/2 = -Urr/2 + Vrr/2,
donc la tangente fait un angle de 37I/4 avec Urr; 2, donc un angle de 57I/4 avec l'axe des
abscisses.

Nous avons tout ce qu'il faut pour tracer la cardioïde.

FIGURE 30.9. La cardioïde

EXEMPLE 30.35. Soit à tracer la courbe d'équation polaire

p = 1 + tan(0/2).

La fonction p est définie sur lR \ {(2k + 1 )n; k E Z}, 27I-périodique; nous allons donc
l'étudier sur I =] - TI; 7I[.
922

Sur l'intervalle d'étude, p est visiblement strictement croissante, de -oo à +oo. On


calcule les valeurs particulières p(-n/2) = 0, p(0) = 1 et p(n/2) = 2. On peut calculer la
tangente en chacun de ces points, elle est donnée sans calculs en -n/2 puisque p(-n/2) = 0
et p'(-n/2) -=f. O.

Pour étudier p au voisinage den (ou -n, ce qui revient au même par ln-périodicité),
on calcule, avec les notations habituelles
sin(h)
Y(8 + h) sin(h) = (1 + tan(n/2 + h/2)) sin(h) ~- tan(h/l) ~ -2,

donc l'asymptote à l'équation Y = -2 dans le repère mobile en 8 = n, qui est


((-1,0),(0,-1)). Ainsi l'équation de l'asymptote dans le repère original est y= 2. La
position par rapport à l'asymptote pourrait être précisée en calculant

Y(8 + h) sin(h) + 2 = h + o(h).


Les éléments précédents permettent de constater que la courbe a un point double, atteint
pour une valeur de 8 dans l'intervalle ] - n, -n/2[ et l'autre dans ]0, n/2[. Notons 8 la plus
petite des deux. L'autre est alors 8 + n, et il faut donc résoudre

1 + tan(8/2) = -(1 + tan(n/2 + 8/2)).

Posons t = tan(8/2) E llL. Cette équation est équivalente à

1 +t=-(1-1/t)

donc à t 2 + 2t- 1 = 0, soit t = 1 - vl (car t < 0). Ceci donne 8 = -n/4. Voici maintenant
le tracé de la courbe.

FIGURE 30.10. 1 + tan(0/2)

On peut aussi déterminer les tangentes en -n/4 et 3n/4 pour améliorer le tracé.
EXEMPLE 30.36. Soit à tracer la courbe d'équation polaire
1 - sin(8)
p-------,--
- 1 + cos(8)'
La fonction p est ln-périodique, positive, définie sur lR \ {(2k+ 1)n; k E Z}. On peut étudier
p sur [0,2n].
La dérivée de p est donnée par :
, sin(8) - cos(8) -1
p =-------
(1 + cos(8))2)
923

Pour étudier le signe du numérateur, on fait l'opération habituelle :

sin(8) - cos(8) - 1 = v12(sin(8) cos(n/4) - sin(n/4) cos(8)) -1 = v1lsir1(8 - n/4) -1.


Ainsi, p est croissante en tous les 8 satisfaisant 8 - n/4 E [n/4;3n/4], soit 8 E [n/2;3n/2].

On détermine les points p(0) = 1/2, p'(0) = -1/4 (donc tan(V(0)) = -2), p(n/2) = 0,
p(3n/2) = 2, p'(3n/2) = -2 (donc tan(V(3n/2)) = -1 d'où une tangente parallèle à la
première bissectrice).
Il reste à étudier ce qui se passe au voisinage de 7t. Ici p tend vers +oo,
et par ailleurs,
·en posant 8 = 7t + h (avec h tendant vers 0) :

1 + sin(h) 2
p(n + h) sin(h) = ( ) sin(h) ~ -h,
1 -cos h

+oo
qui tend vers l'infini (vers à droite et -oo à gauche). Donc on a une branche parabolique
de direction (0, x). Voici le tableau de variations et la représentation graphique.

80 7t
2 7t 2n

p
½~ 0 /+0011+00~ 1
2

FIGURE 30.11. (1 - sin(t))/(1 + cos(t))

IV. CONTINUITÉ DES FONCTIONS À 2 OU 3 VARIABLES


Nous avons défini les notions de limite et de continuité pour des fonctions de IR dans IR,
nous allons les généraliser ici au cas des fonctions définies dans IR2 ou IR3 . Ce contexte est
légèrement plus délicat, et nous l'étudierons plus en détail dans le cours de l2. Nous donnons ici
simplement les premier éléments de la théorie générale. Nous pourrions énoncer les définitions
et résultats dans le cas de IRP avec p quelconques, mais nous nous limiterons à p E {2, 3}, au
924

prix de quelques lourdeurs d'écriture, pour souligner le caractère intuitif des idées que nous
introduisons.

IV .1. Limites de suites dans IR2 ou JR 3


Considérons une suite (UnlnEN d'éléments de lR. 2 (ou de lR. 3 ), que l'on écrira Un = (xn, -Ynl
ou Un= (xn, -Yn, Zn) respectivement. Ainsi (xnlnEN, (-YnlnEN, (Zn) seront des suites de réels,
ce sont les suites composantes de la suite (UnlnEN· Nous allons présenter les définitions et
propriétés dans JR.3 (le cas de JR.2 s'en déduisant immédiatement par suppression de la dernière
composante).
Commençons par définir la notion de convergence.
Définition 30.37. On dit que la suite (UnlnEN de JR.3 tend vers u = (x, 'y, z) E JR. 3 lorsque
n -, +oo si on a :
lim Xn = X, lim -Yn = 'y, lim Zn= Z.
n~-too n~-too n~+oo
On dit encore que la suite converge vers u, et on note limn-->oo Un= u, ou Un-, u sin -, oo.
2
On a une définition analogue pour les suites de JR. . On voit donc qu'une suite converge vers
un vecteur si chacune des suites composantes converge vers la composante oorrespondante du
vecteur limite. On en déduit immédiatement la proposition suivante.

Proposition â0.38.- SQîfp" t2i3}, 'Sqie.fit· e,i


.etL(\iti}~ de R3 qui
t~J~; des.!"*'¾
.è(irt'U~efhl ifJe~è•fi~ètiîc'.~tJeme~t; .Alâf:s l4c.S'ti~{~·+ v,dneé! etm'tlerie, V~ 'iï v. *
S<Jitt\ ER~ sQit.{~}- une SÜitede llt3 ~ieonverge '11ers1i:~.la Sll,ite (.ÀUn:}tlEH
converge vefs ÀU. · · ·
Nous allons maintenant donner une autre définition de la convergence d'une suite, équi-
valente à la précédente, et qui sera susceptible de généralisations extrêmement intéressantes,
que nous verrons dans le cours de L2. Il s'agit essentiellement de rendre plus systématique
l'approche que nous avons esquissée au dans la partie 1.1 de ce chapitre. Rappelons que pour
p E {l, 2, 3}, on peut mesurer la longueur d'un vecteur de JRP, à l'aide de sa norme euclidienne
définie par

llull = lui si p = 1, llull = Jx 2 +-y 2 si p = 2 et llull = Jx2 + 11 2 + z 2 ) si p = 3,


l'expression de cette norme se généralise d'ailleurs sans difficulté au cas d'entiers p quel-
conques, comme les considérations qui vont suivre. Rappelons aussi les propriétés suivantes
de la norme euclidienne, que nous avons montrées dans le cas p = 2.

Pn;>p-1~ti.·io;~,.;,9.Di(-p e•·{.l;.l~ 3}t La' M~i e.èlitlî~ril satiiift>if ·leg"p'rtipnétês. sitir


vantes.' { ..• }" ·.· .. ·. ·•·. ·.·'<r''"' .:.·• . \
r: '}' [}";:; ;;5,•.•c ·.·.. ··•·· > . . . .• . .•.. ··. .
°iJ ll~ll~ o{eflt~fl~O's(~iJ~,î/e~t<si ffufl ~·et ...
2). Pâ~î'·tout~e Îstil,tqfâJfffe ~~jf~y,U~
3)•."l'oir·t~Jj;v•i~~it\ ·t{ti"+illf•·~1~ f
4' ··1ioiir•Ù,iiùi~·~~RP•l'fü
,:,/_ "'._ ,,_-'!-'f-~,';-''_- ','
'_-,,- '._,>'è_- c-
114}1'1îJ.fl <:fltt+. vif.:
--.c",1-, 9-.,,1,-, '1.;'. 0
,_'-~- Jf

PREUVE. Elle est analogue au cas p = 2, et laissée au lecteur. ■

La propriété fondamentale suivante établit l'équivalence entre la convergence d'une suite


et 1~ convergence de la norme de la différence entre son terme général et sa limite.
925

PREUVE. Si p = 1, les propriétés sont équivalentes par définition même de la convergence


d'une suite. Supposons p = 3, le cas p = 2 étant strictement analogue. Si Un --, u, alors
comme
JJUn - ull2 = (Xn - x) 2 + (1/n - y) 2 + (Zn - z)2
on obtient limn-Joo 1111-n - ull2 = O. On sait de plus que la fonction cp : t H v't, de JR+ dans JR,
est continue en 0, et vérifie cp(0) = O. Par composition, on voit que

lim 1111-n -ull = lim cp(Jl11-n -uii2) = cp( lim llun -uJJ 2 ) = 0,
n---+oo n-+oo n--too

ce qui montre que si la suite converge, alors la suite des normes tend vers O.
Réciproquement, supposons 1111-n - uJJ--, O. Notons que

Il en résulte que limn-Joo lxn - xi = 0 par le théorème des gendarmes, et donc limn-Joo Xn = x.
Le même argument vaut pour les deux autres composantes, ce qui termine la preuve de
l'équivalence. ■

Cette équivalence permet de former une nouvelle définition pour la limite : une suite
(UnlnEN de JRP converge vers un vecteur u si et seulement si la distance 1111-n-uJJ de son terme
général à sa limite tend vers 0, ce qui correspond bien à l'intuition, et généralise de manière
naturelle la définition de la convergence dans R.

EXEMPLE 30.41. Déterminons la limite de la suite (unlnEN, où Un= (1 /n, (n + 1 )/n).


► La première composante de Un tend vers 0, la seconde vers 1 donc par définition Un --,
(0, 1). Vérifions à l'aide de la norme. Nous avons

donc on retrouve bien que lim Un= (0, 1).

IV.2. Limites et continuité de fonctions.


Nous allons maintenant passer au cas des limites de fonctions. Nous aurons d'abord besoin
de nouvelles définitions pour les parties de JRP.

IV.2.1. Quelques propriétés des parties de JRP

Commençons par la notion de boule ouverte, qui généralise celle d'intervalle ouvert de R.

Définition 30.42. Soit p E {1, 2, 3}. Soit a E IftP, et soit r E JR';_. La boule ouverte de centre
a et de rayon r est l'ensemble

B(a, r) = {u E IftP I JJu- a[J < r}.


926

De manière plus intuitive, si p = 1, B( a, r) = )a - r, a+ r[, les boules ouvertes sont donc


des intervalles. Si p = 2, la boule ouverte B (a, r) est le disque ouvert de centre a et de rayon
r. Enfin, si p = 3, B( a, r) est la région comprise à l'intérieur de la sphère de centre a et de
rayon r.
Définition 30.43. Soit a E JRP. Une partie V de JRP est dite voisinage de a s'il existe r > 0
tel que V contienne la boule ouverte B ( a, r).

Cette terminologie est un peu trompeuse. Il faut comprendre qu'un voisinage contient tous
les points « voisins » de a, et non qu'un voisinage ne contient que des points voisins de a.
Pour s'en convaincre, il faut voir que si V est un voisinage de a, toute partie W contenant V
est aussi un voisinage de a, en particulier W = JRP est un voisinage de n'importe quel point
a E JRP, pourtant il contient des points arbitrairement « éloigné » de a.
Terminons par une définition que nous serons appelés à rencontrer souvent.
Définition 30.44. Une partie O de JRP est dite ouverte lorsque pour tout point a de O, il
existe r > 0 tel que O contienne la boule ouverte B ( a, r). On dit alors aussi que O est un
ouvert de JRP.
En d'autres termes, une partie O est ouverte si elle est un voisinage de chacun de ses
points. Intuitivement, ceci traduit le fait que la partie O n'a pas de points à sa «frontière»,
ou encore qu'elle << entoure »chacun de ses points.

EXEMPLE 30.45. Etudions quelques parties de JRP.


► L'intervalle O = JO, 1[ est un ouvert de R En effet, si a E JO, 1 [, et si r = min( a, 1 - a)
(noter que r > 0), l'intervalle ]a - r, a+ r[, qui est une boule ouverte, est contenu dans O.
► L'intervalle I = [O, 1) n'est pas un ouvert de R En effet, si a = 1, pour tout r > 0, la
boule ouverte B ( a, r) =) u - r, a + r[ n'est pas contenue dans I.
► Dans 1R2 , le demi plan !?J' = {(x, y) 11! > O} est un ouvert. En effet, si a= (xo, 1Jol E !?J',
la boule B(u, r), avec r = y 0 > 0, est clairement contenue dans !?J'.
► Dans 1R 2 , le demi plan !?J'. = {(x, y) 11! 2: O} n'est pas un ouvert. En effet, si a= (0, 0),
aucune boule ouverte de rayons r > 0 centrée en a n'est contenue dans !?J'.

Voici maintenant une proposition souvent très utile, qui donne beaucoup d'exemples de
parties ouvertes.

Proposition 30.;,ffi. SmtP E {t,2;3}:Soit c E j,P et soît1' >'O. Aliîrs la' lJ<Jmtf ôfJll)/!Jrtê
'tJ( C, T) est Un OUfJerl âe JllP. . . . ..

PREUVE. Soit u E B(c, r). Alors lla-cll < r, donc p = r-lla-cll > O. Nous allons montrer
que la boule B(u, p) est contenue dans B(c, r). En effet, si u E B(u, p), alors

llu- cil= llu- a+ a - cll ::; llu- ail+ lia - cil < P + llu - cil = r

par l'inégalité triangulaire et la définition de p. Ceci montre que llu - cll < r, et donc par
définition que u E B (c, r). Comme u est arbitraire dans B ( a, p), on en déduit que B ( a, p) c
B(c, r). Ceci montre bien que B(c, r) est un ouvert. ■

Considérons maintenant une fonction f définie sur une partie D C JRP. Comme nous
voulons définir la notion de limite de f en un point a, il est raisonnable de demander que ce
point a puisse être approché aussi près qu'on le veut par des points de l'ensemble de définition
D de f. Ceci conduit à la définition suivante.
927

Définition 30.4 7. Soit p E {1, 2, 3} et D une partie de JR.P. On note D, et on appelle


adhérence de D, l'ensemble des u E JR.P tels qu'il existe une suite (UnlnEN d'éléments de D

qui converge vers u.

Remarque. Toute partie est contenue dans son adhérence. En effet, si a E D, a est limite
de la suite (UnlnEN définie par Un= a pour tout n EN (suite constante égale à a), dont tous
les éléments sont dans D. Donc par définition a E D. Ceci montre bien que D C D.

EXEMPLE 30.48. Etudions de nouveau quelques parties de JR.P.


► L'adhérence de l'intervalle O = JO, 1[ est O = [O, 1]. En effet, le point O est limite de la
suite (1/n lnEN*, dont les éléments sont dans O, il est donc dans O. De même, on voit que
1 E O. un ouvert de R Comme par ailleurs O C 0, ceci montre que [0, 1] subset O. Si
maintenant x > 1, il est clair que x ne peut être limite d'une suite d'éléments de 0, et on
a la même conclusion si x < 1. Donc O = [O, l]. De même, on vérifie que l'adhérence de
l'intervalle I = [O, 1] est égale à I. Ceci coïncide bien avec la définition de l'adhérence d'un
intervalle que nous avons déjà donnée.
► Dans JR. 2, l'adhérence du demi plan fYJ = {(x, -y) x > O} est !!JJ. = {(x,-y) x 2': O}.
1 1

► Dans JR. 2, l'adhérence de !!JJ. = {(x, -y) 1 x 2': 0} est !!JJ•.

IV.2.2. Limite d'une fonction à p variables.

Nous pouvons maintenant donner la définition de la limite dans le cadre des fonctions à p
variables, pour p E {1,2,3}. Nous allons commencer par le cas des fonctions à valeurs dans
R Comme nous allons le voir, la présente définition va généraliser celle que nous avons déjà
manipulée dans le cadre élémentaire des fonctions de lR. dans R

Définition 30.49. Soit p E {1, 2, 3}, soit D C JR.P, et soit f : D ---1 lR. une fonction. On
considère un point a E D. On dit que f a pour limite i E lR. au point a, suivant la partie D,
lorsque
Ve> 0, 3rJ > 0, Vu ED, (llu- ail:::: TJ) =} (llf(u) - EII:::: e).
On écrit alors limu-ta f(u) =t
Cette définition est très semblable à celle que nous avons vue pour les fonctions à une
variable, mais elle est en fait un peu plus générale. En effet, pour une fonction à une variable,
nous avons demandé qu'elle soit définie dans un voisinage épointé du point a. Ceci revient à
demander que le domaine de définition D contienne une partie de la forme ] a - €, a[ U] a, a+€[.
Dans ce cas, le point a est bien dans l'adhérence de D. Mais réciproquement, la partie D =
{1/n In EN*} est une partie de lR. telle que 0 E D, et ce n'est pas un voisinage du point O.
la notion de limite que nous introduisons ici est donc plus générale, puisqu'elle vaut pour des
fonctions définies sur des parties plus générales.

EXEMPLE 30.50. Soit la fonction f de D = {1/~I n EN*} dans lR. définie par f(l/n) =
1 (n + 1 )/n. Alors f admet une limite au point O E D, et cette limite est 1.

Il faut aussi prendre garde au fait que la limite dépend de la partie D considérée, ce que
l'on rappelle en parlant de limite suivant la partie D.
928

EXEMPLE 30.51. Soit la fonction f de [-1, 1] dans lR définie par f(x) = 1 si x f= 0, et


f(O) = O. Alors, si D = [-1, 1] \ {O}, f admet en O une limite, et cette limite est 1. En
revanche, si maintenant D = [-1, 1], f n'admet pas de limite en O.

On prendra garde au fait que dans le cas des fonctions de lR dans JR, nous avons impli-
citement défini la notion de limite suivant le voisinage épointé. En d'autre termes, nous ne
voulions pas tenir compte de la valeur éventuelle de la fonction au point considéré.
L'intérêt de supposer que le point a est dans l'adhérence du domaine de définition est
illustré par la proposition fondamentale suivante.

PREUVE. Supposons d'abord que limu--la f(u) = t Fixons E. > 0 et prenons une suite (Un)nEN
d'éléments de D convergeant vers a (il en existe, puisque a E D). Appliquons la définition de
la limite de la fonction f. Il existe T] E JR~ tel que pour tout u E D vérifiant llu - ail :::; T],
alors llf(u) - fll :::; E.. Maintenant, comme la suite (UnlnEN converge vers a, il existe n 0 E N
tel que pour n 2 no, lia - 1.1.nll :::; T]. Donc pour n 2 no, on aura lf(1.1.n) - Cl :::; E.. Mais ceci
montre que la suite (f(1.1.nlln converge vers C.
Pour montrer la réciproque, supposons que la fonction f ne possède pas la limite Cau point
a. Alors il existe E. E JR~ tel que pour tout T] E JR~, il existe u E D tel que llu - all :::; T] et
lf(u)-CI > E.. Pour n EN*, posons T] = 1/n. Il existe alors Un ED tel que 111.1.n-all:::; 1/n et
lf(Un) - Cl> E.. Considérons la suite (unlnEN*· C'est une suite d'éléments de D, qui converge
vers a, puisque 111.1.n - ail---, 0, et qui vérifie llf(1.1.n) - CIi 2 E. pour tout n EN*. Ceci montre
la réciproque par contraposition. ■

f1!' ..f ,f.;g, :·re. , .


sommé
.sifefg
> . ·.·.•··•·· .··.··•··.•· ".
êt. ~~f9·P'1.~tmtaî!Ssi 4eJi lïmitef ~Cl sui;t1o;rjt. P~ ~t···
ii;1f~;J~~ijfj
"'.,_-,< < -~ <-_

liniÜgJ{û)
U-fa . .
~ (littff{~iïf~.!){1,J.}}(
. . . u--ta • .U--Hl, .
..•.

PREUVE. Elle est immédiate à partir de la proposition précédente, et laissée au lecteur. ■

EXEMPLE 30.54. Considérons la fonction f: (lR+J2 \ {(0, 0)} définie par

Xa.ll
f(x, -y)= -2--2•
X +-y

où ( a, b) E [1, +oo[2 . On se demande si f a une limite au point (0, 0) suivant D = (lR+J2 \


{(0,0)}. Lorsque nous regardons les fonctions partielles x H f(x,O) = 0 et -y H f(O,-y) = 0,
nous voyons que le seul candidat possible pour la limite est la valeur O (considérer par exemple
les suites de termes généraux (1/n,O) et (0, 1/n), pour n EN*), ce qui peut donner envie
de répondre de manière affirmative.
Cependant ce n'est pas toujours vrai. Prenons par exemple une suite de la forme
(1/n, k/n), où k > 0 est fixé. On a (1/n, k/n)---, (0,0), mais f(l/n, k/n) = (l+kz~a+b-l ne
929

tend vers O que si a + b > 2, c'est-à-dire (dans notre cas) lorsque ( a, b) =/- (1 , 1) . Donc si
(a, b) = (1 , 1), la fonction considérée n'a pas de limite en (0, 0).
Pour démontrer que lorsque a+ b > 2, la limite en (0, O) de f est 0, il faut encore
travailler un peu. ·La méthode générale consiste à majorer lf(x, y)I par un terme de la forme
cp ( 11 (x, 1J) Il), où cp tend vers O en O. Procédons ainsi

0 0
· If( )I < lxl l1:1lb < ll(x, 1J)ll ll(x, Ylllb = ll(x y)llu+b-2
x,y - ll(x,1:1)II 2 - ll(x,1:1)II 2 ' ·

Revenons à la définition. Soit E > O. Choisissons T] = E l/(a+b-l), alors T] > O. Si (x, y) E D


satisfait llx, y) Il < T], on voit que lf(x, y)I S E, ce qui montre bien que la limite de f en (0, 0)
suivant D est O.
6
C')

EXEMPLE 30.55. Voici un exemple plus subtil. Considérons la fonction f définie sur D =
.d
ü
JR. 2 \ {(O, O)} par l'expression f(x, y) = 1 si 1J = x 2 et f(x, y) = 0 dans tous les autres cas.
Comme f(x, 0) = f(O, y) = 0, pour tous x et y non nuls, la seule limite possible est O. Si
l'on considère des termes sur la droite 1J = kx avec k E JR* fixé, on a f(x, y) = 0 sauf
lorsque x = k, ce qui est exceptionnel. Donc si (UnlnEN est une suite d'éléments de cette
droite tendant vers (0, 0), on aura également f(un) ----, O. Pourtant, si l'on considère la suite
de terme général Un= (1/n, 1/n2), on voit f(un) = 1 alors que (UnlnEN tend vers O. Ceci
montre que la fonction considérée n'a pas de limite en O.

IV.2.3. Continuité des fonctions à p variables

Nous pouvons maintenant donner la définition de la continuité des fonctions de JRP dans JR.k.
Comme pour les limites, notre définition sera légèrement plus générale que celle que nous
avons déjà rencontrée dans le cas p = 1, puisque nous considérons maintenant des fonctions
définies sur des parties quelconques.

Définition 30.56. Soit D une partie de JRP. Soit f : D ----, JR.k, u E D. On dit que f est
continue en u si la limite de f en u suivant D existe et vaut f(u). On dit que f est continue
sur D si elle est continue en tout point de D.

Donnons d'abord un exemple trivial.

EXEMPLE 30.57. Toute fonction de N dans lR est continue. En effet, il suffit d'appliquer la
définition de la limite en un point n E N pour voir que limu-rn f(u) = f(n) (on choisit par
exemple T] = 1/2).

Comme pour les limites, la continuité est stable par les opérations élémentaires.

fr~ttJ~iî ~.;s., ~?~~~J~~t ·c1ff~t.'J:i#in ff>~F#~:deJr't!~i~


e;intîii,uê}1,ù11oitiÙ1 é ... . ~·r+g cetfg s~rtf. ùeiJ#fttPfJief4, sud ü.stlnircôriitffei&Uf!IJ
sur~O/m· summê et le,produit~st,m rontinrwt.surO: . . . . . . . . . . . . . ..
PREUVE. Conséquence immédiate de la proposition analogue pour les limites.

930

EXEMPLE 30.59. Considérons une fonction polynôme à deux variables, c'est-à-dire une
fonction de la forme
P: (x, y) H L
aiixi-yi,
O<::i,i<::n
où les termes aii sont réels, et montrons que P est continue en (0, 0). En vertu de la proposition
précédente, il suffit pour cela de montrer que chaque fonction monôme (x, y) H aiixi-yi est
continue. Mais chaque monôme s'exprime comme produit à partir des fonctions (x, y) H x et
(x, y) H y, qui sont continues. Il est donc aussi continu, encore par la proposition précédente.

EXEMPLE 30.60. La fonction norme N: JRV--, lR définie par N(x,-y) = llx, 1111 est continue
sur JR 2 . En effet, au point (x 0 , -y 0 ), l'inégalité triangulaire conduit à

lll(x,11lll-ll(xo,11ollll:::; ll(x-xo,11-11olll,
et lorsque (x, y) --, (x 0 , -y 0 ), le terme de droite tend vers (0, 0), celui de gauche aussi. On en
déduit aisément la continuité au point (x 0 , -y 0), et donc la continuité sur JR 2.

IV.2.4. Limite et continuité des fonctions à valeurs vectorielles

Comme nous l'avons déjà vu dans l'étude des arcs plans, l'étude des fonctions vectorielles se
fait immédiatement au moyen de leurs composantes.

Définition 30.61. Soit Dune partie de JRV, avec p E {1,2,3}, et soit f: D--, lRq, avec
q E {1,2,3}. On note fi: D--, lR les composantes de f, pour 1:::; j:::; q. Soit a ED. On dit
que f tend vers e E lR q au point a, suivant D, si et seulement si chacune des fonctions fi
tend vers ri au point a suivant D, pour 1 :::; j :::; q, où l'on a noté fi les composantes de e.

Comme nous l'avons déjà montré dans la partie 1.1, il est facile de relier notre définition
de la limite à l'intuition usuelle.

{l
Proposition 3().63. Sôit D tint partie tJe RP; )ivet v•e ,:Z, 3}, et JJoitf ~ 1)-+ R<1, à11ec
q E {t, 2~ 3}. Alors f ·a pour limite t E JR<1 -au point tt, ~iint D, si èt;seulernent si ·_.· .
lim l!f(u) -
u-n1
tH ='lk

PREUVE. Elle est maintenant immédiate. ■

Enfin, la continuité se définit de manière analogue.

Définition 30.63. Soit Dune partie de JRV, avec p E {1,2,3}, et soit f: D--, lRq, avec
q E {1, 2, 3}. On note fi : D --, lR les composantes de f, pour 1 :::; j :::; q. On dit que f est
continue au point a E D, si chacune des fonctions fi est continue au point a suivant D. De
manière équivalente, f est continue au point a si

lim llf(u) - f(a)II


u->a
= O.

On dit que f est continue dans D si elle est continue en tout point de D.
931

V. CALCUL DIFFÉRENTIEL À 2 ET 3 VARIABLES.


Il y a deux points de vue équivalents pour la dérivée pour les fonctions d'une variable. Le plus
simple consiste à écrire
f'( ) _ r f(xo + h) - f(xo)
xo - h1.!fli h '
quant au second, il consiste à écrire

f(x 0 + h) = f(x 0 ) + f'(x 0 )h + hé:(h),


avec lim 0 E = O. Le premier point de vue consiste en la limite d'un taux d'accroissement et
présente quelques difficultés pour la généralisation à une fonction à plusieurs variables (en
effet, comment diviser par h qui sera alors un vecteur?). Le second point de vue consiste en
l'approximation locale de la fonction f par une fonction affine x H f(xo) + f'(xo)(x - Xo) au
voisinage de x 0 , et nous allons voir que cette approche se généralise aux fonctions de plusiseurs
variables.

V.1. Dérivées partielles des fonctions à deux variables


Nous allons montrer dans cette partie et la suivante comment généraliser la notion de dérivée
au cas des fonctions à 2 variables. On considère un ouvert Q de JR 2 et un point a de 0, (on
écrira a= (x 0 , y 0 )). Comme nous l'avons vu, l'ouvert Q « n'a pas de bord», et le point a est
donc « entouré »par 0, c'est une condition nécessaire pour une définition satisfaisante de la
notion de dérivée. Soit f une fonction de Q dans R
Une idée naturelle pour se ramener au cadre des fonctions à une variable est de fixer l'une
des coordonnée x 0 ou 1:Jo du point a et d'introduire les deux fonctions dites « partielles »obte-
nues en faisant varier l'autre coordonnée. Plus précisément, ces deux fonctions partielles sont
les suivantes

Notons que nous n'avons pas donné leur domaine de définition. Comme Q est ouvert et a E Q,
il existe un rayon r > 0 tel que le disque B(a, r) soit contenu dans O. La fonction f1al est donc
définie sur l'intervalle lxo = Jxo-r, xo+r[, et fia) est définie sur l'intervalle 1110 = ]y 0 -r, y 0 +r[.
Ces fonctions sont toutes deux à valeurs réelles, comme f. Notons aussi que nous avons rappelé
en indice la coordonnée qui varie, et en exposant le point a initial (bien qu'en apparence une
seule de ses coordonnées intervienne dans chaque expression).
Il est facile de déterminer les graphes des applications partielles ainsi définies. Plaçons-
nous pour simplifier dans le cas où Q = JR 2 , alors lxo = lR et 1110 = R Le graphe de f1al est
par définition
G(f1al) = {(x, f1al(x)) 1 x E lR} = {(x, f(x, 1:!oll l XE lR}.
Il peut être identifié à l'intersection du graphe de f avec le plan 9(11ol d'équation y = y 0 . En
effet le graphe de f est G(f) = {(x, y, f(x, y)) (x, y) E JR 2 } et donc
1

G(f) n 9(11ol = {(x, 1:Jo, f(x, 110)) I x E lR}.


En oubliant la deuxième coordonnée 1:Jo dans l'écriture précédente, on voit que le graphe
G(f1al) et la partie G(f) n 9(11 ol = {(x, 1:Jo, f(x, y 0 )) x E JR 2} coïncident. L'omission de la
1

deuxième coordonnée revient simplement à identifier le plan 9(11ol à JR 2 . De la même manière,


le graphe de l'application partielle fia) s'identifie à l'intersection du graphe de f avec le plan
9(xol d'équation x = Xo. La figure 30.12 illustre ce que nous venons de décrire.
932

Les dérivées partielles de l'application f au point a peuvent maintenant être définies de


manière naturelle.
Définition 30.64. La dérivée partielle de f par rapport à x en a est par définition la dérivée,
f
lorsqu'elle existe, de la fonction partielle x H f(x, 1Jo) au point xo. On note alors (a) cette
dérivée partielle. On définit de même : (a) comme la dérivée, lorqu 'elle existe, de la fonction
d'une variable 1J H f(x 0, 1J) au point Xo.

Ainsi, le calcul des dérivées partielles en un point consiste à fixer une variable à la valeur
qu'elle prend en ce point, à dériver par rapport à l'autre variable, et à considérer le nombre
dérivé obtenu lorsque cette autre variable prend la valeur qu'elle a au point considéré. Le
problème de l'existence des dérivées partielles ainsi que leur calcul peut donc se traiter par
les moyens bien connus, issus de l'étude des fonctions de lR dans JR.

1J

G(f)

XQ
a
X

FIGURE 30.12. Graphe de l'application partielle f~a)

f
En suivant notre illustration géométrique précédente, la dérivée partielle (a) s'interprète
comme la pente de la tangente au point d'abscisse x 0 à la courbe obtenue comme intersection
du graphe de f avec le plan &,o (Yo l ; et la dérivée partielle : (a) est la pente de la tangente
en 1Jo à la courbe obtenue comme intersection du graphe de f avec le plan &,o(xal, comme le
montre la figure 30.13.

FIGURE 30.13. La dérivée partielle ~(a)

EXEMPLE 30.65. Considérons la fonction u définie sur (R\__)2 par u(x, 1J) = x"1)f3, où a
et f3 sont deux paramètres strictements positifs. Déterminons les dérivées partielles de u en
un point (xo, 1Jo) E (lR"t-)2, Pour la première dérivée partielle, on fixe 1J à 1Jo et on regarde
933

la dérivabilité de x H x<Xyg. Cette fonction est dérivable de dérivée x H cxx"'-\,g, par


conséquent ~~(xo, Yol existe et vaut :

au( )_ _ u(xo, Yol


Yo13 -
.x-i
-a
X
Xo,Yo - <XXo
Xo
.

De même ' ôu(x


ôy o, y 0 ) existe et vaut u(Xo,1lol
110 •

Nous sommes habitués à interpréter la dérivée en un point d'une fonction à une variable
comme la pente de la tangente à son graphe en ce point. La notion de dérivée partielle en
découle assez facilement. Mais nous n'avons pas encore construit l'objet qui serait l'équivalent
pour les fonctions à 2 variables de la droite tangente au graphe, dans le cas des fonctions à ci
C')
une variable. Cet objet doit certainement être « de dimension 2 », donc un plan, et il faut .d
donner des conditions pour que ce plan soit tangent au graphe. ü
Avant de définir convenablement ce plan tangent, nous allons essayer d'en deviner l'équa-
tion au moyen des dérivées partielles que nous venons d'introduire. Considérons de nouveau
le point a= (x 0 , y 0 ) E O. L'idée très simple est que si P est le plan tangent au graphe de f
au point a, l'intersection de P avec le plan 9(Xo l doit être la droite tangente à l'intersection
du graphe de f avec 9(Xol, c'est-à-dire au graphe de l'application partielle f~a); et de même
l'intersection de P avec le plan 9(1101 doit être la droite tangente à l'intersection du graphe de
f avec 9(wl, c'est-à-dire au graphe de l'application partielle f~aJ_ Comme ces deux tangentes
se coupent en (a, f(a)) et ne sont pas confondues, elles définissent bien un plan, qui sera le
plan tangent. Mais nous avons vu que les pentes de ces droites sont précisément les deux
dérivées partielles. Si l'on connait ces dérivées partielles, on connait les équations des droites
tangentes (ou simplement leurs vecteurs directeurs) et il est alors facile de former l'équation
du plan tangent.
Cherchons maintenant les vecteurs directeurs des tangentes. La tangente D 11 à l'intersection
du graphe de f avec 9(Xol est contenue dans 9lXol, donc la première composante du vecteur
tangent est nulle, et sa pente dans 9(Xol est donnée par : (a). Le vecteur tangent U 11 s'écrit
donc
U 11 = ( 0, 1, :: (a)).
De la même manière, la tangente Dx à l'intersection du graphe de f avec 9(1101 est contenue
dans 9(11ol, donc la deuxième composante du vecteur tangent est nulle, et sa pente dans 9l1iol
est donnée par ~(a). Le vecteur tangent lix s'écrit donc

Le plan tangent TT au graphe de f au point a est donc le plan passant par le point ( a, f (a)),
de vecteurs directeurs lix et U 11 • Pour en avoir une équation cartésienne, on écrit simplement
son vecteur normal
af af )
N = lix /\ U11 = ( - ax (a), - ay (a), 1

et on obtient l'équation de TT en écrivant que son point courant (x,y,z) est tel que le vecteur
(x-xo,Y-Yo,z-f(a)) soit orthogonal à N, soit
934

Essayons maintenant une autre approche. Prenons une fonction f : Q -, R qui admet des
dérivées partielles au point u E Q et livrons-nous à un calcul (non rigoureux, mais qui le
sera rendu plus tard sous certaines conditions). Supposons que l'on fasse subir à x 0 et y 0 des
petites variations en leur ajoutant les réels (supposés très petits) ôx et ôy. On obtient alors
en utilisant la définition des dérivées partielles, et en omettant les termes o
of
f(xo + ôx, Yo + ôy}:::::: f(xo, Yo + ôy) + ox (xo, Yo + ôy)ôx::::::

of of of
f(xo, Yo + ôy} + ox (xo, Yo)ôx :=:::: f(xo, Yol + oy (xo, Yo)ôy + ox (xo, Yo}ôx.

Nous avons successivement appliqué la définition de la dérivabilité de f par rapport à x au


point (x 0 , y 0 + ôy) et négligé le terme o; ensuite nous avons approché ~(xo, Yo + ôy)ôx par
~ (x 0 , y 0 )ôx (ce qui se justifie si ~ (x 0 , y 0 + ôy) - ~(xo, Yol est du même ordre de grandeur
que ôx et ôy, et donc le produit de cette différence avec ôx est négligeable); et enfin nous
avons appliqué la dérivabilité par rapport à y en (xo, Yol-
Oublions maintenant que ôx et ôy sont petits, notons-les hx et hy, et définissons l'appli-
cation A de R 2 dans R par
é)f é)f
A(hx, hy) = f(u) + ox (u) hx + oy (u) hy.

Nous obtenons donc ainsi une application affine, définie dans R 2 tout entier, qui va être la
meilleure approximation affine possible au voisinage de u pour l'application initiale f. Nous
avons donc ainsi trouvé l'analogue pour les fonctions à deux variables de ce que nous avions
construit pour les fonctions à une variable. Le graphe de cette fonction <D est, comme on le
voit, précisément le plan tangent au graphe de f que nous avons introduit plus haut. Les deux
approches donnent donc le même objet tangent, ce qui est satisfaisant.
Bien entendu, rien de ce qui précède n'est vraiment rigoureux. Nous allons dans ce qui suit
définir les fonctions dérivables en u comme celles pour lesquelles le procédé que nous venons
de décrire est justifié.

V.2. Différentielle d'une fonction à deux variables


On notera que l'application l: (hx,hy) H ~(u)hx+ ~(u)hy est linéaire, et c'est ce qui
conduit à la définition suivante. Si Q est un ouvert de R 2 et si u E 0, on note Q- a l'ensemble
{x - a I x E Q}. Comme Q contient une boule ouverte de la forme B (a, r}, avec r > 0, Q - u
contient la boule B(O, r) (puisque B(O, r) = B(u, r} - u), et donc Q - a est un voisinage de O.

Définition 30.66. Soit Q un ouvert de R 2 , a= (x 0 , Yol un point de 0, et f une fonction


de Q dans R On dit qu'une application f est différentiable en a s'il existe une application
l linéaire et une fonction E : Q - a -, R continue et nulle en 0, telles que

f(u+ h) = f(u) + l(h) + llhlldh).


Notons qu'il est possible de parler de continuité de E en 0, puisque E est bien définie en O.
En utilisant la notation de Landau que nous avons déjà rencontrée plusieurs fois, l'expression
peut encore s'écrire
f(u+ h) = f(u) + l(h) +o(llhll).
La proposition suivante est au cœur de la notion que nous cherchons à définir.
935

PREUVE. Si nous avons deux applications linéaires vérifiant L, et l2 l'égalité de la définition,


il est possible d'écrire

d'où une égalité de la forme

pour tous les h voisins de O. Prenant d'abord h sous la forme (t, 0) (t > 0 petit destiné à
tendre vers 0), nous avons

soit en divisant par t et tenant compte de la linéarité de L, et l2

En faisant tendre t - t o+, on trouve L 1 ( 1, 0) = L 2 ( 1, 0) par unicité de la limite. De même, on


démontre que L1 ( 0, 1) = l2 (0, 1) . Ainsi les applications linéaires L1 et l2 sont égales sur une
base de JR. 2 , donc sont égales. ■

Définition 30.68. Si la fonction f est différentiable en a, on note d 0 f l'unique application


linéaire L satisfaisant l'égalité

f(a + h) = f(a) + duf(h) + o(llhlll


et on l'appelle différentielle de f au point a .

. \11l'll(Ïull Linéarité
Il faut bien voir que c'est l'application h H d 0 f(h) qui est linéaire, et non l'application
a H d 0 f(h).

La notion de différentielle pose deux difficultés. La première est la question de son existence,
et, lorsqu'elle existe, la deuxième est celle de sa détermination. Nous allons voir qu'heureuse-
ment ces questions peuvent, dans les cas usuels, se résoudre à l'aide des dérivées partielles.
Etudions d'abord un exemple trivial.

EXEMPLE 30.69. Cas où f: JR. 2 -t lR est linéaire.


► Alors f est différentiable en tout a E JR. 2 , et duf(h) = f(h) (soit duf = f). En effet, par
linéarité, on a
f(a + h) = f(a) + f(h),
Prenant dans la définition L = f (qui est bien linéaire) et E = 0, on voit que la définition de
la différentiabilité est satisfaite, et que d 0 f = L = f.

Voici comment déterminer la différentielle à partir des dérivées partielles, si l'on sait qu'elle
existe.
936

PREUVE. Démontrons la première relation. Pour cela, prenons h = (t, 0) dans la définition
de la différentielle, et posons ex( t) = E( t, 0). Alors ex est une fonction d'une variable, continue
et nulle en 0, et nous avons

f(xo + t, Yol = f(xo, Yol + daf(t, 0) + lticx(t) = f(xo, Yol + tdaf(l, 0) + ltlcx(t),
ce qui montre bien que f(xo+t,Yotf(xo,Yol tend vers d 0 f(l, 0) lorsque t tend vers 0, on en déduit
donc que *(a) = d 0 f(l,0) par définition. La démonstration de la deuxième relation est
identique. La troisième se déduit des deux précédentes, puisque la linéarité de d 0 f implique

La proposition précédente montre en particulier que la matrice

af(a)
( ax
n'est autre que la martice de l'application linéaire d 0 f dans la base canonique ((1,0),(0, 1))
de JR 2 (au départ) et la base canonique (1) de JR, à l'arrivée. Cette matrice s'appelle la matrice
Jacobienne de f au point a, et se note Jacf(a).
Avant d'aller plus loin dans l'étude de la différentiabilité, nous allons élargir la cadre au cas
des fonctions de trois variables (il serait possible de considér des fonctions d'un nombre quel-
conque de variables, mais nous nous limiterons à trois pour permettre une intuition commode
des divers objets considérés), et à valeurs dans ]RQ, avec q E {1, 2, 3}.

V.3. Différentiabilité des fonctions de JRP dans ]RQ

Tout ce qui a été dit pour les fonctions de JR 2 s'étend sans aucune difficulté au cas des
fonctions à 3 variables, à valeurs réelles, comme nous allons le voir. Pour les fonctions à
valeurs vectorielles, il suffira simplement d'adapter ce qui précéde aux fonctions composantes,
qui sont à valeurs réelles.

V .3.1. Fonctions de JRP dans JR, p E {l, 2, 3}

Soit .Q un ouvert de JR 3, a= (xo, y 0, z0) un point de flet f une fonction de .Q dans R Alors
il existe un rayon r > 0 tel que la boule B ( a, r) soit contenue dans fl. Il est possible de
définir trois applications partielles au point a, sur lx= ]x 0 - r, x 0 + r[, 111 = ]y 0 - r, y 0 + r[,
Iz =lzo -r,zo + r[, par
937

pour x E lx, 1J E 111 et z E Iz respectivement. Lorsque ces applications partielles sont déri-
vables, on en déduit les dérivées partielles correspondantes

Notons que Q - a= {x - a I x E Q} est un voisinage de O dans IR 3 . On dit que la fonction f


est différentiable au point a lorsqu'il existe une application linéaire l : IR 3 --, IR qui vérifie

f(a + h) = f(a) + l(h) + llhlldh)


pour h E Q - a, où ,: est une fonction dans Q - a, nulle en O et continue en O. Comme
pour les fonctions à deux variables, on montre facilement que l est unique si elle existe.
Cette application s'appelle la différentielle de f au point a, et se note daf. Donc daf est une
application linéaire de IR 3 dans IR. On a encore la proposition suivante.

La démonstration est analogue à celle que nous avons donnée pour les fonctions à deux
variables. Enfin, la matrice

Jacf( a)
af
= ( ôx (a) ôf
ôz
(al)
est la matrice de daf dans les bases canoniques de IR 3 et IR, c'est la matrice Jacobienne de f
au point a.
Enfin, il est clair que lorsque p = 1 , la définition que nous avons donnée pour la différen-
tiabilité coïncide avec celle de la dérivabilité. Une fonction f définie au voisinage de a E IR et
à valeurs dans IR est dérivable en a si et seulement si il existe un réel ex tel que

f(a+ h)-f(a) = cxh+o(h).


La fonction daf est alors définie par daf(h) = ex h, et par convention peut encore ecnre
ex= ~(a). La matrice Jacobienne de f en a est la matrice de daf dans la base (1) de IR au
départ et à l'arrivée, donc
Jacf(a) = [ex].

V.3.2. Fonctions à valeurs vectorielles

Considérons maintenant une fonction définie sur un ouvert Q de IRP, p E {1, 2, 3} et à valeurs
dans IR q, pour q E {1, 2, 3}. La donnée de f est donc équivalente à celle de ses q applications
composantes f = (f 1, ... , f q). Ces composantes sont des fonctions de IRP dans IR, on peut donc
définir les applications dérivées partielles en un point a de 0, ainsi que leur différentiabilité
en un point. Il serait possible de définir la différentiabilité de f au moyen de la différentiabilité
de f des composantes. Mais nous allons en donner une définition globale équivalente.
938

Définition 30. 72. On dit que la fonction f est différentiable au point a s'il existe une
application linéaire l de JRP dans lR q et une application E définie dans Q - a, à valeurs dans
lRq, continue et nulle en 0, telles que pour tout h E Q - a,

f(a+ h) = f(a) + l{h) + llhlldh)


Vérifions immédiatement l'équivalence des définitions.
a
Propositîoo •·so.rs. ·La fonction{ esftdi/fé:rnntfabte. au• Pf)tlrtt si et seulemeflt Si· ses tôf!I,~
posantes fi, ... , fq sont différentiables au point a. La différentielle de la composante fi en a
est la composante d'indice j de la différentielle daf, pourl S j :5 q.
PREUVE. Supposons d'abord f différentiable en a. Notons d 0 f = ((daf)1, ... , (daf)q) les
composantes de daf. Alors les applications (dafli : JRP --) lR ainsi définies sont clairement
linéaires. Ecrivons aussi E = (E 1, ... , Eq) les composantes de la fonction E. Compte tenu de la
définition de la continuité des fonctions à valeurs vectorielles, on sait que chaque composante
Ei est nulle en O et continue en O. Pour 1 S j S q, on peut écrire l'égalité entre composantes
fi(a+ h) = f(a) + (dafli{h) + llhllEi(h)
qui prouve donc que fi est différentiable en a, avec da(fi) = (daf)j.
Réciproquement, si fi est différentiable en a pour 1 S j S q, on peut écrire une égalité
fi(a + h) = f(a) + da(fi)(h) + llhllEi(h)
où Ei est nulle en O et continue en 0, et où da(fi) est une application linéaire de JRP dans R
L'application l = (da(f1l, ... , da(fq)) est clairement linéaire de JRP dans lRq, et si on pose
E = (E1, ... , Eq), on obtient

f(a+ h) = f(a) + l(h) + llhlldh)


et donc f est différentiable en a (puisque E est continue et nulle en 0), avec Daf =L ■

Définition 30.74. La matrice Jacobienne de f en a est la matrice de daf dans les bases
canoniques de JRP et lRq, c'est la matrice à q lignes et p colonnes dont les éléments sont les
dérivées partielles des applications composantes de f.

EXEMPLE 30. 75. Donnons quelques cas particuliers.


► Si p = 3 etq = 2, puis si p = 2 et q = 3, on obtient respectivement

éH1(a) éH1(a)
ox oy
Jacf(a) =

ôf3(a) 2.h(a)
ox ay
► Si p = 1 et q = 2, puis si p = 1 et q = 3, on obtient respectivement

ôfl(a))
Jacf(a) = ax ' Jacf(a) =
( ôf2(a)
ax
llit
ax al
939

V.3.3. Propriétés des applications différentiables

Commençons par une proposition de démonstration immédiate.

Passons maintenant à une propriété beaucoup plus intéressante, qui concerne la composi-
tion des applications différentiables. On introduit un nouvel entier r E {1, 2, 3}.
0

~~-~;:;~, ~::~~t:J~;~~'.i:~~
O')
.d
ü

. ê1if{~};;Â~rs gôft!sl1 , ·.tio.blèen

y;<,c C ~~"fij iWt~~ (Îf{~j~h;i!t?


Avant de démontrer ce théorème, nous allons d'abord en commenter un peu le résultat. La
formule de composée des différentielles est très intuitive, on l'énonce simplement en disant que
la différentielle d'une composée est la composée des différentielles. Il faut simplement prendre
garde au fait que c'est une égalité entre applications linéaires, exprimant ainsi que pour tout
h E JRP,

Constatons aussi que si f et g sont des fonctions à une variable et à valeurs réelles, nous
retrouvons la formule de la dérivée d'une composée. En effet

(go f)'(a) = d(g of)a(ll = dgf(a)(dfa(lll = g'(f(a)) · (dfa(ll) = g'(f(a))f'(a).


Venons en à la démonstration, qui commence par un lemme technique, qui sera fondamental
dans le cours de L2.

;~~•q•ûn.?~~ônt.tttf.lÎfeJ fi ~ri, 11ltî~:~11,nte c: ~ b


'S_-& ::.s;;:1-sf::"\~-f,;'~~;l~\ 1
- ,~'.c-t~/~~f,),>,~ ~"t];; ,_ - _:tt~;--< ~-0.?i<:~~!

· · 1t1tttlff ~ êl11t1l.
PREUVE. Nous allons faire la démonstration avec p = q = 2 pour fixer les idées, mais bien
entendu les arguments restent valables pour tous p et q. Notre application linéaire prend la
forme l(x 1, x 2) = (l 1(xi, x 2), l2(x 1, xz)), avec li(x1, x2) = aux1 + auxz. On a successivement,
en majorant simplement lh;I par 11h11, la majoration:

et donc:
2 2
2
lll(h)ll2 = L_(li(h)) 2 :S llhll L_(lai1I + laulJ2,
i=l i=l

et ainsi on peut poser C = L~=1(lai1I + luul)2. •


940

Montrons maintenant le théorème 30. 77.


PREUVE. Pour h assez proche de a, de sorte que tous les objets existent, on peut écrire

(go f)(a + h) = g(f(a) + df a(h) + llhllt:t(h)).


Posons provisoirement k = df 0 (h) + llh\lt:t(h). Ce terme tend vers O lorsque h tend vers O.
Nous avons alors

(go f)(a + h) = g(f(a) + k) = g(f(a)) + dgt(aJ(k) + llkllt: 9 (k),


qui grâce à la linéarité de d9t(al peut s'écrire

Nous reconnaissons l'application linéaire h H dgt(aJ(df 0 (h)) qui est notre bon candidat pour
être une différentielle. Il faut alors montrer que

C'est un calcul un peu fastidieux. Pour le premier terme, c'est trivial dans la mesure où lorsque
h tend vers 0, il en est de même de Et(h), et donc de dgt(aJ(Et(h)) d'après le lemme 30.78.
Ainsi, il vient bien

Pour le second terme, comme lorsque h tend vers 0, k tend vers O également, on sait déjà que
t: 9 (k) tend vers O. On note alors que

k = df 0 (h) + llhllt:t(h) = 11h11 ( df a ( 11~\I) + Et(h)) ·

Mais, en vertu du lemme 30. 78, on voit qu'il existe une constante C > 0 telle que puisque
lldfa{h/llhll)II ~ C, et de plus Et(h) tend vers O. Ainsi pour h assez proche de 0, on aura la
majoration llkll ~ llhll(C + 1). Il en résulte que pour h assez proche de 0

qui est bien de la forme souhaitée, puisque (C + 1) Il t: 9 (k) Il ---) 0 lorsque h ---) O. d'où notre
résultat. ■

Voici maintenant un corollaire immédiat, mais important, du théorème 30. 77.

·:~~T4i~
J~'tgêcf)t Q}';.;;; ~q(f{éJ}j~;i{iiÎf\ ; ,·•
PREUVE. Il suffit d'utiliser la définition des matrices Jacobiennes, et la relation entre produit
de matrices et composition des applications linéaires. ■

Nous allons traiter quelques exemples représentatifs.


941

EXEMPLE 30.80. Nous allons calculer ici la dérivée partielle d'une fonction composée. Pour
fixer les idées, disons que les fonctions f et g sont définies dans JR 2 à valeurs dans JR 2, et l'on
suppose f différentiable en a= (x 0 , y 0 ) E JR 2 et g différentiable en f(a). On veut calculer la
dérivée partielle o(~:fl (a).
► On sait que g o f est différentiable par composition, et donc on peut écrire

o(gof)
ox (a)= d 0 (g o f)((l0)) = df(alg(d 0 f(l,0)) = df(al9 (of
ox (a) ) .
Soit
o(g Of) (a)= og (f(a)) of1 (a)+ og (f(a)) of2a),
ox ox ox ox ox
où f = (f 1, f 2) (les fi sont à valeurs réelles).

EXEMPLE 30.81. Soit f : JR 2 ----) lR différentiable, a= (a 1, a2) E JR 2 fixé et cp: t H f(ta).


On veut calculer la dérivée de cp.
► Notons que cp est une fonction réelle d'une variable réelle, mais cp est définie comme une
composée faisant intervenir une fonction définie sur JR 2 , pour calculer la dérivée de cp nous
avons besoin de passer par la différentielle. On constate que cp =fol, où lest l'application
linéaire (donc différentiable) l( t) = ta. Par conséquent

V.4. Les théorèmes d'inversion locale et des fonctions implicites.


Nous allons présenter succinctement les théorèmes d'inversion locale et des fonctions impli-
cites. Ces théorèmes seront revus en détail dans le cours de L2 et surtout L3, le but est seule-
ment ici d'introduire les idées. Ainsi, on va se contenter d'une introduction non rigoureuse,
mais qui permet de comprendre une fois encore le rôle du calcul des dérivées en termes de
meilleure approximation locale. Nous donnerons sans démonstration les théorèmes justifiant
nos approches intuitives, ces théorèmes seront revus de manière approfondie par la suite.

V.4.1. Introduction au théorème d'inversion locale.

Soit f une fonction définie sur une partie Q de JRP, a E O de sorte que O soit un voisinage
de a, à valeurs dans JRP. L'entier p est encore dans {1, 2, 3}, et il est important ici qu'il soit le
même au départ et à l'arrivée. On s'intéresse à la résolution de l'équation

f(x) = Y,
y étant donné et x étant l'inconnue (dans Q). Si y = f (a), il y a bien sdr (au moins) une
solution qui est x = a. On va donc chercher, pour y proche de f(a), s'il existe encore une
solution x proche de a. Pour cela, on utilise la définition de la différentielle pour écrire que

f(x) = f(a) + daf(x- a)+ llx- allE(x - a).


942

C'est maintenant que l'on va faire une opération non rigoureuse. On néglige le reste (du fait
que l'on cherche x proche de a) pour écrire que

f(x)::::::: f(a) +d 0 f(x- a).

Alors l'équation que l'on cherche à résoudre est proche de

d 0 f(x- a)= 1J - f(a).

Si l'on veut avoir une solution pour toute 1J proche de a, on a besoin que d 0 f soit surjective, et
comme c'est une application linéaire entre espaces vectoriels de même dimension, sa surjecti-
vité équivaut à sa bijectivité. Supposant alors d 0 f bijective, on voit que l'équation approchée
a une solution et une seule, qui est

Si on omet nos approximations, il semble légitime de dire que f est inversible au voisinage de
a, et que

Bien entendu, notre calcul étant fait d'approximations, on ne peut pas espérer que l'on ob-
tienne une telle expression explicite. Mais l'intuition que donne ce calcul est exacte. C'est
l'objet du théorème d'inversion locale, dont l'énoncé suit.

Théorèniê 3Ôi82.. (Tlï66têinê.d'inverskm·. tociÙe). · $oient aêttv, Oun ~i,,ver1,•.à(JR:P\


et a un :pmn.t àeQ.. Soit f une applicatwn dé !l iJaniJ JltP, On s u ~ ((11,e f esf à~ c~~ tt
dans!l etqued41êsiinversible.· . . · . ···•.<··.···•··· /.• >' '. . c · ..· ..·.•.
Alors il ~t!: 1.trJ. ~ti€rf U, cp-at~_a,n.t q.1' ~ 1,inJ1~,tV' ~~tertt1ltJ{:4J,~t«~.~iîfU}c.;,V,.·
u
et tels qué trTrêsttietiQn .fk fi soit bijeéiiri{~ u~}VI· ,· ' '' , . " ,. '. 1'· ' ' ·····; t

Illustrons maintenant ce théorème dans le cas où p = 1. On considère une fonction f de


classe ci de lR. dans lR. (pour simplifier, on suppose donc Q = JR.), telle que f(O) = 0 (par
exemple, ceci ne restreint pas la généralité), dont la différentielle au point Oest bijective. Cette
différentielle est l'application de lR. dans lR. définie par h H f'(O) h, elle est donc bijective si
et seulement si f'(O) c/- O. Le théorème d'inversion locale exprime donc qu'alors il existe un
ouvert U contenant O et un ouvert V contenant f(O) = 0 tels que f soit une bijection de U sur
V.
Ceci ne doit pas nous surprendre, et nous pouvons même en donner une démonstration
dans ce cas très simple. En effet, comme f'(O) c/- 0, on peut par exemple supposer que f'(O) > O.
Alors comme f est supposée de classe ci, f'(x) est encore strictement positive sur un invervalle
ouvert I contenant 0, puisque f' est continue. Nous avons alors déjà vu que comme f est
continue et strictement monotone, f est une bijection de I sur f(I), et f(I) est un intervalle
ouvert contenant O. On peut donc choisir U = I et V= f(I).
Le théorème d'inversion locale peut donc être vu comme une généralisation en dimension
supérieure de ce théorème en dimension 1. Comme la démonstration en dimension 1 repose
essentiellement sur la structure d'ordre présente sur la droite réelle, il faut donc imaginer une
méthode de démonstration qui ne dépende pas de cette structure d'ordre. Elle sera basée sur
une généralisation du théorème du point fixe que nous avons introduit dans le chapitre sur
les fonctions dérivées.
943

V.4.2. Introduction au théorème des fonctions implicites ( I )

On se donne maintenant une fonction f définie sur un voisinage li x V d'un point a de IR2 à
valeurs réelles. On pose a= (xo, Yol et li= lxo - f., Xo + d et V= lYo - f., Yo + d, où f. > O.
On pose c = f(x 0 , y 0 ) et on s'intéresse à l'ensemble

r = f- 1 ({c}) = {(x, y) Elix VI f(x,y) = c}.

On cherche notamment à savoir si l'on peut représenter r par une relation liant x à y, ou y
à x, au moins pour x proche de x 0 et y proche de 1Jo. On commence l'étude comme dans la
partie précédente, en remplaçant f par son expression approchée

of of
f(a) + ox (a)(x - xo) + oy (a)(y -110).

Simplifiant alors par f(a) = c, l'équation que l'on cherche à résoudre s'approche par

Les dérivées partielles de f sont des nombres réels. On voit que, sur le problème approché,
pour exprimer y en fonction de x, il est nécessaire que : (a) soit non nul, et pour exprimer
x en fonction de y, il est nécessaire que M
(a) soit non nul. Plaçons nous dans la première
situation (la seconde est analogue). On obtient alors l'égalité

qui est de la forme

y= ax+ b,

avec a= -(M(a))/(:(a)) et b ajusté de sorte que y 0 = ax 0 + b.


En fait nous allons voir que sous l'hypothèse formulée, on pourra, pour toute valeur x
proche de Xo, exprimer une valeur et une seule y proche de 1Jo telle que f(x, y) = c. Si l'on
note y = <p (x) la fonction ainsi obtenue, on aura donc

f(x, cp(x)) = c

et on aura encore cp'(xo) = a. Le théorème des fonctions implicites formalise les remarques
que nous venons de faire.
944

EXEMPLE 30.84. Prenons l'exemple classique du cercle

Soit (x 0 , y 0 ) E JR 2 un point du cercle; on a en particulier lxol :S 1 et l1Jol :S 1.


Pour pouvoir exprimer y en fonction de x en appliquant le théorème des fonctions impli-
cites, il est nécessaire que :(x0 , y 0 ), qui vaut 2yo, soit non nul. Si tel est le cas, c'est-à-dire
sauf aux points (-1,0) et (1,0) du cercle, il est possible de trouver deux réels strictement
positifs r 1 et r 2 et une fonction C 1 de lxo - r,, x 0 + r, [ vers ]1Jo - f2, 1Jo + r2[ tel que

(f(x, y)= 1, (x, y) E ]x0 - r,, x 0 + r,[ x ]1Jo - f2, 1Jo + r2[) #(y= cp(x)).
La fonction <p est bien sëlr ici connue (il suffit de calculer), mais nous ignorerons cet
aspect des choses (provisoirement). La raison d'être des voisinages est évidente ici, puisque
bien entendu on n'a plus de relation six (f. [-1, 1] (ce qui justifie la restriction en x) et on
a deux choix de y (ce qui justifie la restriction en 1J). On ne connaît pas grand chose de <p,
sauf que
, lxo
<p (xo) = - - .
lyo
En fait, on peut aller un peu plus loin. Comme pour tout x E]xo-f1, xo+r 1 [, on a la relation

il vient en dérivant
x + cp(x)cp'(x) = O.
Supposant, quitte à diminuer r 1 , que <p ne s'annule pas sur ]x 0 - r,, x 0 + r 1 [, on voit alors
que <p est solution de l'équation différentielle
945

ce qui montre au passage que cp est c:xo et permet, par récurrence, de déterminer successive-
ment les cplPl(x 0 ) en fonction de x 0 et 1Jo. Par exemple, on sait déjà que cp(x 0 ) = 1Jo et que
cp'(x 0 ) = -x0 /1J 0 . Dérivant une nouvelle fois la relation, il vient

1 + cp'(x) 2 + cp(x)cp"(x) = 0,

soit, en faisant x = x 0 , il vient


2
1 + (xo/1Jo) + 1Jocp"(xo) = 0,

soit, en tenant compte de X6 + 1J6 = 1

cp "( Xo ) = - 31 .
1Jo
On peut ainsi donner un développement limité d'ordre 2 de la solution, au voisinage de x 0

Xo 1 2 2
cp(x) = 1Jo - -(x-xo) - 3 (x -xo) + o((x -xo) ).
1Jo 1Jo
On voit au passage quelle est l'équation de la tangente et le fait que la courbe est (localement)
sous la tangente.
Regardons maintenant le point (1, 0), en lequel l'hypothèse du théorème des fonctions
implicites n'est pas vraie. On constate dans ce cas que la conclusion n'est pas vraie non
plus, car quels que soient les réels e, et E:2 strictement positifs que l'on prendra, il y aura
dans l'intervalle )1 - e 1; 1 + e 1 [ des x pour lesquels aucun point n'est sur la courbe (prendre
x E]l; 1+e 1 [ arbitraire) et des x pour lesquels l'équation 1) 2 = 1-x2 aura deux solutions dans
] - e2; e2[ (prendre x < 1 assez proche de 1 pour que l'une des solutions soit dans] - e2; e2[,
l'autre solution sera nécessairement dans cet intervalle).
Le lecteur pourra comparer ce que l'on a obtenu dans le premier cas avec ce que l'on
obtiendrait avec l'expression explicite de cp (qui sera cp(x) = ✓ 1 - x 2 si 1Jo > 0 et cp(x) =
- ✓ 1 - x 2 si 1Jo < 0).
Il est conseillé au lecteur de discuter le cas où l'on chercherait à exprimer x en fonction
de 1J.

V.4.3. Introduction au théorème des fonctions implicites (II)

Cette partie est fortement calquée sur la précédente. On se donne trois intervalles ouverts
li, V, W de JR, et une fonction f définie sur li x V x W, à valeurs dans lR. Soit a= (x0 , 1Jo, z 0 ) E
li x V x W. On pose c = f(x 0 , 1Jo, z 0 ) E lR et l'on s'intéresse à l'ensemble

r = f- 1 ({c}) = {(x, 1J,Z) Elix v x w I f(x, 1J,Z) = c}.


On cherche notamment à savoir si l'on peut représenter r par une relation liant l'une des trois
variables aux deux autres, au moins pour x proche de x 0 , 1J proche de 1Jo et z proche de z 0 . On
commence l'étude comme dans ce qui précède, en remplaçant f par son expression approchée

ôf ôf ôf
f(a) + ôx (a)(x -xo) + 0/aH1J -1Jol + ôz (a)(z - zo).
946

Simplifiant alors par fa) = c, l'équation que l'on cherche à résoudre s'approche par

On voit que pour exprimer l'une des variables en fonction des deux autres, il est nécessaire que
la dérivée partielle correspondante soit non nulle. Supposant par exemple ~(xo,Yo,zo)-/- 0,
on obtient

On voit ici arriver une expression de la forme

Z =<XX+ f3y + Y,

~(xo, Yo,zo) t f3 = g:(xo, Yo,zo)


avec ex = of e of , et y ajusté de sorte que z 0 = cxx 0 +
az(xo,Yo,zo) az(xo,Yo,zo)
f3y 0 + y. On a ainsi une relation affine z = cp (x, y). Le deuxième cas particulier du théorème
des fonctions implicites justifie cette approche non rigoureuse dans le cas de fonctions assez
régulières.
947

VI. EXERCICES
30.1. 30.5.

On reprend la définition de u dans la défini- On est intéressé par la recherche de toutes les
tion de la tangente (30.22). On suppose que u fonctions u différentiables sur R 2 qui vérifient
existe au voisinage de to, et on prend t dans ce
2 ôu ôu
voisinage. lf(x,1J) ER, ôx (x,1J) = Ô1J (x,1J).
1. Montrer que pour tout t, llu( t) Il = 1.
2. Déduire de la question 1 les normes des vec- 1. Montrer que l'ensemble des solutions est un
teurs u( ttl et u( tol (lorsqu'elles existent). En espace vectoriel.
déduire que si l'arc admet une tangente en to, 2. On cherche les solutions qui sont de la forme
on a u(tt) = u(t 0) ou bien u(ttl = -u(t0). u(x, -y) = A(x)B(1J) avec A et B non constam- ci
C')

3. Donner un exemple pour chaque situation ment nulles. Montrer qu'il existe (k, a) E lR x R* ..d
tels que pour tout (x, -y) E R 2, u( x, 1J) =
u
décrite dans la question précédente.
aek(x+11l_
4. Onnoteu(t) = (u1(tl,u2(t)) et prenons une
suite (tn) E (R;;)N de limite nulle. En utili- 3. Grâce aux questions précédentes, on voit que
sant la question 1, montrer que l'on peut trou- les fonctions <p de la forme
ver une sous-suite (tcp(n)ln telle que (u(tcp(n)lln n
ait une limite (on construira la sous-suite en <p(t) = L ai<;(tl,
· deux étapes, en se concentrant successivement j=l
sur chacune des composantes).
la fonction (x, 1J) H <p (x + 1J) fournit une solu-
tion. Montrer que c'est bien le cas pour toute
30.2.
telle fonction, avec <p : R H R arbitraire et dé-
rivable.
Soit <X E R irrationnel. Montrer que l'adhé-
4. On établit maintenant la réciproque à la
rence de l'image de l'arc (R;y) où y(t) =
question précédente. On introduit le change-
(cos(t); cos( cxt)) est [-1; 1] 2 (on utilisera que
ment de variables cp(x, 1J) = (x + 1J, x -1) ). Soit
si <X est irrationnel, Z + <XZ est dense dans R).
u une solution, et on introduit v de sorte que
L'arc y est-il périodique? u = vo cp (c'est-à-dire que v = uo cp- 1 ). Notons
ô1v et ô2v les dérivées partielles de v. Vérifier
30.3.
que ~~(x, 1J) = ô1v(x+1J, x-1J)+ô2v(x+1J, X-1Jl
et calculer de même t(x, 1!) en fonction de
On considère la fonction f définie de R 2 dans
ô1v(x+1J, X-1J) et ô2v(x+1J, X-1J). En déduire
R par f(x, 1J) = 1 lorsque 1J = x 2 et f(x, 1!) = 0
que v vérifie ô2v = 0, puis conclure.
dans les autres situations.
1. Trouver deux suites (xnlnEN et (-YnlnEN de
30.6.
réels convergeant vers 0 de sorte que f(xn, 1Jn)
ne tende pas vers 0 = f(0,0) (ainsi f n'est pas
On considère l'ensemble r des couples de réels
continue en (0, 0)).
(x, 1J) satisfaisant la relation
2. Montrer que f admet des dérivées partielles
en (0,0) et les déterminer. Au vu du résultat
de la question précédente, celui-ci vous paraît-il
surprenant ? Soit (0,0) Er.
1. Vous semble t-il possible d'exprimer à l'aide
30.4. d'une formule explicite 1J en fonction de x? x
en fonction de 1J? Si oui, donnez l'expression.
Trouver toutes les applications f : R 2 --, JR, dif- 2. Le théorème des fonctions implicites s'ap-
férentiables sur R 2, telles que pour tout h E R 2, plique t-il pour exprimer x en fonction de 1J?
l'application (x,1J) H df(x,y)(h) soit linéaire. -y en fonction de x ?
948

3. On appelle q:, la fonction obtenue par le TF1 30.7.


telle que y = q:,(x). Faire le développement li-
mité d'ordre 3 au voisinage de Ode q:,. On considère l'équation polynômiale
5
x + ax+ 1 = 0,
où a est un paramètre réel et x est l'inconnue.
1. Trouver l'unique solution réelle xo et sa mul-
tiplicité lorsque a = O.
2. Montrer par le théorème des fonctions impli-
cites que a assez proche de 0, l'équation poly-
nômiale n'a qu'une seule solution q:,(a) proche
de xo.
Chapitre 31
ÉQUATIONS DIFFÉRENTIELLES
ORDINAIRES

'INVENTION du calcul différentiel à la fin du XVIIe siècle par Newton, puis indépen-

L damment par Leibniz dont les travaux sur les infiniment petits éclaircis par les frères
Bernoulli 1 , a permis la résolution de nombreux problèmes réputés à l'époque in-
solubles par le calcul analytique. En dehors des déterminations de minima ou de maxima,
le « nouveau calcul» a très vite fait ses preuves dans l'étude des courbes mécaniques - l'ex-
pression est employée par le Marquis Michel de L'Hospital dans son Analyse des infiniment
petits - telle que la tractrice : quelle est l'équation de la courbe décrite par un objet remorqué
le long d'une droite par un câble tendu de longueur constante ?

\
\

\
\
\
\

\
\

N
Mise en équation Courbe obtenue

FIGURE 31.1. La tractrice

Ce problème, initialement étudié par Huygens, fut résolu par Leibniz en 1693. La remarque
essentielle est que, puisque le câble est supposé tendu, il est porté en tout point par la tangente
à la courbe recherchée. Choisissons l'axe (Ox) selon la droite de remorquage puis (Oy) tel que
l'on obtienne un repère orthonormé direct du plan. Notons y(x) l'ordonnée du point d'abscisse
x de la tractrice, C la longueur du câble, et M(x,y(x)) et N(xN,0) les extrémités du câble.
Puisque (MN) est tangente à la courbe en M, on a

y'(x) = pente de la tangente en M = pente de (MN)=~.


X-XN

d'où x-xN = i,\~r Or MN = C = (x-xN) +y(x) , ainsi C2y'(x) = y(x) 2 +y'(x)2y(x)2,


2 2 2 2 2

et finalement y'(x)2(C 2 -y(x)2) = y(x)2. En choisissant un câble vertical en x = 0 et e = 1,


il est clair que la dérivée y' sera négative et que 0 ,( y(x) < 1, d'où
y(x)
\/x E [0, 1[, y'(x) =

1
Les idées de Newton dateraient de 1671 et celles de Leibniz de 1684. Jacob et Johann Bernoulli ont étudié le
sujet vers les années 1691-1692; ils initièrent Le Marquis de L'Hospital à ce « nouveau calcul».
950

Nous avons donc à résoudre une équation dont l'inconnue est une fonction -y dérivable.
Cette équation ne faisant intervenir que la dérivée première est appelée équation différen-
tielle d'ordre un. L'introduction du calcul différentiel a donc permis la mise en équation de
ce nouveau type de problème. Une nouvelle classe de questions est alors apparue : comment
résoudre ces équations 2 et, si les tentatives de calcul échouent, peut-on tout de même décrire
quelques propriétés des éventuelles fonctions solutions (existence, unicité, les solutions sont-
elles bornées, etc) ?
Ce chapitre sur les équations différentielles portera essentiellement sur la résolution d'une
classe d'équations bien connues et sur lesquelles on dispose de nombreux résultats, il s'agit des
équations différentielles linéaires d'ordres un et deux dont nous allons préciser la définition
dans ce qui suit. L'étude d'équations plus générales sera abordée dans le cours de 12.

1. ÉQUATIONS LINÉAIRES DU PREMIER ORDRE

C Étudions l'exemple élémentaire de la charge d'un


i condensateur par une force électromotrice (f.e.m.) e,
illustré ci-contre. On recherche l'évolution de la tension
Uc aux bornes de la capacité C. D'après la relation de
Uc
Chasles pour les tensions, e = Uc + uR, or i = Cu~ et
UR= Ri= RCu~. On a donc
UR
u~+ RCuc = e.
e
En posant 'f = 1/RC, il s'agit donc de résoudre l'équa-
tion -y'+ ¾-Y = e. Dans le cas où le condensateur se
décharge dans la résistance R, c'est-à-dire quand on
remplace la f.e.m. e par un câble sans composant, l'équation s'écrit simplement u~+RCuc = 0
et l'on doit dans ce cas résoudre -y'+ ¾-Y = O. C'est ce type d'équation que nous allons d'abord
étudier avant d'aborder des situations plus générales.

I.1. Définitions et notations


Définition 31.1. On appelle équation différentielle linéaire d'ordre un, toute équation du
type (E) : <X(t)-y' + 13(t)-y = y(t) où <X, 13 et y sont trois fonctions définies et continues sur
un intervalle I de lR à valeurs dans <C. Résoudre l'équation (E) sur I, c'est déterminer toutes
les fonctions dérivables f : I -t <C telles que

Vt E I, <X(t)f'(t) + l3(t)f(t) = y(t).


À l'équation (E), on associe l'équation suivante: (EH): <X(t)-y' + l3(t)-y = 0, dite homogène.

Les fonctions <X et 13 sont les coefficients de l'équation et y s'appelle le second membre de
l'équation; l'équation homogène associée (EH) est souvent qualifiée d'équation sans second
membre. On dit que l'équation (E) est linéaire parce que l'inconnue -y apparaît de manière

2
Nous renvoyons le lecteur aux exercices de ce chapitre, parmi lesquels il trouvera la solution de l'équation
différentielle de la tractrice.
951

linéaire au premier membre. Plus exactement, si la "fonction" <l> qui, à une fonction 11 (déri-
vable sur I), associe la nouvelle fonction <l> (11 l = ex 11' + 1311 est linéaire, comme on le vérifie
facilement. Cette linéarité aura des conséquences fondamentales dans la suite, par exemple
par le biais du principe de superposition. L'équation (El est dite d'ordre 1 car elle ne fait
intervenir que la dérivée d'ordre 1 de la fonction inconnue 11·
On notera Y l'ensemble des solutions de (El et Ytt l'ensemble des solutions de (EHl-

Convention de résolution
On adoptera la convention suivante : lorsque les coefficients et le second membre de
l'équation sont tous à valeurs réelles, on ne recherchera que les solutions de (El à valeurs
réelles, sauf mention contraire. En effet, les équations à coefficients réels ont souvent une
origine physique et seules les solutions réelles sont alors intéressantes. Mais il ne s'agit ......
là que d'une convention, il est toujours possible de rechercher les solutions à valeurs C'"l
..d
complexes. ü

Définition 31.2. Soit (El une équation différentielle linéaire d'ordre un. On appelle courbe
intégrale de (El le graphe d'une solution de l'équation (El. Une courbe intégrale est donc
une partie de lR x R

Lorsque le coefficient ex ne s'annule pas sur I, (El est équivalente à 11' + !\!!11 = :\!l,
c'est-à-dire 11' + a(tl11 = b(tl en posant et b = a=! !-
On remarquera que les fonctions a
et b ainsi définies sont continues sur l'intervalle I.

Définition 31.3. Une équation (El du type 11' + a(tl11 = b(tl sera dite réduite.

Nous étudierons d'abord la résolution des équations réduites avant de revenir en fin de
parcours aux équations différentielles générales du premier ordre.

I.2. Résolution d'une équation homogène réduite


Pii>~:'3t~.:;•:a~: ~,f~t~:1Us:'tôliJt i~t:&f!l1Jqùtmr1'fi 111 •+<lll''=Oâ~·.~fonctwrts
f dè là :jtJ'rfri.e f :·Il·..➔, Cc, tH Àtr·,,t, ri,>.. E '(!: .•

PREUVE. Soit 11 : lR ~ C. Posons, \ft E :IR, z( t l = 11 (t l eut. La fonction 11 est dérivable si et


seulement si z est dérivable et, sous cette hypothèse, z'(tl = (11'(tl + a11(tlleat_ La fonction
11 est donc solution de l'équation si et seulement si z' = 0, c'est-à-dire (puisque l'ensemble de
définition des fonctions est lR tout entier) si et seulement si il existe À E C tel que z = À, soit
encore \ft E :IR, 11 = Àe-at_ ■

Nous pouvons maintenant résoudre par exemple l'équation de décharge d'un condensateur
établie ci-dessus, u~ + RCuc = O. La tension Uc aux bornes du composant est de la forme
uc(tl = Àe-t/'r où 't = 1/RC, avec À ER
952

EXEMPLE 31.5. Résolvons sur lR les équations suivantes :


1. y'+ ,i+i.y
-t
= 0;
► Puisque )~~ = (l~i.l = i, les solutions de la première équation sont les fonctions de la
2

forme t H Àe-H, avec À E C


2. y' +2y = 0;
► Les solutions sont les fonctions de la forme t H Àe-2t où À E R
Nous avons adopté dans cet exemple la convention mentionnée ci-dessus: on a imposé À E lR
lors de la résolution de la seconde équation, dont les coefficients et le second membre sont
réels.

Test 31.1. Test 31.2.


Donner l'allure des courbes intégrales de l'équa- Quelles sont les solutions de 1J" = 1J' ?
tion 1J' = 1J.

Le cas d'une équation à coefficient variable se traite suivant le même principe : il s'agit
de multiplier l'inconnue par une exponentielle bien choisie, pour faire apparaître une nouvelle
équation que l'on sait résoudre.

PREUVE. Soient y: I-+ lR et A une primitive de a sur I. Posons, Vt E I, z(t) = y(t)eA(tl.


Puisque y(t) = z(t)e-A(tl, la fonction z est dérivable sur I si et seulement si y est dérivable
sur I et sous cette hypothèse, z'(t) = (y'(t) + A'(t)y(t))eA(tl = (y'(t) + a(t)y(t))eA(tl. La
fonction y est solution de l'équation si et seulement si z'(t) = 0 donc si et seulement si il
existe À E C tel que z = À, soit y = Àe-A(tl, Vt E I. ■

D'après la démonstration ci-dessus, le choix d'une primitive A de a sur l'intervalle I est


arbitraire. Ajouter une constante d'intégration revient simplement à modifier le coefficient
À, ce qui ne modifie pas la forme générale de la solution. Cette proposition est bien sûr une
généralisation du résultat obtenu au paragraphe précédent puisque ut est une primitive de
la fonction constante égale à a. On dit que t H ÀCA(tl (À E C) est la solution générale de
l'équation (E). On note Ytt l'ensemble des solutions de l'équation (Ett). D'après la proposition
précédente, on a

.Y'tt = {f: I-+ C 1 :3;\ E C, Vt E I, f(t) = Àe-A(tl}.

EXEMPLE 31. 7. Résolvons sur lR l'équation y'+ xy = O.


► Puisque f xdx = ½x2 , les solutions sont les fonctions de la forme x H Àe-;--2 avec
À E R Ici encore, puisque les coefficients sont réels, on a imposé À E lR afin de limiter la
résolution aux fonctions à valeurs réelles.
953

Test 31.3. Test 31.4.


Montrer que toute solution 110 de l'équation Trouver les solutions complexes de l'équation
différentielle homogène 11' + a( t )11 = 0 soit est précédente.
nulle, soit ne s'annule jamais.

1.3. Résolution de l'équation avec second membre


Dans la suite, sauf mention contraire, lorsque f est une fonction continue sur un intervalle, on
désignera par f f(t)dt une primitive arbitrairement choisie de f (contrairement à la notation
usuelle, qui désigne généralement l'ensemble des primitives).
.....
C'J
..d
ü

PREUVE. Soient -y : I ----1 lR et A une primitive de a sur l'intervalle 1. Posons, Vt E I,


z(t) = -y(t)eAltl. La fonction z est dérivable sur I si et seulement si -y est dérivable sur 1.
Sous cette hypothèse, on a sur I : z'(t) = (-y'(t) + a(t)-y(t))eAltl; -y est donc solution de
l'équation si et seulement si z'(t) = b(t)eA(tl, c'est-à-dire 3;\ E (C tel que z(t) =À+ B(t).
D'où -y(t) = z(t)e-Altl = (B(t) + ;\)e-Altl. ■

Comme dans le paragraphe précédent, et comme le montre la preuve, le choix des deux
primitives (A primitive de a et B primitive de t H b(t)eA(tl) est arbitraire. On peut aussi le
vérifier directement. En effet, modifier A par addition d'une constante u revient à multiplier
-y par e-u, alors que B est changée en euB, il suffit alors de changer À en eu;\ pour que la
solution soit inchangée. De même, on vérifie que l'addition d'une constante à la fonction B ne
perturbe pas la forme des solutions.
En notant 9 l'ensemble des solutions de l'équation (E), nous avons prouvé que

9 = { f: lR ----t (C 1 3;\ E C, 'v't E lR, f(t) = Àe-A(tl + B(t)e-A(tl}.

Il apparaît que la fonction t H B e-A(tl est une solution particulière de l'équation (E),
obtenue lorsque À = O. La terminologie usuelle oppose souvent les solutions particulières aux
solutions générales, comme f ci-dessus, qui décrivent l'ensemble des solutions au moyen de
constantes appropriées. Nous reviendrons sur ce point dans un prochain paragraphe.
Revenons un instant sur la démonstration de cette proposition. Les solutions de l'équation
(E) : -y'+ a(t)-y = b(t) sont de la forme µ(t) x e-A(tl oùµ vérifie µ'(t)cA(tl = b(t). Soit
1Jo une solution non nulle de l'équation homogène (EH). Il existe µo =/= 0 tel que -y 0 = µ 0 e-A.
En posant À = µ/µo, les solutions de (E) s'écrivent donc au moyen de -y 0 sous la forme
À(t) x cA(tJ où À vérifie À1 (t)-y 0 (t) = b(t). On retrouvera donc sans effort les formules de la
proposition précédente en appliquant la méthode décrite ci-dessous et appelée variation de la
constante 3 .

3
Mais qu'est-ce qu' "une constante qui varie» sinon une fonction?
954

Méthode de la variation de la constante


On cherche à résoudre l'équation différentielle (E): -y'+ a(t)-y = b(t).
o On résout l'équation homogène (Ea): -y'+ a(t)-y = O. On en choisit une solution non
nulle notée -y 0 (dans la pratique, on choisira -y 0 = e-A où A(t) = f a(t)dt).
o On sait qu'une fonction -y : I ----+ IR dérivable est solution de l'équation (E) si et
seulement si elle s'écrit -y = À-Yo avec À : I ----+ IR dérivable telle que À11Jo = b, c'est-à-dire
;\' = j,__
Yo

o On détermine toutes les primitives de J,_ sur I pour conclure.


Yo

EXEMPLE 31.9. Résolvons sur IR l'équation -y'+ th(t)-y = sh(t).


► Puisque f th(t)dt = ln(ch(t)) = A(t), -y 0 : t H e-A(tl = ch~tl est une solution non
nulle de l'équation homogène. Appliquons la méthode de la variation de la constante : les
solutions sont de la forme À-Yo avec À: IR----+ IR dérivable et telle que Vt E IR, ~~i!i
= sh(t),
c'est-à-dire À(t) = f ch(t) sh(t)dt = f ½sh(2t)dt = ¼ch(2t) + k où k ER Les solutions de
l'équation sont donc les fonctions de la forme t H ~~~~~\ + ch~tl avec k E IR (noter qu'ici nous
avons désigné par f ch(t) sh(t)dt la primitive générale).

Remarquons avant de clore ce paragraphe que les solutions d'une équation différentielle
(données par les formules de la proposition 10) ne peuvent pas toujours être explicitées à
l'aide des fonctions usuelles : les primitives de fonctions obtenues à partir des opérations
algébriques (le produit, la composition, etc.) sur les fonctions usuelles ne s'expriment pas
systématiqueme nt à l'aide des fonctions usuelles. Citons par exemple les primitives sur IR de
la fonction x H e-x', qu'on appelle gaussienne et qui intervient de manière essentielle en
théorie des probabilités.

Test 31.5. Test 31.6.


Résoudre y'+ ~y = 1 sur JR';_. Résoudre y'+ e"-y = ex sur R

1.4. Résolution de (E) à l'aide d'une solution particulière


Nous avons signalé en introduction que la linéarité des équations que nous considérons ici
leur confère des propriétés remarquables. Dans ce qui suit, nous allons mettre en évidence
l'une de de ces propriétés, à savoir que la solution générale de l'équation (E) est toujours la
somme d'une solution particulière et de la solution générale de l'équation sans second membre
associée. Ceci nous donne une deuxième approche de la résolution des équations différentielles.

Pr<>f10flit~on
y =1:h -f-,Y'~1îl.t,bI
, . .Soit
. l({ûtê-sôlutitln
. .. . fiarliem,iènr ile zriquàti&n ij 1 ~ (lît)·V -;; bJt). ·Aldr$
. ... .. . . . . . . .
PREUVE. Soit -y : I ----+ IR (ou C) dérivable. Puisque 'v't E I, -y;( t) + a( t )-y 1(t) = b (t), la
fonction -y est solution de (E) si et seulement si -y\(t) + a(t)-y 1(t) = -y'(t) + a(t)-y(t), soit
(1J1 - -y)'(t) + a(t)(-y1 - -y)(t) = 0, c'est-à-dire -y -1)1 E Ytt soit encore -y E -y 1 + Ytt. On a
donc .9' = 1!1 + Y'tt- ■
955

Déterminati on d'une solution particulière


1
On cherche à résoudre l'équation différentielle (E): 1J + u(t)1J = b(t).
◊ On dispose d'une solution particulière 1Ji de (E).

◊ On résout (EH) : 1J 1 + u(t)1J = 0, l'équation homogène associée à (E).

◊ On a Y = 1Ji + Y'tt, ainsi la solution générale de (E) est la somme d'une solution
particulière de (E) et de la solution générale de (Ett).

L'équation de charge d'un condensateur se prête bien à une résolution de ce type; elle
s'écrit Uc + ¾uc = e et admet une solution constante évidente, -re. La tension Uc aux bornes
du composant est donc de la forme uc( t) = -re + Àe-t/'r où -r = 1/RC.
..-<

Nous avons vu que la méthode de la variation de la constante est valable dans tous les cas
C".I
..d
de figure, car elle réduit la résolution d'une équation différentielle linéaire du premier ordre (E) ü
à deux calculs de primitives: A(t) = f u(t)dt puis B(t) = f b(t)eA(tldt. Nous savons de plus
que B est une solution particulière de (E) : 1J' + u(t)1J = b(t). À la réflexion, il apparaît donc
que la variation de la constante permet d'aboutir directement à l'écriture solution générale
de (E) = solution particulière de (E) + solution générale de (Ett).Par exemple, les solutions
2
de 1J 1 + 1J = e 2t sont de la forme 1J(t) = À(t)e-t avec ;\'(t)e-t = e t donc ;\'(t) = e \ i.e.
3
2
À(t) = !e3t + k, ainsi 1J(t) = !e2t + ke-t où t H !e t est une solution particulière. On
est alors en droit de trouver absurde la recherche d'une solution particulière de (E) sachant
que la primitive B en est une! Cependant, lorsque B est difficile à calculer, l'équation (E)
peut admettre des solutions plus évidentes que B; c'est dans ce cadre que la recherche d'une
solution particulière diffère sensiblement de la variation de la constante et devient intéressante.
Le lecteur comparera les deux approches au travers de l'exemple suivant.

EXEMPLE 31.11. Résolvons l'équation (x 2 + 1)1J' - 3x1J = 1.


1. En remarquant qu'elle admet une solution polynomiale.
► Recherchons le degré n d'une éventuelle solution polynomiale p de (E) : si on écrit p(x) =
PnX n + ... + Po, (x 2 + 1)p' - 3xp est un polynôme de degré au plus n + 1 et son monôme en
xn+l vaut Pn( n- 3)xn+l. Si p est solution de l'équation, ce terme est nécessairement nul et,
3 2
puisque Pn =/- 0, n = 3. On recherche donc une solution de la forme p(x) = ux +bx +cx+d.
;J 2 !
On obtient b = d = 0, c = 1 et u = 2/3. Puisque - f 1 dx = ln(x + 1), les solutions de
23 2 3 2
(E) sont les fonctions de la forme x H x + ; + k(x + 1) 1 avec k ER
2. Par la variation de la constante, avec patience.
► Appliquons la méthode de la variation de la constante. D'après le calcul de primitive
2 2
précédent, les solutions de l'équation sont de la forme À(x)(x + 1 ) 1 avec À (x)(x + 1 ) 1 =
3 2 1 3 2
2
x2~ 1 , soit ;\'(x) = (x + 1)-
512 . Remarquons d'abord que

2 2
dx J1 + x 2 -
x J dx J x dx
(x2+1)s;2·
J (x2+1)5/2 = (x2+1)5/2 = (x2+1p12-

Intégrons par parties :


956

d'où

De même
dx Jx 2 + 1 -
x
2
J dx J 2
x dx
J (x2+1)3/2 = (x2+1)3/2dx= ✓x2+1 - (x2+1)3/2"
Intégrons par parties

ainsi

On a donc
X 2x
À(x) = 3(x2 + 1)3/2 + 3(x2 + 1)1/2 + k (k E JR)

et les solutions de (E) sont les fonctions de la forme x H x + 2; 3 + k(x 2 + 1 )312 , avec k ER

Remarque.
1. Pour rechercher une solution polynomiale à une équation différentielle dont les coef-
ficients et le second membre sont des fonctions polynômes, on commence par poser p (x) =
PnX n + ... + p 0 puis on injecte cette expression dans l'équation. Après regroupement des mo-
nômes de même degré dans chacun des membres, on identifie les coefficients, ce qui se traduit
par des équations linéaires qu'il faut ensuite résoudre. Afin de simplifier les calculs, on essaie
parfois (c'est le cas dans l'exemple précédent) de déterminer le degré n de p (il faut pour cela
s'intéresser aux mônomes de plus haut degré).
2. Le calcul de primitive s'effectue au moyen de méthodes élémentaires mais nécessite un
peu d'astuce et de persévérence.

Test 31.7. Test 31.8.


Trouver une solution polynomiale de l'équation Trouver une solution polynomiale de l'équation
y'-y =t2. y'+ty=t2+t+ l.

Un cas où la recherche d'une solution particulière est possible est celui des équations à
coefficients constants dont le second membre est une fonction polynôme-exponentielle, c'est-
à-dire de la forme t H P(t)e"'t, avec P polynôme à coefficients complexes et w E C.

PREUVE. Posons, pour tout réel t, f(t) = Q(t)e"'t. La fonction f est dérivable sur lR et, pour
tout réel t, f'(t) = [wQ(t) + Q'(t)]e"'t ; f vérifie l'équation si et seulement si

[(a+ w)Q(t) + Q'(t)]e"'t = P(t)e"'\


957

soit \lt E lR, (a+w )Q(t)+Q'(t) = P(t). Lorsque w+a = 0, l'équation devient Q' = P. Il suffit
alors de choisir un polynôme Q parmi toutes les primitives de P (qui sont toutes des fonctions
polynômes de degré deg(P) + 1). Supposons <X= w+a =/- O. Écrivons P(t) = Pntn+ ... +p 0 .
Recherchons Q sous la forme Q(t) = qntn + ... + qo. On a
n
aQ(t) + Q'(t) = aQ(t) + L. kqktk-l
k=l
et
n n-1
L. kqktk-l = L. (k + 1)Qk+1t\
k=l k=O
ainsi
n-1
aQ(t) + Q'(t) = <XQntn+ .L_(<Xqk + (k+ l)qk+1ltk. .....

e
k~c() (".)

Après identification des coefficients, l'égalité aQ + Q' = P est équivalente aux n + 1 égalités
suivantes:

Puisque a=/- 0, la première équation permet de calculer Qn = Pn/<X et les n suivantes et de


calculer les Pk, pour k ~ n - 1. Il existe donc un tel polynôme Q qui est de plus de degré
n = deg(P). ■

Isolons le résultat suivant, démontré au cours de la preuve de la proposition 31.12 et qui


sera utilisé dans la suite.

Dans la pratique, on cherchera une solution particulière f(t) = Q(t)ewt avec Q choisi à
l'aide de la proposition précédente et l'on injectera cette expression dans l'équation. On suit
alors pas à pas le déroulement de la preuve exposée ci-dessus : les exponentielles se simplifie-
ront et l'équation se résumera à l'égalité de deux polynômes. L'identification des coefficients
aboutira à un système linéaire qu'il faudra résoudre pour trouver Q.

EXEMPLE 31.14. Résolvons sur lR les équations suivantes:


1. 11' + 211 = te-t ;
► puisque 2 - 1 =/- 0, l'équation admet une solution de la forme f(t) =(ut+ b)e-t. On a
f'(t) + 2f(t) = (lat+ 2b +a-ut- b )e-t = (ut+ a+ b )e-t; la fonction f est donc solution
si et seulement si a= 1 et a+ b = O. Ainsi f(t) = (t - 1Je-t. Les solutions sont donc les
fonctions de la forme t f-t ( t - 1) e-t + ke-Zt où k E lR.
2. y'+ ly = e-2t_
► puisque 2 - 2 = 0, l'équation admet une solution de la forme f(t) = ate-2t. On a
f'(t) + 2f(t) = ue-Zt; la fonction f est donc solution si et seulement si a = 1. Ainsi
f(t) = te-2 t. Les solutions sont donc les fonctions de la forme t f-t te-Zt + ke-2t où k E lR.
958

Remarque. Il est inutile de rechercher la solution particulière de l'équation 2. sous la forme


f(t) = (at+ b Je-21 . On peut omettre le terme constant b car la fonction définie part H bc21
est solution de l'équation homogène associée, b disparaît donc à la fin des calculs. Cependant,
si l'on conservait ce terme, le raisonnement serait le suivant :

f'(t) + 2f(t) = (-2at - 2b +a+ 2at + 2b )e-21 = ae-21.


La fonction f est donc solution si et seulement si a = 1. On peut donc choisir a = 1 et, par
exemple, b = 0 (en fait b peut-être choisit arbitrairement). La fonction t H te-21 est une
solution particulière de l'équation.
Le résultat suivant illustre (une fois de plus) le bel et puissant outil que sont les nombres
complexes qui permettent aussi la résolution de problèmes limités au corps des réels. Afin de
résoudre sur lR certaines équations algébriques, on peut passer sur C, c'est-à-dire les considérer
comme équations à coefficients complexes, effectuer les calculs dans C, puis revenir sur lR en
recherchant les solutions réelles (voir l'introduction du chapitre sur les nombres complexes et
en particulier le paragraphe consacré à l'origine des nombres imaginaires). Dans le contexte
des équations différentielles, le passage à C nous permettra aussi de trouver des solutions
particulières à valeurs réelles.

PREUVE. Posons f1 = 9îc(f), f 2 = '.Jm(f), b 1 = 9îc(b) et b 2 = '.Jm(b). La fonction f est une


solution de l'équation y'+ a(t)y = b(t) si et seulement si , pour tout réel t,

(f1 + if2)'(t) + a(t)(f 1 + ifz)(t) = f; (t) + if~(t) + a(t)f1 (t) + ia(t)f2(t) = b 1(t) + ib 2(t).

Après identification des parties réelles et imaginaires de chacun des deux membres de l'égalité,
on obtient f;(t) + a(t)f 1(t) = b 1(t) et f~(tl + a(tlf 2(tl = b 2(tl. ■

Cette technique est souvent très efficace lorsque le second membre contient des fonc-
tions circulaires, on utilise alors l'exponentielle complexe. Examinons par exemple le cas de
l'équation y'+ ay = P(tl cos(tl avec a E lR et P polynôme à coefficients réels. Puisque
\it E JR, P(tl cos(t) = 9îc(P(t)ei1), on peut commencer par rechercher une solution particu-
lière f de l'équation y'+ ay = P(t)eit_ On sait (et c'est la proposition 13 qui nous le dit) que
la fonction 9îc(fl est une solution de y'+ ay = P(tl cos(tl. On adapte sans peine ce schéma
au cas du sinus en utilisant l'égalité P(tl sin(tl = '.Jm(P(tleitl.

EXEMPLE 31.16. Résolvons sur lR l'équation y' +y= tcos(t).


► Puisque \it E JR., tcos(t) = 9îc(teit), on commence par déterminer une solution particu-
lière de y'+ y = teit_ Comme i -f. 1, il existe une solution particulière de la forme f(t) =
(ext+ (3 leit_ Puisque f'( tl = (iext +i/3 + exleit, la fonction f est solution de (El si et seulement
si (iext + i/3 +ex+ ext + (3 leit = teit, c'est-à-dire \it E JR, ex( i + l)t + (i + 1l (3 +ex= t. Après
identification des coefficients, on aboutit à ex( 1 + i) = 1 et ( 1 + il (3 + ex = 0, système dont
les solutions sont ex= 1/(1 +il= 12i et (3 =½,Ainsi \it E JR., f(tl = [1tt+ ½Jeit. La partie
réelle de f, t H tco;'tl + 121 sin(t), est une solution particulière de l'équation initiale (El.
Puisque la solution générale de (Ettl est t H ;\e-t avec À E JR., les solutions de (El sont les
fonctions de la forme t H tco;(tl + t 1 sin( t l + ;\e-t avec À E lR.
2
959

Le calcul de la partie réelle de f(t) ne doit poser aucun problème au lecteur :

i 2i] . [t2
f(t) = [ -1 - -t +
2
e't = --
+ i1-
2
t] x [cos(t) + isin{t)] =

tcos(t) _ 1 - t] . [tsin(t) (1 - t) cos(t)]


[ 2 2 +t 2 + 2 .

Test 31.9. Test 31.10.


Soit (E) : y' -y= sin(t). Trouver une solution Trouver les primitives sur lll de t H t cos( t).
particulière Yo de (E). Résoudre (E).

Le théorème de superposition énoncé ci-dessous est un résultat élémentaire mais essentiel


qui repose lui aussi sur la linéarité des équations que nous considérons.

>_--,,,:1;~:c-

·.• •.. {gf;.11(-Ë~(t~l}l) ~ ~tft}d· l!ttif, C - , , __ ,_

~.:~~t.U.t~~~1:~l,rii11Jtt..;~+vo<i&t:~~.
~{E},<
PREUVE. Soient Y1 et Yz des solutions des équations (E1) et (E2). Posons y = Y1 + yz.
La fonction y est dérivable sur I et \it E I, y'(t) + u(t)y(t) = (Y1 + Yzl'(t) + u(t)(y1 +
Yzl =y\(t) + u(t)y 1(t) +y;(t) + u(t)yz(t) = b 1(t) + b2(t). La fonction y est donc solution
de (E). ■

C'est en vertu de ce résultat (il s'agit à dire vrai d'une généralisation de cette proposition)
que le physicien se borne à étudier la réponse d'un circuit à des signaux périodiques purs
de période T, c'est-à-dire du type t H cos(27rt/T + <p ). En effet, on prouve que tout signal
périodique de période Test la superposition (la somme) de signaux purs du type précédent.
Ce résultat, énoncé ici de manière un peu vague, relève de la théorie des séries de Fourier et
sera précisé dans le cours de L2.

EXEMPLE 31.18. Résoudre sur :IR l'équation y' -y= et+ e 2t.
► Recherchons une solution particulière : d'après le théorème de superposition, il suffit de
trouver des solutions particulières des équations y' -y= et et y' -y= e2t et de les ajouter.
2
En appliquant la méthode précédente, on trouve facilement les solutions t H tet et t H e t.
2
Les solutions de l'équation sont donc les fonctions de la forme t H tet+ e t+ ket avec k ER

I.5. Problèmes de Cauchy


Il paraît évident que la vitesse d'un corps pesant soumis à un ensemble de forces connues
est entièrement décrite par la donnée de sa vitesse initiale. De même, l'équation différentielle
d'ordre un la plus simple, y' = b(t), admet une infinité de solutions (les primitives de la
fonction continue b), mais il n'existe qu'une seule primitive de b prenant une valeur donnée
Yo E C en un point fixé to E I. Cette remarque est en fait d'une portée beaucoup plus générale.
960

Définition 31.19. (Problème de Cauchy). Un problème de Cauchy est la donnée d'une


équation différentielle (El et d'une condition initiale 11 (t 0) = 110- Résoudre ce problème, c'est
déterminer les solutions f de (El qui vérifient de plus f(to) = 110-

PREUVE. Posons, pour tout t E I, A(t) = J~ u(u)du et B(t) = J~ b(u)eA(uldu. Les


fonctions A et B sont des primitives respectives de a et beA. Nous savons que la solution
générale de l'équation (El est de la forme t H [,\ + B(t)Je-A(tl où,\ E C. Puisque A(t 0) =
B(t0) = 0, cette fonction est solution du problème de Cauchy si et seulement si,\= 11o- Ce
choix de À et des primitives A et B répond donc à la question et c'est le seul possible. ■

Test 31.11. Test 31.12.


Résoudre le problème de Cauchy Résoudre le problème de Cauchy

y' +y= 0, y(O) = 1. y'+y=O, y(O)=O.

Dans le cas où les coefficients et le second membre


de l'équation différentielle (El sont à valeurs réelles,
on peut donner une interprétation géométrique de la
Yo
lR
proposition 31.20. Commençons par remarquer que les
courbes intégrales de (El sont contenues dans la bande
I x R Pour tout couple (on pourrait même dire "pour
toute condition initiale") (t 0, 11ol appartenant à cette
bande, il existe une et une seule solution de l'équation
passant par le point de coordonnées (t 0, 11 0).
Ainsi, on peut reformuler la proposition 31.20 de la
manière suivante : par tout point de la bande I x lR
FIGURE 31.2. Théorème passe une unique courbe intégrale de l'équation dif-
de Cauchy-Lipschitz férentielle (El : 11' + u(tl11 = b(t). Ces courbes re-
couvrent la bande I x lR et sont deux à deux disjointes, elles forment donc une partition de la
bande I x R

Examinons par exemple le cas de l'équation différentielle (El : 11' -11 = et. La fonction
f 0 : t E lR H tet est une solution particulière de l'équation (E) et la solution générale de
l'équation homogène associée (EH) est t H ,\et où,\ ER Les courbes intégrales de (El sont
donc les courbes représentatives des fonctions f,\ définies sur lR par

Les solutions, définies sur JR, ont été tronquées dans la figure ci-contre à la fenêtre [-2, 2] x
[-5,6].
961

Le théorème de Cauchy-Lipschitz que nous


voyons là dans le cas très particulier des équations
différentielles linéaires d'ordre 1 a en fait une por-
tée beaucoup plus générale, que nous verrons dans
le cours de 12.
Dans la pratique, on utilise peu l'écriture sous
forme intégrale de la proposition 31.20 pour la solu-
tion à un problème de Cauchy. On résout l'équation
(E} (par la méthode la variation de la constante
ou par la recherche d'une solution particulière se-
lon les cas) : la solution générale de (E} dépend
toujours d'un paramètre À E C (ou À E lR si les
coefficients et le second membre de l'équation sont
à valeurs réelles). La condition initiale f(to} = Yo ......
Cl)
impose alors la valeur du paramètre À.
..ci
ü
EXEMPLE 31.21. Résoudre le problème de Cau-
chy y'+ y= t, y(O}=l. FIGURE 31.3. Les courbes
Le second membre étant de la forme intégrales de y - y = et
1

exponentielle-polynôme, on recherche une solution
particulière de l'équation sous la forme P(t) =
cxt + f?,. La fonction P est solution si et seulement si 'v't E lR, cxt + f3 + ex = t, soit, après
identification des coefficients, ex= 1 et ex+ f3 = O. Ainsi t H P(t} = t - 1 est solution. La
solution générale de l'équation est donc t H t - 1 + Àe-t. La condition initiale y(O} = 1 est
donc équivalente à À= 1. La solution recherchée est donc t H t - 1 + e-t.

II. ÉQUATIONS LINÉAIRES D'ORDRE DEUX

Considérons une bille de masse m attachée à un ressort de rai-


deur k et de longueur à vide €0 , immergée dans un liquide. On
néglige la poussée d'Archimède et on modélise l'action du milieu
liquide sur la bille par une force de frottement fluide (de la forme
v v
Î = -2 µ où est la vitesse de la bille et µ ), 0). Choisissons
l'extrémité fixe du ressort comme origine O et notons Ü le vec-
teur unitaire dirigeant la verticale descendante. La position de la
bille à l'instant t sera repérée par sa position y (t} dans le repère
FIGURE 31.4. (0, Ü}. L'équation fondamentale de la dynamique s'écrit
Oscillateur
my"(t}Ü = -k(y(t} - €0 }Ü - 2µy'(t}Ü + mgû.

 l'équilibre, cette équation se résume à Ô = -k(fe - €0 }û + mgû; en faisant la différence


des deux équations et en posant 1Je = y(t} - fe (il s'agit de la position de m par rapport à
sa position d'équilibre), on aboutit à my:(t} + 2µy~(t) + kye(t} = O. En posant w 0 = /"Fn
et À = _µ_'
mwo
il s'agit de résoudre l'équation Ye" + 2?-..woy~ + W61Je = O. Dans le cas d'un
frottement non négligeable (i.e. À > 0 ou encore µ > 0), ce système mécanique est qualifié
d'oscillateur amorti. Lorsque À = 0 (et donc µ = 0), il n'y a aucune force de frottement
et on parle d'oscillateur non amorti. Cette terminologie laisse présager que les solutions Ye
962

de ce type d'équation s'expriment à l'aide des fonctions circulaires. Nous reviendrons sur ce
vocabulaire dans la suite et tenterons de le justifier.

IL 1. Définitions et notations
Définition 31.22. On appelle équation différentielle linéaire d'ordre deux toute équation du
type (E) : a(t)-y" + f3(t)-y' + y(t)-y = ô(t) où a, f3, y et b sont quatre fonctions définies et
continues sur un intervalle I de JR, à valeurs dans C. Résoudre l'équation (E) sur l'intervalle
I, c'est déterminer toutes les fonctions deux fois dérivables f : I ~ (C telles que \ft E
I, a(t)f"(t) + f3(t)f'(t) + y(t)f(t) = ô(t). A l'équation (E), on associe l'équation (EH) :
a( t )-y" + f3 (t )-y' + y( t )-y = 0, dite homogène.
Comme pour le cas des équations du premier ordre, la fonction inconnue -y intervient
dans l'équation au moyen d'une application linéaire, ce qui justifie la terminologie. L'ordre de
l'équation est l'ordre maximal de dérivation de la fonction inconnue. Les fonctions a, f3 et y
sont les coefficients de l'équation et ô s'appelle le second membre de l'équation; l'équation
homogène associée (EH) est souvent qualifiée d'équation sans second membre. On notera
9 l'ensemble des solutions de (E) et Ytt l'ensemble des solutions de (EH)- Sauf mention
contraire, on adoptera comme pour les équations d'ordre 1 la convention suivante :lorsque les
coefficients et le second membre de l'équation sont tous à valeurs réelles, on ne recherchera
que les solutions de (E) à valeurs réelles. On appellera encore courbes intégrales de (E) les
courbes représentatives des solutions de l'équation (E).

II.2. Équation homogène à coefficients constants


Définition 31.23. Soient a, b et c trois nombres complexes avec a /= O. On considère
l'équation homogène à coefficients constants (E) : a-y"+ b-y' + c-y = 0. La fonction polynôme
définie par P(t) = at 2 + bt + c est appelée trinôme caractéristique de l'équation (E).
On voit apparaître naturellement le trinôme caractéristique lorsque l'on calcule l'expression
a-y"+ b-y' + c-y pour -y de la forme t H -y(t) = et où r E C. On a -y'(t) = r-y(t) puis
-y"(t) = r2-y(t) donc
a-y"+ b-y' + c-y = (ar2 +br+ c)-y = P(r)-y.
Puisque -y ne s'annule pas sur JR, -y est solution de (E) si et seulement si P(r) = O. Si a et f3
désignent les racines complexes de P, les fonctions t H ecxt et t H ei3t sont donc solutions de
(E). La proposition suivante nous montre que ces deux fonctions suffisent à décrire toutes les
solutions de l'équation.

;_J:::.~tion.·~-'-èt_~Jk_:P·._.~--·:_ir_\ . .
'1-~ M'
J:_;+~ffl-•~--~~--
, IJ!ll T
\:li;::: . litiêt;:,r, ~rt,:ii~~s1r:1e
Z;;~:j~:~_1\,.V~>

·:-.f~Jitl:~la~t,i;~;:
dela forme t i.-+ {Àt+µ)e~ pc,ur• 1/é C et µ .è Ç~•," . . · ·.
PREUVE.
: · . ····
Écrivons les relations coefficients-racines pour P : a+ f3 = -~ et af3 = ~'
. . .·. < .·
l'équation est donc équivalente à -y" - (a+ f3)-y' + af3-y = O. Soit -y : lR H (C deux fois
dérivable. Posons \ft E JR, z(t) = e-cxt-y(t). On a donc sur JR, -y'(t) = (z'(t) + az(t))ecxt, puis
-y"(t) = (z"(t) + 2az'(t) + a 2 z(t))ecxt, d'où, \ft E JR,
963

1
-y"(tl-(a+l3)-y'(t)+al3-y(tl = (z"(t)+(a-13lz'(t)+-P(alzle"'t = (z"(t)+(a-13lz'(t)le"'t
a
car P(al = O.
1) -y est donc solution de (El si et seulement si \ft E lR, z"(t) + (a- l3)z'(tl = 0, donc
si et seulement si z' est solution de -y' + ( a - 13 l-Y = 0, ce qui est équivalent à z' de la forme
z'(tl = k 1 e(f3-oc)t avec k 1 E <C, soit z de la forme z(tl = f3~oce(f3-ocJt + k2 avec k2 E <C et
finalement, on aboutit à une solution -y (t l = z( t l e"'t = f3~oc ef3t + k2e"'t. La fonction -y est bien
de la forme annoncée. Réciproquement, soient À, µ dans <C et \ft E lR, -y (t) = Àe"'t + µef3t_ On
vérifie facilement que -y" - (a+ 13l-y' + al3-y = ÀP(a)e"'t + µP(l3lef3t = 0, d'où le résultat.

2) Dans ce cas a= 13, d'où -y"(tl- (a+ 13 l-y'(tl + al3-y(t) = z"(tle"'t. L'équation est donc
équivalente à z" = 0, donc il existe À,µ dans <C tels que z(tl = at + 13, d'où le résultat. La ......
Cf)
réciproque se vérifie comme dans le cas précédent. ■ ..d
ü

EXEMPLE 31.25. Déterminons les solutions à valeurs complexes des équations suivantes.
1. -y" +-y' +-y= o.
2
► Le trinôme caractéristique de l'équation valant P(t) = t + t + 1 = (t - j)(t - i2l où
2 3
j = e in/ = -½
+ i 'J:,
les solutions à valeurs complexes de l'équation sont les fonctions
définies sur lR part H -y(tl = ;\eit + µeh avec À,µ dans <C.
2. -y" - 2i-y' --y = O.
► Le trinôme caractéristique de l'équation valant P(tl = t 2 -2it-1 = (t-i}2, les solutions
à valeurs complexes de l'équation sont les fonctions définies sur lR par t H -y (t) = (Àt + µle it
avec À, µ dans <C.
3. -y" - i-y' + 2-y = O.
► Le trinôme caractéristique de l'équation valant P(tl = t 2 - it + 2 = (t - 2i)(t + il, les
solutions à valeurs complexes de l'équation sont les fonctions définies sur lR par t E lR H
-y(t) = ;\e 2it + µe-it avec À,µ dans <C.

La résolution des équations linéaires d'ordre deux à coefficients constants n'est pas encore
complète. Il reste à déterminer la forme générale des solutions à valeurs réelles lorsque les
coefficients de (El appartiennent à R

tr~1:!i~•;tfit~t,Jk~,î~}:~t[et~~ ft~:'Jf~t_;·fflt 1

1/.Larsque A > 0, en notant « et (.1les tkÛ/1; ffl,Cines réelles dê ,, lès s<ii~;-~e[E} ~


val~urs réëlles spnt ~f trf}io~ ~e {a ~ e t 1-+l~t + µeit. flt1€C ~.µc 001!8 Rr" . ... .i <. •
2. LtJrsquê ~.P, ~ri~7>~t11ti« ltl. n'!tJ~; âq?Jble{dofitc rée#fJ)j~;P/ J~;sfil~ti~; ilti'.'tfif ~
viùeurs rtélleS sonrléi.fonètit#l,S. de ia}orm;e t H {lt +i:cJe~ avet'l; µ. da$ .R, . .
s:,),,.~ê A,..,i,~) i~?~;t~l#(:f is· (<1t1,.~.ê-*)iês,4l~-1nt)~séôrtlp'l#µ: d>,r}fogÛêes
dé P, les •s.-9lutfo'4à •rte'tlllf'avâlettrs ~lq .SIJriÎ îes jo~it)ng île lg, /ôrme f:,~ (). ti:Îâ{ st} +
µs.in{'st}tert aveè'X:µtliinS'R:' " .. . . .. . . . .. .. . . .
964

PREUVE.

L Les solutions à valeurs complexes sont de la forme -y(t) = Àeat + µef3t avec À,µ E <C.
En reprenant la démonstration de la proposition 31.24, on s'aperçoit que À et µ sont des
constantes d'intégration de fonctions à valeurs réelles : on a donc À et µ réels.
2. Les solutions à valeurs complexes sont de la forme -y(t) = (;\t + µ)eat où À,µ E <C. Le
même argument qu'au 1) permet de conclure que À et µ sont réels.
3. Soit -y une solution à valeurs réelles de (E) ; -y étant a fortiori une solution de (E) à valeurs
complexes, -y est de la forme -y(t) = Àe(r+is)t + µe(r-is)t avec À,µ dans <C. Puisque -y est à
valeurs réelles, \lt E JR,

-y(t) = ~e(-y(t)) = ert~e(Àeist + µe-ist)


= ert(~e(;\) cos(st) - Jm(;\) sin(st) + ~e(µ) cos(st) + Jm(µ) sin(st)).

Après regroupement des termes en sinus et en cosinus, on voit que la fonction -y est bien de
la forme annoncée.
Réciproquement, puisque cos(st) = e"'+t'''
et sin(st) = e''' 2 r'",
une fonction de la forme
indiquée s'écrit également -y(t) = À1eist + µ1e-i st avec À1, µ1 E <C, il s'agit donc d'une
solution de (E).


EXEMPLE 31.27. Résolvons sur lR les équations suivantes.
1. -y" +-y' +-y= O.
► Le trinôme caractéristique de l'équation vaut P(t) = t 2 +t+ 1 = (t-j)(t-j2). Les solutions
à valeurs réelles de l'équation sont donc les fonctions de la forme -y(t) = (;\cos('i3t) +
µsin('i3t)Je-½t avec À,µ dans R
2. -y"+ 3-y' + 2-y = O.
► Le trinôme caractéristique de l'équation vaut P(t) = t 2 + 3t + 2 = (t + l)(t + 1). Les
solutions à valeurs réelles de l'équation sont donc les fonctions de la forme -y (t) = ;\e-t+µe- 2t
avec À, µ dans R.
3. -y" - 4-y' + 4-y = O.
► Le trinôme caractéristique de l'équation vaut P(t) = t 2 -4t+4 = (t-2)2. Les solutions à
valeurs réelles de l'équation sont donc les fonctions de la forme -y(t) = (Àt + µ)e 2t avec À,µ
dans JR.

Remarque. On comparera avec profit l'équation L des deux exemples 31.25 et 31.27 : il ne
suffit pas d'imposer À E JR, µ E lR pour que la solution définie par -y(t) = ;\eit + µei 2 t soit à
valeurs réelles.

Test 31.13. Test 31.14.


Résoudre y 11
- 3-y 1
+ 2-y = 0 sur JR. Résoudre y" - 2-y 1 + 5-y = 0 sur JR.
Nous avons établi ci-dessus l'équation différentielle -y"+ w~ = 0 pour un oscillateur non
amorti. Son trinôme caractéristique vaut P(t) = t 2 + w~ et comme w 0 # 0 il admet deux
racines conjuguées ±iw 0 ; les solutions de l'équation sont donc les fonctions de la forme

-y(t) = Àcos(wot) + µsin(wot) (avec À etµ réels)


965

ou, de manière équivalente, celles de la forme -y(t) = A cos(wot + cp) avec A et cp réels.
Étudions plus généralement les équations du type (E) : -y"+ k-y = 0 où k E R Lorsque
k > 0, il existe w 0 E R* tel que k = w§ et l'on est ramené à l'étude d'un oscillateur non
amorti. Lorsque k = 0, les solutions sont bien sûr les fonctions affines. Soit k < O. Il existe
w
alors 0 ER* tel que k = -w3
et le trinôme caractéristique de l'équation vaut P(t) = t 2 -w§.
Ses racines valent ±w0 et les solutions de l'équation sont de la forme -y(t) = Àewot + µe-wot
avec À,µ ER Puisque les formules 2ch(w 0 t) = ewot + e-wot et 2sh(w 0 t) = ewot - e-wot
s'inversent immédiatement en

les solutions peuvent également s'écrire sous la forme -y(t) = À1 ch(wot) + µ, sh(wot) avec À1
et µ 1 réels. .....
C'J
..d
ü

Équations du type y" + ky =0 avec k E ffi.


Il s'agit d'un cas usuel qu'il faut savoir résoudre immédiatement. Il y a trois cas à
envisager.
o CAS où k = w 2 > O.
Les solutions sont les fonctions de la forme t H Àcos( wt) + µ sin( wt) avec À, µ dans R,
ou, de manière équivalente, les fonctions de la forme t H A cos( wt + cp) avec A et cp
réel.
o CAS où k = -w 2 < O.
Les solutions sont les fonctions de la forme t H Àch(wt) + µsh(wt) avec À,µ dans R,
ou, de manière équivalente, celles de la forme t H Àewt + µe-wt avec À, µ dans R
o CAS où k = O. Les solutions sont les fonctions de la forme t HM+µ avec À,µ dans
R

EXEMPLE 31.28. Décrivons qualitativement l'évolution de l'oscillateur étudié en tête de


paragraphe puis justifions la terminologie usuelle d' « oscillateur amorti » et d' << oscillateur
non amorti ».
► La terminologie « oscillateur non amorti » est claire car la solution générale de l'équation
-y 11 + W61J = 0 est de la forme A cos( w 0 t + cp) avec A et cp réels. Considérons l'équation
d'un oscillateur amorti -y"+ 2;\-y' + W61J = O. Notons~ le discriminant réduit (négatif) du
trinôme caractéristique associé et li = JjL1Ï; ses racines valent donc -À± ili et les solutions
de l'équation sont donc de la forme (Àcos(lit) + µsin(lit)Je-?.t avec À etµ réels. Or il existe
A, cp E R tels que 'v't E R , Àcos( lit) + µ sin( lit) = A cos( lit + cp). Les solutions sont donc
les fonctions de la forme -y(t) = Acos(lit + cp)e-?.t_ Le tracé suivant a été effectué pour
A=3,À=0,25,cp =7I/4 et li= 1.
966

La solution oscille entre les courbes représentatives des fonctions t H ±e-t/4 et tend vers 0
lorsque t tend vers +oo (cela vient de l'exponentielle et du signe positif de À), ce qui justifie
la terminologie « oscillateur amorti ».

Test 31.15. Test 31.16.


Résoudre -y" - 4-y = O. Résoudre -y"+ 4-y = O.

II.3. Équation à coefficients constants avec second membre


Reprenons le système mécanique étudié en ouverture du par~raphe sur
les équations d'ordre deux en ajoutant une force extérieure F ext = Fü.
L'équation d'évolution de Ye s'écrit dans ce cas

2.. f
Ye
Il
+ 2ÀWoYe + Wo!:le
/
= -.
m
FI-
Lorsque la force extérieure vibre à la pulsation w, par exemple F(t) =
GURE31.5. ( )
Oscilla- Fo cos wt , on s'aperçoit qu'après un régime transitoire, la bille oscille
tions à la pulsation w; on parle à ce sujet d'oscillations forcées ou entre-
entrete- tenues. Nous justifierons ces observations et montrerons en particulier
l'e~ce du phénomène de résonance, à l'aide de la théorie générale exposée ci-dessous.
Les méthodes de résolutions générales des équations linéaires d'ordre deux à coefficients
constants sont les mêmes que pour l'ordre un : variation des constantes et recherche d'une
solution particulière. Nous étudierons la variation des constantes dans le cours de 12.

Prop?5iti<tâ 31.29; ~oity1 une


Siif!JÎÎOO ~~.tlèi'~t~ ~taifü dit ;,;
tE)! ny"+by.1'+ëv· &·!(tj.•AtohfCenitm&ltîfisi~lûtîiiM"!fèfffJ"ê3!;~~

PREUVE. Soit y: 1 --t <C dérivable. Puisque 'v't E 1, ay;'(t) + by\(t) + cy 1(t) = li(t), la
fonction y est solution de (E) si et seulement si ay\'(t) + by\ (t) +cy 1(t) = ay"(t) + by\ (t) +
cy1 (t), soit a(y1 - y)"(t) + b(y1 -y)'(t) + c(y1 - y)(t) = 0, c'est-à-dire y - y 1 E Ytt soit
encore y E Y1 + Ytt. On a donc Y= Y1 + Ytt. ■
967

Recherche d'une solution particulière


On cherche à résoudre l'équation différentielle (E): a-y"+ b-y' + c-y = ô(t).
o On dispose d'une solution particulière -Y1 de (E).
◊ On résout (EH): a-y"+ b-y' + c-y = 0, l'équation homogène associée à (E).
◊ On a Y = -y 1 + YH, ainsi la solution générale de (E) est la somme d'une solution
particulière de (E) et de la solution générale de (EH)-

Le cas usuel est celui d'un second membre en polynôme-exponentielle. La recherche d'une
solution particulière généralise dans ce cas la méthode exposée dans la proposition 31.12. On
utilisera le lemme 31.13 pour le prouver.
....
P~16sitiôn ·!I!so. Si>iènf A''.#= <>;ll; è éflb rfoi,,tre 'tiombres complexe$ eiS uiè J()rl,ction C'")
..d
I~~~:fi~tJd,ëti~,itEt~tC, Albfi,l~Ôff:{Jil:iaflj+b\ Jt +.ej·•·;;.S(t:~~ otlmet 9:ùr ü
'Rê.,t;,ffl.u~;~~' l~cl4' f<>rmt ftt) == t'{t}ê~ ••~,J '8t ttn Jlf)~n:,f,i,~ )i ·•toeJll,dients
.
Jiii,iC~(jù~ë . . . . .. . . .

·.,,,j~~1e11•iiii
PREUVE. On a f'(t) = (T'(t) + wT(t))e"'t et f"(t) = (T"(t) + 2wT(t) + w 2T(t))e"'\ d'où,
pour tout t réel, af"(t) + bf'(t) + cf(t) = (aT"(t) + (2wa + b)T'(t) + P(w)T(t))e"'t. La
fonction f vérifie donc l'équation si et seulement si aT" + (2wa+ b)T' + P(w)T = S. Posons
À= 2 "'~+b etµ= P(w)/a. L'équation est équivalente à T" + ÀT' + µT = S/a. Notons u, v les
racines complexes du trinôme t 2 + Àt + µ. On a donc À= -u -v et µ = uv. L'équation est
donc équivalente à (T'-aT)' -b(T'-aT) = S/a. D'après le lemme 31.13, il existe une solution
polynomiale V à V' -vV = S/a puis il existe une solution polynomiale de W' - uW = V. Il
suffit de choisir T = W.
1. Lorsque w n'est pas racine de P, P(w) = a uv /. 0, u et v sont donc non nuls et d'après le
lemme 31.13, deg (W) = deg (V)= deg (S).
2. Lorsque w est racine simple de P, P(w) = 0 et À/. O. On peut donc supposer (quitte à
permuter u et v) que u = 0 et v /. O. On a donc deg (V)= deg (S) puis deg (T) = deg (W) =
deg (V) + 1 = deg (S) + 1.
3. Lorsque w est racine double de P, on a P(w) =À= 0 d'où u = v = O. D'après le lemme
31.13, on a donc deg (V) = deg (S) + 1 puis deg (T) = deg (W) = deg (V)+ 1 = deg (S) + 2. ■

EXEMPLE 31.31. Résolvons sur IR l' équation y" - 3-y' + 2-y = f(x) pour plusieurs fonc-
tions f.
1. f(x) =X
► Toutes les équations qui suivent admettent le même polynôme caratéristique de solutions 1
2
et 2. L'équation (EH) admet donc pour solutions les fonctions de la forme x H Àex+µe x, À,µ
3 2
dans IR. Les solutions de l'équation sont les fonctions de la forme x H zx: + Àex + µe x, À,µ
dans IR.
2. Puisque 2 est solution simple de l'équation caractéristique, l'équation admet une solution
particulière de la forme x H axe 2x.
968

3. f(xl = e 2x
► Puisque 2 est solution simple de l'équation caractéristique, l'équation admet une solution
particulière de la forme x H uxe 2x. On aboutit à u = 1. Les solutions de (El sont donc les
fonctions de la forme x H xe 2x + Àex + µe 2x, avec À, µ dans IR.
4. f(xl = xex
► Puisque 1 est solution simple de l'équation caractéristique, l'équation admet une solution
particulière de la forme x H ( ux 2 + bxlex. On aboutit à u = -1 /2 et b = -1. Les solutions
de (El sont donc les fonctions de la forme x H -(x2/2+xleX+Àex+ µe 2x avec À,µ dans IR.

Test 31.17. Test 31.18.


Résoudre 11" -11' = tet. Résoudre 11" + 11' = tet.

Le théorème de superposition permet de simplifier les calculs en « cassant » le second


membre en une somme de fonctions plus simples. On peut reprendre mot à mot le commentaire
déjà donné pour les équations d'ordre 1 à propos de ce résultat.

PREUVE. Soient Y1 et Y2 des solutions respectives des équations (Eil et (E 2 l. Posons y =


Y1 + Y2· La fonction y est dérivable sur I et Vt E I

cxy"(tl + f3(tly'(tl +y(tly(tl = cx(t)(y1 +Yzl"(tl + /3(t)(y1 +Y2l'(tl +Y(Y1 +Yz)(tl


= cx(tly;'(tl + f3(tly;(tl +y(tly 1(tl + cx(tlyf(tl
= b1(tl + b2(tl
La fonction y est donc solution de (El. ■

EXEMPLE 31.33. Résolvons sur IR l'équation y" - 3y' + 2y = ch(xl.


► L'équation s'écrit y" - 3y' + 2y = ex+rx, le second membre est une superposition de
fonctions du type polynôme-exponentiel.
Le trinôme caractéristique vaut P (t l = t 2 - 3t + 2 = (t - 1 l (t - 2 l. Puisque 1 est racine
simple de P alors que -1 n'en est pas racine, l'équation admet une solution particulière de
la forme f: x H uxex + be-x. On a f'(xl = -be-x + (ax + ulex, f"(xl = be-x + (ax + 2ulex
et f"(xl - 3f'(xl + 2f(xl = 6be-x - uex. La fonction f est donc solution si et seulement
si Vx E IR, 6be-x - uex = ex+2e-x. Pour que y soit solution de (El, il suffit donc d'imposer
6b = 1/12 et a = -1 /2. Les solutions de (El sont donc les fonctions de la forme x H
-½xex + e;;
+ Àex + µe 2x avec À,µ dans IR.
969

Remarque.
1. On se gardera d'affirmer directement que
ex+ e-x
VxElR, 6be-x-aex= ---, a=-l/letb=l/12 .
2
Cette implication est vraie mais nécessite une démonstration. Puisque nous recherchons une
solution particulière (et non pas toutes les solutions de l'équation qui sont de la forme f(x) =
axex + be-x), on se borne à déterminer une condition suffisante sur a et b pour que f ainsi
définie soit une solution.
2. Il n'est pas nécessaire de mentionner à chaque fois le théorème de superposition. On consi-
dère qu'il va de soi que la «superposition» d'une solution de y" - 3-y' + 2-y = ~ et d'une
solution de y" - 3-y' + 2-y = e;x est solution de l'équation initiale. On applique alors à deux
reprises la proposition précédente sans plus de précision.
Lorsque (E) est à coefficients réels et que le second membre est du type P(t) cos(wt) ou .....
C')

P(t) sin(wt) (où P désigne un polynôme à coefficients réels), par exemple dans le cas des ..d
ü
oscillations forcées d'un système mécanique, le passage à C nous permettra de trouver des
solutions à valeurs réelles de (E). Comme dans le cas des équations d'ordre 1, les calculs
seront justifiés par la proposition qui suit.

PREUVE. Soit 1J : I H C. Posons 1J1 = !Re(y) et 1J2 = Jm(y). La fonction 1J est deux fois
dérivable sur I si et seulement si y 1 et 1J2 sont deux fois dérivables sur I. Sous cette hypothèse,
1
on a ay"+by'+cy = a(1J1+i1Jz)"+b(y 1+i1J2l'+c(1J1+1Jzl = ay; +by;+c1J1+i(ay 2+by~+
C1Jz). En identifiant les parties réelle et imaginaire on obtient que la fonction y est solution
de uy" + by' + cy = d si et seulement si !Re(y) et Jm(y) sont respectivement solutions de
ay" + by' + cy = !Re(d) et ay" + by' + cy = Jm(d). ■

2
EXEMPLE 31.35. Résolvons sur lR l'équation y"+ 4-y' + 5-y = e- xsin(x).
► Recherchons une solution particulière de l'équation y"+ 4-y' + 5-y = e(-l+ilx_ Puisque les
solutions de l'équation caratéristique sont -2 ± i, il existe une solution particulière de la
forme f: x H axe(-l+i)x_ On a, pour tout nombre réel x, f'(x) = ((-2 + i)ax + u)e(-l+ilx,
f'(x) = ((-2+i)2ax+2(-2+i )a)eH+ilx et f"(x) +4f'(x) +Sf(x) = 2iaeH+ilx_ La fonction
f est donc solution si et seulement si a = 1/li = -i/2. La partie imaginaire de2 cette solution
particulière est une solution de l'équation initiale et vaut f 0 : x H - xcos(;Je- ' . La solution
2
générale de (EH) s'écrivant x H [Àcos(x) + µsin(x)]e- x avec À,µ dans JR, les solutions de
(E) sur lR sont donc les fonctions de la forme

xcos(x)e-2x
XH + [Àcos(x) + µsin(x)] e-2x avec (À,µ) E JR2.
2

Remarque. L'équivalence entre la propriété (Vx E JR, 2iae(-l+i)x = e(-l+ilx) et l'égalité


lia = 1 est ici claire, on l'a donc affirmée même si l'on n'utilise en fait que la condition
suffisante, c'est-à-dire lia= 1 ---, Vx E lR , 2iae(-l+ilx = e(-l+ilx_
970

Nous sommes maintenant en mesure d'expliquer les phénomènes observés lors des expé-
riences sur les oscillations mécaniques entretenues. L'équation générale d'une grandeur phy-
sique -y(t) soumise à des oscillations forcées s'écrit
(El: -y"(t) +2Àw 0-y'(t) + w~(t) = Acos(wt)
où À ;:: 0 est le coefficient d'amortissement du système (on fait toujours l'hypothèse d'un
faible amortissement À< 1), w 0 est la pulsation propre du système (c'est-à-dire la pulsation
qu'aurait le système s'il n'était soumis à aucune force extérieure ni amortissement), w est
la pulsation de l'excitation extérieure subie par le système et A son amplitude. On souhaite
connaître la réponse du système à cette excitation extérieure, c'est-à-dire que l'on recherche
la forme générale de la solution de (E). Commençons par passer à C en recherchant une solu-
tion particulière de -y"(t) + 2Àw 0-y'(t) + w~(t) = Aeiwt_ Le trinôme caractéristique de cette
équation vaut P(t) = t 2 + 2Àw 0 t + w~ et son discriminant réduit L1 = wMÀ 2 - 1) est négatif
dans le cas d'un faible amortissement. Posons b = ~ -

◊ CAS D'UN OSCILLATEUR NON AMORTI : À= o. Les racines de p valent dans ce cas
±iw~. Lorsque w = w 0 , il existe une solution particulière de la forme -y(t) = Ateiwot_ En la
reportant dans l'équation, on trouve facilement A = -2,wo 1
. . La partie réelle de cette solution
valant t H tsi2n(wotl, la solution générale de l'équation s'écrit
wo
. tsin(w 0t)
-y(t) = Àcos(w 0 t) + µsm(w 0 t) + avec À,µ E lR.
2Wo
L'excitation à la pulsation propre d'un oscillateur non amorti se traduit donc par une explosion
progressive de la réponse du système, comme le montre la figure suivante :

Lorsque w -/- w 0 , on passe également à C. Il existe une solution particulière de la forme


f(t) = Beiwt_ Après tout calcul, on trouve B = uJ~w2. La fonction t H A~~~:Ztl est donc une
0 0
solution de l'équation initiale. La solution générale de cette équation s'écrit
. Acos(wt)
-y(t)=[acos(w 0 t)+bsm(w 0 t)]+ , (a,b)ER2.
W 2 -w 02

Dans ce cas il y a oscillations forcées, obtenues par superposition de deux oscillations de


fréquences distinctes w 0 et w, le résultat n'est plus une sinusoïde.
◊ Cas d'un oscillateur amorti, avec O <À< 1. Les racines de P valent dans ce cas À±ib.
Il existe une solution particulière de la forme -y(t) = Beiwt_ En reportant dans l'équation, on
trouve facilement l'expression B = u1a-w2~2 L\wow· Notons Z = u1a-w2~2 L\wow que l'on écrit
sous forme polaire Z = IZleicp_ Comme !Re(-y(t)) = A J(w2:~~t.::;_~uiw2, la solution générale
de l'équation (E) s'écrit

-y(t) = [acos(bt) + bsin(bt)]e-,\t + ~=A=co=s=;.c(w=t=+=<r=cl===:.=


J(
w 2 - w~) 2 + 4;\ 2 w~w 2
971

avec a, b dans R Puisque la solution générale de (EH) tend vers zéro lorsque t tend vers
+oo, on voit progressivement apparaître un régime d'oscillations à la même pulsation w que
l'excitation (ce régime correspond à la solution particulière calculée ci-dessus), ce qui justifie
la terminologie « oscillations forcées ».
On remarque que l'amplitude de la réponse à l'excita- ....
tion Acos(wt) passe par un maximum pour w = Wr tel que O')
.d
w; = wW - D-1] (on suppose ici en plus que À< 1/v'l). ü
Une étude un peu plus précise prouverait que l'amplitude va-
rie considérablement au voisinage de cette pulsation lorsque
À est petit. L'amplitude de la réponse admet dans ce cas
un pic prononcé en Wr- Ce phénomène s'appelle la « réso-
FIGURE 31.6. nance » de l'oscillateur. Citons un exemple connu de tous
Amplitude A(w) de les lecteurs de Tintin: l'augmentation subite de l'amplitude
la réponse de la vibration au voisinage de Wr ~ Wo permet de briser
des verres de cristal par émission d'un son pur à la fréquence propre du cristal f 0 = wo
ln.

La présence de deux constantes Àetµ dans la description générale des solutions de l'équa-
tion homogène (EH) a pour conséquence qu'une solution de (E) est entièrement déterminée
par la donnée d'une condition initiale du type y(to) = Yo, y'(to) = Yb- En langage de méca-
nicien : le mouvement d'un point matériel de masse m est entièrement défini par la donnée
des forces auxquelles il est soumis (la donnée d'une équation différentielle d'ordre deux) et
par sa position et sa vitesse initiales (la condition initiale). On appellera problème de Cauchy
pour l'équation (E) la donnée d'une telle condition initiale.

PREUVE. Soient ex, 13 les racines complexes du trinôme caractéristique de l'équation (E) et
y : I H C deux fois dérivable. Posons Vt E I, z(t) = y(t)e-at_ La fonction z est également
deux fois dérivable sur I et sur cet intervalle

y'(t) = (z'(t) + cxz(t))eat, y"(t) = (z"(t) + 2cxz'(t) + cx2 z(t))eat


et ay"(t) + by'(t) + cy(t) = az"(t) + (lcxa + b)z'(t). La fonction y est donc solution de
l'équation si et seulement si z' est solution de au'+ (2acx+ b)u = b. D'après les paragraphes
précédents, cette équation admet au moins une solution f et une primitive F de f sur I est une
solution particulière de (E).
Supposons que ex-/- (3. Les solutions à valeurs complexes de l'équation (E) sont les fonctions
de la forme y(t) = F(t) + Àeat + µel3t avec À,µ dans C. Cette fonction vérifie la condition
972

initiale si et seulement si Àcx.e<rto + µ13ef3to = y~ - F'(t0 ) et ;\e<rto + µef3to = y 0 - F(t0 ). Le


déterminant de ce système linéaire vaut e<oc+l3Jto ( cx.-13) # 0, il existe donc une unique solution
(À,µ), d'où l'existence et l'unicité d'une solution y vérifiant la condition initiale.
On raisonne de manière analogue dans le cas où ex. = 13. ■

On prouve facilement que si les coefficients, le second membre et la condition initiale sont
à valeurs réelles, l'unique solution au problème de Cauchy correspondant est à valeurs réelles.

EXEMPLE 31.37. Résolvons sur lR les problèmes de Cauchy suivants.


1. y" - 4y' + 4y = 0, y(0) = y'(0) = O.
► On sait qu'il existe une unique solution à un problème de Cauchy. Puisque la fonction
nulle est clairement solution du premier problème, il s'agit de la solution.
2. y" - 6y' + 9y = 0, y(0) = 0, y'(0) = 1.
► On remarque que le trinôme caractéristique admet la racine double 3. Les solutions de
l'équation sont donc les fonctions de la forme x H (Àx + µ)e 3x, À,µ dans R La condition
initiale impose À = 0 et µ = 1. La solution du deuxième problème de Cauchy est donc la
fonction définie sur lR par x H xe 3x.
3. y" - 3y' + 2y = x, y(0) = y'(0) = 1.
► Le trinôme caractéristique admet 1 et 2 pour solutions. Le second membre est du type
polynôme-exponentiel; 0 n'étant pas solution du trinôme caractéristique, il existe une solu-
tion particulière de la forme x H ax + b. On aboutit à a= 1/2 et b = 3/4. Les solutions de
l'équation sont donc de la forme x H 2".i+ 3 + ÀeX + µe 2x, À,µ dans R Le problème de Cauchy
impose À = 0 et µ = 1/4; son unique solution s'écrit donc x H 2".i+3 + ¾e 2x.
4. y"+y'+y=0, y(0)=0, y'(0)=l.
► Le trinôme caractéristique admet les racines j et j2. Les solutions sont donc les fonctions
2
de la forme y: t H ;\eit + µei t_ Cette fonction est solution du problème de Cauchy y(0) =
0 , y'(0) = 1 si et seulement si À = -µ et À(j - j2) = iy'3;\ = 1. L'unique solution au
2
problème de Cauchy étudié est donc y(t) = i_½(eil- ei t) et, puisque j = -½
+ i".( (et
j2 = -1 - j), on a y(t) = ~ sin( v'3t/2)ct/ 2
.

Remarque. Dans le 4., on aurait également pu écrire la solution générale de l'équation sous
la forme y(t) = Acos(v'3t/2 + cp)e-t/l et déterminer les constantes A et cp à l'aide de la
condition initiale. Attention : la solution est unique mais il existe une infinité de constantes
possibles car le cosinus est n-antipériodique.
973

III. EXERCICES
31.1. 5. Résoudre (El.

Résoudre sur R l'équation différentielle 31.6.


(El: y"+ 4-y = sin2(tl.
Résoudre sur I =]0, n[ l'équation différentielle

(El: y'+ cotan(tly = cos2(tl.


31.2.

Résoudre sur I =] - n/2, n/2[ l'équation


31.7.
1 1
y -tan(tly = ( l
1 +cos t Déterminer les applications f de classe 'if 1 de R ......
dans R telles que "'
..ci
u
31.3. Vx ER, f'(x) = f(2005-xl.

Résoudre sur R l'équation différentielle


(El: y" -2-y' + 5-y = etsin(2tl + cos(tl. 31.8.

Résoudre sur ]-oo, 0(, ]O, 1[ puis ]1, +oo[ l'équa-


31.4.

Résoudre sur R les équations différentielles 31.9.

C'est Leibniz qui apporta la première solution


et au problème de la tractrice ...
1. En admettant que la solution y définie sur
[O, 1 [ de l'équation
y
31.5. y'=
✓ 1-y2

Soit (El l'équation (t2 + 1l-Y" - 2-y = O. réalise une bijection de ]O, 1[ sur ]O, 1[, établir
1. Établir qu'une éventuelle solution polyno- que sa bijection réciproque notée x: y H x(yl
miale et non nulle de (El est nécessairement est dérivable et vérifie
de degré deux.
2. Trouver une solution polynomiale et non x'(yl =
nulle p de (El.
3. Justifier qu'une fonction y deux fois déri- 2. Vérifier le résultat de Leibniz,
vable de R dans R peut s'écrire sous la forme
y = p x z où z est une fonction deux fois déri-
vable de R dans R. I
4. Montrer qu'une fonction z : R ---, R deux
fois dérivable est solution de (El si et seule-
ment si la fonction Z = z' (où z est définie sur JO, 1(.
comme à la question précédente l est solution 3. En déduire que sur ]O, 1[
d'une équation différentielle linéaire d'ordre un
(E'l à préciser.
Sixième partie
SOLUTIONS DES TESTS

Chapitre 1 1.12. îZ.


1.7. 2~7t. 1.13. Elles valent respective-
1.1. On a
1.8. ment 2n, 3n et 4n.
llü+vll2 = iiüll2+2ü-v+llvll 2 1.14. La somme des angles au
et sommet d'un polygône convexe
à n côtés vaut (n-2)n.

1.15.
d'où

liü+ vll2-iiü-vil 2 =4Ü• V.

M111t/6

1.2. On trouve

1.9. Non.
1.10. a= b[n] =}a= b[n/2]
1.3. R et a= b [2n] =} a= b [n].

1.4. 8 unités d'aire. 1.11.

1.5. L'aire du grand carré vaut 4.


L'aire du petit carré vaut 2.
x/v'2 +y/v'l=x'
{ -x/v'2 + y/v'l =y'. L'aire du disque vaut 7t.
1.16. Le plus court chemin
1.6. On a z' = ze-i 8 . Comme entre deux points étant la ligne
z' = x' +iy' et z = x+iy, on droite, le périmètre p = a+ b+c
retrouve les formules du triangle est inférieur à la lon-
gueur nd de 'ef'.
cos{0)x + sin(0)y = x'
{ -sin{0)x + cos(0)y =11 1 •

Chapitre 2 sante mais pas strictement crois-


sante sur I. Il existe alors deux
2.8. Oui. Pour tout x dans
2 .1. Choisir un repère ortho- éléments x < y de I tels que
]O, n], lf(x)I :( !xi :( n.
normé de centre n. On trouve f(x) = f(y). Comme, pour tout
y= JR2 -x2. z dans ]x,y[, f(x) :( f(z) :( f(y), 2.9. Oui.
f(z) = f(x) = f(y). La fonction
2.2. Oui : permuter les deux f est constante sur [x, y]. 2.10. Symétrie centrale de
axes. centre !1(3, 2)q.
2.6. Non : voir f = g = -idlR
2.3. On a (f o g)(x) = sin 2 (x) et 2.11. Réflexion d'axe fg d'équa-
et fg(x) = x 2 .
(go f)(x) = sin(x2 ). tion x = -¾-
4 2 2. 7. La fonction est décrois-
2.4. t + 2t 3 + 4t + 3t + 3. 2.12. Oui.
sante sur les deux derniers en-
2.5. Soit f une fonction crois- sembles mais pas sur le premier. 2.13. f(T/2) f{-T/2) et
f(T/2) = f(T - T/2) = -f(-T/2)
d'où f(T/2) = O.
constante égale à 1.

2.18. t H -3sin{t) cos2 (t).


vert non vide : f est donc stric-
tement croissante sur IR.. Comme

2.14. Une telle fonction ne peut \ftEIR., t-1,;:;;f(t),;:;;t+l,
2.19. t H 2(1 +tan2 (t)) tan(t).
être injective mais peut être sur-
jective. f( t) tend vers +oo en +oo et vers
2.20. On a -oo en -oo. La fonction f étant
2.15. Strictement monotone=} continue sur IR., elle réalise une
injective. Mais la réciproque est (fgh)' = f'gh+ fg'h+ fgh'. bijection de IR. sur IR..
fausse.
2.22. La fonction f est dérivable
2.16. Voir le test 2.8. On déduit 2
et sur [-1, 1], f'(t) = (t1;:;.\ 12
de l'inégalité que f{x) tend vers 2.21. Notons f la fonction de est positif. La dérivée ne s'annu-
0 avec x : comme f(0) = 0, cela l'énoncé. La fonction est déri-
lant qu'en ± 1, la fonction réalise
signifie que f est continue en O. vable et sa dérivée est positive.
L'ensemble des points où la déri- une bijection strictement crois-
2.17. Il n'y en a que deux : vée s'annule est égal à n+2nZ et sante de [-1, 1] sur l'intervalle
la fonction nulle et la fonction ne contient aucun intervalle ou- [f(-1),f(l)] = [-1/2, 1/2].

Chapitre 3 3.8. Étudier la fonction de IR.


dans IR. définie par g(x) = x -
arctan(x). Comme g est déri-
3.1. On a sin(x) ,;:;; 1 < ~ ,;:;; x. 7 [ - (X
vable sur IR. et que
3.2. 1J = 4x - 7t. x2
-X X \fx E IR., g'{x) = - 2- - ? 0,
3.3. Non. X +1
3.6. f- 1 (x) = 2n + arccos(x). la fonction g est croissante sur
3.4. f- 1 (x) =n-arcsin(x).
IR.. Comme g(0) = 0, g est posi-
3.7.1} =X.
3.5. On note ex= arccos(x). tive sur IR.+.

Chapitre 4 positions des réels a et b par 4. 7. On a x = - argch{y).


rapport à 1.
4.8. sh{x) + sh{y) est égal à
4.1. Oui, sur IR.~ et l'on a
ln:(x) = 1/(xln(a)).
4.4. Non. 2sh (4'1-) ch (9)-
4.5. Les deux limites valent 1. 4.9. Ces formules ne corres-
4.2. On trouve -oo.
pondent plus à un changement
4.6. +oo.
4.3. C'est faux. Cela dépend des de repère orthonormé.

Chapitre 5 5.4. Soit z E IC. Par unicité de 5.5. Écrivons z = x + i 1J avec


l'écriture sous forme algébrique, x, 1J E IR.. L'équation est équi-
5.1. C'est faux. Par exemple, z E IR. si et seulement si z = valente à
9le{z) et, sous cette hypothèse,
9le(i2)=-lc/9le(i) 2 =0. 12x 2 + 4y 2 + 8ixy = 3,
lzl = l 9le(z)I. Ainsi z E IR.+ si et
seulement si z = 9le(z) = lzl. ce qui est équivalent au système
5.2. C'est vrai.
12x 2 +4y 2 =3
5.3. Soit z E IC. Par unicité de { 8xy =0
l'écriture sous forme algébrique,
z = !Re(z) + iJm(z) E i!R. si et c'est-à-dire,
seulement si 9le{z) = 0, c'est-à-
dire i'.Jm(z) = z. x=0 et 11 =±v13
" 2 ,
ou 5. 7. On trouve 5.12. On a ei"/ 3 = -j2 et
1 1 - e-ie e-irr/3 = -j.
ei ·2
x=±:z et 1J=Û. 1 + e-ie.
1-i' J ' 5.13. Racines carrées de 1 + i :
Les solutions sont donc
5.8. v'3 + 3i = 2v'3ei"13 , y~
---y- y---y-·
+i~
v'3 - 3i = 2v'3e-irr/3, -v'3 +
3i = 2v'3e2irr/ 3 et -v'3 - 3i =
Racines carrées de 1 - i :
lv'3e4irr/3.
5.6. L'ensemble des points re-
5.9. On a°'= e2irr/3 = j.
cherché est la réunion des deux
demi-droites issues de O faisant 5.10. On trouve les entiers n
y~
---y- y---y-.
-i~

un angle de ± n / 3 avec la demi- non divisibles par 3.


droite ( Ox).
5.11. -n/2. 5.14. ±(3 - 2i).

Chapitre 6 3.
6.10. On a n i
6.1. 218. as + bs = as - ( -b )5 ' \ ' \ a·
L_L_i,J.

6.2. I:! =:\(2k + 1).


8
=(a+b)
4
L_ uk(-b) 4 -k
i=l j=l
n n
6.3. L;!~ Uk- k=O
= L rai,j
i=l i=j
6.4. Utiliser le fait que
6.11. On trouves= 1.
4.
b = tan((n- f)n/(2n)) 6.12. On trouves'= j. n n
= tan(n/2- fn/(2n))
= cotan(fn/(2n))
6.13. On a îo = 1, T1 = X, puis LL Ili,j L Ili,j

î2 = 2X 2 - 1 et î3 = 4X 3 - 3X. i=l j=l l(i,j(n


n n
6.14. U 0 = 0, U1 = 1, U2 = 2X = rrai,j
6.5. On trouve et U3 = 4X2 - 1. j=l i=l

Uq + Uq-1 - llp-4 - Up-3-


6.15.
1. 6.16. nz(,~t1)z
n n
' \ 'L
L \ a ·l,J
. L Oi,j
6.17. %6·
6.6. On trouve i=l j=i 1
6.18. ;;.
n j
u~ +u~_ 1 - ~ - 4 -~-3- 6.19. Elle est fausse, il manque
=rrai,j
j=l i=l les produits « croisés ».

6.7. -1.
2. 6.20. 63.2 13 ln(2).
n-1 n
6.8. -14+38i. L L Ili,j L Ili,j
6.9. Remarquer que i=l j=i+l 1 (i<j(n
n j-1

= rrai,j
i=2 i=l

Chapitre 7 En compréhension : 7. 2. En extension :

{ e2kirr/n 10,;;; k,;;; n - 1 }.


7 .1. En extension : {n E Nl4ln}.
En compréhension :

{4nln EN}.
7.3. {-1,0, 1, -i, i}.
7.22. Soit x E A. Co=e
f(x) E f(A), x E f~ 1(f(A)).
neutre: 0.
7.34. On trouve x = a~ 1 * b.

7.23. Pour tout élément x de 7.35. X= a~l *C* b- 1.
7 .4. Voir le chapitre 23.
E, llt-'(BJ(x) = 1 si et seule-
7.5. Elle est vraie. ment si f(x) E B, c'est-à-dire 7.36.
(11B o f)(x) = 1. D'où le résul- 1} Réflexive, symétrique et
7.6. C'est faux considérer transitive (mais pas antisymé-
tat, puisque les deux fonctions
{(1, bl, (2, a)}. trique).
ne prennent que les valeurs O et
7.7. z. 2} Symétrique (mais pas ré-
1. flexive, ni antisymétrique, ni
7.8. Oui, car Ac lR \ IQ. 7.24. Notons f = llt-'(AuBJ· On transitive dès que E f= 0).
a 3} Réflexive (mais pas antisy-
7.9. An B. métrique, ni symétrique, ni tran-
f = llAuB O f = ]IA O f + lis O f sitive dès que E f= 0).
7.10. {N XE) U {A X Be).
-IA ofllB of 4} Réflexive, symétrique et
7.11. Ona
= llf-1 (A)+ llf-1 (B) transitive (mais pas antisymé-
trique).
9"(E) = {0,{0},{l},E}, - llf-1 (A)llf-1 (B)
= lit-' (A)uf-1 (B)· 7. 3 7. La seule relation symé-
et ,9"(9"(E)) est égal à
trique et antisymétrique est la
relation d'égalité.
{ 0, { 0}, {{O}}, {{1}}, {E},
7.25. L'application f n'est pas 7.38. On a n:~ 1 (E/'R,) =E et
{{0}, { O}}, {{0}, {1 }}, injective car f(-1) = f(l ). L'ap- n:~ 1 {x) = X:.
{0, {E} }, {{O},{l}}, {{O}, E}, plication f est surjective d'après
le théorème de d'Alembert- 7 .39. 'R, est la relation d'égalité.
{{l}, E}, { 0, {O}, {l}}, { 0, {O}, E},
Gauss.
{{O},{l}, E}, { 0,{l}, E}, 9/'(E)}
7.26. Toutes les fibres de f sont 7.40. sup(F) = x.
des singletons. 7.41. (JR,,;;;;) et F=ll,2].
7.12. UxE9"(El X E et 7.27. La bijection réciproque de 7.42. On a inf(F) = 0 et
nXE9"(E) X= 0 . f o g o t~ 1 o g~ 1 est égale à sup{F) = {l, 2}.
gofog- 1 of- 1.
7.13. 4. 7.43. Les trois inf ne sont
7.28. f~ 1({y}) ={f- 1 (y)}. pas définis. On a par contre
7.14. 1.
7.29. f- 1(B) est l'ensemble des sup{F2) = sup(F3) = 3 et
7.15. (f o g)(x) = x 2 + sin(x2 ) sup{F1) =2.
antécédents par f des éléments
et (go f)(x) = (x + sin(x)) 2 .
de B. Puisque tout élément y de
7.16. f"(x) = x si n est pair,
f(x) = 1/x sin est impair.
B admet un unique antécédent
par f qui vaut t~ 1 (y), f- 1(B) est
Chapitre 8
7.17. 111 = IA et llAIAc = o. égal à l'ensemble {f- 1 (y)ly E 8.1. On a
B} = f- 1(B), image directe de
7 .18. llA.1.B = IA + 11B - 211AIB. B par l'application t~ 1. llAuB = IA + 1B -llAis,
d'où
7.19. g = flA est l'aplication de 7.30. Il est facile de constater
A dans B définie par g(l) =cet que l'application '1> de 6F dans
6E définie par '1>(0") = f- 1 o(Jof
g(2) =a. xEE

vérifie '1> o 1l' = ide E et 1l' o '1> = = L_{IA +IB -llAnB)


7.20. flX, fi~, fi~ ne sont pas
xEE
définies au contraire de fi~ . ide, . Ainsi 1l' est bijective et
'l'-J ='1>.
7.21. L'égalité f~ 1(F) = E est xEE xEE
toujours vraie. L'egalité f(E) = 7.31. Non!
F n'est pas vraie en général. Elle 7.32. Trois fois non.
équivaut à la surjectivité de f = IAI + IBI - IA n BI.
7.33. Elle est co=utative, as-
(voir la suite du cours).
sociative et admet un élément
8.2. AL'lB est fini car contenu Chapitre 9 9.14. mZ C nZ implqiue que
dans l'ensemble fini A U B. On m = m x 1 est de la forme kn,
a
9.1. Non : 2 n'est pas inver- avec k E Z. De même, nZ C mZ
IAL'lBI = IA u BI - IAn BI sible. implique que n = n x 1 est
de la forme k'm, avec k' E Z.
= IAI + IBl-21AnBI. 9.2. Le caractère abélien est
Ainsi, m = kk'm. Si m = 0,
équivalent à la symétrie de la
n = m = O. Sinon kk' = 1 et
table par rapport à la diagonale.
8.3. IA1 UA2 UA3 UA4I est égal (k, k') E N2, ainsi k = k' = 1 et
à m=n.
9.3. Dans un groupe oui, dans
IA1 l+IA2l+IA3l+IAiHIA 1 nA2I+ 9.15. On a
un monoïde non.
IA1 nA3l+IA1 nAil+IA2nA3I
9.4. f(X*Yl = (X*Yl-l
IA2nAi l+IA3 nAi l)+(IA1 nA2nA3 I+
IA1 n A2 n Ail+ IA1 n A3 n Ail+ 1. Non, il n'y a pas d'élément =Y-1 *X-1
IA2nA3nAil)-IA1 nA2nA3nAil. neutre. =X-l*Y-1
(31.1) 2. Oui. =f(x)*f(y)
3. Non, il n'y a pas d'élément
8.4. On a neutre.
9.5. On a 9 * 9 1 = 9 1 * 9, ainsi 9.16. Pour tous x et y dans G,
IAL'lMBI = IAI + IBI + ICI on a
- 21A n BI - 21A n Cl 9-l *(9*9 1 )*9-l = 9-l (9 1 *9)*9-l
f((lJ*X)- 1 )=1J*X
-2IB n Cl
d'où 9 1 * 9- 1 = 9- 1 * 9 1 • On =f(x-1 *l!-1)
+4IAnBn Cl. =f(x- 1 )*f(y-l)
en déduit que 9- 1 et 9 1- 1 com-
mutent.

8.5. E est l'ensemble des pattes 9.6. 9;;: 1 * ... *92 1 * 91 1 •


de moutons, F celui des moutons 9.7. Non, car ni l'un ni l'autre 9.17. L'application est clai-
et f est l'application qui à une ne contiennent le neutre. rement surjective et puisque
patte associe le mouton corres- Ker (f) = {O}, f est injective : f
pondant. On a donc IFI = IEl/4. 9.8. La réunion U contient clai-
est un isomorphisme de groupes.
rement l'élément neutre. Soient
x et y dans la réunion. Il existe
8.6. Le nombre de fibres non n 1 et nz dans N tels que x E 9.18. f est injectif et l'on a
vides de f est majoré par IEI. Hn, et y E Hn 2 • Posons n3 = IG11 = IGzl < +oo : f est donc
8.7. A~= 8!. max(n1, nz). Les éléments x et bijectif.
y appartienent à Hn 3 , ainsi x *
8 .8. L'application est claire-
ment bijective de bijection réci- y- 1 E Hn 3 C U, d'où le résul-
proque tat. Chapitre 10
9.9. On a (a) {0, a}, 10.1. o Table de (62,0).
(b) = {0, b}, ({a, b}) = 9'(E), On pose T = (1,2).
On en déduit que ({0, a}) = {0, a} et (E) = {0, E}.
o id 'T
id id -r
'T T id
9.10. Oui, Z = (1).
9.11. L'ordre de a vaut 2 et di- o Table du groupe (63,0).
8.9. On trouve (~) si n = 2m On pose a= (1,2), b = (1,3),
vise n d'après le théorème de La-
c = (2,3), d = (1,2,3) et finale-
et(~)= (m':- 1) sin= 2m+ 1. grange. mente = (1,3,2).
8.10. 0, 1, 1/2, 2, 3, 1/3, 1/4, 9.12. On a G = {e, a, b}. 0 id a b C d e
2/3, 3/2, et 4. Comme l'ordre de a divise 3 et id id a b C d e
a f e, on a o(a) = 3 et donc a a id e d C b
8.11. C'est absurde IC n'est b b d id e a C
pas dénombrable. G = (a). e d id
C C b a
d d b C a e id
9.13. m=6. e e C a b id d
Les sous-groupes de (63, o)
sont {id}, {id, a}, {id, b}, {id, c},
d'où le résulat puisque les trans-
positions engendrent ( 63, o ).
11.10. L'application f de Z
dans 2Z définie par la formule

{id, d, e} et 63. f(n) = 2n est un morphisme
10.16. Non dès que n;:;, 3, car
10.2. On a d'anneaux mais Ker (f) = {0}
alors (6n, o) n'est pas abélien.
n'est pas un sous-anneau de Z.
(1,2)(1,3) = (1,3,2) 10.17. Non, car alors 63 ne
f-(1,2,3) = (1,3)(1,2) contiendrait que des permuta-
11.11. Non:
tions de signature + 1.
(1, 0, ... )(0, 1, 0, ... ) = (0, ... ).
10.3. 10.18. dcrl = -1.
10.19. Notons a= (1,2,3) et
12345) b = a 2 = (1,3,2), de sorte que
cr= ( 54321 · 11.12. Non.
1.l3 = {id, a, b}.
0 id a b 11.13. Oui.
10.4. cr2 = idl\1 5 et cr- 1 = cr. id id a b
11.14. Non il n'est pas in-
a a b id
10.5. On a b b id a tègre puisque

0(1) = 0(5) = {1,5}, 10.20. Non, cet ensemble ne (0, 1,0, ... )(1,0 ... ) = (0, ... ).

0(2) = 0(4) = {2,4} contient pas le neutre idl\ln .

et 0(3) = {3}.
10.6. On a
Chapitre 11 Chapitre 12
0(1) = 0(3) = 0(4) = {l,3,4} 11.1. Non. En revanche, la for-
12.1. Si a = ±b, on a claire-
mule est valable dans un anneau
et 0(2) = 0(5) = {2, 5}. ment a Ib et b I a. Réciproque-
commutatif.
ment, il existe {k, k') E Z 2 tels
10.7.
que a = kb et b = k'a, donc
1234567) a= kk'a. Si a= 0, on a aussi
cr= ( 2647351 · 11.3. Non, 2Z ne contient pas
le neutre 1. b = O. Sinon, kk' = 1 donc
k = k' = ±1 et a= ±b.
11.4.0ui.
10.8. 12.2. Oui.
11.5. Si A = {0A}, seule la
123456) 12.3. Si bZ C aZ, alors en par-
cr= ( 462153 · deuxième inclusion est vraie. Si-
non, la première inclusion est ticulier b = b x 1 E aZ et il
toujours vraie mais la seconde existe k E Z tel que b = ka,
est équivalente à la proprosition donc a Ib. Réciproquement, si
10.9. cr= (a, c).
« A est un corps». a Ib, il existe k E Z tel que
10.10. C'est un cycle de lon- b = ka et bZ = kaZ c aZ.
gueur n. 11.6. (±1,±1).
12.4. On a
10.11. cr = (1,3,2)(4,5) et 11.7. I =A. n-1
()"2007 = (4,5). 11.8. Il n'y en a qu'un : A. lûn-1 =(10-1) L 10k.
10.12. o( cr) = 3. k=O
11.9. Notons * et • les lois de
10.13. cr= (1, 3)(3,2)(2,4). A et B. On a
12.5. Le quotient vaut 11509 et
10.14. cr= (1, 3)(3, 6)(6,4)(2,5). ls = cp(lA) E lm(cp).
le reste 28.
Pour tous a et b dans lm {cp),
il existe x et y dans B tels que 12.6. Le quotient vaut n 2 + 1 et
10.15. On a
le reste n.
a= f(x) et b = f(y). On a alors
(1,2,3)(1,2)(1,2,3) 2 = (2,3) a•b=f(x)•f(y) 12.7. 1112121113.
et = f(X*Y) E Im(cp). 12.8.1236.

(1,2,3)2(1,2)(1,2,3) = (1,3) 12.9. 3n = 210010 3.


12.10. 1120204. 13.9. D est surjective mais pas
12.11. On a 102 = 2 [7], d'où 12.26. Non : le pgcd divise tou- injective.
= =
10 6 23 1 [7]. jours le ppcm. 13.10. On a
12.12. 1. 12.27.On trouve
12.13. n n'est divisible par au- {(-1 +3k,-l +2k) lk E Z}.
cun des nombres indiqués.
12.14. Il suffit de remarquer 13.11. (n;T)!X 2 .
que 13.12. On a Q' = 2XP'(X 2 ),
12.28. {(-2-3k, 2+2k) 1k E Z}.
m
L_ (-l)kak = L_ (-l)m-kilm-k• Q" = 4X2 P"(X 2 ) + 2P'(X 2 )
k=O k=O 12.29. 12 est inversible car
et
12/\ 7 = 1. Comme
12.15. 21\3 = 1, 12/\22 = 2, Qi 3 1 = sx3 pl 3 l (X2 ) + 12XP"(X2 ).
3xl2-7x5=1,
14/\49 = 7 et 13A3 = Î.
1
12.16. Bien sûr que non. On ona 12- =3.
13.13. Il suffit de calculer la
sait juste que (a/\ b) 1 d. 12.30. (Z/l0Z)X = {î,3,7,9}. composée P o Q pour Q = X + a
12.17. Par l'algorithme d'Eu-
à partir de la formule de Taylor
clide,
pour P.
424/\68 = 681\ 16 = 16/\4 =4.
Chapitre 13 13.14. On trouve

5 51
12.18. Par l'algorithme d'Eu- 13.1. On a (x+ 1)5- '\"" · k
- L (5- k)!k!x .
clide, k=O
P+Q = (-1,3,5,-1,0, ... ).
(Sn+l -1)/\ (Sn -1) = (Sn - l)/\4 On reconnaît la formule du bi-
=4. nôme.
13.2. On a 13.15. Si BJK[X] c AJK[X], alors
PQ = (0,-1,0,4, 13, 7,-3,0, ... ). en particulier B = B x 1 E AJK(X]
12.19. On a 3 x 7-4 x 5 = 1. et il existe Q dans JK[X] tel que
12.20. Après élévation au carré B = QA, donc AI B. Récipro-
de l'égalité 3 x 7-4 x 5 = 1, on quement, si AI B, il existe Q
aboutit à 9 x 72 -88 x 5 = 1 mais 13.3. Le produit de deux poly- dans JK[X] tel que B = QA et
également 16 x 5 2 - 57 x 7 = 1. nômes unitaires est unitaire.
Après une nouvelle élévation au BJK[X] = QAJK(X] C AJK[X].
13.4. La somme de deux po-
carré, on trouve
lynômes unitaires n'est jamais
88 2 5 2 -3951 x72 =1. unitaire. La différence de deux 13.16.On a
polynômes unitaires n'est pas en
général unitaire. X3 +27 = (X+3l(X 2 -3X+9).
12.21. 43 - 2 X 21 = Î.
13.5. Q = 3X 2 + 3X + 1. On a
12.22. Comme 11 /\ 8 = 1, 7 ap- deg {Q) = 2 et val{Q) = O.
partient à Z = 1 JZ + 8Z, d'où 13.17. On trouve Q = 2X 2 +4
l'existence de (u, v) E Z 2 tels 13.6. R = 6X + 6 et S = 6. et R = 3X2 +X+ 5.
que 7 = llu + 8v. 13. 7. Ces deux fonctions sont 13.18. On a
12.23. C'est vrai. égales. Le premier x est la mul-
R = 2 + 5(X - 1) = 5X - 3.
tiplication sur JK[X], le deuxième
12.24. La réciproque est x désigne la multiplication sur
fausse : 2A3/\4 = 1 mais JRIR.
2A4=2c;fl. 13.19. Cette équivalence est
13.8. Ces deux fonctions sont vraie.
12.25. Cela découle immédiate- égales. Le premier o est la com-
ment de l'égalité 13.20. Supposons que
position sur JK[X], le deuxième o
(aZnbZ)ncZ = aZn(bZncZ). désigne la composition sur JRIR.
Comme
AC-BD= C(A-B) + B(C-D)
X1XzX4 + X1X3X4 + X2X3X4 et
0"4 = XJ XzX3X4.
14.2. D'abord on remarque que
les formules sont trivialement

vraies si l'une des fractions ra-
13.35. cr1 = cr3 = 0, cr2 = -~ tionnelles est nulle. Soient alors
et P divise A - B et C - D,
etcr4=½- F1 = ~ 11 et F2 = ~~ . On a
P divise aussi AC - BD et donc
AC= BD [P]. 13.36. xf+x~+xi = crf-2crz. P1P2
deg (F1 F2) = deg Qi Qz
13.21. L'ensemble PIK[X] est
non vide car il contient le poly- 13.37. C'est faux : pour tout
nôme nul. Soient (A, B) E PlK[X]
= deg (P1 P2) -deg (Q1 Q2)
a E IC, le polynôme X - a est
et C E lK[X]. Il existe alors = deg P1 + deg P2 - deg Q1
(Q1, Q2) E lK[X] 2 tels que irréductible sur IC. En revanche,
un polynôme irréductible sur lK -deg Q2
A= PQ1 et B = PQ2. de degré supérieur ou égal à 2 = deg F1 + deg F2 .
n'admet aucune racine dans lK.
D'oùA-B = (Q1-Q2)P appar-
deg (F1 + F2) =deg Pi Q 2 + P2 Q 1
tient à PlK[X] et CA= (CQi)P 13.38. C'est faux : le poly- Q1Q2
à PlK[X] : PlK[X] est un idéal nôme (X 2 + 1)2 n'admet aucune = deg (P1 Q2 + P2Q1) -deg (Q1 Q2)
de lK[X]. Il en est de même de racine réelle mais n'est pas irré-- ,;;; max(deg (P1 Q2 ),deg (P2Q1))
QJK[X]. La suite résulte du fait d uctible sur IR.. -deg Q1 -deg Q2
que l'intersection de deux idéaux
13.39. On trouve =max(deg P1 +deg Q2,deg P2+
est toujours un idéal.
deg Q1 )-deg Q, -deg Q2
13.22. La somme de deux x4_, =
=max(deg P1 -deg Q1 ,deg P2-
idéaux est toujours un idéal.
deg Q2) = max(deg F1 ,deg F2).
(X- l)(X+ l)(X-i)(X+i)
13.23. On trouve X+ 1.
13.24. On trouve X+ 1 par l'al- et
14.3. Existence : On sait que
gorithme d'Euclide.
X' - 1 = (X- 1)(X+ 1 )(X2 + 1 ). toute fraction rationnelle F a une
13.25. On a écriture irréductible F = -G-· No-
X+2_X-l=l. tons a le coefficient dominant de
3 3 13.40. On a Q. Alors F = ~j: et cette écri-
ture est irréductible avec coef-
X3 +1 =(X+l)(X+j)(X+j2) ficient dominant du dénomina-
13.26. On a
teur égal à 1.
2 et
X - 2X + 1 _ X - 3 (X+ l) = 1. Unicité : Soient -G- = ~~ deux
4 4 X3 + 1 = (X+ ll(X2 -X+ 1). telles écritures. Alors QP1 =
PQ 1 , c'est-à-dire Q divise PQ1.
Or Q et P sont premiers entre
13.27. X 6 - , .
eux, donc Q divise Q 1. Or dans
13.28. X5 +x 3 +x 2 + 1. une écriture irréductible les de--
13.29. (X 2 + 1ln convient.
Chapitre 14 grés sont les plus petits pos-
sibles, donc Q et Q1 ont le même
13.30. On trouve{± 1, ±j, ±j2}. 14.1. Soient F = -G- = ~~ deux degré. Alors Q = aQ1, avec a E
écritures de F. Alors, on a l'éga- lK. Par comparaison du coeffi-
lité PQ1 = QP1, d'où cient dominant on trouve a = 1
13.31. Le nombre a est une ra-
cine d'ordre au moins égal à 3. et Q = Q 1. Par conséquence
deg P+deg Q1 = deg Q+deg P1,
P=P1.

13.32. Non. et on peut poser 14.4.


a. Vrai. e. Faux.
13.33. (~)- deg F = deg P - deg Q b. Faux.
=deg P1 -deg Q1. f. Vrai.
13.34. O"] = XJ
+ Xz + X3 + X4, c. Vrai.
cr2 = x1x2+x1x3+x1x4+x2x3+ d. Vrai. g. Vrai.
XzX4 + X3X4, 0"3 = X1X2X3 +
• x•
14.6. X(X+l)
-X
X(X+l)
1
14.5. f = (X-3)'(X-2)' .

= X2 - X+ 1 +
15.9. p inconnues et n équa-
tions.
15.10. n équations et p incon-
16.3. On a
13) ~ (-20) (03).
(01+226 14 '=

nues.
14.7. Quatre pôles: 0 d'ordre 16.4. On a
3; i d'ordre 1; 1 d'ordre 4; -1 15.11. Non.
d'ordre 3. Un zéro: i-2 de mul- 15.12. Non.
tiplicité 5.
15.13. Oui. Les deux nombres 4 8 12)
14.8. Non, car le polynôme au 0, 1 sont non tous nuls, mais non C = 32 et D = 5 10 15 .
( 612 18
dénominateur ne peut pas pos- tous non nuls.
séder une infinité de zéros. 15.14. 16.5.
a. Faux. c. Faux.
14.9. 3tz
est déjà décomposée, a. vrai. c. non.
b. Vrai.
c'est un élément simple. b. non.
14.10. c = -d. 16.6. m=n=p=q.
15.15.
a. non. b. vrai. 16.7. eeA est la i-ième ligne de
A et Ae{ est la k-ième colonne
Chapitre 15 15.16. Les deux assertions sont de A.
fausses.
15.1. 16.8. AEek est la matrice dont
15.17. Oui, car ce sont 4 vec- la k-ième colonne est la i-ième
a. (1 +i)(l,i) = (1 +i,-1 +il
appartient à IC 2 . teurs de JR:. 3 qui est un espace de colonne de A et toutes les autres
dimension 3. colonnes sont nulles. Eek B est la
b. D'après la règle 6), le vecteur
matrice dont la i-ième ligne est
i((l + i)(l, i, 1 - i)) est égal à 15.18. C'est vrai, car l'espace
(i(l +i))(l,i, 1-i). la k-ième ligne de B et toutes
de solutions est un sous-espace
les autres lignes sont nulles.
vectoriel de ocn et que tout sous-
15.2. V= (-4,-20+i,4i+2). espace vectoriel de ocn est de la EekEpq = ôkµEeq-
15.3. forme demandée. 16.9. n 3 et n 2 (2n- l).
a. Deux, à savoir les sous- 15.19. 16.10. eeAe{ est l'élément aek
espaces triviaux. a. Cela se vérifie par le calcul, de la matrice A.
b. Une infinité, par exemple les composante par composante.
16.11.
sous-espaces JK( cos -& , sin -& ) où b. w =w et w =u+2v.
-& E [O, n[. a. x 2 - 1 = O équivaut à l'équa-
tion (x + 1)(x - 1) = O. Dans
15.20. Oui. Pour démontrer un corps tout élément non nul
15.4. Il n'y a que l'espace nul. que tout vecteur de ocn s'écrit est inversible, donc x = 1 ou
En effet si (x, -y) est un vecteur de manière unique comme com- X= -1.
non nul, alors ,\(x,-y) !/. B pour
tout réel ,\ assez grand.
binaison linéaire de ces vecteurs, b. Par exemple ( b~1 ) ou
on se ramène au système linéaire (?b).
15.5. Non, car ffi:.TTL n'est pas un de l'exemple 15.7. Il possède une
unique solution.
16.12. Notons
sous-ensemble de ffi:.n.
A= (!Xhj) E .4'tmn(lK),
15.6. Oui. 15.21. dimXo = 4.
B = (/3jk) E .4'tnp (JK),
15.7. 15.22.;, ;
et C = (Ykll E A'lµq(lK). Dé-
a. non. c. non. terminons d'abord le coefficient
15.23. d'indice (h,i) de (AB)C. Il est
b. oui. d. oui. le produit de la h-ième ligne de
AB avec la €-ième colonne de C :
15.8. Le système à deux in-
connues et une seule équation
ux1 + bx2 = -y avec
Chapitre 16 (f. <Xn;f3;1 , ... ,f. <Xn;f3;p)
j=l j=l
X

a. a = b = 0 et -y = 1, 16.1. à A'l2,3(1C).
b. a = b = 1 et -y = O. 16.2. dim.4'tmn(lK) = mn.
expression égale à {0, ± 1, ... , ±9} ! Les matrices
qu'il peut ainsi obtenir forment
16.26. Tout est faux.
16.27. La première assertion

un ensemble fini dans lequel les
est fausse, la seconde est vraie.
matrices de rang non maximal
constituent une partie non négli-
Maintenant nous comparons geable. 16.28. Seul le b. est vrai.
avec le coefficient d'indice (h, i)
de A(BC). Ce dernier est le pro- 16.17. La réponse est oui aux 16.29. Toutes les assertions
duit de la h-ième ligne de A avec deux questions. sont vraies, sauf les deux der-
la i-ième colonne de BC nières.
16.18. 21. Pour la somme de deux matrices
16.19. Pour (A, B) appartenant nilpotentes, on a
à Gl(n,JK) x GL(m,JK), la ma-
trice
c'est-à-dire
<D(A, B) = ( 4s)
t (t ahj ~jkYkl)
est dans Gl( n + m, JK). On vé-
rifie facilement que l'application
(A, B) H <D(A, B) définit le mor-
Pour le produit de deux matrices
symétriques, on a

t (t ahj(~jkYkiJ),
phisme recherché.
16.20. Oui. D'après 16.25, on
soit encore a m = rg (AB) ::;; rg A ::;; n et
n=rg(B'A)::;; rg A::;; m. 16.30.
a. n(~+l) c. n(~-1)
16.21.
a. Faux. c. Vrai. b. n(~+l);

b. Vrai. d. Faux.
16.31. Oui.
16.22. Nous savons que le sous-
16.32. Il suffit de calculer les
espace vectoriel F engendré par
et finalement puissances successives A k de A.
les lignes de A est le même que
On a A 2 # 0 et A 3 = O. La ma-
celui engendré par les lignes de
trice A est nilpotente, d'ordre de
A et que la dimension de F est
nilpotence 3.
r. Les dernières n - r lignes de
où l'on a utilisé les lois suivantes A sont nulles. Donc F est né- 16.33. Toutes les identités sont
dans 1K : l'associativité de la cessairement engendré par ses r vraies sauf la deuxième, qui n'est
multiplication, la commutativité premières lignes. Ces lignes sont vraie que pour µ = O.
de l'addition et la distributivité. donc libres car dimF = r.
16.34.
16.23. Il suffit de choisir a, b, c
16.13. rg (lln) = n. tels que a ,l 3b - 2c. 000
0100
1)
16.24.
16.14. 2 pour les deux ma- ( 001 0 '
trices. a. 4. b. Oui. 1000

16.15. 16.25. Oui. En identifiant


a. Vrai. c. Vrai. A2 (JK) ligne après ligne avec 100 0)
0200
JK4 , nous obtenons quatre 4- Ui[2] = 001 0
b. Faux. d. Vrai. uplets qui forment la matrice (
0001
16.16. Non, il n'y a pas de
0111) et
contradiction. La probabilité de 1011
cet événement est nulle lors- 1101 .
( 10-20)
111 0 01 0 0
qu'on choisit les coefficients au
U1,3[-2]= 0010.
hasard dans R Or un profes- Par la méthode du pivot, on (
seur a plutôt tendance à choisir montre facilement que son rang 00 0 1
les coefficients dans l'ensemble est 4.
• 16.35. On a 16.41. On trouve l = tR où l
vaut
1 00)
2 10 .
( 321
17.9. Soient P = .LkEN akxk,
Q = LkEN bkXk et
R= L ckXk
kEN
dans JK[[X]]. Commutativité
16.36. On aboutit à dans PQ le coefficient d'ordre k
est donné par la somme
Chapitre 17
17.1.
ak-1b1 +akbo.
a. Faux. b. Vrai. La commutativité dans 1K assure
que cette somme reste la même
16.37. Si C1, ... , Cn sont les 17.2. Soit v E E un vecteur non si on échange les rôles des Uj et
colonnes de A, alors A P cr = nul. Si Àv = µv pour deux sca- des bi.
(Ccr(l),··•,Ccr(n)l- Notons que laires À et µ, alors Associativité : Posons
la colonne Ck de A se lit dans k
(À- µ)v = Àv- µv = 0,
la cr 1 (k)-ième colonne de A P cr· dk = L. a1bk-1
1=0
donc À - µ = 0 d'après la
règle 17.3. Cela montre que l'ap- et
16.38. Non, il suffit d'inver- k
ser les deux premières colonnes plication 1K --l E : À H Àv est in- ek = L bick-! .
de l'inverse calculé. En géné- jective. Or, le corps 1K contient !=0
ral, si B = PcrA, alors B- 1 = une infinité d'éléments. Donc E Le coefficient d'ordre k de
A- 1 (Pcr)- 1 = A- 1 Pcr-', donc si contient une infinité de vecteurs (PQ)R est donné par
on permute les lignes de A, on de la forme Àv.
permute de la même manière les
17.3. L'axiome EV3, car il com-
colonnes de l'inverse.
mence par << :30 E E ». k

16.39. Le coefficient de 17.4. Aucun.


L_ L_ Uj b1-jCk-!
O(i(k O~j(i
Pcr t(Pcr) qui a l'indice (i, k)
est le produit de la i-ième ligne 17.5. Supposons que 1' soit une L_ Uj b1-jCk-!.
autre unité. Alors
de Pcr avec la k-ième colonne O(j(i(k

de t(Pcr), ou encore le produit Le coefficient d'ordre k de


de la i-ième ligne de Pcr avec P(QR) est donné par
la k-ième ligne (transposée en d'après l'axiome Al3.
colonne) de Pcr- D'après le com-
17.6. Si lA =0A, alors
mentaire ci-dessus, ce produit
= L_ Oj L_ b,,Ck-j-p
est 1 si et seulement si k = i et O~j~k O~p~k-j
il est nul sinon. Cela montre que
Pcr t(Pcr) = lin- pour tout u E A.
= L. Oj L. bpck-(j+p)
O~j~k j~j+p:o,;;k

A est une matrice de permuta- = L_ L_


17. 7. Oui, c'est une ll-algèbre a; be-j Ck-1
tion. Donc A - l = t A et, comme O~j:%;k j~f~k
qui s'identifie à IC.
A est symétrique, A - l = A. L. a; be-; ck-1 .
17.8. O~j~f~k
16.40. On trouve
a. Non:
17.10.
100) (1,0,0) /\ (X,lJ,Z) = (0,*,*l a. Oui. c. Oui.
l = 01 0
( 101 f (1,0,0) b. Non.

et pour tout (x, li, z) E ll 3 . 17.11. Non, sinon 1K x 1K n'au-

R=
111) b. Pour la fonction constante
rait que quatre sous-espaces vec-

( 003
021 .
w = 1, on a toriels (voir la question-test I.2).

wo(u+v) = 1 f 2 =wou+wov. 17.12.


a. Vrai.
b. Faux.
e. Vrai.
f. Faux.
17.18.
a. Nécessaire d. Non-
17.22. L'application est bien
un isomorphisme d'espace vec-

c. Vrai. g. Vrai. et suffisant. sens. toriel mais non d'algèbre (si JKN
b. Nécessaire e. Non- est munie de la structure d'al-
d. Vrai. h. Vrai.
et suffisant. sens. gèbre produit). En effet, elle ne
c. Nécessaire. f. Née. conserve pas la multiplication
interne. Ou plus brièvement :
17.19. idE. elle n'envoie pas l'élément unité
17.13. Pour la première par-
(1, 1, ... ) de JKN sur l'élément
tie, la réponse est oui (prendre 17.20. Presque. La réponse se-
unité x 0 de JK[[X]].
(x,y) H (x,0)). Pour la se- rait affirmative si l'on pouvait
conde, la réponse est non. En définir l'ensemble de tous les es- 17.23. Non. En effet, elle in-
effet, pour toute application li- paces vectoriels, ce qui n'est pas verse l'ordre dans la multiplica-
néaire, on a f(-u) = -f(u), évident dans le cadre de la théo- tion : tAB = tB tA et le pro-
donc l'image par f d'une partie rie des ensembles. Pour donner duit matriciel n'est pas en géné-
symétrique par rapport à 0 l'est un sens à la question, on peut ral commutatif. On l'appelle un
encore. considérer la relation "' sur l'en- anti-automorphisme.
semble des sous-espaces vecto-
17.24. Elles sont vraies.
17.14. La conjugaison est R- riels d'un espace vectoriel fixé.
17.25.
linéaire mais elle n'est pas IC- On obtient bien dans ce cas une
linéaire. relation d'équivalence. f(X) = (x1, x, +x2,x3, ... ,xn),
17.21. La linéarité des deux g(X) = (x2, X1, X3, ... ,Xn).
17.15.
applications résulte des règles
où X= (x1, ... ,Xn)-
du calcul matriciel. On constate
a. C'est un cas particulier de que ( ~ j ) est inversible d'inverse 17.26.
l'exemple 17.9 avec la matrice ( _35 21) . Donc les deux applica- f(X) = (x,, x,, x,, ... , x,),
A=adeformat 1 x 1. tions ont pour inverses
g(X) = (0,x2-x,, ... ,Xn -x,).
M H ( _35 21 ) M ( _35 21) ,
b. On pose a = f ( 1 ), alors pour
toutx E JK, onaf(x) = f(x-1) = et M H (n)M(_3521 ). 17.27. il est clair que la condi-
x-f(l)=ax. La première application n'est tion est nécessaire. Réciproque-
pas un morphisme d'algèbres. ment, en prenant À = 1, on voit
En effet, elle ne conserve pas que F est stable par addition. En
17.16. la multiplication interne et, en prenant À= -1 et u = v, on voit
outre, elle n'envoie pas la ma-
que F contient le vecteur nul. En
trice unité sur elle-même. La
a. Morphisme d'algèbres. prenant u = 0, on voit que F
deuxième application est un au-
tomorphisme d'algèbres. est stable par multiplication par
b. Linéaire si P = <XX. Sinon Plus généralement, soit A une scalaires.
non linéaire. algèbre et a E A inver- 17.28.
sible. Alors l'application définie
c. Morphisme d'algèbres. par b H a- 1 ba est linéaire, a. est faux car 1 E Z mais 1/2 •
conserve la multiplication car 1 = 1/2 ~ z.
d. Linéaire mais non mor- b. Il!'. est un sous-espace vec-
phisme d'algèbres. toriel du R-espace vectoriel C,
mais non un s.e.v. du IC-espace
et envoie lA sur lA. Son inverse vectoriel C.
e. Non linéaire.
est l'application b H aba- 1 , c. Ri est un sous-espace vecto-
donc il s'agit bien d'automor- riel du ffi'.-espace vectoriel C mais
f. Linéaire.
phisme d'algèbre, que l'on ap- non un s.e.v. du IC-espace vecto-
pelle automorphisme intérieur riel C.
g. Linéaire.
parce qu'il est défini à partir
17.29.
d'un élément a qui appartient à
a. (x,y,z) H x+y-zconvient.
17.17. L'assertion est vraie. A.
Dans ce cas, on pense F co=e
une « tranche » de Ill:.3 , en tant 17.35. b. Comme sin2 + cos2 1,
que ligne de niveau de f d'équa- a. Sous- l'autre. toutes les fonctions constantes
tion f(p) = O. algèbre. sont dans G.
f. Ni l'un ni
b. (x,y) H (x,y,x + y) b. Sous- l'autre. 18.8. L'assertion est vraie.
convient. Dans ce cas, on pense algèbre.
F comme un espace canonique g. Sous- 18.9. {l} engendre le C-ev C
c. Sous-
R 2 « plongé » dans R 3 . algèbre.
algèbre. et {(0,1),(1,0),(i,0)(0,i)} en-
17.30. d. Sous- h. Ni l'un ni gendre le R-ev C 2 .
algèbre. l'autre.
a. f est injective car la matrice 18.10.
(f =1) de cette application li- e. Ni l'un ni i. s.e.v. a. Faux.
néaire est de rang 2.
b. Faux.
c. Vrai, considérer l'application
b. f est non injective car la ma- Chapitre 18 (À1, ... , Àn) H Lj=l ÀjVj pour
trice associée est de rang 1.
une famille (v1, ... , Vn) généra-
18.1. Non car une combinai- trice fixée.
c. L'application est non linéaire son des ôk ne comporte qu'un
( !) et non injective (comme nombre fini de composantes non 18.11. Ils sont tous de dimen-
z f-) lzl 2 ). nulles. sion finie.

18.2. Les deux assertions sont 18.12. La partie {l, i} C C est


d. f est injective car c'est une
vraies. liée sur C et libre sur R.
application linéaire de noyau
nul. 18.3. 18.13. Soit (Vj li El une famille
a. Une suite stationnaire est de vecteurs de E non injective.
e. <l> est non injective car presque nulle si et seulement si Cela signifie qu'il existe deux in-
c'est une application linéaire de sa limite est nulle. dices k c/ e dans J tels que
noyau non nul, constitué de
vk = v1. On a donc la relation
toutes les fonctions de la forme
b. Une suite périodique est Vk - v1 = 0, ce qui montre que
x H cex, avec c E !K. presque nulle si et seulement si la famille est liée. Si on préfère,
elle est nulle.
17.31. Non-sens, faux, vrai, on peut poser Àk = 1, À1 = -1
vrai. 18.4. L'équation x2 0 et Àj = 0 pour tout j E J \ {k, i},
convient. de sorte que LjEJ ÀjVj = O.
17.32.
a. Partie, noyau, groupe, condi- 18.5. 18.14.
tion suffisante, condition néces- a. Prendre par exemple V= {l} a. Vrai.
saire. et U = {2} dans R b. Faux : les parties {l} et {2}
b. Vrai. sont libres dans R mais la partie
b. C'est le mot<< mais». Condi- {l, 2} est liée.
c. Faux, avec le même contre-
tion suffisante et condition né- c. Faux : considérer la partie
exemple que plus haut.
cessaire sont deux notions in- V = {(1 , 0), (0, 1), ( 1 , 1)} de R 2 .
dépendantes. On peut bien dire d. Vrai.
d. Vrai.
« cet homme est russe, mais il vit
au Brésil». En revanche, il serait 18.6. vect(V) = vect(U). e. Vrai.
bizarre de dire « cet homme est 18.7. 18.15. Oui. Soient À,µ deux
russe, mais il a 30 ans». a. Tout sous-espace de RIR réels tels que Àlog x + µJx = 0
contient la fonction nulle. Soit
17.33. Oui. pour tout x > O. Alors en éva-
f E F. Alors il existe (À,µ) E R 2
luant cette formule en x = 1, on
17.34. tels que f = Àsin+µcos. Suppo-
sons f constante. Alors f est dé- obtient que µ = O. Comme la
a. Sous- e. Ni l'un ni
rivable et 0 = f' = Àcos-µsin. fonction log n'est pas identique-
algèbre. l'autre.
En évaluant cette relation en 0, ment nulle, il s'ensuit que À= O.
b. Nil'unni f. s.e.v. on obtient À = O. Il s'ensuit que
l'autre.
µ = 0 car la fonction sinus n'est
c. Sous- g. s.e.v. 18.16.
pas identiquement nulle. Donc
algèbre. h. Nil'unni la seule fonction constante de F a. Vrai.
d. s.e.v. l'autre. est la fonction nulle. b. Faux car h = cos +i sin.
18.17.
a. Faux. c. Vrai.
18.24.
a. {sin, cos}.
pour tout
De même, on démontre que
1, ... , n.

b. Faux. b. {(l,0,0,1,0,0, ... ) cpj(Àv) = Àcpj(v) pour tout sca-
(0, 1,0,0, 1,0, ... ), laire À.
18.18. Ce sont les fonctions (0,0, 1,0,0, 1, ... )}. 18.29.
dont l'image est soit de la forme a. La k-ième fonction coordon-
18.25. x H x et x H 1 consti-
{0, c}, soit de la forme {c} , avec née est la projection sur la k-
tuent une base, donc la dimen-
c E IC* ou c E iC. En effet soit ième composante.
sion est 2.
f E C I telle que f et f 2 sont b. La k-ième fonction coordon-
liées. Alors il existe À et µ non 18.26. Notons la suite née associe au polynôme son k-
tous les deux nuls dans Il{ tels constante. Il est clair que ième coefficient.
que M + µf 2 = O. Soit j E J tel {l, lio, li1, ... } est une partie libre c. Les coordonnées de
que f(j) f O. Alors À+ µf(j) = O. dans S. Montrons que c'est une P = a+ bX+cX 2
Ainsi µ f 0, car sinon µ=À = base. Soient a = (anlnEN une
suite, ex E Il{ et N E N tels dans .CJIJ sont a- b, b-c,c.
O. Il en résulte que f(j) = -~-
que Un = ex pour tout n ;;:, N. d. <p1 (x1, x2) = x1 - x2 et
Réciproquement, si f E Cl ne
<p2(x1, x2) = x2.
prend que la valeurs c E C, et La suite a - ex • 1 est presque
nulle. Elle est donc combinaison e. <p1 (x1, x2) = (x1 + x2)/2 et
éventuellement la valeurs nulle,
cpz(x1, x2) = (x2 - xi)/2.
alors cf - f 2 = O. Donc f et f 2 linéaire des vecteurs lio, li1 , ...
sont liées. Par conséquent, a est bien com- 18.30.
binaison linéaire de 1, lio, li1, ... a. C!il!'!il! est égale à
18.19.
a. Infinie. d. Finie.
18.27. u (respectivement v) est
1/2 1/2)-l _
( -1/2 1/2 -
(1 -1)
1 1
b. Infinie.
représenté par le triplet ( *, 4, 3)
c. Infinie. e. Finie. b. Les coordonnées de v dans .CJIJ
(respectivement (*, 1,2)). Les sont (3, -2). Les coordonnées de
18.20. vecteurs (4,3) et (1,2) sont in- v dans .CJIJ' sont (5, 1).
a. Oui. dépendants car de déterminant
non nul. Il en est donc de même 18.31. Oui.
b. Oui.
des vecteurs u et v. 18.32. Ylk = cpe(b~) .
c. Non car
18.28. Soient u, v E E. Alors 18.33. Numérotons les sys-
n tèmes de la gauche vers la droite
u = L. cpj(u)bi et de haut en bas. Seuls les sys-
j=l
tèmes 2, 3 et 4 sont vérifiés.
n

18.21. v = L cpi(v)bi 18.34. Oui. (1,2,3) et (2,3, 1)


2
j=l étant linéairement indépendants
a. (X k)kEN·
il suffit de les compléter en une
b. dimKn[X] = n + 1. u+v = L cpj(u+v)bi. base de JR 3 et d'appliquer la pro-
i=l
c. Ce sont 4 polynômes inclus position 18.41.
dans l'espace K2[X] de dimen- Par conséquent,
sion 3. 18.35. Du système de coordon-
n
nées <I>!il!.
18.22. Soit r = min(m, n). L cpj(u+v)bi = u+v
Alors la dimension est j=l 18.36.
n n a. Non. b. Oui.
= L <pi (u)bj + L. cpj(v)bi
i=l i=l 18.37. Vrai si dim F < oo.

= L (cpj(u) + cpj(v)) bi. 18.38.


a. Oui, (x,1J) H (x,1),0).
i=l
18.23. Non, car ces quatre fonc- b. Non.
tions sont dans l'espace engen- Par unicité de l'écriture dans
c. Oui, f H f(0).
dré par les 3 fonctions f, g, fg'. une base, on a
d. Oui, f H f o exp.
e. Non.
18.39. On a Chapitre 19 19.7.
a. Vrai, évident par construc-
19.1. Soit Bn la sous-algèbre tion.
de lK[X] engendrée par xn. Elle b. Vrai. ( ===}) vrai en dimen-
est formée des polynômes de sion arbitraire.
et
la forme LkEN OnkXnk_ Alors c. Faux (voir page 491).
M ~ ( g } _- (cos oc -sin oc)
X 2 E B2 et X3 E B3 mais
sina. coscx • 19.8. La partie paire de ex est
leur produit X5 n'est pas dans
ch x = e'\e-• et la partie im-
la so=e B2 + B3.
Avec la matrice de passage paire est sh x = e•-/-•.
19.2. Seule l'inclusion
19.9. L'espace des matrices
c~~, z
= l ( -11
1 1) F+GcFUG anti-symétriques.
19.10. lK[X] est égal à
n'est pas vraie en général,
et son inverse ( j 1
1
) , on trouve co=e le montre l'exemple des lKn[X] œ{xn+lp I P E lK[X]},
axes dans JR2.
et lK[[X]] est égal à
M.qj/,{fJ=i(l , 1l(-"1 o'H_11 ll 19.3. La première est fausse.
lKn[Xl œ{xn+lp I P E lK[[Xll}.
Contre-exemple dans JR2 : consi-
=(J-"1)
dérer G = lR x 0, H = 0 x lR et
F={(x,x) lxElR}.
et de la même manière, par un petit 19.11. La première est fausse.
La seconde est vraie. En effet, si
calcul, M.qJ/,(g) = M.qJ/(g). Contre-exemple : considérerE =
v E FnG et u E FnH, alors il est
JR2 , F = lR X 0, G = 0 X JR,
18.40. clair que d'une part v+u E F et
G'={(x,x) lxElR}.
d'autre part que v+u E G+ H.
La deuxième est vraie (voir le co-
19.4. Seule l'assertion c. est rollaire 19.9).
vraie. La troisième est fausse. Contre-
19.5. exemple : considérer E = JR2 ,
a. Faux. c. Non- F = G =lR x O.
b. Vraie. sens. 19.12. Infinie.

19.6. 19.13.
Le rang est n - 1. Cela se voit
aussi à l'aide le théorème du a. La linéarité de Lj est évi- a. Oui, c'est le noyau de J :
rang puisque le noyau est consti- dente. On a '6' 1 ([O, ll} --) JR, f H J~ f. La
fonction x H x engendre un sup-
tué des polynômes constants.
plémentaire.
18.41. Elles sont toutes vraies. iEJ iEJ b. Non car sa dimension est 1.
et c. Oui, c'est le noyau de ev0 :
'6' 1 ([O, ll} --) JR, f H f(O). L'es-
18.42. n2 la famille u+v= LPi(u+v). pace des fonctions constantes est
2
(idE, ... , f" ) est liée puisque iEJ un supplémentaire.
dim(2'(E)) =n2. d. Oui, c'est le noyau de
En prenant la so=e on trouve
'6'1 ([O, ll} --) JR, f H f"(l). La
que LiEJ(Pi(v) +Pi(u)) est égal
18.43. Soit P = Lr=l akxk_ fonction x H x 2 engendre un
La condition P(O) cJ O signifie à LiEJ Pi(u+v), et par unicité
supplémentaire.
que no-# O. De P(f) = 0 on dé- de la décomposition,
duit e. Oui, c'est le noyau de
'6' 1 ([O, 1]) --) JR, f H f(l) - f(O).
p p La fonction x H x engendre un
f L_ akfk-l = L_ UJ<f" = -Cl()Ïn · b. Pi o Lk = 0 si j -/- k et supplémentaire.
k=2 k=Z
Pi O lj = idF;. f. Non, car les deux fonction
c. La composée Lk o Pi a seule- x H 1 et x H x se trouvent dans
f ment un sens si j = k. On a un supplémentaire. Or tout sup-
AinsI,. f-1 _ l
- - - L_Ok
fk-1
.
plémentaire d'un hyperplan doit
no k=2 Lio Pi =idf;.
être de dimension 1.
19.14. Oui car la trace est une
forme linéaire, et que les ma-
trices de traces nulles en consti-
Chapitre 20
20.1.
20.10. 198.
20.11. Si rg (A)= n, A est in-
versible et com(A) également. Si
rg(A)<n-1,
-
tuent le noyau. La dimension de a. 0(6, -5) et O'(0, -3).
ce dernier est n 2 - 1. b. (ABCD) est le parallélo- rg (com(A)) = O.
19.15.VH-V. gramme formé par AB(-3, 1) et
A0(4, -6). Son aire est donc
Si rg (A) =n - 1, on a
19.16. Seulement dans le cas de rg(com(A)) = 1.
la décomposition triviale 1- 3 X (-6) - 1 X 41 = 14.

E = E EB{û}. (CABD') est le parallélo-


gramme formé par AB(-3, 1) 20.12. On suppose ici n), 3.
Si rg (A) < n, rg (com(A)) ,:;; 1
et AC(l, -5). Son aire est donc
donc
19.17. Posons q = idE -p. l-3x(-5)-1 x11=14.
Comme com(com(A)) = O.
Si rg (A) = n, on a
20.2.
det(A) det(com(A)) = det(A)n
q2 = q ssi p 2 = p. Sous cette
et det(A) / 0 donc
hypothèse, un vecteur x de E
appartient à lm (p) si et seule- det(com(A)) =det(A)n-l
ment si p(x) = x, c'est-à-dire et com(com(A)) est égale à
x E Ker (q). De même pour la 20.3.
det(com(A))det(A)A = det(A)n A.
seconde inclusion. a. Faux, contre-exemple

19.18. A=-B=h.
a. X2 . b. x2 -x 20.13.
b. Faux, car a. Vrai. b. Vrai.
19.19. Conjugaison complexe. 20.14. On a le système
Partie réelle.
19.20. c. Faux, car 2-1 2) (<p1(v))
0 1 1 <p2(v) =V,
( 1 -3-2
012) -1 2 4) det(-A) = (-l)ndetA. <p3(v)
(012
000
, 0 1 4
( 0 0-1
.
donc

19.21. On a
20.4. det(-lln) = (-1 )n.
(v)) = (2-11
<p 1
<p2(V) Û
2)-l
1 V.
20.5. (-l)n. ( <p3(v) 1 -3-2
s: .Jf:--,.Jf:, 20.6. Le volume est 21 car
La matrice est à coefficients en-
et 1 -2 1 1 tiers et elle a déterminant -1,
det(AB, AC, AD) = -2 2 3
donc son inverse aussi est à co-
M H M-2E,(M)ll, 1 3 -1
1 efficients entiers.
=-21.
où E, : X --, R est la forme li- 20.15. {l,-1} et {1}.
néaire qui à un carré magique
20.16. GL( 1, Z) contient les
associe son caractère. La symé-
20.7. detB = det('AA) est deux éléments 1 et -1 .
trie change le signe du caractère
égal à Si n > 1 alors GL( n, Z) est
car E,(M-2E,(M)ll) est égal à
<let 'AdetA = (detA) 2 ?, O. un ensemble infini. En effet,
E,(M) - 2E,(M) = -E,(M). pour tout k E Z, la matrice
42-8 82-8
( k_k_ 1 kt 1 ) est de déterminant 1.
-1 0 -1 H -1 4 -1 Cela donne une infinité de ma-
-5 ---4 7 -5 ---4 11
20.8. An = 0 implique que A
trices dans GL(2, Z) qu'on peut
n'est pas inversible et donc que
aussi utiliser comme blocs pour
det(A) =0.
19.22. On trouve p = t1 o Pl et montrer que GL( n, Z) est infini
S = L] 0 Pl - t2 0 P2 · 20.9. 132. si n>2.
- 20.17.
a. Vrai, en vertu de la règle
20.20.
a/b avec a > et b ;,, 1, et on au-
rait 3b = 2°, ce qui est absurde
car 3 ne divise aucune puissance
de 2.
b. Faux.
o De même, Vz ne peut être
rationnel sans quoi on aurait
2b 3 = a 3 pour des entiers a et
b d'où à nouveau une contradic-
Chapitre 21 tion avec l'unicité de la décom-
position en facteurs premiers
21.1. Ceci est immédiat en dis- puisque, l'entier premier 2 appa-
raît à gauche avec une puissance
cutant selon les signes de x et 11.
du type 3n + 1 et à droite du
type 3m. 21.9. X= 11 = 0,5.
21.2. Si lxl ~ 1111 alors 2
x ~ 11 2
. 21.10. X= 11 = 0,4.
Sinon, on a x 2 ;,, 11 2 . 21.6.
21.11. Le premier sous-
21.3. Non car, pour tout ration- a. Si x et 11 sont rationnels, leur
ensemble est l'intervalle
somme et leur produit le sont
nel r > 0, on a O < f < r et [-v'l, v'l] tandis que le second
aussi.
I E IQ. est la réunion des deux inter-
b. Si x et 11 sont irration- valles disjoints ] - oo, -1 [ et
21.4. L'unicité est claire car, si nels, leur somme et leur produit
on a des entiers met n vérifiant, ]1, +oo[ et donc n'est pas un in-
peuvent être aussi bien ration-
nels, qu'irrationnels, comme le tervalle (-2 et 2 y appartiennent
m:Sx<m+l etn:Sx<n+l, mais pas leur milieu 0).
montrent les exemples,
alors, m - 1 < n < m + 1 et 21.12. L'intersection de deux
donc m = n. Pour l'existence, si
v'2 + (-v'l) = 0 EIQ, intervalles est toujours un inter-
x = 0, n = 0 convient et plus valle. La réunion de deux inter-
généralement si x est un entier, v'2.v'2 = 2 EIQ, valles I 1 et I2 non disjoints est
n = x convient ; on suppose dé- toujours un intervalle.
sormais x non entier; si x > 0,
v'2 + v3 ElR \ IQ,
21.13. Dans tous les cas
par la propriété d'Archimède, le
v'2v3 ElR \ IQ. sup(I) = 1 et inf(I) = O.
sous-ensemble de N* constitué
des entiers k vérifiant k x 1 > x c. Si x est rationnel et 11 est 21.14. [a, bl, [a, +oo[ ou bien
est non vide, donc admet un plus irrationnel, la somme est tou- ]-oo,a].
petit élément ; si on note n + 1 jours un irrationnel et le produit
21.15. Oui t H 1 - t.
ce plus petit élément, alors n aussi, sauf si x = O.
convient. Enfin, six< 0, d'après 21.16. Non.
21.7. E n'est ni paire ni pério-
le cas précédent il existe un en- 21.17. Il est évidemment mo-
dique.
tier m tel que m < -x < m + 1, nogène, précisément il s'agit de
donc -m-1 < x <-met donc
n = -m - 1 convient. •
1
1
v'2Z; en effet, pour tout entier
relatif k, il existe m et n entiers
relatifs vérifiant 2m + 3n = k car
21.5. 1 -

.
v'2/v3 1 2 et 3 sont premiers entre eux.
o Si était un ration-
nel a/b, on aurait 2b 2 = 3a2 ,
1: --.0

contredisant ainsi l'unicité de la


__________ ....._,,_ _____
1 21.18. Ce n'est pas un sous-
groupe, car tous ses élément sont
décomposition en facteurs pre- : 1 positifs.
-..-0
miers puisque, par exemple, l'en- 1
1
tier premier 2 apparaît avec --.0 1
une puissance impaire dans le 1

membre de gauche de l'égalité,


1
1
Chapitre 22
1
et avec une puissance paire dans
celui de droite. 22.1. La suite est majorée et
minorée car nous avons
o Si ln(3)/ ln(2) > 0 était un ra- 21.8. D est 1-périodique mais
tionnel, il s'écrirait sous la forme n'est pas paire. 0 s Jn+ 1 -vn s 1,
pour tout n E N.
2
tel que, sin 2'. N, alors IUnl >
111/2 > O.
In pour tout n E N. En suppo-
sant que la longueur de In tend

22.2. Nous avons co~n+i 1 =
I
l+tsmn vers O lorsque n tend vers l'in-
lcosn+il 2
= cos n+l < 2 0
2 22.11. Les propriétés sont équi-
ll+isinnlZ 1+sin2n - · Il fini, on déduit du théorème des
peut donc en conclure que, pour valentes car Dte(un) = !Re(Un)
gendarmes que lb- al = O. Ainsi
tout n EN, et Jm(unl = -Jm(unl-
a = b et l'intersection des in-
22.12. tervalles est réduite au singleton
cos~_+i 1::; Jz. 1. Nous avons, {a}.
11 +tsmn n 2 +~cosn
n 2 +cos 2 n et 22.18.
ncosn-nv'ï
n 2 +cos 2 n · 1. Le résultat devient faux :
22.3. Nous avons lun - 1/21 = 2. La suite (Un)nEN est conver- considérer les intervalles In =
21 2~+ 3 ). Pour € E IR';_, l'inéga- gente de limite égale à 1. ]O, 1/n[ pour n EN*.
lité IUn - 1/21 < € est vérifiée, si 2. Elle est vide.
n > ½( }.- - 3). Soit N un entier 22.13. Pour tout n dans N, on
a
naturel tel que N > ½(}.- - 3); 22.19. Non comme le montre
sin 2'. N, alors lun -1/21 < €. l'exemple de la suite Un
et donc si lim Vn = 0, on dé- (-l)n.
22.4. Cette affirmation est n-t+oo
fausse comme le montre duit du théorème des gendarmes 22.20. Non comme le montre
l'exemple de la suite Un que (unlnEN est convergente de l'exemple de la suite Un
(-l)n. limite t (-l)n
n+l '
22.14. 22.21. Elles ne le sont pas
22.5. On peut prendre Un
(-l)n et Vn = -Un, 1. C'est faux. Les suites n'ont comme le montre l'exemple de la
aucune raison d'être conver- suite Un= n(-l)n.
22.6. Montrons par l'absurde gentes. Voir par exemple les
que la somme est divergente et suites de termes généraux Un = 22.22. La suite tend vers +oo.
notons pour cela Wn = Un +vn, n + 1, Vn = n et Wn = n + 2.
22.23. Soit M E R Comme
La convergence de (wnln2:o en- 2. C'est vrai. On a, pour tout (UnlnEN n'est pas majorée, il
traîne celle de (vnln2:o car cette entier n, 1 ~ ~ ~ ~- Le existe no E N tel que Un 0 > M.
dernière est somme de deux théorème des gendarmes permet
Puisque la suite est croissante,
suites convergentes; on aboutit alors de conclure que la suite de
terme général ~ converge vers on a donc \ln ): no, Un > M.
ainsi à une contradiction. La suite tend vers +oo avec n.
1.
22. 7. On peut prendre les suites 22.24. Cette assertion est
22.15.
Un= (-l)n etvn =Un, fausse comme on peut le voir
1. Cette affirmation est fausse
22.8. C'est faux : il suffit de sur l'exemple de la suite Un
comme le montre l'exemple de la
prendre les suites, Un = n et suite donnée par uo = 0, u1 = 1 n+(-nn.
Vn = nzl+l' et Un= 1/n pour tout n 2'. 2. 22.25.
2. Cette assertion est également 1. Soit M > O. Posons no =
22.9. Ces deux propriétés ne
fausse ; on peut prendre comme E(M 11°) + 1. Pour tout n): no,
sont pas équivalentes comme le exemple la suite définie par, on an> Ml/a d'où na > M.
montre l'exemple de la suite 1
U2n = 0 et U2n+l = 2n +1 · La suite (nalnEN tend donc vers
(UnlnEN donnée par, Un = 0, si +oo.
n est entre O et 10, et Un = 1 22.16.
2. La suite n'a pas de limite
sinon. 1. Cette affirmation est fausse dans i:.
car le produit de la suite crois-
22.10. La propriété 2) n'en- sante Un = n-) 1 par elle-même 22.26. La suite ( Ju;:;:lnEN tend
traîne pas en général la 1) , n'est pas une suite croissante. vers +oo avec n.
comme on peut le voir sur 2. Cette affirmation est vraie, il
l'exemple de la suite Un= n~l. suffit d'utiliser les définitions. 22.27. Il suffit de démontrer le
En revanche la réciproque est résultat pour deux suites ten-
toujours vraie. En effet, soit 22.17. Puisque a et b appar- dant vers +oo, le cas de -oo dé-
(Unln2:o une suite de limite l f= tiennent à In pour tout n, lb-al coulant d'un simple passage aux
0; pour € = lll/2, il existe N E N est majoré par la longueur de opposés. Soit M > O. Il existe
des rangs n1 et nz au-delà des- 22.35. Supposons par exemple 23.4. 0, 010101 • • • 0101 • • • est
quels on a respectivement Un > la suite (unlnEN croissante. le développement de 1/3 en base
M/2 et Vn > M/2.Alors, au- Nous avons par définition u;;: = 2.
delà du rang n3 = max{n1, nz), Un et u;;: est la limite de
23.5. En général non, à cause
on a Un + Vn > M. La suite (unlnEN•
d'éventuelles retenues rejetées à
(un +vnlnEN tend donc vers +oo
22.36. La suite est constante. l'infini: voir0,66 ... +0,66 ....
avec n.
22.28. Soient Un = n(- l)n + 22.37. Pour k E N, on pose
Uk = r où r est le reste de la di- 23.6. Oui. Quitte à multiplier
n et Vn = -n(-l)n. Aucune
vision euclidienne de k par n ; la les deux nombres par la même
de ces deux suites ne tend vers
suite (uklkEN possède n valeurs puissance de la base b, on
+oo alors que leur somme a
d'adhérence: 0,1, ... ,n-l. est ramené à des développe-
pour limite +oo. Grâce à cet
ments de la forme 0, P1P2 ... :
exemple on peut conclure que les 22.38. Soit (unlnEN la suite dé- 0, P1P2... :( 0, p{pf ... si et
deux premières affirmations sont finie par uzn = 1 et Uzn+ 1 = seulement si les deux dévelop-
fausses. En revanche, la somme 2n + 1. Cette suite possède 1 pements sont égaux ou coïn-
de deux suites majorées étant comme valeur d'adhérence et cident jusqu'à un rang m E N
majorée, la troisième affirmation n'est pas bornée.
est vraie. et P~+l > Pm+l ·
22.39. (uq,(tj,(nJJlnEN est une 23. 7. Le développement déci-
22.29. Il existe n 0 tel que pour
sous suite de (Uq,(n) lnEN· mal de 1/ q est nul à partir d'un
tout n ~ n 0 , Un > O. Le cas
certain rang.
d'une suite négatif en découle :
considérer (-UnlnEN· Chapitre 23 23.8. Il existe deux entiers na-
turels net m tels que q = 2n5m.
22.30. On trouve respective-
ment +oo, -oo et +oo. 23.1.
1. L'affirmation est vraie 123456789
22.31. Soit M > O. Il existe 23.9. Le rationnel
puisque, 1010 -1
no EN tel que est équiréparti.

23.10. Le développement déci-


mal de 1/17 est de période 16;
D'où le résultat. 2. Cette assertion est également comme 16 n'est pas divisible par
vraie, car 10, le nombre 1/17 ne peut être
22.32. Oui choisir par
exemple Un = y'n et Vn = n~ 1 • équiréparti.
1= lim l/2+1/2 2+- +l/2n.
n--t+oo

22.33. Une telle affirmation est


23.2. Non, puisque le déve-
Chapitre 24
fausse. On peut prendre comme
contre-exemple, la suite Un = loppement décimal propre est
24.1. Non pour le premier en-
(~l)n 0, 0909090 · · · 09 · · ·
n+l · semble. Oui pour le second avec
22.34. 23.3. Des égalités suivantes on \/x E JR, f(x) = O.
déduit que a= 15/26.
1. En multipliant par l'expres- 24.2. Oui pour f(x) = /f=x2
sion conjuguée, on obtient définie sur [-1, 1].
. nL=mPn
]1m -
Jn 2 + 2 - Jn2 + 1 = m--t+oo 3n
n=l
24.3. Non.
24.4. Les deux assertions sont
vn 2 + 2 + vn 2 + 1. k=mi=l .
1
fausses dès que f c/ g.
lim
m--t +oo ''
L L - -=
La suite a donc pour limite O. J3k+i
24.5. 1/f est décroissante.
k=O i=O
2. Comme
24.6. C'est faux : voir par
1 k=m l
-n + Jn2 + 1 = exemple f(x) = x pour E = JR*.
, 5/9 m-----++oo
lim '
n+ vn2 + 1 L 33 k.
k=O 24. 7. La fonction f 2n+ 1 est mo-
la suite tend vers +oo avec n. notone de même sens de varia-
tion que f (car x H x 2 n+ 1 est
croissante sur JR). En revanche,
non vide contient toujours un ra-
tionnel.
25.11. Soit f la fonction défi-
nie sur lR par f(0) = 0 et f(t) =

la fonction f peut être mono- sin(l/t) si t le O. On peut véri-
tone sans que f 2 n le soit (voir 25.2. Oui, elle est équivalente à fier que f n'est monotone dans
la définition de la limite d'une aucun voisinage de O.
f(x) = x sur JR).
fonction en un point.
24.8. En toute généralité, 25.12. Pour n E Z, si t E
f 2 n+ 1 est monotone si et seule- 25.3. La fonction f n' a pas [2n - 1,2n[, f(t) = -1 et si
ment si f est monotone (car de limite en O. Supposons le t E [2n,2n + 1[, f(t) = 1. La
x H x 2 n+ 1 réalise une bijection contraire et notons l cette li- fonction f possède une limite en
croissante de lR sur lR). En re- mite. Pour € E lR';_ et t assez tout point de lR \ Z. Elle a une
vanche, f 2 n peut être monotone proche de 0 nous avons li - li < € limite à gauche et à droite, qui
sans que f le soit. et Il - li < €. On déduit alors sont distinctes, en tout point de
t=l=l. z.
24.9. Non. L'interprétation
graphique du caractère lipschit- 25.4. La fonction g a la même 25.13.
zien nous guide : c'est le vo- limite que f au point to. 1. Soient f la fonction constante
sinage de 0 qui pose problème. 25.5. Soit t E lR. En choisissant égale à 1 et g définie sur lR par
Raisonnons par l'absurde. S'il deux suites (tnlnEN et (t~lnEN g(t) = 0 si t ::>: 0 et g(t) =
de limite t dont les termes sont sin(l/t) sinon. Le produit fg =
existait k E lR';_ tel que, pour respectivement dans IQ et lR \ IQ,
nous obtenons g ne possède pas de limite au
tout t et t' dans [0, 1], on ait point O.
lv't-vt'I,,;; lt-t'I, on aurait en lim f(tn)=l#O= lim f(t;,).
n~+oo n~+oo 2. Soit f la fonction définie sur
particulier pour t le 0 et t' = 0, lR par f(t) = sin(l/t) si t > 0 et
v't ,,;; kt, soit v't ,,;; 1/k, ce qui On peut donc conclure que f n' f(t) = 0 sinon. Si g est la fonc-
est manifestement absurde. a pas de limite en t. tion nulle, nous avons f + g = f
qui ne possède pas de limite à
24.10. La somme de deux 25.6. En reprenant les argu- droite en O.
fonctions lipschitziennes est une ments du test précédent, on
fonction lipschitzienne. Cette prouve que f admet pour limite 25.14. Soit fla fonction définie
propriété est fausse pour les pro- 0 en 0 mais n'admet pas de li- sur lR par f(n) = n + 1/2 pour
duits. On vérifie sans peine que mite en t le O. tout n E Z et f(t) =n+ 1 pour
f = idlR est lipschitzienne sur lR tout t E]n, n + 1 [. f est mono-
25.7. On peut prendre comme
mais pas f 2 . tone et vérifie bien les inégalités
voisinage de 0 l'intervalle ouvert
24.11. Les fonctions -f et lfl . 1 demandées.
] -1, 1[. Nous avons hm -f() =
sont respectivement concave et t-;0 t 25.15. La fonction f(t) = sin(t)
-i.
convexe. On ne peut rien dire de est bornée mais sa limite en
la concavité de f 2 . 25.8. On peut montrer la même +oo n'existe pas. Cet exemple
24.12. Il suffit de superposer proposition en prenant l'inter- montre que la propriété d'être
deux inégalités de convexité. section des voisinages. bornée n'implique pas en géné-
ral l'existence d'une limite en
25.9. La définition de la limite
+oo. La réciproque est égale-
de f au point a appliquée à € =
Chapitre 25 1/2 fournit un réel T] E lR';_ tel
ment fausse comme on peut le
voir sur l'exemple suivant : soit
que pour tout t E]a - Tl, a +
25.1. g définie sur lR par g(0) = 0 et
T][\{a}, f(t) > 1/2 > O. On
1. [0, 1 [ n'est pas un voisinage g(t) = 1/t si t E JR*. Elle n'est
prend alors comme voisinage I =
de 0 car il ne contient aucun pas bornée mais possède une li-
intervalle ouvert ] - €, e[ avec ]a-TJ,a+TJ[.
mite en +oo.
€ E lR';_.
25.10. Les deux affirmations
2. iQ) n'est pas un voisinage de
25.16. Pour n E N, on pose
sont fausses. On peut prendre
1/2 car un intervalle ouvert non Un = nn et Vn = n/2 +
comme contre-exemple le point
vide contient toujours un irra- 2nn. Les deux suites (UnlnEN et
a = 0 et la fonction f définie par
tionnel. (vnlnEN ont pour limite +oo et
f(t) = -1 si t < 0 et f(t) = 1 si
3. lR \ IQ n'est pas un voisinage limn-Hoo sin{Un) = 0 le 1 =
t ::>: O.
de .,fi_ car un intervalle ouvert limn-,+oo sin(vn)- On peut donc
conclure que la fonction sin(t) 25.23. considérer la suite ( ~7() nEN· qui
n'a pas de limite en +oo. 1. Soit f(t) = 1 si t > 0 et converge vers 0 et vérifie pour
f(t) = -1 si t :<::: O. Si g est tout n EN ~7( # 0 et f(~7() =
la fonction nulle, alors g o f est 0 = f(0) .
25.17. On définit la fonction h continue en 0, alors que f ne l'est
surIRparh(0) = h(_!_) = 1 pas. 25.29.
si n E Z* et h(t) = ;i:2 (1/t) 1. f est une bijection et f- 1 = f.
2. Cette assertion est fausse. Il
sinon. On pose g(t) = 1/h(t) suffit de considérer g (t) = 0 si 2. On peut vérifier que f([l ,2))
et f(t) = W- Nous avons t ~ 0 et g(t) = 1 si t < O. Si f est n'est pas un intervalle.
3. 1/2 est le seul point de conti-
;~ f(t)g(t) = +oo mais aucune la fonction nulle, alors go f est la
fonction nulle, qui est continue nuité de f.
des deux fonctions ne possède
en 0, alors que g ne l'est pas.
+oo comme limite en O. 25.30.
3. L'exemple de la première
1. Pour n E N*, on pose Xn =
question ci-dessus montre que
1/n et Yn = n:l. Nous avons
25.18. Pour n E Z, on pose cette affirmation est également
limn-->+oo (Yn - Xn) = 0 et
fausse.
f(t) = 0, g(t) = 1 si t E limn-->+oo f(yn)-f(xn) = 1 c/ O.
[2n,2n+ 1[ et f(t) = 1, g(t) = 25.24. Ceci prouve que f n'est pas uni-
0 si t E [2n - 1, 2n[ ; f et g formément continue sur ]0, +oo[.
1. Soit g(t) = 0 si t ~ 0 et
n'ont pas de limites en +oo alors g(t) = 1 si t < O. Si f(t) = -t 2. Pour x et y dans [a, +oo[,
que la limite de leur produit est sur IR tout entier, alors g o f nous avons lf(x) -f(y)I :'Ô lx,-;--,111.
nulle. n'est pas continue à droite en O. La fonction f est donc uniformé-
Ceci montre que l'assertion est ment continue sur [a, +oo[.
fausse. 3. Pour n assez grand, les deux
25.19. On applique la défini- 2. Soient f(t) = -t sur IR tout suites utilisées dans 1) montrent
tion de la continuité à € = entier et g la fonction définie sur que f n'est pas uniformément
f(a)/2. IR par g(t) = 0 si t :<::: 0 et continue sur ]0, b].
g(t) = 1 si t > O. La fonction 25.31.
go f n'est pas continue à gauche
1. Cette affirmation est fausse.
25.20. Si g désigne la fonc- au point O.
Il suffit de prendre la fonction
tion g(t) = f(t) - i, nous avons 3. Cette affirmation est vraie. f(t) = t.
g(a) # O. Comme g est conti- Pour la prouver il suffit d'écrire
2. L'inégalité I lf(x)l- lf(y)I I ~
nue en a, en prenant € les définitions.
lf(x)-f(y)I prouve que cette as-
lg(a)l/2 et en utilisant les in- sertion est vraie.
25.25. Soit f telle que
égalités lg(all - lg(tll :<::: lg(al - 3. Cette propriété est fausse
f([a, bl) c IQ. La continuité de f
g(t)I < lg(a)l/2, nous obtenons puisque la fonction f(t) = t
entraîne que f([a, bl) est un in-
lg(t)I > lg(a)l/2 > 0 pour tout est uniformément continue alors
tervalle. S'il est non réduit à un
t dans un certain voisinage V que sa limite en +oo est infinie.
singleton, alors il contiendrait
de a. C'est-à-dire f(t) # i pour 25.32.
un irrationnel. On peut donc
tout t EV. 1. Cette affirmation est fausse.
conclure que f est constante. On
peut prouver de la même façon On peut prendre comme contre-
que si f( [a, bl) c IR\ IQ, alors f exemple f(t) = g(t) = t.
25.21. Montrons que f est iden-
est constante. 2. On peut prouver cette pro-
tiquement nulle sur IR. Si x E IR, priété en utilisant l'inégalité tri-
alors il existe une suite (r n) nEN 25.26. Une telle fonction ne angulaire.
de rationnels de limite x. Par peut exister car un intervalle, ici 3. Prouvons cette assertion.
continuité, nous avons f(x) = f([0, 1]), non vide et non réduit Soient (xnlnEN et (YnlnEN
limn-->+oo f(rn) = O. à un singleton contient toujours deux suites réelles telles que
un irrationnel. limn-->+oo (Yn - Xn) = O. La
continuité uniforme de f en-
25.22. L'assertion est fausse 25.27. Soit f définie sur [0, 1] traîne que limn--,+oo (f(yn) -
comme le montre le contre- parf(0) = 1, f(l) = 0 et f(t) =t f(xn)l = 0 et celle de g permet
exemple de la fonction f définie si0<t<l. d'avoir limn-->+oo(g(f(Ynll -
sur IR par f(t) = 1 si t > 0 et g(f(xnll) = O. On peut conclure
25.28. Un tel voisinage n'existe que gof est uniformément conti-
f(t) = -1 sinon.
pas. Pour le prouver il suffit de nue.
25.33. Les trois assertions sont
fausses comme le montre le
au fait que

. sin(a+ h)-sina
qui peut encore s'écrire

h'{x) =

contre-exemple des fonctions f 1Jm - - - - - - - = cos a.
h->0 h
et g définies sur IR par f(0) = 2, (1 -x2 ) cosx - (x2 + 1)xsin x
g(0) = 0, f(t) = g{t) = 1 si Ainsi, la fonction x >-l sin x est
(x2 + 1)2
t E IR*. dérivable et sa fonction dérivée
est donnée par x >-l cos x. 26.10.
25.34. Oui.
26.4. Le réel cos(a+ b) est égal a. f'(x) = ✓x~+i ·
25.35. Oui.
à cosacosb-sinasinb, et on b.
25.36. Non : considérer g = sin conclut comme dans la question g'(x) =
et L= 1. test précédente.
2x2
26.5. Léquation est y - 16 2xcosx 2 +ln(l +x2 ) +---z-
25.37. Cette fois-ci la proposi- 1 +x
tion est vraie. 32(x - 2), c'est-à-dire c.
h'(x) =
25.38. Le point a est adhérent y= 32x-48.
à In A. expx2 (2xln{l + x 4 ) + *4)
25.39. Non, voir f(x) = x 3 12 . · ✓1 +x2
26.6. Da pour équation y-1 =
25.40. Non. 3(x-1 ), soit y= 3x-2. Si (x, y) x(expx2 ln{l +x4 ))
appartient à r n D si et seule- (1 + x2)3/2
25.41. Cela équivaut à ment si x 3 = 3x - 2 et y = x 3 ; et arranger l'expression ne pré-
lim f(t) =
t-;n
e. or, sente pas d'intérêt!
25.42. Oui, non et non. x 3 -3x+2 = (x+2)(x-1) 2 , 26.11. On a f'(x) = 4x 3 + 6x,
25.43. f ~a g =} f = Üa(g).
Mais c'est faux pour oa(g).
donc f"(x) = 12x2 + 6

25.44. Il suffit de raisonner par r n D = {(1, 1), (-2, -8)}. et


récurrence sur n. C'est un résul-
tat du cours pour n = 2.
26. 7. En effet, f est dérivable et
sa dérivée est donnée par 26.12. On a

Chapitre 26 f'(x) = 3x2 f'(x) = (x 2 +2x)expx,


26.1. On a fi= o(fj) si et seule- qui est une fonction continue sur f"(x) = (x 2 +4x+2)expx
ment si i > j. l'intervalle IR. et
26.2. On a f = o(g). 26.8. Oui elle l'est, puisqu'elle
f(3l (x) = (x2 + 6x + 6) expx.
26.3. On a sin( a+ b) = est égal est dérivable, de dérivée
à sin a cos b+sin b cos a; il en ré-
sulte que
f'(x) = -l/x2 ,
26.13. Pour que f présente en
sin(a + h) - sin a continue sur IR*. x E IR un extremum local, il faut
h 26.9. que

sina(cosh-1) +sinhcosa a. f'(x) = 6x + 7-cosx. f'(x) = 4x3 + 6x2 = 0,


h b.
g'(x) = i.e. x = 0 ou x = -3/2. En
qui conduit, en utilisant les li-
x = 0, la dérivée s'annule, mais
mites de formes indéterminées 2xsin x + x cosx + 3x2 expx+
2
classiques sans changer de signe, donc il n'y
x 3 expx. a pas d'extremum local; en re-
lim cosh-1 = 0 vanche, en x = -3/2, la dérivée
c.
h->0 h s'annule en changeant de signe,
h'(x) =
et donc f présente en ce point un
. sinh COSX - X Sin X 2x2 COSX
1Jill - - = 1' extremum local.
h->0 h xz+1 (x2+1)2'
26.14. Pour que f présente en ]0, +oo[; si on note respective- 26.22. Oui car, pour x f 0,
x E lR un extremum local, il faut ment C 1 et C2 les valeurs des
que constantes sur chacun de ces in-
tervalles, on a donc
f'(x) = 12x5 - 15x4 + 3x2 = 0,
f(t) = C1t si t E) -oo,0[ et donc a une limite finie quand
i.e. x = 0, x = 1, x = 1-{17 ou x tend vers 0, à savoir O.
et
x = 1+{17. En x = 0, la dérivée
26.23. Oui car, pour x > 0,
s'annule, mais sans changer de f(t) = C2t si t E)0, +oo[.
signe, donc il n'y a pas d'extre- 1 • 1 ,lx. 1
D'autre part, la relation satis- f (x) =2xsm---cos-
mum local ; en revanche, en les ,/x. 2 ,lx.'
faite par f impose que f(O) = O.
trois autres points, f présente un La fonction f ainsi définie sur lR et donc a une limite finie quand
extremum local. est bien continue mais n'est dé- x tend vers 0, à savoir 0 et c'est
26.15. rivable qu'à la condition néces- la même chose pour x < O.
saire et suffisante que C1 = C2.
a. Si f(a) f f(b), la conclu- 26.24. Cette fonction est défi-
Il en résulte que les seules fonc-
sion du théorème de Rolle n'est nie et dérivable sur lR ; elle est
tions f satisfaisant la relation
plus valide comme le montre par impaire donc on peut restreindre
donnée sont celles de la forme
exemple la fonction définie sur son étude à lR+. Sa dérivée est
[0, 1) par f(x) = x. lR --l JR, t 1--t Ct, donnée par
b. Si f n'est pas continue en
un point de [a, b], la conclu- où C est une constante arbitraire , 4(1-x2 )
sion du théorème de Rolle n'est réelle. f (x) = (1 +x2)2,
plus valide comme le montre par 26.18. On a
exemple la fonction définie sur donc f est croissante sur [- 1, 1)
[0, 1) par f{x) =x six E [0, 1[ et f'(x) = 4x 3 + 6x2 -2 et décroissante sur son complé-
f(l) = O.
=2(x+ 1) 2 (2x-1). mentaire. Enfin, les limites de f
c. Si f n'est pas dérivable en en ±oo sont nulles.
un point de )a, b[, la conclu- La dérivée de f est donc positive
26.25. Cette fonction est
sion du théorème de Rolle n'est ssi x 2: 1/2. Ainsi, f est décrois- définie et dérivable sur
plus valide comme le montre par sante sur )-oo, 1/2) et croissante )0,3[U]3,+oo[; on a
exemple la fonction définie sur sur [1 /2, +oo[.
H, 1) par f(x) = lx!. lim f(x) = 0, lim f(x) = -oo,
26.19. On a X---tO+ X---t3-

26.16. Posons pour t E JR,


, x 2 (x 2
-3) lim f(x) = +oo,
cp(t) = (1 + t 2 )f(t); cette fonc- f (x) = (x2 - 1)2 , x---t3+
tion est dérivable, de dérivée et
cp'(t) = (1 + t 2)f'(t) + 2tf(t). donc f est croissante sur lim f(x) = +oo.
x-----t+oo
Compte tenu de la relation sa- ) - oo, -v3] U [v3, +oo[
tisfaite par f, on a donc <p' nulle La dérivée est donnée par
sur JR, et donc <p constante ; si et décroissante sur [-v3, v3).
f'( ) = x-3lnx-3
C désigne cette constante, on a 26.20. On peut prendre l'inter- X (x-3)2 '
donc f(t) = ,f-.z. valle I =) - n/2, n/2[; la déri-
vée de la fonction réciproque est et il existe donc a E]0, 3[ et b E
26.17. On procède de la même
donnée par ]3, +oo[ tels que f est croissante
façon que dans la question test
précédente en posant cette fois, sur ]0, a] U [b, +oo[ et décrois-
1
pour t E JR*, cp(t) = f(t)/t; x1--t---. sante sur [a, 3[U]3, b].
cette fonction est dérivable, de
vT=x2
26.26. Elle n'est pas lipschit-
dérivée cp'(t) = f'(t)/t-f(t)/t 2 . zienne, ni même uniformément
Compte tenu de la relation sa- 26.21. On peut prendre l'inter- continue, puisque
tisfaite par f, on a donc cp' valle I =) - n/2, n/2[; la déri-
nulle sur lR •. À la différence vée de la fonction réciproque est 2

de la question test précédente, donnée par 1)


( n+- -n2 =2+-1
n n2
cela n'implique pas que <p soit
1
constante mais seulement qu'elle x1--t 1 +x2· ne tend pas vers 0 lorsque n tend
soit constante, d'une part sur vers +oo. En revanche, en vertu
] - oo, 0[, et d'autre part sur du théorème des accroissements
finis, sa restriction à [0, 10] est 27.5. Pour 0:::; k :S n-1, la X + X où X est la fonction non

k-lipschitzienne avec,

k = sup
[0.10]
12xl = 20.
]*, f~
fonction f prend la valeur k sur

lier.
k~ 1 [ elle est donc en esca-
f(t)dt = I:~:~-l k/n =
intégrable sur [0, 1] définie par
x(t) = 0 si t est rationnel et
x(t) = 1 sinon.
n-1
-2-· 27.15. l. Si f(t) 2 0, alors
27 .6. Il suffit de prendre <p et 1j.> f(t) = f+(t) et L(t) = 0,
26.27. Elle est évidemment lip-
donc f(t) = f+(t) + L{t) et
schitzienne de rapport 100. distinctes en O.
lf(t)I = f+(t)-L(t). Si mainte-
26.28. Oui, c'est immédiat par 27.7. En général, on n'a pas nant f(t):::; 0, alors f(t) = L(t)
l'inégalité triangulaire, et le rap- l'égalité. Il suffit de prendre sur et f+(t) = 0, donc f(t) = f+(t)+
[0,2], <p =1'> = 1. L(t) et lf(t)I = f+(t) - L{t).
port de Lipschitz de la somme
2. Nous avons f+ = f"ifl et
est inférieur ou égal à la somme 27.8. L = f-tl.
des rapports de Lipschitz de cha-
1. Si <p est constante sur
cune des fonctions. ]xk, Xk+ 1 [, alors 1/ <p l'est égale- 27.16. Montrons que f+ :S 9+.
26.29. Non, il suffit de prendre ment. Si f(t) 2 0, alors 9(t) 2 O.
2. On peut voir facilement que Nous avons dans ce cas f+(t) =
le produit de la fonction id11., par
sur [0, 2] la fonction constante f(t) :::; 9(t) = 9+(t). Si main-
elle-même.
égale à 1 ne vérifie pas l'égalité. tenant f(t) :::; 0, alors f+(t) =
0:::; 9+(t). De la même manière
Chapitre 27 27.9. Oui. se prouve l'inégalité L :S 9-•
27.10. Elle est nulle sur [a, bl, Pour la dernière inégalité, écri-
27.1. La fonction f n'est pas en sauf éventuellement en un vons 9 - f = 9+ + 9- - (f+ +
escalier car elle prend une in- nombre fini de points. L) = 9+-f++9_-L. Comme
finité de valeurs sur [0, 1]. Par 9- - L est positive, on déduit
27.11. Pour € E lft';_, il existe
contre, la fonction t H [t 2 ] est que 9 - f 2 9+ - f+.
en escalier sur [0, 10] ; il suffit de
prendre la subdivision Xk = Jîë
<p en escalier sur [0, 1] vérifiant
<p :S x et ib(xl - € < ib(cp) :S 27.17. Supposons J: 92 (t)dt f-
0. L'égalité de l'énoncé entraîne
ib(x). Nous avons ib(<p) :S 0
pourk=0,··· ,10 que le discriminant L'. est nul,
(voir l'exemple), donc ib(x) -
c'est-à-dire qu'il existe un réel À
27.2. La fonction <p est bornée
car elle prend un nombre fini de
€ :::; O. On en déduit alors que

ib(xl :S O. Comme ib(x) 2 0,


tel que J:{f(t) + À9(t)) 2 dt = O.
On peut donc conclure que f+'A9
valeurs sur [a, b]. On peut évi- nous avons ib(x) = O. L'égalité est nulle sauf sur un ensemble
demment trouver des fonctions Ib{x) = 1 se prouve de la même fini de points de [a, b]. C'est-à-
en escalier qui ne sont pas mo- façon. dire que f est proportionnelle à
notones. 9 sauf éventuellement sur un en-
27.12. La même preuve que le semble fini de points de [a, b].
27 .3. Oui <p o 1j.> est en escalier,
car si 1j.> est constante sur chaque
second exemple ci-dessus montre
que i:_ 1 (f) = I:. 1 (f) = 5/2.
Si maintenant J: 92 (t)dt =
0, alors 9 est nulle sauf sur un
intervalle ]xk, Xk+ 1[, alors <p o 1j.>
27.13. Soit h(t) = 9(t) - f(t). ensemble fini de points de [a, b].
l'est également.
On a donc h(t) f- 0 si t E X, et Elle est donc proportionnelle à
27.4. h(t) = 0 si t E [a, b] \X; h est f sauf sur un ensemble fini de
1. Non : soit f(t) = 0 si t E en escalier car X est un ensemble points de [a, b].
[0, 1] et f(t) = 1 si t E]l,2]. fini. L'égalité 9 = h+ f entraîne
La fonction f est en escalier sur 27.18. Pour 0 :::; k:::; net t E
que 9 est la somme de deux fonc-
[0,2] et discontinue au point 1. ]n~l, ~:\[,on pose f(t) = Xk et
tions intégrables, donc elle est
2. Oui : soit (xk)o:c;k:c;n est intégrable, et que J:
9{t)dt =
9{t) = Yk· Les fonctions f et 9
une subdivision adaptée à <p.
J: h(t)dt + J: f(t)dt. Comme
sont en escalier sur [0, 1]. L'in-
Comme sur ]xk, Xk+l [ la fonc-
tion <p est constante, alors elle J: h(t)dt 0, nous avons
égalité demandée traduit exac-
tement celle de Cauchy-Schwarz
y est continue. Maintenant au
point Xk elle admet une limite
J: f(t)dt = J: 9(t)dt. appliquée aux fonctions f et 9.

à gauche (resp. à droite), car 27.14. Les deux assertions sont 27.19.
elle est constante sur ]xk-1 , xk [ fausses comme le montre le 1. Soit h la fonction définie sur
(resp. ]xk, Xk+ 1[). contre-exemple suivant : 1 = 1 - [a, b] par h{t) = 1 si t E [a, c]
et h(t) = 0 si t E]c, b]; g n'est 27.28. Si a f 0, on peut f! f{t)dtl < € pour tout E, as-
que la fonction produit fh, elle prendre comme primitive la sociée à X. Si on prend tous les
est donc intégrable. fonction x 1--) exp~ax). Dans le termes de E, rationnels, on ob-
2. Nous avons f! g(t)dt cas a = 0, la fonction x 1--) x est tient If! f(t)dtl < €. Le cas où
f! f(t)h(t)dt = I: f(t)h(t)dt + une primitive. ils sont tous irrationnels conduit
f: f(t)h(t)dt. Comme h est
nulle sur [c, b], nous avons
27.29. Nous avons f tan tdt = à Il - f!f(t)dtl < €. On ob-
tient alors la contradiction, 0 =
f: f(t)h{t)dt 0, donc
-lnlcostl + C sur ] - rc/2 +
krc, rc/2 + br[. f! f(t)dt = 1.
I: f(t)dt = f! g(t)dt. 27.30. Nous avons f thtdt = 27 .38. Il est facile de voir
que s6(f) = O. Montrons que
27.20. Oui, car f est intégrable ln(cht) + C.
si(f) > o. Si X = (xk)O:,k:Sn
sur [a, c] et [c, b]. 27 .31. Une intégration par par- une subdivision de [O, 1], nous
27 .21. La fonction f définie par ties montre que f arctan tdt = avons S(X, f) = I:.;:6
(xk+ 1 -
f(t) = ltl est lipschitzienne sur tarctant- ½ ln(l + t 2 ) + C. xk)Xk+ 1- Notons ko le plus
[-1, 1] et non dérivable en O. 27.32. Grâce à une intégration grand entier entre O et n tel
par parties, nous obtenons que que xko :::; 1/2. On peut vérifier
27.22. Supposons f lipschit-
2f~Jî=tldt = cx✓ l -cx2 + que 1/4 :::; S(X, f). En prenant
zienne sur I, c'est-à-dire qu'il
arcsin ex. la borne inférieure sur toutes
existe k tel que pour tout x f 11
de I nous avons lf(x)-f(y)I < k. les subdivisions, nous obtenons
, lx-yl - 27.33.
1/4:::; S6(f). La fonction f n'est
En fixant x et en faisant tendre 1. Pour obtenir le résultat, on donc pas intégrable car s6( f) =
11 vers x, on obtient lf'(x)I :::; k. utilise le changement de variable 0fS6(f).
Pour la réciproque, on utilise le t 1--) -t.
théorème des accroissements fi- 2. L'égalité f: 0
f(t)dt 27.39. Les deux égalités sont
nis. vérifiées par toute fonction f
f~a f(t)dt + f~ f(t)dt et le
27.23. F est définie et déri- changement de variable t 1--) bornée sur [a, b]. Montrons que
vable sur [-1, 1] avec F'(x) = -t appliqué dans l'intégrale s~(f) = i~(f). Pour € E IR~,
3x2f(x 3 ). f~a f(t)dt permettent de prou- il existe une fonction en esca-
ver l'identité demandée. lier cp vérifiant cp :::; f et i~ (f) -
27.24. La relation F'(x) = f(x+
27.34. Oui, il suffit d'utiliser la
€ < f! cp(t)dt. Or, f! cp(t)dt =
T) - f(x) permet de prouver s~(cp) :::; s~(f). Nous déduisons
l'équivalence. relation de Chasles pour se ra- donc que i~(f) - € < s~(f) pour
mener à un intervalle où la fonc- tout € E IR~. Ce qui entraîne
27.25. Elle est fausse car si F
tion est constante. i~(f) :::; s~(f). Nous avons alors
est la fonction nulle sur IR* et G,
la fonction égale à 1 sur IR~ et 27.35. Le changement de va- i~(f) = s~(f).
nulle sur IR''_, nous avons F' = G' riable t H Vt permet de trou-
27.40. Le changement de
mais G f F+C sur IR* pour tout ver la primitive -3 ifiZI cos {lx+
variable s expt donne
CER 6 {lx sin {lx + 6 cos {lx.

27.26. Si Fest une primitive de 27.36. En prenant la li-


la fonction t 1--) [t] sur [-2,2], mite de la suite Sn
" ((«-l)2(,.2n_l))
alors elle vérifie F(t) = C si ;;:ln r«-l)(«+ll , on peut
27.41. Le changement de va-
t E [O, 1) et F(t) = C - t pour conclure que f;
ln( 1 - 2cx cos t +
riable s = expt conduit à
t E [-1,0], où C un réel. On cx2 ) dt est nulle si Icxl < 1 et égale
peut voir facilement que F n'est à 2rcln lcxl dans le cas où lcxl > 1.
f 2sht!!ht+l = -½ln{expt +
1 ) + ½ ln 13 exp t - 11 + C.
pas dérivable en O. Donc la fonc-
tion t H [t] ne possède pas de 27.42. Si ad - be = 0, on ne
27.37. En supposant X inté-
primitive sur [-2,2). peut pas exprimer dt en fonction
grable sur [a, b], nous savons
de ds.
27.27. Soit F(t) = -~ si t E que pour tout € E IR~ il existe
]R._ et F(t) = ~ si t E IR.~. La TJ E IR~, tel que si X est une 27.43. En multipliant par l'ex-
fonction F est une primitive sur subdivision de [a, b] vérifiant pression conjugée, nous avons
IR de la fonction t 1--) ltl. l>(X) :::; TJ, alors IS(X, E,, f) - f ~:~ = f ty't+Î - tv't.
Une primitive est 2/5(t+ 1 )5 12 -
2/3(t + 1 )3 12 - 2/5t5/ 2 .
27.44. On suppose a< b. Nous
ou encore que, k - 1 = [log 10 n],
i.e. k=[log 10 n]+l.
Dans le cas qui nous inté-
resse, le nombre k de chiffres dé-
donc puisque x et 1J sont stricte-
ment positifs et que la fonction
logarithme est croissante,
-
avons alors, cimaux de l'entier 244497 - 1 est (x+y)ln{x+y) 2: xlnx+ylny.
donc CTog 10 (244497 -1 )] + 1. Nu-
f ((t-a)(t- bW
112
dt mériquement, on a

=ln(-~+t 13394 < log 10 (2 44497 ) 28.8. Posons pour x E]O, +oo[,
<p{x) = ln x - y'x. On a alors,
= 44497log 10 2 < 13395,
<p'{x) = 1/x-1/2y'x; on en dé-
+J(t-a)(t-b)) +C.
donc duit que le maximum de la fonc-
tion <p est atteint en 4 et vaut
1013394 < 244497 < 1013395_
donc ln4-y'4 = 2(ln2-1) < 0,
27.45. Dans le cas fi.= 0, nous
d'où il résulte que la fonction <p
avons ✓at 2 + bt + c = fait+ Puisque les deux entiers 1O13394
et 244497 sont différents, leur dif- ne prend que des valeurs stricte-
2b0 1 avec a > O. Le calcul ment négatives.
de f F(t, ✓at 2 + bt + c)dt se ra- férence est au moins égale à 1 et
par suite, 28.9. Les identités
mène alors à celui d'une fraction
rationnelle ou d'un polynôme en 1013394 :S 244497 - 1 < 1013395,
t. e 0 = ch a+ sh a,
d'où il résulte que e- 0 =cha-sha

Chapitre 28 [log 10 (244497 - 1)] = 13394 entraînent les suivantes :

28.1. 8 1 13 = 2, 32 3 15 = 8, et que le nombre de chiffres de ena = {cha+sha)n,


272 13 =9. cet entier de Mersenne est donc e-na = (ch a- sh a)n.
13395.
28.2. on a En utilisant la formule du bi-
28.6. Si n = 0, on a
31/4 < 123/8 < 811/3 < 59/5_ nôme de Newton, on obtient

chna=chna

28.3. Il suffit de la prolonger


lim ln x = -oo,
x--+O+
+C~chn- 2 ush 2 a+···
par O sur les irrationnels ; ce + C~k chn- 2k ush 2k a+···
et
n'est évidemment pas contradic-
toire avec ce qui a été fait car un et
tel prolongement n'est pas crois-
sant. lim ln x = +oo. sh nu= C~ chn-l ush u
x--++oo

28.4. Non puisque, par + C~ chn- 3 ash 3 a+··.


Sin> 0, on a
exemple, pour a = 2, sa valeur + C~k+l chn-2k-l ush2k+l a
en 1/2 est irrationnelle. + ....
28.5. De manière générale, si un lim xn ln x = +oo.
x-----t+oo
entier n a pour une écriture déci-
male comportant k chiffres, soit Sin< 0, on a 28.10. On a
ak-1 · · · a 0 , on a
lim xnlnx = -oo
x-----+O+ ch4 a= e a+ e -a)4
( 2
lim xnlnx=O.
avec ak-1 /c 0, donc x--++oo
d'où en développant par la for-
1ok-l :Sn:S9{lok-l + .. •+l) mule du binôme de Newton,
=lOk-1<10\ 28.7. En effet, après regroupement deux par
deux des termes,
d'où il résulte que (x+y)ln(x+y)
= xln(x+y) +y ln(x+y), 4 1
+ 3).
ch a=
8 (ch4u +4ch2u
De même, d'où en développant par la for- 28.19. En effet sa dérivée sur
mule du binôme de Newton, l'intervalle]- 1, 1[ est nulle, donc
5 1
ch a= (ch5a+Sch3a après regroupement des termes la fonction est constante sur ] -
16
conjugués, 1, 1[ et donc sur [- 1, 1] par conti-
+ l0cha),
1 nuité; prenant sa valeur en 0, on
4 1 cos4 a= (cos4a + 4cos2a + 3). obtient que, Vx E [- 1, 1],
8(ch 4a - 8
sh a = 4 ch 2a + 3),
1 De même,
sh 5 a= (sh5a-Ssh3a . TC
16 arccos x + arcsm x = .
cos 5 a=
1
(cos5a+Scos3a
2
+ l0sha). 16
+ l0cosa),

sin4 a= i(cos4a -4cos2a + 3), 28.20. on a


28.11. Cette dérivée n-ième
est an chat, si n est pair, et 1
sin5 a= (sin5a-5sin3a cos(2arctanx) = 0
anshat, sin est impair. 16
28.12. On a + l0sina).
si et seulement si arctan x
n
L ch(a+kb) = 28.15.
±TC/4, i.e. x = ±1.
k~O 28.21. Vx E [-1, 0[U]0, 1],
sh~ch(a+~) cosp + cosq =
p+q p-q
sh} 2 cos - 2 - cos -2-, ✓1 -x2
tan(arccosx) = - - - .
X
et cosp-cosq =
n -2sinp+qsinp-q On ne peut pas vraiment
.[_sh(a+kb) = 2 2 ' donner de formule donnant
k~O sinp+sinq = arcsin(sin x); on peut simple-
sh~sh(a+~) . p+q p-q ment dire que arcsin(sinx) = y,
2 sm - - cos - - ,
sh} 2 2 où y E [-TC/2, TC/2] vérifie
sinp-sinq = sin x = sin y, i.e. y = x[2TC]
. p-q p+q ou y TC - x[2TC]. Enfin,
28.13. Écrivant que 2 sm - - cos - - . Vx E [-1,1],
2 2
cosna+isinna = ema = (e' 0 )n,
cos(arcsinx) = ~ -
on obtient, en développant par
formule du binôme de Newton, 28.16.
cos na= cosn a tana+tan b
tan( a+ b) = 1 - tan a tan b'
- C~ cosn-Z asin2 a+•••
+ (-1 )kC~k cosn-Zk asin2 k a
tan(a- b) = tana-tanb Chapitre 29
1 + tanatanb
+···
29.1. Bien entendu, une fonc-
28.17. Posant t = tan(a/2), on
et a tion f dans C00 est indéfiniment
dérivable et ses dérivées sont
sin na= c~ cosn-l a sin a 1 - t2 . 2t
cos a= continues; elle est en particu-
1 +tz, sma = 1 +tz'
- c~ cosn- 3 asin3 a+··· 2t lier dans V 00 . Réciproquement,
+ (-l)kC~k+l cosn-Zk-1 a tan a= -tZ. une fonction de V 00 étant in-
1
x sin2 k+l a définiment dérivable, chacune de
ses dérivées est dérivable et par
+." . 28.18.
conséquent continue ; la fonction
arccos(cos(STC/4)) = 3TC/4, est dans C00 • Il y a donc égalité
arccos(cos(-TC/3)) = TC/3, entre ces espaces.
28.14. On a, en utilisant les for-
mules d'Euler, arcsin(sin(3TC/2)) = -TC/2,
arcsin(sin(-9TC/4)) = -TC/4. 29.2. On vérifie sans peine que
eia + e-ta)4 la dérivée première de f existe,
cos4 a= (
2 et vaut f'(x) = 0 si x :S 0 et
f'(x) = 2x six 2 O. Alors, f est fonction convexe devienne crois- tend vers 0, on a
deux fois dérivable (au moins) sante pour les grandes valeurs de
sin{x) = sin(x) {l-x2/ )_ 1
sur R., et f"(x) = 0 si x < 0, x. Ainsi, f(x) = e-x est l'expres- 6
x-x3 /6 x
f"(x) = 2 si x > O. Ainsi, f" sion d'une fonction convexe dé-
n'a aucune chance d'être conti- qui tend vers 1 comme produit
croissante sur R
de deux fonctions qui tendent
nue en 0 (on peut vérifier sim-
29.8. Lorsque f est convexe, vers 1. Quoique vraie, cette
plement que f"(0) n'existe pas assertion n'est pas pertinente,
en étudiant la limite de f'(x)/x a f + b est convexe si et seule-
et n'apporte rien de plus que
lorsque x-; 0). Donc p = 1. ment si a 2 O. Par contre, x H
sin(x) - x qui est tout aussi
f( ax + b) est toujours convexe. vraie, mais d'expression plus
29.3. Lorsque n < 0, la fonction
simple ( un équivalent doit avoir
f définie par f(x) = xn est par 29.9. Soit (PnlnEZ une suite
la forme la plus simple possible).
récurrence définie et C00 sur R., strictement croissante de réels. En fait, ce qui est écrit fait pen-
et pour tout p on a: f(Pl(x) = Si on prend une fonction f ser à sin(x) = x - x 3 /6 + o(x3 ),
n(n-1) ... {n-p + l)xn-p_ continue sur R, dont la pente qui est tout aussi vraie et qui
Lorsque n 2 0, f est de classe sur [n;n + 1] est constante et cette fois apporte plus.
C00 sur R, et l'on a pour tout égale Pn, c'est gagné (vérifier!). La seconde assertion est
Vous pouvez par exemple choi- vraie également, puisque les
p :-,:; n flPl(x) = n(n-1) ... (n-
termes de gauche et de droite
P + 1)xn-p et tout p > n : sir f(0) = 0 et Pn = n, ce qui
tendent tous deux vers 1. Ce
f(Pl(x)=0. détermine f de manière unique.
qui est écrit pourrait surprendre,
29.4. De la question précé- 29.10. La dérivée seconde de car on s'attend à ex ~ 1 + x;
mais en fait les deux sont vraies
dente, il vient immédiatement sin est - sin. Elle est donc
et n'apportent rien de plus que
que la dérivée (n+ 1)-ième d'une convexe sur tout intervalle sur limx-, o ex = 1. En revanche,
fonction polynôme de degré n lequel sin est négative, ce qui bien entendu, ex= 1 + x + o(x)
est la fonction nulle. donne la famille d'intervalles est vraie, tandis que ex = 1 +
29.5. On a tan'{x) = 1 +
suivants : [(2n + 1)n; (2n + Jn + 3x + o(x) est faux.
2)n] (n E Z), et leurs sous- La troisième est fausse, par
tan(x)2, donc tan"(x)
intervalles. exemple la fonction f(x) = 1 +
2 tan{x) tan'(x) = 2 tan(x)(l + x + x 2/2 satisfait aussi la pro-
tan(x) 2 ), puis tan"'(x) 29.11. Oui! Par exemple, la priété demandée.
2tan'(x)(l + 3tan(x)2) fonction identité x H x est à Pour la dernière, tester
2(1 + tan(x) 2 )(1 + 3tan(x)2) = la fois convexe et concave. Plus f(x) = 1 + x + 10000000x2 !
2(1 +4tan(x)2 + 3tan(x) 4 ). généralement, pour tous réels a 29.14. Il ne faut pas se laisser
29.6. On a th'(x) = 1 -th{x) 2, et b, la fonction x H ax + b impressionner par le sin qui reste
donc th"(x) = -2th(x) th'(x) = (fonction affine) est à la fois borné. On remarque surtout que
-2th(x)(l - th{x) 2), puis convexe et concave. Un exercice 14 est bien plus grand que 8, ce
(pas si facile!) est de montrer qui fait que x 14 va être beaucoup
th"'(x) -2th'(x)(l -
plus petite que x 8 • Par consé-
3th{x)2) = -2(1 - th(x) 2 )(1 - que réciproquement, toute fonc-
quent,
3th(x) 2 ) = -2(1 - 4th(x) 2 + tion convexe et concave est né-
14
3 th(x) 4 ). cessairement affine. x sin(l/x) 1 6
x8 :"o X
l
29.7. Si g est convexe on a 29.12. Si f est concave, -f est
g(Àx1 + (1 - À)x2) :<,; Àg(x1) + qui tend vers 0, donc
convexe et bien entendu, l'une
(1 - À)g(x2). Supposant f crois- x 14 sin(l/x) o(x 8 ) (presque
est dérivable si et seulement
sante, on en déduit sans calculs!)
si l'autre l'est. Or une fonc-
tion convexe n'est pas nécessai-
f(g(ÀX1 + (1 - À)X2))
:<,; f(?.g(x1) + (1 - À)g(x2))
rement dérivable partout (pen- Chapitre 30
ser à x H lxl) ; donc une fonc-
et par convexité de f, le tion concave non plus (x H -lxl 30.1. La relation est clairement
membre de droite se majore par en 0). réflexive ; il suffit d'utiliser le
M(g(xi)) + (1 - ;\)f(g(x2)). On 29.13. La première asser- changement de paramétrisation
obtient ainsi la convexité de f o tion est vraie, puisque comme donné par l'identité. Elle est sy-
g. Il ne faut pas penser qu'une sin{x)/x tend vers 1 lorsque x métrique, puisque si TJ = y o
<p, avec <p Ck-difféomorphisme, 31.5. -y(x) = I + f, KER
alors y =l]o<p- 1 , et <p- 1 est un
31.6. -y(x) = 1 + Ke-e', KER
Ck difféomorphisme. Enfin elle
est transitive, puisque si T] =
y o <p et E.. = TJ o -if,, alors E.. = 31. 7. P(t) = -t2 - 2t - 2.
y o ( <p o -if,), et <p o -if, est un Ck- 31.8. P(t)=t+l.
difféomorphisme si <p et -if, sont
des Ck-difféomorphismes. 3 1. 9 . -Yo(t) = co~(t) _ sini') ;
-y(t) = 1Jo(t) + Ke', avec KER
31.10. -y(t) = cos(t) +tsin(t) +
K, avec K E IR.
31.11. -y(t) = e-t.

31.12. -y= o.
30.2. Non, ils n'ont pas la même 31.13. -y(t) = ae' + be 2 t, avec
(a, b) E IR2 .
image. 31.2. -y(t) =et+ K, KER
31.14. -y(t) = (acos(2t) +
31.3. En notant A(t) bsin(2t))et, avec (a, b) E IR2 .
Chapitre 31 J a(t)dt, les solutions sont de
la forme t H Àe-A(t). Si À = 31.15. -y(t) ach(2t) +
0, la solution est identiquement bsh(2t), avec (a, b) E IR 2 .
nulle. Si À /= 0, la solution cor- 31.16. -y(t) acos(2t) +
respondante ne s'annule jamais bsin(2t), avec (a, b) E IR2 .
(car l'exponentielle ne s'annule
31.17. -y(t) = ~e'-tet+aet+
pas sur IR).
b, avec (a, b) E IR 2 •
31.4. L'expression est la même,
31.1. Les solutions sont de la 31.18. -y(t) = ½et - ¾et +
il suffit d'imposer À E IC.
forme t H Àet, avec À E R ae-t + b, avec (a, b) E IR 2 .
Septième partie
SOLUTIONS DES EXERCICES

Chapitre 2 c'est-à-dire
r.:t:: b-a
2.1. Soient f et g deux fonctions de lR:. dans R On tl->(yu1u)=ln(b)-ln(a)- r=·
vab
prouve sans peine les résultats suivants à partir des
définitions :
o si f et g sont impaires, f o g est impaire; 2.5. o Première méthode : utiliser la définition, ce
o si f et g sont paires, f o g est paire ; qui revient à résoudre en x l'équation y = f(x).
On remarque que f est définie sur lR:. à valeurs dans
o si f est paire et g est impaire, f o g est paire;
]0, +oo[. Soit y > O. L'équation ln(l + ex) = y est
o si f est impaire et g est paire, f o g est paire. équivalente à 1 + ex = eY, c'est-à-dire ex = eY - 1.
Puisque eY - 1 > 0, cette équation admet une unique
2.2. La fonction f est un produit de fonctions stric- solution, x = ln( eY - 1). La fonction f réalise donc
tement croissantes et strictement positives sur ]0, 1 [. une bijection de lR:. sur ]0, +oo[ de bijection réci-
f est donc strictement croissante sur cet intervalle ; proque f- 1 vérifiant
f étant de plus continue, elle réalise une bijection de
[0, 1] sur son intervalle image [f(0), f(l )] = [0,2e].
2.3. Notons f la fonction de l'énoncé. Puisque ◊ Seconde méthode : utiliser la dérivation. On re-
marque que f est la composée de deux fonctions
.
hm -f(x)
x--t +oo X
.
= X----thm +oo
✓ /x + 1/x 2
( 1-1 ) = 1, strictement croissantes sur R Elle est donc stricte-
ment croissante sur JR:.. Puisqu'elle est continue sur
lR:. et que
la première bissectrice est la direction asymptotique
de la courbe de f en +oo. Comme lim f(x) = 0 et lim f(x) = +oo,
X--t-oo x--t+oo
lim f(x) - x = -
x--t+oo
lim
x-t+oo
v'x+1 = -oo,
f réalise une bijection de lR:. sur ]O, +oo[.
la fonction f n'admet pas d'asymptote en +oo. 2.6. ◊ Puisque pour tout x E lR:.
2.4. Soit tj., la fonction définie par 1 ex
--- =1----,
1 + ex 1 + ex
1
Vx~ 1, tj.,(x) = 2ln(x) -x + -.
X les primitives sur lR:. de la fonction f sont les fonc-
tions du type
D'après les théorèmes sur les opérations et la dériva-
tion, tj., est dérivable sur (1, +oo[ et sur cet intervalle

, 2 1 (x-1) 2 o Puisque pour tout x E lR:.


tj., ( x ) = - - 12- - = - - -,
x x x2
e-x e2x
tj.,' est donc strictement négative sur ]l, +oo[ et ainsi ----1---
e-x + ex - 1 + e2x ,
tj., est strictement décroissante sur (1, +oo[; puisque
tj.,(1) =Û les primitives sur lR:. de la fonction g sont les fonc-
tions du type
1
Vx ~ 1, 2ln(x)-x+- ( O.
X 1
XHx- ln(l+e 2x)+k, kER
2
Soient alors 0 < a ( b. On a y'bÏa ~ 1, donc

tl->( y'b/a) :;,; O.


Or

tl->( y"b/a) = ln(b/a) -l + ~,


Chapitre 3 g' est du signe de sin(2x)sin(x:-n/4). Ainsi, g est
décroissante sur [0, n/4], croisssante sur [n/4, n/2],
3.1. o On a puis à nouveau croissante sur [n/2, n]. Pour déter-
miner les extrema de g, il faut donc comparer les
f'{x:) =4sinx:cosx:{sin2 x:-cos 2 x:) nombres g(0), g(n/4), g(n/2) et g(n) :
= -2sin{2x:)cos{2x:) = -sin{4x:).
g(0) = g(n/2) = -g(n) = 1
En intégrant et en utilisant f{0) = 1 on obtient
1 3 et
4.
f{x:) = cos(4x:) +
4 1
La fonction f étant paire et n/2-périodique, il suffit 2v2·
de l'étudier sur l'intervalle [0, n/4]. Sur cet inter- Le maximum de g vaut donc 1 et son minimum -1
valle, f est décroissante ; elle admet donc un mini-
(voir la figure 1.2 à la page 1005).
mum en n / 4 valant ½, et un maximum en 0 valant
1 (voir la figure 1.1 à la page 1004). 3.2. La fonction f est dérivable sur lR et pour tout
x: réel,
o Soit g la deuxième fonction ; g est dérivable sur
lR et pour tout réel x:, f'(x:) = sin(x:)2cos(2x:) + cos(x:) sin(2x:)
4 4
g'(x:) = Scos(x) sin (x) - Ssin(x:) cos (x:) = 6sin(x:)[cos2 (x) -1/3].
= Scos(x:) sin{x:)[sin3 {x) -cos (x:)] 3

= ~ sin(2x)[sin(x:) - cos(x:)] Puisque f est clairement n-antipériodique, il suffit


d'étudier f sur un intervalle d'amplitude n tel que
x [sin 2 {x) + sin(x:) cos(x) + cos (x:)] 2
[- n / 2, n / 2], mais f étant paire, on peut se res-
5 . {Z ) sin(x) - cos{x) treindre à [0,n/2] : d'après l'expression de f', la
= v'ï sm x: v'2 fonction f est croissante sur [O, arccos{ 1 / v'3)], puis
x [1 +sin(x:)cos{x)l décroissante sur [arccos(l /v3),n/2]. Elle admet
un maximum en oc = arccos(l / v3) qui vaut
= ~ sin(2x) sin(x:-n/4)[1 + sin(x:) cos{x)].
f(arccos(l/v3)) = sin(oc)2sin(oc) cos(oc)
La fonction g étant clairement n-antipériodique, il 1 4
suffit de l'étudier sur un intervalle d'amplitude n, = 2 r-,(1 -1/3) = r,·
v3 3v3
par exemple [0,n]. Puisque pour tout réel x:,
(voir la figure 1. 3 à la page 1005.)
. 1 . 1
1 + cos{x) sm(x) = 1 + sm(2x:) ;:, 1 - > 0,
2 2

7t
2

H cos4(x:) + sin4 (x:) 3


FIGURE 1.1. La fonction x: = cos(!x)+

3.3.
o Pour x: E [n/2, n], 2n - 2x E [0, n] et a le même
1. On remarque que la fonction de l'énoncé, que
cosinus que 2x:, donc arccos(cos{2x:)) = 2n-2x: et
nous noterons f, est Zn-périodique et paire. Il suf-
f(x:) = 2x - n.
fit donc de l'étudier sur I = [On]. Sur I, on a
arccos(cos(x:)) = x:.
o D'où le graphe de f sur lR à la figure 1.4.
o Pour x: E [0, n/2], 2x: E [0, n] et donc
arccos(cos(2x:)) = 2x:, puis f{x:) = O. 2. On remarque que la fonction de l'énoncé, que
7I
2

FIGURE 1.2. La fonction x H cos 5 (x) + sin5 (x)

7I
2

FIGURE 1.3. La fonction x H sin(2x) sin(x)

nous noterons g, vérifie 3.4. Il faut faire apparaître un sinus, puisque y est
un arcsinus.
Vx E IR, f(x +br)= f(x) + n.
cos(4y) = 1 - lsin 2 (ly) = 1 - 8sin 2 (y) cos 2 (y)
On déduira donc le graphe de g sur lR de celui sur
[0, ln] par translations de vecteurs
= 1 - 8u2 [1 - u 2 ].

kü où Ü=lnî+nf, kEZ. où u = sin(y) = 1


\v'S. Après tout calcul,
o Soit x E [O, ln],
cos(4y) = -u = sin(-y) = cos(n/l+y).
On a donc
x 1 +sin(x)
2-
g(x) = arcsin l n
4y = l +y [ln] ou
x . ✓ 1 + cosl(n/4- x/4)
2-
= arcsm l c'est-à-dire
n n
= i- arcsin Jcos 2 (n/4-x/l)
y=
6
[ln/3] ou y= -
10
[ln/5].

= i- arcsin Jsin 2 (n/4- x/l)


Or, y est l'arcsinus d'un nombre positif, donc
y E [0, n/l]. Or, la seule solution de la première
= i- arcsin Isin(n/4 + x/l)I.
congruence appartenant à cet intervalle est n/6, qui
n'est donc pas y puisque
o Pour x E [0, n/l], n/4 + x/l E [0, n/l] donc 1
sin(y) =/= sin(n/6).
2=
g(x) =x/l-(n/4-x/l) = -n/4.
La seule solution de la seconde congruence apparte-
o Pour x E [n/l, 3n/l], n/4 + (x/l) E [n/l, n] donc nant à [0, n/l] étant 3n/10, nécessairement y= ti5.
g(x) = x/l- (n-n/4-x/l) = -3n/4 + x.
3.5. Puisque a et b sont positifs
o Pour x E [3n/l,ln], n/4 + (x/l) E [n,Sn/4] donc
(arctan(a),arctan(bl) E [0,n/1[2 ,
g(x) = x/l - (n/4 + (x/l) - n) = 3n/4.
donc arctan( a) - arctan(b) E] - n/l, n/l[. Or,
o D'où le graphe de g sur lR à la figure 1.5 à la page a-b
1007. tan(arctan(a) - arctan(b)) = - - .
1 +ab
Ainsi 3.8.
1. Pour x E JR, (1 + lxl/ ~ 0, et donc 21xl :( 1 +x2 ,
arctan(a) -arctan(b) = arctan ( a-b)
1
+ ab • i~
c'est-à-dire 1 2 E [-1, 1). La quantité de l'énoncé
définit donc une fonction sur lR que nous notons
f. Remarquons que f est continue car composée de
fonctions continues.
3.6. Notons 2. Notons f(x) cette quantité. D'après le théorème
de dérivation des fonctions composées, la fonction f
ex= arctan(l/5) et f3 = arctan(l/239). ainsi définie est dérivable en tout point x de lR tel
que
D'après les variations de l'arctangente, on sait que
~2 ..L ±1
0 :( ex :( 1/5 et O :( f3 :( ex, ainsi 1 +x ' '
ainsi f est dérivable sur lR \ {± 1}. Sur cet ensemble
4 7t
5 < 2.
0 :( 3cx :( 4cx - f3 :( 2
1 2
f'(x) =2 - x x c======
1 +x 2
On a (l+x2)2 ( 2x )2
1
- 1 +x2
tan(4cx,) - tan(f3)
tan(4cx- f3) = 1 +tan (4 ex ) tan (f3).
= 1 :x 2 ( J(x2~~~-4x2 -l)

1:x
Posons u = tan(4cx). On a alors u = 1 :~,, où

2 tan(cx,) 5
= 2 ( J(\-::_x:212 - l)
v = tan(2cx) = ( ) 2
1 -tan2 ex, 12 = --(sgn(l -x2 )-1).
1 +x 2

donc u =
~
l-H,- =
120
ÎÎ9'
,
d ou
, oSur)-1, 1[, le signe de 1-x2 est +1; d'où f'(x) = 0
donc f est constante et puisque f(O) = 0, f est nulle
sur cet intervalle et par continuité même sur [-1 , 1].
u-1/239
tan(4cx- f3) = 1 + (u/239) o Sur] - oo, -1 [, le signe de 1 - x 2 est -1 ; d'où

Et puisque 4cx - f3 E [O, 1t/2], 4cx - f3 = l f '( x) =--1--2,


4
+x
3.7. donc il existe k E lR tel que
1. Soit x E lR une solution de (*). On a successive- Vx < -1 , f(x) = -4arctan(x) + k.
ment
Puisque f est continue sur lR cette égalité est vraie
tan(arctan(x) + arctan(2x)) = tan(1t/4), pour tout x :( -1. Comme f(-1) = 0, on conclût
k = -1t.
puis = 1 et finalement 2x 2 + 3x - 1 = O.
1 .!fx2 o De la même manière on trouve que sur [1, +oo[
2. On sait que f(x) = arctan(x) + arctan(2x) on a
est continue et strictement croissante car somme f(x) = -4 arctan(x) + 7t.
de deux focntions continues et strictement crois- 3. Posons e = 2arctan(x). Lorsque x parcourt la
santes sur JR. Maintenant on applique le théorème droite réelle de -oo à +oo , l'angle e parcourt le
des valuers intermédiaires : comme f(O) = 0 et cercle de -7t à 7t, le point à l'est étant exclus. On a
limx-Hoo f(x) = 7t l'équation (*)possède une unique
solution et elle est positive. f(x) = arcsin(sin(0)) - e.
Le discriminant de l'équation 2x2 + 3x - 1 = 0 est
t. = 17 et ses deux solutions sont o Pour x E [-1, 1], eE [-1t/2, 1t/2] donc f(x) = O.
o Pour x E] - oo, -1], eE [-7t, -1t/2] donc
- 3 + v17 < 0 ,
- - -- -
- -3 + v17 0
X] - X2 - > ·
4 4 arcsin(sin(0)) = -7t- e
Ainsi x2 est l'unique solution de l'équation (* ). et f(x) = -7t- 4 arctan(x).
o Pour x E [1, +ool, 0 E [7t/2, 7t) donc On a
arcsin(sin(0)) = 7t- 0
_ tan(a+ b) + ½
et f(x) = 7t - 4 arctan(x). tan(a + b + c) - _ ~
1 8
o D'où la courbe représentative de f à la figure 1008.
Or
3.9.
l +l 7
1. Puisque pour tout x positif, tan(a + b) = ~ = -.
1 - 10 9
arctan(x) = 7t/2- arctan(l/x),
Ainsi,
l'équation est équivalente à

arctan(l/2) + arctan(l/5) + arctan(l/8) =


7'[
. z+ l 65
4 tan(a + b + c) = _L__f = - = 1.
1- 72 65
Puisque les nombres 1/2, 1/5 et 1/8 sont strictement
compris entre O et 1/v3 = tan(7t/6), leurs images
par la fonction arctangente sont strictement com- 2. La fonction définie sur IR par
prises entre O et 7t/6. Posons
x H arctan(x- 2) + arctan(x) + arctan(x + 3)
a= arctan(l/2), b = arctan(l/5), c = arctan(l/8).
On a a+ b + c E [O, 7t/2[. L'égalité est donc équiva- étant strictement croissante en tant que somme de
lente à fonctions strictement croissantes, l'équation du 1.
tan(a+b+c)=l. n'admet qu'une seule solution égale à 5.


2

FIGURE 1.4. La fonction x H arccos{cos{x)) - ! arccos{cos{2x))

7t
2

FIGURE 1.5. La fonction x H


1- arcsin ✓ l+s~n(x)
7[

FIGURE 1.6. La fonction x H arcsin (x}: )-2arctan(x)


1

Chapitre 4 et par croissance de la fonction exponentielle

4.1.
t
( 1 + :;;:
)n ~ et ~
(1 - :;;: )-n ,
t

1. Soit x E R Le réel 1 est une solution évidente de


la deuxième inégalité étant équivalente à
l'équation ; puisque la fonction définie f sur lR par
f(x) = 2x+3x est strictement croissante en tant que
somme de deux fonctions strictement croissantes, il e-t;;;,(1-~r
s'agit de l'unique solution de l'équation.
3. On a, d'après la question 2.

-(1 - ~r;;;,
2. Un réel x est solution de l'équation si et seule-
ment si e-t O.
32x + 32x-1 = 2x+½ + 2x+f,
De plus,
ce qui équivaut à 3Zx- l (3 + 1)
à 3Zx- 3 = 2x-½ et donc à
= 2x+ ½(1 + 23 ), puis (i+~r ~ et.
En multipliant membre à membre cette inégalité par
le nombre positif {l - t/n)n, on obtient
(2x-3) ln(3) = ( x-D ln(2).
t2 )n ( t )n
( 1 - n2 ~ et 1 - :;;: '
Ainsi, l'unique solution de l'équation est

X
3 ln(3) - ln(2) J
= -c-c--c--,-,--~,.......,.,..,--- = -
3 soit encore
2ln(3) - ln(2) 2· t2 )n ,
t)n ~ -e-t ( 1 - n2
- ( 1 - :;;:

4.2. puis en ajoutant à chaque membre e-t


1. Soit u E [0, 1 [. Puisque Vt E [0, u],

_1_,;::1,;::_1_
e-t - (1 - ~r ~ fn(t).
1 +t"' "'1-t' 4. Pour n ) 1, notons HR(n) la proposition sui-
vante
on a par positivité de l'intégrale
(1-u)n) 1-nu.

lu
0
_dt_ ,;::
l+t""
lu lu
0
dt,;'.'.
"'
-dt-
1-t'
o HR(0) est claire.
0
o Soit n) 1. Supposons HR(n) vraie, c'est-à-dire
c'est-à-dire
(1 - u)n ) 1 - nu.
ln(l + u) ~ u ~ -ln(l - u). En multipliant membre à membre par 1 - a ) 0, on
obtient
2. Puisque t/n E [0, 1 [, on peut appliquer les in-
égalités de la question 1., (1-u)n+l )(1-nu)(l-u)
= 1-(n+ l)u+nu2 ) 1- (n+ l)u,
ln(l +t/n) ~ t/n ~ -ln(l -t/n),
et HR(n+ 1) est vraie.
puis en multipliant par n ) 1
o La proposition HR(n) est donc vraie pour tout n
nln(l + t/n) ~ t ~ -nln(l - t/n), positif d'après le principe de récurrence.
5. Appliquons ce qui précède à a = t 2/n2. Figure 1.7. Graphe de x t-t x 2 2x

( 1 - :: r~ 1- f. REMARQUE - Le maximum local en - 1nf2i


ainsi
t2
1- ( 1- n2
)n t2
,;; ~•
vaut e 2 1: 2 ( 2 ).

d'où 4.5. En posant t = eX, l'équation est équivalente à

3t- ~ =4
ce qui achève l'exercice. t '

4.3. c'est-à-dire 3t2 -4t- 1 = 0, donc t = 2 ±/7. Puisque


1. Six= 0, alors \ln~ 1, fn(x) = O. D'où t = ex > 0, on trouve l'unique solution
lim fn(X) = O.
n---++oo

Si X> 0, lim fn(x) = O.


n-++oo
Six< 0, lim fn(x) = -oo.
n---t+oo
2. Pour tout n ~ 1, f n est dérivable sur IR. et sur 4.6. o Si a= 0, on a clairement Sn= (n+ 1) ch(b)
cet ensemble, et Ln= (n+ l)sh(b).
f~(x) =n"'e-nx[l-nx].
o Supposons a # O. On remarque que
Ainsi, puisque
n n

lim fn(x) = -oo,


x-+-oo
lim fn(x) = 0,
x--++oo
Sn+ Ln= L_ eka+b et Sn- Ln= L e-ka-b.
k=O k=O
la fonction f n est donc strictement croissante sur
l'intervalle] -oo, 1/n] de -oo à f n(l/n), puis stric- Ainsi,
tement décroissante sur [1/n,+oo[ de fn(l/n) à 0
f admet un maximum valant Un= fn(l/n). be(n+l)a _ 1
3. Ona Sn + Ln = e en _ l

1 eb+(n+ 1 )a/2 e(n+ 1 )a/2 _ e-(n+ 1 )a/2


Un= fn(l/n) = n"' x - x e- 1 = n"'- 1 e- 1 . en/2 en/2 _ e-a/2
n
Ainsi, lorsque ex > 1, lim Un = +oo. _ sh((n + 1)a/2) b+na/ 2
n-++oo - sh{a/2) e ·
Lorsque ex= 1, lim Un = e- 1
n---t+oo
Lorsque ex < 1, lim Un = O. Comme Sn - Ln s'obtient de Sn+ Ln ne changeant
n---t+oo
(a, b) en (-a, -b) on trouve
4.4. Les fonctions exponentielles et puissance deux
étant dérivables sur IR., la fonction g est dérivable S -L _sh((n+l)a/2) -b-na/ 2
sur R De plus, pour tout réel x, n n - sh(a/2) e '
2
g'(x) = x ln(2)2x + 2x2x = xln(2)2x [x + ln~z)] • d'où

La fonction g est donc croissante sur] - oo, - 1nf2i] S n = ch(b +na /Z)sh((n+ l)a/2)
sh(a/2)
et sur IR.+ et décroissante sur [ - Inf2l , 0] . On a
lim g(x) = 0, lim g(x) = +oo. et
x---+-oo x-++oo
.- = h(b /Z) sh((n + 1 )a/2)
"-n s +na sh(a/2) .

4. 7. L'équation est définie seulement pour x ~ 1.


On note tout d'abord que argch(x) ~ 0 et donc
sh(argch(x)) ~ O. Par suite,

sh(argch(x)) = + ✓ch 2 (argch(x)) -1 = ~-


Puisque sh est une bijection de lR sur JR, on a alors 2. La fonction f étant strictement croissante sur lR
argch(x) = argsh(2 - x) (en tant que somme de fonctions strictement crois-
# sh(argch(x)) = sh(argsh(x)) santes), le réel-~ est l'unique solution de l'équa-
tion.
{cc} ../x2 -1 =2-x
{cc} x 2 -1 = (2- x) 2 et 2-x;;, 0
# 4x - 5 = 0 et 2 - x ;;, 0
# X=S/4. Chapitre 5
4.8. Soient (x, -y) E] -1, 1[ 2 , posons 5.1. Soit x + i-y une racine carrée de w. Alors
x 2 - -y 2 = !Re(w) = 1 et x 2 + -y 2 = lwl = ./2.,
a= argth(x) + argth(-y), d'où x 2 = (1 + ./2.)/2 et -y 2 = (./2.- 1)/2. Puisque
et donc Jm(w) > 0, x et -y sont de même signe. Ainsi
th(cx) = -x+-y
-,
1 +x-y
d'où
a = argth ( 1x+-y)
+ x-y . et son opposé sont les deux racines carrées de w.
D'autre part, w = ./J.ei1t/ 4 , ses racines carrées sont
donc ± v'Zeirr/B et puisque cos( n/8) > 0,
4.9. On remarque que f est impaire et qu'elle est
définie et dérivable sur lR puisque ch ne s'annule pas. /✓2+1. ~
De plus, Vx E lR cos(n/8) = y ~ , sm(n/8) = y ~ -
f(x) = x - th(x),
ainsi 5.2. L'exercice est roboratif : calcul du discrimi-
2
f'(x) = sh (x) = th 2 (x);;, O. nant ~, recherche de ses racines carrées ±6 puis les
2
ch (x) formules bien connues.
La fonction f est donc croissante sur R On a
1. 6 = ±(2- 16i), solutions 2 + 3i et 1 - 2i.
lim f(x) = +oo et lim f(x) = -oo.
x~+oo x4-oo 2. 6 = ±(-1 + 2i), solutions -3 - 2i et -1 - i.
3. 6 = ±(5 - 4i), solutions 2i et 5 - 2i.
4. 6 = ±26(1 + i), solutions 2-i et -2 + Si.
5 . ei0/3, jeie/3, j2ei0/3, e-ie/3, je-ie/3, j2e-i0/3.

REMARQUE - On résout cette équation en po-


sant Z = z3 , on se ramène ainsi à une équation du
second degré en z. Dans le cas où 0 = 0 [2n], les si.x
solutions dégénèrent en trois solutions doubles.

5.3. On applique la formule du binôme

s = (1 -1)1547 -1 = -1.

Figure 1.8. Graphe de x H x - th(x) 5.4. Notons les deux sommes respectivement a et
b. D'après la formule du binôme, (1 +i)7 = a+ib.
4.10. Posons pour tout réel x, Or,
f(x) = sh(x) + sh(a +x) + sh(2a + x) + sh(3a + x).
(1 + if = (1 + i)(2i) 3 = (1 + i)(-8i) = 8 - 8i,
1. Puisque sh est impaire, on a
d'où a= 8 = -b.
3a)
= - sh 3a + sh a a 3a
2-
f (- sh + sh
2 2 2 2 5.5. o On a w = 2ei1t/ 6 donc wn = 2neinrr/ 6 .
=0. Ainsi, wn E lR si et seulement si sin(nn/6) = 0,
c'est-à-dire il existe k E Z tel que nn/6 = kn.
Le réel - ~ est donc une solution évidente de L'ensemble des solutions est donc 6Z.
l'équation.
◊ De même, wn E ilR si et seulement si cos(nn/6) = on obtient
0, i.e. il existe k E Z tel que nn/6 = (n/2) + kn.
L'ensemble des solutions est donc 3 + 6Z.
5.6. Puisque a= (a+ b)/2+ (a- b)/2, -1 - w + w 2 + w 3 + w 4 + w 5 + w 6
l+w
lai ~ la+ bl/2 + la - bl/2.
-1-w-1-w
=-----=-2
De plus, b = (b + a)/2 + (b - a)/2 , donc 1 +w ·
lbl ~ la+ bl/2 + la - bl/2,
5.9.
et en sommant les deux inégalités,
1. 41-i 3. J·2 -
_ -1-iv'3
-2-·
lai + lbl ~ la+ bl + la - bl.
2. -1 +i. 4. _2+v'3
2
+ .i2'
Il y a égalité ci-dessus si et seulement si il y a égalité
dans les deux premières inégalités, i.e. 5.10. Rappelons que le conjugé d'un complexe de
module 1 est son inverse.
a=b, a =-b 1. La conjuguaison donne
ou a+ b, a - b et b - a sont non nuls et ont le
1 +ab
même argument : ce dernier cas ne peut manifeste-
a+b '
ment pas se produire puisque a - b = -{b - a). Il
y a donc égalité ci-dessus si et seulement si a = b d'où le résultat.
ou a= -b. 2. De même
5. 7. Soit Z E C. On a Z4 - 1 = (Z 2 - 1 )(Z 2 + 1)
z+abz-a-b) = z+abz-_a-b
d'où ( a- b a- b
Z 4 -1 = (Z-l){Z+ l)(Z-i)(Z+i). z+ (ab)- 1z-a- 1 - b- 1
a-1 - b-1
Puisque pour tout z E C, ~::;:i~ -/-
1 et d'après la
z+ abz-a- b
formule de la série géométrique, l'équation étudiée
a-b
est équivalente à
d'où le résultat.

5.11. Raisonnons par récurrence sur n ~ 1. Le cas


n = 1 est trivial.
c'est-à-dire à
Soient z1 , ... , Zn+ 1 des nombres complexes non
z-2i nuls. En appliquant l'inégalité triangulaire à z1 +
- - = -1 i ou - i.
z+2i ' · · · + Zn et Zn+ 1, on obtient
On trouve alors z = 0, -2 ou 2.
5.8. Puisque w -/- 1,
en appliquant l'hypothèse de récurrence à Z1, ... , Zn
w w2 w + w2 + w4 + w5
1 + w + 1 + w = 1 + w2 + w4 + w6
2 4

w + w 2 + w4 + w 5
d'où l'inégalité au rang n + 1. Il y a égalité si et
w 8 -1
u,2-1 seulement si il y a égalité dans les deux inégalités
précédentes, c'est-à-dire d'après l'hypothèse de ré-
De plus, w 7 = 1 donc w 8 = w et currence si, premièrement
1 + w + · • • + w 6 = 0,
arg(z1) = · · · = arg(znl,

w w2
- - +2- - = ( l4+ w ) ( - 1 - w 3 -w)
6 ce qui impose arg(z1 +···+Zn) = arg{z1), et deuxiè-
1 +w 1 +w mement, d'après l'inégalité triangulaire du cours, si
=-1 +w 2 +w5 .
arg(z1 + .. ·+Zn)= arg(Zn+il-
D'où puisque
Ensemble ces deux conditions sont donc équiva-
w3 w3 w4
lentes à arg(z1) = · · · = arg(Zn) = arg(Zn+ 1).
l+w 6 1+1/w l+w'
5.12. 5.14.
1. On a 1. D'après la formule de Moivre, 5 est la partie ima-
ginaire de
ze = -sin(20) + i(cos(20) + 1) = i + ie 2ie
= 2cos(0)iei0 = 2cos(0)ei(e+t l. 22
L. [e"'/23
k~o
. ] k e23xin/23 _ 1
= -~~--
ei1t/23 - 1
On aboutit donc à la discussion suivante :
-2
o si 0 E ~ + nZ, ze = 0; 2isin(n/46)ei"/46
◊ si 0 E LJkEZ] - n/2 + 2kn, n/2 + 2kn[, on a i e-in/46
sin(n/46) ·
7I
Izel= 2cos(0) et arg(zel = 0 + 2 [2n] ;
Ainsi
◊ si 0 E LJkEZ]n/2 + 2kn, 3n/2 + 2kn[, on a 5 = cotan(n/46).

Izel= -2cos(0) et arg(ze) = 0 + 23n [2n]. REMARQUE - On a utilisé la formule de la série


géométrique et effectué deux passages à l'arc-moitié.
2. L'égalité Izel= Ize- li est clairement équivalente
à Ize 12 = Ize - 11 2 , c'est-à-dire
2. On remarque que pour tout O ~ k ~ 22
lzel 2 = lzel 2 -2~e(ze) + 1,
sin((23 - k)n/23) = sin(kn/23),
ce qui équivaut à 2~e(ze) = 1, c'est-à-dire
ainsi 5 = 25' et donc
1
sin(20) = - = sin(-n/6).
2 5 ' = 1 cotan (n/46).
Cette équation est équivalente à 2
n 7n 3. On remarque que
20 E -
6 +2nZ ou 20 E G +2nZ.
w 2k - 1 = 2isin(kn/23)eikn/l 3 ,
L'ensemble des solutions est donc
ainsi, puisque sin(kn/23) ;;, 0 pour O ~ k ~ 11

lw 2k -11 = 2sin(kn/23),

5.13. d'où 5" = 25' = 5.


1. En posant {, = ez, l'équation est équivalente à
5.15.
{,+(1/[,) =1, 1. Le nombre z vérifie l'équation si et seulement
c'est-à-dire [,2 - {, + 1 = 0, de solutions si il existe k E {O, ... , n- 1} tel que

z+ 1 _ 2ikn/n
z-1 -e '
L'ensemble des solutions de l'équation initiale est
donc c'est-à-dire

équation n'admettant de solution que lorsque k est


2. En posant {, = ez, l'équation est équivalente à non nul. Ainsi, pour 1 ~ k ~ n - 1, on obtient une
solution

de solutions 1 + e2ikn/n cos(kn/n) .


z = -1 - e2ikn/n = isin(kn/n) = -icotan(kn/n)

après passage à l'arc-moitié.


L'ensemble des solutions est donc égal à
REMARQUE - Il y a n - 1 racines distinctes
puisque la fonction cotangente est strictement dé-
croissante sur l'intervalle ]O, n[.
2. On remarque que z vérifie l'équation si et seule- 6.3.
ment si -iz est solution de l'équation de la question 1. Soient a et b deux réels strictement positifs. On
1. Les racines sont donc a arctan( a) E ]O, n/2[ et arctan(b) E ]O, n/2[. Par
cotan(kn/n), 1 (; k (; n - 1. suite, arctan( a) - arctan(b) E ] - n/2, n/2[. Mais
alors, tan ( arctan( a) - arctan(b)) existe et vaut
3. Le nombre z vérifie l'équation si et seulement
si il existe O (; k (; n - 1 tel que tan ( arctan(a)) - tan ( arctan(b)) a-b
1 + tan ( arctan( a)) tan ( arctan(b)) 1 +ab.
z+ ] 2ik,r/n i6
z-1 = e e '
Ainsi, les deux nombres arctan( a) - arctan(b) et
c'est-à-dire arctan ( 1"...-abb) sont dans ]-n/2, n/2[ et ont la même
(1-ei(2kn+n6)/n)z = -(1 + ei(2kn+n6)/n). tangente. On en déduit que ces deux nombres sont
égaux.
Puisque 0 "!- 0 [2n/n], 0/2 "!- 0 [n/n] ainsi 0/2 + 2. Soit k EN*. On a
kn/n "!- 0 [n/n] et a fortiori
k+l-k
0/2 + kn/n "!- 0 [n]. k 2 + k+ 1 1 + (k+ l)k'
On obtient ainsi une solution pour chaque valeur de
et donc, puisque k et k+ 1 sont des réels strictement
k comprise entre O et n - 1 :
positifs, la question 1. permet d'écrire
1 + é(2k,r/n+6) cos(kn/n + 0/2)
Z=
1 _ ei(2kn/n+6) 1
isin(kn/n + 0/2) arctan ( 2 ) = arctan(k + 1) - arctan(k).
k +k+ 1
= -icotan(kn/n + 0/2)
après passage à l'arc-moitié. Soit n E N*. Par téléscopage, en notant Sn la
somme de l'énoncé, on obtient
4. En posant A=~:::), l'équation est équivalente à
n
1
An+ An= 2cos(n0). Sn = L (arctan(k + 1) - arctan(k))

En posant B = An, l'équation est équivalente à = arctan(n + 1) - arctan(])


B2 -2cos(n0)B+l =0, et immédiatement
de discriminant -4sin2 (n0) et admet donc les solu-
tions e±ine, ce qui équivaut à z solution de l'équa- .
hm Ln arctan ( i )7î7I7I
= - - - = -.
n--->+oo k2 +k+l 2 4 4
tion du 1. lorsque ne = 0 [2n], et équivalent à z k=l
solution des équations du 2. correspondant aux va-
leurs ±0 dans le cas contraire. 6.4.
1. Deux cas se présentent

Chapitre 6 o Sim est un multiple den, wm = 1 et donc

1 +wm+w2m+···+w(n-1)m=n.
6.1. An est la partie réelle de
o Sinon wm i= 1 . Utilisant wn = 1 on a
Ln ( -2-
k=l
ein/3) k
= -2-
ein/3
X----
1 _ ein,r/3 /2n
] - ei1t/3 /2 . wnm 1
l+wm+w2m+···+wln-1)m= -
e'" 13 _ i,/3 wm-J
E n remarquant que 2_e<n; 3 - ~, on trouve
=0.
_ v'3sin(nn/3)
An - 3 X 2n · 2. Appliquons la formule du binôme de Newton
n-1
6.2. On rappelle la relation 1 + j + j2 = O.
s(z)= L (z+wk)n
k=O
429
L
k=27
429

k=27
]
(1 +i2t = L (-j)k = (-j)27 -
( •)403
-J.
] - (-J)
= ~fo (:)wkln-m)zm

= -1.
D'après la question 1., \lm E {O, ... , n} où l'on a effectué le changement de variable i = n-i.
Ainsi
si m E {O, n} n-1 n-1 n-1
sinon. 2Wn = L_ i(i+ 1) = .L_ i 2 + L_ i
i=l i=l i=l
Ainsi s(z) = n(zn + 1). (n- l)n(2n-1) n(n-1)
= 6 +--2-·
6.5. La somme S est la partie réelle de
d'où
4 4 _ n(n 2 -1)
U= L e(2k+T)in/11 = ein/11 L (e2in/1J)k Wn - 6 .
k=0 k=0 4. On a
= ein/11 elOin/11 -1 = eSin/11 sin(Sn/11)

Ainsi
e2in/11 -1 sin(n/11) ·
Xn = ~
1(1.<J(n
i = :f ( f
t.=1
i_
J=1.+l
1) = L i(n - i)
t=l
n-1 n-1
S = sin(Sn/11) cos(Sn/11) = sin(lOn/11) =n.[_i-.[_i2
sin{ n/11) 2 sin{ n/11) i= 1 i= 1

sin(n-n/11) 1 n 2 (n-1) n(n-1)(2n-l)


2 sin(n/11) 2· 2 6
n(n-1)(3n- (2n-1)) (n+ l)n(n-1)
6 6
6.6. Notons respectivement Un, Yn, Wn, Xn et Yn
5. En séparant Yn en trois parties, on trouve
les sommes à calculer. On se rappelle des formules
L~=l k = n(~+l) et L~=l k2 = n(n+1~(2n+1). n

1. En séparant l'ensemble d'indices en trois parties


Yn = Yn + .L_ ij+ L_ i 2
1 (j<i(n i=l
disjointes,
_ 2y n(n+ 1)(2n+ 1)
Un= L. max(i,j) + L max(i,j)
- n+ 6 .

l(i<j(n Ainsi
n
+ .[_max(i,i) y _ Yn _ n(n+ 1)(2n+ 1)
i=l n - 2 12
n n 2 (n+ 1) 2 n(n+ 1)(2n+ 1)
=2 L max(i,j)+.[_max(i,i) 8 12
l(i<j(n i=l
_ n(n2 -1)(3n+2)
n n j-1
- 24
, . , . ,,. n(n+ 1)
=2 L J+Lt= 2 LLJ+--2-
l(i<j(n i=l j=2 i=l
6.7. Si X = 1, le produit vaut 2n+l_ Sinon, on
= 2 f_(i2-j)+ n(n+l) prouve sans peine par récurrence sur n E N que
2 le produit vaut
i=l
2n(n2 -1) n(n+ 1) n(n+ 1)(4n-1) zn+l_l zn+l
= 3 +--2- = 6 . .L_ k X -1
k=0 X = X-1
2. Ona

Yn = '\ .. ( ~ ·)2 n2(n+ 1)2 6.8.


L l) = Li = 4 1. Soient n E N* et a E ]O, n[. Puisque a E ]O, n[,
l(i,j(n i=l
pour k;;, 1, z't- E ]O, ~ [. Par suite, pour tout k com-
3. On a pris entre 1 et n, cos z't- > O. On en déduit que la
somme proposée est parfaitement définie. Ensuite,
n n n n-i pour x E]O,~[, on a sin{2x) = 2sin(x)cos(x) et
Wn=.L_.L_(i-i)=.L_.L_k d one, cos (x ) = 2sin(2x)
sin(x). p our x = p,
a
on obt"1ent en
i=l j=i
particulier
1
= ~ (n-i)(n-i+l) = ~ i(i+l)
L 2 L 2 .
i=l 1=0
et donc Chapitre 7
7.1. Prouvons A = B par double inclusion. On a
B c A U B = A n C C A. De même, A c A U C =
B ne C B.
L'égalité B = C se démontre de la même manière.
7.2. L'équation est équivalente à An X = 0 et
B n xc = 0, c'est-à-dire X C Ac et B C X, i.e.
BcXcAc.
o Si B n A cJ 0, alors B n'est pas contenu dans Ac.
L'équation n'a donc aucune solution.
. . sinx .
2. On sait que hm - - = 1. Par smte, o Si B n A = 0, alors B C Ac et les solutions de
X---t O X
l'équation sont les parties de Ac contenant B.
7.3.
1. Soit x E A. On a alors f(x) E f(A) et donc
et donc, quand n tend vers +oo, x E f-l (f(A)).
2. Raisonnons en deux temps.
sin(a) sin(a)
zn sin( a;zn) a ~si-n(~a~/z=n~J ◊ Supposons f injective.
~
Soit x E f- 1 (f(A)). On a f(x) E f(A). Ainsi, il existe
tend vers sinlal _ Finalement,
x' E A tel que f(x') = f(x). D'où par injectivité de
f, x = x' et donc x E A.

◊ Supposons que \/AC E,A = f- 1 (f(A)).


Soit (x, x') E A 2 tel que f(x) = f(x'). On a alors
6.9. {x} = f- 1 (f({x})) = f- 1(f({x'})) = {x'}. Donc l'ap-
1. Il faut distinguer deux cas. plication f est injective.

o Si 0 = 0 [2n], alors Dn(0) = 2n + 1. 7.4.


1. Soit 1J E f(f- 1 (B)). Il existe un élément x de
o Si 0 'le O [ln], alors d'après la formule de la série
f- 1(B) tel que f(x) =1J et ainsi 1J E B.
géométrique
2. Raisonnons en deux temps.
-ineei(Zn+T)e_l sin((2n+1)0/2)
Dn( 9 ) = e ei 8 - 1 = sin(0/2) o Supposons f surjective. Soit 1J E B. Puisque f est
surjective, il existe x E E tel que 1J = f(x). Ainsi,
après passage par l'arc-moitié. x E f- 1 (B) et 1J E fW 1 (B)).
2. Si 0 = 0 [2n], alors ◊ Supposons que \/B C f, B = f (f- 1(B)). En parti-
culier f = f(f- 1 (f)) = f(E) ce qui prouve que f est
f (0 )=L~= 0 2k+l (n+ 1) x (2n+2)
surjective.
n n+l 2(n+ 1)
=n+l. 7.5.
1. L'application i: E -t Y'(E) définie par
Si 0 'le O[ln], (n + 1) sin(0/2)fn(0) est la partie
imaginaire de la somme \/x E E, i(x) = {x}
n n i(n+1)0 -1
, ei0/2+ik0 = eie/2, eik0 = eie/2_e~-~-- est clairement injective.
L L e'e-1 2. Raisonnons par l'absurde en supposant l'exis-
k=O k=O
_ i(n+T)e;zsin((n+ 1)0/2) tence d'une surjections de E sur Y'(E). Posons alors
- e sin(0/2) ·
f ={x E Eix Il s(x)}.
Ainsi
Comme f C E et s surjective, il existe xo E E tel
2 que f = s(xol- Si xo E f, alors xo ~ s(xo) = f et
fn( 0 ) = _1_ (sin((n+ 1)0/2))
si xo ~ f = s(xol, alors Xo E f. Il y a donc une
n +1 sin(0/2)
absurdité.
7.6. Montrons l'égalité des deux ensembles. Comme Ainsi, U admet une borne supérieure valant AU B.
(AU B) n (BUC) =BU (An C), on a
o Déterminons l'ensemble m des minorants de l'en-
Y=[BU(AnC)]n(CUA) semble U = {A , B } ; f E m si et seulement si
= [B n (CUA)] u [(An C) n (CUA)] f C A et f C B,
= (B n C) u (B n A) u (An C) = X.
i.e. f C A n B et ainsi m est l'ensemble des parties
de E contenues dans A n B ; cet ensemble m ad-
met donc clairement un plus grand élément qui vaut
7.7. An B. Ainsi, U admet une borne inférieure valant
1. Soit i E I. Puisque An B.
4. En reprenant pas à pas les raisonnements menés
\fj E J, Ai,i C U A1,j, ci-dessus on prouve que toute partie non vide ff
IEI de !Y (E) admet une borne inférieure et une borne
on a supérieure valant
nAi,i C n LJAi,i.
jEJ jEJ !El
sup(ff) = LJ A et inf(ff) = n A.

Comme i était arbitraire, on obtient


7.9.
u n Ai,j C n u At,j = n u Ai,j .
iEl jEJ jEJ !El jEJ iEl
1. La relation ~ est clairement réflexive. La rela-
tion est antisymétrique : soient x = (x1, x2) et
2. Il suffit de choisir I = J = {l, 2}, A 1, 1 = A2,2 = 0 y = (y1, Y2l tels que
et A1 ,2 = A2,1 = N. On a alors
X~ y et y~ X.

LJnAi,i =0 mais nLJAi,i =N. On a donc x1 :( Y1 et Y1 :( X1. Ainsi x1 = Y1. On


iEl jEJ iEJ iEI a alors x2 :( Y2 et Y2 :( Xz. Ainsi x2 = yz. D'où
x = y. La relation est transitive : soient
3. Il s'agit d'établir l'inclusion réciproque. Soit x
appartenant à njEJ uiEI Ai,j. Pour tout j E J, il
existe donc ii E I tel que x E Ai; ,i. Comme i f i'
implique pour tout (j,j') E J2 , Ai,j n Ai',i' = 0, tels que
pour tout (j,j') E J2 tel que j f j', on a ii = ii'· x~y et y~z.
Notons io la valeur commune des indices ii lorsque Si x1 < Y1, puisque Y1 :( z1, on a x1 < z1 et donc
j décrit J. On a donc \fj E J, x E Aio ,i et donc x ~ z. Si x1 = Y1 et Y1 < z1, alors X1 < z1 et
XE nE, Aio,i· Ainsi donc x ~ z. Si x1 = Y1 et Y1 = z1, alors x1 = z1,
Xz :( Yz, Y2 :( z2 et donc x1 :( z2. Ainsi x ~ z.
XE unAi,j, 2. L'ordre est total : soient x = (x1, x2) et y =
iEI jEJ
(Y1,Y2l- Si x1 c/ Yl, alors x ~ y ou y ~ x. Si
d'où le résultat. x1 = Y1, puisque soit x2 :( Yz, soit Y1 :( X1, on
X~ y OU y~ X.
7.8. 3. o La partie A n'est pas majorée. En effet, soit
1. La relation est clairement réflexive. La relation (x, y) E N 2 . Il existe alors p E N tel que p > x, donc
est antisymétrique d'après le principe de double in- (x, y) ne peut majorer A.
clusion. La relation est transitive d'après le cours.
o La partie B est majorée par (3, 0). Déterminons
2. L'ordre n'est pas total dès que E contient au l'ensemble M des majorants de B ; (x, y) E M si
moins deux éléments distincts a et b, puisqu'alors et seulement si
les ensembles {a} et {b} ne sont pas comparables par
inclusion. \fpEN, (2,JOP)~(x,y),
3. o Déterminons l'ensemble M des majorants de c'est-à-dire 2 < x car on ne peut avoir \fp EN, y ?,
U = {A, B}; f E M si et seulement si ]OP. Ainsi
M ={3,4,5, ... } x N.
AcF et Bcf,
L'ensemble M admet clairement un plus petit élé-
i.e. A U B C f et ainsi M est l'ensemble des parties ment : (3,0). Ainsi, B admet une borne supérieure
de E contenant A U B ; cet ensemble M admet donc valant (3, 0) mais pas de plus grand élément puisque
clairement un plus petit élément qui vaut A U B. (3, 0) if_ B.
Chapitre 8 et

8.1. Soit n;;, 2. Notons Pl, ... , Pn les n pays d'une P"(x) = f / ( k - 1) (:)xk-l
planète P donnée. Notons Vi le nombre de voisin(s)
sur P du pays Pi· Raisonnons par l'absurde en sup- =n(n-1)(1 +x)n- 2 ,
posant, quitte à permuter les pays, que
de sorte que
V1 < · · · < Vn.

Clairement Vn ,;;; n - 1 . Par conséquence v1 = 0,


c'est-à-dire le pays p 1 n'a pas de voisins (il est sur
une île). En particulier Pl n'est pas voisin de Pn
donc Vn ,;;; n - 2 ; ce qui est absurde car alors 2. Adaptons la méthode précédente. Pour tout réel
{O, ... , n - 2} contiendrait n entiers deux à deux x, posons
distincts.
8.2.
1. Commençons par fixer une partie B de E à k ,;;; n
éléments : il y a (;L choix. Pour chacun de ces Ainsi
choix, on dénombre 2 choix possibles d'une partie
A de B. L'ensemble Ji1'j est donc de cardinal
Q'(x) = ktl 2kG:)x2k-1

=n((l +x)2n-1 -{l -x)2n-1)

2. L'égalité AU B = E est équivalente à Ac C B. et


Puisque l'application de 9"(E) dans lui-même défi-
nie par A H Ac est bijective, on est ramené à la 2 2
Q"(x) = f/k(2k-l)G:)x k-
question précédente et donc
= n(2n-1)((1 + x)2n-2 + (1 - x)2n-2),

de sorte que
8.3. Une surjections de Nn+ 1 dans Nn possède clai-
rement la propriété suivante : il existe un unique
élément ()( de Nn+ 1 admettant exactement deux
antécédents par s. Contruisons une surjection s :
t
k~l
k2 (2n) = Q'(l) + Q"(l)
2k 4
Nn+ 1 --l Nn : il y an choix de ()(. Pour chacun de = n(2n + 1J2 2n- 4 .
ces choix, on dénombre (nr1) = n(n + 1)/2 choix
possibles d'une paire d'antécédents {a, b} de ()( par
s. Pour chacun de ces choix, il reste alors à définir s 8.5. Inspirons-nous de la démonstration de la for-
sur Nn+ 1 \ { a, b} à valeurs dans Nn \ {()(} de manière mule de Vandermonde. Posons, pour tout x réel,
à obtenir une surjection. Comme les ensembles de P(x) = (1 + x) 2n(1 - x) 2n. Pour tout réel x, on
départ et d'arrivée sont de même cardinal n - 1, a
cela revient à définir une bijection : on dénombre
{n-1 )! possibilités. Ainsi, l'ensemble des surjections
de Nn+ 1 sur Nn est de cardinal
P(x) = ( ; (2;)xk)
0
Ct0
(-1t(2;)xk)

1
nx n(n+l) xn
~
( -l) 1 _n(n+l)!
2
.- .
2 = c~:~{i~ 2n/-llk(2;) t~\) )x'.

8.4. Le coefficient de x 2n dans P est donc égal à


1. Posons, pour tout réel x,

Comme on a aussi, pour tout réel x,


Ainsi
on en déduit que Chapitre 9
9.1.
1. Le réel O est un élément neutre. Si (E, *l était un
groupe, l'équation 1 * 1J = 0 admettrait une unique
solution (l'inverse de 1). Or cette équation n'a pas
de solution car elle est équivalente à 1 = O. (E, *)
8.6. Non, ce n'est pas toujours possible. Puisque iQ)
n'est pas un groupe.
est dénombrable, on peut ranger tous les rationnels
2. (E, *l n'est pas un groupe car il ne contient au-
dans une suite (unlnEN· S'il existait une permuta-
cun élément neutre. En effet, il n'existe aucun élé-
tion cp de N telle que (uq,(n)lnEN soit croissante,
ment (xo, 1Jol de Etel que
tous les rationnels seraient supérieurs au nombre ra-
tionnel Uq,(O), ce qui est manifestement absurde. \l(x, 1J) E E, (xo, 1Jol * (x, 1J) = (xox, 1Jo) = (x, 1J).

8.7. Pour toute suite stationnaire a= (anlnEN no- car lR contient strictement plus qu'un élément.
tons i(a) la valeur commune des Un pour n assez 3. Si ( e1 , e2) était un élément neutre, alors, (x, 1J) *
grand (autrement dit i(a) est la limite de la suite). (e1,e2) = (xe1,1J-e2) = (X,1J). Nécéssairement
Alors l'application e1 = 1 et e2 =0. Mais (1,0)*(X,1J) = (x,-1)) donc
(E, *l n'admet pas d'élément neutre. (E, *) n'est pas
IQ)~-) IQ)(Nl xiQ), a f-) (a-i(a),i(a)), un groupe.
4. lR est un élément neutre. Si (E,*) était un
est bijective d'inverse ( a, a) f-) a + a. Nous sa- groupe, l'équation 0nX = lR admettrait une unique
vons que IQ)(NJ et iQ) sont dénombrables, et par consé- solution (l'inverse de X). Or cette équation n'a pas
quence leur produit l'est aussi. de solution car elle est équivalente à lR = 0. {E,*)
n'est pas un groupe.
8.8.
5. 0 est un élément neutre. Si (E, *) était un
1. Pour construire une permutation <Y de Nn ad- groupe, l'équation lRUX = 0 admettrait une unique
mettant exactement k points fixes, on commence solution (l'inverse de X) or cette équation n'a pas de
par choisir les k points fixes : il y en a (~) . Pour solution car elle est équivalente à lR =X= 0. (E, *)
chacun de ces choix de k points fixes que l'on ras- n'est pas un groupe.
semble dans un ensemble F, il faut définir la per-
mutation sur Nn \ F. Comme F est un ensemble de 9.2.
points fixes de <Y, la restriction de <Y à Nn \F doit être 1. Il faut vérifier que l'ensemble E est non-vide, que
une permutation sans point fixe de Nn \ F. Comme la composition o est associative, qu'elle admet un
INn \ FI = n - k, on dénombre rl.n-k.O = rl.n-k pos- élément neutre et que tout élément de E est inver-
sibilités. Ainsi, sible pour la loi o.
Or toutes ces vérifiactions sont évidentes ; en effet
les éléments de E ne sont que des re-écritures des
éléments de G et loi o n'est qu'une re-écriture de la
loi*· On dit que "la bijection f: G -) E transporte
2. L'ensemble 6n des permutations de Nn est la la structure du groupe G sur l'ensemble E".
réunion disjointe des ensembles suivants : Par exemple la vérification pour l'élément neutre
est :
Posons e' = f(e), où e désigne le neutre de G. Soit
Pk = {a E 6n 1 <Y a précisément k points fixes}
x E E. Posons g = f- 1(x). On a

pour k variant de O à n. Ainsi, d'après la première xoe' = f(f- 1 (x) *f- 1(e')) = f(g H) = f(g) = x
question,
et

n! = f_ rl.n.k = k~O
k~O
f_ (:)rl.n-k
= ktO (n: k)hk = to (:)hk,
L'élément e' est donc neutre pour la loi o. .
2. Evident d'après ce qu'on vient de dire en haut,
l'isomorphisme réciproque étant f- 1.

où l'on a effectué un changement de variable et ap- 3. Applications.


pliqué la symétrie des coefficients du binôme. a. Il suffit de poser G = JR';_, E =) - 1, +oo[ et,
pour tout x > 0, f(x) = 3x - 1.
b. Il suffit de poser G = E = JR, E et, pour tout x 2. On ab= u- 1b 4 u, d'où, en appliquant le calcul
réel, f(x) = ifx. de la question 1.,
c. Choisissons G = (JR, +) et b3 = 0 -1b12 0 = 0 -1(b6)2u = 0 -1 0 = e.

f : lR ---l] - 1, 1[ , x H th(x). Ainsi, ub = b 4 u = b 3bu = ebu = bu.


3. On a ubu- 1 = b 2 . Soit, pour tout n positif, la
On a alors, pour tous x, 1J E ] - 1, 1[,
propriété HR(n) : unbu-n = b 2n. Prouvons par
X01J = th(argth(x) + argth(1Jll récurrence que Vn E N, HR(n) est vraie.
20
= th ( argth x + 1J ) = x + 1J o HR(O) est banalement vraie, car ebe = b = b.
1 + X1J 1 + X1J
o Soit n) O. Supposons HR(n) vérifiée. On a alors
9.3. On a les équivalences un+lbu-n-l = u(unbu-n)u- 1 = u(b 2n)u- 1
= (ubu-1 )2n = (b2)2n = b2n+l,

d'où HR(n + 1).


e=~
n fois o La propriété HR(n) est vraie pour tout entier na-
turel n.
u- 1 =bubub ... ub=bubu ... bob
n - 1 fois n-1 fois On a en particulier, pour n = 5, u 5 bu- 5 = b 32 .
Puisque u 5 = e on trouve b = b 32 , i.e. b 31 = e.
#u-lb- 1 = ~ 4. Raisonnons en deux temps.
n-1 fois 2 2
o Supposons que u 3 = b 2 , b = c et c3 = u . On
3
a alors successivement
0 21 = (u3)9 = (b2)9 = (b3)6 = (c2)6
= (c3)4 = (u2)4 = 0 s,

9.4. d'où u 19 = e, donc a fortiori a38 = (u 19 )2 = e,


puis
1. Remarquons que V g E G, g- 1 = g. Soient alors
x,1JEG.Ona b38 = (b2)19 = (u3)19 = (u19)3 = e.

X*1J = (X*1Jl-1 =1)-1 *X-1 =1J*X. Comme c = c 3c- 2 = u 2b- 3, que u 2 = c 3 et


b- 3 = c- 2 commutent, on a aussi c 38 = e. D'où,
2. Non! Par exemple, (9"(JR),~) est un groupe de
c = c39 = (c3)13 = (u2)13 = 0 26 = 0 19+7 = 0 1_
cardinal infini vérifiant la propriété de l'énoncé.
Ainsi,
9.5.
1. Soit, pour tout n positif, la propriété HR(n) b = b3b-2 = c2 0 -3 = 0 14-3 = 0 11 = 0 -s.
xn = ubnu- 1. Prouvons par récurrence que 'lin E
o Réciproquement, supposons que u 19 = e, b = u- 8
N, HR(n) est vraie.
et c = u 7. Alors,
o HR(O) est banalement vraie, car x 0 = uu- 1 = e. b2 = 0 -16 = 03 , c2 = 0 14 = 0 14-2x19
◊ Soit n) O. Supposons HR(n) vérifiée. On a alors = 0 -24 = b3
xn+l =xnx=(ubnu- 1)(ubu- 1) etc 3 =u21 =u 2.
=o(bnu- 1ub)u- 1 =ubn+lu- 1,
9.6. Soit A C IC* une telle partie.
d'où HR(n+ 1). 1. Soit u E A arbitraire. Comme A est stable par
le produit, l'application La : A ---l A, x H ux, est
o La propriété HR(n) est vraie pour tout entier na- bien définie. Comme elle est clairement injective et
turel n. que A est fini, La est bijective. Comme la bijection
On a alors, \in ) 0 La ne fait que permuter les éléments de l'ensemble
fini A, on a
x-n = (xn)-1 = (ubnu-1)-1 = u(bn)-lu-1
= ub-nu- 1.
TI X= TI La(x) = TI (ux) = un TI x.
xEA xEA xEA xEA

La relation de l'énoncé est donc bien vérifiée pour Or le produit des éléments de A C IC* est un nombre
tout n E Z. complexe non-nul, d'où un= 1.
2. D'après ce qui précède, A C Un. Comme on a i(ci) = i(c2).
IAI = IUnl = n, il y a en fait égalité : A = Un.
(4=) Soient c1 = (k1, ... , k,,) et c2 = (k{, ... , k{,).
9. 7. Appliquons la caractérisation usuelle des sous- Clairement il existe une permutation cr E 6n telle
groupes. que

o Le centre de G est non-vide car e commute avec


tous les éléments de G. En effet il suffit de la définir sur {k 1, ... , k,,}
o Soient x et 11 dans Z(G) et 9 dans G. On a par la condition ci-dessus et de la compléter par
9 * 11 = 11 * 9 et donc 11- 1 * 9 * 11 = 9, puis une bijection quelconque de Nn \{k1, ... , k,,} dans
11- 1 *9 = 9*11-l. Ainsi Nn \{k{, ... , k{,}.
On a bien c2 = (cr(k1), ... , cr(k,,)) = cro c1 o cr- 1.
(x*11- 1)*9 =X*(11-l *9) =X*(9*11- 1l
= (X*9l*11-1 = (9*X)*11-1 10.4.
=9*(X*11-1), 1. On a

ce qui montre que X*11-l E Z(G). cr= (1,3,7)(2,5,8,4, 10)(6,9)


= (1, 3)(3, 7)(2, 5)(5, 8)(8, 4 )(4, 10)( 6, 9).
REMARQUE - Un groupe est égal à son centre
si et seulement si il s'agit d'un groupe abélien.
2. La décomposition de cr en produit de transposi-
tions compte 7 termes, donc e( cr) = -1.
3. On a w( cr) = ppcm(2, 3, 5) = 30.
Chapitre 10
10.5. D'après l'exercice 1, pour tout O ( m < n-1,
10.1. o On a

cr;"cr2 cr,m = (cr;"(l ), ... , cr;"(n))


= (cr;"(l), cr;"(2),3, ... , n). Comme les transpositions (1, 2), (2, 3), ... , (n-1, n)
engendrent 6n, on a (S) = 6n.
Si m est pair, cr;"cr2 cr,m = cr2. Si m est impair,
crrcr2 cr,m = (2, 1,3, ... , n). 10.6. Il est clair que pour tout k dans Nn,
o Puisque l'ordre de cr2 vaut n, on peut se limiter cr(k) = n + 1 - k et cr(n + 1 - k) = k.
par périodicité à O ( m ( n - 1. Pour m <n- 1,
on a On distingue donc deux cas selon la parité de n.

crfcr1 cr2m = (crf(l ), crf(2)) o Si n est pair : n = 2m avec m E N*. Alors


= (m+1,m+2) m
cr= fl(k,2m+1-k) et e(cr)=(-l)m.
et pour m = n - 1, crfcr 1 cr2 m = (n, 1). k=l

10.2. Il faut distinguer les cas n = 2 et n ~ 3. o Si n est impair : n = 2m + 1 avec m E N*. Alors
o Sin= 2, 62 = {idr, 2 , (1,2)} donc Z = 62.
o Soient n ~ 3 et cr E Z. Soit i E Nn. Il existe j cr= fl(k,2m+2-k) et e(cr)=(-l)m.
et k dans Nn tels que i, j et k soient deux à deux k=l
distincts. Comme cro (i,j) = (i,j) o cr, on a

(i, j) = cr o (i, j) o cr- 1 = (cr(i), cr(j)). 10. 7. Une permutation cr vérifie cr2 = idNn si et
seulement si w( cr) = 1 ou 2. Puisque l'ordre d'une
Ainsi, cr(i) = i ou cr(i) = j. Comme le même raison- permutation cr c/ idr;n est égal au ppcm des lon-
nement nous conduit à cr(i) = i ou cr(i) = k cl j, on gueurs des cycles de sa décomposition en produit
a cr(i} = i. Ainsi, cr= idr;n et Z = {idr;J de cycles de supports disjoints, une permutation cr
10.3. Prouvons que deux cycles sont conjugués est d'ordre deux si et seulement si elle est le pro-
dans 6n si et seulement si ils sont de même lon- duit d'un nombre fini non nul de transposition de
gueur. supports disjoints. Les permutations cr telles que
cr2 = idr;n sont donc l'identité et les produits de
(==}) Sic1 =(k1, ... ,kp)etc2=croc1ocr- 1 avec
cr E 6n, on sait que c2 = ( cr(k1), ... , cr(k,,)) et donc transpositions de supports disjoints.
10.8. 11.2.
1. Soient C1 et c2 deux cycles qui commutent tels 1. Z[j] contient 0 = 0+0j et 1 = 1 +0j. Soient z et z'
que Supp(c1) nSupp(cz) i= 0. Notons u un élément dans Z[j]. Il existe a, b, a', b' E Z tels que z = a+jb
de cette intersection. On sait que et z' = a' +jb'. On a z-z' = (a-a') +j(b- b') E
Z[j] et
Supp(ci) = {c}(u) 1k EN}
zz' = aa' +j(ab' +a'b) +j2bb'
et = aa' +j(ab' + a'b)- (1 +j)bb'
Supp{cz) = {c~(u) 1 k EN}. = (aa' - bb') + j(ab' + a'b- bb') E Z[j].
Il existe a E Supp(c1) et 13 E Supp(cz) tels que Ainsi, Z[j] est un sous-anneau de C. Z[j] n'est pas
u = c1 (a) = Cz(/3). Soit k E N. Comme c1 et c2 un sous-corps de C car ½!/. Z[j]
commutent, on a 2. Soit z E Z[j]. Il existe ( a, b) E Z 2 tel que
z = a+jb d'où
c}(u) = c}(c2(13)) = c2(c}(l3)).
/z/ 1 =zz= (a+jb)(a+jb)
Mais c~(l3) E Supp(cz) car sinon c~(u) = c~(l3) et
= (a+jb)(a+j2b) = a1 + b 1 + (j +j2)ab
donc u = 13 par injectivité de c~, ce qui est absurde
car alors 13 = Cz(l3) et 13 r/. Supp(cz). On a donc = a1 + b 1 - ab E Z
c~(u) E Supp(cz). D'où Supp(c1) c Supp(cz) puis 1
Supp(c1) C Supp(c1), car c1 et cz jouent des rôles et comme /z/ est positif on a même /z/2 E N.
symétriques. 3. Ona

2. Bien sûr que non. Il suffit de considérer 1lh ={l,-l,j,-j,j2,-j2}={1, -l,j,-j,-1-j, 1 +j}.

4. Montrons que Z[j] x = 1!.J6 par double inclusion.


C1 = (1,2,3) et C1 = C1 1 = (3,2, 1) i= C]. On a vu que
[h ={l,-l,j,-j,j2,-j2}={1,- 1,j,-j,-1-j, 1 +j}.
10.9. Non. La décomposition en produit de cycles
Cela montre d'une part que 1!.J6 C Z[j] et même que
de supports disjoints d'un élément de 6 4 est néces-
1!.J6 C Z[j]x car pour tout élément de 1!.J6 son inverse
sairement de l'un des types suivants : produit de est dans 1!.J6 et donc dans Z[j].
une ou deux transpositions (donc d'ordre deux), un Pour montrer l'autre inclusion soit z E Z[j] x. Donc
3-cycle (d'ordre trois), un 4-cycle (d'ordre quatre) on a /z/ 1 E N. Comme 1/z E Z[j] on a aussi
ou id (d'ordre un). 1//z/1 = /1/z/ 1 E N. On en déduit que /z/ 1 = 1.
Ecrivant z = a + jb avec a, b E Z on a
3 1
Chapitre 11 (a- b/2) 1 +
4b = a 2 + b 1 - ab= /z/ 2 = 1,

11. 1. Il faut prouver que iQ) [i] est un sous-anneau d'où b = 0, -1 ou 1.


de iQ) stable par passage à l'inverse. a. Si b = 0, on trouve a = ± 1, donc z = ± 1.
b. Si b = 1, on trouve a = 0 ou a = 1, donc z = j
◊ L'ensemble iQ) [ i] contient les nombres complexes ou z = 1 + j = -j2 .
0 = 0 + 0i et 1 = 1 + 0i. c. Si b = -1, on trouve a= 0 ou a= -1, donc
o Soient u, v E iQ) [i]. Il existe a, b, c, d E iQ) tels z = -j ou z = -1 -j = -j 1 .
que u = a+ ib et v = c + id. D'où Ainsi, Z[W C 1!.J6,

11.3. Soit cp: {K1,+,x) --l (Kz,+,x) un mor-


u-v=(a-c)+i(b-d ) E IQ)[i]
phisme d'anneaux entre deux corps K1 et K1.
car a - b et c - d sont des rationnels. De même, Puisque
Vx E Kj, cp(x)cp(x- 1) = cp(xx- 1) = cp(l K,) = 1K2 ,
uxv=ac-bd+i(ad+ bc) E IQ)[i]
cp(x) i= O. Ainsi, Ker( cp) ={OK,} et cp est injectif.
car ac-bd et ad+ be sont des rationnels. De même,
pour v i= 0, i.e. c 2 + d1 i= 0, 11.4. Il est clair que (1 lnEN E B. Soient a =
(anlnEN et b = (bnlnEN deux suites de B. Il existe
1 c . d a, 13 E Z et des rangs n1 et n1 au-delà desquels
v= c1+d1 -\1+d2 E IQ)[i] on a respectivement Œn = a et bn = 13. Posons
n3 = max(n1, n1). Pour tout n? n3,
car c'~d 2 et - c 2 !d 2 sont des rationnels.
Œn - bn = a-13 E Z et Œnbn = al3 E Z,
d'où a - b E B et ab E B B est un sous-anneau de I est dans I (par une récurrence immédiate),
de zN. ainsi
m
11.5. Comme à l'exercice 2, on prouve sans peine Z=LJZiEI.
i=l
que lzl 2 E N pour tout z E Z[ivÎ] et on en déduit
que lzl = 1 pour tout élément inversible de Z[iyÎ]. On a donc également .9(F) C I.
Ansi si z = a+ ivlb avec (a, b) E Z 2 est dans c. La réciproque est claire : pour toute partie F
de E, .9(F) est un idéal de A.
Z[ivÎ]x alors lzl 2 = a 2 + 2b 2 = 1. Il est clair que
3. L'ensemble I est clairement un idéal de A.
les seules solutions entières {a, b) de cette équation
Puisque E est infini et que I contient tous les single-
sont (1,0) et (-1,0). Ainsi, Z[ivÎ]x C {-1, 1} et tons de E, I est infini. Raisonnons par l'absurde en
finalement Z[ivÎ] x = {-1, 1}. supposant l'existence d'une partie F de E telle que
11.6. Soient x E A* et lx la translation à gauche I = .9(F). La partie F ne peut être finie car sinon
par x pour la loi o : I = .9{F) le serait aussi. La partie Fest donc infinie,
ce qui est absurde car F E I et F infinie.

Prouvons que lx est injective. Soient y et y I dans A Chapitre 12


tels que lx(Y) = lx{y'), c'est-à-dire xoy = xoy'.
On a donc xo(y-y') = 0A et comme A est supposé 12.1. Comme (7 /\ 11) = 116, l'équation admet des
intègre et x f=- 0, on en déduit que y-y'= 0A, d'où solutions. Il est clair que 2 x 11 - 3 x 7 = 1, d'où
12 x 11 - 18 x 7 = 6. Le couple ( -18, -12) est donc
y = y 1 • Comme lx est injective et que IAI est fini,
une solution de l'équation. Un couple (x,y) est so-
lx est une bijection de A. En particulier, 1A admet lution si et seulement si
un antécédent x' par lx, d'où xox' = x' ox = 1A
(A est supposé commutatif). L'anneau A est donc 7x-11y = 6 = 12 X 11 -18 X 7,
commutatif et tout élément non nul de A admet un i.e. 7(x + 18) = 11 (12 + y). Comme 7 /\ 11 = 1, on
inverse pour o : A est un corps. déduit du lemme de Gauss que (x, y) est solution si
et seulement si il existe k E Z tel que y + 12 = 7k et
11.7. x+ 18 = 11 k. L'ensemble des solutions de l'équation
1. A est intègre si et seulement si IEI = 1. En effet, est donc
dès que E contient deux éléments distincts a et b, {(-18 + llk, -12 + 7k) 1 k E Z}.
on a {a} n {b} = 0 = 0A. : {a} est un diviseur de
O. De plus, si E = 0, 0A = 1A = 0, donc A n'est
pas intègre. Si E = {a}, A= {0A, 1A}, où 0A = 0 et
12.2. Ce système équivaut à l'existence d'un couple
1A = E est un anneau intègre.
d'entiers relatifs (k,l) tel que 2+3k = 3+5l. Il faut
2. Soit I un idéal de A. donc résoudre l'équation diophantienne 3k-5l = 1.
a. Soient X E I et Y C X. Comme Y = Y n X Il est clair que 2 x 3- 5 x 1 = 1. Le couple (2, 1) est
avec Y E A, X E I et que I est un idéal de donc une solution de l'équation. Un couple (k, l) est
A, on a Y E I. Soient X et Y dans I. On a solution si et seulement si
XUY = X~(Y\X). Or, Y\X c Y donc, d'après le 3k - se = 1= 2 x3- s x 1,
point précédent, Y\X E I. Comme X E I et que
I est un idéal de A, on a XUY = X~(Y\X) E I. i.e. 3(k-2) = S(l-1). Comme 3/\5 = 1, on dé-
duit du lemme de Gauss que (k, l) est solution si et
b. L'ensemble E étant fini, I est également fini. seulement si il existe m E Z tel que k - 2 = Sm et
Soient X1 , .•• , Xm les éléments de I. Soit alors l - 1 = 3m. L'ensemble des solutions de l'équation
m est donc
{(2 +Sm, 1 + 3m) lm E Z}.
L'ensemble des solutions du système initial est donc
Il est clair que I c .9(F). Réciproquement, une égal à
partie Z de F est de la forme {8+ 15mlm E Z}.
m
z = LJ zi où zi c xi. 12.3. On a Uo /\ u1 = 2 /\ 11 = 1. On peut supposer
i=l n;;, 1 dans la suite. Inspirons-nous de l'algorithme
d'Euclide. On a Un+ 1 = 6un - 5n+ 1 , d'où
D'après la question précédente, pour i entre 1
et m, Zi E I et toute réunion finie d'éléments Un+ 1 /\ Un =Un/\ 5n+ 1 .
Les seuls diviseurs de 5n+ 1 sont les puissances de 5. 12. 7. Non, en général. En effet,
Comme n ? 1, 5 divise 5n mais pas 6n, 5 ne divise
pas Un- Ainsi, n 4 + 4 = (n2 + 2) 2 - (2n)2
= (n2 - 2n + 2)(n2 + 2n + 2).
Un+l /\Un= Un /\Sn+l = 1.
Il est clair que \fn E N, n 2 + N + 2 fc 1. De plus,
n 2 - 2n + 2 est toujours positif et égal à 1 si et
12.4. Puisque 2A3 = 1, être divisible par 6 est seulement si (n-1) 2 = 0, c'est-à-dire n = 1. Ainsi,
équivalent à être divisible par 2 et 3. Parmi les n 4 + 4 est premier si et seulement si n = 1.
nombres net n + 1, il y a toujours un nombre pair.
12.8. Les diviseurs entiers naturels de n sont les
Ainsi, 21 n(n+ 1)(8n+ 1). Sin= 0 [3], alors 3 divise
nombres de la forme
n donc aussi n(n+ 1)(8n+ 1 ). Sin= 1 [3], 8n+ 1 =
m
9 = 0 [3], d'où 3 l 8n+ 1 et donc 3 ln(n+ 1 )(8n+ 1 ).
TI Pklh < m,
avec \fk "' ,, ~
f3 k"'
Si n = 2 [3], n + 1 = 3 = 0 [3], ainsi 3 In + 1 et ~k-
k~l
3 ln(n+1)(8n+ 1). Dans tous les cas, n(n+1)(8n+l)
est divisible par 2 et 3, donc par 6. On en dénombre donc

12.5. m

1. Puisque n = qm+r, on a an= aqmar. Si q = 0,


N = TI (cxk + 1).
k~l
le résultat est clair. Si q ;,: 1, on a
q-1
an- ar = ar(aqm _ 1) = ar(am-1) L akm, 12.9. On remarque que, pour tout entier relatif
z, 2A3 = 11 (1 - Sz). L'équation admet donc des
k~O
solutions pour tout z E Z. Soit z E Z. Comme
d'où an= ar [am - l]. 2 x (-1) +3 x 1 = 1, 2(5z-1) +3 x (1-Sz) = 1-Sz.
2. D'après la question précédente, Ainsi, (Sz - 1, 1 - Sz) est une solution particulière
de l'équation 2x + 3-y = 1 -Sz (à z fixé). Un couple
(x, -y) est solution de cette équation si et seulement
si
et comme r < m, a r - 1 est le reste dans la di-
vision euclidienne de an - 1 par am - 1. Notons 2x + 3-y = 1 - Sz = 2(5z- 1) + 3 x (1 - Sz),
To,r1, ... ,Tn 0 -1 fc O et Tn 0 = 0 les restes obtenus
lorsqu'on applique l'algorithme d'Euclide à r 0 = n c'est-à-dire 2(x-5z+ 1) = 3(1 -Sz--y). Puisque
et T1 = m. D'après ce qui précède, pour tout n com- 2 /\ 3 = 1, on déduit du lemme de Gauss que (x, -y)
pris entre 2 "t no, arn -1 est le reste dans la division est solution si et seulement si il existe k E Z tel que
euclidienne de aTn- 1 -1 par arn- 2 - 1 : il s'agit de 1 - Sz - -y = 2k et x - Sz + 1 = 3k. L'ensemble des
l'algorithme d'Euclide pour les nombres an - 1 et solutions de l'équation de départ est donc
am -1. Puisque aTno -1 = 0 et Tno-1 = n/\ m, on
a {(3k+Sz-1,-2k-Sz+ 1,z) 1(k,z E Z 2 )}.

12.6.
1. Raisonnons par contraposition. Soit n ;,: 2 non
Chapitre 13
premier. Il existe alors deux entiers k > 1 et k' > 1
tels que n = kk'. Mais alors 13.1.
1. o Prouvons l'unicité de În-
k-1
2n-1 = (2k')k-1 = (2k' -1) L 2k't_ Soient În et Yn deux polynômes vérifiant la rela-
e~o tion de l'énoncé. Posons P = În - Yn. Le polynôme
P vérifie \ft E IR, P(cos(t)) = O. Il admet donc une
Et comme n > k' > 1, 2k' - 1 est un diviseur de
infinité de racines : les réels appartenant au segment
Mn strictement compris entre 1 et Mn : Mn n'est
[-1, 1]. On a donc P = 0 et În = Yn.
pas premier.
2. Après une méthode de crible, on trouve que o Prouvons l'existence de În,
11
2 - ] = 2047 = 23 X 89. Soient n E Net t ER D'après la formule de Moivre,

M 11 n'est donc pas premier.


Or, d'après la formule du binôme, Les polynômes 2XTn et Tn-1 ayant la parité inverse
de celle de Tn, il en est de même de Tn+ 1- L'hypo-
(eit)n = (cos(t) +isin(t))n thèse HR{n + 1) est donc vérifiée.

= t
k~O
(:}ksink(t) cosn-k(t). o L'hypothèse HR(n) est donc vraie pour tout entier
naturel n ;;, 1, d'après le principe de récurrence.
5. Soit n ~ 1. Posons, pour tout O ( k ( n - 1,
Et puisque i k E lR si et seulement si k est pair

cos(nt) = L. G~)i2 k sin 2 k(t) cosn-lk(t) O\'.k


1t
= COS ( 2n + nkn) .
0(2k(n
On a alors
L. G~}-l)ksin 2 k(t)cosn-lk(t)
0(2k(n

Puisque pour tout O ( k ( n - 1 ,


1t kn
Ainsi on conclût en posant
O ( 2n +n (n
et que la fonction cosinus est injective sur [O, n], les
°'k sont n racines distinctes de Tn ; Tn étant de de-
gré n, les °'k sont les seules racines de Tn qui sont
donc simples.
2. D'après la formule ci-dessus
6. Posons, pour tout nombre réel t,
To = 1, T2 = 2X 2 -1,
f(t) = cos(nt) - Tn(cos(t)).
T1 =X, T3 =4X 3 -3X.
La fonction f est de classe "6' 00 sur lR et sur cet in-
3. Pour tous p, q E IR, tervalle,

cos(p) + cos(q) = 2cos (p+ q) (p- q)


- -
2
cos - -
2
. f'(t) = -nsin{nt) +sin(t)T~{cos(t)),

puis
Ainsi, \ln ~ 0 et t E IR,
f"(t) = -n 2 cos(nt) - sin 2 (t)T;(cos(t))
cos((n - 1)t) + cos((n + 1)t) = 2cos{nt) cos(t).
+ cos(t)T~(cos(t))
Le polynôme = -n2 cos(nt) + cos(t)T~(cos(t))
- (1 - cos2 (t))T;(cos(t)).

admet donc une infinité de racines, les nombres de Puisque f est nulle sur IR, le polynôme
la forme cos(t), t décrivant R On en déduit que le
polynôme Pest nul, i.e. Tn+ 1 = 2XTn - Tn-1 · P = (X2 - 1)T; + XT~ - n 2 Tn
4. Prouvons par récurrence sur n ~ 1 la proposi- admet une infinité de racines, les nombres de la
tion HR(n) suivante: forme cos(t), t décrivant R Ainsi, P = O.
<< Pour tout 1 ( k ( n, Tk est de degré k,
de coefficient dominant 2k- l et a la même 13.2.
parité que k. » 1. Les seuls polynômes constants à vérifier (*) sont
o L'hypothèse est banale aux rangs 1 et 2. clairement le polynôme nul et le polynôme constant
égal à 1.
o Soit n ~ 2. Supposons HR(n) vérifiée. Puisque
2. D'abord prouvons que °'
cJ O : si O était une
racine de P alors 1 aussi car

on a P(l) = P(l )P{l - 1) = O.

deg(2XTnl=n+1 >deg(Tn-il, Par une récurrence immédiate on montre que tout


naturel est racine de P, ce qui est impossible car
donc deg (Tn+ 1) = n + 1 et le coefficient dominant P cJ O n'admet qu'un nombre fini de racines.
de Tn+ 1 est celui de 2XTn c'est-à-dire °'
On a donc cJ O et
2 X 2n-l = 2n.
Par une récurrence immédiate, on montre que P puisque JR[X] est intègre et après simplification par
s'annule en cx2n, pour tout n E N. Or, P ad- le polynôme non nul X(X + 1 )(X+ 2), Q E JR[X] est
met seulement un nombre fini de racines. La suite solution si et seulement si Q(X + 1) = Q(X), ce qui
( cx2n lnEN doit donc être périodique, ce qui impose est équivalent à Q constant.
lcxl = 1. D'autre part, si ex est racine alors ex+ 1
o Les solutions sont donc les polynômes de la forme
aussi. Donc on a également lcx + 11 = 1. Ainsi
lcxl = 1 = lcx+ 11. Ca revient à chercher l'intersection ÀX(X+ l)(X +2), À ER
des cercles de rayon 1 et de centre Orespectivement
-1. Ainsi on trouve ex = j ou ex = j2.
3. Soit n (resp. m) la multiplicité de j (resp. i2) 13.4. o Le polynôme nul est une solution évidente
dans P. Alors de l'équation.
o Soit P une solution non nulle de l'équation. No-
3
tons d ;;;, 0 son degré. Puisque P(X2 ) est de degré
puis, utilisant les identités j = 1 et 1 + j + j2 = 0, 2d et (X2 + 1 )P, on a nécessairement 2d = d + 2,
À(X-j2Jn(X + j2Jn(X-j)1n(X +i)1n c'est-à-dire d = 2.

= À(X2 -W(X2 -j2)1n o Soient a, b, c E lR et P = aX 2 + bX + c. Après


= P(X 2) = P(X)P(X 1) tout calcul, P est solution si et seulement si b = 0
et c = -a. En notant r = X 2 - 1, l'ensemble des
= ;\ 2 (X-j)n(X-j2)1n(X- l -j)n(X-1 -j2)m
solutions est donc {Àf IÀ E JR}.
= À2(X- j)n(X-j2 )1n(X + j2)n(X + j)1n.
13.5. o Le polynôme nul est une solution évidente
Par unicité de la factorisation en facteurs irréduc- de l'équation.
tibles de coefficients dominant 1 on trouve m = n
o Soit P une solution non nulle de degré n ;;;, 0
et À = À2 , d'où À = 1. Par conséquence
et de coefficient dominant Pn· Notons, V-y E JR,
F11 : x H P(x-y). Pour tout -y E JR, la fonction F11
est de classe 9ff00 et
4. Non ! Il reste à déterminer parmi les polynômes
V-y,x E lR, F~nl(x) =-ynp(nl(x-y).
précédents cerne qui sont effectivement solutions de
(*). Soit n EN. Posons Or, pourtousx,-y E JR, F11 (x) = P(x)P(-y), on a donc
aussi

P vérifie (*) si et seulement si


Et puisque p(n) = n!pn, on a pour tout -y E JR,

n!pnP(-y) = n!pn1Jn.
ce qui est le cas pour tout n EN, puisque
Ainsi, P(X) = xn.

o Réciproquement, les monômes de la forme xn, où


5. On procède de mème en recherchant les ra- n E N sont des solutions évidentes de l'équation.
cines complexes d'une solution quelconque. Les po-
lynômes solutions sont le polynôme nul et cerne de 13.6. o Soit P un polynôme réel non nul divisible
la forme par son polynôme dérivé P'. Notons Q leur quotient.
Q est de degré un et, si n ;;;, 1 désigne le degré de
P, de coefficient dominant ¼- Soit ex l'unique racine
réelle de Q, nP = (X - a)P'. En dérivant formel-
13.3. ◊ Soit P une solution de l'équation. Après éva- lement une fois, on obtient nP' = (X - a)P" + P',
luation en 0, 3P(0) = 0, 0 est donc racine de P. Après c'est-à-dire (n - 1)P' = (X - a)P". Par une récur-
évaluation en -1, 2P(-1) = -P(0) = O. -1 est rence immédiate, on prouve que pour tout entier
donc racine de P. Après évaluation en -2, P(-2) = k ,( n,
(n- k)Plkl = (X- a)P(k+ll_
-2P(-1) = O. -2 est donc racine de P. Le polynôme
Pest donc de la forme P = X(X+ l)(X+2)Q, avec On a donc, après évaluation en a, \fk ,( n - 1,
Q E lR[X]. (n-k)P(kl(a) = O. Le réel a est donc une racine de
◊ Réciproquement, un polynôme P = X(X + 1 )(X+ P de multiplicité au moins égale à n. Puisque n est
2) Q, avec Q E lR[X], est solution si et seulement si le degré de P, P est de la forme

X(X+ 1 )(X+2)(X+3)Q(X) = X(X+ l )(X+2)(X+3)Q(X+ 1), P=À(X-a)n, n;;;,1, ÀElR*.


◊ Réciproquement, tout polynôme P de la forme 2. Notons cr1, cr2 et cr3 les fonctions symétriques
élémentaires associées aux réels a, b, c et cr;, crf et
cr3 les fonctions symétriques élémentaires associées
est clairement divisible par son polynôme dérivé. aux trois réels de l'énoncé.

13.7.
◊ Calcul de cr;. On a cr; = :, = -1.
1. Soit n > deg (P). Écrivons la formule de Taylor
à l'ordre n pour P,
◊ Calcul de cr~. On a cr~= N2 = -2.
n p(kl(a)
P = P(a) + (X- u) L
-k-!-(X- a)k-l.

I
Calcul de cr3" On a cr3I -
- ~
c,
-
- cr3 _- -1.
k~l 3

Par unicité dans la division euclidienne de P par Les trois réels sont donc les racines du polynôme
X- a, le reste recherché vaut P(a).
2. Soit n > deg (P). Écrivons la formule de Taylor
à l'ordre n pour P, Q = X3 + X2 - 2X + 1.
P = P(a) + P'(a)(X- a)+

+(X- a)2 L Trx-


p(kl( )
n
a)k-2.
13.9. Notons crk les fonctions symétriques élémen-
k~2
taires associées à x, y, z. On reprend la notation Nk
Par unicité dans la division euclidienne de P par
des sommes de Newton définies dans l'exercice pré-
(X - a )2, le reste recherché vaut
cédent. Le système s'écrit alors
P(a) + P'(a)(X- a).

3. Notons Q et R le quotient et le reste dans la di-


vision euclidienne de P par (X - a)( X - b). Il existe
u, v E lll tels que R = uX + v. Puisque

P = (X- a)(X- b)Q +uX +v, Rappelons les calculs menés à la question 2. du
on obtient après évaluation en u et b, même exercice ; on a les relations N 1 = cr1 , puis

P(u) =uu+v , P(b) =ub+v,


d'où N2 = crf - 2crz.
P(b) - P(a) bP(u) - uP(b)
u= b-u et V= b-a .
On en déduit sans peine les formules inverses,
d'abord cr1 = N1, puis
13.8.
1. Notons cr1, cr2 et cr3 les fonctions symétriques
élémentaires associées aux réels u, b et c. Posons
N 2 = a2 + b 2 +c 2. D'après les relations coeflicients-
racines, on a

cr1 = 0, cr2 = 1 et cr3 = -1.


Du fait de cette inversibilité des formules, le système
o Calcul de N2. On a N2 = crf - 2cr2 = -2. de l'énoncé est équivalent à

◊ Calcul de u = u 2 b 2 + u 2c 2 + b 2c 2 . comme cr~ =


u + 2cr3 cr1, on a u = 1. cr1 = 1 , cr2 = -4 , cr3 = cr2 = -4,
◊ Calcul de S. On a
N2 - a 2 N2 - b 2 N2 - c 2 c'est-à-dire x, y, z sont racines du polynôme
S=--u-2-+--b-2-+--c-2-

= -3 + (2-
a2 + __!__
b2 + 2-)N2
c2 X3 - X2 -4X + 4 = (X-1 )(X-2)(X + 2).
u
=-3+N2x 2 .
cr3
Ainsi, S = -5.
13.10. et par injectivité de x >-t cotan2 (x) sur ]0,1t/l[, les
1. Soient x E IR\ 1tZ et n E N*. D'après la formule nombres réels
de Moivre,
cotan2 ( lnk1t
+ ) , 1 ,( k ,( n
sin((ln + 1)x) = '.Jm((eix) 2n+l) 1

= '.Jm((cos(x) + isin(x)) 2n+l ). sont n racines distinctes de Pn- Ce polynôme étant


de degré n, ce sont les seules ! Le coefficient domi-
En notant nant de Pn valant ln + 1, on peut écrire
In= (cos(x) + isin(x)) 2n+l, n
Pn = (ln+ 1) I](X-cotan2 (k1t/(ln+ 1)))
puis en utilisant la formule du binôme, k=l

= (ln+ 1)X n - (ln+


ln_ 1) Xn-2 + ... + ao.
1

Ainsi, en notant crk les fonctions symétriques élé-


mentaires associées aux racines de Pn, on a

ln+
(ln+l)cr1 = ( ln-l
1)
et donc
Or, i 2n+l-k E IR si et seulement si k E lN + 1. La
partie imaginaire de In vaut donc ~ 2 n(ln-1)
cr 1 = L cotan (k1t/(ln + 1)) = .
3
k=l
sin2n+l(x) L (2~;,)r-lln-kcotan2k(x),
o:,;;;2k:,;;;2n+ 1
3. Posons, pour tout x E [O, 1t/l[,
c'est-à-dire
f1 (x) = sin(x) - x et f2(x) = tan(x) - x.

Les fonctions f1 et f2 sont dérivables sur leur en-


semble de définition et sur ]O, 1t/l[,
Ainsi, en posant
f; (x) = cos(x) -1 < 0 et f~(x) = tan2 (x) > O.

f1 et f2 sont donc respectivement strictement dé-


croissante et strictement croissante sur [O, 1t/l[. On
a donc, pour tout réel x E]0, n/1[,
on a bien Vx E IR\ 1tZ,

sin((ln+ l)x) = sin 2n+l (xJPn(cotan2 (x)). f1 (x) < f1 (0) = 0 et f2(x) > f2(0) = O.

D'où les inégalités souhaitées.


2. On remarque que Vl ,( k ,( ln,
4. Pour tout x E]0, 1t/l[,
- . ((ln+ l)k1t)
0 -sm ln+ 1

2 2
=sin n+l (~)rn(cotan ( ~ ) )
ln+ 1 ln+ 1 d'où
1
cotan2 (x) < 2 < 1 +cotan2 (x).
et puisque X

Puisque Vl ,( k ,( n,
sin 2n+ 1(k1t/(ln + 1)) fc 0,
kn/(ln + 1) E]0, 1t/l[,
le nombre réel
on a
k1t )
cotan2 ( ln+ 1 2( kn ) (ln+1)
2
cotan ln+ 1 < 7r2k2 '
est une racine de Pn. Puisque Vl ,( k ,( ln,
et
2
2 ((ln+ 1 - k)1t) 2 ( k1t ) (ln+l) 2( k1t )
cotan ln + 1 = cotan ln + 1 n2k2 < 1 +cotan ln+ 1 .
Puis, en sommant de 1 à n, et le pôle a est de l'ordre 2 car Pet Q1 ne s'annulent
pas en a.
n (2n+1) 2
f
n
cotan
2 ( kn )
2n + 1 < n2k2 f Cherchons la partie polaire de F en a. Selon le lemme
14.7, le pôle en a de

et Fi =f- P(a) =f- 2P(a)


Q1(a)(X-a) 2 Q"(a)(X-a) 2
est d'ordre au plus 1. Donc on doit pouvoir simpli-
fier par X - a. Voyons comment : on a
Ainsi, d'après la question 3., P 2P(a)
Fi= (X-a) 2 Q 1 Q"(a)(X-a) 2
n(2n-1) ~ (ln+ 1) 2 n(2n+2)
3 <L n2k2 < 3 . Q"(a)P-2P(a)Q1
k=l (X- a) 2 Q"(a)Q1 ·
5. Pour tout n ;;;, 1, Cherchons à factoriser X - a dans le numérateur.
Q"(a)P-2P(a)Q 1

=L (Q"(a)plkl(a) -2P(a)Q(k+21(a)) (X-a)k


k;:,O k! (k+2)!
puis, d'après le théorème d'encadrement,
= L (Q"(a/lkl(a) -2P(a)Qlk+2l(a)) (X-a)k
k;:,l k! (k+2)!
= (X-a)P1,
où P1 est égal à
p(k+ll(a)
Chapitre 14 L
k;:,o (
Q(k+3l(a))
Q " ( a ) - - - - 2 P ( a ) - - - (X-a)k.
(k+l)! (k+3)!

14.1. Oui, car si F est une fraction rationnelle à Ainsi,


coefficients dans IQI l'élément simple qu'on retranche P1
Fi = (X- a)Q"(a)Q1
dans le lemme 14.7 est aussi à coefficients dans IQI.
Encore d'après le lemme 14.7, le résidu c de Fen a
x4 + 1
14.2. - - - = X2 - X + l + - - - -
1 2 est celui de F1, donc
X(X + 1) X X+ 1.
14.3. P1 (a) Q"(a)P'(a) - 2P(a) Q"~lal
C=-~~--=-------:=-;-; --;-~-
1. Par la formule 14.15, on trouve Q"(a)Q1 {a) Q"(a) Q'~(a)
6Q"(a)P'(a)-2P(a)Q"'(a)
4X 1 1 1 1
--=--+--------
X4 - 1 X - 1 X + 1 X - i 3Q"(a) 2
X+ i .
2. En rassemblant les termes conjugés ci-dessus, on
obtient
lx lx
cp(x) = -2--,
X -
- -2--,
X +
· Chapitre 15
Donc 15.1.
lx2 -li 1. u et v sont manifestement non colinéaires, donc
<I>(x) = lnlx2 - ll-ln(x2 + 1) = ln--2 -
X +1 dim{vect (u, v)) = 2.
est une primitive de cp sur IR.\{-1, 1}. 2. u et v sont manifestement non colinéaires. Si
w = Àu + µv, on voit directement sur les deux
14.4. Par développement de Taylor on a premières coordonnées que À = -1 et µ = 2 ce
qui donne une contradiction avec la dernière co-
Q= L Ql:t)(X-a)k = (X-a)2Q1, ordonnée. Ainsi, w n'est pas une combinaison li-
néaire des vecteurs (u, v), donc (u, v, w) est libre et
k;?;2
dim(vect(u,v,w)) =3.
3. Comme ci-dessus, on voit rapidement que
(v, w, z) est libre, donc dim(vect (u, v, w, z)) ;;;, 3.
D'autre part, cette dimension est majorée par 3
(sous-espace de IR. 3 ), d'où dim(vect (u, v, w, z)) = 3.
15.2. 15.5. Pour (x, y, z) E llt 3 donné on résout le sys-
2 tème à trois inconnues ex., 13, y
1. F = {P,(1,2,3,0) + µ(1,-1,4,2) 1 {?,,µ) E JK }.
Ainsi, F est le sous-espace vectoriel de IK4 engendré cx.+213 - y =X
par les vecteurs (1,2,3,0) et (1,-1,4,2). -ex.+ 13 + 3y =1.J
2. Les deux vecteurs ci-dessus n'étant pas coli-
{ ex.- 13+ y=z
néaires, ils forment une base de F. Par conséquent,
dimf =2. par exemple par substitutions successives, comme
au lycée; on trouve l'unique solution
15.3. C'est une conséquence du lemme 15.15 :
comme ex. i= 0 et 13 i= 0, dans vect (u, v, w) on peut _ (4x-y +7z 2x+y-z y +z)
( ex., 13, y ) - 12 ' 6 ' 4 .
enlever au choix le générateur u ou le générateur v,
La famille !JlJ = (u, v, w) est donc une base de llt 3 .
vect(u,w) =vect(u,v,w) =vect(v,w).
15.6. Le paramètre t représente l'heure entre mi-
nuit et midi, et le vecteur Ut (resp. Vt) représente la
petite (resp. grande) aiguille sur une horloge. Dire
15.4. que les vecteurs sont liés revient à dire que les ai-
1. Par définition, E est le sous-espace vectoriel de guilles sont alignées.
llt 3 engendré par les vecteurs u = (1, 2, 3), v = Les deux aiguilles sont alignées si et seulement si la
(3, 2, 1), et w = (1, 1, 1). Il est clair que les vec- différence des deux angles, 27rt et I/f, est un multiple
teurs (u, v) sont linéairement indépendants, d'où de 1r. Autrement dit, si et seulement si
dim F ?, 2. D'autre part, w = uiv,ce qui implique
(voir le lemme 15.15) que E = vect (u, v). Par consé- 2 __,_ - 7rt = kn , k E Z.
'" 6
quent, dim E = 2.
2. L'ensemble Fest un sous-espace vectoriel de llt3 On trouve t = Gk/11. Pour 0 :( t < 12, les aiguilles
en tant qu'espace des solutions du système homo- sont donc alignées précisément 22 fois, lorsque
gène x -y = 0 à trois inconnues x, y et z. Une base
de F est ( (0, 0, 1), ( 1, 1, 0) ). Donc dim F = 2. k = 0, ... ,21.
3. L'ensemble G est un sous-espace vectoriel de llt 3
en tant qu'espace des solutions du système homo-
gène suivant : 15.7.
x+3y = 0 1. E est un sous-espace vectoriel de llt3 car c'est
y+z=0 l'espace nul.
{ 2x-z = O.
2. L'équation x 2 + y 2 + z 2 + 2(xy + xz + yz) = 0
Le vecteur nul en est l'unique solution. Donc G est équivaut à (x+y+z) 2 = 0 ou encore à x+y +z = O.
l'espace nul, dim G = 0 (sa base est la famille vide). Donc F bien d'un sous-espace vectoriel.
4. L'ensemble H est un sous-espace vectoriel de llt 3 3. G n'est pas un sous-espace vectoriel de llt 3 . En
en tant qu'espace des solutions du système homo- effet, on voit sans peine que G contient les vec-
gène suivant : teurs (0, 1, 1) et (0, -1, 1) mais il ne contient pas
leur somme (0,0,2).
x+3y = 0 4. On peut H écrire de la manière suivante,
y+z=0
{ x+2y-z= O.
F = {À 3 (1,-1,0) + (2µ-1)(1, 1 ,-1) 1(À,µ) 2
Elit}.
2
On résout ce système (la première équation est su-
perflue car elle est la somme des deux autres) et on Remarquons que les deux applications de lit dans
trouve que H = IK(3, -1, 1), donc dim H = 1. lit définies par À H À3 et par µ H 2µ - 1 sont
surjectives. Cette observation permet de changer de
5. L'ensemble Lest un sous-espace vectoriel de llt3 paramétrisation. En posant ex. = À3 et 13 = 2µ - 1
en tant qu'espace des solutions du système homo- on trouve alors
gène suivant :
1 2
F = {cx.(1,-1,0) + 13(1,
-x+3y+z=0 2,-1) 1 (ex., 13) Elit}
{ -2x+y +2z = O. = vect ((1,-1,0), (1, 1/2,-1)).

On trouve que les solutions sont de la forme (À, 0, À) ce qui montre bien que H est un sous-espace vecto-
avec À E lit. Donc (1, 0, 1) est une base de L et riel de llt 3 .
dim L = 1.
Reprenons les questions dans le cas complexe. 16.5.
E n'est pas un sous-espace vectoriel de IC 3 . En effet,
1. Il est clair que toute combinaison linéaire de ma-
E contient les vecteurs (1, i, 0) et (1, -i, 0) mais il
trices de C est encore une matrice de C, C est donc
ne contient pas leur somme (2, 0, 0). Pour F, G et H
bien un sous-espace vectoriel. Sa dimension est 2,
les réponses ci-dessus ainsi que leurs preuves restent
valables dans le cas complexe.
une base en est par exemple Ili , J = ( ?-,} ).
2. Il est évident que l'application

Chapitre 16
est injective et que son image est C. Il ne reste qu'à

( 2
7
1
1
4
- 1 1
4
2
5

11
1
2

6
1
-1
4
9
lJ-1
16.1. Appliquons la méthode du pivot de Gauss
sous sa forme matricielle (A, y) :

1
<--+
<-----
J-2 i-7
+
<--------- +
montrer que f est un morphisme d'anneaux. Évi-
demment, l'image du nombre complexe 1 est la ma-
trice identité. Pour la multiplication, on a

f((a+ib)(a' +ib')) = f(aa' - bb' + i(ab' + a'b))


_ (aa' - bb' -ab'+ a'b)
- ab' + a'b aa' - bb'
1 2 = (ab -b)
a
(a'b' -b')
a' ·
3 3
-3-3-1
La compatibilité de l'addition est évidente.
-3-3-1
3. La matrice ( c?s"
Slll
sin") est l'image par f du
- COS

-;,l
0(. (X

nombre complexe exp(ioc), d'où


2
3 3 1

(l 0
0
0
0
0
0 = (cos(koc) - sin(koc))
sin(koc) cos(koc) ·
16.2. Pour tout m o, ... ,n - 1, ap-
pelons la m-ième diagonale supérieure d'une
16.6.
matrice (bekl E An(OC) le n - m-uplet
(b1 ,l+m, b2,2+m, ... , bn-m,nl- La puissance Am 1. D'abord, nous notons que l'élément nul et l'élé-
est alors la matrice n x n dont la m-ième diagonale ment unité sont dans le centre. Soient b, b' E Z(A).
Alors
supérieure ne contient que des 1 et est nulle ailleurs.
En particulier, Am = 0 pour tout m;?: n. a. on ab - b' E Z(A) car, pour tout a E A,

16.3. On note Ck les vecteurs colonnes de la (b-b')a = ba-b'a =ab-ab'= a(b-b');


matrice A. Supposons par l'absurde que le sys-
tème possède une solution, c'est-à-dire qu'il existe
b. on a bb' E Z(A) car, pour tout a E A,
x1, ... , Xn E IR tels que b = L;=l XkCk. Par hypo-
thèse, tckb = 0 pour tout k = 1, ... , n. Donc
(bb')a = b(b'a) = b(ab') = (ba)b'
= (ab)b' = a(bb').

Ainsi, Z(A) est un sous-anneau de A. Sa commuta-


tivité est triviale.
D'autre part, tbb = L;=l b{ f Ocar au moins l'un On a Z(A) = A si et seulement si A est un anneau
des bk est non nul, contradiction. commutatif.

16.4. 2. D'abord il est évident que les matrices homo-


thétiques sont dans le centre. Réciproquement soit
1000)
0100 (0000)
0000 B = (bik) E Z(An(OC)). En particulier, B commute
0000 et 0010 · avec les matrices de la base canonique, c'est-à-dire
( 0000 pour tout (k, i) E {l, ... , n}2 , on a
0001
ou encore j = 1 , ... , n. Par conséquence

lx1I < n~l Lk,'l lxkl


0 0 0
lxzl < n~l Lk,.z lxkl (1.2)
0 0 0
{
k-+ b11
0
b12
0
bin
0 lxnl ~ n~l Lk,'n lxkl-
En prenant la somme de ces inégalités, on arrive à
0 0 0
une inégalité contradictoire.
2. Si au moins une des inégalités lakkl ), n - 1,
! est stricte, alors dans le système (1.2) au moins une
l des inégalités reste stricte, ce qui permet toujours

l}
0 b1k 0
0 b2k 0 de conclûre lorsqu'on prend leur somme.

(l 0 b1k 0
3. La matrice n(Iln +A) est à diagonale dominante
au sens de la première question.

Donc, b 1i = 0 dès que j # t. Ainsi, B est une ma- 16.8. Le tableau de composition est
trice diagonale. En plus, en comparant les coeffi-
cients d'indice (k, !) de ces deux matrices, on trouve
bu = bkk. Ainsi, tous les coefficients diagonaux de Il e I a I b I c I d I f 1
B sont identiques, d'où e e a b C d f
a a e d f b C
b b f e d C a
C C d f e a b
d d C a b f e
16.7.
f f b C a e d
1. Supposons par l'absurde que A n'est pas inver-
sible. Donc il existe une relation de dépendance li-
Nous notons que dans chaque ligne figure l'élé-
néaire entre les colonnes Ci de A, c'est-à-dire on a
ment neutre e = Il2, ce qui montre que chacune
x = (x1, ... , Cn) E icn non nul tel que LJ=l xi Ci=
des matrices est inversible et que son inverse est
O. On a donc le système
l'une parmi ces mêmes six matrices à coefficients en-
U11X1 + a12x2 + ... + a1nXn = 0 tiers, donc les six matrices sont bien dans le groupe
a21X1 + a22x2 + ... + UznXn = 0 Gl(2, Z) et forment un sous-groupe.
Notons les six permutations dans 63 comme suit
{
+ Un2X2 + ... + UnnXn ~ (123) (123)
Un]Xl
213 b' = (123)
Û.

On isole suivant la diagonale et on utilise l'inégalité


e
/= 1 23 132
a
/=

triangulaire et le fait que les éléments en dehors de


C
/ = (123) d' = (123) f
321 31 (123)
31 2 . 2
i=

la diagonale sont majorés par 1.

lx11 ,,,; ~ Lk,'l lxkl Si on fait leur tableau de composition, alors on


trouve la même chose. Il s'agit donc de groupes iso-
lxzl ,,,; îau1 Lk,'2 lxkl morphes.

{ 16.9. On observe l'égalité polynômiale


lxnl ,,,; ln!nl Lk,'n lxkl•

Maintenant on remarque que Lk,'i lxkl # 0 pour


tout j = 1, ... , n. En effet, si Lk,'i lxkl était nul Si k est assez grand pour que A k+ 1 = 0, alors en
alors Xj serait la seule composante non-nulle dans remplaçant l'indéterminée X par A, on trouve
x. Ainsi la relation de dépendance linéaire serait
Xj Ci = 0, c'est-à-dire la j-ème colonne Ci de A est
nulle, contradiction à Ujj > n - 1 .
Donc l'inégalité ln:; 1 < n~ 1 implique l'inégalité
d'où l'inversibilité de lin - A.
stricte la:;I Lk,'j lxkl < n~l Lk,'j lxkl pour tout
Chapitre 17 o G est non vide car il contient la suite nulle ;
d'après le cours d'analyse, toute combinaison li-
1 7 .1. D'abord, constatons que si u, v E IR~, À E IR, néaire de suites dominées par n 2 est dominée par
alors n 2 : G est donc un sous-espace vectoriel de E.
uEBv=uv>0 et À[:Ju=u/\ =e/\In(u) >0, o H n'est pas un sous-espace vectoriel, il ne contient
donc les lois internes et externes sont bien à valeurs pas la suite nulle.
dans IR~. Vérifions les huit règles de la définition
17.1. o l n'est pas un espace vectoriel car il n'est pas
o Commutativité : u EB v = uv = vu = v EB u. stable par l'addition. En effet, les suites
o Associativité: uEB (vEBw) = u(vw) = (uv)w =
(uEBv) EBw.
o Le vecteur nul est le nombre 1 E IR~.
o Le vecteur opposé de u E IR~ est u - 1. appartiennent à l mais pas leur somme.
◊] [:JU=u1 =U.
o À[:](µ[:] u) =À[:] uµ = (uµ? = uµ/\ = u/\µ =
(;\µ) [:] u.
o (À + µ) [:] u = uHµ = u/\uµ
Chapitre 18
u/\ EB uµ
À8uEBµ8u.
o À[:] (u EB v) = (uv)/\ = u/\v/\
18.1. (====}) est trivial.
u/\ EB v/\
À[:]UfBÀ[:JV. ( ~ ) Pour tout vecteur v non nul, il existe Àv E lK
tel que f(v) = ÀvV. Prouvons que le scalaire Àv est
REMARQUE - Il n'y rien de mystérieux avec cet
indépendant de v. Soient u, v deux vecteurs non nuls
espace vectoriel. En effet, il n'est qu'une réécriture de E.
de l'espace vectoriel canonique IR ; on a « trans-
o Cas 1 : (u, v) est libre.
porté » la structure de l'espace vectoriel IR sur l'en-
semble IR* par la bijection exp : IR ----l IR~ . (Voir En particulier, u + v fc O. On a donc
aussi l'exercice 9.2.)

17.2. mais on a aussi


1. L'ensemble F est un sous-espace vectoriel car il

::::l:~:::'(ï13r:.:::::':,::
sous-espace vectoriel car c'est le noyau de l'applica-
Ainsi, ÀuU + ÀvV = Àu+vU + Àu+vV, et puisque la
famille est libre, Àu = Àu+v = Àv-
◊ Cas 2 : (u, v) est liée.
tion linéaire de IR 3 dans IR donnée par (x, -y, z) H
X+ 2-y. Puisque u fc 0 et v fc 0, il existe donc µ E lK*
tel que v = µu. On a f(v) = ÀvV = µÀvU, mais
2. Un vecteur appartient à F n G si et seulement
aussi f(v) = f(µu) = µÀuU- Ainsi, Àu = Àv puisque
s'il est de la forme
µ#O.
(À - 3µ, 2;\ + 3µ, À) avec À - 3µ + 2(2;\ + 3µ)
Conclusion : en notant À la valeur commune des Àv
et À,µ E IR. C'est-à-dire si et seulement si il est de pour v non nul, on a pour tout v non nul, f(v) = Àv.
la forme Puisque f(0) = 0, cette égalité est valable sur E.
(6À, -3À, À) avec À E IR. 18.2.
Ainsi, F n Gest la droite JK.(6,-3, 1). 1. Notons n = dim E.
(====}) Si f est une homothétie, alors f = ÀÏdE- Clai-
17.3. o Fest un sous-espace vectoriel de E. En effet, rement pour toute base !Ji! de E, on a M.s,i(f) = Àlin.
F contient la suite nulle ; la stabilité par combinai- ( ~ ) Montrons d'abord que pour tout v E E les
son linéaire résulte de la linéarité de lim, vue en vecteurs v, f(v) sont liés. Supposons le contraire,
analyse - plus précisément, si (UnlnEN et (unlnEN c'est-à-dire qu'il existe v 1 E E non colinéaire avec
sont dans F et si À est dans lK, alors v2 = f(v1 ). On complète (v1, v2) en une base !Ji!=
(v1, v2, ... , Vn) de E. Alors l'élément d'indice (2, 1)
dans M.s,i(f) est 1. En revanche, si on prend la base
est égale à !Ji!' = (2v1, V2, ... , Vnl alors l'élément d'indice (2, 1)
dans M.s,i, (f) est 2. C'est en contradiction avec l'hy-
lim (Un -Un+1l +À lim (vn -Vn+l) = O. pothèse selon laquelle Mai (f) et M.s,i, (f) doivent
n-+oo n-+oo
coïncider. 1. PH XP.
On conclut avec l'exercice 18.1. 2. PHP 1 •
2. Une matrice A E Gl(n, IK) commute avec tous 18.5.
les éléments de Gl(n,IK) si et seulement si
1. E est de dimension infinie.
VC E Gl(n,JK), 2. 1jJ est bien définie car la fonction primitive
lj)(f) = g est bien une fonction continue. La véri-
Cela signifie que la classe de conjugaison de A ne fication de la linéarité est facile.
contient que A. Autrement dit, l'application linéaire 3. o Soit f E Ker lj). On a alors
définie par A possède la mème représentation ma-
tricielle dans toutes les bases. D'après la question 1.
cela revient à dire que A est une matrice homothé-
Vx E lll+, I tf(t)dt = O.

tique, A = Àlln, d'où La fonction t H tf(t) étant continue sur lll+, l'ap-
plication
Z(Gl(n,IK)) ={Àlln I À E IK*}.

On constate donc que le centre de l'algèbre des ma-


X HI tf(t)dt

trices carrées est le même que le centre du groupe est dérivable sur lll+ de dérivée
des matrices inversibles. x H xf(x).

18.3. Ainsi,
2 Vx E lll+ , xf(x) = O.
1. Puisque f = 0 est équivalent à lm (f) C Ker (f),
on a dim(lm(f)) :( dim(Ker(f)). De plus, lm(f) f- En particulier, Vx > 0, f(x) = 0 puis f(0) = 0 par
Ker (f) car sinon, en appliquant le théorème du rang, continuité de f en zéro. Le noyau de 1jJ est donc ré-
on obtiendrait la contradiction 2 dim(lm (f)) = 3. duit à 0 et 1jJ est injective.
Ainsi, dim(lm (f)) < dim(Ker (f)). Puisque f est non
o L'application 1jJ n'est pas surjective puisque
nulle,
Vf E E, lj)(f)(0) =0
1 :( dim(lm (f)) et dim(Ker (f)) :( 2.
et qu'il existe des fonctions g E E telles que g(0) f- 0
Ainsi, rg (f) = 1. Un exemple est l'endomorphism e (comme g = cos ou g = 1).
de lll3 associé à la matrice
4. Soient À E lll et f E Ker (lj) -Ài.dE).
01 0) o Cas 1 : À= O.
(00 00 00 On a montré à la question précédente que Ker 1jJ =
2
o.
2. Puisque f 3 = 0 équivaut à lm (f) c Ker (f ), on
2
a dim(lm (f)) :( dim(Ker (f )). o Cas 2 : À f- O.

o De plus, f 2 f- 0 (donc a fortiori f f- 0) ; ainsi Pour tout x positif,

2
1 :( dim(Im(f)) et dim(Ker(f )) :( 2. I tf(t)dt - M(x) = 0,

On a donc rg (f) = 1 ou 2. d'où


Vx ER+ , f(x) = -1 IX tf(t)dt.
Montrons que le cas rg (f) = 1 ne peut avoir lieu. À 0
Supposons par l'absurde que rg (f) = 1. Comme La fonction f est donc dérivable et
f 2 f- 0 on a dim(Im(f2)) ;, 1. D'autre part
2
lm (f 2 ) C lm (f) et par conséquence lm (f ) Vx E lll+ , xf(x) - M'(x) = O.
lm(f). Ainsi, f 2 (E) = f(E) et donc De plus,
3 2
f (E) = f(f (E)) = f 2 (E) = f(E), f(0) = ~ I: tf(t)dt = O.
ce qui est absurde car f 3 (E) = {0}. Ainsi, rg (f) = 2. La fonction f est alors solution du problème de Cau-
Un exemple est l'endomorphism e de lll 3 associé à la chy
1
1J - ~X1J = 0, 1J(0) = o.
1
matrice
010)
( 0 0 1
0 0 0
. D'après les théorèmes sur les équations différen-
tielles linéaires, nous savons que ce problème pos-
sède une solution unique, et par conséquence f = O.
18.4. Ainsi, Ker (lj) - Ài.dE) = {0}.
18.6. et par l'opération élémentaire sur les lignes l 2 f-
1. Non, car E\F ne contient pas le vecteur nul. l2 - l1,
x-11+ z-t= 0
2. Soient x E F et 11 E E\F. Le vecteur x + 11 ap-
-2z+t= 0
partient à Fou E\F : supposons que x + 11 E F, on {
a alors 11 = (x + 11) - x E F car F est stable par com-
11 + t = O.
binaison linéaire, ce qui est absurde puisque 11 i F. Ainsi,
Ainsi, x + 11 E E\F. x = -z , 11 = -2z , t = 2z

3. Supposons que F cJ E. Il existe alors 11 E E\F.


et
Pour tout x E F, d'après la question précédente, F n G = {(-z,-2z,z,2z ) 1 z E IR},
x+11 E E\F et donc x = x+11-11 E vect (E\F). On soit en posant w = (-1, -2, 1,2),
a donc F c vect (E\F). Puisque E\F C vect (E\F),
on a E = vect {E\F).
F n G =vect(w).

F n G est donc de dimension 1 et de base (w).


18.7.
18.8. Soient a, 13 et y E lR tels que
1. On a F = { (x, 11, z, x - 11 + z) 1 x, 11, z E lR } ,
ainsi F = vect(u1,U2,u3 ) où u1 = (1,0,0, 1), Vx > 0, aex + l3x 2 +yln(x) = O.
u2 = (0, 1,0,-1) et u3 = (0,0, 1, 1). Cette famille
1. Si on remplace x = 1, e, y'e, on est amené à un
étant libre, F est un sous-espace vectoriel de IR4 de
système linéaire homogène dont la matrice est
dimension 3.

o a E F donc il existe un unique triplet ( a, 13, y) de


A= ( e~ ~2 ~).
réels tel que
eft e ½
Supposons par l'absurde que rg A cJ 3. Notons
l1, lz, l3 les lignes de A. On voit que l2 et l 3 ne
ce qui est équivalent au système suivant, sont pas colinéaires (car e 2 x ½- ex 1 cJ 0).
Donc il existe À,µ E lR tels que l1 = ,\lz + µl3.
a =3 On voit sur la dernière coordonnée que µ = -2,\.
13 =1 On a donc e = ,\(ee - 2eft) et 1 = ,\(e 2 - 2e). En
y=2 multipliant la dernière équation par e, on obtient
{ a- 13 +y =4.
ee -2eye = e 3 -2e 2 .
Les coordonnées de a dans la base (u1, Uz, u3) sont Avec la calculatrice, on vérifie que cette égalité est
donc (3, 1,2). fausse.
2. On a G = {(x,11,x -11,-11) 1 x,11 E IR}, 2. Cette méthode est plus élégante, car elle ne fait
ainsi F = vect(v1,V2) où v1 = {l,0,1,0) et pas appel à la calculatrice qui, après tout, pourrait
v2 = (0, 1,-1,-1). Cette famille étant libre, G faire des erreurs d'arrondi.
est un sous-espace vectoriel de JR 4 de dimension 2. On a pour tout x strictement positif,

o b E F donc il existe un unique couple ( a, 13) de


a + 13 x 2 e - x +y ln( x) e - x = 0,
réels tel que et faisant tendre x vers+ oo, d'après les croissances
a= av1 + 13v2, comparées, a = 0. On a pour tout x strictement
positif,
ce qui est équivalent au système suivant, ,,_ + ln(x) _
" ' Y ~ -0,
a = 4 et faisant tendre x vers+ oo, d'après les croissances
13= 1 comparées, 13 = 0. On a alors y = 0 car la fonction
{ a- 13 = 3 logarithme est non nulle.
-13=-1.
18.9. ( ==}) Supposons la famille !'lJ
Les coordonnées de b dans la base (v1, v2) sont donc {v1, ... , Vn) libre. Alors !'lJ est une base de F
(4, 1). vect {v1, ... , Vnl- L'endomorphis me f: F ---t F donné
3. Un vecteur (x, 11, z, t) appartient à F n G si et par la matrice n x n
seulement si
11 ... 1)
x-11+z-t= 0 1 ... 1
M.'lll(f)=
x-11-z = 0
{ (
11 + t = o. 1
envoie vk sur uk pour tout 1 ( k ( n. La matrice (uq,[kJlkEN, est linéaire. Elle est bijective car
étant inversible (triangulaire avec éléments diago- (uk)kEN H (uq,-1 (k) lkEZ est son inverse. On a alors
naux tous non nuls), on sait que f est un isomor-
phisme, donc il envoie toute base de F sur une base
de F, d'où la liberté de (u1, ... , Un)-
({,=) Supposons la famille &6' = (u1, ... , Un)
libre. Alors 36 1 est une base de F'
vect (u 1 , ... , Un). Remarquons qu'on peut exprimer
les vk en fonction des Uk comme suit o Les isomorphismes ci-dessus induisent des isomor-
phismes IC(Zl '.:::'. IC(Nl '.:::'. IC[X]. Enfin, en associant à
1 ,c;; k ,c;; n, tout polynôme complexe sa partie réelle et sa partie
imaginaire, on voit que IC[X] est isomorphe à JE.[X] 2 ,
où on a posé u 0 = O. Maintenant, on considère l'en- d'où
domorphisme f' : F' --l F' donné par la matrice
nxn

o L'application

(qui est d'ailleurs l'inverse de la matrice M81J(f) en '6'(IR) --l '6'd (IR), g H (x H [ g(t)dt),
haut) et on fait le même raisonnement que dans
la preuve ci-dessus : f' est un isomorphisme qui
envoie la famille libre (u1, ... , Un) sur la famille est linéaire. Elle est bijective car la dérivation f H f'
(v1, ... , Vn) qui est donc libre. est son inverse. Ainsi,

18.10. Soit (Àt)tEJR une famille quasi nulle telle que

Supposons par l'absurde qu'il existe r E JE. tel que o L'application


ÀT -/= O. Alors on a

'6' 1 (JE.) --l CCd (IR) X IR, 9 H (g - g(OJ, g(O)),

On remarque que la fonction ft est dérivable en tout est linéaire. Elle est bijective car (f, c) H f + c est
point de JE. sauf en t. Ainsi, la somme ci-dessus son inverse. Donc
donne une fonction dérivable en r, ce qui est en
contradictoire car f T n'y est pas dérivable.
18.11. o Pour des raisons de dimension, on a
ccd (IR) x JE. CC:'. cc 1 (IR).

o Soit 1j, : JE. --l] - 1, 1 [ une bijection (par exemple REMARQUE - On vient de montrer que parmi
x H -#; arctan x). les 17 espaces vectoriels proposés, le nombre de
Il est clair que l'application IC1- 1•11 --l IC1\ f H folj,, classes d'isomorphie est au plus 6. On n'a pas dé-
est linéaire. Elle est bijective car f H f olj,- 1 est son montré que ce nombre est égal à 6.
inverse. Donc
ICJ-1,11 CC:'. ICI!.
18.12. Non, en effet si c'était le cas, alors JE.'.:::'. QIN).
o Même idée : soit cp : l\l --l Z: une bijection
Or dans des exemples du chapitre sur la dénom-
(par exemple O H 0, 1 H 1, 2 H -1, 3 H 2,
brabilité nous avons vu que JE. est non-dénombrable
4H-2 ... ).
Il est clair que l'application IC" --l ICN, (uklkEZ H tandis que QIN) est dénombrable.
18.13. Ou encore
1. Un élément de JKixJ est une fonction f: I x J -l
E. En posant cp(j)(i) = f(i, il, (i, il E I x J, cela
définit pour tout j E J une fonction cp(j) : I -l E,
donc cp est un élément de (JK:1) 1. ce qui se ramène à la seule condition
Réciproquement, si tf, E (IK 1 ) 1, alors en posant
f(i, j) = 1),(j)(i), on obtient un élément f de JKixJ.
Cela définit une bijection naturelle entre 1K I x I et
(JKl)I.
Or t, et T] sont des variables muettes (on n'a pas
2. Si f: I x J -l E est à support fini, alors f(i, il = 0 fait de changement de coordonnées), donc on peut
pour tout (i,j) E I x J\{(i,,i,), ... ,(in,in)} avec les renommer par x et y. Ainsi l'équation de l'image
certains ik E I et ik E J. On pose I' = {i1, ... , in} c; de C par A 1 est
et J' = {i,, ... ,in}- Alors {(i1 ,i,l, ... , (in,in)} C
l' x J'. Donc cp(j)(i) = f(i,i) = 0 pour tout i E I\I' c; : x2 +411 2 =4.
et cp(j) est la fonction nulle sur I pour tout j E J\J'.
Réciproquement, soit 1), E (JK( 11J(I)_ Alors, 1),(j) est De même, en remplaçant dans l'équation carté-
la fonction nulle sur I pour tout j E J\{i,, ... , in} sienne de D, on obtient
avec certains Îk E J. De plus, on a 1),(jk)(i) = 0
pour tout i E I\I(, où I( est un sous-ensemble fini
o; : x+2v13-y =4.
de I, k = 1, ... , n. Donc f(i, il = 1),(j)(i) = 0 pour
tout (i,j) E (I x J)\((LJ;~, I{) x J').
1
18.14. 1

1. Une équation cartésienne de D est x + y13y =2. -


1
1
Une écriture paramétrique est 1
1

1
1
► Images par Az : On trouve par la même méthode

et D~: v13x-y =2.

REMARQUE - Il s'agit d'une rotation d'angle -:r.

2. f(D) = ½ f(l,v13) + lR f(v13,-1). Donc, si


f(v13,-1) = 0, alors f(D) consiste du point unique
P' = ff(l,v13). Dans le cas contraire f(D) est la
droite parallèle à vect (f( v13, -1)) et passant par a.
3. D'abord une remarque générale : Si S est
un sous-ensemble de JR 2 défini par une équation
'l'( x, y) = 0 et si A est un automotphisme de JR2 ► Images par A3: On a A31 = (6 11 ) donc
alors l'ensemble image A(S) est défini par l'équa-
tion C3 : (x-11) 2 +11 2 =1 et D 3 : x-y+v'3y=2.

ou encore
c'est-à-dire on remplace dans l'équation 'l'(x, -y) = 0
les varibales (x,y) par A- 1 (x,y). On le comprend
mieux dans la pratique :
► Images par A 1 •
L'équation 'l'( x, -y) = 0 du cercle C est donnée par la
fonction 'l'(x, y)= x 2 +y 2 - 1. Un point (t,, T]) de JR 2
est dans A 1 ( C) si et seulement s'il existe (x, y) E JR 2
tel que
► Images par A 4 : On a REMARQUE - A une homothétie près, il s'agit de
la projection orthogonale sur la droite IR( 1, 1) .
A-l=(co~'t sinÏ)=~(v'3 1 ).
4 cos6
-sm 6 2 ~1 v3

On trouve

et D~ : y= 1.

REMARQUE - Il s'agit d'une rotation d'angle -li.

Chapitr e 19
19.1.
1. Puisque Im(f + g) = {f + gl(E) C f(E) + g(E),
on a
► Images par As : Ici on n'a pas affaire avec un
2
automorphisme . En effet As envoye tout IR sur la rg (f + g) :(; dim{Im (f) + Im (g))
droite d'équation y - x = O. D'après la question 2., :(; dim(Im (f)) + dim(Im {g))
D~ = {P~(2,2)}. = rg {f) + rg {g) .
q consiste de tous les points de la forme {x +
v'3y, x + v'3y) avec x 2 + y 2 = 1. Autrement dit, ce En appliquant l'inégalité précédente à f + g et -g,
sont tous les points de la forme (x+ J3(1 -x2 ), x+ on obtient
J3(1 -x2 )) ou (x - J3(1 -x2 ), x - J3(1 - x 2 ))
rg (f) = rg {f + g - g) :(; rg {f + g) + rg {g),
avec -1 :(; x :(; 1. Par un petit calcul d'extrema
on trouve que C~ consiste de tous les points de la c'est-à-dire rg (f) -rg (g) :(; rg (f + g). Les endomor-
forme (t, t) avec \t\ :(; 2. phismes u et v jouant des rôles symétriques, on a
aussi rg (g) - rg {f) :(; rg (f + g) et donc
On trouve
1rg (f) - rg {g)I :(; rg (f + g).
{x-y=O , {x=2
C' \xi:(; 2 et Ds : y= 2 .
s : 2. D'abord nous remarquons qu'on a l'égalité
rg (f + g) = rg f + rg g si et seulement si les deux
REMARQUE - A une homothétie près, il s'agit de inégalités de la question 1. sont en fait des égalités,
la projection sur la droite IR (1, 1) parallèlement à la autrement dit, si et seulement si
droite IR( v'3, -1) , donc parallèlement à la tangente
Im (f + g) = lm {f) EEi Im (g).
T.
o Supposons que rg (f + g) = rg (f) + rg (g). Nous
devons prouver que Ker (f) + Ker (g) = E.
D'abord nous constatons que

Ker (f + g) = Ker (f) n Ker(g),

puisque six E Ker ( f + g),

f(x) = g(-x) E Im(f) nim(g) ={0},

l'autre inclusion étant banale. Ainsi

dim(Ker (f) + Ker ( g))


► Images par AG : Comme ci-dessus, AG envoye tout = dimKer (f)+dimKer (g)-dim(Ker (f) n Ker (g))
IR 2 sur la droite d'équation y - x = O. D'après la = dimKer (f) + dimKer {g) - dimKer {f + g)
question 2., l'image de D est cette droite toute en-
= dirnKer (f) + dirnKer (g) + rg (f + g) -n
tière. On trouve
= dirnKer ( f) + dirnKer (g) + rg (f) + rg (g) - n
, {x-y=0 et x-y=0. =n+n-n=n .
cG : 2lxl ,:; v'l
Cela prouve que Ker (f) + Ker (g) = E. 2. Il est clair que les vecteurs b1, b2 sont contenus
dans F et qu'ils sont linéairement indépendants. Ils
o Supposons
constituent alors une base de l'hyperplan F.
lm (f) n lm (g) = {O} et Ker (f) + Ker (g) = E. 3. Les équations qui définissent G sont invariantes
sous permutation de coordonnées. Donc G est inva-
Nous devons montrer que
riant sous 6 3 .
rg (f + g) = rg (f) + rg (g). 4. Fest invariant sous 6 3 car l'équation qui définit
F est invariante sous permutation de coordonnées.
Comme en haut le fait que lm (f) n lm (g) = {O}
Il est évident que les sous-espaces triviaux O et IR3
implique
sont invariants.
Ker (f + g) = Ker (f) n Ker (g). Soit H c IR 3 un sous-espace invariant sous 63. Si
H CG, alors H = 0 ou H = G car Gest une droite.
On a alors Si H <t. G, alors il existe x = (x1, x2, X3) E H\G. On
a x1 # x2 ou X2 # x3. Comme H est invariant sous
rg(f + g) permutation des coordonnées, nous pouvons suppo-
= dim(E)-dimKer(f + g) ser, en gardant toute généralité, que x 1 # x2. Le
= dim(E) - dimKer (f) n Ker (g) vecteur x' = (xz, x 1 , X3) est également dans H. La
stabilité par combinaison linéaire implique
= dim(E) + dim(Ker (f) + Ker (g))
-dimKer(f)-dimKer(g) x-x'
= dim(E) + dim(E) - b1 =(1,-1,0)=-- EH.
dimKer (f) - dimKer (g) XJ -Xz
=rg(f)+rg(g).
Or, si b1 est dans H, alors par permutation de co-
ordonnées, b2 l'est aussi, ce qui montre que F C H.
19.2. Donc, pour des questions de dimension, H = F ou
1. Comme G1 # G2, on a !K2 = G1 œGz. Soit b3 un H = IR3.
vecteur non nul sur la droite G3 . Alors il existe une
unique décomposition b3 = b1 + b2 où b1 E G1 et 5. Nous faisons la preuve seulement pour la permu-
b2 E Gz. Le vecteur b1 est non nul (car G2 # G3), tation cr = (} f ~) (pour les autres permutations, le
et de même bz est non nul (car G1 # G3). Pour tout calcul est similaire).
j = 1, 2, 3, le vecteur bj est une base de la droite Gi .
= ô'(e1 - e2) = ecr(l J -
1,
De même, il existe des vecteurs b j = 1, 2, 3, tels
que b est une base de G et tels que b~ = b; + b 2.
ô'(b1)
= ez -e1 = -b1
ecr(2)
1 1
Il suffit alors de définir l'automorphisme f par
f(b1) = b; et f(b2) = b 2. Par linéarité, on a et
f(b3) = f(b1 + b2) = f(bi) +f(b2) = b; + b 2 = b~.
On déduit f(Gi) = G pour j = 1,2,3.
1 ô'(bz) = ô'(ez - e3) = ecr(Zl - ecr(3)
2. Soient f et g deux automorphismes tels que = e1 - e3 = b1 + b2,
f(Gj) =Giet g(Gj) = Gi
pour j = 1,2,3. Comme
ci-dessus, on choisit trois vecteurs non nuls bj E Gi
tels que b3 = b1 + bz. ainsi
Les vecteurs f(b3) et g(b3) sont non-nuls et coli-
néaires (car ils sont dans G~)- Donc il existe li E !K* - = (-11)
M&j(cr) 0 1 .
tel que g(b3) = M(b3). On a donc
On retrouve bien la matrice de l'exercice 16.8.
g(b1) + g(b2) = g(b1 + b2) = g(b3) = M(b3)
= M(b1 + b2) = M(b1) + M(bz). 19.4.
Par unicité de la décomposition dans la somme di- 1. C'est évident car f envoie une base de F sur une
recte G; œ G2, on trouve base de C.
et g(bz) = M(b2). 2. On sait déjà que z12 = 1 et z23 = ½(-1 + i\/'3).
De plus,
Donc g et M coïncident sur la base (b1, b2) de JK2 ,
d'où l'identité g = M.

19.3.
1. Fest un hyperplan; le vecteur (1, 1, 1) n'est pas Les trois autres points sont leurs opposés, car on a
dans F et engendre G et. Donc IR3 = F œ G. Zkl = -z1k. Il s'agit des 6-èmes racines d'unité.
D'autre part, on sait que la dimension de E* =
.Z(E, IK) est n, donc {<p1, ... , (f)n) est une base de
E*. Deux espaces vectoriels de même dimension finie
sont isomorphes.
2. Dans JKn, il y a la base canonique e1, ... , en. No-
z12 tons {<p1, ... , (f)n) les coordonnées canoniques. Alors
ek H (f)k définit un isomorphisme canonique de E
sur E*.
Sous cet isomorphisme canonique, le vecteur
( a 1, ... , Un) E IKn correspond à la forme linéaire
(x1, ... , Xn) H a1x1 + · · · + UnXn.

19.7.
3. Nous ne faisons la preuve que pour CY12 (pour les
1. Linéarité :
deux autres transpositions 0"23 et 0"13, c'est pareil).
D'une part, de la preuve de l'exercice précédent, x(u + Àv)(f) = f(u + Àv) = f(u) + M(v)
nous connaissons déjà la matrice de ô'1z. Avec la
base d = {z12,Z23) dans IC, nous trouvons
= x(u) + 7'x(v).
Supposons par l'absurde que X n'est pas injective.
M,1(ô'1kl = M,1(f O O!k O f- 1i
Alors il existe v E E non nul tel que x(v) = O. Donc
= M,1,qJ(f)M,qJ(01k)M,qJ,1(f- 1) pour tout f E E*, on a f(v) = O. On complète v en
_ (1 0) (-1 1)
-01 01
(1010) = (-101·
1)
une base E. Dans le système de coordonnées asso-
cié à cette base, la fonction qui correspond à v est
une forme linéaire sur E qui prend la valeur 1 sur v.
D'autre part, la droite perpendiculaire à lRz12 est C'est une contradiction.
l'axe imaginaire. La réflexion par rapport à l'axe 2. Si dim E = n < oc, alors d'après l'exercice précé-
imaginaire envoie la base d = (z12,Z23) sur dent, l'espace E, le dual E* et le bidual E** ont tous
(z21,z13) = (-z12,z12 + z23). Donc dans la base la même dimension finie. Donc le morphisme injec-
d, cette réflexion a la représentation matricielle tif de la question précédente est un isomorphisme.
("01 l), ce qui prouve qu'elle est bien l'automor- Comme il ne dépend d'aucun choix, il s'agit d'un iso-
phisme ô'ik• morphisme canonique; on peut donc identifier l'es-
Les six éléments du groupe symétrique 63 s'iden- pace avec son bidual.
tifient à des transformations de l'hexagone régulier
de sommets z12,z13, z23,z21, Z31,Z32 en lui-même. 19.8. La vérification de A 2 = A est facile. Donc
Les transpositions CY12, 0"23, 0"13 correspondent aux l'endomorphisme A : IKn --l IKn, x H Ax, est une
reflexions par rapport aux trois axes de symétrie de projection. Son rang est 1. Ainsi, A est semblable à
l'hexagone qui passent au milieu des arêtes. Elles la matrice
engendrent le groupe 63; les trois éléments de 63
qui ne sont pas des transpositions correspondent aux
trois rotations d'angles respectives 0, 23" et ~.

19.5. Soit f : E --l lK une forme linéaire non nulle


et soit u E E un vecteur tel que f(u) i= O. Posons Pour chercher une matrice de passage C, nous déter-
minons le noyau G et l'image F de l'endomorphisme
v =fi:). Alors f(v) = 1. On a E = lKvEBKer (f). On
A. On voit immédiatement que b1 = (1, 1, ... , 1) est
choisit une base de l'hyperplan Ker (f). Son union
une base de F et que les vecteurs bk = ek-1 - ek ,
avec v est alors une base de E. Dans le système de k = 2, ... , n, forment une base de G. Dans la base
coordonnées associée à cette base, la fonction coor- (b1, ... , bnl de IKn, l'endomorphisme A a pour ma-
donnée (f)v vérifie (f)v(v) = 1 et (f)v(w) = 0 pour tout trice la forme diagonale B ci-dessus. La matrice de
w E Ker (f). Cela prouve que f = (f)v• passage est donc
19.6. 1 1 0 0
1. Choisissons une base (b1, ... , bn) de E et notons 1-1
{<p1, ... , (f)n) le système de coordonnées associé. Les
formes linéaires <p1, ... , (f)n sont libres dans E*. En 0 -1
C=
effet, si À1<p1 + ··· +Àn(f)n = 0, alors pour tout 0 0 0
k= 1, ... ,non a
1
0 0 ...... -1
On peut aussi vérifier AC= CB. 20.4.
19.9. 1. On distingue deux cas.
Si rg A < n, alors <let A = 0 mais aussi <let M = 0
1. Il suffit de montrer que q est idempotent,
car les premières n lignes de M sont liées.
q 2 = (idE - p )2 = idE - 2p + p 2 Si rg A = n, alors on peut utiliser les premières n
lignes de M pour « nettoyer »en dessous de A: pour
= idE - 2p + p = idE - p = q.
cela on utilise seulement des opérations élémentaires
2. q Op = (idE - p) 0 p = p - p 2 = p - p = o. sur les lignes de type « ajout d'une combinaison li-
L'égalité p o q = 0 résulte par symétrie. néaire», c'est-à-dire les opérations élémentaires qui
ne changent pas le déterminant. Donc
3. v E Ker q {=} q(v) = 0 {=} p(v) = v. Donc
le noyau de q est l'espace des vecteurs invariants de
p. Par définition de la projection p, c'est l'image de
p. L'égalité lm q = Ker p résulte par symétrie.
On peut décomposer en produit
4. C'est vrai car q est une projection.

19.10.
1. Puisqu'en dimension 1, le seul hyperplan est l'es-
pace nul, on a n ;) 2. Il est facile de voir que ces deux facteurs ont pour
2. Puisque les deux hyperplans sont distincts, il déterminants précisément <let A resp. <let D. On
existe u E H1 \ H2. On a donc conclut alors en appliquant la formule du détermi-
nant d'un produit.
E = H2 EB lKu C H2 + H1 CE, Généralisation : on considère des matrices en blocs
de la forme
ainsi E = H1 + H 2 et d'après la formule des dimen-
sions,

dim(H 1 n H2) =n-1 +n-1 -n =n-2.

Chapitre 20 où les Bj sont des blocs carrés et où les étoiles sont


des blocs de tailles adaptées. On pourra appeller une
telle matrice triangulaire inférieure en blocs. Par ré-
20.1. On peut transformer A en la matrice identité currence, on montre alors que
Iln en faisant une réflexion par rapport à l'axe hori-
zontal passant par le milieu de la matrice. La permu- <let A = det B1 · · · det Bv .
tation des lignes correspondante est laissée au lec-
Par transposition, on trouve un résultat analogue
teur. Ainsi <let A = (-1) k où n = 2k ou n = 2k + 1. pour une matrice triangulaire inférieure en blocs.
2. Par permutation de lignes, on ramène la matrice
20.2.
(~ID) à la matrice M : pour cela, chacune des
1. ( <let f) 2 = <let (f 2) = <let idE = 1 .
dernières n lignes « traverse »les m lignes de ( C, D).
2. On sait que la symétrie f possède une représen-
Au total, nm transpositions d'éléments voisins sont
tation matricielle qui est diagonale et n· a que des
donc nécessaires, d'où
1 ou -1 sur la diagonale. Le nombre des -1 est la
dimension de l'espace Ker (idE +f) des vecteurs que
f tranforme en leurs opposés. det (f-) = (-l)nm det ( ~ )

20.3. La matrice de f dans la base canonique de JR 3 = (-l)nm detAdetD.


est
3. Voici un contre-exemple :
11 1 )
21-1
( 13 1
101 0)
En développant par rapport à la première ligne, on M=(AIB)= 010-1
CD ( 101 0
trouve le déterminant 01 0 1
det(f) = (1 + 3) - (2 + 1) + (6-1) = 6 ;i O. La première ligne est égale à la troisième, donc
detM=0.
f est donc un automorphisme de JR 3 .
Mais detA detD - detB detC = 2.
20.5. 20.6.
1. La définition ne dépend pas du choix du vecteur
(Xj , 11 i). En effet, si on le remplace par un autre
1. Effectuons l'opération par blocs l 1 f-- l 1 + il2, 1
vecteur (x ,11f) tel que Gi = IK(x ,11f), alors on a
1
1,
forcément (x 11;J = À( Xj, 11i). Par linéarité du dé-
terminant, le coefficient À apparaît une fois au nu-
mérateur et une fois au dénominateur, donc se sim-
d et M =I A+iB-B+iAI
B A , plifie.
Les quatre déterminants sont tous non nuls car les
droites sont distinctes deux à deux. Ainsi, on ne di-
vise pas par zéro et le birapport est non nul.
2. Si on cherche la droite sous la forme G = IK(x, 11),
on est amené à résoudre l'équation
det M = B A _OiB 1.
A+iB X21I -112x = j3,
1 X11I -111x
où x1, 111, x2,1l2, j3 sont des constantes. Elle équi-
Ainsi, par blocs trigonaux, vaut à

det M = det(A + iB) det(A - iB). Du fait que les droites G1 et G2 sont distinctes,
on déduit qu'au moins un des coefficients 112 - 13111
ou x2 - j3x1 est non nul. Cela prouve que (1.3) est
l'équation d'une droite, à savoir la droite G cher-
2. Si n = 1, la formule est manifestement vraie. chée.
Considérons donc le cas n ~ 2. 3. Soient (G1,G2,G3,G4) et (G\,G~,G~,G;) deux
Si AB = BA, la formule est vraie car alors quadruplets de droites vectorielles distinctes dans
OC. 2 . Soient (xi, 11i) des vecteurs tels que Gi =
IK(Xj,1ljl-
2
(A+iB)(A-iB) = A 2 + B . (===}) Soit f un automorphisme de OC. 2 tel que
1
f(Gj) = G pour j = 1, ... ,4, et soit(~~),
ad- be # 0, la matrice de f dans la base naturelle.
Elle est fausse dans le cas général, comme le prouve 1,
On pose (x 11f) = f(xj, 11il = (axi + b1Ji, cxi +d11il-
le contre-exemple suivant : Alors

(1.4)
01-10)
A -B 10 0 0
M=(*)=
(
10 01 .
00 1 0 Ona

xi x~I = l(a b) (xi X3)I = la bl 1x1 X31,


l111 113 Cd 111 113 Cd 111 113
Le développement par rapport à la dernière colonne
et de même pour les quatre autres facteurs dans la
donne
fraction (1.4). Ainsi il y a simplification et on re-
trouve le birapport [G1, G2, G3, G4].
( {==) Notons ex le birapport commun des deux qua-
det M = -
01-11
1 0 0 = 1. druplets. D'après l'exercice 19.2, il existe un au-
tomorphisme f de OC.2 tel que f( Gi) = G pour 1
101
0
j = 1, 2, 3. Il reste à démontrer que f( G 4 ) = G;.
D'après la direction ( ===}) ci-dessus f préserve le
birapport, donc
D'autre part,
ex= [G1, G2, G3, G4] = [f(G1 ), f(G2), f(G3), f(G4)]
= [G\, G~, G~, f(G4)].
D'autre part,
ex= [G\, G~, G~, G~].
Selon la question 2., on déduit f(G 4 ) = G~.
20.7. En développant par trilinéarité ce déterminant, on
obtient 8 termes dont 6 sont nuls par le caractère
o Effectuons l'opération C1 f---- C1 + Cz + C3,
alterné du déterminant. On a

11 1 1 L',3 = IA, B, Cl+ 1B, C,AI,


L'.1 = (a+2) 1a 1 ,
1
11a Or, par antisymétrie,

1B, C, Al = IA, B, Cl,


ainsi
1 0 0 1
L'.1=(0+2) la-1 0 =(a+2)(a-1)2.
1 0 a-1 a b c
= 2 a 2 b 2 c2
1 1
L'.3 = ZIA, B, Cl
a3 b3 c3
o Effectuons l'opération C1 f---- C1 + C2 + C3, 1
= ZabcL'.2 = 2abc(c - b)(c - a)(b- a).
1a a 1 ◊ On remarque que les lignes du déterminant sont
L'.2=(x+2a) lxa,
1
1a X liées par la relation

On a donc L',4 = O.
1 0 0 1
L'.2=(2a+x) lx-a O =(2a+x)(x-a)2. o Posons
1
1 0 x-a

M=
(
abc)
cab et D=
11 1)
lj j2
( 1 j2 j
,
20.8. Notons Ck, 1 ~ k ~
3 les colonnes du déter- b c a
minant. Puisque pour tout x E JR,
où j c/= 1 est une troisième racine de l'unité. On a
cos(x) + cos(x + 2k) = 2cos(k) cos(x + k),
a j3 y )
les colonnes du déterminant sont liées par la relation MD= a jj3 j2y ,
( a j2j3 jy

d'où L'. = O. a=a+b+c, i3=a+jb+j2c, y=a+j2b+jc.


20.9. Notons L', le déterminant en question.
On a donc
o Cas 1 : w = 1. Les trois colonnes du déterminant
sont identiques, donc L', = O. det(M) det(D) = det(MQ) = aj3ydet(D).

o Cas 2 : w = j ou j2. Dans ce cas, 1 + w + w 2 = O. On remarque que det(Q) est un déterminant de


Donc les trois colonnes C1, C2, C3 du déterminant Vandermonde non nul. Ainsi,
sont liées par la relation C1 + C2 + C3 = O. Ainsi L'.s = det(M) = aj3y.
L'.=0.
20.10. 20.11.
o Un simple développement par une ligne aboutit 1. C'est vrai puisque pour tout <Xo, a1 , az dans IC,
à L'.1 = 2abc. L', est invariant par l'opération

o C'est un déterminant de Vandermonde, on a L'.2 =


(c- b)(c- a)(b- a).
◊ Notons 2. Un tel polynôme (unitaire) est de la forme

P = (X-a)(X- b)(X-c)(X-t).

Il faut déterminer t E IC tel que le coefficient de de-


gré 3 est nul. Or ce coefficient étant l'opposé de la
Le déterminant s'écrit en colonnes, somme de racines, il faut a+ b + c + t = 0, d'où

D-3 = IA+ s, s + c,A+ ci. P = (X- a)(X- b)(X- c)(X +a+ b + c).
3. On obtient 20.15. Calculons le déterminant de Ma par déve-
2
loppement par rapport à la première ligne.
1a a 0 2
1b b2
2
0
= P(d) 1a
1b
a
b2
I det(Ma) = (a+ l)(a2 +5a)-2a+ (-3a)
1C c Û = a((a+ l)(a+5)-5)
1C c2
1d d 2 P(d) 1

=a2 (a+6)
= (d- a)(d- b)(d- c)(d +a+ b + c)
x (c-b)(c-a)(b-a). La matrice Ma est donc inversible si et seulement
si a 1/c {O, -6}.
20.12. Soit M = ( g ~). On a alors par blocs, 20.16. Pour M = A, on a
2detA = detA+detA = det(A+A) = 2ndetA
~= 1 aM bM 1
bMaM.
et comme n? 2, detA = O.
Effectuons l'opération par blocs C2 f-- C2 + C1, Raisonnons par l'absurde en supposant A non nulle.
Son rang r est alors supérieur ou égal à 1. On sait
~-1 aM(a+b)MI=( +b)zl aMMI qu'il existe des matrices inversibles Pet Q telles que
- bM(a+b)M a bMM. A= PJrQ avec

Puis, par l1 f-- l1 - lz, on obtient (voir aussi exer-


cice 20.4)
1
Tr = où 1 figure r fois.
~=(a+b)21 (a;~M!I 0

= (a+ b) 2 det((a- b)M) det(M)


0
= (a+ b) 2 (a-b) 2 det(M) 2
= (a+ b) 2 (a- b)2(u 2 - b 2)2 Posons M = P(lln- Jr)Q = PQ-A. Commer? 1,
4 4 on a rg (lin - Jr) < n, donc
= (a+ b) (a- b) .

detM = detP det(lln- Jr) detQ = O.

Et par conséquence, <let A + det M = O.


20.13. Notons~ la base canonique de lK2[X] et M
D'autre part,
la matrice de f dans la base~- On a immédiatement

M=
11
012
0) .
det(A + M) = det(PQ) = <let Pdet Q #0
car P et Q sont inversibles. Cela contredit l'hypo-
( 001
thèse det(A + M) = <let A+ <let M.
On a donc det(f) = det(M) = 1. Donc f est un 20.17. Il s'agit d'un système homogène de matrice
automorphisme.
20.14. Voici deux démonstrations possibles.
o Première version. Il existe p, q, r E ffi. tels que

L'ensemble des solutions système contient une


A= ( ~P ~
; ) . droite vectorielle si et seulement s'il n'est pas ré-
duit à zéro. Ou encore si et seulement si detM = 0.
-q -r 0
En développant par rapport à la première colonne,
On calcule det(A) = pqr -pqr = 0 et la matrice A
n'est pas inversible. detM = (1-m)((l +m)2-4)
-3(2(1 +m)+2)+3(4+(1 +m))
o Deuxième version. Puisque t A = -A, on a
= (l -m)(m2 +2m-3) +3(1-m)
det(A) = <let ( - t A) = (-1 )3 <let ( t A) = m(l - m)(2 + m).
= -det(A).
La condition nécéssaire et suffisante recherchée est
Ainsi, det(A) = 0 et A n'est pas inversible. donc
m E {O, 1, -2}.
REMARQUE - Cette preuve est valable pour
toute matrice antisymétrique d'ordre impair.
Chapitre 21 ou encore, par définition de €, la contradiction
sup(A + B) <a+ b.
21.1. Supposons par l'absurde qu'il admette une
borne supérieure, soit µ E IQ. On ne peut avoir 21.3. Si A et B sont majorées non vides, on a pour
µ 3 = 2 puisque {/2 n'appartient pas à IQ. Par suite, tous a E A et b E B,
soit µ 3 < 2 soit µ 3 > 2; les deux cas étant ana-
a ~ sup A et b ~ sup B,
logues, nous traiterons seulement le premier. Suppo-
sons donc que µ 3 < 2; pour tout n E N*, le nombre
µ + 1/n appartient à IQ et est strictement supérieur d'où en faisant le produit membre à membre
à µ. Donc si on prouve que pour un certain n, il
vérifie(µ+ 1/n) 3 ~ 2, on aura obtenu une contra- ab~ supAsup B,
diction avec le fait que µ est la borne supérieure de
l'ensemble considéré. Or, ce qui montre que AB est bornée et que

sup(AB) ~supAsupB.

d'où Il nous reste à voir que cette inégalité est une égalité.
Par définition d'une borne supérieure, pour€ E lfl'j.,
(µ+ 1/n) 3 ~ µ 3 + (3µ 2 +3µ+ 1)/n il existe a E A et b E B tels que

donc, puisque IQ est archimédien, il existe n E N*


supA <a+€
tel que n(2 - µ 3 ) > 3µ2 + 3µ + 1 et donc tel que
(µ + l/n) 3 < µ 3 + 2- µ 3 = 2, qui nous apporte la et
contradiction souhaitée. sup B < b + €,
21.2. Si A et B sont bornées non vides, on a pour
d'où par produit,
tous a E A et b E B,

inf A~ a~ supA et infB ~ b ~ sup B, supAsup B <ab+ €(a+ b) + €2 •

d'où en sommant L'inégalité,

infA+infB ~ a+ b ~ supA+supB,

ce qui montre que A + B est bornée et que entraîne que


inf A+ infB ~ inf(A + B),
supAsup B < sup(AB) + €(supA + sup B) + €2 ,
et
supA + sup B;;,, sup(A + B). pour tout € E lfl'j.. On en déduit que

Il nous reste à voir que ces deux inégalités sont des supAsupB ~ sup(AB)
égalités; les deux cas étant analogues, nous traite-
rons uniquement le cas de la borne supérieure. Sup-
et on peut ainsi conclure que sup A sup B
posons donc par l'absurde que l'on ait
sup(AB). Cette égalité n'est plus vraie si A et
supA + sup B > sup(A + B). B contiennent des réels négatifs ; on peut vérifier
que supAsup B c/ sup(AB), si par exemple, A =
Notons
{-2,-1} et B = {-1}.
€:=supA+supB-sup( A+B) >0. 21.4. Si ce nombre était rationnel, son carré le se-
rait aussi, soit
Par définition d'une borne supérieure, il existe a E
A et b E B tels que
v'2 + V3 = r E IQ.

sup A - ~
2< a sup A Mais alors, 3 = (r - J2)2 = r 2 - 2v'2r + 2 et donc,
puisque r c/ 0,
et

sup B - ~
2< b sup B, r2 - 1
d'où par addition,
v'2= 2 r EIQ,

sup A+ sup B - € < a+ b ~ sup A+ sup B, ce qui est absurde.


21.5. Si a = b, la suite est nulle, donc de limite O. Si
1. Notons a = ex + f3, avec ex = {ho+ 14vl et a< b, comme (a/b)n tend vers 0, la suite Un a
f3 = {ho - 14vl; si on élève a au cube, on obtient pour limite - 1 ; enfin, si a > b, la suite ( a/b) n
tend vers +oo et donc Un a pour limite 1.
a3 = 40 + 3(cx2 f3 + cxf3 2 ) = 40 + 3cxf3a,
22.2.
ce qui donne finalement 1. En multipliant par l'expression conjuguée, on
a3 -6a-40 = O. obtient

On remarque que le nombre 4 est racine du poly- Un+l -Um+l


✓ 1 + Un + ✓ 1 + Um ·
nôme
P = x 3 - 6x -40, Les inégalités 1 :( ✓ 1 + Un et 1 :( ✓ 1 + Um en-
qui donc se factorise en traînent que

x 3 -6x-40 = (x-4)(x2 +4x+ 10). lun-Uml


IUn+l -Um+il :(
2
Or, le trinôme du second degré x 2 + 4x + 10 a un
2. On peut voir facilement que si l est le réel tel
discriminant strictement négatif, donc pas de racine
que l = ./î+î, alors, pour tout n E N, Un :( l.
réelle et donc la seule racine réelle de P est 4, ce qui
Pour tous n et p de N, l'inégalité de la question 1
nous donne donc a = 4.
conduit à
2. En procédant de même avec le réel b, on obtient
b 3 = 14- 3b. Ainsi, b est racine du polynôme,

Q = x 3 + 3x-14 = (x-2)(x2 + 2x + 7),


L'inégalité triangulaire et u 0 = 1 impliquent la ma-
qui n'a pas d'autre racine réelle que 2; on en conclut joration
que b =2. Un+l
IUn+p -upl,:;; ~ -
21.6. Comme Un :( l, on a
1. Le fait que G est un groupe est immédiat.
l+ 1
2. Pour toute fonction continue, périodique, non lun+p -upl :( 2P
constante, comme la fonction sinus par exemple, ce
groupe est nécessairement monogène; en effet, si f et grâce à cette inégalité, on peut conclure que la
est une telle fonction, alors pour tout T E G, on a suite est de Cauchy, donc convergente.
f(T) = f(O), donc f est constante sur G et donc par
continuité de f, f devrait être constante sur lR si G 22.3.
était dense. En revanche, pour une fonction comme 1. Un calcul simple montre que Vn+ 1 - Vn est égal
la fonction de Dirichlet, i.e. la fonction caractéris- à
tique des rationnels, qui vaut 1 sur les rationnels et Un+1-uo+Un+1-u1 +···+Un+1-Un
0 sur les irrationnels, on a G = !QI. Donc dans ce cas, (n+l)(n+2)
le groupe G des périodes est dense.
Nous avons alors Vn+ 1 -Vn positif (resp. négatif) si
21.7. Si deux des ai sont incommensurables, i.e. (unlnEN est croissante (resp. décroissante); on peut
ont un rapport irrationnel, le sous-groupe H qu'ils en conclure que (vnlnEN a le même sens de mono-
engendrent est dense dans JR, donc a fortiori le tonie que (unlnEN·
groupe G est dense puisqu'il contient H. Si main- 2. Quitte à remplacer Un par Un - l, on peut sup-
tenant tous les rapports a;/ai sont rationnels, par poser que l = O. Soit M un majorant de la suite de
une récurrence facile, on voit que G est monogène. terme général Ill.ni- Fixons, pour€ E JR~, un entier
N tel que, pour tout n ~ N, lunl < €. Nous avons
Il en résulte que G est dense dans lR si et seulement
alors
si il existe deux éléments, parmi a1, · · · , Un, dont
le rapport est irrationnel. I I MN+(n-N+l)e MN
Vn < n+l ,:;; n+l +e.
Comme ~;'; tend vers 0, quand n tend vers l'infini,
Chapitre 22 on peut trouver un rang N' ~ N tel que si n ~ N ',
alors~~ < €.
22.1. En factorisant par b, on obtient On peut donc en déduire que pour tout n ~ N ',
(a/b)n - 1 lvnl < 2e. Nous avons ainsi montré que la suite
Un= (vnlnEN est convergente de limite O.
(a/b)n + 1·
3. Supposons par exemple que limn-, +oo Un = +oo 22.6. Notons l1, lz et l3 les limites respectives des
et montrons que dans ce cas, limn-,+oo Vn = +oo. suites (uznlnEN, (uzn+ 1lnEN et (U3n)nEN• Comme
Pour A E IR't-, il existe N E N, tel que sin ;;, N, (U;;nlnEN est une suite extraite à la fois de (UznlnEN
alors Un > A. Nous avons donc
et de (U3n)nEN, elle est donc convergente de limite
UN+l +···+Un (n-N)A limn-,+oo ¾n = l1 = 13. La suite (u3{2n+1JlnEN
Vn ;;, n +1 > n +1 · extraite de (U3n)nEN et (Uzn+l lnEN permet de
Comme {n,:;-:i1A tend vers A, quand n tend vers conclure que lz = l3 ; nous avons ainsi montré que
l'infini, on peut trouver un entier N' ;;, N tel que, l1 = lz. En posant l = 11 = lz et en utilisant
si n ;;, N', alors {n,:;-:i1A ;;, A/2. En conclusion la définition de l comme limite de (uznlnEN et de
pour A E IR't-, nous avons trouvé N'EN tel que, si (Uzn+ 1lnEN, on peut prouver facilement que la suite
n ;;, N ', alors Vn > A/2 et nous avons ainsi montré (UnlnEN est convergente de limite l.
que limn-,+oo Vn = +oo.
22.7.
4. Soit (unlnEN la suite divergente définie par Un=
1. Posons, pour n EN, Wn = Un +vn; nous avons
(-1 )n. Un calcul simple montre que la suite (vnlnEN
est donnée par Vzn = zn1+ 1 et Vzn+ 1 = O. Cette
w;;: :,;; u;;: + v;;:. En passant à la limite, on obtient
suite est convergente de limite O.
lim w;;::;;; lim u;;: + lim v;;:.
n--t+oo n--t+oo n--t+oo
22.4. Il est facile de voir que (UnlnEN• est crois-
sante; montrons que (vnlnEN· est décroissante. Un L'inégalité ci-dessus n'est autre que
calcul simple montre que Vn+ 1 - Vn est égale à
lim(Un +vn):,;; lim(11n) +lim(vnl-
2nP-l +nP - (1 +n)P
(1 +n)PnP- 1 On n'a pas l'égalité en général, comme le montre
l'exemple des suites Un= (-l)n et Vn = -(-l)n.
Le binôme de Newton permet de voir qu'elle vaut
2. D'après la question 1 et grâce à l'égalité
également
lim(vn) = lim Vn, nous avons
n--t+oo
(2-p)np-l - •· • -1
(1 +n)PnP- 1 lim(Un + Vn) :,;; lim(11n) + lim(vnl-
Comme p ;;, 2, on peut affirmer que Vn+ 1 - Vn :,;; 0
En écrivant Un = (un+ Vn) - Vn et en utilisant
pour tout n E N; la suite (vnlnEN' est alors dé- l'inégalité ci-dessus pour les suites de terme général
croissante.
Un+ Vn et -Vn, on obtient
Nous avons de manière évidente limn-,+oo (Un -
Vn) = 0 et Un :,;; Vn pour tout n E N*; les deux lim(Un) = lim((Un +vnJ-vn)
suites sont donc bien adjacentes.
:,;; lim(Un +vnl +lim(-vnl
22.5.
, ou encore
1. Pour 1 :;;; k :,;; n, nous avons
lim(un) :,;; lim(un + Vn) - lim(vnl-
1/vn+Î:,;; 1/v'k.
En sommant membre à membre ces inégalités, on On en déduit alors que
obtient 1/ v'n+Î :,;; Un- L'inégalité précédente, et
le fait que lim(un) + lim(vn) :;;; lim(Un + Vnl-

n 1 Nous avons ainsi montré l'égalité


U 1 =- - u + ---~==
n+ n+l n (n+l) ✓n+l'
lim(un) + lim(vn) = lim(Un + Vnl-
entraînent que 1Ln+1 :;;; Un. D'autre part, la suite
est minorée par 0, donc convergente vers une limite 3. a) En faisant le produit membre à membre des
l ;;, 0, puisque décroissante. inégalités Un :,;; u;;: et Vn :;;; v;;:, on obtient Un Vn :,;;
2. Nous avons l'inégalité u;;:v;;: ; on en déduit alors que

Un 1
Uzn:;;; T + 2 y'n.
pour tout n E N. Le passage à la limite per-
3. La sous-suite de terme général Uzn est aussi met d'avoir lim(Unvn) :,;; lim(11n)lim(vnl- En gé-
convergente de même limite ; en passant à la limite, néral, l'égalité n'est pas réalisée comme le montre
dans l'inégalité de la question 2, on obtient l :;;; l/2. l'exemple des deux suites (Unln;;,o et (vnln;;,o défi-
On en déduit que l = O. nies par Uzn = Vzn+ 1 = Û et Uzn+ 1 = Vzn = 1.
b) Supposons la limite de (vnln)O nulle; pour Comme Urq = ruq + rc avec Ici ,( 1, l'égalité ci-
€ E IR~, il existe N E N tel que si n ? n, alors dessus devient
0 ,( Vn < €. En multipliant par Un, on obtient Urq
kb rc
0 ,( UnVn ,( €Un ; le passage à la limite supérieure Vp-Vq =a/p+-+-+ur/p--.
p pq pq
entraîne alors que
En écrivant Urq = QUr + qd avec ldl ,( 1, on obtient

kb rc
En faisant tendre € vers 0, on obtient v p -v q =a/p+-+--d/p.
p pq
lim(UnVn) = O.
L'inégalité triangulaire et le fait que r est compris
Supposons maintenant que (vnln)O a une limite l entre O et q entraînent que
non nulle. On peut alors trouver N E N tel que, pour
tout n? N, Vn > O. L'égalité Un= (UnVn)l/vn,
pour n? n, et la question 3a) entraînent l'inégalité
Comme k/p ,( 1/q et 1/p ,( 1/q, nous déduisons
alors

ou encore Maintenant, si € E IR~, il existe N E N tel que si


q? N, alors 4/q <€.Ainsi, nous avons montré que
lim(un) lim Vn ( lim(UnVn).
n-t+oo si N ,( q ,( p, alors lvp -vql <€.On peut donc en
conclure que la suite (vnln)l est de Cauchy, donc
Grâce à l'inégalité de 3a), on peut conclure que
convergente.
22.10.
1. Si j vérifie 3 ,( j ,( k, alors j ,( n - k + j - 2.
22.8. Soit (Iklk;;,1 une partition de N où chaque Ik En faisant le produit terme à terme, on obtient
est infini (ça existe, donnez-en!). Posons Un= 1/k, 3.4- • · k ,( (n-k+ 1) · · · (n-2), c'est-à-dire
sin E Ik, et notons Ad(Un) l'ensemble des valeurs
d'adhérence de la suite (Un)n)O· Cette suite est bor- k! (2(n-k+l)•··(n-2),
née et Ad(Un) = {O, 1, 1/2, • · • , 1/k, ··•}est un en-
semble infini et strictement contenu dans l'intervalle ou encore k!(n - k)! ,( 2(n-2)!.
[O, 1]. En effet, l'inclusion En divisant les deux membres par n! et en prenant
les inverses, on en déduit que C~ ? C;.
{O, 1, 1/2, .. · , 1/k, · · ·} c Ad(Un) 2. La question 1 nous donne l'encadrement
est assez claire. Quant à l'inclusion inverse, si ex est
une valeur d'adhérence de Un, ex est la limite d'une
sous-suite (Uq, (n l )nEN et chaque cp (n) appartient à
un seul Ikn; mais alors ex= n~~oo 1/kn, et on voit On pose dans la suite
facilement que ex est nulle ou égale à 1/k, pour un
n-2 l
certain k E N*.
22.9. On peut montrer par récurrence sur n que,
Vn = L Ck"
k=2 n
pour tous n E N et m E N,
D'après l'inégalité ci-dessus, la suite (vnlnEN est
convergente de limite O.
3. Nous avons
Posons, pour tout n E N*, Vn = Un/n; nous al-
lons montrer que (vn)n)l est une suite de Cauchy.
Soient p et q deux entiers vérifiant 1 ,( q ,( p ; si r
est le reste de la division euclidienne de p par q, il Un calcul simple montre que Un= 2+2/n+vn, d'où
existe alors k E N tel que p = kq + r. Nous avons l'on déduit que la suite (unlnEN est convergente de
Up = Ukq + Ur + a avec lai ,( 1. L'inégalité (*) en- limite 2.
traîne que Ukq = kuq + kb, avec lbl ,( 1. Un calcul
simple donne 22.11. Une récurrence montre que, pour tout m E
N,
TUq
Vp -Vq = a/p + kb/p +ur/P- - .
pq
1. Soit (n, p) E N2 ; l'identité 22.13.
1. Nous avons y'u;:;: ,( ✓un + vUn+ 1. En ajoutant
Un-1 à chaque membre et en prenant la racine car-
rée, on en déduit que
Un+p - Un+p-1 + Un+p-1 - · · · + lip+ 1 - Up
et l'inégalité triangulaire entraînent que

En procédant ainsi, on obtient Vn ,( Vn+ 1 ; la suite


(vnln;;,1 est donc croissante.
Nous en déduisons alors que
2. Si a est la valeur de la suite constante (unln;;,1,
notons ( anln;;,1 sa suite associée, c'est-à-dire celle
qui vérifie, pour tout n E N*, Un+ 1 = va+ Un.
En calculant cette dernière somme, on obtient l'en- Montrons par récurrence sur n, que si l = va + l,
cadrement alors il majore (an)n;;,1- Nous avons a1 =VU,( l;
supposons que Un ,( l ; en ajoutant a à chaque
membre et en prenant la racine, on obtient Œn+ 1 =
va + Un ,( Va + l = l.
La suite (anln;;,1 est majorée et croissante, donc
Comme kP tend vers O quand p tend vers l'infini,
convergente.
pour € E ~~, il existe N E N tel que si p ) n, alors
kP < E(l - k). Nous en déduisons donc que, pour 3. Si a est un majorant de la suite (Un)n;;, 1, nous
tout n E N, si p ) n, lun+p - Upl < €. Ainsi, la avons, pour tout n EN*, Vn ,( Un; comme ( anln;;,1
suite (unlnEN est de Cauchy, donc convergente. est majorée, (vnln;;,1 est donc convergente, car
croissante et majorée.
2. Soit k ) 1 ; si n E N, on pose Un = kn. La
suite (unlnEN vérifie bien l'inégalité, mais n'est pas 22.14. Supposons la suite convergente, de limite l.
convergente. En passant à la limite dans l'égalité

22.12. Notons l la limite de (unln;;,o et supposons- sin(n+ 1) +sin(n-1) = 2sinncos 1,


la strictement positive. Pour O < € < l, il existe N E
on obtient l'égalité, 21 = 2lcos 1. Comme cos 1 # 1,
N tel que sin) N, alors 1-E < Un+1/Un < l+ €.
L'identité suivante il en résulte quel= O. L'identité cos 2 n+sin 2 n = 1
entraîne que lim cos 2 n = 1 ; en élevant au carré
Un UN+l Un n---t+oo
--···-- l'égalité sin( n + 1) = cos n sin 1 + sin n cos 1 et en
Un-1
passant à la limite, on obtient O = sin2 1. Or, ceci
entraîne que est impossible puisque sin 1 # 0; nous aboutissons
ainsi à une contradiction.
22.15.
On en déduit que 1. Une étude rapide de la fonction x H tan x - x,
sur l'intervalle ] - n/2 + nn, n/2 + nn[, permet de
prouver l'existence d'un unique réel Un E] - n/2 +
nn, n/2 + nn[, tel que tan Un - Un = O.
Comme u~n(l-€) 1-N/n (resp. u~n{l+E)l-N/n)
2. L'inégalité -n/2 + nn ,( Un entraîne que
tend vers 1- € (resp. l + €), alors il existe un entier lim Un= +oo.
N') N tel que, sin) n', alors n---t+oo
3. La condition Un E] - n/2 + nn, n/2 + nn[ est
équivalente à

et
u;!n < U~n(l + €)1-N/n < l + 2€.
L'inégalité ci-dessus montre que lim un/n = 7r.
n---t+oo
Nous avons donc, pour n ) N', lwn - li < 2€ et
nous avons ainsi montré que la suite (wnlnEN est 22.16. Pour la première, on étudie donc la suite
convergente de limite l. homographique (unlnEN, définie par
Si l = 0, on peut avoir facilement l'inégalité
4un+2
0 < Un/UN < En-N, pour n ) N. Le fait que Un+l = - - --, Uo E ~ \ S,
Un+ 5
u~n€J-N/n tend vers € permet de conclure que
l'ensemble S à ôter à~ étant celui des nombres u 0
(wnlnEN est convergente de limite O.
tel qu'il existe n E N vérifiant fn(Uo) = -5, où fn
désigne la composée de f, n fois avec elle-même. Évi- on a alors Vn+ 1 = Vn + 1, donc la suite (Vn) nEN
demment, -5 E S; nous déterminerons précisément tend vers +oo et la suite {UnlnEN tend donc vers O.
S ultérieurement. L'ensemble S des valeurs uo à exclure est donné par
Pour l'instant, cherchons les points fixes de f,
i.e. les x tels que f(x) = x; cela conduit à l'équation S={n-~l I nEN}.

x 2 +x-2 = 0, Maintenant, si on se place sur JR, i.e. si


~ # 0 comporte
a, b, c, d E lR et uo E JR, le cas
dont les racines sont -2 et 1. Si Uo = -2 (resp. deux sous-cas : ~ > 0 ou ~ < O.
Uo = 1) , la suite (Un) nEN est constante de valeur -2 Le premier cas est identique au cas complexe.
(resp 1) ; supposons désormais uo E lR \ S, uo f -2, Dans le second cas, f n'a pas de point fixe réel
Uo # 1. Conformément à la méthode développée et donc la suite ne peut pas converger. Remarquons
dans le cours, considérons alors la suite (vnlnEN, que nous le savions déjà grâce à l'étude précédente
définie par du cas complexe puisque si ~ < 0, on a deux ra-
Un-1 cines complexes conjuguées ex et f3 et donc on est
Vn = Un+2' dans la situation où le complexe r est de module 1,
qui vérifie donc aussi c'est-à-dire dans un cas divergent. Ceci dit, dans ce
cas réel, on peut préciser un peu ce qui se passe. En
effet, comme
2
~ = {d- a) 2 +4bc = {d+ a) -4(ad- be),
On vérifie par un calcul simple que, pour tout entier c'est que nécessairement ad - be > O. Mais f est
n, on a Vn+l = Vn/2; ainsi (vnlnEN est une suite dérivable et f'(x) = (~~.:;:~ 12 , donc dans ce cas,
géométrique de raison 1/2 et donc on a pour tout la fonction f est strictement croissante. Par suite,
½)
entier n, Vn = ( n Vo. Il en résulte que la suite Un+l - Un = f(Un) - f(Un-1) est de même signe
(vnlnEN tend vers O et donc compte tenu de l'ex- que Un - Un-1 et donc par récurrence immédiate a
pression de Un en fonction de Vn, la suite (unlnEN le signe de u, - uo. Ainsi, la suite est strictement
a pour limite le réel 1. croissante dans le cas où u, > uo et strictement dé-
Maintenant, pour déterminer S, remarquons croissante dans le cas où u 1 < Uo ; évidemment elle
que Un = -5 si et seulement si Vn = 2; il en ré- serait constante si u, = Uo, i.e. si Uo était un point
sulte que l'ensemble S des valeurs u 0 à exclure sera fixe de f mais ici cela ne peut arriver puisque f n'a
déterminé dès lors que l'on connaîtra l'ensemble des pas de point fixe.
valeurs vo telles que Vn = ~ = 2, ce qui donne
Il en résulte en tout cas que la suite est stricte-
trivialement vo = 2n+ 1, ou encore uo = f~;:t). ment monotone et donc, puisqu'elle ne converge pas,
Ainsi,
} qu'elle tend vers +oo dans le cas où elle est stricte-
2n+2 + 1
S = { l _ 2n+l I n EN . ment croissante et vers -oo dans le cas où elle est
strictement décroissante.
Pour la deuxième suite, on trouve un seul point
fixe pour g, à savoir 2; si Uo = 2, la suite (UnlnEN
est alors constante de valeur 2. Sinon, on considère
la suite définie par
Chapitre 23
23.1.
1. Supposons a < O. Comme la suite na est posi-
tive et de limite O quand n tend vers l'infini, alors
Un calcul rapide montre que cette suite est arithmé- lim [na] = O. Le fait que [nb] tend vers +oo
tique de raison 3, donc tend vers +oo ; il en résulte, n---++oo
quand n tend vers l'infini permet de conclure que
en exprimant Un en fonction de Vn, que la suite
(unlnEN a pour limite 2. L'ensemble des valeurs Uo
r [na]
à exclure est ici donnée par
n-!1!100 [n b] ·
Supposons maintenant a ;,, 0 et écrivons
6n+5 } [na] [na] na nb
5= { 3(n+l) nEN .
~ nb [nb]"
1
[nb]
Les deux limites
22.17. La fonction f n'a pas de point fixe, donc la lim [na]/na = lim [nb]/nb = 1
n---++oo n---++oo
suite homographique associée n'est pas convergente.
La fonction g a un seul point fixe, à savoir O; conduisent à
si Uo = 0, la suite est constante de valeur O. Sinon, [na]
lim - - lim na-b_
introduisons la suite de terme général Vn = 1/Un ; n---++oo [nb] n---t+oo
N
ous d'd .
e msons d l"
one que n--!~oo [nb] = 1 s1· a= b ,
[na] 23.4.
1. Nous savons que [t + k] = [t] + k pour tout
lim [[n:] = 0 si a< b et +oo dans le cas a> b. (t, k) E l!!. x :Z. Le réel x est donc solution si et
n--->+oo n J
seulement si [n(x - [xl)] = 0, c'est-à-dire x vérifie
2. Si a = 1, la limite est nulle puisque celle [x] ( x < [x] + 1/n. On peut donc en conclure que
de [bn] est égale à +oo. Si 0 < a < 1, nous l'ensemble des solutions est la réunion de tous les
avons lim [an] = O. On peut alors déduire que intervalles de la forme [h, h + 1/n[ quand h décrit
n---++oo
lim [an]/[bn] = O. :z.
n---++oo
2. Si x ), 2, alors x ), [x] ), 2, ce qui entraîne
Supposons maintenant que a > 1 et écrivons que xn ), [x]n > [x], d'où l'on déduit encore que
[xn] ), [x]n > [x]. Ainsi, x ne vérifie pas [x] = [xn].
[an] [an] an bn Supposons maintenant 1 ( x < 2 et posons k =
[bn] un bn [bn]. [n(~ll; l'entier k E {O, 1,2 · · · , n-1}, et le réel x vé-
rifie 2k/n ( x < 2 k~i • Nous avons 2k ( xn < 2k+ 1 .
Comme lim [an]/an = lim [bn]/bn = 1, on En prenant la partie entière, on obtient 2k ( [xn].
n---++oo n---++oo Si x vérifie [x] = [xn], alors 2k ( 1 = [xn] = [x],
peut déduire que lim [an]/[bn] = lim (a/b)n. donc k = O. La réciproque est également vraie. x est
n---++oo n---++oo

Nous avons donc lim [an]/[bn] = 0 si a< b et solution si et seulement si 1 = [n(~ll, c'est-à-dire
n---++oo XE [1,2 1 /n[.
lim [an]/[bn] = +oo si a > b. Dans le cas où
n---++oo Dans le cas où O ( x < 1, alors O ( xn < 1. Nous
a= b, la suite est constante de valeur 1. déduisons donc [xn] = 0 = [x]. Tout élément de [O, 1[
est solution.
23.2. Posons x' = x - [x] et -y' = -y - [-y]. En résumé, l'intervalle [0,2 1 /n[ est l'ensemble de
tous les x > 0 vérifiant [x] = [xn].
Nous avons alors [x + -y] = [x' +-y'] + [x] + [-y],
[2x] = [2x'] + 2[x] et [2-y] = [2-y'] + 2[-y]. L'in- 23.5.
égalité [x] + [-y] + [x + -y] ( [2x] + [2-y] est donc
1. La définition de la partie entière entraîne que
équivalente à [x' + -y'] ( [2x'] + [2-y']. En ajou- 0 ( f(n) < 1.
tant membre à membre les inégalités O ( x' < 1
2. Supposons f(n) = f(m). Nous déduisons alors
et O ( -y' < 1, on obtient O ( x' + -y' < 2. (n - m)8 = [n8] - [m8]. Comme 8 est irrationnel,
Nous allons distinguer deux cas. Si x' + -y' < 1, l'égalité précédente entraîne que n - m = 0, c'est-
l'inégalité est trivialement vérifiée; dans le cas où à-dire n = m.
1 ( x' +-y'< 2, alors 2 ( 2x' +2-y'. Nous en dé- 3. f n'est pas surjective car 1/2, par exemple, n'a
duisons que 2x' ), 1 ou 2-y' ), 1, ce qui entraîne que pas d'antécédent.
[2x '] ), 1 ou [2-y '] ), 1. L'inégalité est alors vérifiée,
puisque [x' +-y']= 1 ( [2x'] + [2-y']. 23.6.
1. On peut vérifier que f(x+ 1/10) = f(x); la fonc-
23.3. La division euclidienne de p par q donne tion f est donc périodique, de période 1/10.
p = kq + r, où k et r sont deux entiers naturels
p-q 2. Pour x E [0, 1[, notons 0, X1X2 · · · Xn • • • son dé-
avec 0 ( r < q. Nous avons - - = k- 1 + r/q. veloppement décimal. On peut vérifier facilement
q
Comme 0 ( r/q < 1, alors que, pour tout n EN*, f(nl(x) = 0,Xn+l ···.Nous
savons que x est rationnel si et seulement si son
développement décimal est périodique à partir d'un
certain rang. On peut donc conclure que x est un
rationnel si et seulement si la suite (f(nl (xlln)l est
périodique à partir d'un certain rang.
1 1
L'égalité p + = k + + r et les inégalités 1/ q ( 3. Si 0, X1 Xz · · · Xn · · · est le développement déci-
q q mal d'un réel x E [0, 1[, solution de f(x) = x,
l+r
- - < 1 + 1/ q entraînent que alors 0,Xz···Xn··· = 0,x1X2···Xn···. Par uni-
q cité du développement décimal, nous déduisons que
Xi = Xi+ 1 pour tout i E N*. La suite (Xk) kEN·
est donc constante ; notons a sa valeur. De l'égalité
x = 0, x 1xz · · · Xn · · · , nous déduisons que x = a/9,
avec a un entier entre 0 et 8. Réciproquement, tout
réel de la forme a/9, où a est un entier compris entre
Les identités ( *) et ( **) prouvent le résultat.
0 et 8, est solution.
23.7. Le développement décimal de 1/47, donné ci--- M est la borne supérieure de lfl sur [A, A+ 1] (elle
aprés, est de période 46 : existe car f est continue) alors

0,02127659574468085106382978723404 lf(t)/t- li,;;; M +Till+ E.


t
255319148936170212···
Soit B > A un réel tel que M~Tlll < € pour
tout t > B. Nous avons donc pour tout t > B,
23.8. Soit x un nombre-univers; supposons qu'il est lf(t)/t- li,;;; 2E.
rationnel et posons 25.3. Si k = 0, nous avons lim E(kt)/E(ht) = O.
t---t+oo
Supposons que k # 0 et fixons t assez grand. Nous
avons
E(kt) E(kt) kt ht
où n est la période, à partir de m, du développement E(ht) JZt ht E(ht).
décimal de x. La séquence des chiffres de l'entier
N = 1o2n+m doit se trouver dans le développement Les deux limites
décimal de x. Comme ce dernier est périodique à lim E(y)/y = 1
lim (E(x)/x) =
partir de m, nous déduisons que O = a 1 = a2 = x---t+oo y---t-oo

••• = Un ; le réel x est donc un nombre décimal, conduisent à


mais un tel réel ne peut pas être un nombre-univers,
il suffit de prendre une séquence finie de 1, de lon- lim (E(kt)) = ~-
gueur m+ 1. t---Hoo E(ht) h

23.9. Supposons le rationnel et notons T > 0, lapé-


riode de son développement décimal. Il existe donc 25.4. À l'aide d'une récurrence, nous avons
N EN tel que, pour tout n ~ N, Xn+ T = Xn, En f(t 2 n) = f(t) pour tous t E [0,1] et n EN. Si
particulier, si m ~ v'N, alors ✓m2 + T est un en- t E [O, 1 [, la suite (t2 nlnEN a pour limite O. En
tier. lim ( ✓ m 2 + T - m) = 0 entraîne que, pour faisant tendre n vers +oo dans l'égalité précédente
m---t+oo
m assez grand, 0 < ✓m2 + T - m < 1, c'est-à-dire et en utilisant la continuité de f en 0, on obtient
m < ✓m 2 + T < m + 1, ce qui est absurde, puisque f(O) = f(t). La fonction f est donc constante sur
✓m2 +Test un entier. [O, 1[. La continuité de f au point 1 permet de
conclure que f est constante sur [O, 1].
23.10. Soit s une séquence finie de chiffres. En
ajoutant un O à s comme dernier chiffre, nous ob- 25.5. Montrons que 1) entraîne 2). En remplaçant h
tenons une nouvelle séquence s' dont le dernier par -hdans al, nous avons lim (f(xo-h)-f(xo)) =
h---->0
chiffre est pair. Elle se trouve alors, dans les deux O. lim (f(xo+h)-f(x 0 -h)) = lim (f(xo+h)-f(xo)-
h---->O h---->0
cas, dans le développement décimal du nombre (f(xo - h) - f(xo))) = O. Nous avons ainsi montré
0, XJ X2X3 · · · Xn · · ·, que
lim (f(xo + h) -f(xo - h)) = O.
h---->0

Chapitre 25 La propriété 2) n'entraîne pas en général 1 ), comme


le montre l'exemple suivant : on définit f sur lR par
25.1. Pour tous t E lR et n E N, nous avons f(t) = 1, si t E JR* et f(O) = O. La fonction vérifie
f(t) = f(t + nT). En passant à la limite, on ob- bien la propriété 2) au point O mais pas 1).
tient f(t) = limn---Hoo f(t + nT) = limx---Hoo f(x) et 25.6.
donc la fonction f est constante.
1. En posant x = y = 0 dans l'identité vérifiée
25.2. Si lest la limite de f(t + 1) - f(t) en +oo, par f, on obtient f(O) = O. La continuité de f sur
alors pour E E JR';_, il existe A E JR';_ tel que si lR entraîne évidemment sa continuité en O. Mon-
t > A, alors lf(t + 1) - f(t) - li < E. Si t > A, trons maintenant la réciproque. Soint x E lR et
écrivons t = T + n oÎ n E N et T E]A, A + 1[. (xnlnEN une suite de limite x. Nous avons f(x) =
Nous avons donc, pour tout k entre O et n - 1, f(Xn + (x - Xn)l = f(xnl + f(x - Xn), Comme f
lf(T + k + 1) - f(T + k) - li < E. L'inégalité trian- est continue en O et x - Xn tend vers 0, alors f(xn)
gulaire entraîne que lf(t)-f(T)-nll < nE. Comme converge vers f(x) - f(O) = f(x). Nous avons ainsi
n = T - t, nous avons lf(t) - tll ,( lf(T) -TIi + tE, montré que la suite f(xn) converge vers f(x), ce qui
d'où nous déduisons lf(t)/t- li,( lf(T)~+Tlll +€.Si prouve que f est continue au point x.
2. À l'aide de la récurrence, on peut prouver que, et x' = x - [y/T]T sont dans le segment [- T, 2T]
pour tout n E N, f(n) = nf(l ). En prenant pour et vérifient ly' - x'I < 11- Nous déduisons donc que
x E ll, y = -x dans l'identité vérifiée par f, on ob- lf(y') - f(x')I < €. Comme Test une période de f,
tient f(-x) = -f(x). Maintenant sin E Z, comme
on peut affirmer que lf(y) - f(x)I < €. Nous avons
-n EN, alors f(n) = f(-(-n)) = -f(-n) = nf(l).
ainsi montré la continuité uniforme de f sur ll tout
3. Soit r = p/q, p E Z et q E N*. Nous avons
entier.
qf(r) = f(qr) = f(p) = pf(l), d'où l'on déduit que
f(r) = rf(l ). 25.11. Pour € = 1, il existe 11 E ll~ tel que si

4. Si t E ll, alors il existe une suite de rationnels lt - t'I ,:;; 11, alors lf(t) - f(t')I < 1. Sin E Z, nous
(rnlnEN de limite t. En passant à la limite quand avons lf((n + 1)11) - f(n11)I < 1. Nous en déduisons
n tend vers +oo dans la relation f(rn) = rnf(l), on que, pour tout k E Z, l'inégalité lf(k11) - f(O)I < lkl.
obtient f(x) = xf(l ). Pour t E ll, si h est la partie entière de x/11, alors
lf(t) - f(h11)I < 1. L'inégalité triangulaire entraîne
25.7. Si <XE [O, 1], le réel <Xf(a) + (1 - <X)f(b) est
lf(t)I ::;; lf(h11)I + 1 ::;; lf(O)I + 1 + lhl. En utili-
entre f(a) et f(b). Le théorème des valeurs intermé-
sant l'inégalité lhl ,:;; ltl/11 + 1, on obtient lf(t)I ,:;;
diaires appliqué à f sur [a, b) permet de conclure.
lf(O)I + 2 + ltl/11.

25.8. Posons I = [a, b) et notons g l'application


g(t) = f(t) - t. De l'inclusion I C f(I), on déduit Chapitre 26
l'existence de c et d appartenant à [a, b) tels que
f(c) = a et f(d) = b. Nous avons g(c) = f(c) - c = 26.1. En dehors de l'origine, la fonction f est de
a - c ,:;; 0 et g(d) = f(d) - d = b - d ~ O. classe ci par théorèmes généraux; en 0, elle est dé-
rivable, de dérivée nulle, puisque son taux d'accrois-
D'après le théorème des valeurs intermédiaires, il
existe to E [c, d] tel que g(to) = 0, c'est-à-dire
sement est x sin t,
qui tend vers O quand x tend
vers O. Cependant, elle n'est pas de classe ci sur ll,
f(to) = to. puisque sa dérivée, donnée sur ll* par
25.9. En supposant le contraire et grâce à la conti-
nuité de f et g, on peut voir facilement que f- g est f '( x ) . -1 - cos -1 ,
= 2x sm
X X
à valeurs dans ll~ ou ll'.'.... On se place dans le cas
où f - g > 0 sur [a, b]. La continuité de f - g sur ne tend pas vers f'(O) = 0 (en fait, elle n'a pas de
le segment [a, b] entraîne que la borne inférieure de limite).
f-g sur [a, b], soit <X, est strictement positive. Nous
avons donc pour tout t E [a, b], f(t) ~ g(t) + <X. On 26.2.
en déduit alors que 1. Si f est une fonction satisfaisant la première
équation, posons pour x E ll*, g(x) = f(x)/x.
minf~ ming+<X Puisque clairement f(O) = 0, cette fonction g se
[a,b] [a,b]
prolonge par continuité en O par g(O) = f'(O). On
et a alors, pour tout x E ll, g(2x) = g(x), ou encore,
maxf ~ maxg + <X. g(x) = g(x/2). Cette dernière égalité donne immé-
[a,b] [a,b]
diatement par récurrence que, pour tout entier n et
En faisant le produit membre à membre, on obtient tout réel x, on a g(x) = g(x/2n ). Fixant x et faisant
alors tendre n vers +oo, il en découle par continuité de
g et unicité de la limite que g(x) = g(O) = f'(O).
min f.maxf ~ min g.maxg + <X2 , Ainsi, g est constante et donc f est linéaire, de la
[a,b] [a,b] [a,b] [a,b]
forme f(x) = ax, a constante réelle arbitraire; inver-
ce qui entraîne l'inégalité sement, ces fonctions satisfont bien l'équation fonc-
tionnelle étudiée.
min f. max f > min g. max g. 2. Pour la deuxième équation fonctionnelle, il y a
[a,b] [a,b] [a,b] [a,b]
bien entendu la fonction identiquement nulle qui
est solution; à l'opposé, si une solution f ne s'an-
25.10. Notons T > 0 la période de f. Comme f nule jamais, elle est alors strictement positive, ce
est uniformément continue sur le segment [- T, 2T], qui permet de considérer la fonction définie par
q:, (x) := ln f( x}, qui satisfait l'équation fonctionnelle
alors pour € E ll~, il existe O < 11 < T tel que
précédente et donc est de la forme x H ax. Ainsi,
pour tout t et t' de [-T, 2T], si lt - t'I < 11 alors dans ce cas, f(x) = en". Il nous reste alors à voir s'il
lf(t)-f(t')I < €. Soient maintenant x et y deux réels peut exister une solution non identiquement nulle
vérifiant lx - yl < 11- Les nombres y 1 = y - [y/T]T mais s'annulant au moins une fois; nous allons voir
que cela ne se peut. En effet, si f était une telle fonc- tend vers 0 lorsque x tend vers 0, donc f(n) est déri-
tion, il existerait donc xo tel que f(xo) = 0 et donc vable en 0, i.e. f est (n + 1)-fois dérivable en 0 avec
par application répétée de l'équation fonctionnelle, f(n+ll(0) = 0 et comme limx-.of(n+ll(x) = 0 =
on aurait pour tout entier n f(n+ll(0), f(n+l) est continue en 0 et donc f est de
classe en+ l .
26.5.
donc f(x 0 /2n) = 0, qui par passage à la limite en
n, nous donnerait f(0) = 0 par dérivabilité et donc 1. Si f est dérivable au point a, en écrivant
continuité de f en O. D'autre part, f n'étant pas f(a+h)-f(u-h) = ! (f(a+h)-f(a) + f(a-h)-f(a))
2h 2 h -h '
identiquement nulle, il existe x1 tel que f(x 1) i= O.
on obtient en faisant tendre vers 0 que
Là encore, par application itérée de l'équation fonc-
tionnelle, on a r f(a+h)-f(a-h) -f'( l
h~ 2h - a'

c'est-à-dire le résultat cherché.


Mais, à nouveau limn-t+oo f(xi/2n) = f(0) donc
puisque f(0) = 0, par passage à la limite dans (1.5), 2. L'égalité
on obtient f(x1) = 0 et donc une contradiction. f(a+h)-f(u-h) _ ! (f(u+h)-f(u) + f(u-h)-f(u))
2h - 2 h -h '
En définitive, les seules fonctions satisfaisant l'équa- montre plus généralement en faisant tendre h vers 0
tion fonctionnelle étudiée sont la fonction nulle et par valeurs positives, puis par valeurs négatives, que
les fonctions de la forme x H e 0 X, a étant une si f admet en a une dérivée à droite et une dérivée à
constante réelle arbitraire. gauche, alors f admet en a une dérivée symétrique
26.3. En multipliant cette inégalité par lf(x)I, on et que
obtient, pour tout x E [a, b],

lf(x)f'(x)I ,( cxlf(x)l 2 = cxf(x) 2 . 3. Considérons la fonction f définie sur IR. par


Posant g(x) := f(x)2, x E [a, b], on a donc g'(x) - 1
2cxg(x) ,( O. Le cas d'égalité serait obtenu pour une f(x) = xsin ;z six i= 0 et f(0) = O.
fonction du type x H Ce 2 "'x ; introduisons donc la
fonction cp(x) := g(x)e- 2 "'x, comme pour la mé- Cette fonction n'admet ni dérivée à droite, ni déri-
thode de variation de la constante. On a vée à gauche en 0 car sin~ n'a pas de limite quand
x tend vers 0; a fortiori, elle n'est évidemment pas
cp'(x) = (g'(x) -2cxg(x))e-2<xx ,( 0, dérivable. Pourtant, elle admet une dérivée symé-
trique en 0 et celle-ci est nulle, puisque
donc cp est décroissante sur [a, b]; comme cp(a) = 0
puisque f (a) = 0, on a donc cp négative et donc aussi f(h)-f(-h) hsin*-(-h)sin~
g négative. Mais g = f 2 est positive donc finalement 2h 2h = O.
g et f sont identiquement nulles.
26.4. Sur IR.*, f est de classe e 00 par théorèmes gé- 26.6. La fonction t H sin t a pour dérivée la fonc-
tion t H cos t, dont la valeur absolue est majorée
néraux et une récurrence facile montre que, pour
par 1 ; l'application de l'inégalité des accroissements
tout entier n, il existe une fonction polynômiale
finis entre 0 et x, à la fonction t H sin t, conduit
Pn, de degré 3n, telle que, pour tout x E IR.*, on
donc à l'inégalité
a f(nl(x) = Pn(l/x)e-l/x'. Cela montre, compte
tenu des limites de formes indéterminées classiques 'efx E IR., lsinxl ,( lxl.
mettant en jeu fonctions polynômiale et exponen-
tielle, que pour tout entier n, De même, la fonction t H ln(l + t) a pour dérivée
= O. la fonction t H 1~t , qui est encadrée entre 0 et 1
lim f(nl(x)
x-.o sur IR.+, d'où l'encadrement

Pour n = 0, puisque f(0) = 0, cela nous donne la 'efx;;, 0, 0 ,( ln(l +x) ,( x.


continuité de f en 0 ; montrons alors par récurrence
que si pour un certain entier n, f est de classe en
avec f(nl(0) = 0, alors elle est de classe en+l, avec
f(n+ll(0) = 0, ce qui montrera qu'elle est de classe 26. 7. Le taux d'accroissement en un point x quel-
en pour tout n et donc de classe e 00 • En effet, conque de I vérifie

f(-y)-f(x)l ,(lx-111"'-1,
l 11-x
donc tend vers 0 lorsque y tend vers x. Il en résulte 26.12. Puisque <f>(o) = <f>(b) = 0 et que
que f est dérivable sur I et que sa dérivée est nulle;
comme I est un intervalle, f est donc constante. f(o) f(b) f'(x) 1
<t>'(x) = g(o) g(b) g'(x) ,
26.8. La fonction g est dérivable sur ]0, +oo[ et sa h(o) h(b) h'(x)
l
dérivée est donnée par
le théorème de Rolle nous donne l'existence d'un
'( ) _ xf'(x) - f(x) réel c E]o, b[ tel que
g X - x2 .

Or, par l'égalité des accroissements finis appliquée f(o) f(b) f'(c)I
entre 0 et x, il existe un réel c E]0, x[ tel que, g(o) g(b) g'(c) = O.

f(x) = f(x) - f(0) = xf'(c), l


h(o) h(b) h'(c)

Si h(t) = 1, pour tout t E [o, b], on retrouve le


et donc puisque f' est croissante, on obtient f (x) :s; théorème des accroissements finis, généralisé à deux
xf'(x), donc g'(x) ~ 0 d'où g croissante.
fonctions, vu dans un exercice précédent.
26.9. Comme dans la preuve du théorème de Rolle,
26.13. Par récurrence sur n; sin= 1, c'est le théo-
on montre que nécessairement f admet son maxi-
rème de Rolle de base. Supposons que pour un cer-
mum ou son minimum en un point de l'intervalle
tain n, le résultat soit vrai pour toute fonction f et
]o, b[. Supposons par exemple que ce soit le maxi-
prouvons qu'il est alors vrai pour n + 1 ; soient
mum, l'autre cas étant analogue, qui est atteint
en c E]o, b[. Dans ce cas, pour h > 0 assez pe-
Oo = 0 < 01 < · · · < On < On+ 1 = b
tit, f(c+h~-f(cl :s; 0 et donc par passage à la li-
mite, f~(c) :s; 0; de même, pour h < 0 assez petit, et supposons que
f(c+h~-f(c) ~ 0 et donc par passage à la limite,
f~(c) ~ 0, ce qui nous donne au final f~(c).f~(c) :s;
O.
L'application du théorème de Rolle ordinaire nous
Donc si f est dérivable en o, on a f'd(c) =
donne l'existence de points Co < c1 < · · · < Cn tels
f~(c) = f'(c) et donc la condition précédente nous que
donne f'(c) 2 :s; 0, donc f'(c) = 0; on retrouve ainsi f'(co) = f 1 (c1) = · · · = f'(cn) = O.
le théorème de Rolle.
L'hypothèse de récurrence appliquée à la fonc-
26.10. Si f est constante, le résultat est trivial; si- tion f', sur l'intervalle [co, Cnl, aux points Co <
non, il existe b E]o,+oo[, tel que f(b) -:fa f(o), par c1 < · · · < Cn, nous donne donc l'existence d'un
exemple, f(b) > f(o). Par continuité de f, la valeur réel c Elco,Cn[C]o, b[, tel que (f')(nl(c) = 0, i.e.
intermédiaire ½(f(o) + f(b)) E]f(o), f(b)[ est prise f( n+ 1l (c) = 0 ; la récurrence est établie.
par f, i.e. il existe a. E]o, b[, tel que f(a.) = ½(f(o)+
26.14. Là encore, faisons une récurrence sur n; si
f(b)). D'autre part, puisque limt--Hoo f(t) = f(o),
n = 1, c'est le théorème de Rolle usuel. Montrons
pour tassez grand, on a f(t) < ½(f(o)+f(b )) ; fixant alors que si la propriété est vraie pour un certain n,
un tel t = t 0 , la valeur intermédiaire ½(f(o) +f(b)) elle l'est pour n + 1 ; supposons donc que
est à nouveau prise par f sur l'intervalle ]b, t 0 [, donc
il existe 13 E [b, tol tel que f(i3) = ½(f(o) + f(b)). f(o) = f'(o) = • • • = f(nl(o) = f(b) = O.
En particulier, on a f(a.) = f(i3) donc le résultat
Par le théorème de Rolle ordinaire, le fait que f( o) =
annoncé découle du théorème de Rolle usuel.
f(b) assure qu'il existe c E]o, b[ tel que f'(c) = O.
26.11. On a Mais alors, l'hypothèse de récurrence appliquée à
<f>(o) = f(b)g(o) - g(b)f(o) = <f>(b), la fonction f' et aux points o et c au lieu de o
et b nous dit qu'il existe y E]o, c[c]o, b[ tel que
donc puisque (f')(nl(y) = 0, i.e. f(n+ll(y) = 0; la récurrence est
<t>'(x) = (f(b)-f(o))g'(x) - (g(b) - g(o))f'(x), établie.
le théorème de Rolle nous donne l'existence d'un 26.15. Puisque f'(o) <y< f'(b), on a évidem-
réel c E]o, b[ tel que ment g'(o) < 0 et g'(b) > O. Par suite, la fonction
(f(b) - f(o))g'(c) = (g(b) - g(o))f'(c). g ne peut être injective, sans quoi, puisqu'elle est
continue, elle serait strictement monotone et donc
Si g(t) = t, pour tout t E [o, b], on retrouve l'énoncé aurait une dérivée de signe constant. Ainsi, il existe
du théorème des accroissements finis. xo, x1 E [o, b], Xo < x1, tels que g(xo) = g(x1 ).
D'après le théorème de Rolle, il existe donc c E ainsi a= 1, 134724138 à 10- 9 près.
lxo, xdc]a, b[ tel que g'(c) = 0, i.e. f'(c) = y.
26.16. On a Un+l = f(Un) avec f(x) = ✓4+x. Chapitre 27
La fonction f étant croissante, la suite (UnlnEN est
donc monotone. On a u 1 = ✓4 + Uo = ✓4 + c donc
27.1. On note [t] la partie entière du réel t et
u 1 ), uo si et seulement si 4 + c ), c 2 , ou encore
Un = ,:t; (r1 + r2 + · · · + rnl- Il est facile de voir
c 2 - c - 4 ,::; 0, ce qui équivaut à O ,::; c ,::; 1+f7.
que [n/k] est le quotient de la division euclidienne
Le réel l := 1+f7 est le seul point fixe de f donc de n par k. Nous avons donc Tk = n - [n/k]k et
puisque f est continue, si {UnlnEN converge, ce ne
peut être que vers l := 1+f7. Or, si O ,::; c ,::; 1+f7,
une récurrence immédiate montre que (UnlnEN est
majorée par 1+f7 et donc converge en croissant
vers 1+f7. Si au contraire c), 1+f7 , (UnlnEN On reconnaît la somme de Riemann de la fonc-
est minorée par 1+f7 et donc converge en décrois- tion [1 /t]t sur [0, 1]. Comme cette fonction est in-
tégrable, alors la suite (Un)n;,1 est convergente de
sant vers 1+f7.
Comme cela a été remarqué dans le cours, on limite 1 - J~ [1 /t]tdt.
peut utiliser plus rapidement le théorème du point 27.2. Posons F{x) = J: f(t)dt. Comme F'(x) =
fixe ; en effet, puisque f' (x) = 2 fa+x,
f est claire- f(x) > 0, alors F est strictement croissante sur
ment contractante de rapport 1/4 et donc (UnlnEN [a, b] et donc une bijection de [a, b] sur [0, I], où
converge vers l'unique point fixe 1+f7 de f. I = J! f(t)dt. Pour k entre 1 et n - 1, nous avons
la relation xk(n) = F- 1{Ik/n). La quantité
26.17. On a Un+ 1 = f(Un), avec f(x) = 1;x2, XE
lE.+. La fonction f est décroissante, donc les suites 1
(u2nlnEN et (U2n+ilnEN sont monotones, de mo- Un= -(f(x1 (n)) + · · · + f(xn-1 (n)))
n
notonie contraire. Pour connaître la monotonie de
(u2nlnEN, il faut résoudre l'inéquation f o f(c)), c; n'est que la somme de Riemann de la fonction
celle-ci s'écrit f o F- 1 sur [0, I]. Elle est donc convergente de li-
t
mite J~ f o F- 1{s)ds. Le changement de variable
(c-1)3(c 2 +c+2),::;0
F- 1(s) = t montre que J~ fo F- 1{s)ds = J! f 2 (t)dt.
et donc, puisque le trinôme du second degré qui La suite (un)n;,l est donc convergente de limite
apparaît est toujours positif, (u2nlnEN est crois-
J! f 2 (t)dt
sante (et donc (u2n+1 lnEN décroissante) si et seule-
ment si c ,::; 1. La résolution de cette inéquation J! f(t)dt .
nous a montré en même temps que le seul point
fixe de f of est le réel 1. Ainsi, si c E [0, 1], par 27 .3. Posons, pour n assez grand, Vn = ln Un et
une récurrence immédiate, la suite (u2nlnEN (resp. notons M un réel tel que lfl ,::; M sur [0, 1] (un
(u2n+1 lnEN) est majorée (resp. minorée) par 1 et tel réel existe car f est continue sur [0, 1]). Le dé-
croissante (resp. décroissante), donc convergente et veloppement limité à l'ordre 2 en O de la fonction
par conséquent la suite {unlnEN converge vers 1 ; si t H ln(l +t) entraîne, pour n assez grand et k entre
1 et n, que
maintenant, c ~ 1, on obtient le même résultat sur
la suite (UnlnEN, avec seulement l'échange des rôles 2
1
ln ( 1 + :;;:f(k/n) ) - :;;:f{k/n)
1 1 ,::; ---::;;:z,
M C
des suites (U2nlnEN et (u2n+ ilnEN• 1

26.18. Posons f(x) = x 6 - x - 1 ; clairement f


où C est une constante positive. Nous avons donc
est strictement négative sur [0, 1] donc, puisque f
tend vers +oo en +oo, f s'annule sur ]1, +oo[. Mais
f'(x) = 6x5 -1 est strictement positive sur ]1, +oo[,
donc f y est strictement croissante et donc f n'y a
qu'une seule racine, soit a. On peut même préciser
que a E]l, 2[. Appliquons la méthode de Newton, De l'inégalité ci-dessus et de la convergence de
c'est-à-dire considérons la suite ( anlnEN définie par la somme de Riemann (1/n) L~=~ f{k/n) vers
J~ f(t)dt, on peut déduire que la suite (vnln;,1 est
f(an)
Œn+l = Un- f'(un)' ao = 1. convergente de limite J~ f(t)dt. La suite {un)n;,1
est donc convergente vers exp(J~ f(t)dt).
On sait que cette suite converge vers a; on obtient
27.4. La convexité de ljJ entraîne que 2. Nous avons

JY g(s)ds = xf(x) + JY
J x f(t)dt +
0 0 f(x)
g(s)ds.

Si f(x) ( y, alors pour tout s E [f(x), y], nous


avons x = g(f(x)) ( g(s). En intégrant cette in-
On déduit l'inégalité demandée, en utilisant la conti- égalité membre à membre, on obtient x(y-f(x)) (
nuité de ljJ et en passant à la limite. Jirxl g(s)ds, c'est-à-dire
27.5.
xy ( xf(x) + JY g(s)ds = Jx f(t)dt + JY g(s)ds.
1. Nous avons f(x) 0 O

Dans le cas y ( f(x), une preuve semblable conduit


2I(a) = [1n(a 2 -2acos0+l)d0 à l'inégalité demandée.
2n 3. On applique l'inégalité de la question 2 à la fonc-

I
+" ln(a 2 -2acos0+l)d0. tion f(t) =tp-l_

27.7.
Le changement de variable 0 H 0- 7t dans la der- 1. On commence par prouver le résultat pour une
nière intégrale conduit à fonction en escalier. Si f est une telle fonction, no-
tons (xk)O,;k,;n une suite finie de points de [a, b]
2I(a) = [(ln(a2 -2acos0 + 1)) telle que f soit constante sur ]xk, Xk+ 1 [ de valeur
ck, pour tout k entre 0 et n - 1. Nous avons, pour
x (ln(a 2 +2acos0+1))d0 tout À> 0,

= [ ln(a4 2a2 cos0 + 1)d0. b k~n-1 Jxk+


J f(t) sin(Àt)dt = .L. ck
1
-
sin(°Jlt)dt.
a k=O xk

A nouveau, le changement de variable 0 H 20


montre que I(a) = ½I(a 2 ). On en déduit alors que J! f(t) sin(Àt)dt est égal à
L'égalité k=n-1
, cos(Àxk) - cos(Àxk+ 1)
L Ck À •

I(l/a) = 1 J 2
2
2 ln(1/a (1-2acos0+a ))d0
0
" 2
k~O
En faisant tendre À vers +oo, on obtient
entraîne que
lim
J..---1+00
Jb f(t) sin(Àt)dt = O.
a
I(l/a) = -2nlnlal + I(a).
Maintenant, si f est intégrable, alors pour tout
E E JR~, il existe g et h en escalier vérifiant f = g + h,
2. Si a E [0, 1[, nous avons pour tout 0 E [O, 2n]
a 2 - 2acos 0 + 1 ( (1 + a) 2 . En intégrant membre à avec h positive et J: h(t)dt < €. Nous avons, grâce
membre l'inégalité, on obtient II(a)I ( 2nln(1 + a). à l'inégalité triangulaire,
La même preuve s'adapte au cas où a E] - 1, 0]. 1 J: f(t) sin(Àt)dtl (
À l'aide d'une récurrence, on peut montrer que
I(a2n) zn 1 J: g(t) sin(°Jlt)dtl + I J: h(t) sin(°Jlt)dtl.
I(a) = z;,-- pour tout n EN*. Comme II(a )1 <
2 2
2nln(1 +la nl), alors la suite I(a n) est bornée. En De l'inégalité
passant à la limite, on trouve I(a) = O.
3. La seconde identité de la question 1 et la ques-
1J: h(t) sin(Àt)dtl ( J: lh(t) sin(°Jlt)ldt ( E,
tion 2 montrent que si lai > 1, alors I(a) - 0 = nous déduisons
2nlnlal; on a donc I(a) = 2nlnlal.

27.6.
1 J: f(t) sin(°Jlt)dtl ( J: g(t) sin(°Jlt)dtl +
1 €.

1. Notons F(x) = J~f(t)dt + J~(xl g(s)ds. Nous Comme g est en escalier, il existe un A> 0 tel que
avons si À > A alors,

F'(x) = f(x) + g(f(x))f'(x) = f(x) + xf'(x), 1J: g(t)sin(°Jlt)dtlE.


c'est-à-dire que F et xf(x) ont la même dérivée; Nous en déduisons que, pour tout À> A, IF(°Jl)I ( 2E
comme elles coïncident en 0, nous en déduisons et nous avons ainsi bien montré que limÀ+oo F(°JI) =
l'identité demandée. O.
2. Soit G une primitive de f sur [a, b). Une intégra- Le changement de variable s = nt montre que
tion par parties montre que In = ¾
est égal à
J~:
1 sin slds ; on en déduit alors que nin

f(À) = [G(t) sin(Àt))~ -À f G(t) cos(Àt)dt. (p+ 1)rr


ne
k=q-1 J(k+ 1)rr
Isin slds + kf_ krr Isin slds+
J 1
Comme G est continue, grâce à la question 1, on
peut conclure que lim,\-;+oo f(À)/À = O. nd

27.8. Admettons pour l'instant que pour tous réels


+
J
qrr
1 sin slds

c et d tels que c ~ d, on a où p = [nc/1t) et q = [nd/1t).


Un calcul simple montre que
d 2
k=q-1 (k+ 1)rr
lim
n---t+oo J lsin(nt)ldt=-(d-c).
c 7t
L J lsinslds=Z(q-p-1).
k=p+l krr
Si f est une fonction en escalier sur [a, b], notons
(xk)O,;;k,;;n une suite finie telle que f soit constante, On peut voir facilement que
de valeur ck, sur l'intervalle )xk, Xk+ 1[. De l'égalité
1 J(p+l)n 1 Jnd
lim - lsinslds = lim - lsinslds
n ne
n--t+oo n---t+oo n Q7t

=Û.

Il en résulte que
on déduit que
2
lim In= 2 lim ([nc/1t)/n-[nd/1t)/n) = -(d-c).
z k=n-1 z Jb n---t+oo n---t+oo 7t
lim In= -
n---t +oo 7t
L.
k=O
ck[xk+l -Xk) = -
7C a
f(t)dt.

27.9. Si M = 0, alors f est identiquement nulle


Si maintenant f est intégrable, alors pour e E IR.~, et on a trivialement le résultat. Supposons M > 0
il existe g et h en escalier sur [a, b) vérifiant g ~ et fixons O < e < M. La continuité de f entraîne
f ~ g + h, h positive et J!
h(t)dt < e. Si on pose l'existence de c < d tels que si t E [c, dl, alors
k(t) = f(t) - g(t), l'inégrale In est égale à M - e < f(t). On peut donc en déduire que pour
tout t E [c, dl, (M-e)n < fn(t). En intégrant, nous

L b
g(t)I sin(nt)ldt +
Jb
a k(t)I sin(nt)ldt
obtenons alors

et
Des inégalités

-2 Jb f(t)dt = -2 Jb g(t)dt + -2 Jb k(t)dt.


1ta 'TCa 7ta
on déduit que
Des inégalités O ~ k(t)I sin ntl ~ k(t) et
J! h(t)dt < e, on déduit J!
k(t)I sin(nt)I < e et
J! k(t)ldt < e.
En utilisant le fait que g est en escalier et les ou encore
deux inégalités ci-dessus, on obtient, pour n assez
grand,

On peut trouver un entier N tel que si n ;;, N, alors


2
(b-a) 11 n<1+ e etl--e-<(d-c) 11 n.
Ceci nous permet de conclure que In tend vers M M-e
J!
¾ f(t)dt quand n tend vers +oo. On peut donc en conclure que pour n ;;, N, on a
Il reste à prouver que

lim Jd Isin(nt)ldt = 3_(d- c).


n---t+oo c 7t
28.3. Si f était une telle primitive, sur IR.~, elle
diffèrerait de la fonction x H ln x d'une constante
et donc cette dernière serait rationnelle ; on aurait
Chapitre 28 ainsi, pour tout x > 0,
UnXn + ··· + Uo
28.1. Le prolongement effectué dans le cours est lnx = ~ - - - - - , - - ,
bmxm + · · · + bo
continu; l'unicité résulte de la densité de iQ) dans IR..
avec Un cf 0, puisque la fonction logarithme n'est
pas identiquement nulle et bm cf O. Mais, pour tout
28.2. x > 0, lnx 2 = 2lnx, d'où
1. On peut se ramener au cas où u > 1 puisque
uz = y équivaut à (1/u)-z = 1/y et que l'un des UnXZn + · · · + Uo = Z UnXn + · · · + Uo .
deux nombres u ou 1/ u est strictement supérieur à bmx2m + · · · + bo bmxm + · · · + bo
1. Par définition de l'égalité de deux fractions et l'iden-
2. Pour tout entier n E N*, on a, en utilisant la for- tification des termes de plus haut degré, on obtient
mule du binôme de Newton, et le fait que u - 1 > 0, que nécessairement m =net que Unbm = 2unbm,
i.e. la contradiction Un = O.
28.4. Posons, pour x E IR.+,
d'où un- 1 ;;, n(u-1). En appliquant cette inégalité
à u 1 /n au lieu de u, on obtient x2 x3
cp(x) = ln(l + x) -x + , 1.j.,(x) = cp(x) - .
2 3
u-1 ),n(u 11 n-l).
On a
3. Si À > 1 et n > (u - 1)/(,\ - 1), alors d'après xz -x3
l'inégalité précédente, cp'(x) = - - et 1.j.,'(x) = - - .
1 +x 1 +x
u-1
U1/n -1 :( _ _ < ,\- 1, Il en résulte que cp est croissante sur IR.+, donc pour
n
tout x E IR.+, cp(x) ;;, cp{0) = 0, i.e. l'inégalité de
d'où u 1 /n < À. gauche, et que 1.j., est décroissante, ce qui nous donne
4. En appliquant ce qui précède à À = yu-t, on l'inégalité de droite.
obtient donc que si t vérifie ut < y (et donc À > 1), 28.5. Il est clair que pour un tel endomorphisme,
alors pour n assez grand, on a f(0) = 0 d'où, pour tout réel x, f(-x) = -f(x);
puisque f ( 1) = 1 , une récurrence immédiate utili-
ut+¼< y.
sant la première équation nous donne que, pour tout
5. De même, si t vérifie ut > y et en prenant donc
entier naturel n, f(n) = n, et donc aussi, pour tout
entier relatif n, f(n) = n. Toujours par la même
,\=ut /y> 1, on a pour n assez grand,
équation, pour tout entier naturel non nul n,

1 = f(l) = f(n(l/n)) = nf(l/n),


6. Il en résulte que le réel z défini par z = sup A, d'où f(l/n) = 1 et donc aussi pour tout couple d'en-
OÙ tiers naturels (m, n), avec m cf 0,

f(m/n) = f(m(l/n)) = mf(l/n) = m/n.


vérifie bien uz = y. En effet, si on avait u~ < y,
on pourrait trouver un entier n tel que uz+;;: < y, Ainsi, finalement la seule première équation nous
d'où z + ¾E A, ce qui contredirait la définition de donne que, pour tout rationnel r, on doit avoir
z; si on avait uz > y, par la question préc~dente, f(r) =r.
on pourrait trouver un entier n tel que uz-;;: > y. Maintenant, l'utilisation de la deuxième équa-
Mais alors, par définition d'une borne supérieure, tion avec la première implique que f est nécessaire-
on pourrait trouver un réel t E A vérifiant ment croissante car si x :( y, alors
1
z- - < t :( z,
n
et dans ce cas, par croissance de la fonction x H u x, Si donc x est un réel quelconque, on peut choisir des
on aurait suites adjacentes (rnlnEN et (r;,.)nEN de rationnels
y< uz-¼ <ut< Y, dont la limite est x; puisque pour tout entier n

puisque t E A, ce qui est absurde.


et que f est croissante, on a x f-l a cos wx + b sin wx; enfin, si k > 0, écrivant
k = w 2 , f est de la forme x f-l u ch wx + b sh wx.
f(rn) ~ f(x) ~ f(r'n), Mais d'après l'équation fonctionnelle, appliquée à
x = 0, f doit être paire; compte tenu que l'on doit
ce qui donne en passant à la limite, compte tenu du aussi avoir f(0) = 1, les seules possibilités restantes
fait que f(rn) = Yn et f(r~) = r~, l'égalité f(x) = x, sont donc
montrant que le seul endomorphisme de l'anneau lR
f(x) = 1 ou f(x) = coswx ou f(x) = chwx,
est l'identité.
28.6. Cette équation équivaut à dire que w étant un réel arbitraire. On vérifie immédiate-
ment que ces fonctions sont bien soultions de l'équa-
\lx E IR, f(x) = f(x/2), tion fonctionnelle et donc qu'au final, l'ensemble des
solutions de cette équation fonctionnelle est consti-
ce qui par itération nous donne tué de la fonction constante
\lx E lR, \ln EN, f(x) = f(x/2n). X f-l 0

Fixant x et faisant tendre n vers +oo, la conti- et des deux familles de fonctions
nuité de f en 0 nous donne f(x) = f(0), i.e. que
x f-l cos wx et x f-l ch wx,
f est coutante. Ainsi, seules les fonctions constantes
sont solutions de cette équation fonctionnelle (elles wER
le sont clairement). 28.8. Il faut d'abord se convaincre qu'une solution,
28. 7. Évidemment, la fonction nulle est solution; si elle n'est pas la fonction identiquement nulle, ne
cherchons désormais les solutions non triviales. Si s'annule jamais. Par continuité, une solution non
f est une telle solution, puisqu'elle est continue, on nulle f peut donc être supposée par exemple stric-
peut considérer l'unique primitive f de f sur IR, s'an- tement positive; la fonction g = ln f satisfait alors
nulant en O. On a alors, en primitivant en x l'équa- l'équation fonctionnelle
tion fonctionnelle et en effectuant un changement
V(x,y) E ffi:. 2 , g(x+y) + g(x-y) =2(g(x) +g(y)).
de variable (translation), que pour tous réels x et y,
Par des arguments classiques déjà utilisés dans des
f(x+y) + f(x-y)- f(y) - f(-y) = 2f(y)f(x).
exercices précédents, on montre alors que
Il existe évidemment un réel a tel que f(a) c/ 0,
\Ir E IQI, g(r) = r 2 g(l ).
sans quoi f et donc f seraient identiquement nulles.
L'écriture de l'égalité précédente pour x = a et y Par continuité de g, et densité de IQI dans IR, nous
quelconque, fait alors apparaître f comme une fonc- obtenons donc
tion de classe C1 sur IR, puisque f l'est. Mais alors,
de ce fait, f est même de classe C2 , et donc aussi \lx E IR, g(x) = x 2 g(l)
f par la même identité! En dérivant alors deux fois
et donc finalement que les solutions de l'équation
l'équation fonctionnelle par rapport à x, on obtient
fonctionnelle initiale sont les fonctions
que, pour tous réels x et y,

f"(x +y)+ f"(x-y) = 2f"(x)f(y).


u E IR.
De même, en dérivant deux fois par rapport à y,
28.9. La dérivée de cette fonction est égale à
f"(x+y) +f"(x-y) =2f(x)f"(y).
1-lnx l/x
Ces deux relations, prises en y = 0, nous donnent ~X '
alors que, pour tout x E IR, on a
donc la fonction est croissante sur ]0, e] et décrois-
f"(x)f(0) - f"(0)f(x) = O. sante sur [e, +oo[, avec un maximum atteint en e
et valant elfe. Comme 2 < e < 3 et 2 112 < 3 113,
Or, d'après l'équation fonctionnelle prise, en y = 0, sa plus grande valeur lorsque la variable prend des
et en un Xo tel que f(xo) c/ 0, on a 2f(xo) =
valeurs entières est atteinte en 3 et vaut 3 1 / 3 = v'J.
2f(x0 )f(0), i.e. f(0) = 1; ainsi, f est solution d'une
équation différentielle linéaire d'ordre 2, du type Donc si m et n sont des entiers non nuls, on a, dans
le cas où m ~ n, m 1 /n ~ n 1 /n ~ {/3 et dans le cas
y" - ky = O. où n ~ m, n 1 /m ~ m 1 /m ~ ?13, d'où le résultat.
Si k = 0, f est donc affine, de la forme x f-l ux + b; 28.10. On vérifie sans peine que cette fonction est
si k < 0, écrivant k = -w 2 , f est de la forme définie sur R D'autre part, elle est dérivable et sa
dérivée est constante et égale à 1 ; ainsi, elle est de 29.3. Commençons par dériver la formule du bi-
la forme x H x + b ; sa valeur en O nous donne la nôme. On a, pour tout j E {O, ... , k},
valeur de b, à savoir
k
((x-l)kJlil ~ L_ cL{-1t- 1 t(l-1) ... (l-j+l)xl-i.
1 1 1 + ½ ln2
b = argth- = - l n - -
1 = -.
l=j
3 2 1- 3 2
Donc, pour x = 1, on a, pour tout j E {O, ... , k- 1},

Chapitre 29 L ct(-11k- 1r1-1) ... (l-i+ 11 = o.


1

l=j

29.1. Montrons la propriété suivante : Pour j = k, cela donne seulement k! = k!.


Toutes les primitives d'une fonction polynôme sont La famille de polynômes (1, (X(X - 1) ... (X - j +
des fonctions polynômes. l))jE{O, ... ,k-lJ) forme une base de !Rk_i(X]. On re-
Soit f une fonction polynôme. Elle s'écrit marque qu'il n'y a pas de terme constant dans aucun
n
des polynômes (X(X-1) ... (X-j + l))jE{O, ... ,k-1)·
f(x) = L akxk. Donc chaque monôme Xi s'écrit sous forme de
combinaison linéaire des polynômes de la famille
k=O
(X(X-1) ... {X- j + l))jE{O, ... ,k-lJ· On en déduit
Les primitives de f s'écrivent que les sommes Sj sont des combinaisons linéaires
des dérivées de la formule du binôme prise en 1.
Ainsi, on trouve bien

t
avec bk = 0 1 pour k E 1, ... , n + 1. Donc Jf est
bien une fonction polynôme. Pour la dernière somme, on remarque que le mo-
Passons maintenant à la résolution de l'exer- nôme Xk est une combinaison linéaire des poly-
cice. La fonction nulle est une fonction polynôme. nômes (X(X- 1) ... (X-j + 1 l)iE{O, ... ,kJ, dont le co-
efficient devant (X(X - 1) ... (X - k + 1) est égal à
D'après la propriété précédente, la fonction p(p- l l
1. On a alors
est aussi une fonction polynôme. Ainsi, on montre
que toutes les fonctions p(p-k) sont des fonctions k-1
polynômes. Donc P est bien une fonction polynôme. sk = L (-11k-1-1c}J(-ll ... (l- k+ 11 + P{l).
1=0

29.2. Procédons par récurrence sur n. Le terme P(l) est une combinaison linéaire de termes
Pour n = 1, la dérivée de tan est de la forme
k-1
tan'(x) = 1 + tan2 (x) = P1 (tan(x)),
.L_{-l)k-l-lCkl( -1) ... (l-j + 1),
avec P1 (X)= X2 + 1. 1=0

Pour n = 2, le calcul donne avec j < k. On sait que ces derniers termes sont
tan"(x) =2tan(x)(l +tan 2 (x)) = P2(tan(x)), nuls. Donc
k-1
avec P2{X) = 2X 3 + 2X. sk = .[_(-l)k-l-lct1( -l) ... (l- k+ 1) = O.
Supposons que pour n donné, la dérivée n-ième 1=0
de la fonction tangente s'écrive Pn(tan(x)) avec Pn
un polynôme de degré n + 1 et de terme dominant
REMARQUE - Si on pose
n!. Dérivons
k
Si= .L_(-l)k-1-ICkli,
Le polynôme p;_ est un polynôme de degré n - 1 1=0

et de terme dominant (n+ l).n! = (n+ 1)!. Ainsi, alors on obtient en raisonnant comme précédem-
tanin+ 1l s'écrit ment

S; = 0, Vj E {O, ... , k- l} et Sk = k!.


avec Pn+ 1 un polynôme de degré n + 2 et de terme
dominant (n + 1 ) !. Ceci achève la récurrence.
29.4. Donc
1. On connaît le développement limité en 0 des ap- ln(l +8)
plications x H (1 +x)"'. En remplaçant(){ par½, on - -- x < ln(l + x), 1,/x E]0, 8 [.
8
obtient
En regroupant les deux inégalités, on obtient le ré-
sultat demandé.
29. 7. La fonction logarithme est concave. Donc,
2. La notation de Landau o(x 2 ) signifie« tend vers pour tout (x1, ... , Xn) E (IR~)n, on a
0 plus vite que x 2 ». Or, 10 000 est vraiment loin
d'être petit. L'approximation est donc loin d'être
bonne. On trouve en effet

vlOÎ = -9899 + 0(10000).


La fonction exponentielle est une fonction crois-
3. On cherche donc à utiliser la formule avec x pe- sante. On en déduit
tit. On remarque que

v'îoî = 1ov1foî.
On utilise alors la formule de la question 1. avec Ce qui donne
X= 0.01. Gn c( Sn.
4 4 On peut remplacer chaque Xi par 1/xi dans la for-
vlOÎ = 10(1 + ;0.01 - 110- + o(l0- )).
mule précédente
d'où
vlOÎ = 10.0050125 + o(l0- 3 ).
Une calculatrice donne

vlOÎ = 10.04987562. On inverse et on trouve

L'approximation est évidemment bien meilleure.


Cependant, o(l0- 3 ) ne signifie pas plus petit que
10-3_
REMARQUE - Â l'aide de la fonction x H 1/x
29.5. Prenons f: x He-x et g : x H x 2 . Leurs dé- qui est concave, on peut montrer Hn ,( Sn.
rivées secondes valent respectivement f" : x H e-x
et g" : x H 2. On a donc f"(x) > 0 et g"(x) > 0 29.8. Puisque f est convexe sur I et puisque K est
pour tout x. Pourtant dans l'intérieur de I, l'application f est continue sur
K.
2
(fog)"(x) = (4x 2 -2)e-x Soit x E K. D'après le cours sur les fonctions
convexes, l'application
et alors
(f o g)"(0) = -2 < O. g: [a, x[U]x, b] HIR
li H g(l1) = f(1.J)-f(x)
Ainsi, la composée f o g des deux fonctions convexes 1.J-X

f et g n'est pas convexe. est croissante et admet des limites à gauche g(x-)
29.6. La fonction f : x Hln(l + x) définie sur et à droite g(x+) en x vérifiant g(x-J ,( g(x+).
] - 1, +oo[ est strictement concave. En effet Comme K est borné, l'application g est bornée. Il
existe M > 0 tel que
Il -1
f (x) = (l +x) 2 < 0, 1./x E]-1,+oo[. 19(llll c( M, 'ill E K \ {x}.

Son graphe est donc situé sous ses tangentes et au- Ce qui s'écrit
dessus de ses cordes. L'équation de la tangente en 0
est li= f(0) + f'(0)x = x. Donc lf(lll -f(x)I c( Mill - xi, 'ill E K \ {x}.

ln(l + x) < x, 1./x E] - 1, +oo[\{0}. Comme cette inégalité est aussi vraie pour li = x,
on en déduit que f est M-lipschitzienne.
L'équation de la corde passant par les points (0,0)
Pour une fonction non lipschitzienne sur I lip-
et (8, ln(l + 8)) avec 8 > 0 est
schitzienne sur K, il suffit de prendre f( x) = x 2 et
ln(l +8) I = IR.
li= X.
8
29.9. Une fonction f: l-, l bijective est monotone. Si t E IR+ n V, on a :
Étudions séparément le cas f croissante et le cas f
décroissante. tcost -sin t
F'(t) =
Supposons que f est croissante. Alors f- 1 est aussi t2 ✓1 _ (si~t)2
croissante. En effet, on a
si~t -cost

x ( y {=} f(x) ( f(y), \l(x, y) E 12 . t ✓l -1 + ~ +o(t3 )


1 - ~-1 + ~ + o(t3 )
Ce qui s'écrit, en posant x' = f(x) et y'= f(y),
t ✓~ +o(t3 )
2
½t +o(t 3 )
t~y/J+o(tÏ
Puisque f est convexe, on a \1( x, y) E 12 , \I;\ E [O, 1]
=
v'3 (1 +o(t))
3
f(Àx + (1 - À)y) ( M(x) + (1 - À)f(y)
En intégrant, on trouve alors :

On compose par f- 1 . On obtient, en notant encore


x' = f(x) et y'= f(y), \l(x',y') E 12 ,\IÀ E [O, 1]
sin
arccos ( -t- t) = F(O) + v'3 t +
3
2
o(t )

Enfin, puisque F(O) = arccos(l) = 0, et en se servant


de la parité, on obtient finalement (sur V) :

Donc f- 1 est concave. sin t)


arccos ( -t- = v'3 o(t 2).
Supposons maintenant que f est décroissante. 3 t+
En suivant le même raisonnement, on trouve 2. On connaît le développement limité de ln(l +x)
\l(x', y') E 12 , \IÀ E [0, l]
et celui de ex en O. On cherche donc à les utiliser.
On a

Dans ce cas, f- 1 est convexe. On développe les exponentielles

29.10. Puisque f et f- 1
possèdent des dérivées se-
condes positives, elles sont convexes. D'après l'exer-
cice précédent, elles sont aussi concaves. Donc leurs
dérivées secondes sont aussi négatives. Nécessaire-
ment, leurs dérivées secondes sont nulles. Les fonc-
tions f et f- 1 sont donc affines, c'est-à-dire qu'elles
s'écrivent
ln(a' + b') = ln(2 + t(lna + ln b)+
1 t2
f(x) = ax+ b, f- 1 (y) =-y+ b', = ((lna) 2 + (lnb) 2 ) + o(t 2 )).
a 2
On sort le 2 gênant :
avec a, b et b' des nombres réels. Comme elles sont
bijectives, leur graphe est une des deux diagonales t
ln(a' + b') = ln2 + ln(l +
du rectangle lx J. On détermine ainsi les coefficients 2(lna + ln b)
t2 2 + (ln b) 2 ) + o(t 2
a, b et b 1 • Les intervalles l et J fixés, il n'existe que +
deux applications bijectives de classe <ef?2 à dérivées
4 ((ln a) )).

secondes positives et dont la réciproque est aussi de On développe le logarithme


classe <ef?2 à dérivées secondes positives.

29.11.

1. On pose F( t) = arccos ( si~ t). Cette fonction,


prolongée par continuité en 0, est dérivable sur un
voisinage V de O et elle est paire.
On obtient finalement puis
t
ln(at + bt) = ln2 + (lna + ln b)+
2
2
+ t4
(3z((lna)2
2
+ (ln b ) ) -1 2
ln a ln b) + o(t ).

3. On sait que
1 1 2
v'l+t= 1 + t- t +o(t2 ).
2 8
On remplace dans Jl + v'f+î
On obtient finalement
J1 + v'î+t = J1 + ½t- ½t 2 +o(t 2) 1 19 2 29 3
( 1 - t + t 2F = e- 1 1 + - t + - t + - t
1 [

✓1 + v'f+î 2
= 1 + ½(½ t - ½t ) - } ( ½t - ½t 2 ) 2 24 48
+o(t) 281 4 4 ]
2 + t + o(t ) .
J1 + v'f+î = 1 + ¾t- fit 2 +o(t ). 720
On remplace encore et on trouve au final : 5. Développons l'exponentielle p
1 2 2
J1 + J1 + v'l+t = 1 + ~t- 1; 8 t +o(t )

4. On transforme la formule afin de faire apparaître


une exponentielle
2
On a alors
(1 _ t + t2Jt = et ln(l-t+t ).

On développe le logarithme. Seulement pour arriver


au final à l'ordre 4, comme on divise le logarithme
part, il faut développer jusqu'à l'ordre 5
On obtient
2 22
(1 -t+t2 )t = exp (~[(-t+t )-~(-t+t ) +
t 2
~(-t+t2)3- ~(-t+t2)4 J
t

0
52
e- ds ='L --=----
P (

k~O
l)k t2k+l
k! 2k+ 1
+ o(t 2
P+1J.

3 4
+ 1(-t+t2)s +o(tsl]).
29.12. On commence par transformer l'expression
On développe les termes à l'intérieur de l'exponen- donnée afin de faire apparaître des fonctions bien
tielle sans tenir compte des termes dont la puissance connues
est supérieure ou égale à 6 (ils rentrent dans le o(t5 ))
1
-1
1
(1 + t)• = exp(- ln(l + t)).
2
(1 - t + t ) += exp ( ~ [ - t+t
2 t2 + t3 t

1 4 1 3 4 5 On va utiliser la formule de composition des dé-


-1t-3t+t-t veloppements limités. On doit commencer par déve-
lopper le logarithme
- ~t4 +t5-1t5 +o(tSJ]).

D'où t2 t3 t4 t5 t6 t7
2 2 1 ln(l +t) = t - - + - - - + - - - + - + o ( t7 )
2 1 2 3 4 5 6 7 .
(1 - t + t F = exp ( - 1 + t + t
2 3
1 1 On a développé jusqu'à l'ordre 7 à cause de la
+4t3-st4+o(t4 )).
t
présence du dans l'exponentielle. On introduit ce
développement dans l'exponentielle
On factorise par e- 1 puis on développe l'exponen-
tielle
t t 2 t3 t4 t5 t6
(t6))
1
(l+tF =exp(l--+- --+---+-+o .
234567

D'où
On utilise encore la méthode de composition des dé-
veloppements limités. On a
, t t2 t3 t4 t5 t6
(l+t)• = e exp(--+---+---+-+o(t 6 ))
234567 . _x_ = x-x 2 +x3 -x4 +o(x4 ).
l+x
Le terme dans l'exponentielle tend vers O et on
connaît le développement limité de l'exponentielle à Donc
tout ordre. Notons E le terme dans l'exponentielle.
On a
·(X)
sm - - =x-x 2+x3-x4--(x-x
1 +x
1
6
2+x3
-x 4 ) 3 +o(x4 ),

Calculons les coefficients du développement limité


un par un. Le coefficient constant est évidemment
1.
Le coefficient devant t est -½- Ensuite, on a
Le coefficient devant t 2 provient du terme en t 2 dans
E et du terme en t dans r 2 . Il vaut

Le coefficient devant t 3 provient du terme en t 3 dans


E, du terme en t dans r 3 et du produit t.t 2 dans r 2 .
Le calcul donne puis

1 1 1 1 1 1 5 sin x 2 5 3 2
--+-(--) 3 +2-(--)(--)=-- --.- = X - X + -X - -x4 + o(x4 ).
4 6 2 2 2 3 48" 1+smx 6 3

On continue avec la même méthode. Le coeffi- On trouve donc


cient devant t 4 vaut
-14- ( sm(--)
. x - -sinx
- -) =
sin x 1 +x 1 +sinx
~ +2~(-~)(-~) + ~(~) 2 +3~(-~)2(~)
-¾x4 + o(x4 )
5 2 2 4 23 6 2 3
x 4 + o(x4 ) ·
1 1 4 2447
+24(-2) = 5760" On en déduit
Le coefficient devant t 5 vaut . -1- ( sm{--)
. x
hm - -sinx
-.-) 5
= --.
x-;O sin 4 x 1+ x 1 + sm x 6

1 1 1 3 1 1 1 5 911 29.14.
(-4l) +24( 4 (-:zl 3l+ 120(-:zl =-2304·
1. Comme x ln x tend vers O lorsque x tend vers 0,
Le coefficient devant t 6 vaut on a
1 1 1 1 2 11 2 1 1 1 1 xx -1 = exp{xln x) - 1 = xln x + o(x2 ln2 x).
7 + :z( 2(-:zH-6l + 23s + (-4l) + 6( 3(-:zl s
+6(-! 1!r_! 1+ r! J3 ) + ~(4(-! J3 r-! 1 On a aussi
2 3 4 3 24 2 4
+6(-! )2 ( ! )2 ) + _!___5(-! )4 ! XX-X= exp(xxlnx) = eexp(xlnx)lnx,
2 3 120 2 3
1 1 6 81737
+720(-:zl = 193536. xx" = elnx(l+xlnx+o(x 2 In 2 x)l,

Finalement, on a trouvé

1 11 2 5 3
(l+t)• =e 1 - - t + - t - - t +2447
l ( 4
--t
2 24 48 5760
911 5 81737 6 xx' = x (1 + xln 2 x + o(x 2 ln 3 x)).
- 2304 t + 193536 t .
On en déduit
xxx ln x
lim - -
r xlnx+x2 In 2 x+o(x3 Jn4 x)
29.13. Comme sin x ~ 0 x, on doit faire un déve- xx-1
x:---tO+ x~~+ xlnx+o(x2 In 2 x)
loppement limité à l'ordre 4 de sin( 1 :x) - 1 ~~: x. =1.
2. On a déjà Le deuxième terme de l'expression devient

x(xx -1) = x 2 ln x + o(x 3 ln2 x).

On développe le numérateur
(1 +x)(Inx)/x = e(lnx)/x ln(l+x)
= e(Inx)/x(x-x 2 /2+o(x 2 ))
0 ex 3 ln(l + 1/x) =--; ln(l + u).
u
puis
(1 +x)(lnx)/x = elnx(l-x/2+o(x))

et finalement
Développons le logarithme.
xlnx
(1 +x) (Inx )/x = x(l - -2- + o(xlnx)).

On en déduit que

. (1 +x)(lnx)/x - X
hm--~-~-=
x->0+ x(xx - 1)
e e u2 u2
2 -ln(l +u) = - 3( u - - +-+o(u3 )).
lim -(x lnx)/2+o(x2 lnx) =-! u 3 u 2 3
x->0+ x 2 lnx+o(x2 lnx) 2·

29.15.
1. Posons u = 1/x. Lorsque x tend vers +oo, u
tend vers O. On peut alors appliquer les formules de
développement limité La différence est donc

On a déjà développé le terme (1 +u) 1 /u à l'exercice


13
1
(1 +u) 1 /u = e(l - u+o(u)).
2 1 e 11 1
Cela donne -(1 +u)l/u_ -ln(l +u) = e(- - -) +o(l).
u2 u3 24 3

On a aussi

On en déduit
Comme uln(-½u+o(u)) tend vers O lorsque u tend
vers 0, on a

lim (e-(l+u1 11ur=1.


U->Û

2. Posons encore u = 1/x. Le premier terme de


l'expression devient lim x 2 (1 + 1/x)x - ex3 ln(l + 1/x) = ~-
~oo 8

On utilise le développement de l'exercice 13

1 e u 11
-(1 +u) 11 u = -(1- - +-u2 +o(u2 )).
u2 u2 2 24
29.16. 29.17.
1. On utilise l'astuce 1 = t/t. Effectuons alors une 1. Cas n = 2.
intégration par parties. Pour tout A > x, nous avons La formule de Taylor-Lagrange à l'ordre 1 entre x
etx+hest
A -t2 [ le-t']A lJAe-t'
e dt = - - -- - - - -dt. hz
Jx 2 t x 2 x t2 f(x+ h) = f(x) + f'(x).h+ f"(c)
2
On fait ensuite tendre A vers +oo pour obtenir
où c E]x, x + h[. Ainsi, on a
+oo -t2 1 e-x' 1 J+oo e-t'
e dt = - - - - - - 2-dt. hz
Jx 2x 2x t lf'(x)lh = lf(x + h) - f(x) - f"(c)I ~ lf(x + h)I
2
C'est ce qu'on voulait avec hz
+ lf(x)I + 1f"(c)I.
2
On en déduit

-t 2 2
Comme ¾,- = o( e-t ) lorsque t tend vers +oo, les
théorèmes de comparaisons nous permettent d'affir-
mer que 2. La fonction <l> est définie sur JO, oo[. La dérivée
de
2
+oo e-t J+oo <l> est
- -dt = o( e-t' dt) <l>'{h) = _ 2Mo
JX 2
t Mz
X h2 + 2 .
et donc que La dérivée s'annule en h = 2JMo/Mz qui est défi-
nie si Mo et Mz sont non nuls. Si Mo est nul, alors
la fonction f est la fonction nulle et alors M 1 et Mz
sont nuls et les inégalités de Kolmogorov sont tri-

Posons I(x) = J: 00 2
e-t dt. On a
vialement vérifiées. Si M2 est nul, alors la fonction
f est affine et pour qu'elle soit bornée, elle doit être
constante. Alors M 1 = 0 et les inégalités de Kolmo-
I(x) x2 J+oo e-t2 gorov sont encore vraies.
--(-) = 1 - xe - 2-dt.
D1 X x t On a aussi
2 +oo -tl . lim <l>{h) = lim <l>{h) = +oo.
Posons f(x) = xex fx ¾,-dt. Il est clan que f h---tO h to+oo
est positive. Ensuite, puisque 1/t2 ~ 1/x2 pour tout
t ~ x > 0, on a Donc le point où la dérivée de <l> s'annule est le lieu
du minimum.
D'après la question 1), on a
f(x) ~ -1 J+oo ex 2- t 2dt.
X X
lf'(x)I ~ <l>{h), 'efh E]0,oo[, Vx ER
Effectuons le changement de variables u
Donc
v't 2 - x 2 . On obtient
lf'(x)I ~ <l>(2JMo/Mz) = 2JMoMz, Vx ER
1 J+oo ue-u2
f(x) ~ - v'u2+x2du.
x o uZ+xz On a bien
On élimine comme précédemment le dénominateur
3. Cas n = 3.
1 J+oo -u2 1 Il existe C1 E]x, x + h[ et cz E]x, x + 2h[ tels que
f(x) ~ ue du= - 2 •
2
X o 2X
hz h3 111
On en déduit f(x+ h) = f(x) +f'(x)h+ 2f"(x) + f {ci),
6

2. On procède comme à la question 1) pour obtenir


On en déduit que
e_X2 e_X2 3 J+oo e-t2
I(x)=---+- -d t.
2x 4x 3 4 x t4 f'(x)h+
1 2
~ f(x+ h)-f(x)-
h3
t 111 (c 1 )
2t"(x)h 6
puis Chapitre 30
4h3
2f'(x)h+2f"(x)h2 = f(x+2h) -f(x) - t"'(cz). 30.1.
3
1. Par définition, on a
Donc le couple (f'(x)h, f"(x)h2 ) est solution du
système linéaire y(t) -y(to)
u(t) = IIY(t)-y(to)II.
y + ½z=u
{ 2y+2z=v Donc
llu(t)II = IIY(t) -y(to)II = 1.
avec IIY(tl -y(tolll
u=f(x+h)-f(x)- ~ fm(c1) 2. Si u(tt) et u(t 0 ) existent, alors d'après laques-
et tion précédente et par continuité de la norme, on
4h3 a
v = f(x + 2h) - f(x) - f"'(c2).
3 llu(ttlll = llu(tolll = 1.
4. On a S'il existe une tangente en ta, alors les vecteurs
h3 u( tt) et u( t 0 ) sont colinéaires. Il existe donc À non
h3
lui ( lf(x+h)l+lf(x)t+ tf"'(ci)I ( 2Mo+ M3. nul tel que u(tt) = Àu(t0 ). On en déduit
6 6
De même
4h 3
lvl ( 2Mo + M3.
3 On a bien À = ± 1.
5. La résolution du système linéaire donne
3. Soit y : IR -+ IR2 le chemin défini par
f'(x)h = 2u- i et f"(x)h 2 = v - 2u.

On en déduit
On étudie la tangente en t = O.
lf'(x)lh ( 5Mo + h 3 M 3
2 3 t
lf"(x)lh ( 6Mo + ~h M3. ui(t)= - -
u( t l = u t - ittl .
6. Posons <1>1 : h -+
5
~
0
+ h 2M 3 et <1>2 : h -+ { 2( l - v'lttl
6;jo + jhM3.
Comme précédemment, pour obtenir les minima ab- On en déduit
solus des fonctions <l> 1 et <l> 2, il suffit de trouver le
point où leurs dérivées s'annulent.

<l>'(h) = _ 5Mo +2hM


1 h2 3

et Donc u(0+) = -u(o-).


, 12Mo 5 Soit y : IR -+ IR 2 le chemin défini par
<1> 2 (h) = - ~ + M3.
3
x(t) = t 2
Donc elles s'annulent respectivement en ( ~ ) 1/ 3 y(t) = { y(t) = t2.
et en ( 356:;13°) 1/ 3 . On en déduit, Vx E IR
On étudie la tangente en t = O.
1
u1(t) =
et Vx E IR u(t) = J2
1 .
{ u2(t) =
1 13 13
lf"(x)I ( (6(25/36) 113 + ~(36/5) 13)M6 M~ . J2
On en déduit
On en déduit les inégalités de Kolmogorov avec

C(3, 1) = 5(2/5) 113 + (5/2) 2 13

et
C(3,2) = 6(25/36) 113 + ~(36/5) 113 .
4. Posons Xn = u1 (tn) et Yn = u2(tnl- D'après la 30.4. Soit f: ll2 --t ll. Pour h = (h1, h 2 ) E ll2 fixé,
question 1, on a l'application (x,y) r i dftx.yJ(h) s'écrit

lim X~ +y~= 1.
n->oo

Donc les deux suites (xnl et (Ynl sont bor- of of


nées. Il existe donc une sous-suite (Xq, 1 ( n 1) nEN qui (x,y) ri )x,y)h1 + ély(x,y)hz.
0
converge. La sous-suite (ycp, (nJlnEN est encore bor-
née. Il existe donc une sous-suite (Yq,,(q,i(nJJlnEN
qui converge. Posons cp = cpz o cp1. Les deux sous-
suites (Xq,(nJlnEN et (Ycp(nJlnEN convergent.
En prenant les vecteurs particuliers (1, 0) et (O, 1),
30.2. Soient x et y dans [-1, 1]. On veut construire
une suite d'instants ltnlnEN telle que seulement si les applications (x, y) r i
(x, y) r ig~ (
x, y) sont linéaires. Alors
*(
on montre que (x, y) r i df(x,yJ (h) est linéaire si et
x, y) et

Soient 01 et 0 2 tels que


of
cos(01)=x )x,y) = ax+ by, V(x,y) E R 2 .
0
{ cos(02) =y·

On sait que Z + <XZ est dense dans lR. Prenons deux


suites d'entiers k~ et k~ tendant vers +oo telles que
On intègre par rapport à x
kl k2 02 - cx01
ex n + n--+ ln

Ainsi, on a
2
f(x, y)= Ïx + bxy + g(y),
cx01 + lncx~ --t 02[mod2n].

Posons tn = 01 + lnk~. On a

cos(tn) = cos(01 + ln~) = x, Vn EN et où a et b sont des réels. On dérive par rapport à y


{ cos(cxtnl = cos(cx01 + lncxk~) --t y.

Ainsi, (x, y) est dans l'adhérence de 1'image de l'arc


(ll,-y).
:~ (x, y)= bx + g'(y).
30.3.
1. Prenons les suites (xn) = (1/n) et (Ynl =
(1/n2 ). Elles tendent bien vers O. On a, pour tout
n, Yn = X~. Donc f(xn, Ynl = 1 pour tout n.
2. On a Puisque g~ est linéaire par rapport à y, on a

of (O, O) = lim f(x, 0) - f(O, 0).


OX X->0 X

Comme f(O,O) = 0 et dès que x est différent de 0, g'(y) = cy, puis g(y) = i11 + d.
f(x,O) = 0, on a
of
-;-(0,0) = lim O = O.
uX x-----tO
Les fonctions cherchées sont de la forme
On obtient de même

f(x,y) = ax 2 + bxy + cy 2 + d.
Le résultat n'est pas surprenant. L'existence de dé-
rivées partielles ne dépend que de la forme de la
fonction f le long des axes. Or, chacune des appli-
cations partielles x r i f(x,O) et y r i f(O,y) sont
identiquement nulles.
30.5. 4. On au= v o <I>. On écrit <I> = (<I> 1, <I>2). La loi
de composition des dérivées donne
1. L'espace des solutions est un sous-ensemble de
l'espace vectoriel des fonctions différentiables. La ou o<I>1
fonction nulle est clairement une solution. De plus, ox (x,11) = 01v(<I>(x,11))ilx(x,11)+
si u1 et u2 sont des solutions, alors, pour tout À
réel, on a o<I>2
02v(<I>(x, 11))ilx(x, 11).

o(u 1 + :\u2) = ou1 + Àou2 = ou1 + Àou2 D'où


ox ox ox 011 011
o(u1 +llu2)
011
De même, on obtient
Donc u1 + Àu2 est aussi solution. L'espace des so- ou
lutions est bien un espace vectoriel. (x,11) = 01v(x+11,x-11)
011
2. Soit u une solution de la forme u( x, 11) =
A(x)B(11). On a donc -02v(x+11,x-11).
L'égalité ~~ = g~ s'écrit alors
A 1 (x)B(11) = A(x)B 1 (11), \i(x,11) E IR 2 .
01v(x+11, x-11)+02v(x+11, x-11) = 01v(x+11, x-11)
Soit I un intervalle sur lequel ni A ni B ne s'annule.
On le suppose maximal i.e. si J est un autre inter- -02v(x+11,x-11), \i(x,11) E IR2.
valle contenant I et tel que ni A ni B ne s'annule sur On en déduit
J, alors J = I. On a
A'(x) B 1 (11)
\i(x,11) E 12 . Ainsi, la fonction v ne dépend que de la première
A(x) B(11)'
variable. On en déduit la conclusion
Les deux termes de l'égalité précédente dépendent
de deux variables indépendantes l'une de l'autre. Ils u(x,11) =v(x+11), \i(x,11) E IR2 .
sont donc constants. Il existe k E IR tel que, pour
tout (x, 11) E I 2 30.6.
?, 1 + 11 2 pour tout 11· De
112
1. Par convexité, e
A'(x) =k plus, l'application polynômiale 11 f-) 11 2 -11 + 1 ne
A(x) s'annule pas et est toujours positive. On peut donc
1
{ B (11) =k décrire r par une équation de la forme
B(11) .

On sait résoudre ces équations différentielles. Il


existe a 1 et a2 réels tels que Ceci est possible parce qu'on connaît la fonction ré-
ciproque de l'exponentielle. On ne connaît pas la
\ix E I fonction réciproque de 11 f-) e112 - 11 (cette fonction
V11 E I. est-elle bijective?). Il n'est donc pas possible d'écrire
11 en fonction de x.
Comme les fonctions A et B sont non nulles sur I, 2. L'ensemble r est l'ensemble tel que
les réels a 1 et a2 sont non nuls. De plus, la fonction
exponentielle ne s'annule jamais, donc par maxima- F(x,11) = e 112 -11-ex = O.
lité, l'intervalle I est la droite réelle toute entière.
On obtient, avec a= a1 a2, On peut donc utiliser le théorème des fonctions im-
plicites (TFI) afin d'exprimer 11 en fonction de x
au voisinage de chaque couple (x, 11) pour lequel
g~ (x, 11) ne s'annule pas.
3. On prend donc une fonction u : IR 2 ---iIR de la 3. Ona
forme u( x, 11) = cp (x + 11) avec cp : IR ---i IR dérivable.
Calculons les dérivées partielles
aF 2
(0, O) = (11 f-) 211e11 - 1)(0, 0) = -1.
011
a~= cp'(x+11)
!~= cp'(x + 11).
D'après le TFI, il existe une fonction cp définie au
voisinage de 0 avec cp(O) = 0 telle que

Les fonctions u de cette forme sont donc solutions. F(x, cp(x)) = O.


En dérivant cette équation, on obtient Chapitre 31
Dxf(x, <p(x)
<r'(x) = 31.1. Commençons par résoudre l'équation diffé-
Dy F(x, <p(x))'
rentielle homogène associée
où Dx F et Dy F désignent la dérivée partielle de F par
rapport à x, respectivement par rapport à -y. On (E') : -y" +4-y =0.
trouve
<r'(O) = -1. Nous la résolvons en complexe et nous reviendrons
aux solutions réelles à la fin. Les solutions de (E')
On peut continuer à dériver ainsi <p mais les cal- sont
culs deviennent de plus en plus longs et compliqués.
Nous utilisons donc une autre méthode. D'après le -y{t)=Ae2it+Be- 2it, A,BE:C.
TF1, la fonction <p a la même régularité que la fonc-
tion F donc <p est infiniment dérivable et possède un Pour résoudre l'équation (E), nous écrivons sin 2 sous
développement limité à l'ordre 3 en O. On sait que forme complexe
<p(0) = O. Posons alors
. 2 ( eu _ e-u) 2 1 e2it e-2u
<p(x) = ax + bx2 + cx 3 + o(x3 ). sm (t) = 2i = 2- 4 - -4-·
On en déduit
Nous séparons les différents termes complexes, puis
nous superposons les solutions pour obtenir une so-
lution de l'équation (E).
puis Commençons par résoudre
ecp(xl = a 2x 2 + 2abx3 + o(x3 ).
2

1
On remplace dans l'équation F(x, <p(x)) = 0 pour -y"+ 4-y = 2·
obtenir
Il existe une solution particulière évidente, la fonc-
tion constante t H 1/8.
Pour résoudre les deux autres équations, nous utili-
Les coefficients sont solutions du système
sons la méthode de la variation de la constante.
a+l =0 Résolution de
a 2 - b-½ = 0
{ 2ab-c-
¼=O.

Le développement limité de <p est


Considérons la fonction t H A(t)e 2it. Elle est solu-
1 7 tion de l'équation précédente si A est solution de
<p(x) = -x +
2x
2
- î/ 3 3
+ o(x ).

A" +4iA' =-~


30.7. 4·
1. Le polynôme X5 + 1 se factorise dans IC Nous trouvons que les solutions de cette équation
4 sont de la forme
xs + 1 = TI (X+ efü,;s).
j~O A'(t) = Àe-4it + i , À E C.
16
La seule racine réelle est donc -1 et a pour multipli-
cité 1. Nous n'avons besoin que d'une seule solution. Pre-
nons A'(t) = i/16. Alors A(t) = (it)/16.
2. Posons
Résolution de
F(x,a) =x5 + ax+ 1. " e-2it
-y +4-y = --4-·
On a
DF(-l 0)=4
DX ' . Nous utilisons la même méthode avec t H B(t)e- 2it
On peut donc utiliser le TF1 au voisinage de (-1 , 0). et nous obtenons une solution B(t) = -(it)/16.
Il existe une fonction <p définie au voisinage de 0 Finalement, nous avons trouvé pour solution parti-
telle que <p(0) = -1 et F(<p(a),a) = O. Donc pour culière
a proche de 0, l'équation polynômiale possède une
it 2· it 2· 1 t 1
solution proche de -1. -y(t) = - e i t - -e- i t + - = -- sin(2t) + -
16 16 8 8 g·
Cette solution est en fait réelle. Les solutions réelles
de l'équation (E) sont de la forme
Nous cherchons maintenant une solution particu-
lière pour chacun des termes du second membre de

l'équation non homogène.
1J(t) = Acos(2t) + B sin(2t) - ½sin(2t) + i- Résolution de l'équation

31.2. D'après la proposition 23.8, les solutions sont Cherchons une solution particulière de la forme
de la forme
1i(t) = atcos(2t)et.
1)(t) = (B(t) +À)e-A(tl,
Les calculs donnent
où A(t) = J-tan(s)ds et B(t) Jl/(1 +
cos(s))eA(slds. Maintenant l'intégration 1i"(t) -21i'(t) +51J(t) = -4asin(2t)et.

On prend a= -1/4.
A(t) = J-tan(s)ds = ln(cos(t)). Résolution de l'équation

Nous ne prenons pas la valeur absolue du cosinus


car, sur l'intervalle choisi, le cosinus est positif

A(s) I () Nous ne connaissons pas a priori de solution par-


B(t) =
I e
1 + cos(s)
ds = cos s ds.
1 + cos(s)
ticulière. Nous utilisons donc la méthode de la va-
riation de la constante et, pour simplifier les cal-
culs, nous passons en complexe. Il suffit de résoudre
Pour calculer cette primitive, nous utilisons le chan- l'équation
gement de variables classique u = tan(s/2) 1) Il - 21) I + 51) = eit'

B(t) = I 1 - u2 1 2du
l+u21+1-u2J+u2
2
= J1 - u2 du
l+uz .
puis de prendre la partie réelle. Posons 1J (t) =
A(t)e(l+Zi)t_ La fonction 1J est solution de l'équa-
l+u
tion précédente si A est solution de l'équation
Nous décomposons en éléments simples
A" +4iA' = e-(l+ilt_
B(t) = J-1 + 1 : u2 du. Les solutions de l'équation homogène associée sont
de la forme
Nous trouvons alors A'(t) = Àe- 4 it.
B(t) = -tan(t/2) +2arctan(tan(t/2)) Nous utilisons encore la méthode de la variation de
= 1 - tan(t/2). la constante. La fonction À doit vérifier

Les solutions de l'équation sont de la forme

1J(t) = _l -tan(t/2)+À_ Donc


cos(t)
Puis
REMARQUE Nous pouvons aussi écrire
- A'(t) = __1 __ e-(1+tlt_
l'équation sous la forme -1 +3i
Nous obtenons
, cos(t)
(1J(t) cos(t)) = ( ).
1 +cos t
Les calculs pour résoudre cette équation sont les
Nous en extrayons la partie réelle pour obtenir la
mêmes que les précédents.
solution particulière cherchée
31.3. Commençons par résoudre l'équation homo-
gène associée

Finalement, les solutions de l'équation de départ


sont de la forme
Les racines du poynôme caractéristique de cette
équation linéaire à coefficients constants sont 1 ± 2i.
Donc les solutions sont de la forme
1J(t) = Asin(2t)et + B cos(2t)et - i cos(2t)et+

3 4
1i(t) = Asin(2t)et + Bcos(2t)et. ( cos(-t) + sin(t))e-t.
25 25
Finalement, les solutions de (E2) sont de la forme
31.4. Les solutions de l'équation homogène associée
à (E1) sont de la forme

Nous utilisons ensuite la méthode de la variation de


la constante. La fonction y(x) = ,\(x)ex est solution 31.5.
de (E1 ) si la fonction À vérifie
1. Considérons le monôme de plus haut degré Untn
À1 (x)ex = arctan(ex). d'une solution polynômiale P. L'équation étant ho-
mogène, le polynôme (t2 + 1)P" - 2P est nul. Donc
Il s'agit donc de calculer son terme de plus haut degré aussi. Or, le coefficient
associé vaut (n( n - 1) - 2) Un. Puisque Un est non
,\(x) = f arctan(e 5 )e- 5 ds. nul, le degré n vérifie n 2 - n - 2 = O. Les solutions
de cette équation sont 2 et -1 . Le polynôme P est
Effectuons le changement de variables u = e 5 de degré 2.
2. Posons p(t) = ut2 + bt +cet cherchons les co-
I arctan(e 5 )e- 5 ds =
I
arctan(u)
u2 du. efficients a, b et c pour que p soit solution de (E).

Nous intégrons par parties


(t 2+ 1)p"(t)-2p(t) = 2u(t 2+ 1 )-2ut 2-2bt-2c = O.
arctan(u) du= [- arctan(u)] + J 1 du.
J u2 u u(l + u 2 ) Le polynôme p est donc de la forme
Nous décomposons la fraction rationnelle de la se-
p(t) = u(t 2 + 1).
conde intégrale en éléments simples
1 ex au+ b Nous choisissons la solution non nulle la plus simple
~-~~=-+---
u(l+u2) u l+u2 ·
Nous utilisons la méthode des pôles pour montrer p(t) = t 2 +].
que ex = 1, puis la méthode d'identification donne
a= -1 et b = O. Nous avons 3. Soit y une fonction deux fois dérivable. Alors
la fonction z = y/p est aussi deux fois dérivable.
1
En effet, le polynôme p ne s'annule pas sur lFt La
Ju(l +u2 ) du=J.!_du-J-
u l+u
u-du 2
fonction z est donc bien définie sur JR, ainsi que sa
1 dérivée z' = (y'p - p'y)/p 2 et sa dérivée seconde
ln(u) - + u 2 ).
2 ln(l z" = (p(y"p-p"y)-p '(y'p-p'y))/p 3 . On peut
Nous en déduisons donc écrire toute fonction deux fois dérivable y sous
la forme p x z, avec z deux fois dérivable.
1
,\(x) = -arctan(ex)e-x + x - ln(l + e 2x).
2 4. Soit y = p x z une solution de l'équation diffé-
rentielle (E). Nous avons
Les solutions de (E 1) sont de la forme

(t 2+1)y"-2y = (t 2+l)(p"z+2p'z'+p z")-2pz = O.

Utilisons la même méthode pour trouver les so- Or, p est solution de (E), donc
lutions de (E2)-
Les solutions de l'équation homogène associée sont (t 2 + l)p"z-2pz=0.
de la forme
y(x) = Àe-x. Nous en déduisons que Z = z' est solution de l'équa-
tion
La méthode de la variation de la constante nous
amène à calculer (t 2 + 1)(2p'Z +pZ') = O.

À(x) = Jarctan(ex)exdx. Comme t 2 + 1 ne s'annule pas sur lR et grâce à l'ex-


pression de p, nous obtenons que Z est solution de
Les calculs sont similaires et plus simples. Nous l'équation (E')
trouvons
4
(E'), Z' + t2 +
t 1 Z = o.
5. Les solutions de (E') sont de la forme

•• ds =À
Nous cherchons des constantes A, B telles que la
fonction f = A cos +B sin vérifie l'équation de dé-

Z(t)=Àe - f -;z-:;:,
1 , ÀER part. Cette équation doit être vérifiée en particulier
(1 +t 2 ) 2 pour x = O.
Il faut encore intégrer pour obtenir z
B = f'(0) = f(2005) = Acos(2005) + B sin(2005).

Comme cos(2005) est non nul, nous prenons A =


B(l - sin{2005))/ cos(2005). Nous avons alors
Nous décomposons en éléments simples
1 + s2 - s2 s2 f(x) = cos{1005) ((1 - sin(2005)) cos{x)
(1 + s2)2 1 + s2 - (1 + s 2 )2 ·
+ cos(2005) sin{x)).
Nous intégrons par parties le deuxième terme et
nous trouvons Un peu de trigonométrie nous donne
3 1 t B .
z(t) =A( arctan(t)- +t 2 ), A ER f(x) = cos{ ( cos(x) + sm(x- 2005)).
2 21 20051
Nous savons que l'ensemble des solutions de (E) est Vérifions que cette fonction est solution de notre
un espace vectoriel de dimension 2. Donc nous avons équation de départ
trouvé toutes les solutions. Elles sont de la forme
3 1 t f'(x) = cos(1oo5) ( -sin(x) + cos(x -2005))
y(t) = ap(t) + A( 2 arctan(t) - 21
+ t 2 )p(t),

où (a,A) E JR:.2 . et
B
31.6. Nous utilisons la remarque faite à l'exercice f(2005 - x) = cos( ) ( cos(x - 2005)
2. Nous avons 2005

1 +sin((2005-x)-2005)).
y'+ tan- 1 (t)y =-.-(-)(y' sin{t) + cos(t)y)
sm t
Nous avons bien
.
1 (1J sm(t)
= -.-(-) ) 1.
sm t f'(x) = f(2005 - x), Vx ER
Sur l'intervalle JO, n[, le sinus ne s'annule pas. Ainsi,
une fonction 1J est solution de (E) si la fonction
z = 1J sin est solution de 31.8. Sur ] - oo, 0[ et sur ]1, oo[, la fonction x >--+
x(x - 1} est strictement positive. Donc, sur chacun
z' = sin(t) cos 2 (t). de ces intervalles, l'exercice se ramène à résoudre
l'équation
Nous intégrons
1 X
z(t) = Jsin(s) cos (s)ds = -~ cos (t) + À.
2 3 1J 1 + - - - y
x(x - 1)
= --
x-1·

Les solutions de (E) sont donc de la forme Les solutions de l'équation homogène sont de la
forme
y(x) =Àe-f ,1,'-11ds_
En décomposant en éléments simples la fraction ra-
tionnelle, nous trouvons facilement
31. 7. L'application cp: x H 2005 -x est dérivable, X
y(x) =À-- .
donc f' = f o cp est aussi dérivable. On peut donc X- 1
dériver l'équation f' = f o cp. Nous obtenons
La méthode de la variation de la constante nous
f"(x) = -f'(2005 - x) = -f{2005 - (2005 - x)) donne une solution particulière
=-f(x). s s-1
Les fonctions cherchées sont aussi solutions de
l'équation différentielle f" +f = 0 dont nous connais-
y(x)
f s-
= - - --ds = x.
1 s
Sur ] - oo, 0[ et sur ]1, oo[, les solutions sont de la
sons bien les solutions. Elles sont de la forme
forme
f(x) = Acos{x) + B sin(x), {A, B) E JR:. 2 •
Sur ]O, 1[, la fonction x H x(x - 1) est stricte- 31.9.
ment négative. Donc, sur cet intervalle, l'exercice se
1. Soit f une fonction bijective. Nous avons
ramène à résoudre l'équation

1 1 X
1J - - - - y = - - - .
x(x-1) x-1 Donc

Les solutions de l'équation homogène sont de la


forme Puis
( f-1 )'( ) 1
X = f'(f-l (x))'
Nous en déduisons
En décomposant en éléments simples la fraction ra-
tionnelle, nous trouvons facilement
x'(y) = _2_ = - ✓1 -112.
1J 1 1J
x-1
y(x) =À--.
X 2. Dérivons la fonction f: y H - ✓f7 +ln(y)-
La méthode de la variation de la constante nous ln(l - ✓î°7).
donne une solution particulière
f'(y) = __
Y_+.!_ ___
Y_ 1 .
s2 1 ✓f7 1J ✓f7 1 - ✓f7
I
X-
y(x) = (s-1)2ds-x-·
f'(y) = _11_(1 - 1 ) + .!.,
Nous décomposons en éléments simples ✓f7 1- ✓f=yI 1J

s2 2s - 1 2 1 f'(y) =- 1J + .!._
(s -1 ) 2 = 1 + (s -1 )2 = 1 + s -1 + (s -1 )2 · 1- ✓f=yI 1J

Nous trouvons ainsi une solution particulière y(l+ ✓î°7) 1


f'(y) = -----~---'- --~--+-
(1- ✓f=yI)(l + ✓î°7) 11·
1
y(x) =x+2ln(x-1)- - - .
x- 1
1+ ✓î°7 1
Nous en déduisons l'ensemble des solutions sur l'in-
f'(y) = +-.
1J 1J
tervalle ]O, 1[ Nous trouvons bien
1 x-1
y(x) = (x+2ln(x-1)- - - +;\)--. f'(y) = - ✓1-y2.
X- 1 X 1J
3. C'est immédiat puisque y(l) = O.
Index
Abel, 29, 223 Complet, 609
Adhérence, 585 Composée, 669
Affixe, 10, 93 Congruence, 21
Algèbre, 456 Conjugaison, 94
Algorithme Continuité uniforme, 716, 717
d'Euclide, 287, 323, 646 Coordonnées
de Babylone, 754 polaires, 99
Anagrammes, 193 Corestriction, 151
Angle, 18 Corps, 259, 266
orientés de vecteurs, 19 Cosinus hyperbolique, 814
Anneau, 259 Cotangente, 831
intègre, 265 Cramer, règle, 553
principal, 266 Critère de divisibilié, 286
produit, 260 Cycle, 227
Antécédent, 668
Application, 147, 148 D'Alembert, 689
linéaire, 462 Dedekind, 571
Arc Degré, 308
plan, 797 Dénombrement, 179
rectifiable, 797 Dénombrabilité, 197
Archimède, 593 Dérivation formelle, 313
Argument, 103 Dérivée, 729, 847
Arrangements, 189 à droite, 733
Associativité, 158 à gauche, 733
Asymptote, 37 Descartes, 29, 115, 303, 679
Déterminant, 11, 13, 395, 538
Base, 475, 486 de Vandermonde, 552
Bernoulli, 803 Développement
Bijection, 38 décimal, 639
réciproque, 155 en base b, 638, 639
Bijectivité, 154 en fractions continuées, 649
Bolzano, 617 impropre, 639
Borne limité, 862
inférieure, 577 Dichotomie, 711
supérieure, 164, 577 Difféomorphisme, 742
Branche Différence symétrique, 145
infinie, 36 Différentiel, calcul, 895
parabolique, 37 Dimension, 480, 487
Direction asymptotique, 37
Cardan, 87, 223 Diviseur de zéro, 265
Cardinal, 179 Division
Cauchy, 29,201,223,608 euclidienne, 640
Cercle trigonométrique, 20, 820 des polynômes, 317
Classe selon les puissances croissantes, 319
c 1 , 732 Domination, 718
d'équivalence, 162 Droite numérique achevée, 589
Cœfficients du binôme, 190 Droites, 571
Combinaisons, 190 vectorielles, 9
avec répétitions, 194
Commutativité, 158 Elément neutre, 158
1076

Ensemble, 139 d'Euler, 101


quotient, 162 de Cramer, 16
Equation de la série arithmétique, 120
aux classes, 186 de la série géométrique, 121
différentielle, 949 de Leibniz, 314
différentielle linéaire d'ordre deux, 962 de Moivre, 102
diophantienne, 295 de Poincaré, 185
Equipotence, 179 de Taylor pour les polynômes, 315
Equivalence, 722 de Taylor-Lagrange, 866
Espace vectoriel, 454 de Taylor-Young, 860
Euclide, 380 de Vandermonde, 192
Euler, 29, 51, 115, 680, 689, 803 du binôme, 123, 133, 190, 306
Exponentielle, 74, 99, 101, 105 du multinôme, 194
de base a, 806 Fraction rationnelle, 353

Famille, 150 Galilée, 679


libre, 481 Galois, 201, 303, 379
presque nulle, 476 Gamme naturelle, 664
Fermat, 763 Gauss, 379
Fermé, 585 Graphe, 148, 668
Fibonacci, 594 Groupe, 201
Fibre, 153, 671 abélien, 202
Fonction, 29, 148, 667 alterné, 235
p fois dérivable, 849 des unités d'un anneau, 263
hyperbolique, 69 engendré par une partie, 207
antipériodique, 35 produit, 203
bornée, 675 symétrique, 223
concave, 858
continue, 689, 705, 707 Hilbert, 380
contractante, 747
Idéal, 263
convexe, 677, 853
de JK[X], 321
croissante, 674
Image, 668
décroissante, 674
d'un morphisme, 212
dérivée, 730
directe, 152
dérivable, 727, 729
réciproque, 152, 671
de classe C00 , 849 Indéterminée, 306
de classe CP, 849
Inégalité
en escalier, 765 de Cauchy-Schwarz, 12
exponentielle, 72, 74, 99, 101, 105 des accroissements finis, 739
hèildérienne, 676 triangulaire, 12
hyperbolique, 80 Injectivité, 154
hyperbolique réciproque, 81 Intérieur, 585
indicatrice, 150 Intervalle, 583
intégrable, 763, 771 Inversibilité, 159
lipschitzienne, 675, 747 Isomorphisme de groupes, 214
logarithme, 70
logarithme de base a, 76 Lagrange, 107,223,303
majorée, 675 Lambert, 644
minorée, 675 Lebesgue, 764
puissance, 77 Leibniz, 727, 949
symétriques élémentaires, 332 Lemme
Formule d'Euclide, 293, 337
de Gauss, 290, 326
des bergers, 186
des noyaux, 535
Limite, 691
d'or, 653
dérivé, 729
premier, 292
Notation de Landau, 718
-
1077

à droite, 697 Noyau, 470


à gauche, 697 d'un morphism e, 212
inférieure, 615 Noyaux, lemme des, 535
supérieure , 615
Linéarisat ion, 125 Ordre
Liste, 189 d'un groupe, 204
Logarithm e, 69 d'un élément, 215
de base a, 76, 811 d'une permutatio n, 230
néperien, 808 total, 163
népérien, 70 Oresme, 678
Loi de compositio n, 157 Orthogona lité, 11
Oscillation s entretenue s, 966, 970
Majorant, 163, 576 Ouvert, 585
Matrices, 405
élémentair e, 442 Partie
équivalentes, 507 dense, 586
antisymétr ique, 438 entière, 580
calcul, 405 fractionna ire, 580
conjuguées, 507 génératric e, 480
en blocs, 416 majorée, 576
identité, 412 minorée, 576
Partition, 147
inversible, 418
Pas, 787
nilpotente , 441
Peano, 593
rang, 414
PGCD, 286, 290
symétriqu e, 438
de polynômes, 322
transposée , 420
Plus grand élément, 163, 576
triangulair e, 438
Plus petit élément, 163, 576
Mesure principale , 20
Point adhérent, 702
Méthode de Newton, 755
Polynôme , 303
Minorant, 163, 576
de Taylor, 861
Module, 96
irréductibl e, 335
Monoïde, 159
scindé, 329
Morphism e
Polynôme-exponentielle, 967
d'algèbre, 464
PPCM, 291
d'anneaux , 264
de polynômes, 327
de groupes, 210
Prépondér ance, 720
Primitive, 782
Neper, 69
Principe des intervalles emboîtés, 606
Newton, 727, 949
Niveau, 672 Problème de Cauchy, 959, 971
Produit, 115
Nombre
cartésien, 142
n, 826
scalaire, 11
e de Neper, 809
Projection , 529
équirépart i, 642
Prolongem ent, 151, 669
de Champern owne, 642
Ptolémée, 678
irrationnel , 640
Pythagore , 574
univers, 641
complexe, 87 Racines
1078

ne, 715 Superposition de sinusoïdes, 106


d'un polynôme, 327 Support, 226
de l'unité, 109 fini, 476
~ultiplicité, 330 Surjectivité, 154
Rang Symétrie, 529
d'une application linéaire, 500 glissée, 33
d'une matrice, 414 Système de numération, 283
Recouvrement, 147
Table de Cayley, 157
Réels, '535
Tangente, 732,831
Régularité, 160
Tartaglia, 88
Résonance, 971
Taux d'accroissement, 729
Règle de Cramer, 553
Télescopage, 118
Relation
Thalès, 380
binaire, 160
Théorème
d'équivalence, 162
de Bolzano-Weierstrass, 617
d'ordre, 163
des gendarmes, 603
de Pascal, 123
de Bezout, 288, 324
Reste intégral, 866
de Cauchy-Lipschitz, 960, 971
Restriction, 151, 669
de Cayley, 225
Riemann, 379, 764
de d'Alembert-Gauss, 328
Série, 748 de Heine, 708, 717
formelle, 459 de la division euclidienne, 282
Signature d'une permutation, 233 de Lagrange, 209
Sinus hyperbolique, 814 de Pythagore, 12
Sommes, 115 de Rolle, 738
de superposition, 959, 968
de Darboux, 791
des accroissements finis, 739
de Riemann, 787
des valeurs intermédiaires, 709
doubles, 128
du point fixe, 749, 750
trigonométriques, 126
fondamental de l'arithmétique, 294, 336
Sous-anneau, 262
Translation, 204
Sous-corps, 267
Transposition, 228
Sous-ensemble, 141
Triangle de Pascal, 123, 191
Sous-espace vectoriel, 454
Trigonométrie, 51
Sous-groupe, 205
additif de Z, 209 Valeur absolue, 573
Structure de groupe, 201 Valeur d'adhérence, 616
Subdivision, 765 Valuation, 308
Suites, 150, 5~3, 595 Variation de la constante, 953
adjacentes, 607 Vecteurs du plan, 6
arithmético-géométrique, 621 Viète, 115, 303, 679
bornée, 595 Voisinage, 586
convergente, 596 épointé, 691
croissante, 604
décroissante, 604 Weierstrass, 51, 571, 617
de Cauchy, 608
divergente, 596
homographique, 626
majorée, 595
minorée, 595
primitives, 119
rationnelle de Cauchy, 632
Mathématiques
Jean-Pierre Marco est maître de
conférences et responsable de
la préparation à l'agrégation
de mathématiques à l'université
Pierre et Marie Curie (Paris-VI). Ses
travaux de recherche portent sur les
propriétés dynamiques des systèmes
hamiltoniens et sur le problème des
Cours complet avec 1000 tests et exercices corrigés n corps, en relation avec la
mécanique céleste.
Laurent Lazzarini est maître
de conférences et participe à
Cet ouvrage est destiné aux étudiants de première année d'université en la préparation ou Capes et à
l'agrégation à l'université Pierre et
mathématiques (Ll). Il regroupe tout ce qui leur est nécessaire: un cours Marie Curie (Paris-VI). Ses recherches
complet et détaillé (algèbre, analyse, calcul différentiel) et 1000 tests et exer- portent sur la géométrie symplectiq ue
cices entièrement corrigés. et l' analyse sur les variétés.
Hassan Boualem est maître de confé-
Très progressif, Mathématiques Ll accueille l'étudiant au niveau qu'il a
rences à l'université Montpellier-li.
atteint en terminale scientifique et l'aide à passer au niveau supérieur de la L1 Son domaine de recherche est la
grâce aux huit premiers chapitres regroupés sous le titre « Bases ». Le cours est géométrie différentielle .
ensuite développé en 25 chapitres, assortis pour la plupart de « Compléments » Robert Brouzet est maître de
de niveaux variables permettant la découverte d'applications originales. conférences ou Centre universitaire
de formation et de recherche de
Particulièrement didactique, Mathématiques Ll s'applique à faire ressortir Nîmes. Ses recherches concernent la
les raisons d'être et le sens de toutes les notions introduites. La présentation géométrie différentielle.
des outils algébriques est ainsi toujours assortie d'un grand nombre d'exem- Bernhard Elsner est professeur agrégé
ples concrets (jeux, problèmes de stratégie, etc.) et les concepts analytiques sont ou lycée Saint-Exupéry à Créteil. Il
reliés aux questions, souvent empruntées à la géométrie ou à la physique, qui y enseigne les mathématiques aux
élèves de premières SES et Let de
les ont fait naître (nombres et idée de mesure des grandeurs, fonctions et idée
terminales STT.
de solutions d'équations différentielles, gammes musicales, etc.). En début de
Laurent Kaczmarek est professeur en
chapitre, une introduction donne un rapide aperçu de la genèse des idées. classe prépara toire PCSI ou lycée
François I" du Havre et intervient
Grâce à ses encadrés « Rappel », « Attention »et « Méthode »,Mathématiques Ll
dons la préparation à l'agrégati on de
souligne les notions fondamentales, les pièges à éviter et récapitule la marche mathématiques de l'université Pierre
à suivre pour résoudre les problèmes. Il incite à une lecture active à l'aide de et Marie Curie (Paris-VI).
nombreuses questions test (corrigées en fin d'ouvrage), grâce auxquelles l'étu- Denis Pennequin est maître de
diant peut contrôler au fur et à mesure l'assimilation des concepts. De très conférences à l' université Ponthéon-
nombreuses figures et illustrations facilitent la compréhension du cours. Enfin, Sorbonne/Pori s-1 . Ses travaux de
Mathématiques L1 propose un entraînement sérieux en offrant un grand recherche concernent les solutions
presque-périod iq ues de systèmes
nombre d'exercices d'applications tous intégralement corrigés.
discrets et continus.
Mathématiques Ll est le premier tome d'une série couvrant les besoins des
étudiants pour les trois années de la licence de mathématiques.

Public : étudiants en mathématiques, informatique et physique ; candidats au Capes de mathématiques


Cours : mathématiques , algèbre, analyse, calcul différentiel
Niveau : L1 ; préparation au Capes
612_50/ l
r--1 /
Pearson Education France 7258 0507 49 €
04/03/ 0


47 bis, rue des Vinaigriers
. 75010 Paris
Tél. : 01 72 74 90 00
Fax : 01 42 05 22 17 111111111 11
www.pearsoneducation.fr
9 782744 072581

Vous aimerez peut-être aussi