coursMPSI Fondements

Lycée Louis-Le-Grand, Paris Année 2016/2017
Cours de mathématiques
Partie I – Les fondements
MPSI 4
Alain TROESCH
Version du:
13 juillet 2017
Table des matières
1 Fondements logiques 7
I Rudiments de logique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
I.1 Formule propositionnelles, prédicats . . . . . . . . . . . . . . . . . . . . . . . . . . 7
I.2 Quantificateurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
I.3 Négations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
I.4 Quelques équivalences et tautologies formant la base du raisonnement . . . . . . . 10
II Démonstrations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
II.1 Composition d’un texte mathématique . . . . . . . . . . . . . . . . . . . . . . . . . 12
II.2 Comment construire une démonstration . . . . . . . . . . . . . . . . . . . . . . . . 13
II.3 Le Modus ponens. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
II.4 Démonstration par la contraposée. . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
II.5 Disjonction des cas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
II.6 Analyse-Synthèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
II.7 Raisonnement par récurrence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
II.8 Principe de la descente infinie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2 Ensembles 23
I Théorie intuitive des ensembles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
I.1 Définition intuitive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
I.2 Opérations sur les ensembles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
I.3 Unions et intersections sur une famille . . . . . . . . . . . . . . . . . . . . . . . . . 32
I.4 Fonction caractéristique (ou indicatrice) . . . . . . . . . . . . . . . . . . . . . . . . 33
II Paradoxes ensemblistes et axiomatisation . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
II.1 La crise des fondements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
II.2 Tentatives d’axiomatisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
III L’ensemble N des entiers naturels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
III.1 Axiomatique de N (hors-programme) . . . . . . . . . . . . . . . . . . . . . . . . . . 36
III.2 Propriétés de N . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3 Applications 39
I Qu’est-ce qu’une application ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
II Image directe, image réciproque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
III Injectivité, surjectivité, bijectivité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2 Table des matières
4 Sommes 51
P Q
I Manipulation des signes et . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
I.1 Définition des notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
P Q
I.2 Règles de manipulation des signes et . . . . . . . . . . . . . . . . . . . . . . 55
I.3 Changements d’indice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
I.4 Sommes télescopiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
I.5 Sommes multiples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
I.6 Produits de sommes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
I.7 Rapide introduction à la notion de série . . . . . . . . . . . . . . . . . . . . . . . . 61
II Sommes classiques à connaître . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
II.1 Somme des puissances d’entiers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
II.2 Sommes géométriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5 Combinatoire et dénombrement 69
I Notion de cardinal, combinatoire des ensembles . . . . . . . . . . . . . . . . . . . . . . . . 69
I.1 Définition du cardinal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
I.2 Règles de calcul sur les cardinaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
I.3 Comparaison des cardinaux en cas d’injectivité et surjectivité . . . . . . . . . . . . 72
II Combinatoire des ensembles d’applications . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
II.1 Applications quelconques ; p-listes . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
II.2 Lemme du berger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
II.3 Injections ; p-listes d’éléments distincts . . . . . . . . . . . . . . . . . . . . . . . . . 74
II.4 Surjections . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
III Sous-ensembles et coefficients binomiaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
IV Bijection, Déesse de la Combinatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
V Preuves combinatoires d’identités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
VI Introduction à la dénombrabilité (HP) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
6 Relations 83
I Définitions générales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
I.1 Relations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
I.2 Définition de quelques propriétés sur les relations . . . . . . . . . . . . . . . . . . . 85
II Relations d’équivalence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
II.1 Définitions et exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
II.2 Classes d’équivalence, ensembles quotients . . . . . . . . . . . . . . . . . . . . . . . 86
II.3 Congruences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
III Relations d’ordre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
III.1 Définitions générales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
III.2 Minimalité, maximalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
III.3 Le lemme de Zorn (HP) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
7 Les corps Q et R 95
I De Q à R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
I.1 Construction de Q . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
I.2 Relation d’ordre dans Q . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
I.3 De l’existence de nombres non rationnels . . . . . . . . . . . . . . . . . . . . . . . 97
I.4 L’ensemble R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
II Nombres réels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
II.1 Rappels sur les inégalités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
II.2 Division euclidienne dans R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
II.3 Densité de Q et R \ Q dans R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
II.4 Nombres transcendants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
Table des matières 3
II.5 Partie entière, partie décimale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

II.6 Représentation décimale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
III Intervalles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
III.1 Description des intervalles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
III.2 Intervalles et topologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
IV Droite achevée R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
8 Le corps C des complexes 115

I Les nombres complexes : définition et manipulations . . . . . . . . . . . . . . . . . . . . . 115
I.1 Définition, forme algébrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
I.2 Module . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
II Trigonométrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
II.1 Cercle trigonométrique, formules de trigonométrie . . . . . . . . . . . . . . . . . . 119
II.2 L’exponentielle complexe et applications à la trigonométrie . . . . . . . . . . . . . 124
III Racines d’un nombre complexe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
III.1 Racines n-ièmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
III.2 Cas des racines carrées : expression sous forme algébrique . . . . . . . . . . . . . . 130
IV Nombres complexes et géométrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
IV.1 Affixes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
IV.2 Alignement, orthogonalité, angles . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
IV.3 Transformations du plan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
IV.4 Isométries et similitudes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
IV.5 Caractérisation de certains objets géométriques . . . . . . . . . . . . . . . . . . . . 135
Préface
Ce cours est l’aboutissement de plusieurs années d’enseignement en MPSI au lycée Louis-Le-Grand. Il

est basé sur les programmes actuels de la classe de MPSI, ce qui n’exclut pas certaines digressions hors
programmes, dûment signalées. Ces digressions peuvent être des avances sur le programme de deuxième
année, ou tout simplement des développements permettant de comprendre à quoi peuvent servir les no-
tions introduites, ou introduisant des outils un peu plus sophistiqués que ceux du programme, permettant
de situer les résultats du programmes dans un contexte plus vaste. Ces développements sont utiles aux
meilleurs étudiants pour prendre un peu de hauteur sur les notions étudiées en MPSI, et les comprendre
au-delà de ce qui est demandé. Pour d’autres étudiants, en revanche, il pourra être plus profitable de ne
pas se focaliser dessus dans un premier temps, quitte à y revenir plus tard, lorsqu’ils auront acquis de
l’aisance avec les notions de ces chapitres, par exemple lors des révisions précédant l’entrée en deuxième
année.
En écrivant ce cours, il n’était pas dans mes objectifs de rédiger un cours complet. Notamment, les
développements des exemples et surtout les démonstrations des résultats ont été volontairement omis.
Cependant sous la pression de mes élèves, j’ai rajouté dans cette version des « éléments de preuve »,
donnant l’idée générale et le schéma des différentes démonstrations, sans entrer dans les détails techniques.
Ces éléments de preuve apparaissent en grisé afin de ne pas charger visuellement le polycopié. Leur but
est double :
• Permettre une certaine autonomie dans la découverte du cours : ces éléments de preuve sont conçus
comme des indications permettant de développer ensuite soi-même la démonstration des résultats,
comme un exercice. L’idéal est de pouvoir faire cette préparation avant que le cours soit fait en
classe ; sinon pendant le cours, mais les temps de réflexion sont plus courts.
• Faciliter les révisions, sachant que les preuves complètes sont pris par les élèves sur des feuilles
séparées du polycopié : lors des révisions, ces éléments doivent permettre de se remémorer rapide-
ment les grandes lignes des preuves, sans avoir à ressortir ses notes. Cherchez alors à développer
les détails des preuves par vous-même (par écrit une fois, et les fois suivantes, au moins dans votre
tête) ; si vous coincez, le recours aux notes prises pendant le cours s’impose.
Ce cours est constitué de 3 parties. La première, appelée « Fondements », regroupe toutes les bases logiques
et ensemblistes des mathématiques, ainsi que l’étude des nombres réels et complexes. La seconde partie est
le cours d’analyse, commençant par de l’analyse concrète (étude de fonctions, pratique de l’intégration
etc.) puis l’étude des suites, des approximations (Taylor, développements limités), des séries et enfin
des probabilités discrètes. La dernière partie est le cours d’algèbre, regroupant l’étude des structures
algébriques (groupes, anneaux, corps), avec notamment l’étude des anneaux de polynômes, puis l’étude
de l’algèbre linéaire sous son aspect vectoriel et matriciel, et enfin l’algèbre bilinéaire.
Je remercie tous les élèves de MPSI 4 (Bestial ! ! !) que j’ai eus depuis que je suis au lycée Louis-Le-Grand.
Vos remarques et vos nombreuses questions sont à la base de nombreuses améliorations de ces notes de
cours. Par ailleurs, l’intérêt et, pour certain, la passion que vous montrez pour les mathématiques m’ont
beaucoup motivé pour vous donner le meilleur de moi-même. J’ai beaucoup appris de vous, aussi bien du
point de vue pédagogique que du point de vue mathématique. N’est-ce par là l’idéal de l’enseignement,
quand l’enseignement devient échange ?
Je n’oublierai jamais aucun de vous, que vous ayez été l’étoile filant bien au-dessus de moi, ou l’élève
avançant avec beaucoup plus de peine. Vous avez tous été formidables.
Et que mes élèves actuels et mes futurs élèves se rappellent d’une chose : que vous soyez premier ou
dernier de la classe, votre place est bien là, en MPSI 4, et vous la méritez. Et lorsqu’à certains moments
de l’année, vous aurez l’impression d’être perdus, souvenez-vous que vous êtes forts en mathématiques.
1
Fondements logiques
La logique est la jeunesse des mathématiques

(Bertrand Russell)
La logique est l’hygiène des mathématiques

(André Weil)
La logique n’a ni à inspirer l’invention, ni à l’expliquer ; elle se contente de la contrôler et de

la vérifier.
(Louis Couturat)
En effet, l’effet fait le même effet à la cause que l’effet que la cause lui a causé de fait
(Professeur Shadoko par Jacques Rouxier)
Ce chapitre a pour but d’introduire les concepts fondamentaux des mathématiques, à savoir les bases-
même du raisonnement mathématique : Le but n’est pas l’étude de la logique formelle, ni même la
présentation rigoureuse de cegtte logique formelle, mais de voir comment des rudiments de la théorie
de la logique permettent une mise en forme rigoureuse de la structure de la pensée et du cheminement
logique. Cependant, cette structuration ne peut en rien remplacer l’intuition comme le dit ci bien René
Thom :
Car le monde des Idées excède infiniment nos possibilités opératoires, et c’est dans l’intuition
que réside l’ ultima ratio de notre foi en la vérité d’un théorème - un théorème étant, selon
une étymologie aujourd’hui bien oubliée, l’objet d’une vision.
(René Thom)
I Rudiments de logique
I.1 Formule propositionnelles, prédicats
La logique propositionnelle est l’étude des formules abstraites qu’on peut écrire à partir d’un certain
nombre de variables propositionnelles, représentées par des lettres. Nous nous contentons d’une définition
restant assez vague, l’objet n’étant pas l’étude de la logique formelle, mais une bonne structuration de la
pensée et de la démarche scientifique.
8 CHAPITRE 1. FONDEMENTS LOGIQUES
Définition 1.1.1 (Formule propositionnelle)

Une formule propositionnelle est formule liant des propositions élémentaires représentées par des lettres
(ou variables propositionnelles), à l’aide d’un certain nombre de symboles représentant des opérations
logiques :
• ∧ : et
• ∨ : ou
• =⇒ : implique
• ⇐⇒ : équivalent
• ¬ : non
À part ¬ qui se met devant une unique proposition, les autres symboles permettent de lier 2 propositions.
Un parenthésage rigoureux est nécessaire afin de rendre l’expression non ambigüe quant à l’ordre des
opérations à effectuer.
Exemple 1.1.2 (Formules propositionnelles)

Dans cet exemple, P , Q, R désignent des variables propositionnelles.
1. Ceci est une formule : (((P =⇒ Q) ∨ Q) =⇒ ((R ∧ P ) ⇐⇒ ¬Q)).
On n’affirme pas si elle est vraie ou fausse.
2. Ceci n’est pas une formule : (P =⇒) ∨ R∧
Chaque variable propositionnelle peut prendre une valeur de vérité : V (Vrai) ou F (Faux). Suivant les
valeurs de vérité prises par les différentes variables propositionnelles intervenant dans la formule, une
formule pourra alors être vraie ou fausse, ce qu’on déterminera en suivant les règles intuitive de véracité
liées aux symboles de connection utilisés et rappelées ci-dessous :
Définition 1.1.3 (Définition de l’interprétation sémantique des connecteurs logiques)

Soit P , Q deux variables propositionnelles. Les tables de vérité des formules ¬P , (P ∨ Q), (P ∧ Q),
(P =⇒ Q) et (P ⇐⇒ Q) sont définies par :
P Q (P ∨ Q) P Q (P ∧ Q) P Q (P =⇒ Q) P Q (P ⇐⇒ Q)
P ¬P V V V V V V V V V V V V
V F V F V V F F V F F V F F
F V F V V F V F F V V F V F
F F F F F F F F V F F V
Ces tables définissent en fait le sens logique des connecteurs.
Remarque 1.1.4
1. La table de vérité de l’implication se comprend bien en considérant sa négation : dire qu’une
implication P =⇒ Q, est fausse, c’est dire que malgré le fait que l’hypothèse P soit vraie, la
conclusion Q est fausse.
2. Ainsi, dire que P =⇒ Q est vraie ne sous-entend nullement la véracité de P . En particulier,
« P =⇒ Q » n’est pas équivalent à « P donc Q », qui affirme la véracité de P .
Il convient donc de faire attention à la rédaction : le symbole « =⇒ » ne peut pas remplacer
le mot « donc »
3. La même remarque vaut pour l’équivalence.
4. Par ailleurs, puisque si P est faux, P =⇒ Q est toujours vrai, pour montrer que P =⇒ Q est
vrai, il suffit de se placer dans le cas où P est vrai : on suppose que P est vrai, on montre que
I Rudiments de logique 9
Q aussi. Cela correspond à l’interprétation « Si P est vrai, alors Q est vrai ». En revanche, on
n’a pas de contrainte lorsque P est faux.
5. Ne pas confondre :
• P est une condition suffisante à Q : P =⇒ Q ;
• P est une condition nécessaire à Q : Q =⇒ P ;
• P est une condition nécessaire et suffisante à Q : P ⇐⇒ Q.
6. Pour montrer une équivalence P ⇐⇒ Q, n’oubliez pas de montrer les deux implications P =⇒ Q
et Q =⇒ P . N’oubliez pas la réciproque !
Exemple 1.1.5
• « n est multiple de 6 » est une ..... pour que n soit pair mais pas une ..... .
• x = 1 est une ..... pour que x2 = 1, mais pas une ..... . En revanche, si x est réel, x = 1 est une
..... pour que x3 = 1.
• Si f est dérivable sur R, f ′ (0) = 0 est une ..... pour que f admette un extremum local en 0, mais
ce n’est pas une ..... .
Définition 1.1.6 (Formules équivalentes)

Deux formules A et B seront dites équivalentes si elles prennent la même valeur de vérité l’une et
l’autre, quelle que soit la distribution de vérités donnée sur l’ensemble des variables propositionnelles
intervenant dans ces formules. Autrement dit, elles sont vraies et fausses sous les mêmes conditions sur
les variables propositionnelles. On note alors A ≡ B.
Définition 1.1.7 (Tautologie)

Ce sont des formules toujours vraies (pour toute distribution de vérité).
I.2 Quantificateurs
Dans un texte mathématique élaboré, Les variables propositionnelles représentent des propositions mathé-
matiques élémentaires : des formules, des équations, des faits mathématiques etc. Ces énoncés nécessitent
s’expriment souvent à l’aide de variables mathématiques, vouées à prendre des valeurs dans un ensemble.
Deux propriétés particulières liés à une formule utilisant une variable peuvent être particulièrement inté-
ressantes :
• le fait que la formule soit vraie pour toutes les valeurs possibles de la variable dans un ensemble
donnée
• le fait que la formule soit vraie pour au moins une valeur de x.
Pour formuler ces propriétés, on introduit deux symboles, appelés quantificateurs :
Définition 1.1.8 (Quantificateurs)

Soit F (x) une propriété dépendant d’une variable x.
• Le quantificateur universel ∀ :
∀x, F (x) est satisfait si et seulement si pour tout valeur possible prise par x, F (x) est vraie.
• Le quantificateur existentiel ∃ :
∃x, F (x) est satisfait si et seulement si il existe x tel que F (x) soit satisfait. Dans ce cas, même
s’il n’est bien souvent pas possible d’expliciter x, on peut se donner (c’est-à-dire fixer) un x qui
satisfait F (x) (donc choisir un x convenable).
Remplacer une variable quantifiée par une autre (indépendante des autres variables intervenant dans la
formule) ne change pas le sens de la proposition. Ainsi ∀x, P (x), et ∀y, P (y) sont équivalents.
Attention à bien remplacer toutes les occurrences de la variable x dans le champ d’action du quantificateur.
On dit dans ce cas que x est une variable muette.
I.3 Négations
Dans de nombreuses occasions, par exemple pour mener des démontrations par l’absurde ou par la
contraposée, il est important de savoir nier une expression mathématique (c’est-à-dire exprimer son
contraire) de façon efficace et rapide (et sans erreur !).
Cette négation peut se faire de façon purement formelle, en utilisant les règles de négation suivantes :
Propriétés 1.1.9 (Négation d’une formule)

On a les équivalences de formules suivantes (P et Q sont des formules) :
1. ¬¬P ≡ P
2. ¬(P ∨ Q) ≡ ¬P ∧ ¬Q (loi de De Morgan)
3. ¬(P ∧ Q) ≡ ¬P ∨ ¬Q (loi de De Morgan)
4. ¬(P =⇒ Q) ≡ P ∧ ¬Q
5. ¬(P ⇐⇒ Q) ≡ (P ⇐⇒ (¬Q)) ≡ ((¬P ) ⇐⇒ Q).
⊳ Éléments de preuve.
La démontration se fait en comparant les tables de vérité. ⊲
Propriétés 1.1.10 (Négation des quantificateurs)

(i) ¬(∀xP ) ≡ ∃x(¬P )
(ii) ¬(∃xP ) ≡ ∀x(¬P ).
Exemples 1.1.11
Niez les propositions suivantes :
1. ((A =⇒ B) ∧ C) ∨ ¬B
2. (((A ⇐⇒ B) ∨ C) =⇒ B) ⇐⇒ A
Exemples 1.1.12
1. Non linéarité d’une fonction de Rn vers Rm ; exemple de f : x 7→ x2 de R dans R.
2. Définition de la continuité d’une fonction f en x0 , puis négation. Exemple de la fonction H de
Heaviside.
I.4 Quelques équivalences et tautologies formant la base du raisonnement
Propriétés 1.1.13 (Quelques équivalences entre formules)

On a les équivalences suivantes (P , Q, R désignent des formules quelconques) :
1. (P ∨ Q) ∨ R ≡ P ∨ (Q ∨ R) (associativité de ∨)
2. P ∨ Q ≡ Q ∨ P (commutativité de ∨)
3. (P ∧ Q) ∧ R ≡ P ∧ (Q ∧ R) (associativité de ∧)
I Rudiments de logique 11
4. P ∧ Q ≡ Q ∧ P (commutativité de ∧)
5. P ∧ (Q ∨ R) ≡ (P ∧ Q) ∨ (P ∧ R) (distributivité)
6. P ∨ (Q ∧ R) ≡ (P ∨ Q) ∧ (P ∨ R) (distributivité)
7. (P ⇐⇒ Q) ≡ (P =⇒ Q) ∧ (Q =⇒ P ) (principe de la double implication)
8. (P =⇒ Q) ≡ (¬Q =⇒ ¬P ) (principe de la contraposée)
9. P =⇒ (Q ∨ R) ≡ (P ∧ ¬Q) =⇒ R
10. (P ∨ Q) =⇒ R ≡ (P =⇒ R) ∧ (Q =⇒ R) (disjonction de cas)
11. P =⇒ Q ≡ ¬P ∨ Q.
Proposition 1.1.14 (Quelques tautologies)

Les formules suivantes sont des tautologies :
1. P ∨ ¬P (principe du tiers exclus)
2. P =⇒ P
3. P ⇐⇒ P
4. P =⇒ P ∨ Q
5. P ∧ Q =⇒ P
6. (P ∧ (P =⇒ Q)) =⇒ Q (modus ponens)
7. ((P =⇒ Q) ∧ (Q =⇒ R)) =⇒ (P =⇒ R) (transitivité de =⇒)
8. etc.
On démontre ces équivalences et ces tautologies en dressant et comparant les tables de vérité. Cer-
taines peuvent aussi s’obtenir de façon déductive à l’aide des équivalences et/ou tautologies démon-
trées précédemment. ⊲
Nous terminons par quelques équivalences sur des expressions quantifiées, permettant de formaliser un
usage correct des quantificateurs.
Propriétés 1.1.15 (Interversion de quantificateurs)

1. ∃x, ∃y, P (x, y) ≡ ∃y, ∃x, P (x, y).
2. ∀x, ∀y, P (x, y) ≡ ∀y, ∀x, P (x, y).
Avertissement 1.1.16
Attention ! En général, on ne peut pas intervertir ∃ et ∀ !
Remarque 1.1.17
• Quelle différence de sens faites vous entre deux formules obtenues par interversion de ∃ et ∀.
• L’une des deux formules implique l’autre. Laquelle ?
• Ne jamais utiliser les symboles de quantification dans une phrase : il s’agit d’un symbole ma-
thématique, pas d’une abréviation.
Propriétés 1.1.18 (Règles de distributivité)

Soit P , Q des prédicats. On a :
• ∀x, (P ∧ Q) ≡ (∀xP ) ∧ (∀xQ)
• ∃x, (P ∨ Q) ≡ ∃xP ∨ ∃xQ
Remarque 1.1.19
A-t-on :
• ∀x, (P ∨ Q) ≡ ∀xP ∨ ∀xQ ?
• ∃x, (P ∧ Q) ≡ ∃xP ∧ ∃xQ ?
Propriétés 1.1.20
Si Q ne dépend pas de la variable x,
• ∀x, (P (x) ∨ Q) ≡ (∀xP (x)) ∨ Q
• ∃x, (P (x) ∧ Q) ≡ (∃xP (x)) ∧ Q
Propriétés 1.1.21 (Quantification d’une implication)

1. ∃x, (P (x) =⇒ Q(x)) ≡ ((∀x, P (x)) =⇒ (∃x, Q(x)))
2. Si la propriété P ne dépend pas de x, ∀x(P =⇒ Q(x)) ≡ P =⇒ (∀xQ(x)).
3. Si la propriété Q ne dépend pas de x, ∀x(P (x) =⇒ Q) ≡ (∃xP (x)) =⇒ Q.
4. En général, on peut seulement dire : (∀x(P (x) =⇒ Q(x))) =⇒ (∃xP (x)) =⇒ (∃xQ(x)).
II Démonstrations
II.1 Composition d’un texte mathématique
Un texte mathématique est constitué de :
1. définitions : des descriptions de certains objets constituant les briques de la théorie. C’est à voir
comme un raccourci de langage.
2. résultats : des énoncés mettant en jeu les objets définis dans la théorie, et donnant des propriétés
vérifiées par ces objets. Un résultat s’énonce sous la forme A =⇒ B. On distingue :
• les axiomes : des résultats qui sont des vérités fondamentales de la théorie, et qu’on ne démontre
pas (à considérer comme le cahier des charges de la théorie : on impose ces résultats, il n’y a
donc pas besoin de les montrer) ;
• les théorèmes : les résultats les plus significatifs, démontrés à partir des axiomes et de résultats
démontrés antérieurement ;
• les propositions : des résultats de moindre envergure ;
• les lemmes : des résultats à voir comme des étapes vers des résultats plus consistants (résultats
préliminaires, mais pouvant avoir leur intérêt en soi)
• les corollaires : des conséquences assez immédiates d’autres résultats, par exemple des cas
particuliers intéressants ;
3. démonstrations : des justifications de la véracité des résultats.
4. conjectures : des énoncés qu’on pense être vrais, mais qu’on n’a pas encore réussi à prouver.
II Démonstrations 13
Remarque 1.2.1
Un énoncé s’exprime souvent sous la forme A =⇒ B.
La proposition A regroupe les hypothèses
La proposition B regroupe les conclusions.
Ne pas oublier de bien apprendre toutes les hypothèses d’un résultat. Par exemple, considérons le
théorème suivant :
Soit f une fonction dérivable sur un intervalle I. Si f ′ est positive sur I, alors f est croissante sur I.
Il y a trois hypothèses dans cet énoncé : bien sûr, f ′ > 0, que personne n’oublie ; mais aussi f dérivable
sur I (sans laquelle l’énoncé n’a pas de sens), et (plus souvent oubliée) le fait que I est un intervalle
(sans quoi le résultat est faux !).
II.2 Comment construire une démonstration
Dans un exercice ou un devoir, c’est au candidat de construire soi-même la démonstration. Il est donc
intéressant d’avoir une démarche permettant d’aborder ces démonstrations de façon logique et structu-
rée. Bien entendu, l’application formelle de ces règles n’est pas suffisante, il faut à un moment de la
démonstration apporter une ou plusieurs idées personnelles !
La construction rigoureuse repose sur la structure logique de l’énoncé à démontrer, en se basant sur les
principes généraux suivants. Une formule mathématique étant construite en itérant des constructions
élémentaires de ce type, il faut bien appliquer ces principes de démonstration à chaque étape de la
construction, ce qui nécessite de dérouler la structure logique du résultat à montrer.
• Prouver une implication A =⇒ B :
On suppose que A est vrai, on démontre B. La rédaction commence par « Supposons que A est
vrai ».
Dans certaines situations, il peut être plus simple de montrer l’implication contraposée (voir plus
loin). Y penser si on bloque !
• Prouver une équivalence A ⇐⇒ B :
On prouve en deux temps A =⇒ B et B =⇒ A. On peut aussi raisonner par équivalences succes-
sives, mais dans ce cas, raisonner d’abord dans un sens, puis vérifier scrupuleusement qu’on peut
« remonter » toutes les implications.
• Prouver une conjonction A ∧ B :
On prouve en deux temps : on prouve A, puis on prouve B.
• Prouver une disjonction A ∨ B :
On prouve que ¬A =⇒ B, ce qui revient à supposer que A n’est pas vrai, et à en déduire que
B est vrai. On peut bien sûr intervertir A et B : un bon choix de la propriété que l’on nie peut
parfois simplifier la démonstration.
• Prouver ∀xA(x) :
La proposition A doit être vraie pour tout choix de x. On pose donc un x supposé quelconque
(c’est-à-dire sur lequel on n’impose pas de condition), et on montre que pour ce x, A(x) est vérifié.
Le fait d’avoir choisi x quelconque montre qu’alors A(x) est vrai pour tout x.
La démonstration débute alors systématiquement par « Soit x ... », puis on démontre A(x).
• Prouver ∃xA(x) :
Montrer une propriété existentielle est souvent ce qu’il y a de plus délicat. Dans le meilleur des
cas, on construit explicitement x qui convient. Pour s’aider à définir x convenable, on peut faire
une analyse/synthèse (voir plus loin).
Exemple 1.2.2
Structure d’une démonstration adaptée à la formule :
∀x, (A(x) =⇒ ∀y, (B(y) ∨ ∃zC(z)).
Avertissement 1.2.3
Attention ! Utiliser de façon trop systématique et trop poussée ces différentes règes peut parfois em-
pêcher de voir la ressemblance avec une propriété du cours, et peut nuire à l’intuition. Ne pas le faire
assez nuit très souvent à la rigueur de la rédaction. Il faut donc trouver un juste milieu.
Avertissement 1.2.4
La structure logique, puis les règles de la logique formelle, ne font que structurer la démonstration.
Une bonne rédaction passe par une mise en langage de ces règles : on rédige toujours à l’aide de
phrases, et non par un enchaînement de formules logiques absconses !
Nous voyons maintenant un certain nombre de méthodes classiques de démonstration.
II.3 Le Modus ponens.
Méthode 1.2.5 (Modus ponens)

Pour que B soit vrai, il suffit que A soit vrai et que A =⇒ B. Formellement :
(A ∧ (A =⇒ B)) =⇒ B
On vérifie donc l’hypothèse A, l’implication A =⇒ B, et on conclut que la conclusion B est vraie.
Avertissement 1.2.6
Attention, A =⇒ B n’est pas suffisant. Si on veut obtenir B, il faut aussi justifier la véracité de A !
(différence entre « =⇒ » et « donc »)
Le modus ponens est donc à voir comme une formalisation du « donc », déduction logique.
La situation typique d’utilisation du modus ponens est l’emploi d’un théorème : celui-ci s’écrit A =⇒ B,
où A est l’hypothèse et B la conclusion. Ainsi, pour montrer B, on vérifie que l’hypothèse A est satisfaite,
et on emploie le théorème A =⇒ B. Le modus ponens nous permet de conclure que la conclusion B est
vraie aussi.
Avertissement 1.2.7
Toujours bien préciser A et A =⇒ B. En particulier, quand on utilise un théorème, toujours bien
préciser le théorème utilisé d’une part (en donnant son nom), et la validité des hypothèses d’autre part.
Cela nécessite un apprentissage rigoureux du cours : la connaissance des hypothèses des théorèmes est
aussi importante que la connaissance de leurs conclusions (c’est cette bonne connaissance des hypothèses
qui assure aussi qu’on n’utilisera pas le théorème à tort et à travers dans des situations inadaptées).
On peut enchaîner des modus ponens grâce à la transitivité de l’implication :
Méthode 1.2.8 (Transitivité de l’implication)

Il ne s’agit de rien de plus que d’enchaîner des modus ponens :
A ∧ (A =⇒ A1 ) ∧ (A1 =⇒ A2 ) ∧ · · · ∧ (An−1 =⇒ An ) ∧ (An =⇒ B) =⇒ B.
C’est donc un raisonnement déductif en plusieurs étapes. La conclusion d’une étape fournit l’hypothèse
de l’étape de modus ponens suivante.
La situation typique est celle d’une démonstration composée de plusieurs étapes (par exemple l’utilisation
de plusieurs théorèmes).
II.4 Démonstration par la contraposée.

Il s’agit de l’utilisation de l’équivalence des deux propositions A =⇒ B et ¬B =⇒ ¬A.
Méthode 1.2.9 (Démonstration par contraposée)

Pour montrer A =⇒ B, on peut adopter la démarche suivante : on suppose que la conclusion B est
fausse, et on montre que dans ce cas, l’hypothèse A ne peut pas être vraie. Cela revient à montrer
¬B =⇒ ¬A.
Définition 1.2.10 (Contraposée)

L’expression ¬B =⇒ ¬A s’appelle la contraposée de A =⇒ B.
Ce type de démonstration apparaît dans de nombreuses situations.
Exemples 1.2.11
1. Soit n ∈ N. Montrer que si n2 est pair, alors n est pair.
2. Soit A, B, C trois ensembles. Montrer, sans utiliser les règles opératoires sur les ensembles, que
si A ∩ B = ∅ et A ∩ C = ∅, alors A ∩ (B ∪ C) = ∅.
M
3. Montrer que si x1 + · · · + xn = M , alors il existe i ∈ [[1, n]] tel que xi > n .
Ne pas confondre la contraposée ¬B =⇒ ¬A et l’expression ¬A =⇒ ¬B, qui n’est pas équivalente à
A =⇒ B, mais à sa réciproque !
Un cas particulier important de démonstration par la contraposée est le cas de la démonstration par
l’absurde. Il s’agit de la situation dans laquelle A est la propriété toujours vraie. Alors ¬A est la propriété
toujours fausse (il s’agit d’une contradition).
Méthode 1.2.13 (Cas particulier : démonstration par l’absurde)

Pour démontrer B, il suffit de montrer que le fait de supposer que B est fausse conduit à une contra-
diction.
Là encore, les démonstrations par l’absurde interviennent dans des situations très diverses. La démons-
tration par l’absurde la plus connue est certainement la démontration de Pythagore de l’irrationnalité de
√
2:
Exemple 1.2.14
√
Démonstration de l’irrationnalité de 2.
II.5 Disjonction des cas.

Ce principe de démonstration repose sur l’équivalence, déjà évoquée plus haut :
(A ∨ B) =⇒ C ≡ (A =⇒ C) ∧ (B =⇒ C).
Méthode 1.2.15 (Disjonction des cas)

Pour montrer A ∨ B =⇒ C, on peut séparer en deux cas : voir ce qu’il se passe sous l’hypothèse A, puis
sous l’hypothèse B. Ainsi on montre que si on suppose que A est vérifié, alors C aussi, et de même, si
B est vérifié, C aussi.
Un cas particulièrement important est le cas où A ∨ B est la proposition certaine (A et B regroupe

l’ensemble de tous les cas possibles). Dans ce cas, (A ∨ B) =⇒ C équivaut à C. On en déduit :
Méthode 1.2.16 (Démonstration par discussion)

Si A ∨ B est l’événement certain, pour montrer une proposition C, il suffit de montrer que A implique
C, et que B implique C.
Évidemment, ce principe se généralise dans le cas où la disjonction comporte un plus grand nombre de
termes.
Lors d’une démonstration par discussion, prenez garde à bien vérifier C dans tous les cas envisageables
(s’assurer que la disjonction initiale est bien la proposition certaine)
Souvent, la discussion n’apparaît pas de façon explicite ; la nécessité de la discussion intervient de façon
naturelle au cours de la démonstration. Ces discussions permettent souvent de gérer des cas particuliers
dans lesquels la démonstration générale n’est pas valide, ou alors de séparer l’ensemble des possibilités
en plusieurs classes sur lesquels la démonstration ne s’effectue pas tout à fait de la même façon.
Exemple 1.2.18
Montrer, sans utiliser le fait qu’il s’agit du résultat d’une somme classique, que pour tout n ∈ N,
n(n+1)(2n+1)
6 est entier.
II.6 Analyse-Synthèse
Ce procédé de démonstration est surtout adapté pour les problèmes existentiels (montrer l’existence d’un
objet vérifiant un certain nombre de propriétés). Le principe est le suivant :
Méthode 1.2.19 (Analyse-synthèse)

• Phase d’analyse : On suppose dans un premier temps l’existence d’un objet tel que souhaité, et
à l’aide des propriétés qu’il est censé vérifier, on obtient autant d’informations que possible sur
la façon de construire un tel objet.
• Phase de synthèse : lorsqu’on a suffisamment d’informations sur une façon de construire l’objet
recherché, on construit un objet de la sorte, de façon explicite, et on vérifie qu’il répond au
problème.
• Bonus : si la phase d’analyse fournit une expression explicite de l’objet recherché, ne laissant
pas le choix pour cet objet, cela fournit même l’unicité.
Remarque 1.2.20
• La phase d’analyse est la recherche de conditions nécessaires.
• La phase de synthèse est la donnée de conditions suffisantes.
Exemple 1.2.21
Soit a un réel et I = [−a, a]. Montrer que toute fonction f : I −→ R s’écrit comme somme d’une
fonction paire et d’une fonction impaire.
Remarque 1.2.22
Cet exemple est un cas particulier d’un exemple générique consistant à prouver qu’un espace vectoriel
se décompose en somme (ici somme directe) de deux sous-espaces vectoriels. Se reporter au chapitre
idoine pour ces notions.
Remarque 1.2.23
Dans le cadre d’un problème existentiel sans contrainte d’unicité, la phase d’analyse ne sert qu’à deviner
une expression répondant au problème. D’un point de vue de la rigueur de rédaction, cette phase n’est
pas indispensable, la phase de synthèse est suffisante pour répondre au problème existentiel. Cependant,
elle permet au lecteur de mieux comprendre comment on est parvenu à l’expression voulue. Sans cette
phase d’analyse, la réponse peut dans certaines situations paraître un peu parachutée.
Savoir si on rédige la phase d’analyse ou non dépend en fait de la complexité de la situation. Dans certaines
situations assez simples, on comprend bien l’expression obtenue, on peut parfois même la deviner sans
passer par une analyse. Dans ces cas, ne vous cassez pas la tête et faites directement la synthèse.
Soyez très précautionneux dans la rédaction d’une démonstration par analyse-synthèse. Dites bien de
façon explicite qu’il s’agit d’un raisonnement de ce type. En effet, comme la phase d’analyse consiste en
une recherche de conditions nécessaires, elle consiste souvent à supposer la conclusion vraie pour essayer
d’obtenir le maximum d’informations sur l’expression recherchée. Un lecteur pressé (et les correcteurs
au concours sont à classer dans cette catégorie) risque de prendre votre démonstration pour une pétition
de principe (montrer un résultat en le supposant vrai au départ !)
II.7 Raisonnement par récurrence

Le principe de récurrence est un axiome de la construction de N. Il s’énonce ainsi :
[P(0) ∧ (∀n ∈ N, (P(n) =⇒ P(n + 1))] =⇒ (∀n ∈ N, P(n))
« P(0) » est l’initialisation, « ∀n ∈ N, (P(n) =⇒ P(n + 1)) » est l’hérédité (ou le caractère héréditaire
ou transmissible).
Méthode 1.2.25 (Démonstration par récurrence simple)

Pour montrer une propriété P(n) dépendant d’un entier n ∈ N, on procède suivant le schéma suivant :
• Initialisation : montrer que P(0) est vraie.
• Hérédité : montrer que pour tout n ∈ N, P(n) =⇒ P(n + 1), ce qui se fait, d’après les principes
développés précédemment en posant n quelonque (« Soit n ∈ N »), en supposant que pour ce n,
P(n) est vrai, et en montrant qu’alors P(n + 1) l’est aussi.
• Conclure, en faisant référence au principe de récurrence.
Ce principe peut s’adapter à des situations légèrement différentes :

• Le rang initial peut être un autre entier (éventuellement négatif). Cela modifie aussi alors le rang
initial pour le caractère héréditaire.
• On peut faire des récurrences descendantes pour une propriété P(n), à démontrer sur un intervalle
du type ]] − ∞, n0 ]]. On initialise alors avec P(n0 ) et on montre que pour tout n 6 n0 , P(n) =⇒
P(n − 1).
• On peut faire des récurrences bornées, pour montrer une propriété P(n) sur un intervalle borné,
par exemple [[0, n0 ]]. On initialise alors avec P(0) et on montre que P(n) implique P(n + 1) pour
tout n ∈ [[0, n0 − 1]]. D’un point de vue purement logique, il ne s’agit pas de l’utilisation du
principe de récurrence, mais d’une itération (utilisation répétée, en nombre fini, du modus ponens,
par transitivité de l’implication).
• Ces récurrences bornées s’adaptent aussi au cas de récurrences descendantes.
• Nous verrons un peu plus loin deux variantes du principe de récurrence : la récurrence d’ordre k,
et la récurrence forte.
Exemple 1.2.26
P
n
n(n+1)(2n+1)
Montrer (par récurrence) que pour tout n ∈ N∗ , k2 = 6 .
k=1
N’oubliez pas l’initialisation ! Prouver l’hérédité à tout rang ne suffit pas !
Exemple 1.2.28
10n + (−1)n est-il divisible par 11 pour tout n ∈ N ?
Attention aussi à bien vous assurer que l’hérédité est valable à tout rang.
Exemple 1.2.29 (Le problème des crayons de couleur)

Nous montrons dans cet exemple que tout ensemble de crayons de couleur est monochrome. Nous
notons pour tout n ∈ N∗ , P(n) la propriété affirmant que tout ensemble de n crayons de couleurs est
constitué de crayons ayant tous la même couleur.
• La propriété P(1) est trivialement vraie, ce qui initialise la récurrence
• Soit n ∈ N∗ . Supposons que P(n) est vrai. Soit alors un ensemble de n + 1 crayons de couleur,
qu’on peut supposer numérotés de 1 à n + 1. En appliquant l’hypothèse de récurrence aux n
premiers crayons et aux n derniers crayons, le crayon 1 a la même couleur que les crayons 2 à n
qui on ont aussi même couleur que le crayons n + 1, ce qui prouve P(n + 1) (figure 1.1)
• D’après le principe de récurrence, on peut donc conclure qu’il n’existe au monde que des crayons
d’une même couleur.
Où est l’erreur ?
=⇒
Couleur commune
Figure 1.1 – Caractère héréditaire pour le problème des crayons de couleur
Méthode 1.2.30 (Récurrence d’ordre k)

Il s’agit d’une variante du principe de récurrence, s’exprimant ainsi :
((P(0) ∧ · · · ∧ P(k − 1)) ∧ (∀n ∈ N, P(n) ∧ · · · ∧ P(n + k − 1) =⇒ P(n + k))) =⇒ ∀n ∈ N, P(n).
• Principe : on utilise la propriété aux k rangs précédents pour montrer l’hérédité.

• Schéma de rédaction :
∗ Initialisation : montrer P(0), . . . , P(k − 1).
∗ Hérédité : poser n > 0, supposer P(n), . . . , P(n + k − 1), en déduire P(n + k).
∗ Conclure en faisant appel au principe de récurrence.
Ne pas oublier d’initialiser pour les k premières valeurs ! (sinon la première implication de l’hérédité
n’est pas valable)
On peut bien sûr adapter le principe dans le cas où le rang initial n’est pas 0.
Exemples 1.2.32
1. Soit (Fn )n∈N définie par F0 = 0, F1 = 1 et pour tout n > 0, Fn+2 = Fn+1 + Fn (suite de
Fibonacci).
Avec une mauvaise initialisation on peut « montrer » que Fn est divisible par 3, ce qui est
évidemment faux !
2. Soit n ∈ N. Montrer que Fn est paire si et seulement si n est multiple de 3.
Pour votre culture, ce dernier exemple est une situation particulière du résultat plus général suivant :
∀(m, n) ∈ (N∗ )2 , Fm∧n = Fm ∧ Fn ,
avec m = 3.
Voici une dernière variante du principe de récurrence :
Méthode 1.2.33 (Récurrence forte)

La récurrence forte est basée sur la propriété formelle suivante :
(P(0) ∧ (∀n > 1, P(0) ∧ · · · ∧ P(n − 1) =⇒ P(n))) =⇒ ∀n ∈ N, P(n).
• Principe : on suppose la propriété vraie à tous les rangs précédents pour la montrer à un rang
donné.
• Schéma de rédaction :
∗ Initialisation pour P(0) (une seule valeur suffit ici)
∗ Poser n > 0, supposer P(k) vrai pour tout k < n, et montrer qu’alors P(n) est vrai.
∗ Conclure en faisant référence au principe de récurrence.
Exemple 1.2.34
1. Tout nombre entier n > 0 admet une décomposition en nombres de Fibonacci distincts non
consécutifs (théorème de Zeckendorf)
2. Tout nombre entier n > 1 admet une décomposition en produit de nombres premiers.
Remarque 1.2.35
On retiendra du dernier exemple que le principe de récurrence forte est en particulier très utile dans
de nombreuses questions liées à des propriétés de divisibilité.
Théorème 1.2.36
Les trois principes de récurrence ci-dessus sont équivalents
La récurrence forte et la récurrence d’ordre k impliquent chacune la récurrence simple, car qui
peut le plus, peut le moins. Réciproquement, poser respectivement Q(n) = P(0) ∧ · · · ∧ P(n) ou
Q(n) = P(n) ∧ · · · ∧ P(n + k − 1), et appliquer le principe de récurrence simple à Q. ⊲
II.8 Principe de la descente infinie

Nous terminons sur une dernière méthode classique, plus anecdotique pour une grande part des mathé-
matiques, mais d’une telle efficacité pour certains problèmes d’arithmétique qu’on ne peut pas ne pas la
mentionner.
Méthode 1.2.37 (Descente infinie)

Le principe de la descente infinie est un mélange de démonstration par l’absurde et de démonstration
par récurrence. Soit (P(n))n∈N une propriété dont on veut démontrer qu’elle est fausse pour tout n ∈ N :
il suffit de montrer que si elle est supposée vraie à un certain rang n, il existe alors un rang 0 6 m < n
tel qu’elle soit encore vraie.
En effet en itérant alors ce procédé, on pourrait construire une chaîne infinie d’entiers strictement
décroissants telle que P(n) soit vraie, ce qui est impossible d’après la propriété fondamentale de N,
ce qui amène la contradiction recherchée. ⊲
Remarque 1.2.38
Formellement, le principe de descente infinie est la contraposée du principe de récurrence forte appliqué
à ¬P(n) : au lieu de montrer que si pour tout m < n, 6= P(m) est vérifié alors ¬P(m) l’est aussi, on
montre la contraposée de cette implication. L’initialisation provient alors du fait que pour P(0) ne peut
pas être vraie (l’existence de 0 6 m < n amenant une contradiction).
Exemple 1.2.39
√
• Variante de la démonstration de l’irrationnalité de 2
• Démonstration du théorème de Fermat dans le cas où n = 4 : il n’existe pas d’entiers non nuls
x, y et z tels que x4 + y 4 = z 4 (exemple non développé)
Note Historique 1.2.40

• La démonstration par l’absurde est déjà connue du temps de Pythagore (preuve de l’irrationnalité de
√
2)
• On trouve des prémices du raisonnement par récurrence dans les Éléments d’Euclide, mais cela reste
très vague. La vraie naissance du raisonnement par récurrence date de 1654, lorsque Blaise Pascal écrit
son Traité du triangle arithmétique.
• Pierre de Fermat met en place, à peu près à la même époque, le principe de la descente infinie, mélange
entre le principe de récurrence et la démonstration par l’absurde. Ce type de raisonnement aussi apparaît
déjà plus ou moins dans les Éléments d’Euclide, mais gagne vraiment sa notoriété grâce à Fermat. Il
est par exemple utilisé pour montrer le grand théorème de Fermat pour l’exposant 4.
2
Ensembles
Aus dem Paradies, das Cantor uns geschaffen, soll uns niemand vertreiben können.
(David Hilbert)
The finest product of mathematical genius and one of the supreme achievements of purely
intellectual human activity.
(David Hilbert, à propos de la théorie de Cantor)
Pour choisir une chaussette plutôt que l’autre pour chaque paire d’une collection infinie, on a
besoin de l’axiome du choix. Mais pour les chaussures, ce n’est pas la peine.
(Bertrand Russell)
La notion d’ensemble semble à première vue une notion intuitive évidente, ne nécessitant pas de précau-
tions particulières. Cette notion intuitive est à la base de toutes les mathématiques, depuis leur origine,
que ce soit l’arithmétique élémentaire (ensemble d’entiers, puis de divers autres types de nombres, utilisés
depuis qu’on sait compter), la géométrie d’Euclide à nos jours (une figure est un sous-ensemble du plan),
l’analyse (on étudie des fonctions définies sur des ensembles), ou l’algèbre moderne (étude des structures
algébriques, définies comme des ensembles munis d’un certain nombre de lois supplémentaires).
Longtemps, les mathématiciens se sont contentés de ce point de vue intuitif, sans chercher à formaliser
cette notion. Ce n’est qu’à l’aube du XXe siècle qu’on s’est penché sur cette formalisation, qui a bien
failli faire vasciller l’édifice mathématique sur ses fondations. En effet, Cantor, puis Russell au travers de
son célèbre paradoxe, ont montré qu’on ne pouvait pas se contenter de cette approche intuitive, et que
celle-ci amenait des contradictions si on admettait que toute collection pouvait être un ensemble : ainsi,
le paradoxe de Russell montre qu’il ne peut pas exister d’ensemble des ensembles. Les mathématiciens
pensèrent même un moment qu’il n’était pas possible de donner une formalisation correcte de la notion
d’ensemble ; cela aurait signifié ni plus ni moins que la faillite des mathématiques. Heureusement, au prix
d’une axiomatique assez lourde, les mathématiciens logiciens de l’époque ont réussi à mettre en place cette
formalisation. On peut dire que cette « crise des fondements » a marqué la naissance des mathématiques et
de la logique moderne, par une formalisation systématique de toutes les notions utilisées. Depuis, l’édifice
mathématique a des fondements solides et ne s’assoit plus sur des sables mouvants. Même la notion
d’indécidabilité, dans un premier temps assez choquante, a fini par trouver sa place dans cet édifice
solide, par une latitude qu’autorisent ces résultats indécidables dans le choix de l’axiomatique initiale.
Ainsi, par exemple, l’axiome du choix dont on parlera dans la suite de ce chapitre étant indécidable (pour
l’axiomatique de Zermelo-Frankel), on pourra construire deux théories mathématiques, l’une incluant
l’axiome du choix, l’autre, beaucoup plus pauvre, ne l’incluant pas. Ainsi, dans certaines théories, l’axiome
24 CHAPITRE 2. ENSEMBLES
du choix permet d’aller un peu, ou beaucoup plus loin, en permettant notamment de construire certains
objets infinis.
En ce qui nous concerne, nous nous contenterons du point de vue intuitif. Nous souleverons tout de
même les problèmes que peut engendrer ce point de vue, et nous évoquerons de façon très superficielle le
problème de l’axiomatisation de la théorie des ensembles.
I Théorie intuitive des ensembles

I.1 Définition intuitive
Pour définir rigoureusement la notion d’ensemble, il faut une axiomatique très complexe, c’est pourquoi
nous admettons cette notion. Nous nous contentons de :
Définition 2.1.1 (Ensemble, point de vue intuitif )

• Un ensemble E est une collection d’objets.
• Les objets dont est constituée la collection définissant E sont appelés éléments de E.
• On dit que x appartient à E si x est élément de E, et on note x ∈ E.
Remarque 2.1.2
La définition donnée est insuffisante : on ne peut pas prendre pour E n’importe quelle collection d’objets,
sinon la théorie devient contradictoire (paradoxe de Russell). Pour éviter cela, on peut imposer que E
ne se contienne pas lui-même.

La notation ∈ est introduite par l’italien Peano en 1890. Il s’agit d’un epsilon, pour désigner la lettre E de
« esti » (« il est » en italien)
Il existe plusieurs façons de décrire un ensemble
Définition 2.1.4 (Définitions d’ensembles)

• Une définition par énumération d’un ensemble E est la donnée explicite de tous les éléments de
l’ensemble.
• Une définition par compréhension d’un ensemble E est la donnée d’une propriété P caractérisant
les éléments de E (parmi les éléments d’un ensemble plus gros F )
• Une définition par induction structurelle de E est la donnée d’un certain nombre d’éléments
de E, et d’une façon de construire, étape par étape les autres éléments de E à partir de ceux
donnés.
• Une définition par constructions (unions, intersections) est une façon de construire un ensemble
à partir d’autres ensembles (ce sera étudié dans le paragraphe suivant)
Notation 2.1.5
• L’ensemble E défini par énumération est noté en mettant entre des accolades { et } la liste
complète des éléments de E.
• L’ensemble E défini par compréhension est noté en mettant entre accolades l’appartenance de
l’élément générique x au sur-ensemble F suivi de la propriété P caractérisant les éléments de E.
I Théorie intuitive des ensembles 25
Remarques 2.1.6
1. Il n’y a pas de notion d’ordre des éléments d’un ensemble E : on peut énumérer les éléments de
E dans l’ordre qu’on veut.
2. Il n’y a pas de notion de multiplicité d’un élément : un élément appartient ou n’appartient pas
à un ensemble, mais il ne peut pas « appartenir plusieurs fois ». S’il apparaît plusieurs fois dans
une énumération des éléments de E, attention au fait qu’il s’agit bien du même élément !
3. L’énumération des éléments d’un ensemble est généralement donnée entre accolades {...} pour
désigner l’ensemble.
Exemples 2.1.7
1. Énumération : {1, 3, 7, 9} = {3, 9, 7, 1} = {1, 1, 3, 3, 3, 7, 9, 9}.
2. Compréhension : {x ∈ R | ∃y ∈ N, x2 = y}, ou {x ∈ R | x2 − 4x + 1 > 0}
3. Induction structurelle :
(i) L’ensemble E tel que 2, 3 ∈ E et si p et q sont dans E, pq est dans E.
(ii) L’ensemble des formules propositionnelles, défini comme sous-ensemble de toutes les chaînes
de caractère, qui contient les variables propositionnelles, et stable par certaines contructions
du type A ∨ B...
Quelques définitions supplémentaires :
Définition 2.1.8 (Sous-ensemble)

Soit E un ensemble. Un sous-ensemble de E est un ensemble F tel que tout élément de F est aussi
élément de E. On note F ⊂ E.
Ainsi, F est un sous-ensemble de E si et seulement si : ∀x, x ∈ F =⇒ x ∈ E.

On a clairement :
Proposition 2.1.9 (Principe de double-inclusion)

E = F si et seulement si E ⊂ F et F ⊂ E
Notation 2.1.10 (Ensemble vide)

L’ensemble vide est l’unique ensemble ne contenant aucun élément. Il est noté ∅.
Proposition 2.1.11
L’ensemble vide est sous-ensemble de tout ensemble E.
En effet :
∀x, x ∈ ∅ =⇒ x ∈ E
(la source de l’implication étant toujours fausse, l’implication est vraie) ⊲

Le seul sous-ensemble de ∅ est ∅ lui même.
Terminologie 2.1.12 (singleton)

On appelle singleton un ensemble constitué d’un unique élément, donc de la forme {a}.
La notion de singleton nous donne un lien entre appartenance et inclusion :
Proposition 2.1.13 (Appartenance et inclusion)

Soit E un ensemble et a un objet. Alors : a ∈ E ⇐⇒ {a} ⊂ E
Définition 2.1.14 (Cardinal, notion intuitive)

Intuitivement, le cardinal d’un ensemble correspond à sa taille. Pour un ensemble fini, il s’agit du
nombre de ses éléments. On note dans ce cas Card(E) ou |E| le cardinal de E.
Exemple 2.1.15
• Card(∅) = 0.
• Card({∅}) = 1.
On peut définir, comme on le verra plus tard, une notion de cardinal pour des ensembles infinis, mais
l’intuition en est moins évidente. Par exemple, N et Q ont même cardinal !
I.2 Opérations sur les ensembles

Nous étudions dans ce paragraphe les constructions classiques permettant de définir des ensembles à
partir d’autres.
Définition 2.1.16 (Intersection, figure 2.3)

Soit E et F deux ensembles. L’intersection de E et F , notée E ∩F , est l’ensemble des éléments contenus
à la fois dans E et dans F :
x ∈ E ∩ F ⇐⇒ (x ∈ E) ∧ (x ∈ F ).
A A∩B B
Figure 2.1 – Intersection de deux ensembles
Proposition 2.1.17 (Propriétés de l’intersection)

Soit E, F , G des ensembles. Alors :
1. E ∩ F = F ∩ E (commutativité)
2. (E ∩ F ) ∩ G = E ∩ (F ∩ G) (associativité, figure 2.2)

3. E ∩ F ⊂ E et E ∩ F ⊂ F et E ∩ F est maximal pour cette propriété ;
4. E ∩ ∅ = ∅
5. Si E ⊂ F , alors E ∩ F = E.
E ∩F
E F E F
E ∩ (F ∩ G) (E ∩ F ) ∩ G
F ∩G
G G
Figure 2.2 – Associativité de l’intersection
Définition 2.1.18 (Union)

Soit E et F deux ensembles. L’union de E et F , notée E ∪ F , est l’ensemble des éléments contenus soit
dans E soit dans F :
x ∈ E ∪ F ⇐⇒ (x ∈ E) ∨ (x ∈ F ).
A A∪B B
Figure 2.3 – Union de deux ensembles
Proposition 2.1.19 (propriétés de l’union)

Soit E, F , G des ensembles. Alors :
1. E ∪ F = F ∪ E (commutativité)
2. (E ∪ F ) ∪ G = E ∪ (F ∪ G) (associativité)
3. E ⊂ E ∪ F et F ⊂ E ∪ F et E ∪ F est minimal pour cette propriété ;
4. E ∪ ∅ = E
5. Si E ⊂ F , alors E ∪ F = F .
6. (E ∪ F ) ∩ G = (E ∩ G) ∪ (F ∩ G) (distributivité de ∩ sur ∪, figure 2.4)
7. (E ∩ F ) ∪ G = (E ∪ G) ∩ (F ∪ G) (distributivité de ∪ sur ∩, figure 2.5)
E F E F
G G
(E ∪ F ) ∩ G (E ∩ G) ∪ (F ∩ G)
Figure 2.4 – Distributivité de l’intersection sur l’union
E F E F
G G
(E ∩ F ) ∪ G (E ∪ G) ∩ (F ∪ G)
Figure 2.5 – Distributivité de l’union sur l’intersection
Définition 2.1.20 (Ensembles disjoints)

Deux ensembles E et F sont disjoints si E ∩ F = ∅.
Attention à ne pas confondre disjoint et distinct !
Notation 2.1.22 (union disjointe)

Si A et B sont disjoints, l’union A ∪ B peut être notée A ⊔ B. Cette notation affirme que A et B sont
disjoints.
Définition 2.1.23 (Complémentation)

Soit F ⊂ E. Le complémentaire de F dans E, noté ∁E F ou E \ F , est l’ensemble des éléments de E
qui ne sont pas dans F :
x ∈ ∁E F ⇐⇒ (x ∈ E) ∧ (x 6∈ F ).
En particulier, ∁E F ∪ F = E et ∁E F ∩ F = ∅
Proposition 2.1.24 (Lois de De Morgan, figure 2.6)

Soit E un ensemble et F et G deux sous-ensembles de E. On a :
1. ∁E (F ∪ G) = ∁E F ∩ ∁E G
2. ∁E (F ∩ G) = ∁E F ∪ ∁E G
Il s’agit bien entendu de la version ensembliste des lois de De Morgan données pour la logique.
E F G F G E
∁E (F ∪ G) = ∁E F ∩ ∁E G ∁E (F ∩ G) = ∁E F ∪ ∁E G
Figure 2.6 – Lois de De Morgan
Une autre construction importante est la différence symétrique :
Définition 2.1.25 (Différence symétrique, figure 2.7)

Soit E et F deux ensembles. La différence symétrique E △ F est l’ensemble des éléments x appartenant
à l’un des deux ensembles E ou F , mais pas à l’autre :
E △ F = {x | x ∈ E \ F ou x ∈ F \ E}.
Il faut bien garder en tête la correspondance entre opérations ensemblistes et connecteurs logiques :
∪ ≡ ∨ x ∈ A ∪ B ⇐⇒ (x ∈ A) ∨ (x ∈ B)
∩ ≡ ∧ x ∈ A ∩ B ⇐⇒ (x ∈ A) ∧ (x ∈ B)

∁ ≡ ¬ si x ∈ A, x ∈ ∁A B ⇐⇒ ¬(x ∈ B)
⊂ ≡ =⇒ A ⊂ B ⇐⇒ (∀x, x ∈ A =⇒ x ∈ B),
△ ≡ ou exclusif x ∈ A △ B ⇐⇒ x ∈ A ou (exclusif) x ∈ B
= ≡ ⇐⇒ A = B ⇐⇒ (∀x, x ∈ A ⇐⇒ x ∈ B).
A A△B B
Figure 2.7 – Différence symétrique
Définition 2.1.26 (Produit cartésien, figure 2.8)

Soit E et F deux ensembles. Le produit cartésien de E et F , noté E × F , est l’ensemble des couples
(a, b), tels que a ∈ E et b ∈ F .
Ainsi, pour chaque élément a de E, on dispose d’une copie complète de B, identifiée au produit {a} × B,
c’est-à-dire à l’ensemble des couples (a, b), pour b parcourant B. On peut bien entendu aussi le voir en
inversant le rôle de A et B. Il faut relier cette notion à celle de rectangle plein, qui n’est autre que le
produit cartésien de deux intervalles de R
Figure 2.8 – Produit cartésien de deux ensembles
Notation 2.1.27
On note E 2 = E × E, et plus généralement E n pour un produit catésien à n termes.
Proposition 2.1.28 (propriétés du produit cartésien)

Soit E, E ′ et F des ensembles. Alors :
1. E × F = ∅ ⇐⇒ (E = ∅) ∨ (F = ∅) ;
2. (E ∪ E ′ ) × F = (E × F ) ∪ (E ′ × F ) ;
3. (E ∩ E ′ ) × F = (E × F ) ∩ (E ′ × F ) ;
Une partie d’un ensemble est un autre nom donné à un sous-ensemble.
Notation 2.1.29 (Ensemble des parties d’un ensemble)

On note P(E) l’ensemble des parties de E, c’est-à-dire l’ensemble dont les éléments sont les sous-
ensembles de E : F ∈ P(E) ⇐⇒ F ⊂ E.
Remarque 2.1.30
Ainsi que nous l’avons évoqué en début de section, toute collection d’éléments ne peut pas nécessai-
rement être considérée comme un ensemble. Par exemple, on ne peut pas parler de l’ensemble des
ensembles. Il n’est donc a priori pas évident que P(E) soit toujours un ensemble. En fait, cela fait
partie des axiomes que l’on pose pour définir la théorie des ensembles.
Proposition 2.1.31
Pour tout ensemble E, ∅ ∈ P(E) et E ∈ P(E). Ainsi, P(E) n’est jamais vide. Il contient toujours ∅
et E.
Exemples 2.1.32
Déterminer P(E) dans les cas suivants :
1. E = ∅
2. E = {1}
3. E = {1, 2, 3}
4. E = {∅, {∅}}
Par commodité, nous introduisons les notations suivantes :
Notation 2.1.33 (Ensemble des parties de cardinal fixé)

Soit E un ensemble fini (à prendre au sens intuitif, ainsi que la notion de cardinal), et k ∈ N. On note
Pk (E) l’ensemble des parties de E de cardinal k.
Pour simplifier les écritures, nous utiliserons également les deux notations raccourcies suivantes, non
universelles (donc à redéfinir) :
Notation 2.1.34 (Ensemble des parties de [[1, n]])

Soit n et k deux entiers naturels. On note :
1. P(n) = P([[1, n]])
2. Pk (n) = Pk ([[1, n]]).
Définition 2.1.35 (Partition d’un ensemble)

Une partition de E est un sous-ensemble de P(E) dont les éléments sont des sous-ensembles non vides
de E, deux à deux disjoints et d’union égale à E.
Par exemple, une partition finie, est un ensemble {A1 , . . . , An } de sous-ensembles de E tels que :
1. ∀i ∈ [[1, n]], Ei 6= ∅,
2. ∀(i, j) ∈ [[1, n]]2 , i 6= j =⇒ Ei ∩ Ej = ∅,
3. E1 ∪ · · · ∪ En = E.
Les sous-ensembles Ai sont appelés parts de la partition, et n est appelé longueur de la partition.
Puisque les parts d’une partition ne peuvent pas être vides, il n’existe qu’un nombre fini de partitions
d’un ensemble donné. Ce nombre est égal, par définition, au nombre de Bell Bn .
Définition 2.1.36 (Variantes autour des partitions)

• Nous désignerons par partition ordonnée de E un n-uplet (A1 , . . . , An ) tel que l’ensemble
{A1 , . . . , An } obtenu en oubliant l’ordre des parts soit une partition de E.
• Nous désignerons par partage (terminologie non standard) ou partition à parts éventuellement
vide un ensemble {A1 , . . . , An } vérifiant les points 2 et 3 de la définition d’une partition, mais
pas nécessairement le point 1.
• Nous aurons alors aussi une notion de partage ordonné, ou de partition ordonnée à parts éven-
tuellement vides.
I.3 Unions et intersections sur une famille
Définition 2.1.37 (unions et intersections sur une famille)

Soit (Ai )i∈I une famille (finie ou infinie) d’ensembles. On définit alors l’union et l’intersection de cette
famille [
par :
• Ai = {x | ∃i ∈ I, x ∈ Ai }
i∈I
\
• Ai = {x | ∀i ∈ I, x ∈ Ai }
i∈I
L’existence de tels ensembles est un axiome de la théorie des ensembles.

On pourrait également définir des produits cartésiens infinis, mais cela nécessite un peu plus de technique,
et c’est hors-programme.
Notation 2.1.38 (Union disjointe)

G
Si les Ai sont deux à deux disjoints, on peut noter l’union Ai .
i∈I
Proposition 2.1.39 (propriétés liées aux unions et intersections infinies)

Un certain nombre de propriétés vues dans le paragraphe précédent se généralisent aux unions et inter-
sections infinies. Étant donné (Ai )i∈I une famille d’ensembles, et B un ensemble, tous inclus dans un
ensemble E : !
[ [
1. B ∩ Ai = (B ∩ Ai ) (distributivité)
i∈I i∈I
!
\ \
2. B ∪ Ai = (B ∪ Ai ) (l’autre distributivité)
i∈I i∈I
!
[ \
3. ∁E Ai = ∁E Ai (loi de De Morgan)
i∈I i∈I
!
\ [
4. ∁E Ai = ∁E Ai (loi de De Morgan)
i∈I i∈I
Les deux premières égalités découlent de la propriété 1.1.20, la seconde de la négation des quantifi-
cateurs et des connecteurs logiques. ⊲
I.4 Fonction caractéristique (ou indicatrice)

En admettant momentanément la notion intuitive de fonction, on peut associer, à tout sous-ensemble de
E, une fonction de E dans {0, 1}.
Définition 2.1.40 (Fonction caractéristique, ou indicatrice, d’un ensemble)

Soit E un ensemble et A un sous-ensemble de E. La fonction caractéristique (ou indicatrice) de A,
notée 1A , est la fonction de E dans {0, 1} définie par :
1A : E −→ {0, 1}
(
1 si x ∈ A
x 7→
0 si x ∈
6 A.
On trouve parfois la notation χA au lieu de 1A .

Un certain nombre de propriétés élémentaires se traduisent sur les fonctions caractéristiques. Les construc-
tions élémentaires se transcrivent également très bien au niveau des fonctions caractéristiques.
Proposition 2.1.41 (propriétés des fonctions caractéristiques)

Soit E un ensemble, et A, B des sous-ensembles de E. On a alors :
1. A = {x ∈ E | 1A (x) = 1}.
2. 1A∩B = 1A 1B
3. 1∁E A = 1 − 1A
4. Si A et B sont disjoints, 1A⊔B = 1A + 1B
5. Dans le cas général, 1A∪B = 1A + 1B − 1A∩B = 1A + 1B − 1A 1B
Certaines propriétés se traduisent sur les fonctions caractéristiques. Par exemple, A et B sont disjoints
si et seulement si 1A 1B = 0, ou bien {A1 , . . . , An } est une partition de E si et seulement si les Ai sont
non vides et 1A1 + · · · + 1An = 1.
Les fonctions caractéristiques peuvent donner des démonstrations rapides et formelles de certaines pro-
priétés ensemblistes.
Exemple 2.1.42
Redémontrer la distributivité de l’intersection sur l’union à l’aide des fonctions caractéristiques.
Toute la puissance des fonctions caractéristiques apparaît dans la preuve du résultat suivant, assez pé-
nible si vous cherchez à la faire par des moyens élémentaires, très élégante et rapide si vous utilisez
convenablement les fonctions indicatrices.
Proposition 2.1.43 (Associativité de la différence symétrique)

Soit A, B et C des sous-ensembles de E. On a alors
(A △ B) △ C = A △ (B △ C).
Il suffit de remarquer que 1A△B ≡ 1A + 1B [2]. ⊲
II Paradoxes ensemblistes et axiomatisation

II.1 La crise des fondements

• En 1896, alors qu’il essaye de donner une construction de N et des ordinaux plus généraux (nombres
transfinis), Georg Cantor se rend compte d’une contradiction dans sa théorie des ensembles (il définit
un ensemble comme une collection quelconque d’objets). En effet, il prouve que pour tout ensemble E,
Card(P(E)) > Card(E) (dans le sens qu’il donne à la notion de cardinal, défini à l’aide des ordinaux).
Cette contradiction empêche de parler de l’ensemble des ensembles : en effet, par définition, l’ensemble
de ses parties vérifierait P(E) ⊂ E, ce qui est incompatible avec l’inégalité ci-dessus.
Il n’en parle à personne car sa théorie est menacée, à part à David Hilbert, qui fait autorité à l’époque,
et à qui il envoie une lettre.
• En 1897, Cesare Burali-Forti parvient à la même conclusion et publie son résultat, sans vraiment être
persuadé que cela remet tout en cause.
• En 1901, le logicien et philosophe anglais Bertrand Russell exprime le premier paradoxe simple prouvant
que toute collection ne peut pas être un ensemble. En effet, en définissant
E = {ensembles F qui ne se contiennent pas eux-mêmes},
si E était un ensemble :
∗ si E 6∈ E, alors par définition de E, E est élément de E, d’où une contradiction ;
∗ si E ∈ E, alors, par définition de E, E n’est pas élément de E, d’où une contradiction.
Cet argument très simple montre que E ne peut pas être un ensemble.
Ce paradoxe est connu sous le nom de « paradoxe de Russell » ou parfois « paradoxe du barbier ». En
effet, la situation s’apparente à celle d’un barbier qui rase tout homme qui ne se rase pas lui-même. Ce
barbier peut-il être un homme ?
• Ce paradoxe a en fait été envoyé par Russell au logicien et philosophe allemand Gottlob Frege, suite à la
parution du premier volume de son ouvrage Les fondements de l’arithmétique, pour lui prouver que son
ouvrage reposait sur une contradiction. Frege publie tout de même le second volume, en lui adjoignant
un appendice dans lequel il fait l’aveu et le constat sans doute les plus désarmants de toute l’histoire
des mathématiques :
« Pour un écrivain scientifique, il est peu d’infortunes pires que de voir l’une des fondations de
son travail s’effondrer alors que celui-ci s’achève. C’est dans cette situation inconfortable que
m’a mis une lettre de M. Bertrand Russell, alors que le présent volume allait paraître »
Par la suite, Frege cessa presque entièrement ses travaux mathématiques.
• D’autres paradoxes, recherchant des formes amusantes, virent alors le jour, comme le paradoxe de Jules
Richard (1905), dont un enoncé simplifié est le paradoxe de Berry (formulé par Russell en 1906, il
l’attribue à un bibliothécaire londonien du nom de Berry) :
Soit E l’« ensemble » des entiers qui ne peuvent pas se définir en moins de 16 mots. Cet ensemble est
non vide car son complémentaire est fini (car il y a un nombre fini de mots dans la langue française)
Par les propriétés des sous-ensembles de N, cet « ensemble » admet un plus petit élément, qui peut
être défini par : « le plus petit entier qui ne peut pas se définir en moins de seize mots », définition qui
n’utilise que 15 mots !
II.2 Tentatives d’axiomatisation

• De nombreuses tentatives d’axiomatisation de la théorie des ensembles à la suite de cette crise des
fondements, toutes n’ont pas été fructueuses
II Paradoxes ensemblistes et axiomatisation 35
• Le choix qui s’est imposé est finalement l’axomatique de Zermelo-Fraenkel à laquelle on ajoute ou non
l’axiome du choix.
La théorie des ensembles de Zermelo-Fraenkel définit les ensembles comme étant des objets satisfaisant
à un certain nombre d’axiomes. Dans cette théorie, les éléments eux-même sont tous des ensembles. Les
nombres (les entiers relatifs dans un premier temps) sont alors définis comme étant des ensembles en
particulier, par exemple à la façon des ordinaux de Cantor.
Axiome 2.2.3 (les axiomes de la théorie de Zermelo-Fraenkel, HP)

Voici les noms des différents axiomes, et leur interprétation intuitive :
• Axiome d’extentionnalité : c’est lui qui dit que deux ensembles sont égaux si et seulement si ils
ont mêmes éléments. Cet axiome est notamment à la base du principe de double-inclusion.
• Axiome de la paire : il affirme l’existence des paires {a, b}, lorsque a et b sont deux ensembles.
En particulier, l’axiome de la paire affirme aussi l’existence des singletons {a}, pour un ensemble
a (prendre a = b !)
• Axiome de la réunion : il donne la possibilité de construire des unions des éléments d’un ensemble
(ces éléments étant eux-même des ensembles)
• Axiome des parties : il affirme que si a est un ensemble, alors P(a) aussi.
• Schéma d’axiome ( i.e. série d’axiomes) de compréhension : il permet en particulier de définir un
ensemble par compréhension (comme sous-ensemble d’un ensemble donné, constitué des éléments
vérifiant une certaine propriété)
• Axiome de l’infini : il donne l’existence de l’infini, et notamment des ensembles infinis.
• Axiome de fondation : il dit en particulier qu’un ensemble ne peut pas s’appartenir (on ne peut
pas avoir x ∈ x).
À ces différents axiomes, on ajoute ou non (suivant la théorie) l’axiome du choix. Cet axiome du choix
est indécidable à partir des axiomes de Zermelo-Fraenkel, et il est actuellement couramment admis qu’il
doit être considéré comme vrai.
Axiome 2.2.4 (Axiome du choix, HP)

[
Soit I un ensemble, et pour tout i ∈ I, Ei un ensemble. Alors il existe une fonction f : I −→ Ei
i∈I
telle que pour tout i ∈ I, f (i) ∈ Ei , appelée fonction de choix.
Autrement dit, étant donné une famille d’ensembles, on peut choisir un élément dans chaque ensemble,
d’où le nom de cet axiome. Évidemment, si I est fini, ce n’est pas très étonnant, et cela résulte de l’axiome
de récurrence (car par définition-même de l’interprétation du symbole ∃, on peut toujours choisir un
élément d’un ensemble non vide). N’invoquez donc l’axiome du choix que pour un choix infini, c’est dans
cette situation qu’il est pertinent.
Remarque 2.2.5
1. L’axiome de la paire, couplée à l’axiome de l’union, permet de considérer A ∪ B pour tous
ensembles A et B
2. En itérant cet argument, on peut considérer l’union de n ensembles.
3. L’intersection d’une famille quelconque (non réduite à l’ensemble vide) d’ensembles s’obtient
par compréhension (axiome de compréhension, en se plaçant globalement dans un des ensembles
donnés).
4. L’union d’une famille quelconque pose davantage de problèmes ; il faut déjà préciser ce qu’on
entend par famille (ai )i∈I : il s’agit d’une application d’un ensemble I dans un autre ensemble
E qui à i ∈ I associe ai . Ainsi, les ai doivent eux-même être des éléments d’un ensemble. C’est
le cas en particulier si les ai sont tous des sous-ensembles d’un même ensemble B (dans ce cas,
les ai sont tous éléments de P(B), qui est un ensemble, d’après l’axiome des parties). Dans ce
cas, l’image {ai , i ∈ I} de cette famille est un ensemble (on peut la définir par compréhension),
donc on peut considérer l’union de ses éléments (axiome de l’union).
5. L’existence (et l’unicité) de l’ensemble vide provient de l’axiome de compréhension, à partir d’un
ensemble A quelconque (on sait qu’il existe au moins un ensemble, d’après l’axiome de l’infini ;
de toute façon, si ce n’était pas le cas, la théorie serait bien pauvre). L’ensemble vide peut alors
se définir par compréhension de la façon suivante :
∅ = {x ∈ A | x 6= x}.
6. Le produit cartésien se définit à l’aide de couples, un couple (a, b) de A × B étant défini comme
la paire {a, {a, b}}.
III L’ensemble N des entiers naturels

III.1 Axiomatique de N (hors-programme)
Nous avons vu les difficultés amenées par la conception de la notion d’ensemble. Définir les ensembles
sans prendre de précaution peut amener à des théories contradictoires. La formalisation de la théorie des
ensembles impose alors de devoir aussi redéfinir axiomatiquement les ensembles classiques, notamment
les nombres entiers, et leurs propriétés arithmétiques (donc la définition de la somme et du produit).
L’ensemble N est alors défini comme un ensemble contenant un élément nul 0, et tel que tout élément
n ait un successeur, noté n + 1, et tout élément n, à l’exclusion de 0, ait un prédecesseur m (tel que
m + 1 = n). À cela, on ajoute un certain nombre d’axiomes techniques (les axiomes de Peano) servant à
définir rigoureusement les opérations dans N.
Remarque 2.3.1
Cette définition est insuffisante pour caractériser N : si on se limite à la description par l’existence de
successeurs et prédécesseurs, on pourrait imaginer un ensemble constitué des éléments de N (la version
intuitive), suivi d’une copie de Z, suivi d’une autre copie de Z (la construction d’un tel ensemble qui
vérifie cette définition avec les axiomes de Peano est un peu plus compliquée que cela, car il faut aussi
imposer la stabilité par les opérations, mais un tel ensemble existe, et est à la base de la logique non-
standard, puis de l’analyse non-standard, ou l’on remplace N par un tel ensemble). Il faut rajouter une
hypothèse de minimalité pour obtenir l’ensemble N que nous connaissons bien.
III.2 Propriétés de N
Parmi les axiomes de Peano, il en est un dont on se sert fréquemment, c’est l’axiome de récurrence, que
nous avons déjà étudié, et que nous rappelons ici.
Axiome 2.3.2 (principe de récurrence)

Soit P une propriété dépendant d’un entier n ∈ N. On note P(n) la propriété au rang n. Alors :

P(0) ∧ (∀n ∈ N, (P(n) =⇒ P(n + 1))) =⇒ ∀n ∈ N, P(n) .
III L’ensemble N des entiers naturels 37
En d’autres termes, pour montrer une propriété P dépendant de n ∈ N, il suffit :

• de montrer P(0) (initialisation)
• pour tout n ∈ N, de montrer P(n) =⇒ P(n + 1) (hérédité), ce qui revient à fixer n quelconque,
supposer P(n) et démontrer P(n + 1).
On en déduit :
Théorème 2.3.3 (propriété fondamentale de N)

Tout sous-ensemble non vide et majoré de N admet un plus grand élément.
On le montre par récurrence sur n, pour les sous-ensembles majorés par n, en discutant suivant
que E, majoré par n, contient n ou non, pour utiliser l’hypothèse de récurrence soit sur E, soit sur
E \ {n}. ⊲
Corollaire 2.3.4
Tout sous-ensemble non vide de N admet un plus petit élément.
Appliquer la propriété fondamentale à l’ensemble des minorants. ⊲
En fait, la terminologie « propriété fondamentale » n’est pas anodine. On aurait pu construire une axioma-
tique de N basée sur ce théorème (qui fonderait donc l’ensemble N) plutôt que sur l’axiome de récurrence.
C’est ce que montre le théorème suivant :
Théorème 2.3.5
La propriété fondamentale de N est équivalente à l’axiome de récurrence.
Pour démontrer que la propriété fondamentale entraîne l’axiome de récurrence, considérer le mini-
mum de E = {n | ¬P(n)} et son prédecesseur. ⊲
3
Applications
« Les mathématiciens n’étudient pas des objets mais les relations entre ces objets. »
(Henri Poincaré)
Une civilisation constituée de groupes de personnes n’interagissant pas entre eux serait assez pauvre. Ce
sont les relations entre groupes d’individus qui permettent de comparer, d’apprendre, de progresser, de
transmettre, que ce soient des relations internes à un groupe donné, ou des relations d’un groupe à un
autre. Une civilisation sans relation est vouée à la stérilité et à l’immobilisme, et donc à l’extinction.
Il en est de même pour les ensembles mathématiques. La théorie axiomatique des ensembles est certes très
belle en soi, mais si on n’y rajoute pas une couche, elle est d’un intérêt assez limité pour le mathématicien
recherchant le débouché concret (on a tendance à oublier que ce débouché concret a longtemps été la
motivation-même des scientifiques, y compris mathématiciens). Comme dans le cas d’une civilisation, il
faut faire interagir les ensembles, il faut créer des relations permettant de comparer les éléments d’un
ensemble d’une façon ou d’une autre. Ce n’est qu’ainsi qu’on peut donner vie aux ensembles.
Nous étudions dans ce chapitre un type particulier de relations entre deux ensembles. Il s’agit de la notion
d’application, ou de fonction, qu’on peut considérer comme synonyme ou non, suivant qu’on est puriste
ou non (dans le sens inverse).
I Qu’est-ce qu’une application ?
Définition 3.1.1 (Application, définition intuitive)

Soit E et F deux ensembles. Une application f est un objet qui à tout élément x de E associe un
élément f (x) de F .
Définition 3.1.2 (Application, définition formelle ; graphe ; image)

Soit E et F deux ensembles.
• Une application f est la donnée d’un sous-ensemble G ⊂ E × F tel que pour tout x dans E, il
existe un et un seul élément y de F tel que (x, y) ∈ G.
• L’ensemble G est appelé graphe de f .
• Étant donné x, l’unique élément y de F tel que (x, y) ∈ G est noté f (x), et appelé image de x
par f .
Définir une application nécessite donc la donnée de E, de F et du graphe G, ce qui revient à définir,
d’une façon ou d’une autre, un élément f (x) pour tout x ∈ E. L’ensemble de ces données est souvent
40 CHAPITRE 3. APPLICATIONS
synthétisé par la notation suivante :

f: E −→ F
x 7−→ f (x),
en remplaçant f (x) par son expression, par exemple cos(x).

Attention, une expression f (x) ne désigne pas une application, mais seulement la valeur d’une application
en un point. Parler de l’application, ou la fonction x cos(x) n’a pas de sens. Tout au plus est-il acceptable
de parler de l’application (ou la fonction) x 7→ x cos(x), même si les ensembles E et F sont omis dans
cette notation.

• La notion est ancienne, mais reste longtemps vague et mal définie, sans réelle notation.
• En 1694, Leibniz est le premier à parler de « fonction d’un point M », puis Newton parle de « fluente
du temps t ».
• Leibniz est le premier à proposer une notation, notamment dans le cas où on utilise plusieurs fonctions :
il propose x | 1 et x | 2 pour ce qu’on noterait actuellement f1 (x) et f2 (x).
• Euler introduit en 1734 la notation f x, encore en vigueur actuellement (au parenthésage près).
Remarque 3.1.4 (Application ou fonction ?)

Cette question donne parfois lieu à des débats houleux, entre puristes de la version « officielle » (mais
qu’est-ce qui fait office de référence officielle ?), adeptes de l’usage historique, et ceux qui estiment que
c’est du pinaillage sans intérêt (je fais plutôt partie de cette dernière catégorie).
• L’usage historique semble privilégier la terminologie « fonction » lorsque le domaine d’arrivée
est numérique. C’est encore sous ce sens que ce terme est très souvent adopté dans le monde de
la recherche.
• L’usage répandu dans l’enseignement moderne français consiste à considérer une fonction comme
un sous-ensemble G de E × F tel que pour tout x de E, il existe au plus un y tel que (x, y) ∈ G.
Ainsi, tout point de E admet, par une fonction, au plus une image dans F (mais peut ne pas en
admettre, alors que par une application, il admet toujours une (et une seule) image.
Ainsi, toute application est une fonction, et toute fonction définit de façon unique une application
en la restreignant à son domaine de définition (l’ensemble des points admettant une image).
• On peut donc résumer le point précédente en :
« Une application est une fonction définie sur tout son domaine ».
Lorsque f est une fonction d’un sous-ensemble de R dans R, le graphe de f est un sous-ensemble de R2 .
On visualise une fonction f en représentant son graphe dans le plan muni d’un repère (figure 3.1)
1
|
| | |
|
1
|
Figure 3.1 – Graphe de x 7→ x sin x

I Qu’est-ce qu’une application ? 41
De même, pour des fonctions de deux variables à valeurs dans R, le graphe est un sous-ensemble de R3 ,
et on peut représenter une projection sur le plan de cet espace, aidant à la compréhension de la fonction
(figure 3.2)
x
y
Figure 3.2 – Graphe de f : (x, y) 7→ ex cos y
Lorsque E et F sont des ensembles finis, on peut représenter l’application f sous forme d’un diagramme
sagittal : on représente les éléments de E d’un côté, ceux de F d’un autre côté, l’application f est alors
représentée par une série de flèches reliant les éléments x de E à leur image f (x) dans F .
Par exemple, l’application de [[1, 6]] dans [[1, 4]] définie par f (1) = 3, f (2) = 1, f (3) = 1, f (4) = 4, f (5) = 3
et f (6) = 2 sera représentée par le diagramme sagittal de la figure 3.3
f
E F
4 4
3 3
2 2
1 1
Figure 3.3 – Diagramme sagittal
Exemples 3.1.5
1. Application identique (identité)
2. Soit E ⊂ F . L’injection canonique i : E → F .
3. Soit E ⊂ F . La fonction caractéristique de E dans F , 1E : F → {0, 1}.
4. La projection canonique pE : E × F → E.
Notation 3.1.6
On note F (E, F ), ou encore F E l’ensemble des applications de E dans F .
Nous avons déjà recontré un type d’applications pour lesquelles la dépendance par rapport à la variable
est notée indiciellement :
Définition 3.1.7 (Familles et suites)

• Une famille (xi )i∈I d’éléments d’un ensemble E, indexée par un ensemble I, est une application
x : I −→ E. Dans cette situation, on utilise plutôt une notation indicielle xi à la place de x(i).
L’ensemble I est appelé l’ensemble des indices de la famille (xi )i∈I
• Une suite d’éléments d’un ensemble E est une famille indexée par N, ou éventuellement par un
ensemble {n ∈ N | n > n0 }. Nous étudierons notamment les suites réelles (E = R) et les suites
complexes (E = C)
Remarque 3.1.8
Une suite est donc un cas particulier de famille. Dans ce cas particulier, on dispose d’une notion d’ordre
des éléments, induit par l’ordre usuel des entiers relatifs : on range alors naturellement les éléments
de la suite dans l’ordre de leur indice. En général, on ne peut faire cela pour une famille quelconque.
C’est ce qui fait qu’on obtient souvent pour les suites des résultats et des théories qu’on ne peut pas
ou pas facilement généraliser aux familles quelconques. On trouvera plus tard cette situation dans le
problème de la sommation (séries convergentes versus familles sommables), où l’ordre de sommation a
son importance.
Voici quelques moyens de définir une fonction (la liste n’est pas exhaustive) :
• Définition par une formule explicite :
sin x
∀x ∈ R, f (x) =
1 + x2
• Définition par disjonction de cas (fonction définie par morceaux) :


e si x < 0
x

∀x ∈ R, f (x) = 0 si x = 0


1 si x > 0.
x
• Définition par récurrence :
u0 = 2 et ∀n ∈ N, un+1 = 3u2n − 2.
Évidemment, ce n’est possible que pour définir une suite ! On peut généraliser cela à un domaine
E défini par induction structurelle, en calquant la définition de la fonction sur la description des
constructions définissant E et les éléments initiaux de E.
• Définition implicite :
La fonction f est définie comme étant, pour une valeur de x donnée, l’unique solution d’une
certaine équation. Par exemple :
Z f (x)
2
∀x ∈ R+ , ext dt = x
0
• Définition par une équation fonctionnelle ou différentielle :

Exemple : il existe une unique fonction dérivable f de R dans R telle que f (0) = f ′ (0) = 1 et pour
tout (x, y) ∈ R2 , f (x + y) = f (x)f (y) (laquelle ?)
Exemple : il existe une unique fonction f dérivable sur R, telle que f (0) = 1 et f ′ = f (laquelle ?)
II Image directe, image réciproque 43
Définition 3.1.9 (composition de fonction)

Soit f : E −→ F et g : F −→ G. Alors, la fonction composée de f et de g est la fonction, notée g ◦ f ,
définie par :
g ◦ f : E −→ G
x 7−→ g(f (x)).
Définition 3.1.10 (Restriction, prolongement, corestriction)

Soit E et F deux ensembles, et soit E ′ ⊂ E et F ′ ⊂ F .
1. Soit f : E −→ F une application. La restriction de f à E, notée fE , est l’unique application de
E ′ dans F telle que pour tout x ∈ E ′ , f|E (x) = f (x).
On peut aussi définir la restriction d’une fonction : fE ne sera alors définie qu’aux points de E ′
en lesquels f l’est.
2. Soit g : E ′ → F . Un prolongement de g à E est une application f : E → F telle que g = f|E .
Un tel prolongement n’est bien entendu pas unique en général.
′
3. Soit f : E −→ F une application. La corestriction de f à F ′ est la fonction f |F non définie en
′
x tel que f (x) 6∈ F ′ , et telle que f |F (x) = f (x) si f (x) ∈ F ′ .
On peut définir de la même manière la corestriction d’une fonction.
En général, la corestriction d’une application n’est pas une application, mais seulement une fonction
au sens évoqué ci-dessus. On donne ci-après une condition pour que ce soit une application.
Exemples 3.1.12
1. Soit f : R → R définie par f (x) = x2 . Décrire sa restriction à R+ , sa corestriction à [1, +∞[
2. Comparer la restriction à E ′ de la corestriction à F ′ de f : E → F à la corestriction à F ′ de la
restriction à E ′ de f .
II Image directe, image réciproque

Soit E et F deux ensembles, et f : E −→ F une application de E vers F .
Définition 3.2.1 (Image d’une application)

L’image de f est l’ensemble Im(f ) = {y ∈ F | ∃x ∈ E, f (x) = y}. C’est l’ensemble des points de F
qui sont images d’un certain point x.
La notion d’image permet notamment de donner une condition d’existence d’une corestriction :
Proposition 3.2.2 (Corestriction d’une application)

Soit f : E → F une application et F ′ ⊂ F . La corestriction de f est une application si et seulement si
Im(f ) ⊂ F ′ .
Définition 3.2.3 (Image directe)

1. Soit E ′ ⊂ E un sous-ensemble de E. L’image directe de E ′ par f est l’ensemble :
fe(E ′ ) = {y ∈ F | ∃x ∈ E ′ , f (x) = y.}.
C’est l’ensemble des valeurs qui sont images d’un x de E ′ .

2. Cette construction définie une application « image directe » :
fe : P(E) −→ P(F )
E ′ 7−→ f (E ′ )
Définition 3.2.4 (antécédent d’un élément)

• Soit y ∈ F . Un antécédent par f de y est un élément x de E tel que f (x) = y.
• On note fd −1 ({y}) (ou lorsqu’il n’y a pas d’ambiguïté, f −1 ({y}), ou encore, de façon abusive,
−1
f (y)) l’ensemble des antécédents de y par f . C’est un sous-ensemble de E.
Remarque 3.2.5
Un élément de F peut ne pas avoir d’antécédent par f , ou peut en avoir un seul, ou plusieurs.
Proposition 3.2.6 (Partage associé à une application)

Soit f une application de E dans F . Alors les ensembles f −1 ({y}), y ∈ F sont deux à deux disjoints,
[
et f −1 ({y}) = E.
y∈F
Ainsi, {f −1 ({y}), y ∈ F } est une partition à parts éventuellement vides de E, ou, selon une terminologie
non universelle introduite dans le chapitre précédent, un partage de E.
Le fait que les parts sont disjointes provient de l’unicité de l’image, le fait que l’union est E provient
de l’existence de l’image. Que dire si f est une fonction ? ⊲
L’ensemble f −1 ({y}) des antécédents de y correspond à un cas particulier d’une notion plus générale :
Définition 3.2.7 (Image réciproque)

1. Soit F ′ ⊂ F un sous-ensemble de F . L’image réciproque de F ′ est l’ensemble : fd
−1 (F ′ ) = {x ∈
E | f (x) ∈ F ′ } C’est l’ensemble des éléments dont l’image est dans F ′ , ou, autrement dit,
l’ensemble des antécédents d’éléments de F ′ .
2. Cette construction définit une application :
fd
−1 : P(F ) −→ P(E)
F ′ 7−→ f −1 (F ′ )
Ainsi, par définition, x ∈ f −1 (F ′ ) ⇐⇒ f (x) ∈ F ′ . En d’autres termes fd

−1 (F ′ ) est l’ensemble des élé-
ments de E qui sont antécédents d’au moins (et dans ce cas, d’exactement – pourquoi ?) un élément de
F ′.
II Image directe, image réciproque 45
Remarque 3.2.8
Les tildes et chapeaux sur fe et fd
−1 sont présents uniquement pour distinguer ces applications (définies
sur l’ensemble des parties de E et F respectivement) des applications f et f −1 (cette dernière désignant
la fonction réciproque de f , n’existant que si f est bijective, notion définie ci-dessous), définies sur E
et F respectivement.
On verra plus tard qu’il ne peut en fait pas y avoir d’ambiguïté sur la signification de f −1 (F ′ ) (image
reciproque par f ou image directe par f −1 . Nous nous autoriserons donc à alléger les notations, en
déisgnant simplement par f (E ′ ) et f −1 (F ′ ) les images directes et réciproques par f .
Propriétés 3.2.9 (Images directes et réciproques d’unions ou intersections)

Soit E et F deux ensembles, f : E −→ F une application, et (Ei )i∈I une famille de sous-ensembles de
E, (Fi )i∈I une famille de sous-ensembles de F . Alors :
!
[ [
1. f Ei = f (Ei )
i∈I i∈I
!
\ \
2. f Ei ⊂ f (Ei ) (attention ! ce n’est qu’une inclusion !)
i∈I i∈I
!
[ [
−1
3. f Fi = f −1 (Fi )
i∈I i∈I
!
\ \
4. f −1 Fi = f −1 (Fi ).
i∈I i∈I
Exemple 3.2.10
On peut avoir une inclusion stricte f (E ′ ∩ E ′′ ) ⊂ f (E ′ ) ∩ f (E ′′ ). Pour un exemple, voir figure 3.4
E F
3 3
E′
f (E ′ ∩ E ′′ )
E ′ ∩ E ′′ 2 2
E ′′ f (E ′ ) ∩ f (E ′′ )
1 1
f
Figure 3.4 – Exemple dans lequel f (E ′ ∩ E ′′ ) 6= F (E ′ ) ∩ f (E ′′ )
En retenir que tout se passe bien avec les images réciproques, mais qu’il faut prendre un peu plus de
précautions avec les images directes.
Remarque 3.2.11 (Transition vers la section suivante)

À quelle condition suffisante l’image d’une intersection est-elle l’intersection des images ? Est-ce une
condition nécessaire ?
III Injectivité, surjectivité, bijectivité
Définition 3.3.1 (Injectivité, surjectivité, bijectivité)

Soit f : E → F une application. On dit que :
1. f est injective ssi tout élément de F admet au plus un antécédent par f
2. f est injective ssi tout élément de F admet au moins un antécédent par f
3. f est bijective ssi f est injective et surjective.
Remarque 3.3.2
Ainsi, f est bijective si et seulement si tout élément de F admet exactement un antécédent. Pour cette
raison, une bijection est parfois aussi appelée correspondance 1 à 1 (issu de la terminologie anglaise
« one-to-one correspondance).
Terminologie 3.3.3 (permutation, groupe symétrique)

Une bijection de E dans lui-même est appelée permutation de E. On note S(E) l’ensemble des permu-
tations de E. Si E = {1, . . . , n}, on note Sn au lieu de S(E). L’ensemble Sn est appelé n-ième groupe
symétrique.
La notation S est l’écriture gothique de la lettre S. On trouve parfois aussi plus simplement la notation
Sn au lieu de Sn pour désigner le groupe symétrique (et S(E) au lieu de S(E), notation du programme
officiel). On trouve également parfois Σn et Σ(E)
Exemples 3.3.4
1. Soit E ⊂ F . L’injection i : E → F est ............... .
2. Soit E et F deux ensembles, F 6= ∅. La projection pE : E × F → E est ............... .
3. La fonction identité E → E est ............... .
4. À quelle condition la fonction caractéristique 1E est-elle surjective ? injective ?
5. La fonction x 7→ x2 est :
• ............... si elle est vue comme fonction de R dans R+ ;
• ............... si elle est vue comme fonction de R+ dans R
• ............... si elle est vue comme fonction de R+ dans R+
• .............................. si elle est vue comme fonction de R dans R.
Il est donc important de porter une attention particulière aux domaines de départ et d’arrivée
dans l’étude des propriétés d’injectivité et de surjectivité. D’autre part, constatez sur cet exemple
qu’une fonction peut n’être ni injective ni surjective.
En adoptant la notion intuitive de cardinal d’un ensemble G comme étant le nombre d’éléments de G
(éventuellement infini), on obtient :
Proposition 3.3.5 (CNS d’injectivité)

Soit f : E −→ F une application. Les propositions suivantes sont équivalentes est vérifiée :
(i) f est injective ;
(ii) ∀y ∈ F, Card(f −1 (y)) 6 1,
(iii) ∀(x, y) ∈ E 2 , x 6= y =⇒ f (x) 6= f (y),
(iv) ∀(x, y) ∈ E 2 , f (x) = f (y) =⇒ x = y.
III Injectivité, surjectivité, bijectivité 47
(i) équivaut à (ii) par définition, (iii) équivaut à (iv) par contraposition, (i) implique (iv) en consi-
dérant l’image réciproque de f (x), et (iv) implique (ii) en contraposant : si (ii) est faut, on trouve
facilement x et y contredisant (iv). ⊲
Proposition 3.3.6 (Surjectivité)

Soit f : E −→ F une application. Les propositions suivantes sont équivalentes est vérifiée :
(i) f est surjective ;
(ii) ∀y ∈ F, Card(f −1 (y)) > 1 ;
(iii) ∀y ∈ F, ∃x ∈ E, f (x) = y ;
(iv) Im(f ) = F .
Corollaire 3.3.7 (Partition associée à une surjection)

Lorsque l’application f : E → F est surjective, le partage de E associé à F est une partition.
En effet, d’après le point (ii), les parts sont non vides. ⊲
Dans le cas d’ensembles finis, on peut illustrer ces notions sur des diagrammes sagittaux (figure 3.5).
f f f
E F E F E F
5 5 5 5
4 4 4 4 4 4
3 3 3 3 3 3
2 2 2 2 2 2
1 1 1 1 1 1
f est ........................ f est ........................ f est ........................
Figure 3.5 – Diagramme sagittal d’une fonction f injective, surjective ou bijective
Remarque 3.3.8
Intuitivement, si f : E → F est une injection, il y a plus d’éléments dans F que dans E. C’est l’inverse
si f est une surjection, et c’est E et F ont même cardinal si f est une bijection. C’est vrai si E et F sont
finis. Attention, aux cas où E et F sont infinis : la situation peut parfois être contraire à l’intuition.
Exemples 3.3.9
1. Principe de l’hôtel de Hilbert : soit x 6∈ N. Alors N et N ∪ {x} peuvent être mis en bijection (on
dit qu’ils ont même cardinal).
2. La numérotation en diagonales de N × N est une bijection de N sur N2 .
sin(x)
3. tan :]− π2 , π2 [−→ R est une bijection (rappel : pour tout x pour lequel cos(x) 6= 0, tan(x) = cos(x) ).
Pourtant, il y a « plus » d’éléments dans R que dans ] − π2 , π2 [.
4. Soit f : [0, 1[2 −→ [0, 1[ définie de la façon suivante : étant donné x et y dans [0, 1[, on note xi le
i-ième chiffre de x après la virgule dans son écriture décimale, et de même pour yi . On rappelle
que si x est décimal, x admet deux écritures décimales, l’une qui termine par une infinité de 0,
l’autre qui termine par une infinité de 9 (car 0.9999999... = 1). On choisit dans ce cas, afin que
les xi et les yi soient définis de façon unique, la représentation terminant par des 0. On définit
alors f sur le couple (x, y) par :
f (x, y) = 0.x1 y1 x2 y2 x3 y3 ....
Il s’agit donc du réel de [0, 1[ obtenu en alternant les chiffres de x et ceux de y.

La fonction f est injective. Est-elle surjective ?
5. On peut de même contruire une fonction g : [0, 1[−→ [0, 1[2 par :
g(x) = (0.x1 x3 x4 ....; 0.x2 x4 x6 ....),
les xi représentant encore les chiffres de x dans l’écriture décimale, avec les mêmes conventions
pour les réels décimaux.
La fonction f est surjective. Est-elle injective ?
Les exemples précédents permettent d’établir (avec la notion de cardinal définie plus loin) que N est de
même cardinal que N2 , que ] − π2 , π2 [ est de même cardinal de R (en fait, tout intervalle non vide et non
restreint à un singleton est de même cardinal que R), et, plus surprenant encore, que [0, 1[2 est de même
cardinal que [0, 1[ (de quoi il ressort que R2 est de même cardinal que R !)
Proposition 3.3.10 (Composée d’injections, surjections, bijections)

Soit f : E −→ F et g : F −→ G deux applications. Alors :
1. si f et g sont injective, alors g ◦ f aussi ;
2. si f et g sont surjectives, alors g ◦ f aussi ;
3. si f et g sont bijectives, alors g ◦ f aussi ;
Pour le point (i), considérer x et y tels que g ◦ f (x) = g ◦ f (y), et obtenir d’abord f (x) = f (y) puis
x = y. Le point (ii) est évident, le point (iii) est la combinaison de (i) et (ii). ⊲
Cette proposition admet une réciproque partielle :
Proposition 3.3.11 (« Dé-composée » d’injections, surjections, bijections)

Soit f : E −→ F et g : F −→ G deux applications. Alors :
1. si g ◦ f est injective, alors f est ...............
2. si g ◦ f est surjective, alors g est ...............
1. Considérer x et y tels que f (x) = f (y), et se ramener à l’utilisation de l’injectivité de g ◦ f .

2. Considérer un antécédent par g ◦ f de z ∈ G. Comment en déduire un antécédent par g de z ?
⊲
III Injectivité, surjectivité, bijectivité 49
Dans une structure algébrique, l’inversibilité d’un élément a se traduit par l’existence de b tel que ab =
ba = 1 (ou 1 est le neutre multiplicatif de la structure). Si on a seulement l’existence de b tel que ab = 1,
on parle d’inversibilité à droite de a, et de même, d’inversibilité à gauche si ba = 1. Nous montrons ci-
dessous que les propriétés d’injectivité, surjectivité et bijectivité peuvent être vues comme des propriétés
d’inversibilité à gauche, droite et bilatéral respectivement.
Théorème 3.3.12 (Caractérisation de l’injectivité et de la surjectivité)

Soit f : E −→ F une fonction.
1. (avec AC) f est surjective si et seulement s’il existe une fonction g : F → E telle que f ◦g = idF ,
donc si et seulement si f est inversible à droite.
2. Si E 6= ∅, f est injective si et seulement s’il existe une fonction g : F → E telle que g ◦ f = idE ,
donc si et seulement si f est inversible à gauche.
À chaque fois, l’un des sens s’obtient par la proposition 3.3.11. Pour l’autre sens :
1. Définir g(y) comme étant un antécédent de y par f .
2. Sur Im(f ) définir g(y) comme l’unique (pourquoi ?) antécédent de y par f . Comment définir g
hors de l’image de sorte à éviter le recours à l’axiome du choix ? Souvenez-vous qu’un nombre
fini de choix est possible sans axiome du choix.
⊲
La fonction g du théorème précédent n’est en général pas unique ! Dans le 2, elle est cependant définie
de façon unique sur Im(f )
Théorème 3.3.14 (Caractérisation de la bijectivité)

Soit f : E −→ F une application. L’application f est bijective si et seulement s’il existe g : F −→ E
telle que g ◦ f = idE et f ◦ g = idF , donc si f est inversible.
De plus, dans ce cas, la fonction g est unique.
La réciproque provient de la propriété précédente. Le sens direct aussi, en remarquant que les fonc-
tions g construites pour montrer les points 1 et 2 du théorème précédent sont alors les mêmes (et
qu’on n’a pas de choix à faire ni dans 1, ni dans 2 donc pas d’axiome du choix à utiliser). ⊲
Attention, il ne suffit pas que g ◦ f = idE ou f ◦ g = idF pour obtenir la bijectivité : il faut avoir les
deux égalités.
Définition 3.3.16 (Application réciproque)

Dans la situation du théorème précédent, l’application g telle que g ◦ f = idE et f ◦ g = idF est appelée
application réciproque de f , et est notée f −1 .
Dans le cas où f est bijective, la notation f −1 peut désigner à la fois la fonction image réciproque et
la fonction réciproque. Appliquée à un sous-ensemble de F , il peut s’agir de l’image réciproque de ce
sous-ensemble ou de son image directe par la fonction réciproque f −1 . La proposition ?? montre que
l’ambiguïté des notations n’est pas gênante. Sa démonstration est basée sur le lemme suivant, donc la
démonstration est élémentaire :
Lemme 3.3.17 (Image réciproque d’un élément par une bijection)

Soit f une bijection. Alors
fd ˜(y)
−1 ({y}) = {f −1 (y)} = f −1
Proposition 3.3.18 (Compatibilité des notations f −1 )

Soit f une bijection de E dans F et E ′ ⊂ E, F ′ ⊂ F .
1. L’image directe fg
−1 (F ′ ) de F ′ par la réciproque f −1 de f est égale à l’image réciproque f d−1 (F ′ )
′ −1 ′
de F par f . Nous noterons simplement f (F ).
2. L’image réciproque (f\−1 )−1 (E ′ ) de E ′ par f −1 est égale à l’image directe fe(E ′ ) de E ′ par f .
S
Il suffit d’écrire F ′ = y∈F ′ {y}, et d’utiliser la description de l’image directe et l’image réciproque
d’une union, ainsi que le lemme précédent. ⊲
On peut donc se dispenser des chapeaux et des tildes.
4
Sommes
« La totalité est plus que la somme des parties »
(Aristote)
1
« 1 + 2 + 3 + 4 + ··· = − »
12
(Leonhard Euler)
Introduction
P
Le but de ce chapitre est d’introduire et systématiser l’usage du signe pour désigner une somme
d’éléments. Dans la mesure du possible, l’utilisation de cette notation est préférable à celle utilisant des
petits points, bien moins rigoureuse.
Nous supposons connues les notions et notations suivantes :
• la compréhension intuitive des ensembles de nombres usuels, et les notations standard :
∗ N : ensemble des entiers naturels (i.e. positifs ou nuls) ;
∗ Z : ensemble des entiers relatifs (i.e. de signe quelconque) ;
∗ Q : ensemble des nombres rationnels (i.e. pouvant s’écrire sous forme d’une fraction) ;
∗ D : ensemble des nombres décimaux (i.e. admettant une écriture finie en base décimale) ;
∗ R : ensemble de tous les nombres réels ;
∗ C : ensemble de tous les nombres complexes ;
• les sous-ensembles particuliers suivants de R et C :
∗ R+ : ensemble des réels positifs ou nuls ;
∗ R− : ensemble des réels négatifs ou nuls ;
∗ R∗ : ensemble des réels non nuls ;
∗ R∗+ : ensemble des réels positifs non nuls ;
∗ R∗− : ensemble des réels négatifs non nuls ;
∗ C∗ : ensemble des nombres complexes non nuls ;
∗ N∗ : ensemble des entiers naturels non nuls ;
∗ Z− : ensemble des entiers négatifs ou nuls ;
∗ Z∗ : ensemble des entiers non nuls ;
∗ de même que pour R, on peut définir Q+ , Q− , Q∗ , Q∗+ , Q∗− , D+ , D− , D∗ , D∗+ ou D∗− ; on
rencontre aussi parfois Z+ pour désigner N, et Z∗− ;
• les intervalles de réels :
∗ pour a 6 b, la notation [a, b] désigne l’intervalle fermé délimité par les réels a et b, c’est-à-dire
l’ensemble des réels x tels que a 6 x 6 b ;
∗ pour a < b, la notation ]a, b] désigne l’ensemble des réels x tels que a < x 6 b. On définit de
manière similaire [a, b[ et ]a, b[ ;
52 CHAPITRE 4. SOMMES
∗ +∞ désigne l’infini positif, −∞ désigne l’infini négatif ;

∗ les intervalles de R peuvent être délimités par un infini, à condition d’avoir une borne ouverte :
[a, +∞[ par exemple désigne l’intervalle des réels x tels que a 6 x ;
• les intervalles d’entiers : si a et b sont deux entiers tels que a 6 b, [[a, b]] désigne l’intervalle d’entiers
délimité par a et b, c’est-à-dire :
[[a, b]] = {a, a + 1, . . . , b − 1, b} = {n ∈ Z |, a 6 n 6 b};
On trouve parfois [[a, +∞[[, lorsque l’intervalle n’est pas majoré ;

Si on comprend assez bien les notations N, R, C et D, il n’en est pas de même de Z et Q. Voici un bref apreçu
historique de ces notations :
• N : notation introduite par Peano (fin 19e, de l’italien Naturale)
• Z : notation introduite par Dedekind (fin 19e siècle, de l’allemand Zahlen)
• D : notation introduite par les programmes pédagogiques français (1970)
• Q : notation introduite par Peano (de l’italien Quotiente)
• R : notation introduite par Dedekind (de l’allemand Real )
• C : notation introduite par Gauss en 1831.
P Q
I Manipulation des signes et
Nous nous intéressons dans ce paragraphe à la définition de la somme des éléments d’une famille finie
(xi )i∈I de réels ou complexes (ou plus généralement des objets qu’on sait sommer de façon commutative
et associative). Le cas de familles infinies relève de techniques plus fines, car comme est est amené à faire
une infinité d’opérations, il faut s’assurer que le procédé « converge ». Nous reparlerons de cela plus tard.
I.1 Définition des notations

On rappelle qu’une loi + définie sur un ensemble E est dite commutative si pour tous x, y de E, x + y =
y + x, et associative si pour tous x, y, z de E, x+ (y + z) = (x+ y)+ z. De même pour une loi multiplicative
×.
P Q
Définition 4.1.1 (signes et : définition générale)
Soit I un ensemble fini et (ai )i∈I une famille de nombres réels ou complexes.
X
• L’expression ai désigne la somme de tous les éléments ai , pour i ∈ I. Ainsi, si I = {i1 , . . . , in },
i∈I
X
= ai1 + · · · + ain .
i∈I
Y
• L’expression ai désigne de même le produit de tous les éléments ai , pour i ∈ I.
i∈I
Proposition/Définition 4.1.2 (définition par récurrence)

On peut définir plus rigoureusement et formellement la somme par récurrence sur le cardinal de I :
P
• pour I de cardinal 0, (I est l’ensemble vide), par convention, i∈I xi = 0
• Si I est de cardinal n > 0, soit i0 ∈ I, et J = I \ {i0 } (on enlève i0 de l’ensemble I). Alors J est
de cardinal n − 1, et on définit récursivement
X X
xi = xi0 + xi .
i∈I i∈J
P Q
I Manipulation des signes et 53
• La commutativité et l’associativité de + dans R ou C nous assurent que cette définition est

indépendante du choix de i0 .
• Une définition similaire vaut pour le produit, qui dans R ou C est aussi commutatif et associatif,
le produit vide étant par convention égal à 1.
Il faut justifier que cette définition ne dépend pas du choix de xi0 . Raisonner par récurrence d’ordre
2 sur le cardinal de I. Si on choisit à la place xi1 , appliquer l’HR à I \ {xi0 , xi1 }. ⊲
Remarques 4.1.3
1. La lettre i utilisée pour énumérer les éléments de I résulte évidemment d’un choix arbitraire :
on peut remplacer cette lettre par toute autre lettre n’ayant pas de signification externe à la
somme. On dit que i est une variable muette. Ainsi :
X X X
ai = aj = aβ
i∈I j∈I β∈I
X
En revanche, an n’a pas de sens.
n∈[[1,n]]
2. Par usage, il est assez rare de définir une loi additive non commutative et non associative. Ainsi,
en général, à partir du moment où on dispose d’une loi +, on pourra construire des sommes de
familles finies de la sorte.
3. En revanche, beaucoup de lois multiplicatives ne sont pas commutatives. Par exemple le produit
matriciel. Dans ce cas, le produit tel que défini plus haut est mal défini. Il faut se donner un ordre
dans lequel faire les produits (donc un ordre sur les éléments de I). C’est le cas par exemple si
on considère un sous-ensemble [[0, n]] de N.
P Q
Notation 4.1.4 (signes et sur des ensembles d’entiers consécutifs )
Dans le cas particulier où I = [[n, p]], donc où I est un ensemble d’entiers consécutifs, on écrit généra-
lement :
X p X Xp
• ai au lieu de ai ; ainsi, ai = an + an+1 + · · · + ap .
i=n i∈[[n,p]] i=n
Yp Y p
Y
• ai au lieu de ai ; ainsi, ai = an × an+1 × · · · × ap .
i=n i∈[[n,p]] i=n
On lit respectivement « somme pour i allant de n à p des ai » et « produit pour i allant de n à p des
ai ».
Lorsque m = n, la somme (ou le produit) est réduite à un seul terme :

n
X
ai = an .
i=n
Par définition par récurrence, on a :
Convention 4.1.5 (somme vide, produit vide)

Lorsque I = ∅, on pose par convention :
X Y
ai = 0 et ai = 1.
i∈∅ i∈∅
p
X 1
X
Ainsi, si p < n, [[n, p]] est vide, donc ai = 0. Par exemple, i2 = 0.
i=n i=2
Remarque 4.1.6
On notera qu’en général, une somme n’est pas forcément prise sur un ensemble d’entiers successifs,
ni même sur un ensemble d’entiers. La seule condition est que l’ensemble des indices soit fini. on
étudiera le cas où l’ensemble des indices est N dans le chapitre sur les séries, et plus généralement le
cas d’une somme sur une famille dénombrable (cas des familles sommables).

P Q
Le signe a été introduit par le mathématicien suisse Leonhard Euler en 1755, le symbole date de Gauss,
mais on en trouve trace chez Descartes. Mais leur usage ne s’est pas répandu immédiatement, et de nombreux
mathématiciens ont continué à utiliser des points de suspension (par exemple Abel au début du 19e siècle)
Exemples 4.1.8
4
X
1. k(k − 1) = 1(1 − 1) + 2(2 − 1) + 3(3 − 1) + 4(4 − 1) = 2 + 6 + 12 = 20.
k=1
X
2. i2 = 22 + 32 + 52 = 4 + 9 + 25 = 38.
i∈{2,3,5}
3. si E = {(i, j) ∈ N2 | i + j = 5} = {(0, 5), (1, 4), . . . , (5, 0)}, alors

X i 0 1 2 3 4 5 87
= + + + + + = .
j+1 6 5 4 3 2 1 10
(i,j)∈E
X
4. 1 = 1 + · · · + 1 = |E| (autant de termes 1 que d’éléments dans E).
i∈E
X i+k
5. Soit E = {(i, j, k) ∈ (N∗ )3 | i + j + k = 5}. Calculer .
j+k
(i,j,k)∈E
Remarque 4.1.9
À part dans le cas trivial où un des termes du produit est nul, un produit de réels peut toujours se
ramener à une somme en appliquant le logarithme à sa valeur absolue (et en comptant les signes).
Ainsi, si k est le nombre de termes négatifs dans le produit,
!
Y X
k
ai = (−1) exp ln(|ai |) .
i∈I i∈I
De cette manière, la plupart des règles données pour les sommes peuvent facilement être transcrites au
cas des produits. Cependant, ce point de vue n’est possible que sur R.
L’ensemble des indices E peut dépendre d’un paramètre, le plus souvent d’un entier n (parfois d’un couple
d’entiers, ou d’un p-uplet). Dans ce cas, le résultat est une expression dépendant de ce paramètre. Par
exemple si E dépend de n, le résultat de la somme dépend aussi de n.
Exemples 4.1.10 n
X
1. E = {1, · · · , n}, 1 = |E| = n.
i=1
2n
X
2. E = {n, n + 1, . . . , 2n}, f (i) = f (n) + · · · + f (2n).
i=n
P Q
X X X
3. E = {(i, j) ∈ N2 | i + j = n}. Que vaut 1? i? j −i?
(i,j)∈E (i,j)∈E (i,j)∈E
n
Y
4. Par définition de la factorielle, pour n ∈ N, n! = k.
k=1
Avec la convention 4.1.5, il vient : 0! = 1.
P Q
I.2 Règles de manipulation des signes et
Nous donnons maintenant un certain nombre de règles élémentaires sur les sommes.
Proposition 4.1.11 (Somme indexée dans une union disjointe)

On suppose que I = I1 ⊔ I2 est une union disjointe, et I fini. Alors :
X X X
ai = ai + ai .
i∈I i∈I1 i∈I2
Récurrence sur le cardinal de I, en considérant I \ {i0 } i0 étant arbitrairement choisi, et en discutant
selon que iO est dans I1 ou I2 . ⊲
Exemples 4.1.12
1. Soit E = {1, . . . , n} et k ∈ {1, . . . , n}. Alors
n
X k
X n
X
ai = ai + ai
i=1 i=1 i=k+1
Si k = n la deuxième somme est vide, donc nulle.

2. Soit E = {0, . . . , 2n − 1}. En écrivant E sous la forme de l’union de ses éléments pairs et de ses
X i
2n−1
éléments impairs, calculer , où ⌊x⌋ désigne la partie entière de x.
i=0
2
Remarque 4.1.13
Attention à prendre une union disjointe, sinon on somme deux fois chaque élément indexé par un indice
de l’intersection. Dans le cas d’une union non disjointe I = I1 ∪ I2 , on peut écrire :
X X X X
ai = ai + ai − ai .
i∈I i∈I1 i∈I2 i∈I1 ∩I2
Plus généralement, on obtient le résultat suivant :
Proposition 4.1.14 (Sommation par groupement de termes)

Soit I un ensemble fini et I1 , . . . , In deux à deux disjointx tels que I1 ⊔ · · · ⊔ In = I (si les Ik sont de
plus non vides, la donnée de tels ensembles est ce qu’on appelle une partition de I). Soit (ai )i∈I une
famille. Alors
X X X X Xn X
ai = ai + ai + · · · + ai = ai .
i∈I i∈I1 i∈I2 i∈In j=1 i∈Ij
P
Proposition 4.1.15 (Linéarité du symbole )
Soit I un ensemble fini et (ai )i∈I et (bi )i∈I deux familles (réelles ou complexes), et λ, µ deux nombres
réels ouX
complexes.
X Alors X :
• ai + bi = (ai + bi ).
i∈I i∈I i∈I
X X
• λ ai = λai .
i∈I i∈I X X X
• En combinant les deux égalités : λ ai + µ bi = (λai + µbi ).
i∈I i∈I i∈I
Récurrence sur le cardinal de I. ⊲
P
Cette proposition énonce le fait que est une « forme linéaire sur l’espace vectoriel des familles indexées
par un ensemble fini donné I. » (voir chapitre Espaces vectoriel et Applications linéaires )
Corollaire 4.1.16 (somme de termes constants)

Soit E un ensemble fini et a un nombre réel ou complexe. Alors :
X X
a=a· 1 = a · |E|.
i∈E i∈E
Exemples 4.1.17
Xn Xn Xn
n(n + 1)(2n + 1) n(n + 1)
1. k(k + 1) = k2 + k= + .
6 2
k=0 k=0 k=0
X
2. Soit E = {(i, j) | i + j = n}. Calculer j − i, en séparant la somme en deux.
(i,j)∈E
Remarque 4.1.18
Attention à prendre des sommes indexées sur le même ensemble ! Si ce n’est pas le cas, on ne peut
regrouper les sommes que sur l’intersection des indices, en laissant chacun dans leur somme les éléments
indexés hors de cette intersection :
X X X X X
ai + bi = (ai + bi ) + ai + bi .
i∈I1 i∈I2 i∈I1 ∩I2 i∈I1 \(I1 ∩I2 ) i∈I2 \(I1 ∩I2 )
Exemple 4.1.19
Soit E = {0, . . . , n} et E ′ = {1, . . . , n + 1}. Alors
n
X n+1
X n
X
ai + b i = a0 + (ai + bi ) + bn+1 .
i=0 i=1 i=1
Les règles similaires pour le produit sont :
Proposition 4.1.20 (Règles pour les produits)

Avec des notations cohérentes, on obtient les règles suivantes :
P Q
Y Y Y
• Si I1 ∩ I2 = ∅, ai ai = ai .
i∈I1 i∈I2 i∈I1 ∪I2
!λ !µ
Y Y Y
• ai bi = (aλi bµi ).
Yi∈I i∈I i∈I
• a = a|I| .
i∈I
I.3 Changements d’indice

Nous en venons maintenant à une technique importante, qui est celle du changement d’indice. La technique
énoncée est la même pour la somme et le produit. Nous nous contentons de la donner dans le cas de la
somme.
Théorème 4.1.21 (Changements d’indice)

Soit I et J deux ensembles, et f : I → J une bijection de I sur J. Alors, pour toute famille (bj )j∈J ,
X X
bj = bf (i)
j∈J i∈I
Récurrence sur le cardinal (commun) de I et J. ⊲
Cette formule ne fait que traduire le fait que lorsque i parcourt I, les f (i) prennent une et une seule fois
chaque valeur j de J, du fait de la bijectivite de f .
En appliquant ce résultat à la bijection réciproque f −1 (obtenue en remontant les flèches), on a alors
aussi, pour toute famille (ai )i∈I : X X
ai = af −1 (j)
i∈I j∈J
Exemple 4.1.22
Soit I = {2, 4, 5}, J = {1, 2, 3} et f définie par f (2) = 1, f (4) = 3, f (5) = 2. Alors
X X
af −1 (j) = af −1 (1) + af −1 (2) + af −1 (3) = a2 + a5 + a4 = ai .
j∈J i∈I
De même, X X
bf (i) = bf (2) + bf (4) + bf (5) = b1 + b3 + b2 = bj .
i∈I j∈J
Le cas le plus fréquent est celui où la bijection est donnée par une translation sur des ensembles d’entiers
consécutifs :
Corollaire 4.1.23 (changements d’indices par translation)

Soit n, p et ℓ trois entiers tels que n 6 p. Soit (ai )i∈[[n,p]] une famille. Alors :
p
X p−ℓ
X
ai = ai+ℓ .
i=n i=n−ℓ
Exemples 4.1.24 n n n
X X X
1. Montrer que ak + b k = a0 + (ak + bk−1 ) + bn
k=0 k=0 k=1
n
X
2. Transformation d’Abel : Soit (an )n∈N et (bn )n∈N deux suites, et pour tout n ∈ N, Bn = ak .
k=0
Montrer que
n
X n−1
X
ak b k = Bk (ak − ak+1 ) − an Bn−1 .
k=0 k=0
Un autre exemple d’utilisation d’un changement d’indice de ce type est la classique démonstration par
récurrence de la formule du binôme de Newton, due à Pascal.
Théorème 4.1.25 (Formule du binôme)

Soit a et b deux complexes et n un entier positif ou nul. Alors
n
X
n n k n−k
(a + b) = a b .
k
k=0

k n!
On rappelle à cet effet que pour = si k ∈ [[0, n]], et est nul sinon, et on rappelle la formule
n k!(n − k)!
de Pascal, pour n > 0, k ∈ Z (se vérifie facilement avec la formule ci-dessus) :

n n n+1
+ =
k k+1 k+1
I.4 Sommes télescopiques
Définition 4.1.26 (somme

n
télescopique)
X
On dit qu’une somme ak est téléscopique si pour tout k ∈ {0, . . . , n}, on peut écrire de façon simple
k=0
ak sous la forme ak = bk+1 − bk .
Les sommes téléscopiques se calculent facilement. La technique utilisée (séparer la somme en deux et
faire un changement d’indice sur une des deux sommes) est à retenir : elle s’adapte à des situations plus
générales.
Proposition 4.1.27 (calcul des sommes téléscopiques)

P
Soit (bk+1 − bk ) une somme téléscopique. Alors :
Xn
(bk+1 − bk ) = bn+1 − b0 .
k=0
Soit par récurrence, soit en séparant par linéarité, en faisant un changement d’indice sur l’une des
deux sommes, en regroupant sur les indices communes, et en simplifiant. ⊲
Exemples 4.1.28
n
X
1. Calculer k · k!.
k=0
P Q
n
X 1
2. Calculer .
k(k + 1)
k=1
3. Trouver un polynôme P de degré 2 tel que pour tout x ∈ R, P (x + 1) − P (x) = x. En déduire
Xm
k.
k=n
4. Trouver des réels (a, b, c) tels que pour tout k ∈ N∗ ,
1 a b c
= + +
k(k + 1)(k + 2) k k+1 k+2
n
X 1
En déduire l’expression de . Le retrouver par un télescopage simple.
k(k + 1)(k + 2)
k=1
On peut adapter ces résultats au cas des produits :
Définition 4.1.29 (produit

n
télescopique)
Y
On dit qu’un produit ak est téléscopique si pour tout k ∈ {0, . . . , n}, on peut écrire de façon simple
k=0
bk+1
ak sous la forme ak = bk .
Proposition 4.1.30 (calcul des produits téléscopiques)

Q bk+1
Soit bk un produit téléscopique. Alors :
n
Y bk+1 bn+1
= .
bk b0
k=0
I.5 Sommes multiples

Nous étudions maintenant les sommes multiples. Certaines familles peuvent être indexées sur un produit
cartésien (ou au moins un sous-ensemble). Soit K un sous-ensemble de I × J, et (ai,j )(i,j)∈K une famille
X
doublement indexée (i.e. indexée sur un produit cartésien). Le but est d’étudier la somme ai,j en
(i,j)∈K
se ramenant à des sommes portant sur un seul des deux indices. Pour cela, on introduit la notion de
« coupe » de l’ensemble K.
Définition 4.1.31 (coupes d’un sous-ensemble de I × J, voir figure 4.1)

Soit K ⊂ I × J.
• Soit i ∈ I ; on définit la coupe de K suivant i :
Ki,• = {j ∈ J | (i, j) ∈ K}.
• Soit j ∈ J ; on définit la coupe de K suivant j par :
K•,j = {i ∈ I | (i, j) ∈ K}
Définissons également :
′
• Ki,• = {(i, j) | j ∈ Ki,• } = K ∩ ({i} × J)
′
• K•,j = {(i, j) | i ∈ K•,j } = K ∩ (I × {j}).
J
K
′
Ki,• Ki,•
j
′
K•,j
| |
|
i K•,j I
Figure 4.1 – Coupes d’un ensemble
′ ′
Ainsi, Ki,• est le projeté sur J de Ki,• et K•,j est le projeté sur I de K•,j .
Théorème 4.1.32 (Interversion de signes somme)

Soit K ⊂ I × J, et (ai,j )(i,j)∈K une famille indexée sur K. Alors :
X X X X X
ai,j = ai,j = ai,j
(i,j)∈K i∈I j∈Ki,• i∈I (i,j)∈Ki,•
′
X X X X
= ai,j = ai,j .
j∈J i∈K•,j j∈J (i,j)∈K•,j
′
′
En effet, (Ki,• )i∈I forme un partage de K. Est-ce une partition ? ⊲
Dans la pratique ce résultat est très fréquemment utilisé pour intervertir des signes somme (passer du
deuxième terme au troisième terme de cette égalité) lorsque les bornes de l’indice de la somme interne
dépendent de l’indice de la somme externe (dans ce cas, on essaie de voir la somme interne comme la
somme sur une certaine coupe).
Corollaire 4.1.33 (somme sur un pavé)

Soit (ai,j )(i,j)∈[[1,n]]×[[1,m]]. Alors
n X
X m m X
X n
ai,j = ai,j .
i=1 j=1 j=1 i=1
Ce résultat se généralise à un nombre plus important de sommes, ou à d’autres bornes pour les indices,
à condition que ces bornes soient indépendantes des indices des autres sommes.
Attention, en général, il ne suffit pas d’intervertir purement et simplement les signes sommes. Dans la
plupart des cas, une telle interversion amène d’ailleurs à une expression qui n’a pas de sens.
Exemple 4.1.35 (somme sur un triangle, à savoir faire !)

n X
X i n X
X n
Montrer que ai,j = ai,j .
i=0 j=0 j=0 i=j
P Q
I.6 Produits de sommes

Dans la formule de la double somme, si le terme général s’exprime comme produit de deux termes, chacun
d’entre eux ne dépendant que d’un des deux indices, on obtient l’expression du produit de deux sommes :
Proposition 4.1.36 (Produit de deux sommes)
! 
X X XX X
ai  bj  = ai b j = ai b j .
i∈I j∈J i∈I j∈J (i,j)∈I×J
Partant du milieu (égal au terme de droite), factoriser d’abord la somme interne par ai (à i fixé).
P
On peut ensuite factoriser la somme externe par bj . ⊲
Remarque 4.1.37
Attention, si on effectue le produit de deux sommes indexées sur le même ensemble, et pour lesquels
le même indice est utilisé, pensez à d’abord rendre les indices indépendants (les indices étant muets,
changez l’un des deux afin d’avoir deux indices différents) :
n
! n ! n
! n 
X X X X X
ai bi = ai  bj  = ai b j .
i=1 i=1 i=1 j=1 (i,j)∈[[1,n]]2
Attention, en revanche,
n
! n
! n
X X X
ai bi 6= ai b i ,
i=1 i=1 i=1
Le terme de gauche est la somme sur un carré alors que la somme de droite n’est la somme que sur la
diagonale de ce carré !
Le produit de deux sommes se généralise de la façon suivante :
Théorème 4.1.39 (Distributivité généralisée)
n mk
!
Y X X
ak,i = a1,i1 · · · an,in .
k=1 i=1 (i1 ,...,in )∈[[1,m1 ]]×···×[[1,mn ]]
Récurrence sur n. ⊲
I.7 Rapide introduction à la notion de série

Nous terminons l’étude générale des sommes en donnant une piste, qui sera développée ultérieurement,
pour une généralisation au cas d’un nombre infini de termes (indexés par N).
Définition 4.1.40 (série, définition intuitive)

P
Étant donné une suite (an )n∈N , la série de terme général an (désignée par la notation synthétique an )
est la suite (Sn )n∈N , où
Xn
∀n ∈ N, Sn = ai .
i=0
Le terme Sn est appelé n-ième somme partielle de la série de terme général an .
Il ne s’agit de rien d’autre qu’un point de vue particulier sur une suite, ou l’on voit une suite (Sn )n∈N
comme somme de ses différences successives (an ). Assez logiquement, on définit :
Définition 4.1.41 (Convergence)

P
On dit que la série an converge si la suite (Sn )n∈N de ses sommes partielles admet une limite finie
S. Dans ce cas, on définit la somme de cette série comme étant égale à S et on écrit :
+∞
X
an = S.
n=0
On rappelle que la convergence de (Sn ) revient intuitivement à dire que la suite (Sn ) prend, pour n grand,
toutes ses valeurs infiniment proches de S. On formalisera rigoureusement cette notion plus tard.
Une série peut ne pas converger, dans ce cas, on dit qu’elle diverge. On ne peut alors pas donner de sens
+∞
X
à la somme an .
n=0
Le théorème le plus important pour justifier la convergence d’une série est le suivant, issue du théorème
de convergence monotone des suites :
Théorème 4.1.42 (Théorème de comparaison des séries à termes positifs)

P P
Soit un et vn deux séries à termes positifs telles que pour tout n ∈ N, un 6 vn (ou au moins à
partir d’un certain rang). Alors :
P P
• Si vn converge, u aussi
P P n
• Si un diverge, vn aussi.
En notant Un et Vn les sommes partielles, Un 6 Vn et (Un ) et (Vn ) sont monotones. Justifier qu’alors,
P
si vn converge, (Un ) est bornée. Le second point est la contraposée du premier. ⊲
Dans le cas de séries à termes quelconques (réels ou complexes), on est souvent ramené à cette situation
grâce au résultat suivant, admis provisoirement :
Théorème 4.1.43 (Convergence absolue entraîne convergence, admis provisoirement)

P P
Soit (an )n∈N une suite de réels ou complexes. Si |an | converge, alors an converge. La réciproque
est fausse
Afin de pouvoir nous servir de toute la puissance du théorème de comparaison dès maintenant, nous
montrons le résultat suivant. La technique utilisée, par comparaison série/intégrale, est très importante.
On en fera un théorème un peu plus tard.
II Sommes classiques à connaître 63
Théorème 4.1.44 (Nature des séries de Riemann)

X 1
La série de Riemann est convergente si et seulement si α > 1.
nα
n>1
X 1 X Z n+1 dt X Z n dt
Comparer suivant le cas, la série avec la série ou la série , suivant
nα n tα n−1 t
α
qu’on veut majorer ou minorer (pour obtenir la convergence ou la divergence). Les séries des intégrales
se calculent grâce à la relation de Chasles. ⊲
P n
Nous verrons par ailleurs dans la suite de ce chapitre que les séries géométriques a sont convergentes
si et seulement si |a| < 1.
Remarque 4.1.45
Intuitivement, pour qu’une série à termes positifs converge, il faut qu’elle ne grossisse pas trop, donc
P
que les termes qu’on ajoute deviennent petits. En fait, si an converge, an → 0 (vrai aussi pour les
séries à termes quelconques). En revanche, la réciproque est fausse : il ne suffit pas que les termes
deviennent petits à l’infini pour avoir la convergence de la série, comme le montre l’exemple de la série
P1
harmonique n (série de Riemann de paramètre 1).
On étudiera plus précisément les propriétés de convergence des séries dans un chapitre ultérieur. On verra
que l’étude de la convergence d’une série est souvent plus simple que l’étude de la convergence d’une suite,
essentiellement du fait de l’existence de résultats de comparaison tels que ci-dessus. En revanche, même
connaissant la convergence d’une série, le calcul explicite de sa somme S est souvent dur, voire impossible.
II Sommes classiques à connaître

De nombreuses sommes se calculent en se ramenant à des sommes connues. Pour cette raison, il est
important d’avoir un catalogue de sommes (finies) qu’on sait calculer. Ces sommes sont celles de ce para-
graphe, auxquelles s’ajoutent les sommes télescopiques, et certaines sommes obtenues par des techniques
d’analyse (dérivation des sommes géométriques par exemple).
II.1 Somme des puissances d’entiers
Proposition 4.2.1 (somme des puissances d’entiers, petits exposants)

Pour tout n ∈ N,
Xn X n
• k0 = 1=n
k=1 k=1
n
X n(n + 1)
• k= .
2
k=1
n
X n(n + 1)(2n + 1)
• k2 = .
6
k=1
Xn 2
n(n + 1)
• k3 = .
2
k=1
D’innombrables (indénombrables ?) possibilités. Géométriquement pour certaines (voir ci-dessous),
ou classiquement par récurrence sur n, ou encore de proche en proche, en augmentant petit à petit la
valeur de k (voir méthode ci-dessous), ou encore par manipulations de sommes doubles à intervertir
etc. ⊲
On donne une interprétation géométrique des cas des exposants 1 et 3 dans la figure 4.2
n(n + 1)
côté : 1 + 2 + · · · + n =
2
1 2 3 · · · n−1 n 1·12 2 · 22 ··· (n − 1) · (n − 1)2 n · n2
n+1
n n−1 · · · 3 2 1
n
n
X n
X
Figure 4.2 – Illustration géométrique de k et k3 .
k=1 k=1
Notons, de façon générale, pour tout (n, p) ∈ (N∗ )2 ,

n
X
Sn (p) = kp .
k=1
On peut calculer Sn (p) de proche en proche à l’aide de la formule du binôme (rappelée un peu plus loin).
Méthode 4.2.2 (Calcul de proche en proche des Sn (p))

Pour calculer Sn (p) en fonction des sommes précédentes, considérer la somme :
n
X
S= ((1 + k)p+1 − k p+1 ).
k=1
La somme S peut être calculée d’une part comme somme télescopique, d’autre part à l’aide du dévelop-
pement du binôme (ce qui fait partir les termes d’exposant p + 1). Isoler ensuite les termes d’exposant
p.
Remarque 4.2.3
En utilisant les formules précédentes, on obtient sans peine la somme des nombres impairs consécutifs :
n
X
(2k − 1) = n2 .
k=1
Cette formule a une interprétation géométrique toute simple, déjà connue des Grecs antiques (Euclide) :
elle est donnée en figure 4.3.
1 + 3 + 5 + 7 + 9 + 11 + 13 = 72
1 3 5 7 9 11 13
Figure 4.3 – Illustration géométrique de la somme des entiers impairs
Exemplesn 4.2.4
X
Calculer (k + 1)(k + 2).
k=1
II.2 Sommes géométriques

La deuxième grande famille de sommes à bien connaître est la famille des sommes géométriques.
Proposition 4.2.5 (Sommes géométriques)

Soit z ∈ C et n ∈ N. Alors :
n
X
• si z = 1, zk = n + 1 ;
k=0
Xn
1 − z n+1
• si z 6= 1, zk = .
1−z
k=0
n
X
Dans le cas z 6= 1, calculer (1 − z) z k par télescopage. ⊲
k=0
Exemples 4.2.6
4n
X
1. Calculer (2 i)k .
k=0
n
X
2. Calculer p2k en fonction de p ∈ R et n ∈ N.
k=0
n+2
X
3. Calculer, pour n > 4, e−3k .
k=6
En passant à la limite lorsque n tend vers +∞, on obtient :
Théorème 4.2.7 (Séries géométriques) +∞

P n X 1
Soit z ∈ C. La série z converge si et seulement si |z| < 1, et dans ce cas, zn =
n=0
1−z
Proposition 4.2.8 (Factorisations de an − bn et an + bn , Bernoulli)

Soit a et b des nombres complexes et n un entier. Alors :
n−1
X
• an − bn = (a − b)(an−1 + an−2 b + an−3 b2 + · · · + abn−2 + bn−1 ) = (a − b) an−1−k bk ;
k=0
• En particulier, pour b = 1, on obtient :
n−1
X
an − 1 = (a − 1)(an−1 + an−2 + · · · + a + 1) = (a − 1) ak ;
k=0
• si n est impair, alors :

n−1
X
an + bn = (a + b)(an−1 − an−2 b + an−3 b2 + · · · − abn−2 + bn−1 ) = (a + b) (−1)k an−1−k bk ;
k=0
Encore du télescopage. ⊲
Exemple 4.2.9
1. Que retrouve-t-on pour n = 2 ?
2. Quelles sont les racines dans C du polynôme 1 + X + X 2 ? du polynôme 1 + X + X 2 + X 3 ?
3. Donner une factorisation dans C de a4k+2 + b4k+2 (k ∈ N). En donner une factorisation dans R
(par (a2 + b2 ))
Méthode 4.2.10 (Dérivées de sommes géométriques réelles)

n
X n
X
1. Pour calculer (k + 1)xk , dériver l’expression donnant xk+1 (pour x réel)
k=0 k=0
n
X
2. En théorie, cela permet de calculer toutes les sommes (k+1)(k+2) · · · (k+ℓ)xk , par dérivations
k=0
successives de sommes géométriques. En pratique, les calculs deviennent vite assez pénibles
lorsque ℓ grandit.
3. En admettant que tout polynôme de degré d peut s’écrire comme combinaison linéaire des
polynômes 1, X + 1, (X + 1)(X + 2), . . . , (X + 1)(X + 2) . . . (X + d), cela fournit une méthode
X n
théorique de calcul de toutes les sommes P (k)xk , pour un réel x quelconque, et un polynôme
k=0
P (le cas x = 1 résulte du paragraphe précédent, puisqu’on a dans ce cas des sommes de
puissances d’entiers).
Exemple 4.2.11
n
X k
1. Calculer .
3k
k=0
Xn
2. Calculer k 2 xk , pour tout x ∈ R.
k=0
5
Combinatoire et dénombrement
“What’s one and one and one and one and one and one and one and one and one and one ?”
“I don’t know,” said Alice. “I lost count.”
“She can’t do Addition.”
(Lewis Carroll)
Le dénombrement est à l’origine des mathématiques : compter.
Dénombrer un ensemble d’objets, c’est déterminer le cardinal de cet ensemble. Le dénombrement se base
souvent sur la combinatoire, qui est l’étude des configurations possibles d’un ensemble d’objets, donc
l’étude de la structure d’un ensemble, passant éventuellement par une description décomposée des objets
(contruction par choix successifs), ou un tri des objets suivant certains critères.
La clé du dénombrement combinatoire est la notion de bijection : si je peux construire une correspondance
un-à-un (one-to-one) entre objets d’un ensemble E et les objets d’un ensemble F (c’est-à-dire une bijection
de E dans F ), alors E a autant d’objets que F .
C’est d’ailleurs comme cela qu’on définit la notion de cardinal d’un ensemble fini, par comparaison avec
un ensemble [[1, n]], correspondant à une énumération des éléments de E (l’action de compter)
Par la suite, il est souvent un peu maladroit de revenir systématiquement à la définition en comparant
à un ensemble [[1, n]], et on recherche plutôt la mise en bijection avec des ensembles de référence bien
connus et étudiés. Une telle méthode nécessite souvent une étude de la structure de l’ensemble étudié, et
de la façon de construire les objets de cet ensemble : c’est une méthode relevant de la combinatoire.
I Notion de cardinal, combinatoire des ensembles

I.1 Définition du cardinal
On ne peut pas définir directement de cardinal d’un ensemble quelconque, sans introduire de nouveaux
objets. En revanche, on peut définir sans difficulté des classes de cardinaux (donc définir une condition
pour que deux ensembles aient même cardinal, ce qui permet ensuite de grouper les ensembles en classes
d’ensembles de même cardinal).
Définition 5.1.1 (Définition de la cardinalité selon Frege)

On dit que deux ensembles E et F ont même cardinal s’il existe une bijection de E à F . On note
Card(E) = Card(F ).
70 CHAPITRE 5. COMBINATOIRE ET DÉNOMBREMENT
Définition 5.1.2 (Ensemble fini, cardinal d’un ensemble fini)

Un ensemble est fini s’il existe un entier n et une bijection f : [[1, n]] → E, ou de façon équivalente
une bijection g : E → [[1, n]]. On dit dans ce cas que E est de cardinal n, et on note Card(E) = n, ou
|E| = n.
Lemme 5.1.3 (Unicité du cardinal)

Soit n 6= m. Il n’existe pas de bijection de [[1, n]] dans [[1, m]]. Ainsi, un ensemble E ne peut pas être à
la fois de cardinal n et de cardinal m.
On raisonne par récurrence sur n : s’il existe une bijection f , de [[1, n+1]] dans [[1, k]], et si f (n+1) = ℓ,
f induit une bijection de [[1, n + 1]] dans [[1, k]] \ {l} lui-même en bijection avec [[1, k − 1]] (en décalant
les derniers éléments). ⊲
Exemples 5.1.4
1. |E| = 0 si et seulement si E = ∅,
2. |[[1, n]]| = n.
Lemme 5.1.5 (Sous-ensembles d’un ensemble fini)

Tout sous-ensemble d’un ensemble fini est aussi fini.
Se ramener au cas où l’ensemble total est [[1, n]].
On raisonne alors par récurrence sur n. Pour F ⊂ [[1, n + 1]], discuter suivant que n + 1 ∈ F (on
peut appliquer l’hypothèse de récurrence directement) ou non (appliquer l’hypothèse de récurrence
à F ∩ [[1, n]], puis prolonger la bijection obtenue) ⊲
I.2 Règles de calcul sur les cardinaux

Voyons maintenant les différentes règles de calcul des cardinaux relatives aux différentes constructions
possibles sur les ensembles. La plupart se comprennent bien intuitivement en interprétant le cardinal
comme le nombre d’éléments. Le petit jeu est alors de réussir à formaliser le raisonnement en revenant à
la définition, et en construisant une bijection adéquate.
Proposition 5.1.6 (Cardinal d’une union disjointe)

Soit A, B, A1 , . . . , An des ensembles finis.
1. Si A ∩ B = ∅, alors |A ⊔ B| = |A| + |B|.
2. Plus généralement, si pour tout (i, j) ∈ [[1, n]]2 tel que i 6= j, Ai ∩ Aj = ∅, alors
|A1 ⊔ · · · ⊔ An | = |A1 | + · · · + |An |.
Le point 2 s’obtient du point 1 par récurrence.
Pour le point 1, si m et n sont les cardinaux respectifs de A et B, contruire une bijection de [[1, m]]
dans A ⊔ B en se servant d’une bijection de [[m + 1, m + n]] sur [[1, n]]. ⊲
I Notion de cardinal, combinatoire des ensembles 71
Proposition 5.1.7 (Cardinal d’un complémentaire)

Si A ⊂ B, alors ∁B A = |B| − |A|.
Écrire l’un des trois ensembles en jeu comme union disjointe des deux autres et appliquer la propo-
sition précédente. ⊲
Corollaire 5.1.8 (Cardinal d’un sous-ensemble)

Si A ⊂ B, alors |A| 6 |B|, avec égalité si et seulement si A = B.
L’inégalité découle immédiatement de la proposition précédente. Le cas d’égalité résulte du fait
qu’alors ∁B A est de cardinal 0. ⊲
Proposition 5.1.9 (Cardinal d’une union quelconque)

Soit A et B des ensembles finis. On a :
|A ∪ B| = |A| + |B| − |A ∩ B|.
Écrire A∪B comme union disjointe de trois ensembles, correspondant aux trois zones d’un diagramme
en patates. ⊲
Plus généralement, on a la formule suivante, due à Moivre :
Théorème 5.1.10 (Formule du crible de Poincaré, ou formule d’inclusion-exclusion, HP)

Soit A1 , . . . , An des ensembles finis. Alors :
 
n
X X X \
(−1)k−1
|A1 ∪ · · · ∪ An | = |Ai1 ∩ · · · ∩ Aik | = (−1)|I|−1 Ai .

k=1 16i1 <···<ik 6n I⊂[[1,n]] i∈I
I6=∅
Il s’agit d’une récurrence sur n. On applique le cas n = 2 à A1 ∪ · · · ∪ An et An+1 , on utilise
l’hypothèse de récurrence pour le calcul de |A1 ∪ · · · ∪ An | ainsi que pour le calcul de |(A1 ∪ · · · ∪
An ) ∩ An+1 | après avoir distribué l’intersection. Remarquer qu’on obtient tous les termes voulus, les
indices (ensemblistes I ⊂ [[1, n + 1]]) étant triés en 3 catégories :
• les ensembles I non vides ne contenant pas n + 1 (la somme obtenue à partir de A1 ∪ · · · ∪ An )
• les ensembles I non réduits à un élément et contenant n + 1 (la somme obtenue à partir de
(A1 ∪ · · · ∪ An ) ∩ An+1 )
• Le sous-ensemble I = {n + 1} (le terme |An+1 | apparaissant lors de la première étape.
⊲
Proposition 5.1.11 (Cardinal d’un produit cartésien)

1. Soit A et B deux ensembles finis. Alors |A × B| = |A| × |B|.
2. Plus généralement, soit A1 , . . . , An des ensembles finis. Alors
n
Y
|A1 × · · · × An | = |Ai |.
i=1
Le point 2 s’obtient du 1 par récurrence.
Pour le point 1, se ramener au cas où A = [[0, m − 1]] et B = [[0, n − 1]], et construire une bijection
[[0, mn − 1]] → [[0, m − 1]] × [[0, n − 1]] en pensant à une opération arithmétique classique. ⊲
I.3 Comparaison des cardinaux en cas d’injectivité et surjectivité

Des résultats liés aux cardinaux des sous-ensembles d’un ensemble fini, on déduit assez facilement la
comparaison des cardinaux de E et de F en cas d’existence d’une injection ou d’une surjection entre les
deux.
Proposition 5.1.12 (Injectivité, surjectivité, bijectivité et cardinal)

Soit E et F deux ensembles finis, et soit f : E −→ F une application. Alors :
1. Si f est injective, Card(E)....Card(F )
2. Si f est surjective, Card(E)....Card(F )
3. Si f est bijective, Card(E)....Card(F ).
Restreindre ou corestreindre de façon adéquate, de sorte à se ramener à une bijection. ⊲
On en déduit notamment une caractérisation des applications bijectives entre ensembles de même cardi-
nal :
Corollaire 5.1.13 (Caractérisation des bijections)

Soit A et B deux ensembles finis de même cardinal, et f : A → B. Alors les 3 propriétés suivantes sont
équivalentes :
(i) f est bijective
(ii) f est injective
(iii) f est surjective
On se rend facilement compte qu’il suffit de montrer que (ii) ⇐⇒ (iii).
Si f est injective, remarquer que |Im(f )| = |A| et utiliser le cas d’égalité des cardinaux des sous-
ensembles.
Si f n’est pas injective, montrer que |Im(f )| < |A|, en construisant une surjection d’un sous-ensemble
strict de A sur Im(f ). ⊲
II Combinatoire des ensembles d’applications 73
II Combinatoire des ensembles d’applications

Nous dénombrons dans cette partie certains ensembles d’applications, qui serviront de modèles par la
suite pour des situations probabilistes liées à des expériences de tirages. Certains de ces résultats ont déjà
été démontrés ; il s’agit ici plutôt de grouper et classifier un peu ces résultats rencontrés de façon éparse.
II.1 Applications quelconques ; p-listes
Proposition 5.2.1 (Cardinal de l’ensemble des applications)

Soit E et F deux ensembles finis. On rappelle qu’on note F E l’ensemble des applications de E vers F .
Alors |F E | = |F ||E| .
Une bijection E → [[1, n]] définit une énumération x1 , . . . , xn des éléments de E. Remarquer que F E
est alors en bijection avec F n , en associant à f le n-uplet des images (f (x1 ), . . . , f (xn )). ⊲
Définition 5.2.2 (p-listes)

Une p-liste d’éléments de F (ou p-uplet) est un élément (x1 , . . . , xp ) de F p .
Une p-liste peut être vue indifféremment comme un élément d’un produit cartésien F × · · · × F , ou de
l’ensemble F [[1,p]] des fonctions de [[1, p]] dans F , associant xi à i. Ce second point de vue aura l’avantage
de mieux faire comprendre certaines propriétés imposées sur une liste. Ainsi, les listes d’éléments distincts
correspondent aux fonctions injectives.
Évidemment, les deux points de vue amènent de façon immédiate le dénombrement suivant :
Proposition 5.2.3 (Nombre de p-listes ; tirages successifs avec remise)

• Le nombre de p-listes d’éléments de F est |F |p .
• Version combinatoire : le nombre de résultats possibles lors d’une succession de p tirages avec
remise dans une urne de n boules différenciées est np .
Enfin, étant donné E un ensemble fini, L’ensemble P(E) peut être mis en bijection avec l’ensemble des
applications de E vers {0, 1} via les fonctions caractéristiques. On obtient donc :
Proposition 5.2.4 (Cardinal de l’ensemble des parties)

|P(E)| = 2|E| .
II.2 Lemme du berger

Le résultat suivant permet de donner de la rigueur à tous les arguments combinatoires reposant sur des
choix successifs :
Lemme 5.2.5 (Lemme du berger)

Soit f : E → F une application surjective. On suppose qu’il existe un entier k ∈ N∗ tel que pour tout
y ∈ F , |f −1 (y)| = k (tous les éléments de F ont le même nombre k d’antécédents). Alors |E| = k · |F |.
Considérer la partition de E définie par cette surjection : le nombre de parts est |F | et chaque part
est de cardinal k. ⊲
Remarque 5.2.6
• Ce lemme dit essentiellement que si tout mouton a quatre pattes, il y a quatre fois plus de pattes
que de moutons (la fonction f étant ici la fonction associant à une patte donnée le mouton auquel
elle est rattachée).
• Le lemme du berger permet de formaliser la notion de « choix successifs ». Il est souvent utilisé
de façon implicite dans les raisonnements. Il faut essentiellement en retenir que lorsqu’on fait
des choix successifs, et qu’à chaque étape, le nombre de possibilité ne dépend pas de la situation
dans laquelle on se trouve (c’est-à-dire des choix précédents), alors le nombre total de possibilités
s’obtient en faisant le produit du nombre de possibilités à chaque étape.
• La formalisation d’un tel choix par le lemme du berger se fait en considérant la fonction qui
à un choix possible associe la situation à l’étape précédente permettant ce choix. Le calcul du
nombre d’injections est un exemple typique d’utilisation du lemme du berger.
• À la longue, on ne formalisera plus complètement ce type d’arguments, et on se contentera de
l’approche intuitive des choix successifs. Mais il faut bien être conscient à tout moment que cette
approche intuitive peut être formalisée rigoureusement. C’est seulement lorsqu’on est pleinement
conscient de la possibilité de faire cette formalisation de la sorte qu’on peut s’en dispenser.
II.3 Injections ; p-listes d’éléments distincts

Nous avons déjà démontré par des arguments intuitifs (choix successifs) le résultat suivant. Nous en
donnons maintenant une formalisation reposant sur le lemme du berger.
Théorème 5.2.7 (Dénombrement des injections)

Soit A et B deux ensembles de cardinaux respectifs p et n. Alors, si p 6 n, le nombre d’injections de
n!
A vers B est Apn = (n−p)! . Si p > n, il n’existe pas d’injection de A vers B.
Se ramener au cas où A = [[1, p]], par commodité.
L’idée intuitive consiste à dire qu’on a n façons de choisir une valeur pour f (1), puis plus que n − 1
façons de choisir une valeur pour f (2) (pour préserver l’injectivité), etc : à chaque étape, on diminue
de 1 le nombre de choix possibles.
Il s’agit donc de choix successifs : chaque étape peut se formaliser par le lemme du berger. Faire une
récurrence (sur p) permet alors de n’avoir qu’une étape à rédiger. Appliquer le lemme du berger à
l’application qui à une injection f de [[1, p + 1]] dans B associe sa restriction à [[1, p]]. Comment gérer
le cas p > n ? ⊲
Une transcription en terme de listes donne alors :
Proposition 5.2.8 (Dénombrement des p-arrangements ; tirages successifs sans remise)

• Soit F de cardinal n et p 6 n. Le nombre de p-listes d’éléments distincts de F (ou p-arrangements
n!
de F ) est Apn = (n−p)! .
• Version combinatoire : le nombre de résultats possibles lors d’une succession de p tirages sans
n!
remise dans une urne contenant n boules différenciées est Apn = (n−p)! .
En particulier, on obtient le cardinal des groupes symétriques :
Corollaire 5.2.9 (Nombre de permutations d’un ensemble)

1. Soit E un ensemble fini. Alors |SE| = |E|!
III Sous-ensembles et coefficients binomiaux 75
2. En particulier, |Sn | = n!
Définition 5.2.10 (Permutation de n éléments)

Une permutation de n éléments distincts x1 , . . . , xn est une façon d’ordonner entre eux ces éléments.
Il s’agit donc d’un n-uplet (y1 , . . . , yn ) tel que chaque xi soit égal à un et un seul des yi . On note
Perm(x1 , . . . , xn ) l’ensemble des permutations des éléments x1 , . . . , xn .
Proposition 5.2.11
Perm(x1 , . . . , xn ) ≃ Sn . Ainsi, |Perm(x1 , . . . , xn )| = n!.
II.4 Surjections
Dénombrer les surjections est un problème plus dur (lié à ce qu’on appelle les nombres de Stirling).
L’exemple ci-dessous est simple, mais introduit les problèmes qu’on peut rencontrer lorsqu’on cherche à
dénombrer des surjections dans des cas plus généraux.
Exemple 5.2.12
n
Le nombre de surjections de [[1, n]] dans [[1, n − 1]] est (n − 1)! .
2
III Sous-ensembles et coefficients binomiaux

Le coefficient binomial, que nous avons déjà rencontré, est défini combinatoirement :
Définition 5.3.1 (Coefficient

binomial)
n
Le coefficient binomial est le nombre de parties à k éléments de [[1, n]]. Avec les notations intro-
k
duites précédemment, nous pouvons donc écrire :

n
= |Pk (n)|.
k
Proposition 5.3.2
n
Le coefficient binomial est plus généralement le nombre de sous-ensemble de cardinal k d’un
k
ensemble quelconque E de cardinal n :

n
= |Pk (E)|, où |E| = n.
k
Montrer qu’une bijection E → F induit une bijection Pk (E) → Pk (F ) et appliquer cela à E → [[1, n]].
⊲
Proposition 5.3.3 (Expression factorielle du coefficient binomial)

n n!
Pour k ∈ [[0, n]], = .
k k!(n − k)!
Appliquer le lemme du berger à l’application qui à un k-arrangement (x1 , . . . , xk ) d’éléments de [[1, n]]
associe le sous-ensemble {x1 , . . . , xk }. ⊲
Convention 5.3.4 (Valeurs du coefficient binomial)

n
• Si n ou p est strictement négatif, on pose par convention = 0.
p
n 0
• De la définition il résulte également que si p > n, = 0 et que = 1.
p 0
Remarque 5.3.5 (Valeurs particulières à retenir)

Les valeurs suivantes sont à bien retenir :

n n n n n n n(n − 1)
= = 1, = = n, = = .
0 n 1 n−1 2 n−2 2
Nous nous évertuerons dans ce chapitre à ne considérer, dans la mesure du possible, que la définition
combinatoire du coefficient binomial, et non son expression.
La définition combinatoire même du coefficient binomial fournit diverses inerprétations possibles en terme
de dénombrement,
les plus importantes, en plus de la définition, étant les suivantes :
n
• est le nombre de mots de longueur n, constitué de p lettres a et n − p lettres b.
p
n
• est le nombre de chemins de longueur n consitués de p pas vers le haut et n − p pas vers la
p
a+b
droite. Ainsi, est le nombre de chemins constitués de pas à droite et vers le haut, reliant
a
(0, 0) à (a, b).
Voici deux propriétés utiles qui découlent de façon immédiate de la formule du coefficient binomial, mais
qui peuvent être démontrée aussi par la combinatoire, en revenant à la définition par les sous-ensembles :
Proposition 5.3.6 (propriétés du coefficient binomial)

Soit (n, k) ∈ Z2 . On a :

n n
• = (symétrie du coefficient binomial)
k
n− k
n n−1
• k =n (parfois appelée formule comité-président)
k k−1
1. Quelle opération ensembliste simple appliquer à un sous-ensemble de [[1, n]] de cardinal k pour
obtenir un sous-ensemble de cardinal n − k ?
2. Cette formule porte bien son surnom. Elle dénombre le nombre de sous-ensembles de cardinal
k (comité) dans lesquels on a distingué un élément (président). Suivant qu’on choisit d’abord
le comité qui élit son président ou qu’on choisit d’abord le président qui s’entoure ensuite d’un
comité à son goût, on obtient les deux expressions voulues.
⊲
La formule suivante, source de la construction du fameux triangle de Pascal, se démontre aisément avec
l’expression factorielle des coefficients binomiaux, mais peut elle aussi être démontrée par un argument
combinatoire.
III Sous-ensembles et coefficients binomiaux 77
Proposition 5.3.7 (Formule de Pascal)

2 n n n+1
Pour tout (n, p) ∈ Z \ {(−1, −1)}, + = .
p p+1 p+1
Dans le cas n, p positifs, trier les sous-ensembles de [[1, n + 1]] suivant l’appartenance ou non de n + 1
à ces ensembles.
Dans les autres cas, c’est de la vérification élémentaire avec les valeurs aux bords (p = 0) et les
valeurs définies par convention. ⊲
Grâce à cette formule, on peut contruire les coefficients binomiaux par ligne (une ligne représentant
une valeur de n donnée), de proche en proche. Cette construction est particulièrement utile lorsqu’on
recherche des coefficients binomiaux pour une valeur raisonnablement petite de n (disons n 6 10), par
exemple en vue d’utiliser la formule du binôme de Newton (présentée un peu plus loin). La construction
de ce triangle est expliquée dans la figure 5.1.
k=0
k=1
k=2
n=0 (0) 1 (0)

k=3
n=1 (0) 1 1 (0)

k=4
n=2 (0) 1 2 1 (0)

k=5
n=3 (0) 1 3 3 1 (0)
n=4 (0) 1 4 6 4 1 (0)

k=6
+ + + + + +
k=7
n=5 (0) 1 5 10 10 5 1 (0)

k=8
n=6 (0) 1 6 15 20 15 6 1 (0)

k=9
n=7 (0) 1 7 21 35 35 21 7 1 (0)

k = 10
n=8 (0) 1 8 28 56 70 56 28 8 1 (0)
n=9 (0) 1 9 36 84 126 126 84 36 9 1 (0)
n = 10 (0) 1 10 45 120 210 252 210 120 45 10 1 (0)

n
Figure 5.1 – Triangle de Pascal pour le calcul de
p

Le triangle des coefficients binomiaux, que nous appelons communément « triangle de Pascal » était en fait
connu depuis bien longtemps déjà lorsque Blaise Pascal s’y intéressa : on y trouve mention déjà chez Halayudha,
mathématicien indien du 10e siècle, ainsi qu’en Chine au 13e siècle. La contribution de Pascal a essentiellement
été de démontrer en 1654 un grand nombre de propriétés de ce triangle, jusque-là admises. C’est d’ailleurs à
cette occasion qu’il a mis au point le principe de la démonstration par récurrence !
Théorème 5.3.9 (Formule du binôme de Newton)

Soit a et b deux nombres complexes, et n ∈ N. Alors
n
X
n n k n−k
(a + b) = a b .
k
k=0
Un terme ak bn−k du développement du produit (a + b)n = (a + b)(a + b) · · · (a + b), est obtenu en
choisissant, dans chaque parenthèse le terme a ou le terme b. Combien de façons a-t-on de faire de
tels choix de sorte à obtenir k facteurs a et n − k facteurs b ? ⊲

La formule du binôme était elle aussi déjà connue depuis longtemps, notamment en Inde et en Chine, en relation
avec le triangle de Pascal. L’apport de Newton est bien réel et important, mais ne concerne pas les exposants
entiers naturels. Isaac Newton a en fait généralisé cette formule pour tout exposant réel, sous forme d’une
somme infinie. Pour les entiers négatifs, c’est ce qu’on appelle la « formule du binôme négatif ».
On peut généraliser la formule du binôme au cas d’une puissance de la somme de k termes. Pour cela,
nous avons besoin d’un objet combinatoire supplémentaire
Définition 5.3.11 (Coefficient multinomial, HP)

n

Soit n ∈ N et (i1 , . . . , ik ) tels que i1 + · · · + ik = n. Le coefficient multinomial i1 ,...,ik est le nombre
de partages ordonnés (A1 , . . . , Ak ) de [[1, n]] de cardinaux imposés |Aj | = ij .
Théorème 5.3.12 (Expression des coefficients multinomiaux, HP)

Avec les notations précédentes, on a :

n n!
= .
i1 , . . . , ik i1 ! · · · ik !
Utiliser le lemme du berger avec l’application qui à un n-uplet (x1 , . . . , xn ) associe (A1 , dots, Ak ), où
Aℓ = {xi1 +···+iℓ−1 +1 , . . . , xi1 +···+iℓ }.
Alternative : choisir successivement A1 puis A2 etc, ce qui donne un produit de coefficients binomiaux.
Simplifier quelques factorielles. Remarquer que ces choix successifs cachent aussi une utilisation du
lemme du berger. ⊲
Théorème 5.3.13 (Formule du multinôme, HP)

Soit a1 , · · · , ak des réels, et n un entier positif. Alors
X
n
n
(a1 + · · · + ak ) = ai1 · · · aikk ,
i1 +···+ik =n
i1 , . . . , ik 1
la somme étant prise sur les k-uplets (i1 , . . . ik ) ∈ Nk vérifiant l’égalité mentionnée sous la somme.
IV Bijection, Déesse de la Combinatoire 79
Un terme du développement de la puissance est obtenu en choisissant dans chacun des n termes
parenthésés un des termes a1 , . . . , ak . Il y a donc autant de termes ai11 · · · aikk qu’il y a de façons de
choisir les i1 parenthèses desquelles on extrait a1 (cela définit A1 ), les i2 parenthèses desquelles on
extrait a2 (cela définit A2 ) etc. ⊲
Amusez-vous à montrer la formule du multinôme algébriquement, par récurrence à partir de la formule

du binôme. C’est un bon exercice de manipulations de sommes.
IV Bijection, Déesse de la Combinatoire

La bijection étant au coeur-même de la définition du cardinal, elle tient un rôle central dans un grand
nombre de problèmes de dénombrement. On obtient en particulier le principe fondamental suivant :
Méthode 5.4.1 (Principe fondamental du dénombrement)

Pour montrer que deux ensembles ont même cardinal, il suffit de construire une bijection entre eux.
Ainsi, pour déterminer le cardinal d’un ensemble, on le met souvent en bijection avec un ensemble « de
référence » dont on connaît le cardinal.
Nous en avons déjà vu des exemples d’utilisation, par exemple la preuve de la symétrie des coefficients bi-
nomiaux. Voici quelques autres exemples, qui représentent des situations très classiques, à bien connaître :
Exemples 5.4.2
1. Dénombrer les p-listes (k1 , . . . , kp ) d’entiers strictement positifs tels que k1 + · · · + kp = n.
2. Dénombrer les p-listes (k1 , . . . , kp ) d’entiers positifs ou nuls tels que k1 + · · · + kp = n.
3. Dénombrer les p-listes strictement croissantes d’éléments de [[1, n]].
4. Dénombrer les p-listes croissantes d’éléments de [[1, n]].
Retenir cette bijection consistant à éloigner les éléments les uns des autres. C’est un cas revenant assez
souvent. Nous l’appelerons le principe de l’accordéon.
V Preuves combinatoires d’identités

Idée : dénombrer de deux manières différentes le même ensemble, de manière à obtenir des relations,
dont certaines ne sont pas toujours évidentes à démontrer analytiquement.
Méthode 5.5.1 (Démonstration combinatoire d’une formule)

1. Trouver un modèle adapté à la formule, autrement dit un ensemble d’objets dont le dénombre-
ment fournira un des membres de l’égalité. Pour cela, il est préférable de s’aider du membre le
plus simple de l’égalité.
2. Dénombrer cet ensemble de deux façons différentes. Souvent, on procède d’une part à un dé-
nombrement direct, et d’autre part à un dénombrement après avoir effectué un tri (de façon
formelle, cela revient à définir une partition de l’ensemble). Le résultat d’un dénombrement par
tri se traduit par une somme.
3. Évidemment, cette méthode n’est adaptée qu’à des formules portant sur des nombres entiers, si
possible positifs. Il est parfois possible de se ramener à cette situation par un prétraitement de
la formule à démontrer.
Proposition 5.5.2 (Quelques

formules
se démontrant
combinatoirement)
n n−1 n−1
1. Formule de Pascal : = + .
k k−1 k
Xn
n
2. = 2n .
k
k=0
Xn
N M N +M
3. Formule de Vandermonde : = .
k n−k n
k=0
X p
n+k n+p+1
4. Formule de sommation : =
n n+1
k=0
5. C’est un cas particulier d’une formule plus générale, de type Vandermonde :
n
X
k n−k n+1
=
N M M +N +1
k=0
1. Trier les sous-ensembles de [[1, n]] suivant que n est dedans ou non.
2. Trier les sous-ensembles de [[1, n]] suivant leur cardinal.
3. Composer des bouquets de n fleurs, disposant de 2 types de fleurs.
4. Trier les sous-ensembles à n + 1 éléments de [[1, n + p + 1]] suivant la valeur de leur élément
maximum.
5. Trier les sous-ensembles à n + 1 éléments de [[1, M + N + 1]] suivant la valeur de leur ..... élément.
⊲
Ces formules peuvent intervenir notamment dans certains calculs d’espérance ou de variance.
Méthode 5.5.3
Remarquez qu’un signe (−1)k associé à un coefficient binomial correspond souvent à une comparaison
de parités de cardinaux. On peut passer d’un cardinal impair à un cardinal pair, et vice-versa, en
« allumant ou éteignant » un élément fixé à l’avance, suivant qu’il est déjà ou non dans notre ensemble
(plus précisément, il s’agit de l’opération X 7→ X △ {x}).
Nous appelerons ceci le principe de l’interrupteur.
VI Introduction à la dénombrabilité (HP)

Tout ce paragraphe est du ressort du programme de Spé, à part le dernier point.
Définition 5.6.1 (Dénombrabilité)

Un ensemble E est dénombrable s’il peut être mis en bijection avec N ou l’un de ses sous-ensembles.
Avertissement 5.6.2
Il s’agit ici de la définition du programme. Dans de nombreux ouvrages, un ensemble est dénombrable
s’il est de même cardinal que N. On appelle dans ce contexte « ensemble au plus dénombrable » un
ensemble dénombrable au sens de notre définition.
VI Introduction à la dénombrabilité (HP) 81
Lemme 5.6.3
Un sous-ensemble E non fini de N est de même cardinal que N.
Construire par récurrence une application injective de [[0, n]] dans E, en rajoutant à chaque étape le
minimum des éléments non encore utilisés. Cela définit une bijection N → E. ⊲
Ainsi, un ensemble dénombrable est soit de même cardinal que N, soit fini.
Lemme 5.6.4 (Caractérisation des ensembles au plus dénombrables)

Soit E un ensemble non vide. Les trois propriétés suivantes sont équivalentes :
(i) E est dénombrable
(ii) il existe une fonction injective f : E −→ N.
(iii) il existe une fonction surjective f : N −→ E.
• (i) =⇒ (ii) : considérer une bijection E → F ⊂ N, et composer par l’injection canonique.
• (ii) =⇒ (iii) : c’est l’inversibilité à gauche d’une injection.
• (iii) =⇒ (ii) : c’est l’inversibilité à droite d’une surjection. Pourquoi l’axiome du choix n’est-il
pas nécessaire ici ?
• (ii) =⇒ (i) : corestriction à l’image.
⊲
Nous utilisons le fait, déjà démontré en exercice, que N2 est dénombrable (via la numérotation en diago-
nale).
Proposition 5.6.5 (Construction d’ensembles dénombrables)

1. Si E et F sont dénombrables non vides, alors E × F est dénombrable.
2. Plus généralement, un produit d’un nombre fini d’ensembles dénombrables est dénombrable.
3. Une union d’un nombre dénombrable d’ensembles dénombrables est dénombrable.
1. Construire une surjection par composition : N → N × N → E × F
2. Récurrence
3. Supposons les ensembles indexés sur I dénombrable. Construire une surjection
[
N→N×N→I ×N → Ai .
i∈I
Corollaire 5.6.6
1. L’ensemble Z est dénombrable.
2. L’ensemble Np est dénombrable.
3. L’ensemble Q des rationnels est dénombrable.
4. L’ensemble Z[x] des fonctions polynomiales à coefficients entiers est dénombrable.
Théorème 5.6.7
L’ensemble des réels R est non dénombrable.
Sinon, considérer une énumération (xn )n∈N∗ de tous les réels, et considérer un y tel que le n-ième
chiffre après la virgule de y soit distinct de 0, 9 et du n-ième chiffre de xn . Le réel y peut-il être dans
l’énumération ? Pourquoi prendre la précaution de prendre les chiffres distincts de 0 et 9 ? ⊲
Nous terminons cette étude par un théorème de Cantor, affirmant notamment qu’il existe des ensembles
de cardinal plus gros que le dénombrable. Il existe même une infinité de cardinaux infinis distincts.
Définition 5.6.8
On dit que Card(E) 6 Card(F ) si et seulement s’il existe une injection de E dans F , et Card(E) <
Card(F ) si et seulement si Card(E) 6 Card(F ) et Card(E) 6= Card(F ).
Théorème 5.6.9 (Cantor, 1891, HP)

Pour tout ensemble X, on a Card(X) < Card(P(X)).
S’il existe une surjection f : X → P(X), considérer Y ⊂ X constitué des éléments x tels que
x 6∈ f (x), et obtenir une contradiction en considérant l’apparenance de c à Y , c étant un élément de
X tel que f (x) = Y . ⊲
Comme on l’a signalé plus haut, ce résultat entre en contradiction avec l’existence de l’ensemble des
ensembles.
6
Relations
« Ce n’est pas un lemme, et il n’est pas de moi »

(Max Zorn, à propos du « lemme de Zorn »)
Comme on l’a vu, les applications, ou plus généralement les fonctions, sont une façon de mettre en relation
deux ensembles, donc de faire interagir nos objets formels que sont les ensembles. Mais le rôle des deux
ensembles ainsi mis en relation n’est pas symétrique, du fait de la contrainte d’unicité de l’image, alors
qu’on n’a pas la contrainte d’unicité de l’antécédent. Nous voyons dans ce chapitre comment définir une
notion plus générale, permettant de retrouver cette symétrie perdue.
Ayant déjà étudié les relations définissant les applications ou les fonctions (relations applicationnelles ou
fonctionnelles), nous étudierons plus précisément les deux autres types importants de relations à bien
connaître : les relations d’équivalence, et les relations d’ordre.
I Définitions générales
I.1 Relations
Définition 6.1.1 (relation n-aire) n

Y
Soit n ∈ N∗ . Une relation n-aire entre n ensembles E1 , E2 , . . . , En est un sous-ensemble G de Ei .
i=1
L’entier n est appelé arité de la relation.
Le cas le plus important, et le seul que nous considérerons, est le cas des relations binaires, d’arité 2.
Notation 6.1.2
Étant donné une relation binaire entre E et F , c’est-à-dire un sous-ensemble G de E × F , on note
souvent xRy pour dire que (x, y) ∈ G, et on dit que x est en relation avec y. On parle alors de la
relation R.
Certains types de relation sont aussi notés x ≡ y, ou x ∼ y, ou x 6 y...
Exemples 6.1.3
1. appartenance à une droite
2. L’inclusion entre ensemble. L’appartenance entre ensembles.
3. Les congruences d’entiers.
84 CHAPITRE 6. RELATIONS
Comme pour les fonctions, on peut représenter une relation par un diagramme sagittal. Par exemple,
la relation représentée par la figure 6.1 est la relation entre [[1, 5]] et [[1, 4]] définie par le sous-ensemble
G = {(1, 2), (1, 3), (2, 3), (2, 4), (4, 1), (5, 1), (5, 2), (5, 4)}, donc la relation définie par 1R2, 1R3, 2R3, 2R4,
4R1, 5R1, 5R2, 5R4, les autres paires n’étant pas en relation.
R
5
4 4
3 3
2 2
1 1
Figure 6.1 – Diagramme sagittal d’une relation
On peut également représenter cette relation sous forme d’un tableau à double-entrée, en décidant de
représenter par deux signes distinctifs le fait que xRy soient en relation ou non (par exemple par une
croix ou par rien) Ainsi, la relation précédente est représentée par le tableau de la figure 6.2
F
1 2 3 4
E
1 × ×
2 × ×
4 ×
5 × × ×
Figure 6.2 – Représentation tabulaire (ou matricielle) d’une relation
Remarque 6.1.4
Les fonctions sont des cas particuliers de relation binaire. Une relation binaire définissant une fonction
est appelée relation fonctionnelle.
Plus précisément :
Définition 6.1.5 (relation fonctionnelle)

Une relation R entre E et F est fonctionnelle si pour tout x de E il existe un et un seul y de F tel
que xRy.
Lorsque R est une relation entre E et lui-même, on dit que R est une relation sur E. Dans ce cas, on
dispose d’une troisième représentation possible, correspondant à la représentation sagittale dans laquelle
on a identifié les éléments des deux ensembles de départ et d’arrivée. On obtient de la sorte un graphe
orienté dont les sommets sont les éléments de E. Par exemple, la relation définie sur [[1, 4]] par 1R1, 1R3,
2R3, 3R2, 3R4, 4R1 et 4R4 est représentée par le graphe de la figure 6.3
II Relations d’équivalence 85
1 2
4 3
Figure 6.3 – Graphe d’une relation sur E
I.2 Définition de quelques propriétés sur les relations

On définit maintenant un certain nombre de propriétés susceptibles d’être satisfaites par une relation d’un
ensemble E dans lui-même. Les 4 premières sont à bien connaître, les 2 dernières sont plus anecdotiques.
Définition 6.1.6 (reflexivité, symétrie, antisymétrie, transitivité et al.)

Soit R une relation sur E. On dit que :
• R est reflexive si pour tout x ∈ E, xRx ;
• R est symétrique si pour tout (x, y) ∈ E 2 , xRy =⇒ yRx ;
• R est antisymétrique si pour tout (x, y) ∈ E 2 , (xRy) ∧ (yRx) =⇒ (x = y) ;
• R est transitive si pour tout (x, y, z) ∈ E 3 , (xRy) ∧ (yRz) =⇒ (xRz).
• R est irréflexive (ou antireflexive) si pour tout x, on a ¬(xRx)
• R est asymétrique si xRy =⇒ ¬(yRx).
Remarque 6.1.7
Comment qualifieriez vous une relation antisymétrique et irreflexive ?
Nous allons maintenant définir deux types de relations que l’on rencontre fréquemment.
II Relations d’équivalence
II.1 Définitions et exemples
Définition 6.2.1 (relation d’équivalence)

Une relation d’équivalence sur E est une relation reflexive, symétrique et transitive. On note souvent
x ≡ y ou x ∼ y pour indiquer que x et y sont en relation.
Exemples 6.2.2
1. Égalité.
2. Congruences modulo n dans N (notation ≡[n] ou ≡ ...[n]).
3. Congruences dans R.
4. Appartenance à la même part d’une partition.

5. La relation définissant Q sur Z× N∗ : (p, q) ≡Q (p′ , q ′ ) si et seulement pq ′ = p′ q (ces deux couples
vont définir le même rationnel).
6. Conjugaison dans Sn .
7. Multiplication par un scalaire non nul dans Rn ou Cn .
Une relation d’équivalence sur un ensemble fini peut être représenté par son graphe orienté (figure 6.4).
Ce graphe possède un certain nombre de caractéristiques :
• Le graphe se décompose en un certain nombre de blocs non reliés les uns les autres, les points au
sein d’un même bloc étant reliés (on parle de composantes connexes du graphe)
• Chaque point appartient à un bloc (il y est éventuellement seul). Ainsi, les blocs forment une
partition de E.
• À l’intérieur de chaque bloc, toutes les flèches possibles sont présentes (y compris celles reliant un
point et lui-même) : il s’agit d’un sous-graphe complet.
Les différents blocs sont appelés classes d’équivalence.
x1 x3 x13 x9 = x12 = x13
x9
x1 = x2 = x3 = x5 x5 x2
x12
x8
x6
x11 x11
x10
x4 = x6 = x7 x4 x7
x8 = x10
Figure 6.4 – Graphe d’une relation d’équivalence sur E = {x1 , x2 , . . . , x13 }.
Cette situation se généralise. C’est ce que nous étuidons dans le paragraphe suivant.
II.2 Classes d’équivalence, ensembles quotients
Définition 6.2.3 (classes d’équivalence)

Soit R une relation d’équivalence sur E, et x ∈ E. La classe d’équivalence de x sous la relation R est
le sous-ensemble Cx de E constitué des éléments en relation avec x :
Cx = {y ∈ E | xRy}.
Lemme 6.2.4
Si y et z sont dans une même classe d’équivalence, alors yRz.
II Relations d’équivalence 87
C’est juste la transitivité, en passant par x, définissant la classe commune. ⊲
Théorème 6.2.5 (Partition formée par les classes d’équivalence)

Soit E un ensemble, et R une relation d’équivalence sur E. L’ensemble des classes d’équivalence sous
R forme une partition de E.
Il suffit de montrer que si Cx ∩ Cy 6= vide, alors Cx = Cy , et par symétrie, Cx ⊂ Cy suffit. Là encore,
c’est la transitivité, en passant par un point apparenant aux 2 classes. ⊲
En particulier, si y ∈ Cx , alors Cx = Cy .
Pour les propriétés « stables » par la relation d’équivalence, les points d’une même classe d’équivalence
jouent des rôles similaires, et n’ont pas lieu d’être distingués. On formalise cela en introduisant un ensemble
dont les éléments sont les classes d’équivalences (ainsi, tous les points d’une même classe représentent la
même classe, et sont considérés comme égaux dans ce nouvel ensemble) :
Définition 6.2.6 (Ensemble quotient, HP)

L’ensemble des classes sous la relation R s’appelle l’ensemble quotient de E par R, et est noté E/R.
C’est un sous-ensemble de P(E).
Ainsi, en notant x la classe d’équivalence d’un élément x de E, l’ensemble E/R est l’ensemble formé des
éléments x, où l’on impose x = y dès que xRy.
Exemples 6.2.7
1. On définit Q comme étant le quotient (Z × N∗ )/ ≡Q .
2. On définit Z/nZ = Z/ ≡[n] . C’est un ensemble à n éléments.
Définition 6.2.8 (projection canonique)

On appelle projection canonique de E sur E/R l’application πR qui à x associe sa classe x. Par
définition, πR est surjective, et vérifie :
∀(x, y) ∈ E 2 xRy =⇒ πR (x) = πR (y).
Cette projection canonique vérifie la propriété importante suivante (une telle propriété est appelée « pro-
priété universelle ») :
Théorème 6.2.9 (Factorisation d’une application constante sur les classes d’équivalence)
Soit f : E → F . Alors les deux propriétés suivantes sont équivalentes :
(i) Pour tout (x, y) ∈ E 2 , xRy =⇒ f (x) = f (y) ;
(ii) il existe g : E/R → F tel que f = g ◦ πR .
Définir g(x) comme étant la valeur commune de tous les f (y), pour y ∈ x. ⊲
On dit dans la situation ci-dessus que la fonction f « passe au quotient ».
Ce résultat se généralise sans difficulté pour des fonctions de plusieurs variables, f : E1 × · · · × En −→ F ,
les Ei étant chacun muni d’une relation d’équivalence Ri . Dès lors que f « respecte » les relations
f
E F
πR
∃? g
E/R
Figure 6.5 – Factorisation d’une application constante sur les classes d’équivalence
d’équivalences (donc la valeur de f ne dépend pas du choix des réprésentants des classes d”équivalence), on
a la possibilité de factoriser f au travers de l’espace produit des espaces quotients (E1 /R1 )×· · ·×(En /Rn ).
Cela permet notamment de définir assez facilement des lois (addition, multiplication) sur des ensembles
quotient. C’est ce que nous étudions ci-dessous.
II.3 Congruences
L’ensemble Z étant muni d’une loi d’addition et d’une loi de multiplication, on aimerait savoir si ces lois
« passent au quotient » autrement dit, si elles permettent de définir une somme et un produit sur Z/nZ.
La notion de congruence est adaptée à cette situation.
Définition 6.2.10 (Congruence)

Soit E un ensemble, muni d’un certain nombre d’opérations ×1 , ×2 , . . . , ×n . On dit qu’une relation
d’équivalence R est une congruence sur (E, ×1 , . . . , ×n ) si
∀(x, y, x′ , y ′ ) ∈ E 4 , ∀i ∈ [[1, n]], (xRx′ ) ∧ (yRy ′ ) =⇒ (x ×i y)R(x′ ×i y ′ ).
Proposition 6.2.11 (Congruence des entiers)

La relation de congruence des entiers ≡[n] est une congruence sur (Z, +, ×).
Vérifications de divisibilité immédiates. ⊲
Proposition 6.2.12 (Passage au quotient des opérations, HP)

Soit (E, ×1 , . . . , ×n ) un ensemble muni de n lois d’opérations, et R une congruence sur (E, ×1 , . . . , ×n ).
Alors on peut définir sur E/R des lois × ˙ 1, . . . , ×
˙ n telles que pour tout i ∈ [[1, n]], et tout (x, y) ∈ E 2 :
˙ i y = x ×i y.
x×
La valeur de x × y ne dépendant que de la classe de x et celle de y, on peut définir x × y comme
étant la valeur commune des x′ × y ′ , pour x′ ∈ x et y ′ ∈ y. ⊲
Corollaire 6.2.13 (Addition et multiplication de Z/nZ)

On peut munir Z/nZ d’une addition +̇ et d’une multiplication ×, ˙ notées plus simplement + et × (la
multiplication est parfois aussi simplement notée par un point ·, ou même simplement omise), telles
que :
∀(x, y) ∈ Z2 , x + y = x + y et x × y = x × y
III Relations d’ordre 89
Exemple 6.2.14
Table des lois de Z/2Z, Z/3Z, Z/4Z.
III Relations d’ordre

Une autre famille de relation est celle qui permet de définir des inégalités.
III.1 Définitions générales
Définition 6.3.1 (relation d’ordre large)

Une relation d’ordre sur E est une relation reflexive, antisymétrique et transitive. On note souvent
x 6 y pour indiquer que y est en relation avec x. Les écritures x 6 y et y > x sont équivalentes.
Exemples 6.3.2
1. L’inégalité usuelle 6 sur N, Z, Q ou R définit une relation d’ordre sur ces ensembles.
2. L’inégalité opposée > définit une autre relation d’ordre ; il s’agit de la relation réciproque de 6.
3. De façon générale, étant donné une relation d’ordre R sur un ensemble, la relation R−1 définie
par xR−1 y ssi yRx est une relation d’ordre (duale de R)
4. La relation de divisibilité a | b est une relation d’ordre sur N∗ mais pas sur Z.
5. L’inclusion dans P(E).
6. Le raffinement des partitions d’un ensemble.
7. L’ordre produit sur Nn
8. L’ordre lexicographique sur E × F , et plus généralement sur E1 × · · · × En , tous ces ensembles
étant ordonnés
La figure 6.6 donne le graphe orienté associé à une relation d’ordre sur un ensemble fini. Certaines flèches
sont nécessairement présentes (les flèches d’un élément vers lui-même, par reflexivité), ou déduites des
autres (par transitivité). On se limite alors souvent au digramme constitué par les flèches élémentaires
(engendrant les autres), c’est-à-dire les flèches entre deux éléments consécutifs. La restiction à ces flèches
définit ce qu’on appelle la relation de couverture (on dit qu’un élément x couvre y si x > y, x 6= y, et s’il
n’existe pas z tel que x > z > y). Le graphe associé à cette relation de couverture est appelé diagramme
de couverture de la relation 6.
Pour l’exemple donné dans la figure 6.6, on obtient alors le diagramme de la question 6.7. Par convention,
dans ce diagramme, les flèches vont en montant : plus un élément est placé haut, plus il est « grand »
pour le relation d’ordre (à condition de pouvoir être comparé).
Dans R, vous avez l’habitude d’utiliser la relation d’ordre stricte. Elle peut se définir de façon générale :
Définition 6.3.3 (Relation d’ordre stricte)

Une relation d’ordre stricte est une relation antiréflexive et transitive.
Proposition 6.3.4 (Antisymétrie d’une relation d’ordre stricte)

Une relation d’ordre stricte est antisymétrique.
x7 x6
x4 x5
x8
x3
x2
x1
Figure 6.6 – Graphe d’une relation d’ordre sur E = {x1 , x2 , . . . , x8 }.
x7 x6
x4 x5
x8
x2 x3
x1
Figure 6.7 – Diagramme de couverture de la relation de la figure 6.6
Montrer qu’on ne peut pas avoir xRy et yRx. En quoi cela entraîne-t-il l’antisymétrie ? ⊲
Proposition 6.3.5 (D’une relation d’ordre large à une relation d’ordre stricte)
• Toute relation d’ordre large 6 définit une relation d’ordre stricte par x < y si et seulement si
x 6 y et x 6= y.
• Réciproquement, toute relation d’ordre strict < définit une relation d’ordre large 6 par x 6 y si
et seulement si x < y ou x = y.
Remarque 6.3.6
Lorsqu’on parle de relation d’ordre, sans autre précision, il est en général sous-entendu qu’il s’agit d’une
relation d’ordre large.
Dans R muni de l’ordre usuel, on peut comparer deux à deux tous les éléments, mais ce n’est pas toujours
le cas (cas de la divisibilité par exemple). Cette remarque motive la définition suivante :
Définition 6.3.7 (ordre total, ordre partiel)

• Soit R une relation d’ordre sur un ensemble E. On dit que R est une relation d’ordre total si
pour tout (x, y) ∈ E, soit x 6 y soit y 6 x.
• Dans le cas contraire, on dit que R est une relation d’ordre partiel.
Exemples 6.3.8
1. L’ordre défini par le diagramme de la figure 6.7 n’est pas total : par exemple x8 et x7 ne sont
pas comparables. En fait, le diagramme associé à une relation d’ordre total est linéaire.
2. L’ordre usuel sur N, Z, Q ou R, ainsi que l’ordre lexicographique sur Nn , ou sur l’ensemble des
mots définis à partir d’un alphabet sont des ordres totaux.
3. L’ordre produit sur Nn (pour n > 2), la relation de divisibilité dans N∗ , la relation d’inclusion
dans P(E) (lorsque E possède au moins 2 éléments), le raffinement des partitions de E (lorsque
E possède au moins 3 éléments) sont des ordres partiels.
4. Si 6 est un ordre total, alors > est un ordre total.
5. Si E et F sont munis d’ordres totaux, l’ordre lexicographique sur E × F est total.
Proposition/Définition 6.3.9 (restriction d’une relation d’ordre)

Soit E un ensemble muni d’une relation d’ordre R, et A un sous-ensemble de E. Alors R définit sur A
une relation d’ordre R′ par :
∀(x, y) ∈ A2 , xR′ y ⇐⇒ xRy.
Il s’agit de la restriction à A de la relation R, ou de la relation induite par R sur A. Elle est généralement
notée R également.
III.2 Minimalité, maximalité
Définition 6.3.10 (minimum, maximum)

Soit (E, 6) un ensemble muni d’une relation d’ordre.
1. Un élément m de E est appelé plus petit élément de E (ou élément minimum) si : ∀m′ ∈ E, m 6
m′ .
2. Un élément M de E est appelé plus grand élément de E (ou élément maximum) si : ∀m′ ∈
E, M > m′ .
3. Étant donné un sous-ensemble A de E, un élément minimum (resp. maximum) de A est un
élément minimum (resp. maximum) pour la relation d’ordre R′ induite par R sur A.
Proposition 6.3.11 (unicité du minimum)

S’il existe, le plus petit élément de E ( resp. de A ⊂ E) est unique. De même pour le plus grand élément.
S’il en existe 2, x et y, alors x 6 y et y 6 x. ⊲
Un ensemble n’a pas nécessairement de minimum ou de maximum (Z par exemple, ou P(E) \ {E, ∅},
pour la relation d’inclusion).
Exemple 6.3.12
Dans l’exemple de la figure 6.7, E admet-il un minimum ? un maximum ?
Définition 6.3.13 (élément minimal, maximal ; HP)

Soit (E, 6) un ensemble muni d’une relation d’ordre.
1. Un élément m de E est appelé élément minimal de E s’il n’existe pas d’élément x de E tel que
x < m.
2. Un élément M de E est appelé élément maximal s’il n’existe pas d’élément x de E tel que
x > M.
Remarque 6.3.14 (distinction élément minimum/élément minimal)

Si l’ordre défini sur E est total, la notion d’élément minimal coïncide avec la notion d’élément minimum.
Mais ce n’est plus vrai si la relation n’est que partielle, car x < m n’est dans ce cas pas la négation de
x > m.
Exemples 6.3.15
1. Dans l’exemple de la figure 6.7, quels sont les éléments maximaux ? Sont-ils maximum ? Quels
sont les éléments minimaux ?
Dans un diagramme de ce type, comment décririez-vous un élément maximal ?
2. Soit E ayant au moins deux éléments. Dans P(E) \ {E, ∅}, décrire les éléments minimaux et
maximaux.
A-t-on unicité de l’élément minimal, maximal ?
3. Décrire les éléments minimaux et maximaux dans N\{0, 1}. Y a-t-il un minimum ? un maximum ?
Définition 6.3.16 (minorant, majorant)

Soit (E, 6) un ensemble muni d’une relation d’ordre. Soit A ⊂ E.
1. Un minorant m de A est un élément m ∈ E tel que : ∀a ∈ A, a > m
2. Un majorant M de A est un élément M ∈ E tel que : ∀a ∈ A, a 6 M
Définition 6.3.17 (borne supérieure, borne inférieure)

Soit (E, 6), et soit A ⊂ E.
1. La borne inférieure de A dans E, notée inf E x ou inf x ou inf A est le plus grand des minorants
x∈A x∈A
de A, s’il existe.
2. La borne supérieure de A dans E, notée sup E x ou sup x ou sup A est le plus petit des majorants
x∈A x∈A
de A, s’il existe.
3. Étant donnés x1 , . . . , xn dans E, la borne inférieure (resp. la borne supérieure) des éléments
x1 , . . . , xn , notée inf(x1 , . . . , xn ) (resp. sup(x1 , . . . , xn )) est la borne inférieure (resp. supérieure)
de l’ensemble {x1 , . . . , xn }.
Exemple 6.3.18 (Propriété fondamentale de R)

Tout sous-ensemble non vide majoré de R admet une borne supérieure. Cette propriété soit doit être
prise comme axiome pour la construction de R, soit découle immédiatement d’axiomes équivalents (il
y a plusieurs façons équivalentes de construire R, en imposant dans le cahier des charges des propriétés
différentes).
Attention à l’ensemble dans lequel on considère la borne supérieure. Tout sous-ensemble borné de Q
admet une borne supérieure dans R, mais pas nécessairement dans Q.
Théorème 6.3.20 (Caractérisation de la borne supérieure)

Soit E un ensemble et A un sous-ensemble de E. Pour que b ∈ E soit la borne supérieure de A dans
E, il faut et il suffit que :
1. ∀a ∈ A, a 6 b ( i.e. b est un majorant de A) ;
2. ∀c ∈ E, ¬(c > b) =⇒ (∃a ∈ A, ¬(a 6 c)) ( i.e. b est le plus petit des majorants), ou, de façon
équivalente : ∀c ∈ E, (∀a ∈ A, a 6 c) =⇒ c > b.
Énoncé similaire pour la borne inférieure.
C’est juste une traduction formelle de la définition. ⊲
Remarquez que la seconde condition n’est pas équivalente à dire que c < b =⇒ ∃a ∈ A, a > c. Ceci
n’est vrai que lorsqu’on dispose d’un ordre total. En effet, si ce n’est pas le cas, ¬(c > b) se traduit par
c < b ou bien c et b non comparables (et de même pour le second terme)
Dans R, dont l’ordre est total, en posant c = b − ε, on exprime souvent la deuxième condition sous la
forme suivante :
∀ε > 0, ∃x ∈ A, b − ε < x 6 b.
Exemples 6.3.22 (bornes inférieures, supérieures)

1. Dans N∗ muni de la divisibilité, inf(a, b) = pgcd(a, b), et sup(a, b) = ppcm(a, b).
2. Dans P(E), muni de l’inclusion, inf(A, B) = A ∩ B, sup(A, B) = A ∪ B
3. Dans N2 muni de l’ordre produit, inf((x1 , y1 ), (x2 , y2 )) = (min(x1 , x2 ), min(y1 , y2 ))
Proposition 6.3.23
Soit (E, 6), et A ⊂ E. A admet un maximum M (plus grand élément) si et seulement si A admet une
borne supérieure b et si b ∈ A. Dans ce cas M = b. Énoncé similaire pour le minimum.
Le maximum M , s’il existe, est nécessairement le plus petit des majorants de A, puisqu’il majore A,
et que tout majorant de A majore en particulier M . Réciproque évidente, la borne supérieure étant
un majorant. ⊲
Définition 6.3.24 (Fonction croissante)

Soit E et F deux ensembles, munis chacun d’une relation d’ordre 6E et 6F respectivement. Une
fonction f : E → F est dite croissante si
∀(x, y) ∈ E 2 , x 6E y =⇒ f (x) 6F f (y).
Prenez garde au fait que les propriétés usuelles des fonctions réelles croissantes ne sont pas toutes vraies
dans une situation plus générale. Par exemple, étant donné E un ensemble fini, l’application de P(E)
dans N définie par X 7→ Card(X) est strictement croissante mais non injective !
III.3 Le lemme de Zorn (HP)

Pour terminer ce chapitre, nous donnons un résultat équivalent à l’axiome du choix (donc tout aussi
indécidable), qui est la version sous laquelle l’axiome du choix est le plus fréquemment utilisé. Pour cela,
nous commençons par donner une définition :
Définition 6.3.26 (ensemble inductif, HP)

Soit (E, 6) un ensemble ordonné. On dit que E est un ensemble inductif si pour tout sous-ensemble
F ⊂ E totalement ordonné, F admet un majorant.
Exemples 6.3.27
• Tout ensemble ordonné fini est inductif.
• L’ensemble (Z, 6) est-il inductif ?
• (P(E), ⊂) est-il inductif ?
Théorème 6.3.28 (lemme de Zorn, ou de Kuratowski-Zorn, HP, admis)

(Avec AC) Tout ensemble inductif admet un élément maximal.
Le lemme de Zorn est en fait équivalent à l’axiome du choix.

7
Les corps Q et R
Pour moi, les mathématiques, c’est la conquête du continu par le discret.
(René Thom)
Introduction
Nous étudions dans ce chapitre les ensembles de nombres que nous utilisons usuellement : l’ensemble des
nombres rationnels, puis l’ensemble des nombres réels. Nous étudierons dans le chapitre suivant l’ensemble
des nombres complexes.
Ces ensembles possèdent une structure particulière, que nous appelons structure de corps, et que nous
aurons l’occasion d’étudier plus généralement dans un chapitre ultérieur. Nous nous contentons pour
l’instant d’en donner une définition approximative :
Définition 7.0.1 (corps, version approximative)

Un corps est un ensemble muni de deux types d’opérations (appelées lois), généralement notées + et
×, tel que :
• + et × vérifient un certain nombre de propriétés d’associativité, de commutativité et de distri-
butivité,
• il existe un élément 0, neutre pour + (i.e. 0 + x = x pour tout x),
• il existe un élément 1, neutre pour × (i.e. 1 × x = x pour tout x),
• tout élément x admet un opposé y pour +, tel que x + y = 0,
• tout élément x 6= 0 admet un inverse pour ×.
Ce dernier point a pour conséquence que Z (par exemple) n’est pas un corps (on parle dans ce cas
d’anneau)
I De Q à R
I.1 Construction de Q
Nous avons déjà vu dans un chapitre antérieur une façon de construire Q comme ensemble des quotients
a
b de deux entiers relatifs. Plus précisément, pour définir correctement les cas d’égalités entre fraction,
il convient de définir Q comme l’ensemble des classes d’équivalence de Z × Z∗ muni de la relation ≡Q
définie par :
(a, b) ≡ (c, d) ⇐⇒ ad − bc = 0.
En d’autres termes, Q est l’espace quotient de Z × Z∗ par la relation ≡Q .
96 CHAPITRE 7. LES CORPS Q ET R
Quotienter par cette relation d’équivalence donne les conditions d’égalités de deux fractions ab et dc . C’est
ce quotient qui permet de gérer de façon rigoureuse la non unicité de l’écriture d’un rationnel sous forme
d’un couple (numérateur, dénominateur).
Théorème 7.1.1 (Définition de l’addition et du produit de rationnels)

Les lois définies sur Z × Z∗ par (a, b) + (c, d) = (ad + bc, bd) et (a, b) × (c, d) = (ac, bd) passent au
quotient, définissant sur Q les lois pouvant être décrites avec les notations usuelles par :
a c ad + bc a c ac
+ = et × = .
b d bd b d bd
En vertu des résultats du chapitre précédent, il suffit de vérifier que les lois définies sur Z × Z∗ sont
des congruences, ce qui ne pose pas de problème majeur. ⊲
Théorème 7.1.2 (Propriété des lois de Q)

• Les lois + et × sont associatives (i.e. (x + y) + z = x + (x + z) et de même pour ×)
• Les lois + et × sont commutatives (i.e. x + y = y + x et de même pour ×)
• La loi × est distributive sur + (i.e. x × (y + z) = x × y + x × z)
• L’élément 0 = 10 est neutre pour +, et tout élément ab admet un opposé −a b
• Le rationnel ab est égal à 0 si et seulement si a = 0.
• L’élément 1 = 11 est neutre pour ×, et tout élément ab non nul est inversible, d’inverse b
a.
Ainsi, Q est un corps.
Remarque 7.1.3 (Inclusion de Z dans Q)

Les entiers a ∈ Z peuvent être identifiés aux rationnels a1 (dans le sens où a 7→ a
1 définit une injection
de Z dans Q). Via cette identification, on peut considérer que Z ⊂ Q.
On dit que Q est le corps des fractions de l’anneau (intègre) Z. L’intégrité de Z est une propriété stipulant
que pour tout (a, b) ∈ (Z∗ )2 , ab 6= 0. Cette propriété a été utilisée pour justifier l’inversibilité des rationnels
non nuls.
La construction que nous venons de faire peut être faite à partir de n’importe quel anneau intègre, et
permet de définir le corps des fractions de cet anneau. Nous retrouverons cette construction lorsque nous
construirons les fractions rationnelles formelles à partir des polynômes formels. Nous n’expliciterons plus
à ce moment les détails de la construction, du fait que tout se passe très précisément comme dans la
situation ci-dessus.
I.2 Relation d’ordre dans Q
Lemme 7.1.4
Soit q un rationnel. Alors le signe de l’entier naturel ab ne dépend pas de la représentation de q sous
a
la forme q = .
b
a c
Considérer q = = , et multiplier la relation définissant l’égalité de ces fractions par bd. ⊲
b d
Ce lemme nous assure que la définition suivante ne dépend pas de la représentation choisie pour q :
I De Q à R 97
Définition 7.1.5 (Signe d’un rationnel)

Un rationnel q = ab est dit positif ou nul si ab > 0, et négatif ou nul si ab 6 0. Le cas d’égalité n’est
obtenu dans les deux cas que pour q = 0.
Définition 7.1.6 (Inégalité dans Q)

Soit q, q ′ ∈ Q, on dit que q est inférieur ou égal à q ′ et on note q 6 q ′ , si q − q ′ est négatif ou nul.
De façon fort heureuse et assez immédiate, nous obtenons :
Proposition 7.1.7 (Cohérence de la notion de négativité)

Soit q ∈ Q. Alors q est négatif ou nul si et seulement si qle0, et q est positif ou nul si et seulement si
q > 0.
Des vérifications élémentaires montrent que :
Théorème 7.1.8
La relation 6 ainsi définie sur Q est une relation d’ordre total.
I.3 De l’existence de nombres non rationnels

On connaît l’existence des nombres irrationnels depuis l’antiquité. Ce sont les mathématiciens grecs qui, en
premier, en ont été conscients, via l’étude de la diagonale du carré, et peut-être même avant cela, de la diagonale
du pentagone.
Les nombres étant défini comme des longueurs, ils parlent de longueurs incommensurables (elles ne peuvent pas
se mesurer à l’aide d’une unité commune).
Dans ce qui suit, on adopte la compréhension intuitive de R∗ comme mesure de longueurs.
Définition 7.1.10 (Nombres incommensurables)

x
Soit (x, y) ∈ (R∗ )2 . On dit que x et y sont incommensurables si y est irrationnel.
Exemple 7.1.11 (Existence de nombres irrationnels)

√
Le réel 2 est irrationnel. En d’autres termes, le côté et la diagonale d’un carré sont incommensurables.
√
On pourrait montrer plus généralement que n est irrationnel dès que l’entier n n’est pas un carré parfait.
I.4 L’ensemble R
L’ensemble R est alors obtenu en « bouchant les trous » laissés par les éléments de Q, un peu comme on
coulerait du mortier pour celler un ensemble de petites pierres, ou comme le bitume autour des gravillons.
La façon de percevoir les trous de Q est d’étudier l’exemple suivant :
Exemple 7.1.12 (un sous-ensemble borné de Q n’admettant pas de borne supérieure)

Soit E = {x ∈ Q+ | x2 6 2.}. Alors E est borné, et n’admet pas dans Q de borne supérieure.
Si on se rapproche de plus en plus du bord de cet intervalle, on tombe dans un trou... il n’y a rien au
bord !
C’est ce vide que l’on comble en construisant R comme l’ensemble Q, complété des bornes supérieures
de tous les sous-ensembles non vides bornés. Là encore, on a besoin de le faire sous forme d’un quotient
pour une certaine relation d’équivalence, donnant une condition pour que deux bornes supérieures soit
égales. Cette construction, qui n’est pas au programme, se résume par la propriété fondamentale de R,
fondamentale dans le sens où elle est intrinsèque à la définition de R. Cette propriété ne pouvant être
justifiée que par la manière rigoureuse de construire R, nous l’admettrons.
Ainsi, on prolonge l’ensemble ordonné (Q, +) en un ensemble ordonné (R, +) le plus petit possible,
assurant l’existence des bornes supérieures. Remarquez que cette « définition » très vague englobe aussi
la définition de la relation d’ordre sur R, prolongeant celle de Q. Cette relation est totale. On admet
également la possibilité de prolonger l’addition et le produit à R, ainsi que la différence.
Ainsi, par construction même (c’est notre cahier des charges) :
Axiome 7.1.13 (Propriété fondamentale de R)

Soit E un sous-ensemble non vide et majoré de R. Alors E admet une borne supérieure dans R.
Évidemment, on en a une version équivalente pour la borne inférieure :
Théorème 7.1.14 (Propriété fondamentale de R, exprimée avec la borne inférieure)

Soit E un sous-ensemble non vide et minorée de R. Alors E admet une borne inférieure dans R.
Appliquer la propriété fondamentale à l’ensemble des minorants, puis montrer (par exemple par
l’absurde) que la borne supérieure de cet ensemble est encore un minorant. ⊲
Une variante consiste à appliquer la propriété fondamentale à −E.

La propriété de la borne supérieure a été énoncée (et démontrée, mais avec une erreur due à une absence de
définition correcte de R) en 1817 par le mathématicien tchèque d’origine italienne Bernhard Bolzano, en vue
de donner une démonstration rigoureuse du théorème des valeurs intermédiaires (aussi appelé théorème de
Bolzano), jusque-là démontré par un dessin (Cauchy, auteur de ce théorème se contente d’un dessin comme
preuve)
II Nombres réels
Notre axiome de la construction de R est la propriété fondamentale. Nous admettons l’existence de la
relation d’ordre usuelle prolongeant la relation d’ordre sur Q, ainsi que des opérations usuelles d’addition,
multiplication et soustraction.
II.1 Rappels sur les inégalités

Il est indispensable de bien savoir manipuler les inégalités. En effet, l’analyse peut se définir comme l’étude
d’approximations infinitésimales, ces approximations s’obtenant souvent par majorations et minorations.
Le caractère infinitésimal se traduit par le fait qu’on s’autorise une marge d’erreur ε, mais que ε peut
devenir aussi petit qu’on veut.
Nous rappelons sans preuve les règles usuelles suivantes :
II Nombres réels 99
Proposition 7.2.1 (Manipulations élémentaires d’inégalités)

Soit a, b, c et b des réels.
• Si a 6 b et c 6 d, alors a + c 6 b + d.
• Si 0 < a 6 b et 0 < c 6 d, alors 0 < ac 6 bd, avec égalité si et seulement si a = b et c = d.
L’inégalité reste vraie pour des valeurs positives ou nulles, mais on perd alors le cas d’égalité.
• Si a 6 b alors −b 6 −a.
• Si a > 0 et b 6 c, alors ab 6 ac.
• Si a < 0 et b 6 c, alors ab > ac.
• Pour toutes les autres situations de produit d’inégalité, raisonner d’abord sur la valeur absolue,
puis ajouter le signe.
• Si a 6 b et c 6 d, alors a − d 6 b − c
Évidemment, certaines de ces propriétés se généralisent de façon immédiate à un plus grand nombre de
n
X n
X
termes. Par exemple, si (ai )i∈[[1,n]] et (bi )i∈[[1,n]] vérifie ai 6 bi pour tout i ∈ [[1, n]], on a alors ai 6 bi ,
i=1 i=1
avec égalité si et seulement si ai = bi pour tout i ∈ [[1, n]].
L’obtention d’inégalités (par exemple la majoration d’une quantité pour contrôler son ordre de grandeur,
souvent dans des études de convergence) est essentiel en analyse. Nous indiquons quelques démarches
possibles pour obtenir de telles inégalités. Ces méthodes seront largement développées ultérieurement.
Terminologie 7.2.2
On rappelle que « majorer » une quantité A, c’est trouver B tel que A 6 B, « minorer » une quantité
A, c’est trouver B tel que A > B. Souvent, A dépend d’un certain nombre de paramètres ou variables,
et on cherche un majorant B ne dépendant plus de certains de ces paramètres (il arrivera fréquemment
que B continue de dépendre de certains paramètres, mais pas de tous).
Méthode 7.2.3 (Majorer, minorer)

Pour obtenir des inégalités, on peut :
• tout passer du même côté (si l’inégalité est donnée) et essayer de factoriser pour déterminer le
signe.
Exemple : xy 6 12 (x2 + y 2 ) ;
• procéder par étude de fonction, si l’inégalité est donnée : on passe tout du même côté, et on
étudie le signe de la fonction obtenue, grâce à une étude de variations.
2
Exemple : pour tout x > 0, ln(1 + x) > x − x2 ;
• utiliser une propriété de convexité ou de concavité : une fonction dérivable f est convexe si f ′
est croissante (donc la pente est de plus en plus forte). Intuitivement, la convexité se traduit par
le fait que les tangentes sont sous la courbe, et les cordes sont au-dessus de la courbe.
Exemples : ex > 1 + x, ln(1 + x) 6 x, sin(x) 6 x pour x > 0, sin(x) > π2 x pour x ∈ [0, π2 ] ;
• Utiliser des inégalités classiques (en premier lieu l’inégalité triangulaire, l’inégalité de Cauchy-
Schwarz, l’inégalité arithmético-géométrique...). L’inégalité triangulaire est à utiliser dès lors
qu’on cherche à majorer la valeur absolue (ou le module) d’une somme dont on sait majorer la
valeur absolue de chaque terme : il faut d’abord sortir ces termes de la valeur absolue globale,
et ce grâce à l’inégalité triangulaire.
Le but de la fin de ce paragraphe est justement l’étude des plus importantes de ces inégalités classiques.
Définition 7.2.4 (Valeur absolue)

Soit x ∈ R La valeur absolue de x, notée |x|, est le réel obtenu de x en changeant si besoin son signe
de sorte à obtenir une quantité positive :

(
x si x > 0
|x| =
−x si x < 0.
Remarque 7.2.5
La valeur absolue est souvent utilisée lorsqu’on veut montrer qu’une quantité reste bornée, c’est-à-dire
peut être à la fois majorée et minorée. En effet, majorer |A| revient à majorer et minorer A, puisque
|A| 6 B équivaut à −B 6 A 6 B.
Pour montrer l’inégalité triangulaire, nous décomposons un réel en sa partie positive et sa partie négative
(pour tout réel, l’une de ces deux parties sera nulle, assez logiquement).
Définition 7.2.6 (Partie positive, partie négative d’un réel)

Soit x ∈ R.
• On appelle partie positive de x, et on note x+ , le réel défini par :
(
+ x si x > 0
x = max(0, x) =
0 si x < 0
• On appelle partie négative de x, et on note x− , le réel défini par :

(
− −x si x < 0
x = − min(0, x) = max(0, −x) =
0 si x > 0
Propriétés 7.2.7 (Propriétés des parties positives et négatives)

Soit x un réel. Alors :
(i) x+ > 0 et x− > 0 ;
(ii) x+ = 0 ou x− = 0 ;
(iii) x = x+ − x− ;
(iv) l’égalité précédente est minimale dans le sens suivant : pour tout (y, z) ∈ R+ , si x = y − z alors
y > x+ et z > x− ;
(v) |x| = x+ + x− = max(0, x) − min(0, −x).
(vi) (−x)+ = x− et (−x)− = x+ .
Les points (i), (ii) découlent de la définition, les autres s’obtiennent par discussion sur le signe de x.
⊲
Corollaire 7.2.8 (Inégalités triangulaires)

Soit x et y deux réels. Alors :
(i) (x + y)+ 6 x+ + y +
(ii) (x + y)− 6 x− + y −
(iii) |x + y| 6 |x| + |y|
Chacune de ces inégalités est une égalité si et seulement si x et y sont de même signe.
Les points (i) et (ii) s’obtiennent ensemble en utilisant la propriété de minimalité (iv) de la proposition
précédente, appliquée à x + y exprimé avec x+ , x− , y + et y − .
Le point (iii) en découle par somme. ⊲
On obtient alors, par une récurrence immédiate sur le cardinal de I :
Corollaire 7.2.9 (Inégalité triangulaire pour les sommes)

Soit (ai )i∈I une famille finie de réels. Alors

X X

ai 6 |ai |.

i∈I i∈I
On peut maintenant établir la preuve d’un résultat qu’on avait admis dans le chapitre précédente. Ce
résultat est complété par une généralisation de l’inégalité triangulaire aux sommes infinies.
Théorème 7.2.10 (CVA entraîne CV, et inégalité triangulaire)

P P
Si an converge absolument, alors an converge, et on a :

X+∞ X +∞

an 6 |an |.

n=0 n=0
P + P −
• Convergence : utiliser le TCSTP pour obtenir la convergence de an et an , puis faire la
différence.
• Inégalité : passer à la limite sur les sommes partielles, en admettant pour le moment le théorème
de conservatin des inégalités par passage à la limite.
⊲
On donne ci-dessous deux inégalités classiques, utiles dans de nombreuses situations.
Théorème 7.2.11 (Inégalité de Cauchy-Schwarz numérique)

Soient x1 , . . . , xn , y1 , . . . , yn des réels. On a alors :
2 ! !
Xn n
X n
X

xi yi 6 x2i yi2 ,

i=1 i=1 i=1
avec égalité si et seulement si les vecteurs (x1 , . . . , xn ) et (y1 , . . . , yn ) sont colinéaires.
En notant, pour X = (x1 , . . . , xn ) et Y = (y1 , . . . , yn )

n
X
hX, Y i = xi yi
i=1
le produit scalaire canonique de Rn , et

v
u n
uX p
kXk = t x2i = hX, Xi
i=1
la norme euclidienne canonique, l’inégalité de Cauchy-Schwarz se réexprime de la sorte :
| hX, Y i | 6 kXk · kY k.
Utiliser le fait que le polynôme kλX + Y k2 en la variable λ est de signe constant : que peut-on en
déduire sur son discriminant ? (Attention, ne pas oublier de traiter le cas où le polynôme n’est pas
de degré 2)
Pour le cas d’égalité, cela correspond à ∆ = 0 : qu’est-ce que ça signifie pour le polynôme ci-dessus ?
⊲
Remarque 7.2.12
La démonstration n’utilise que le fait que pour tout X, hX, Xi > 0, avec égalité ssi X = 0, et la symétrie
du produit scalaire. On définira plus tard dans l’année une notion générale de produit scalaire, vérifiant
ces propriétés. Ainsi, la formule de Cauchy-Schwarz restera valable pour tout produit scalaire, la norme
associée à ce produit scalaire se définissant comme on l’a fait pour la norme euclidienne à partir du
produit scalaire canonique.
Théorème 7.2.13 (Inégalité arithmético-géométrique, HP)

Pour tout X = (x1 , . . . , xn ) ∈ (R∗+ )n ,
1 √
(x1 + · · · + xn ) > n x1 . . . xn .
n
Cette inégalité dit qu’on est gentil avec vous en calculant votre moyenne scolaire avec la moyenne arith-
métique plutôt que la moyenne géométrique.
Récurrence un peu atypique avec des retours en arrière : on montre d’abord par récurrence le cas où n
est une puissance de 2, puis en regroupant judicieusement des termes, on montre la propriété pour n
quelconque en redescendant à partir des puissances de 2. C’est la démonstration de Cauchy. Il existe
beaucoup d’autres démonstrations, notamment une démonstration très rapide par un argument de
convexité, mais cela nécessite quelques connaissances supplémentaires que vous verrez plus tard. ⊲
II.2 Division euclidienne dans R

Le principe de la division euclidienne dans R repose sur le résultat suivant, bien utile par ailleurs, no-
tamment pour prouver des propriétés de densité :
Proposition 7.2.14 (Propriété d’Archimède)

Soit x et y deux réels strictement positifs. Il existe un entier n ∈ N tel que x < ny.
Par l’absurde, appliquer la propriété fondamentale de R à {ny, n ∈ N}, et considérer n0 tel que n0 y
soit proche de la borne supérieure. Trouver une contradiction en considérant (n0 + 1)y. ⊲
Corollaire 7.2.15
Pour tout x > 0 et tout y > 0, il existe un rationnel r tel que 0 < rx < y.
1
Appliquer la propriété d’Archimède, puis multiplier par n. ⊲
En particulier, en prenant x = 1, on peut toujours trouver un rationnel strictement positif inférieur à un
réel strictement positif y arbitraire.
Une conséquence importante de ce résultat est l’inversibilité de tout réel non nul :
Théorème 7.2.16 (Le corps R)

Tout réel non nul est inversible. Combiné aux propriétés usuelles admises des opérations de R, ce
résultat affirme que R est un corps.
Se ramener au cas x > 0. Considérer y0 = sup{y | yx 6 1}. Si y0 x < 1, considérer r tel que
0 < rx < 1 − y0 x, et contredire la définition de y0 . Même type d’argument si y0 x > 1. ⊲
Une variante de la propriété d’Archimède est :
Corollaire 7.2.17
Soit x et y strictement positifs. Il existe un unique entier n ∈ N tel que ny 6 x < (n + 1)y. Il existe
également un unique entier n′ tel que n′ y < x 6 (n′ + 1)y. Sauf lorsque xy est entier, on a n = n′ . Le
résultat se généralise à x négatif.
Considérer n minimal tel que x < (n + 1)y. Pour le deuxième point, discuter suivant que x est un
multiple de y ou non. Pour x négatif, appliquer ce qui précède à −x. L’unicité provient du fait que
les intervalles définis par les ny sont disjoints. ⊲
Ce résultat se réexprime sous la forme familière suivante :
Théorème 7.2.18 (Division euclidienne, Euclide)

Soit x ∈ R et y ∈ R∗+ . Il existe un unique entier n et un unique réel r ∈ [0, y[ tels que x = ny + r.
C’est un résultat très concret : si un menuisier doit couper des planches de longueur donnée y dans une
grande planche de longueur x, n est le nombre de planches de la bonne longueur qu’il peut obtenir, et r
est la longueur du bout inutile qu’il lui reste à la fin, donc la chute.

Archimède est légèrement postérieur à Euclide (3e siècle avant J.-C.). La propriété d’Archimède figure en fait
déjà dans les Éléments d’Euclide. Archimède utilise largement cette propriété, sans pour autant prétendre à sa
paternité.
II.3 Densité de Q et R \ Q dans R

On peut alors se demander s’il y a beaucoup de nombres irrationnels, et comment ils se répartissent
entre les nombres rationnels pour former R. Un élément de réponse est apporté par la propriété de
densité, affirmant qu’il y a des rationnels et des irrationnels un peu partout dans R : il n’existe pas
dans R d’intervalle non vide ou non réduit à un singleton, aussi petit soit-il, ne possédant ni rationnel ni
irrationnel. Intuitivement, si ce n’était pas le cas, tous les réels à l’intérieur d’un intervalle ne contenant pas
de rationnels ne seraient d’aucune utilité pour exprimer des bornes supérieures d’ensembles de rationnels,
car trop éloignés des rationnels les plus proches. Notre construction de R ne serait alors pas minimale.
Commençons par définir rigoureusement la propriété de densité dans R.
Définition 7.2.20 (Densité dans R)

Un sous-ensemble E de R est dense dans R si pour tout (x, y) ∈ R2 tel que x < y, il existe z ∈ E tel
que x < z < y.
Autrement dit, entre deux éléments quelconques de R (aussi proches soient-ils), il existe toujours un
élément de E : les éléments de E vont s’infiltrer un peu partout.
Cette notion de densité se généralise à d’autres ensembles que R, mais d’un point de vue topologique.
Théorème 7.2.21 (Densité des rationnels et des irrationnels dans R)

Les ensembles Q et R \ Q sont denses dans R.
Appliquer la propriété d’Archimède avec un rationnel r inférieur à y − x. ⊲
Bref, il existe beaucoup de nombres irrationnels. Et en fait beaucoup plus que des rationnels. En effet Q
est dénombrable, et comme R ne l’est pas, R \ Q non plus, et, en admettant l’hypothèse du continu, il a
donc la puissance du continu (i.e. le même cardinal que R).
II.4 Nombres transcendants

Les nombres irrationnels peuvent eux-même être classés en nombres « peu irrationnels » et nombres « très
irrationnels », ou plutôt, en adoptant une terminologie plus correcte, en nombres algébriques (solutions
d’une équation polynomiale en Q) et en nombres transcendants (les autres).
Définition 7.2.22 (Nombres algébriques, transcendants sur Q, HP)

Soit x ∈ R.
• On dit que x est algébrique sur Q s’il existe un polynôme P à coefficients dans Q tel que
P (x) = 0.
• On dit que x est transcendant sur Q s’il n’est pas algébrique.
En admettant provisoirement que tout polynôme a un nombre fini de racines, on obtient le joli résultat
suivant :
Proposition 7.2.23 (cardinal de l’ensemble des nombres algébriques, HP)

L’ensemble des nombres algébriques est dénombrable.
L’ensemble des polynômes à coefficients rationnels est dénombrable, car peut s’écrire comme union
dénombrable d’ensembles dénomobrables. L’union sur ces polynômes des racines de chaque polynôme
est donc aussi dénombrable. ⊲
Corollaire 7.2.24 (existence de nombres transcendants, HP)

Il existe des nombres transcendants.

On connaît l’existence de nombres irrationnels depuis la Grèce classique. En revanche, la notion de nombres
transcendants est beaucoup plus récente :
• Leibniz est le premier, en 1682, à envisager la possibilité de l’existence de nombres transcendants.

• Ce n’est qu’en 1844 que Liouville justifie l’existence de nombres transcendants, en construisant pour
X
+∞
l’occasion et en montrant la transcendance du réel c = 10−j! , appelé depuis « constante de Liouville ».
j=1
• Hermite prouve en 1873 la transcendance de e. C’est la première fois qu’on montre la transcendance
d’un réel qui avait une existence antérieure.
• Lindemann montre en 1882 la transcendance de π, mettant ainsi fin à 3 millénaires de recherches
infructueuses pour réaliser la quadrature du cercle.
• Les travaux de Cantor permettent de justifier l’existence de nombres transcendants sans avoir à en
contruire, par simple considération des cardinaux.
II.5 Partie entière, partie décimale

Nous étudions maintenant les représentations des réels dans la vie pratique. Pour cela, nous commençons
par séparer la partie entière et la partie décimale, en définissant rigoureusement ces notions.
Proposition/Définition 7.2.26 (Partie entière)

Soit x ∈ R. Les cinq définitions suivantes sont équivalentes :
(i) ⌊x⌋ = max{n ∈ Z | n 6 x} ;
(ii) ⌊x⌋ = min{n ∈ Z | n > x} − 1 ;
(iii) ⌊x⌋ est l’unique entier tel que ⌊x⌋ 6 x < ⌊x⌋ + 1 ;
(iv) ⌊x⌋ est l’unique entier tel que x − 1 < ⌊x⌋ 6 x.
(v) ⌊x⌋ est le quotient de la division euclidienne de x par 1.
L’entier ⌊x⌋ défini par l’une de ces propriétés (donc toutes) est appelé partie entière de x. On trouve
aussi parfois les notations [x] et E(x).
On donne le graphe de la fonction partie entière : x 7→ ⌊x⌋ en figure 7.1

On définit parfois aussi la partie entière par excès, notée ⌈x⌉, comme étant la plus petit entier supérieur
ou égal à x :
⌈x⌉ = min{n ∈ N | n > x}.
La partie entière par excès est alors caractérisée par son appartenance à n et l’un ou l’autre des encadre-
ments suivants :
x 6 ⌈x⌉ < x + 1 et ⌈x⌉ − 1 < x 6 ⌈x⌉.
Proposition 7.2.27 (Relation entre partie entière et partie entière par excès)
Soit x ∈ R. On a alors
(
⌊x⌋ + 1 si x 6∈ Z
1. ⌈x⌉ =
⌊x⌋ si x ∈ Z
2. ⌊−x⌋ = −⌈x⌉.
On reconnaît dans l’encadrement définissant la partie entière et la partie entière par excès le corollaire
de la propriété d’Archimède.
Définition 7.2.28 (Partie décimale, voir graphe 7.1)

La partie décimale de x est le réel x − ⌊x⌋. Il s’agit du reste de la division euclidienne de x par 1.
Intuitivement, c’est le réel obtenu en ne gardant que les chiffres après la virgule, mais cette interprétation
n’est valable que pour les réels positifs.
|
3
|
2
|
1
|
0
| | | | | | | | | |
|
−4 −3 −2 −1 0 1 2 3 4
-1
|
-2
|
-3
|
-4
|
|
Figure 7.1 – Graphe de la partie entière et de la partie décimale
La partie décimale de x est parfois notée {x}.
On a alors par définition même : x = ⌊x⌋ + {x}.
Propriétés 7.2.29 (propriétés de la partie entière)

1. ∀x, y ∈ R, ⌊x⌋ + ⌊y⌋ + 1 > ⌊x + y⌋ > ⌊x⌋ + ⌊y⌋ ;
2. ∀x, y ∈ R+ , ⌊xy⌋ > ⌊x⌋ · ⌊y⌋ ;
3. ∀x ∈ R, ∀n ∈ Z, ⌊x + n⌋ = ⌊x⌋ + n.
Le premier point s’obtient en écrivant x = ⌊x⌋ + {x} et y = ⌊y⌋ + {y} et en remarquant que
{x} + {y} ∈ [0, 2[. Les deux autres points sont évidents. ⊲
II.6 Représentation décimale
Note Historique 7.2.30 (petit aperçu historique de la représentation des nombres)

• Dès l’antiquité, les mathématiciens se rendent compte de la nécessité de rendre la notion de nombre
indépendante de toute unité ou toute échelle. Ainsi, les Grecs définissent un nombre comme un rapport
entre deux grandeurs de même type, par exemple entre deux longueurs. Ainsi, le théorème de Thalès
(premier mathématicien grec important, début du 1er millénaire avant JC) s’exprime sous forme de
rapports de longueur.
• Les premières représentations des entiers sont des numérations additives (on ajoute des symboles pour
faire des nombres plus gros). Le premier système de numération connu est simplement une succession
d’encoches dans un bout de bois ou un os. D’ailleurs, le mot « calcul » dérive du mot « calculus »
signifiant caillou (pensez aux calculs rénaux !), car les bergers utilisaient des caillous pour compter leurs
moutons.
• Beaucoup plus tard, il reste encore des vestiges de ce système de numération chez les romains, même s’ils
disposent d’un système un peu plus sophistiqué (plusieurs symboles pour désigner différentes grandeurs,
et notation soustractive).
• La numération de position (qui correspond à une numération dans une base donnée, la position d’un
chiffre déterminant le coefficient multiplicatif qui lui sera appliqué) apparaît vraissemblablement à Ba-
bylone. Les nombres y sont représentés en base 60 (y compris pour les décimales) ; les « chiffres » de 1
à 60 sont représentés grâce à une numération additive, à l’aide de deux symboles de valeur 1 et 10. Le
zéro n’existant pas encore, la position des chiffres n’est pas toujours très claire.
• Il reste d’ailleurs dans notre civilisation des vestiges de cette numération en base 60. Lesquels ?
• Les fractions apparaissent dès le 2e millénaire avant JC, à Babylone, où un calcul très complexe des
fractions est mis en place. Imaginez-vous faire des opérations sur des fractions en base 60... Les règles
calculatoires (sommes, produits) ne sont pas encore bien établies, et restent intuitive. La plupart des
calculs sur les fractions sont faits à l’aide de tables.
• La découverte des nombres irrationnels date probablement de Pythagore (diagonale du carré), mais
le secret est gardé. Hippase de Métaponte dévoile aux non initiés l’existence de grandeurs incommen-
surables (i.e. dont le rapport est irrationnel). Selon la légende, il est jeté du haut d’une falaise pour
avoir révélé le secret pythagoricien. Quelle est la part de vérité dans cette histoire ? C’est dur à dire.
Il est possible aussi que la découverte des irrationnels provienne de propriétés géométriques du penta-
gone : une construction fractale d’une suite de pentagones permet de montrer géométriquement que
l’algorithme d’Euclide pour le rapport entre la diagonale et le côté ne se termine pas, ce qui équivaut à
l’incommensurabilité de ces deux grandeurs.
• La numération actuelle est une numération en base 10, et une numération de position (l’un n’entraînant
pas l’autre, la notation romaine n’est pas une numération de position, mais est bien une numération
en base 10). La numération de position s’est imposée suite à la diffusion des ouvrage de Al Khwarizmi
diffusant le système de numération indien. L’intermédiaire arabe de cette diffusion a eu pour conséquence
la terminologie de « chiffres arabes », mais il s’agit bien de « chiffres indiens », même si la graphologie
de ces chiffres a beaucoup changé. L’importance de l’apport est bien plus le système de numération par
position (avec un symbole pour représenter 0) que la graphologie précise des chiffres.
Nous renvoyons au cours d’informatique pour les développements de réels en base b.
Notation 7.2.31 (nombres décimaux)

• Nous notons D l’ensemble des nombres décimaux, c’est à dire des réels x tels qu’il existe n ∈ N
tel que 10n x est entier.
• Étant donné n ∈ N, nous notons Dn l’ensemble des nombres décimaux tels que 10n x ∈ Z ; Par
exemple D0 = Z, et D1 sont les décimaux s’écrivant avec au plus un chiffre après la virgule.
Proposition 7.2.32 (Approximations décimales d’un réel x)

Soit x un réel. Il existe un unique élément y de Dn tel que
y 6 x < y + 10−n .
• Le décimal y est appelé valeur approchée décimale à la précision 10−n par défaut
• Le décimal y + 10−n est appelé valeur approchée décimale à la précision 10−n par excès.
On peut utiliser la propriété d’Archimède (c’est le plus élémentaire) ou bien utiliser l’existence d’un
développement propre et tronquer ce développement. ⊲
Proposition 7.2.33 (Caractérisation des rationnels par leur développement décimal)

Un nombre x est rationnel si et seulement si son développement décimal est périodique à partir d’un
certain rang.
Le sens direct s’obtient par l’algorithme de la division posée, qui tourne en boucle. La réciproque est
obtenue en exprimant 10n x − x, où n est la longueur de la période. ⊲
III Intervalles
III.1 Description des intervalles
Nous définissons les intervalles par leur propriété de convexité :
Définition 7.3.1 (ensemble convexe, figure 7.2)

Soit E un sous-ensemble de Rn . On dit que E est convexe si et seulement si pour tout couple de points
A et B de E, le segment [AB] est entièrement inclus dans E.
E2
E1 √
×
Figure 7.2 – Un sous-ensemble convexe E1 et un sous-ensemble non convexe E2 de R2
Définition 7.3.2 (Intervalle)

Un intervalle I de R est un sous-ensemble convexe I de R, c’est-à-dire tel que :
∀(a, b) ∈ I 2 , ∀x ∈ R, a 6 x 6 b =⇒ x ∈ I.
Intuitivement, « il n’y a pas de trou dans un intervalle ».
Théorème 7.3.3 (Inventaire des intervalles réels)

Tout intervalle I de R est d’une des formes suivantes, pour certaines valeurs réelles a et b :
• [a, b] = {x ∈ R, a 6 x 6 b}, a 6 b ; • ]a, +∞[= {x ∈ R, x > a} ;
• ]a, b[= {x ∈ R, a < x < b}, a < b ; • ] − ∞, b] = {x ∈ R, x 6 b} ;
• [a, b[= {x ∈ R, a 6 x < b}, a < b ; • ] − ∞, b[= {x ∈ R, x < b} ;
• ]a, b] = {x ∈ R, a < x 6 b}, a < b ; • ] − ∞, +∞[= R ;
• [a, +∞[= {x ∈ R, x > a} ; • ∅.
Si I est non vide, sa borne inférieure a et sa borne supérieure b existent (éventuellement infinies).
Montrer, par la propriété de convexité, que ]a, b[⊂ I ⊂ [a, b]. ⊲
III Intervalles 109
Remarquez que le premier cas pour a = b dit que tous les singletons {a} sont des intervalles.
On définit de la même manière les intervalles de Q comme sous-ensemble convexes de Q (comme on reste
dans Q, les trous ne se voient pas dans la propriété de convexité)
Proposition 7.3.4 (description des intervalles de Q)

Un sous-ensemble I de Q est un intervalle de Q si et seulement s’il existe un intervalle IR de R tel que
I = IR ∩ Q.
À peu près le même principe ; les bornes inférieure et supérieure sont réelles, tout le reste est rationnel.
⊲
Les intervalles de Q n’admettent pas de description de la forme ]a, b[ intrinsèque à Q : on ne peut
√
pas exprimer les bornes des intervalles sans sortir de Q. Par exemple, ]0, 2[∩Q n’admet pas de borne
supérieure dans Q.
Remarque 7.3.5
L’inventaire des intervalles de R est strictement équivalente à la propriété de la borne supérieure, et
pourrait être considérée comme propriété fondamentale de R en lieu et place de la propriété de la borne
supérieure : un réel est alors une classe d’équivalence d’intervalles de Q de même borne supérieure dans
R (cette notion d’égalité étant à définir intrinsèquement à Q, pour que la définition soit valide).
Un intervalle est donc délimité par deux réels (ou les infinis), et chacune des deux bornes, si elle est finie,
peut être ou ne pas être dans l’intervalle (une borne infinie est toujours exclue de l’intervalle, l’infini
n’étant pas un réel). L’appartenance ou non des bornes à l’intervalle nous incite à donner un classement
des intervalles :
Définition 7.3.6 (intervalles ouverts, fermés, semi-ouverts)

• On dit qu’un intervalle est ouvert s’il est de la forme ]a, b[, ]a, +∞[, ] − ∞, b[, R ou ∅.
• On dit qu’un intervalle est fermé s’il est de la forme [a, b], [a, +∞[, ] − ∞, b], R ou ∅.
• On dit qu’un intervalle est semi-ouvert s’il est de la forme [a, b[ ou ]a, b].
Remarquez qu’il existe des intervalles à la fois ouverts et fermés (R et ∅)
III.2 Intervalles et topologie

La notion d’intervalle est en fait liée à des notions de « topologie » plus générales (la topologie étant
l’étude des sous-ensembles « ouverts » et « fermés » d’un ensemble). Nous nous limitons à une brève
introduction de ces notions dans Rn , la distance que nous utilisons étant la distance euclidienne canonique :
si X = (x1 , . . . , xn ) et Y = (y1 , . . . , yn ), la distance entre X et Y est :
v
u n
uX
d(X, Y ) = t (yi − xi )2 .
i=1
En particulier, si x, y ∈ R1 = R, d(x, y) = |y − x|.

Ces notions se généralisent dans des espaces muni de distances plus générales (espaces métriques).
Définition 7.3.7 (Boule dans Rn , figure 7.3)

Soit x ∈ Rn et r ∈ R+ .
1. La boule ouverte de centre x et de rayon r est : B(x, r) = {y ∈ Rn | d(y, x) < r}
2. La boule fermée de centre x et de rayon r est : B(x, r) = {y ∈ Rn | d(y, x) 6 r}
r r
d(x, y) + d(x, y) +
y y
+ +
x x
B(x, r) B(x, r)
Figure 7.3 – Boules dans Rn
Exemple 7.3.8
Dans R, les boules sont des intervalles (voir figure 7.4) :
• B(x, r) =]x − r, x + r[
• B(x, r) = [x − r, x + r]
En fait, tout intervalle borné ouvert est une boule ouverte, tout intervalle borné fermé est une boule
fermée :

• ]a, b[= B a+b b−a
2 , 2 ,
• [a, b] = B a+b b−a
2 , 2
+ + + +
x y x y
x−r x+r x−r x+r
r d(x, y) r d(x, y)
B(x, r) B(x, r)
Figure 7.4 – Boule ouverte, boule fermée dans R
Remarque 7.3.9
Il est important de retenir qu’une majoration de certaines valeur absolue se traduit par l’appartenance
à une boule :
• une majoration du type |x − a| 6 r traduit l’appartenance de x à la boule fermée B(a, r) de
centre a de rayon r, donc à l’intervalle [a − r, a + r] ;
• une majoration du type |x − a| < r traduit l’appartenance de x à la boule ouverte B(a, r) de
centre a de rayon r, donc à l’intervalle ]a − r, a + r[ ;
Définition 7.3.10 (Voisinage, figure 7.5)

Soit x ∈ Rn . Un voisinage V de x est un sous-ensemble V de Rn tel qu’il existe une boule ouverte
centrée en x entièrement contenue dans V :
∃ε > 0, B(x, ε) ⊂ V, i.e. ∃ε > 0, ∀y ∈ E, d(y, x) < ε =⇒ y ∈ V.
En gros, V est un voisinage de x si x est « à l’intérieur de V », et non sur un bord. En s’éloignant un

peu de x, on ne sort pas de V .
III Intervalles 111
+ +
x x
V √ V
×
Figure 7.5 – Voisinage de x
Exemple 7.3.11 (Voisinages dans R)

• Dans R, un voisinage de x est un ensemble contenant un intervalle ]a, b[ tel que x ∈]a, b[.
• Par extension et commodité, on dit parfois qu’un ensemble contenant un intervalle ]a, +∞[ est
un voisinage de +∞. Version symétrique pour −∞.
Définition 7.3.12 (sous-ensemble ouvert)

• Un ouvert U de Rn est un sous-ensemble U de Rn qui est voisinage de tous ses points
• De manière équivalente, U ⊂ Rn est ouvert ssi :
∀x ∈ U, ∃ε > 0, B(x, ε) ⊂ U.
Intuitivement, un ouvert est un ensemble dont le « bord » est flou : on peut s’en approcher, mais jamais
l’atteindre en restant dans U . Ainsi, l’image qu’il faut en garder est qu’un ouvert est un ensemble ne
contenant pas son bord. Évidemment, n’ayant pas défini la notion de bord, ceci reste une image.
Définition 7.3.13 (sous-ensemble fermé)

Un sous-ensemble F de Rn est fermé si son complémentaire ∁E F est ouvert.
Cette fois, intuitivement, c’est le complémentaire qui ne contient pas son bord, donc F , lui contient tout
son bord.
Exemples 7.3.14
1. Les intervalles ouverts sont des sous-ensembles ouverts de R.
2. Les intervalles fermés sont des sous-ensembles fermés de R.
3. Les intervalles semi-ouverts ne sont ni ouverts ni fermés.
4. R et ∅ sont des sous-ensembles à la fois fermés et ouverts de R.
5. On peut montrer que les sous-ensembles ouverts de R sont les unions disjointes d’intervalles
ouverts.
Proposition 7.3.15 (union, intersection d’ouverts et de fermés)

1. Toute union quelconque d’ouverts est un ouvert ;
2. Toute intersection d’un nombre fini d’ouverts est un ouvert ;
3. Toute intersection quelconque de fermés est un fermé ;
4. Toute union d’un nombre fini de fermés est un fermé.
1. Si x est dans l’union, il existe une boule centrée en x restant dans l’un des ouverts, donc dans
leur union.
2. Prendre le minimum des rayons des boules centrées en x restant dans chaque ouvert. Pourquoi
doit-on se limiter au cas fini ?
3. Par complémentation
4. De même.
Exemples 7.3.16
Voici deux contre-exemples à bien garder en tête :
+∞
\
1
1. Contre-exemple pour une intersection infinie d’ouverts : − , 1 = [0, 1[.
n=1
n
+∞
[
1
2. Contre-exemple pour une union infinie de fermés : , 1 =]0, 1].
n=1
n
IV Droite achevée R
Par commodité, il est parfois intéressant de pouvoir considérer les deux infinis comme des éléments comme
les autres. Cela permet en particulier d’unifier certains énoncés et certaines démonstrations, qui sinon,
nécessiteraient une disjonction de cas.
Définition 7.4.1 (droite achevée réelle)

La droite achevée réelle, notée R, est l’ensemble R ∪ {−∞, +∞}.
Définition 7.4.2 (relation d’ordre sur R)

On peut prolonger l’ordre de R en un ordre sur R en posant :
∀x ∈ R, −∞ 6 x 6 +∞.
Définition 7.4.3 (règles calculatoires dans R)

On peut prolonger partiellement les opérations de R sur R, en posant :
• −(+∞) = −∞
• ∀x ∈ R \ {−∞}, x + (+∞) = +∞
• ∀x ∈ R \ {+∞}, x + (−∞) = −∞
1 1
• +∞ = −∞ =0
∗
• ∀x ∈ R+ , x × (+∞) = +∞, x × (−∞) = −∞,
• ∀x ∈ R∗− , x × (+∞) = −∞, x × (−∞) = +∞.
En revanche, certaines opérations ne peuvent pas être définies de façon cohérente, comme le montre
l’étude des formes indéterminées dans le calcul des limites.
IV Droite achevée R 113
Définition 7.4.4 (Formes indéterminées)

Les opérations suivantes ne sont pas définies, et définissent les formes indéterminées de la somme et du
produit dans R :
• −∞ + (+∞)
• 0 × (+∞)
• 0 × (−∞).
Pour l’étude des limites, ces formes donnent également des formes indéterminées pour les puissances, par
passage à l’exponentielle (voir le chapitre sur les suites).
Les intervalles de R étant définis comme ceux de R par la propriété de convexité, on obtient la description
suivante :
Proposition 7.4.5 (Inventaire des intervalles de R)

Les intervalles de R sont les intervalles de R, et les intervalles de la forme ]a, +∞], [a, +∞], [−∞, a[,
[−∞, a], ] − ∞, +∞], [−∞, +∞[, et [−∞, +∞] = R, pour a ∈ R.
Si I est un intervalle de R, alors I ∩ R est un intervalle de R. ⊲
8
Le corps C des complexes
Au reste, tant les vraies racines que les fausses ne sont pas toujours réelles, mais quelquefois
seulement imaginaires, c’est à dire qu’on peut bien toujours en imaginer autant que j’ai dit en
chaque équation, mais qu’il n’y a quelquefois aucune quantité qui corresponde à celles qu’on
imagine ; comme encore qu’on puisse en imaginer trois en celle-ci :
x3 − 6x2 + 13x − 10 = 0,
il n’y en a toutefois qu’une réelle qui est 2, et pour les deux autres, quoiqu’on les augmente
ou diminue, ou multiplie en la façon que je viens d’expliquer, on ne saurait les rendre autres
qu’imaginaires.
(René Descartes)
Ce que nous nommons temps imaginaire est en réalité le temps réel, et ce que nous nommons
temps réel n’est qu’une figure de notre imagination.
(Stephen Hawking)
Les nombres complexes sont nés de l’étude des solutions des équations du troisième degré. Dans un
premier temps, ils ont été utilisés sans se préoccuper de leur donner un sens précis : ils étaient des outils
abstraits, imaginaire pourrait-on dire, pour accéder aux solutions, pouvant elles être bien réelles, des
équations considérées.
I Les nombres complexes : définition et manipulations

I.1 Définition, forme algébrique

• Les nombres complexes ont été introduits par Cardan et Bombelli au 16-ième siècle, comme moyen
d’exprimer certaines racines de polynômes de degrés 3 ou 4. A cette époque, l’introduction des nombres
imaginaires (via des racines de réels négatifs) est un pur artifice.
• Ainsi, dès leur origine, les nombres complexes sont introduits pour pallier au fait que certains polynômes
à coefficients réels n’ont pas de racines dans R, comme par exemple X 2 + 1.
√
• La notation i est introduite par Euler en 1777 pour remplacer la notation −1.
D’un point de vue formel, C est défini comme le plus petit sur-corps de R dans lequel le polynôme X 2 + 1
admet une racine (c’est ce qu’on appelle un corps de rupture du polynôme X 2 + 1, correspondant dans ce
cas au corps de décomposition, le plus petit corps dans lequel le polynôme peut se factoriser en polynômes
de degré 1).
116 CHAPITRE 8. LE CORPS C DES COMPLEXES
Ainsi, il s’agit d’un ensemble contenant un élément i, racine de X 2 + 1, vérifiant donc i2 = −1, et muni
d’une addition et d’un produit prolongeant celles de R, avec les mêmes propriétés. En fait, la relation
i2 = −1 et les propriétés de commutativité, associativité et distributivité déterminent entièrement les
opérations sur C. Nous donnons la définition suivante :
Définition 8.1.2 (ensemble C des nombres complexes)

L’ensemble des nombres complexes C est l’ensemble R2 , muni des opérations suivantes :
• (a, b) + (a′ , b′ ) = (a + a′ , b + b′ ) ;
• (a, b) × (a′ , b′ ) = (aa′ − bb′ , ab′ + a′ b).
Pour tout réel λ et tout complexe z = (a, b), on peut définir λz par λz = (λa, λb).
Remarque 8.1.3
On identifie un réel λ au complexe (λ, 0). Via cette identification, on peut considérer que R ⊂ C, et on
vérifie facilement que la somme et le produit définis ci-dessus sur C prolongent les lois de R, et que la
multiplication d’un complexe z par un réel λ définie ci-dessus correspond au produit dans C, lorsqu’on
voit le réel λ comme un élément de C.
Définition 8.1.4 (définition de la forme algébrique ; partie réelle, partie imaginaire)

• On note 1 = (1, 0), et i = (0, 1)
• On a alors, pour tout z = (a, b) ∈ C, z = a + i b. C’est la forme algébrique du nombre complexe
z.
• Soit z = a + i b, avec a, b ∈ R.
∗ Le réel a est appelé partie réelle de z, et est noté Re(z) ;
∗ Le réel b est appelé partie imaginaire de z, et est noté Im(z)
• Un nombre z ∈ C (disons z = a + i b, (a, b) ∈ R) tel que Im(z) = 0 (donc z = a) est identifié au
réel a. Ainsi, l’ensemble des nombres complexes de partie imaginaire nulle est égal à l’ensemble
des nombres réels. En particulier, on a une inclusion R ⊂ C.
• Un nombre z ∈ C tel que Re(z) = 0 est appelé nombre imaginaire pur.
Proposition 8.1.5 (propriétés liées au produit)

1. i2 = −1
2. Le produit (a + i b)(a′ + i b′ ) est simplement obtenu par utilisation des règles de distributivité et
par la relation i2 = −1.
3. Si z 6= 0, alors z et inversible, et, si z = a + i b avec (a, b) ∈ R2 , on a l’expression de l’inverse :
a− ib
z −1 = .
a2 + b 2
Ce sont des vérifications immédiates. ⊲
Théorème 8.1.6 (structure de C)

L’ensemble C muni des opérations ci-dessus est un corps.
I Les nombres complexes : définition et manipulations 117
Il faut vérifier la commutativité des opérations, leur associativité, la distributivité du produit sur
la somme, l’existence du neutre additif 0 et du neutre multiplicatif 1, l’existence des opposés −x et
l’inversibilité de tout complexe non nul. Fastidieux mais pas difficile. ⊲
Dans la pratique, un nombre complexe est représenté sous sa forme algébrique a + i b, ou sa forme
trigonométrique que nous rappellerons plus loin. On perd un peu de vue le point de vue initial du couple
(d’ailleurs, on peut introduire C de façon différente). Nous donnons dans la définition suivante la démarche
inverse, permettant de revenir de C à R2 . Cette interprétation est fructueuse pour la geométrie du plan,
pouvant ainsi être étudiée sous l’angle des nombres complexes.
Définition 8.1.7 (affixe d’un point du plan)

Soit A = (a, b) un point de R2 . L’affixe du point A est le nombre complexe zA = a + i b.
Désormais, nous abandonnons la notation d’un complexe sous forme d’un couple, et nous représenterons
un nombre complexe sous la forme a + i b.
Remarquons que la construction de C à partir de R est un cas particulier d’une construction plus générale
d’ « extensions monogènes d’un corps K », à la base de la théorie de Galois : étant donné une racine x d’une
équation polynomiale P à coefficients dans K, K[x] est l’ensemble de toutes les sommes, produits, quotients
√ √
qu’on peut former à partir des éléments de K et de x. Par exemple Q[ 2] = {(a + b 2), (a, b) ∈ Q2 }, et
√ √ √
Q[ 3 2] = {a + b 3 2 + c( 3 2)2 , (a, b, c) ∈ Q3 } (on peut montrer que tout quotient peut s’exprimer ainsi
aussi).
De ce point de vue, C = R[i].
Nous avons donc défini C comme un corps de rupture sur R du polynôme X 2 + 1, et même un corps
de décomposition, puisqu’on a alors la factorisation suivante : X 2 + 1 = (X + i)(X − i). En fait, cette
propriété est beaucoup plus générale, ainsi que le prouve le théorème suivant, d’une importance capitale :
Théorème 8.1.8 (d’Alembert-Gauss, admis)

Tout polynôme non constant à coefficients complexes admet au moins une racine dans C.
On démontrera plus tard que ceci implique que tout polynôme à coefficients complexes se factorise en
polynômes de degré 1.
Le théorème de d’Alembert-Gauss se réexprime ainsi : C est algébriquement clos, ce qui signifie qu’il
n’existe pas d’autre nombre algébrique sur C que les nombres complexes eux-mêmes.
Le théorème de d’Alembert-Gauss, restreint aux polynômes à coefficients réels, allié au fait que C est
par définition le plus petit corps dans lequel X 2 + 1 admet une racine, s’exprime en disant que C est la
clôture algébrique de R.

Le théorème de d’Alembert-Gauss est d’une importance capitale, puisque c’est ce résultat qui motive la construc-
tion de C.
• Il est conjecturé depuis longtemps déjà lorsque d’Alembert en propose une preuve en 1743. Cette preuve
n’est pas satisfaisante, Gauss va jusqu’à la qualifier de petitio principii, puisqu’elle part de l’hypothèse
de l’existence de racines « fictives ».
• La première preuve complète et rigoureuse revient à Gauss, au 19-ième siècle.
Nous voyons maintenant quelques notions directement liées à la forme algébrique des nombres complexes
Définition 8.1.10 (conjugué d’un nombre complexe)

Soit z = a + i b (avec (a, b) ∈ R2 ) un nombre complexe. Le conjugué de z est le nombre complexe
z = a − i b.
Propriétés 8.1.11 (propriétés de la conjugaison dans C)

Soit z et z ′ deux nombres complexes. Alors :
1. z = z (autrement dit, la conjugaison est une involution) ;
2. z = z ⇐⇒ z ∈ R ;
3. z = −z ⇐⇒ z imaginaire pur ;
z+z z−z
4. Re(z) = et Im(z) = ;
2 2i
z z
5. z + z ′ = z + z ′ , zz ′ = z · z ′ , z −1 = z −1 , = .
z′ z′
Vérifications faciles. Pour l’inverse, utiliser la formule obtenue tantôt. ⊲
I.2 Module
Nous définissons maintenant quelques notions liées à la structure euclidienne de R2 , donc aux propriétés
métriques.
Définition 8.1.12 (module d’un nombre complexe)

Soit (a, b) ∈ R2 , et z = a + i b. Le module de z est le réel positif défini par
p
|z| = a2 + b 2 .
Remarque 8.1.13
Via la correspondance entre C et R2 le module d’un nombre complexe correspond à la norme des
−→
vecteurs. Ainsi, si A est le point d’affixe z et O l’origine, alors |z| = kOAk.
Exemples 8.1.14
1. Décrire l’ensemble des nombres complexes z tels que |z − a| = r, où a ∈ C et r ∈ R∗+ .
2. Même question avec l’inéquation |z − a| 6 r.
Propriétés 8.1.15 (propriétés du module)

Soit z et z ′ deux nombres complexes. Alors :
1. z = 0 ⇐⇒ |z| = 0 ;
2. |Re(z)| 6 |z| et | Im(z)| 6 |z| ;

3. |zz ′ | = |z| · |z ′ | et si z ′ 6= 0, z′ =
z
|z|
|z ′ | (multiplicativité du module)
2
4. |z| = zz (expression du module à l’aide du conjugué)
5. |z| = |z| (invariance du module par conjugaison)
II Trigonométrie 119
6. |z + z ′ | 6 |z| + |z ′ | (inégalité triangulaire, ou sous-additivité du module).

L’égalité est vérifiée si et seulement si z = 0 ou s’il existe λ ∈ R+ tel que z ′ = λz.
Le seul point non trivial est l’inégalité triangulaire. Comparer les carrés, en exprimant les modules
à l’aide des conjugués. Se ramener à une comparaison de la partie réelle et du module de z · z ′ . ⊲
On en déduit notamment une méthode pour exprimer sous forme algébrique un quotient de deux com-
plexes donnés sous forme algébrique (pour les autres opérations, cela ne pose aucune difficulté).
Méthode 8.1.16 (Expression algébrique d’un quotient)

Soit z1 et z2 deux nombres complexes donnés sous forme algébrique, avec z2 6= 0. Pour trouver la forme
z1
algébrique du quotient , multipliez le dénominateur et le numérateur par z2 , c’est-à-dire considérez
z2
l’expression zz12 ·z
·z2
2
De la sorte, le dénominateur est maintenant un réel.
II Trigonométrie
II.1 Cercle trigonométrique, formules de trigonométrie
Littéralement, « trigonométrie » signifie « mesure des trois angles », donc se rapporte aux propriétés des
angles d’un triangle. On fait donc ainsi référence aux interprétations géométriques usuelles des fonctions
trigonométriques.

• La trigonométrie (l’étude des mesures dans le triangle) existe depuis l’antiquité (Égypte, Babylone,
Grèce), et est développée en rapport avec l’astronomie.
• Le sinus, sous sa forme actuelle, a été introduit par les indiens aux alentours de 500 ap JC, pour l’étude
des angles célestes. La première table connue date de 499, et est attribuée au mathématicien indien
Aryabhata. En 628, Brahmagupta construit une approximation de la fonction sinus par interpolation.
• Ces notions nous sont parvenus grâce aux travaux de synthèse des mathématiciens arabes des 9e et 10e
siècles (essentiellement basés dans les actuelles Irak, Iran et Khazakstan)
• Auparavant, les grecs utilisaient plutôt la mesure de la corde, ce qui est moins commode, mais assez
équivalent.
• Le nom de « sinus » provient d’un mot sanscrit signifiant « arc », apparaissant dans l’ouvrage de
Aryabhata, et transcrit phonétiquement en arabe, puis déformé en un mot proche signifiant « repli
de vêtement ». Il a été traduit en latin au 12e siècle par le mot « sinus » signifiant « pli ».
Définition 8.2.2 (cercle trigonométrique)

Le cercle trigonométrique (ou cercle unité) est le sous-ensemble de C, noté U (comme « unité »),
constitué des nombres complexes de module 1 :
U = {z ∈ C | |z| = 1}.
Le cercle trigonométrique correspond dans l’interprétation géométrique des complexes au cercle de

centre (0, 0) et de rayon 1 de R2 .
Définition 8.2.3 (fonctions trigonométriques, figure 8.1)

Soit x ∈ R. Soit z le point du cercle trigonométrique tel que le rayon correspondant du cercle trigo-
nométrique forme avec l’axe des réels un angle (orienté dans le sens direct) de x. On définit alors les
fonctions cosinus, sinus et tangente par :
sin(x)
cos(x) = Re(z), sin(x) = Im(z) et tan(x) = si cos(x) 6= 0.
cos(x)
tan(x)
sin(x)
cos(x) 1
U
|
Figure 8.1 – Fonctions trigonométriques
On retrouve facilement l’interprétation usuelle sur les triangles (définitions données au collège), pour un
angle α ∈]0, π2 [ : si ABC est un triangle rectangle en A, et d’angle en B égal à α, alors :
côté opposé côté adjacent côté opposé

sin(x) = , cos(x) = , tan(x) = .
hypothénuse hypothénuse côté adjacent
On utilise parfois une autre fonction trigonométrique, version symétrique de la tangente :
Définition 8.2.4 (cotangente)

Soit x ∈ R. La cotangente est définie, pour tout x tel que sin(x) 6= 0, par :
cos(x)
cotan(x) = .
sin(x)
1
Ainsi, en tout point en lequel à la fois sin(x) 6= 0 et cos(x) 6= 0, on a cotan(x) = tan(x) .
Proposition 8.2.5 (domaines de définition des fonctions trigonométriques)

1. Les fonctions sin et cos sont définies sur R.
[i π π h nπ o
2. La fonction tan est définie sur − + nπ, + nπ = R \ + nπ, n ∈ Z .
2 2 2
n∈Z
[
3. La fonction cotan est définie sur ]nπ, (n + 1)π[ = R \ {nπ, n ∈ Z}.
n∈Z
Les propriétés suivantes sont à bien comprendre sur le cercle trigonométrique.

Proposition 8.2.6 (Symétries de sin et cos)

1. sin et cos sont 2π-périodiques ;
2. sin est impaire et cos est paire ;
3. ∀x ∈ R, cos(π + x) = − cos(x), et sin(π + x) = − sin(x).
4. ∀x ∈ R, cos(π − x) = − cos(x), et sin(π − x) = sin(x).

5. ∀x ∈ R, cos π2 − x = sin(x), et sin π2 − x = cos(x).

6. ∀x ∈ R, cos π2 + x = − sin(x), et sin π2 + x = cos(x).
Proposition 8.2.7 (symétries de tan et cotan)

1. tan et cotan sont π-périodiques ;
2. tan et cotan sont impaires ;
3. pour tout x dans le domaine de tan, tan(π − x) = − tan(x) ;
4. pour tout x dans le domaine de cotan, cotan(π − x) = −cotan(x) ;

5. pour tout x ∈ R \ nπ π π
2 , n ∈ Z , tan 2 − x = cotan(x) et cotan 2 − x = tan(x) ;

6. pour tout x ∈ R \ nπ π π
2 , n ∈ Z , tan 2 + x = −cotan(x) et cotan 2 + x = − tan(x) ;
Nous rappelons :
Proposition 8.2.8 (Valeurs particulières des fonctions trigonométriques)

π
Voici un tableau des valeurs particulières à bien connaître, entre 0 et 2 (les autres s’obtiennent par les
symétries) :
π π π π
0
6 4 3 2
√ √
1 2 3
sin 0 1
2 2 2
√ √
3 2 1
cos 1 0
2 2 2
1 √
tan 0 √ 1 3 −
3
√ 1
cotan − 3 1 √ 0
3
Amusez-vous à retouver ces valeurs géométriquement, en vous servant du théorème de Pythagore. ⊲
Nous obtenons les graphes des fonctions trigonomtriques, les variations pouvant être obtenues par des
considérations purement géométriques (voir figure 8.2).
Et voici les inévitables formules à retenir...
Proposition 8.2.9 (identité remarquable, ou théorème de Pythagore)

Pour tout x ∈ R, sin2 (x) + cos2 (x) = 1.
x 7→ cos(x) 1 x 7→ sin(x)
|
3π
−π − π2 2
| | | | | | | | | | | | |
− 3π
π π
2 2
|
−1
|
x 7→ tan(x)
|
|
1
|
| | | | | | | | | | | | |
− 3π −π − π2 π π 3π
2 2 2
−1
|
|
|
|
Figure 8.2 – Graphe des fonctions trigonométriques
C’est juste dire que cos(x) + i sin(x) est sur le cercle... ⊲
Proposition 8.2.10 (formules d’addition)

Soit a et b deux réels. Alors :
(i) sin(a + b) = sin(a) cos(b) + sin(b) cos(a)
(ii) sin(a − b) = sin(a) cos(b) − sin(b) cos(a)
(iii) cos(a + b) = cos(a) cos(b) − sin(a) sin(b)
(iv) cos(a − b) = cos(a) cos(b) + sin(a) sin(b)
(v) Pour tout (a, b) ∈ R2 tel que tan(a), tan(b) et tan(a + b) soient définis :
tan(a) + tan(b)
tan(a + b) =
1 − tan(a) tan(b)
(vi) Pour tout (a, b) ∈ R2 tel que tan(a), tan(b) et tan(a − b) soient définis :
tan(a) − tan(b)
tan(a − b) =
1 + tan(a) tan(b)
(vii) Pour tout (a, b) ∈ R2 tel que cotan(a), cotan(b) et cotan(a + b) soient définis :
cotan(a)cotan(b) − 1
cotan(a + b) =
cotan(a) + cotan(b)
π

(ii) découle de (i) en considérant −b, (iii) découle de (i) en considérant sin 2 + a + b , et (iv) découle
de (iii). (v), (vi) et (vii) en découlent par quotient et simplifications.
On peut montrer (i) géométriquement par projections signées. Cela revient à considérer des produits
scalaires, mais ce point de vue anticiperait un peu trop les derniers chapitres de l’année. ⊲
Proposition 8.2.11 (formules de duplication des angles)

Soit a un réels. Alors :
(i) sin(2a) = 2 sin(a) cos(a)
(ii) cos(2a) = cos2 (a) − sin2 (a) = 1 − 2 sin2 (a) = 2 cos2 (a) − 1.
2 tan(a)
(iii) tan(2a) =
1 − tan2 (a)
cotan2 (a) − 1
(iv) cotan(2a) =
2cotan(a)
Appliquer ce qui précède avec a = b. ⊲
Proposition 8.2.12 (formules de linéarisation des carrés, ou formules de Carnot)

Soit a ∈ R :
1 + cos(2a)
(i) cos2 (a) =
2
1 − cos(2a)
(ii) sin2 (a) =
2
Utiliser (ii) de la proposition précédente. ⊲
Proposition 8.2.13 (formules de développement, ou transformation de produit en somme)

Soit a et b deux réels.
1
(i) sin(a) sin(b) =
[cos(a − b) − cos(a + b)]
2
1
(ii) cos(a) cos(b) = [cos(a − b) + cos(a + b)]
2
1
(iii) sin(a) cos(b) = [sin(a + b) + sin(a − b)]
2
Sommer ou soustraire 2 par 2 les formules d’addition. ⊲
Proposition 8.2.14 (formules de factorisation, ou formules de Simpson)

Soit p et q deux réels.

p+q p−q
(i) sin(p) + sin(q) = 2 sin cos
2 2

p+q p−q
(ii) sin(p) − sin(q) = 2 cos sin
2 2

p+q p−q
(iii) cos(p) + cos(q) = 2 cos cos
2 2

p+q p−q
(iv) cos(p) − cos(q) = −2 sin sin
2 2
Changement de variable dans les formules de développement. ⊲
Proposition 8.2.15 (formules de l’arc moitié)

Soit x un réel tel que t = tan x2 soit défini. Alors :
2t
(i) sin(x) =
1 + t2
1 − t2
(ii) cos(x) =
1 + t2
2t
(iii) tan(x) = si t 6= ±1.
1 − t2
1
Utiliser la formule de duplication de l’angle et le fait que cos2 (y) = 1 + tan2 (y). ⊲
Proposition 8.2.16 (formule de factorisation de a cos x + b sin x)

Soit a, b et x trois réels, a 6= 0. Alors
a b
a cos(x) + b sin(x) = cos(x − ϕ), où tan(ϕ) = .
cos ϕ a
Utilisation facile de la formule d’addition. ⊲
a
En physique, est appelé amplitude et ϕ est appelé la phase.
cos(ϕ)
II.2 L’exponentielle complexe et applications à la trigonométrie
Définition 8.2.17 (exponentielle complexe)

On définit l’exponentielle complexe sur les nombres imaginaires purs par :
∀θ ∈ R, ei θ = cos θ + i sin θ.
Proposition 8.2.18
La fonction θ 7→ ei θ est surjective de R sur U. Plus précisément, c’est une bijection de tout intervalle
]α, α + 2π] sur U, ainsi que de tout intervalle [α, α + 2π[ sur U.
La surjectivité provient de la définition-même de cosinus et sinus comme projetés d’un point du cercle.
L’injectivité modulo 2π provient de la résolution des équations cos(θ) = a, sin(θ) = b, provenant des
variations de ces fonctions. ⊲
Corollaire 8.2.19
La fonction de R∗+ ×] − π, π] sur C∗ définie par (r, θ) 7→ rei θ est bijective.
Définition 8.2.20 (forme trigonométrique)

• Ainsi, tout nombre complexe non nul z s’écrit sous la forme z = rei θ appelée forme trigonomé-
trique de z, avec r > 0 ;
• r est unique, égal au module de z ;
• θ est unique modulo 2π, appelé argument de z.
• L’unique argument θ de l’intervalle ]−π, π] est appelé argument principal de z et est noté arg(z).
Proposition 8.2.21 (formules d’Euler)

Soit θ ∈ R. Alors :
ei θ + e− i θ ei θ − e− i θ
cos(θ) = et sin(θ) = .
2 2i
Théorème 8.2.22 (formules trigonométriques d’addition)

′ ′
Pour tout (θ, θ′ ) ∈ R2 , ei(θ+θ ) = ei θ ei θ .
Le rapport de l’un à l’autre se fait par les formules d’addition. ⊲
Remarque 8.2.23
Cette formule synthétise les formules d’addition. Si vous les avez oubliées, vous les retrouvez facilement
en considérant la partie réelle ou la partie imaginaire de l’égalité ci-dessus.
Corollaire 8.2.24 (Formule de (De) Moivre, 1707)

Pour tout θ ∈ R et n ∈ N :
ei nθ = (ei θ )n soit: cos(nθ) + i sin(nθ) = (cos θ + i sin θ)n .
Récurrence triviale à partir du théorème précédent. ⊲

• Abraham de Moivre était un mathématicien ami des physiciens et astronomes Newton et Halley. Il
faudrait théoriquement dire « formule de De Moivre », (selon la règle de conservation de la particule
onomastique pour les noms d’une syllabe, comme de Gaulle), mais on dit plus souvent « formule de
Moivre ».
• La version démontrée par Moivre est la version donnée avec les fonctions sin et cos, le lien avec les
propriétés de l’exponentielle n’ayant été découvertes que plus tard par Euler (19e siècle), qui est à
l’origine de la notation exponentielle ei θ .
L’utilisation des exponentielles complexes permet de simplifier un certain nombre de calculs liés à la
trigonométrie. Nous présentons ci-dessous quelques méthodes à connaître.
Méthode 8.2.26 (Principe de symétrisation des arguments)

Cette méthode permet d’exprimer une somme ou une différence de deux exponentielles à l’aide des fonc-
tions trigonométriques. C’est notamment intéressant pour obtenir la partie réelle et la partie imaginaire
sous forme factorisée. Soit et b deux réels.
aa−b Alors :
a+b a−b i a+b
• ei a + ei b = ei 2 ei 2 + e− i 2 = 2 cos a−b
2 e 2 .
a+b
a−b a−b
a+b
• ei a − ei b = ei 2 ei 2 − e− i 2 = 2 i sin a−b
2 ei 2 .
Remarquez que c’est une façon commode de retenir ou retrouver les formules de factorisation des fonctions
trigonométriques (transformation d’une somme en produit).
Exemple 8.2.27
Factoriser 1 + ei a .
Méthode 8.2.28 (Linéarisation)

Le but est d’exprimer cosn θ ou sinn θ en fonction de cos(kθ) et sin(kθ), k ∈ N. Principe du calcul :
1. Exprimer cos θ (ou sin θ) à l’aide des formules d’Euler ;
2. Développer à l’aide de la formule du binôme de Newton ;
3. Regrouper dans le développement les exponentielles conjuguées et les réexprimer à l’aide des
fonctions sin et cos en utilisant la formule d’Euler dans l’autre sens.
Exemple 8.2.29
1. Linéariser cos4 (x)
Z π
2. Linéariser sin6 (x). En déduire sin6 (x) dx.
0
Z π
3. Proposer plus efficace pour le calcul de sin5 (x) dx
0
Méthode 8.2.30 (« délinéarisation », ou les polynômes de Tchébychev)

Il s’agit de la méthode inverse, consistant à écrire cos(nθ) ou sin(nθ) en fonction des puissances de
cos(x) et/ou sin(x). Le principe du calcul :
1. On utilise la formule de Moivre pour exprimer cos(nθ) ou sin(nθ) comme partie réelle ou ima-
ginaire de (cos(θ) + i sin(θ))n .
2. On développe cette expression à l’aide de la formule du binôme de Newton
3. On utilise l’identité remarquable sin2 x+cos2 x = 1 pour exprimer la partie réelle (ou imaginaire)
sous forme d’un polynôme en cos(x) (pour cos(nθ)) ou le produit de cos(x) par un polynôme en
sin(x) (pour sin(nθ))
Remarque 8.2.31
Les polynômes obtenus ainsi s’appelle polynômes de Tchébychev, de première espèce pour les cosinus,
et de seconde espèce pour les sinus. On peut définir ces polynômes par récurrence et redémontrer
directement à l’aide de ces relations de récurrence et des formules de trigonométrie le fait qu’ils assurent
la délinéarisation de cos(nθ) et sin(nθ). La méthode ci-dessus permet alors d’obtenir une expression
explicite de ces polynômes.
Méthode 8.2.32 (Sommes de sin et cos)

Le principe général est d’écrire une somme de sin (ou de cos) sous forme de partie imaginaire (ou réelle)
d’une somme d’exponentielles. On peut alors souvent exploiter le caractère géométrique du terme ei nθ ,
par utilisation des propriétés des sommes géométriques, ou de la formule du binôme etc.
Exemple 8.2.33 (noyau de Dirichlet)

Soit a et b deux réels et
n
X
C = cos a + cos(a + b) + cos(a + 2b) + · · · + cos(a + nb) = cos(a + kb).
k=0

bn sin n+1
2 ·b
Alors C = cos a + · .
2 sin 2b
Nous terminons ce paragraphe par une présentation rapide de l’exponentielle complexe générale.
Définition 8.2.34 (Exponentielle complexe)

Soit z un nombre complexe. On définit alors ez = eRe(z) × ei Im(z) .
Si z est réel ou imaginaire pur, on retrouve respectivement l’exponentielle réelle et l’exponentielle définie
sur les imaginaires purs.
De façon immédiate, on a les résultats suivants :
Proposition 8.2.35 (Parties réelle, imaginaire, module et argument de ez )

(i) ℜ(ez ) = eℜ(z) cos(Im(z))
(ii) Im(ez ) = eℜ(z) sin(Im(z))
(iii) |ez | = eℜ(z)
(iv) arg(ez ) ≡ Im(z) [2π]
Théorème 8.2.36 (propriété d’addition)

′ ′
Soit (z, z ′ ) ∈ C2 . Alors ez+z = ez ez .
Proposition 8.2.37 (cas d’égalité)

′
Soit (z, z ′ ) ∈ C2 . On a ez = ez si et seulement si Re(z) = Re(z ′ ) et Im(z) ≡ Im(z ′ ) mod 2π.
Proposition 8.2.38 (recherche de l’image réciproque)

Soit a ∈ C2 . Alors :
• si a = 0, l’équation ez = a n’a pas de solution ;
• si a 6= 0, l’équation ez = a a une infinité de solutions, décrites par :
Re(z) = ln |a| et Im(z) ≡ arg(a) mod 2π.

III Racines d’un nombre complexe

III.1 Racines n-ièmes
Définition 8.3.1 (racines n-ièmes, groupe Un )

• Soit n ∈ N∗ et z ∈ C. Une racine n-ième de z est une racine (complexe) du polynôme X n − z,
donc un nombre complexe ω tel que ω n = z
• Une racine n-ième de l’unité est une racine n-ième de 1.
• L’ensemble des racines n-ièmes de l’unité est noté Un .
Nous verrons plus tard que cet ensemble Un possède une structure de groupe (notion définie plus tard).
Proposition 8.3.2 (Explicitation des racines de l’unité)

Le groupe Un des racines n-ièmes de l’unité est constitué de n éléments deux à deux distincts et donnés
par :
2πk
Un = {ωk = ei n , k ∈ [[0, n − 1]]}.
Les racines de 1 sont de module 1. On peut donc les rechercher sous la forme ei θ . Résoudre ei nθ = 1.
⊲
Ces racines se répartissent de façon régulière sur le cercle trigonométrique, de façon à former les sommets
d’un polygône régulier à n côtés (figure 8.3)
4iπ
e 7
2iπ
e 7
6iπ
e 7
0iπ
1=e 7
8iπ
e 7
12 i π
e 7
10 i π
e 7
Figure 8.3 – Répartition des racines de l’unité sur le cercle trigonométrique
Proposition 8.3.3 (racines n-ièmes de z, figure 8.4)

Soit z = rei θ un nombre complexe. Alors :
√ θ
(i) Une racine n-ième particulière de z est z0 = n
r · ei n
(ii) z possède exactement n racines n ièmes, données par :
ξk = z0 ω, ω ∈ Un ,
où ω0 , . . . , ωn−1 sont les racines n-ièmes de l’unité.

III Racines d’un nombre complexe 129
(iii) Ainsi, pour z = rei θ , on obtient la description explicite des racines n-ièmes :
√
r · ei ( ) , k ∈ [[0, n − 1]].
θ+2kπ
ξk = n n
De même, rechercher les racines sous la forme ρei ϕ . ⊲
+
z
z0
| | | |
p
1 7
|z|
|
Figure 8.4 – Répartition des racines de z dans le plan complexe
Proposition 8.3.4
P
n−1
Soit ω ∈ Un . Alors ω i = 0.
i=0
Formule de sommation des suites géométriques. ⊲
En particulier, puisque pour tout k ∈ [[0, n]], ωk = ω1k , on obtient :
Corollaire 8.3.5 (somme des racines n-ièmes de l’unité)

P
Soit n ∈ N∗ . Alors ω∈Un ω = 0
Corollaire 8.3.6 (somme des racines n-ièmes de z)

P
n−1
Soit {ξ0 , . . . , ξn−1 } l’ensemble des racines n-ièmes de z, alors ξk = 0.
k=0
Remarque 8.3.7
Ce résultat est un cas particulier des relations entre coefficients et racines d’un polynôme.
Notation 8.3.8 (Le complexe j)

2π
√
On note j la racine cubique de l’unité j = ei 3 = − 21 + i 3
2 .
Les racines cubiques de 1 sont donc 1, j et j 2 .
Proposition 8.3.9 (Propriétés de j)

(i) j 3 = 1, donc j n = j r , où r est le reste de la division de n par 3
(ii) j = j 2
(iii) j 2 + j + 1 = 0
Le point (ii) provient de jj = 1 ⊲
On peut également décrire les racines 6-ièmes de 1 à l’aide de j
Proposition 8.3.10 (racines 6-ièmes de 1)

Les racines 6-ièmes de 1 sont, par ordre croissant d’arguments positifs : 1, −j 2 , j, −1, j 2 , −j.
III.2 Cas des racines carrées : expression sous forme algébrique

Les racines carrées z peuvent être obtenues par la méthode général décrite ci-dessus, lorsqu’on connaît z
sous forme trigonométrique : Si z = rei θ , z possède deux racines carrées :
√ θ √ θ
z1 = rei 2 et z2 = − rei 2 .
Dans le cas particulier des racines carrées, on dispose également d’une méthode permettant d’obtenir
facilement l’expression algébrique des racines carrées de z lorsque z est donné lui-même sous forme
algébrique.
Méthode 8.3.11 (recherche des racines carrées sous forme algébrique)

Soit z = a + i b un nombre complexe sous forme algébrique (a, b ∈ R). Pour trouver les racines carrées
sous forme algébrique :
1. Considérer une racine z ′ = c + i d
2. Identifier les parties imaginaires et réelles dans l’égalité (z ′ )2 = z : en retenir essentiellement la
valeur de c2 − d2 et le signe de cd.
3. Donner l’égalité des modules de (z ′ )4 et de z 2 . Cela donne la valeur de c2 + d2 .
4. Résoudre le système en c2 et d2 donné par les équations ci-dessus.
5. Des quatre solutions pour le couple (c, d), garder les deux seules qui donnent le bon signe de cd.
On peut aussi s’en sortir sans utiliser l’égalité des modules, en constatant que l’étape 2 donne la valeur de
la somme et du produit de c2 et −d2 , donc une équation du second degré dont ces réels sont les solutions.
IV Nombres complexes et géométrie 131
Exemple 8.3.12
1. Rechercher les racines carrées de 3 + 5 i.
2. Trouver les solutions de l’équation du second degré : (2 + i)z 2 − i z + 1 = 0
La méthode de résolution ci-dessus montre que les racines (réelles ou complexes) d’un polynôme de degré
2 peuvent être exprimées à l’aide de radicaux (i.e. les parties réelles et imaginaires peuvent être exprimées
à l’aide des 4 opérations usuelles à partir des nombres rationnels, des coefficients de l’équation, et des
fonctions « racine » définies sur R+ , ici la racine carrée).

• La résolution d’équations polynomiales par radicaux a motivé une part importante de la recherche
mathématique, jusqu’à ce que Niels Abel prouve l’impossibilité de résoudre l’équation général du 5-ième
degré par radicaux. Peu de temps après, Évariste Galois élucide complètement le problème, dans un
mémoire rédigé peu avant sa mort prématurée en 1832, et dans une lettre rédigée à la hâte à un ami, la
veille du duel qui devait lui être fatal (il avait alors 20 ans). Dans ce mémoire, on y trouve en particulier
les balbutiements de la théorie des groupes.
• Carl Friedrich Gauss montre que les racines de X n − 1 (donc les racines n-ièmes de l’unité), peuvent
s’exprimer par radicaux si n est premier.
k
• Il va plus loin, en montrant que si n est un entier premier de la forme 22 + 1, alors les solutions peuvent
s’exprimer sous forme de radicaux carrés. Ce résultat amène la constructibilité à la règle et au compas
du pentagone (déjà connu depuis bien longtemps), de l’heptadécagone, i.e. le polygone à 17 côtés (Gauss
en donne une construction) puis des polygônes à 257 et 65537 côtés. On ne connaît pas à ce jour d’autre
k
nombre premier de la forme 22 + 1 (nombres de Fermat). On ne sait pas s’il y en a d’autres.
• Pierre-Laurent Wantzel montre la réciproque en 1837 : les seuls polygônes constructibles sont les poly-
k
gônes dont le nombre de côtés est un nombre premier de la forme 22 + 1, ou des nombres ayant comme
uniques facteurs (qui doivent être simples) ces nombres premiers ou 2 (en multiplicité quelconque). Ce
théorème est connu sous le nom de théorème de Gauss-Wantzel.
IV Nombres complexes et géométrie

IV.1 Affixes
Nous terminons cette étude des nombres complexes par un bref aperçu de l’efficacité de l’utilisation des
nombres complexes pour l’étude de la géométrie du plan. Nous rappelons que, par la construction que
nous avons donnée, C s’identifie au plan R2 . Nous rappelons :
Définition 8.4.1 (affixe)

1. L’affixe d’un point (a, b) ∈ R2 est le complexe zA = a + i b.
!
→
− a
2. L’affixe d’un vecteur u = de R2 est le complexe z→
u = a + i b.
−
b
On commence par traduire sous forme complexe certaines propriétés géométriques :
Proposition 8.4.2 (affixe d’un vecteur défini par un bipoint)

Soit A et B deux points d’affixe zA et zB . Alors z−
−→ = zB − zA
AB
Proposition 8.4.3 (norme d’un vecteur)

Soit −
→
u un vecteur de R2 d’affixe z→ →
−
− . Alors k u k = |z→
u − |. u
IV.2 Alignement, orthogonalité, angles
Proposition 8.4.4 (Expression complexe du déterminant et du produit scalaire)

Soit zu = a + i b et zv = c + i d. Alors
(i) ℜ(zu zv ) = h−
→u ,−
→
v i (produit scalaire canonique)
!
a c
→
− →
−
(ii) Im(zu zv ) = det( u , v ) = = ad − bc (déterminant)
b d
Expliciter zu zv . ⊲
Proposition 8.4.5 (traduction de l’alignement, de l’orthogonalité)

Avec les notations sous-entendues évidentes :
1. −→
u et −
→v sont colinéaires si et seulement si Im(zu zv ) = 0.
2. A, B et C sont alignés si et seulement si Im((zC − zA )(zC − zB )) = 0.
3. −
→
u et →
−
v sont orthogonaux si et seulement si Re(zu zv ) = 0.
1. Sauf dans le cas trivial où v = 0, cela équivaut à dire que zzuv est réel.
−→ −−→
2. A, B et C sont alignés si et seulement si AC et BC sont colinéaires.
3. C’est la définition (via le produit scalaire) de l’orthogonalité.
Remarque 8.4.6
Si −
→v est non nul, il est parfois plus commode de caractériser la colinéarité par le fait que zu
zv est réel,
et l’orthogonalité par le fait que zzuv est imaginaire.
b−a
Proposition 8.4.7 (interprétation géométrique de c−a
.)
Soit a, b et c trois complexes, et A, B et C les points de R2 d’affixe a, b et c. Alors

b−a −→ −−→
arg = (AC, AB)
c−a
L’écrire en notation trigonométrique. ⊲
IV.3 Transformations du plan

Enfin, les transformations usuelles du plan peuvent être traduites par des fonctions simples de C dans C,
ce qui simplifie souvent leur étude ou leur utilisation.
Proposition 8.4.8 (Interprétation complexe des transformations usuelles du plan)

1. Soit −
→u un vecteur du plan, d’affixe zu . La translation de vecteur −
→
u correspond dans C à la
fonction z 7→ z + zu .
2. Soit A un point du plan, d’affixe zA , et θ un réel. La rotation de centre A et d’angle θ (dans le
sens trigonométrique, ou direct) correspond dans C à la fonction z 7→ zA + ei θ (z − zA ).
3. Soit A un point du plan, d’affixe zA , et λ un réel. L’homothétie de centre A et de rapport λ
correspond dans C à la fonction z 7→ zA + λ(z − zA ).
4. Soit D une droite passant par le point A d’affixe z , et de vecteur directeur unitaire −
A
→
u , d’affixe
zU . La symétrie orthogonale d’axe D (ou reflexion d’axe D) est donnée par la fonction z 7→
zu2 (z − zA ) + zA
Si on note M le point d’affixe z et M ′ le point d’affixe ϕ(z), en vertu des réultats précédents :
−−−→ →
1. M M ′ = −u;
2. kAM ′ k = kAM k, et l’angle entre les deux vecteurs est l’argument du quotient des affixes ;
−−→ −−→
3. AM ′ = λAM ;
4. Si θ est l’argument de zu , faire une rotation d’angle −θ nous ramène à une symétrie d’axe
−→
horizontal, et si on translate encore de −OA cette symétrie correspond à la conjugaison. Quelle
′
z − zA z − zA
relation cela donne-t-il entre et ?
zu zu
⊲
Remarquez dans le 4 qu’on a supposé que − →
u est unitaire, donc que zu est de la forme ei θ . Ainsi, la
multiplication par zu correspond à une rotation qui nous ramène à un axe horizontal. Si cet axe passe
par 0, la symétrie correspond alors à la conjugaison (ce qui fait partir la barre du coefficient multiplicatif
zu ).
Attention, le caractère unitaire de −
→
u est important ici.
Remarque 8.4.9 (Forme des applications associées aux transformations usuelles)

Les transformations usuelles étudiées ci-dessus s’écrivent toutes sous la forme z 7→ az + b ou z 7→ az + b.
On montre que réciproquement une application de ce type correspond à une transformation usuelle, ou
une composée de transformations usuelles du plan :
Théorème 8.4.10 (Interprétation des transformations affines de C)

(i) Soit ϕ : z 7→ az + b, a 6= 0. Alors :
• Si a = 1, ϕ représente une translation ;
• Si a = λei θ 6= 1, il existe un point A tel que ϕ représente la composée d’une rotation d’angle
θ de centre A et d’une homothétie de rapport λ de même centre A.
θ
(ii) Soit ϕ : z 7→ az + b, a = λei θ 6= 0 et u = ei 2 . Alors ϕ représente la composée d’une symétrie
d’axe D porté par u et passant par A, d’une translation de vecteur αu, α ∈ R (un glissement le
long de la droite D) et d’une homothétie de centre O de rapport λ.
(i) si a 6= 1, mettre sous la forme ϕ(z) − zA = λei θ (z − zA ). Cette équation détermine zA en

fonction de a et b.
(ii) L’homothétie étant appliquée en dernier, on est ramené à la description de z 7→ z ′ = zu2 z + λb .

Chercher à la mettre sous la forme z ′ = zu2 (z − zA ) + zA + zv , où v est colinéaire à u. En
comparant les deux expressions, et en exprimant la condition de colinéarité, on obtient une
condition sur la partie imaginaire de zA zu , et on peut décider de choisir la partie réelle nulle.
Méthode 8.4.11
Il faut savoir retrouver, sur des formes explicites, les points A, vecteurs u etc., en utilisant la démarche
suggérée dans la démonstration.
En particulier, cette représentation des transformations usuelles du plan est efficace pour exprimer des
composées :
Lemme 8.4.12 (Composée d’applications affines)

• Soit ϕk : z 7→ ak z + bk , k ∈ [[1, n]]. Alors la composée ϕ = ϕn ◦ · · · ◦ ϕ1 est de la forme z 7→ az + b,
où a = a1 . . . an
• Si un nombre N des ϕk sont de la forme z 7→ ak + zbk , on obtiendra une composée z 7→ az + b
si le nombre N est pair, et z 7→ az + b s’il est impair. Mais le coefficient a est un peu plus
délicat à exprimer de façon générale en fonction des ai (mais sans difficulté dans l’étude de cas
particuliers).
Récurrence sur n. ⊲
En particulier, en combinant les deux résultats précédents, on obtient :
Proposition 8.4.13 (composition de rotations, translations et homothéties)

Toute transformation obtenue par composition de translations, de rotations (d’angle total θ), et d’ho-
mothéties (dont le produit des rapports est λ) est
• soit la composition d’une rotation d’angle θ et d’une homothétie de rapport λ si λei θ 6= 1,
• soit une translation si λei θ = 1.
IV.4 Isométries et similitudes
Définition 8.4.14 (isométries et similitudes)

Soit F : R2 −→ R2 une application.
1. On dit que F est une isométrie affine si F conserve les longueurs, donc si pour tout (A, B) ∈
(R2 )2 , kF (A)F (B)k = kABk. Cela se traduit par une application ϕ : C → C vérifiant |ϕ(z2 ) −
ϕ(z1 )| = |z2 − z1 | pour tous z1 et z2 .
2. On dit que F est une isométrie vectorielle si F est une isométrie affine telle que F (O) = O, où
O = (0, 0).
3. On dit que F est une similitude affine s’il existe λ ∈ R∗+ tel que pour tout (A, B) ∈ (R2 )2 ,
kf (A)f (B)k = λkABk, ce qui se traduit par |ϕ(z2 ) − ϕ(z1 )| = λ|z2 − z1 |
4. On dit que F est une similitude vectorielle si F est une similitude affine telle que F (O) = O.
Lemme 8.4.15 (Composée de similitudes ou d’isométries)

La composée de deux similitudes affines de rapports λ et λ′ est une similitude affine de rapport λλ′ ,
vectorielle si les deux le sont. En particulier, la composée de deux isométries est une isométrie.
Les rotations, translations et symétries étant des isométries, et les homothéties des similitudes, il vient
de l’étude précédente et des propriétés de composition que :
Théorème 8.4.16 (Les z 7→ az + b ou az + b sont des similitudes)

Les applications z 7→ az + b et z 7→ az + b correspondent à des similitudes, qui sont des isométries si
de plus |a| = 1
On étudie maintenant la réciproque, en commençant par le cas vectoriel
Théorème 8.4.17 (Les similitudes vectorielles sont des z 7→ az ou az)

Soit ϕ l’application associée à une similitude vectorielle, et a = ϕ(1). Alors ϕ : z 7→ az ou ϕ : z 7→ az.
De plus, ϕ est une isométries si et seulement si |a| = 1.
Fixer un z0 non réel. En utilisant le fait que les triangles définis par 0, 1, z0 et 0, a, ϕ(z0 ), sont
semblables, en déduire que ϕ(z0 ) = az0 ou ϕ(z0 ) = az0 . Conclure en faisant de même pour z
quelconque et en considérant aussi la distance de ϕ(z) à ϕ(z0 ). ⊲
Ainsi, on peut de façon naturelle classer les isométries et les similitudes en deux catégories :
Définition 8.4.18 (isométrie, similitude directe, indirecte)

• Une isométrie (resp. similitude) vectorielle de type z 7→ az est appelée isométrie (resp. similitude)
directe. Il s’agit des rotations (resp. homothéties-rotations).
• Une isométrie (resp. similitude) vectorielle de type z 7→ az est appelée isométrie (resp. similitude)
indirecte.
En remarquant que ϕ est une similitude affine ssi ϕ − ϕ(0) est une similitude vectorielle, on obtient alors :
Proposition 8.4.19 (Caractérisation des isométries et des similitude affines directes)

Les similitudes affines de R2 correspondent exactement aux applications complexes f : z 7→ az + b ou
f : z 7→ az + b, a ∈ C∗ , b ∈ C ; ce sont des isométries ssi |a| = 1.
On définit de même que dans le cas vectoriel les isométries et similitudes affines directes et indirectes.
Exemple 8.4.20
À quelles isométries correspondent les applications z 7→ z et z 7→ i z ?
IV.5 Caractérisation de certains objets géométriques
Proposition 8.4.21 (Caractérisation des droites)

La droite passant par A d’affixe a et B d’affixe b est l’ensemble constitué des points M d’affixe z tels
que l’une des propriétés équivalentes suivantes soit vérifiée :
(i) il existe t ∈ R tel que z = (1 − t)a + tb

(ii) z = a, ou z 6= a et arg(z − a) ≡ arg(b − a) [π]
z−a
(iii) ∈ R.
b−a
−−→ −−→
Exprimer la colinéarité de AM et AB. ⊲
Proposition 8.4.22 (Caractérisation des cercles)

Un sous-ensemble C de C est un cercle éventuellement vide si et seulement si il existe un complexe α
et un réel β tels que C soit l’ensemble des points d’affixe z vérifiant :
z · z + αz + α · z + β = 0.
L’ensemble C est dans ce cas non vide si et seulement si β 6 αα et dans ce cas, son centre est le point
√
d’affixe −α et son rayon est r = αα − β.
Écrire cette équation sous la forme (z + a)(z + α) = ρ. ⊲
Méthode 8.4.23
Il est inutile de retenir l’expression de l’affixe du centre et du rayon. Il faut en revanche être capable
de les retrouver rapidement en faisant la factorisation précédente.

coursMPSI Fondements

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

coursMPSI Fondements

Transféré par

Droits d'auteur :

Formats disponibles

Lycée Louis-Le-Grand, Paris Année 2016/2017

II.5 Partie entière, partie décimale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

8 Le corps C des complexes 115

Ce cours est l’aboutissement de plusieurs années d’enseignement en MPSI au lycée Louis-Le-Grand. Il

La logique est la jeunesse des mathématiques

La logique est l’hygiène des mathématiques

La logique n’a ni à inspirer l’invention, ni à l’expliquer ; elle se contente de la contrôler et de

Définition 1.1.1 (Formule propositionnelle)

Exemple 1.1.2 (Formules propositionnelles)

Définition 1.1.3 (Définition de l’interprétation sémantique des connecteurs logiques)

Ces tables définissent en fait le sens logique des connecteurs.

Définition 1.1.6 (Formules équivalentes)

Définition 1.1.7 (Tautologie)

Définition 1.1.8 (Quantificateurs)

Propriétés 1.1.9 (Négation d’une formule)

Propriétés 1.1.10 (Négation des quantificateurs)

I.4 Quelques équivalences et tautologies formant la base du raisonnement

Propriétés 1.1.13 (Quelques équivalences entre formules)

Proposition 1.1.14 (Quelques tautologies)

Propriétés 1.1.15 (Interversion de quantificateurs)

Propriétés 1.1.18 (Règles de distributivité)

Propriétés 1.1.21 (Quantification d’une implication)

II.2 Comment construire une démonstration

∀x, (A(x) =⇒ ∀y, (B(y) ∨ ∃zC(z)).

Nous voyons maintenant un certain nombre de méthodes classiques de démonstration.

II.3 Le Modus ponens.

Méthode 1.2.5 (Modus ponens)

On vérifie donc l’hypothèse A, l’implication A =⇒ B, et on conclut que la conclusion B est vraie.

Méthode 1.2.8 (Transitivité de l’implication)

A ∧ (A =⇒ A1 ) ∧ (A1 =⇒ A2 ) ∧ · · · ∧ (An−1 =⇒ An ) ∧ (An =⇒ B) =⇒ B.

II.4 Démonstration par la contraposée.

Méthode 1.2.9 (Démonstration par contraposée)

Définition 1.2.10 (Contraposée)

Ce type de démonstration apparaît dans de nombreuses situations.

Méthode 1.2.13 (Cas particulier : démonstration par l’absurde)

II.5 Disjonction des cas.

Méthode 1.2.15 (Disjonction des cas)

Un cas particulièrement important est le cas où A ∨ B est la proposition certaine (A et B regroupe

Méthode 1.2.16 (Démonstration par discussion)

Méthode 1.2.19 (Analyse-synthèse)

II.7 Raisonnement par récurrence

[P(0) ∧ (∀n ∈ N, (P(n) =⇒ P(n + 1))] =⇒ (∀n ∈ N, P(n))

Méthode 1.2.25 (Démonstration par récurrence simple)

Ce principe peut s’adapter à des situations légèrement différentes :

Exemple 1.2.29 (Le problème des crayons de couleur)

Figure 1.1 – Caractère héréditaire pour le problème des crayons de couleur

Méthode 1.2.30 (Récurrence d’ordre k)

((P(0) ∧ · · · ∧ P(k − 1)) ∧ (∀n ∈ N, P(n) ∧ · · · ∧ P(n + k − 1) =⇒ P(n + k))) =⇒ ∀n ∈ N, P(n).

• Principe : on utilise la propriété aux k rangs précédents pour montrer l’hérédité.

∀(m, n) ∈ (N∗ )2 , Fm∧n = Fm ∧ Fn ,

Méthode 1.2.33 (Récurrence forte)

(P(0) ∧ (∀n > 1, P(0) ∧ · · · ∧ P(n − 1) =⇒ P(n))) =⇒ ∀n ∈ N, P(n).

II.8 Principe de la descente infinie

Méthode 1.2.37 (Descente infinie)

Note Historique 1.2.40

(David Hilbert, à propos de la théorie de Cantor)

I Théorie intuitive des ensembles

Définition 2.1.1 (Ensemble, point de vue intuitif )

Note Historique 2.1.3

Il existe plusieurs façons de décrire un ensemble

Définition 2.1.4 (Définitions d’ensembles)

Quelques définitions supplémentaires :

Définition 2.1.8 (Sous-ensemble)