Vous êtes sur la page 1sur 63

Notions de logique mathématique

Tim Van der Linden


Version du 19 mai 2013.
CHAPITRE 1

Introduction

1. Les paradoxes, et comment les éviter


1.1. Que sont les caractéristiques essentielles de la mathématique ?
Si on se demande, ou si on demande à quelqu’un, de décrire en quelques mots-clés
ce que c’est la mathématique, que sont ses propriétés et caractéristiques essentielles,
la réponse ne serait probablement pas très loin de la liste suivante :
– difficile
– incompréhensible,
et puis
– rigoureux
– précis
– correct
– formel
– il s’agit de vérités universelles,
etc. Certainement on a l’idée en tête que dans la mathématique il y a une certaine ri-
gueur. Si chaotique qu’est le monde, au moins dans les maths les raisonnements sont
corrects et précis. Peut-être nous-mêmes ne sont pas capables d’écrire une preuve
vraiment formellement correcte, mais sans doute il y a des gens qui comprennent
comment le faire.
Le but de ce cours est de donner une introduction à la rigueur dans la mathé-
matique, en étudiant les notions de base de la logique et de la théorie des ensembles.
On se posera aussi la question si la réalité est vraiment si simple : est-ce vraiment
possible de formaliser les raisonnements mathématiques ? On verra qui oui, il y a
des problèmes fondamentaux avec ce projet de formalisation, et oui, (jusqu’à un
certain point) il y a des solutions.
1.2. Des problèmes fondamentaux ? On croit qu’au moins dans les maths,
tout ce qu’on peut dire est ou bien vrai, ou bien faux. Mais comment éviter que
la mathématique contient des paradoxes, comment être certain qu’elle ne contient
pas de contradictions ? Un simple jeu de mots comme le paradoxe du menteur
« Cette phrase est fausse »
(Épiménide le Crétois, IVe siècle av. J.-C.) ou sa variation
« Tous les Crétois sont des menteurs »
a des conséquences sérieuses pour la mathématique dans la forme du paradoxe
de Russell (1905). Acceptons pour le moment la définition plutôt intuitive d’un
ensemble comme un « regroupement dans un tout d’objets bien distincts de notre
intuition ou de nos pensées ». Si maintenant
Y “ tX | X est un ensemble, X R Xu
est aussi un ensemble, alors Y P Y ou Y R Y . Donc
– si Y P Y aussi Y R Y par définition de Y ,
– si par contre Y R Y , alors Y P Y :
on trouve une contradiction. Qu’est-ce alors un ensemble ?
3
4 1. INTRODUCTION

1.3. Éviter les paradoxes. Pour éviter ce genre de problème on a besoin


d’une formalisation assez rigide de la mathématique, d’une théorie formelle de la
vérité (la logique). Comme nous sommes des mathématiciens, notre exemple sera
la théorie des ensembles.
Dans le chapitre 2 on pousse la notion d’ensemble vers ses limites : on étudie
le travail de Cantor sur l’infinité, c’est à dire, les théories des ordinaux et des
cardinaux, pour voir exactement où une approche trop naïve aux ensembles cause
des problèmes.
Ces problèmes sont alors résolus dans le chapitre 3 en suivant une approche
axiomatique. Hélas, la théorie axiomatique des ensembles a ses propres soucis. Com-
ment savoir si elle est libre de contradictions ? Et comment prouver qu’elle est assez
riche pour contenir la mathématique entière ?

2. Bibliographie
[1] E. Colebunders, Wiskundige methodenleer. Fundamenten van de Wiskunde, Vrije Universiteit
Brussel, 2000
[2] K. J. Devlin, Fundamentals of Contemporary Set Theory, Springer, 1979
[3] K. Hrbacek, K. T. Jech, Introduction to Set Theory, 3rd Edition, Marcel Dekker, 1999
[4] T. Lucas, I. Berlanger, I. De Greef, Initiation à la logique formelle, De Boeck, 2003

Ce texte est basé sur les notes du cours [1]. Les autres références de base sont [2]
et [3] pour la théorie, [4] pour les exercices, et Wikipédia un peu pour tout.
CHAPITRE 2

La théorie naïve des ensembles : les ordinaux et les


cardinaux

1. Introduction
Ce sont des problèmes dans la mathématique elle-même (plus précisément,
en analyse) qui à la fin du XIXe siècle mènent vers l’invention de la théorie des
ensembles. Là où auparavant on ne considérait que des ensembles finis, naissait
le besoin d’admettre aussi des ensembles infinis dans la formulation de certains
théorèmes en analyse. Déjà dans le travail de Bolzano, et plus tard dans le travail
de Cantor sur les séries trigonométriques, il devenait nécessaire de considérer des
parties infinies de R.
En 1872 Cantor publie un travail de pionnier sur la théorie des ensembles. La
définition d’un ensemble infini, l’équipotence de Q et N, la non-équipotence de R
et N, l’équipotence de Rn et R sont toutes de sa main. Toute la construction des
théories des ensembles ordonnés et bien ordonnés, de la cardinalité, du principe
de l’induction transfinie sont dus à Cantor. On développera cette théorie dans le
chapitre présent.
En conséquence du travail innovateur de Cantor, au début du XXe siècle la
théorie des ensembles devient la fondation des mathématiques. Les nombres naturels
sont dorénavant définis en termes d’ensembles, et les axiomes de Peano peuvent être
déduits.
En outre, le développement de la théorie des ensembles stimulait la naissance
de structure mathématiques abstraites comme les espaces métriques, topologiques
ou vectoriels, les groupes, les structures ordonnés, les espaces de Hilbert et de
Banach, etc. Les résultats de Cantor sur l’induction transfinie ont des conséquences
profondes pour l’analyse.
Il y a deux problèmes que Cantor ne pouvait pas résoudre et qui sont intéres-
sants pour nous :
– la question si tout ensemble peut être bien ordonné ;
– la question si toute partie infinie de R qui n’est pas équipotente à N est
équipotente à R même.
On verra que la première est liée à l’axiome du choix et au lemme de Zorn, et la
réponse positive sur la deuxième est connue comme l’hypothèse du continu.

2. Comment comparer deux ensembles ?


On introduit la notion d’équipotence de deux ensemble en termes de bijections
et, plus généralement, on comparait leurs tailles en utilisant des injections. On
apprendra à compter les éléments d’un ensemble (à déterminer des représentants
pour les classes d’équipotence) en section 6, en passant d’abord par la théorie des
ordinaux (sections 3–5). Dans ce chapitre la notion d’ensemble reste intuitive.
Définition 2.1. Une paire pX, ďq est un ensemble partiellement ordonné
quand ď est une relation réflexive, transitive et antisymétrique sur l’ensemble X.
Réflexive: pour tout x P X, x ď x
5
6 2. LA THÉORIE NAÏVE DES ENSEMBLES : LES ORDINAUX ET LES CARDINAUX

p´1, 1q lr p0, 1q lr p1, 1q LR


LR


p´1, 0q p0, 0q ,2 p0, 1q p0, 2q
LR


p´1, ´1q ,2 p0, ´1q ,2 p1, ´1q ,2 p2, ´1q

Figure 1. L’ensemble Z ˆ Z est dénombrable

Transitive: pour tout x, y, z P X, si x ď y et y ď z alors x ď z


Antisymétrique: pour tout x, y P X, si x ď y et y ď x alors x “ y
Une paire pX, ăq est un ensemble strictement ordonné quand ă est une relation
transitive et asymétrique sur l’ensemble X.
Asymétrique, fortement antisymétrique: pour tout x, y P X, si x ă y
alors y ć x.
Les ordres partiels sur un ensemble X correspondent bijectivement aux ordres
stricts : on peut toujours choisir x ď y ssi x ă y ou x “ y, et inversement x ă y ssi
x ď y et x ‰ y. On interchangera donc librement les deux genres de structure.
Une paire pX, ďq est un ensemble totalement ordonné quand ď est un ordre
partiel sur X dans lequel deux éléments quelconques sont toujours comparables :
pour tout x, y P X, x ď y ou y ď x. Un ordre total a la géométrie d’une ligne
(possiblement finie, bornée ou très longue) : un point est toujours à gauche ou à
droite d’un autre.
Exemples 2.2. (1) N, Z, Q et R avec l’ordre habituel sont totalement
ordonnés.
(2) Nous écrivons PpXq pour l’ensemble tY | Y Ď Xu des sous-ensembles
de X. Alors la paire pPpXq, Ďq est toujours un ensemble partiellement
ordonné, mais cet ordre partiel n’est pas total dès que X a deux éléments.
Définition 2.3. Une relation R sur un ensemble X est une relation d’équi-
valence quand elle est réflexive, transitive et symétrique :
Symétrique: pour tout x, y P X, si xRy alors yRx.
La classe d’équivalence de x P X est l’ensemble Rx “ ty P X | yRxu.
Définition 2.4. Soient X et Y des ensembles. X est équipotent avec Y (on
écrit X « Y ) s’il y existe une bijection de X vers Y . Cette relation « est une relation
d’équivalence sur la classe SET de tous les ensembles. La classe d’équivalence d’un
ensemble X s’écrit X, donc
X «Y ôX “Y.
On écrit X ď Y s’il y existe une injection de X dans Y . Cette définition est
clairement indépendante de la choix des représentants. (Montrez-le !)
Exemples 2.5. (1) N « Z : on a, par exemple, la bijection
#
k, si n “ 2k
N Ñ Z : n ÞÑ
´k, si n “ 2k ` 1.
(2) N « Z ˆ Z : on dénombre les éléments de Z ˆ Z comme indiqué dans
figure 1.
2. COMMENT COMPARER DEUX ENSEMBLES ? 7

A0

B0
A1
B1

Figure 2. Les ensembles C (gris) et D (blanc) dans la preuve de proposition 2.6

(3) Z ď Q car Z Ă Q.
(4) Q ď Z ˆ N car on a l’injection
p
Q Ñ Z ˆ N: ÞÑ pp, qq
q
où p, q P Z sont relativement premiers et q est positif.
(5) Q ď R car Q Ď R. On montrera plus tard (dans exemple 2.10) que l’inéga-
lité est stricte.
(6) R « s ´ π2 , π2 r : la tangente définit une bijection tan : s ´ π2 , π2 r Ñ R.
(7) s´1, 1r « s´ π2 , π2 r : on peut prendre sin : s´ π2 , π2 r Ñ s´1, 1r ou la function
x ÞÑ 2x
π .
(8) Étant donné un ensemble X, on écrit PpXq pour l’ensemble des sous-
ensembles de X, donc
PpXq “ tY | Y Ď Xu,
et 2X pour l’ensemble des fonctions X Ñ 2 “ t0, 1u. On a PpXq « 2X , car
tout sous-ensemble Y de X est complètement déterminé par sa fonction
caractéristique
#
1, si x P Y
δY : X Ñ 2 : x ÞÑ
0, si x R Y .

La question si ď définit un ordre partiel sur les classes d’équivalence de «


est restée ouverte assez longtemps. Pour montrer l’antisymétrie on a besoin d’un
résultat intermédiaire.
Proposition 2.6 (Schröder–Bernstein). Si A1 Ď B Ď A sont des ensembles
et f : A Ñ A1 est une bijection, il existe une bijection g : A Ñ B.

Démonstration. On pose A0 “ A et An`1 “ f pAn q pour n P N quelconque,


B0 “ B et Bn`1 “ f pBn q. Alors A Ťn`1 Ď Bn Ď An pour tout n. Pour tout n on
8
pose Cn “ An zBn , et on écrit C “ n“0 Cn , D “ AzC. (Voir figure 2.) Maintenant
on définit #
f pxq, si x P C
g : A Ñ A : x ÞÑ
x, si x P D :
8 2. LA THÉORIE NAÏVE DES ENSEMBLES : LES ORDINAUX ET LES CARDINAUX

Y gpY q
X f pXq gpf pXqq
f g

Figure 3. X, f pXq et gpf pXqq « X

la zone blanche reste sur place, la zone grise bouge un pas vers l’intérieur. Ce g est
certainement injectif, car f et 1D sont des injections et leurs images sont disjoints.
On montre que gpAq “ B :
ď8 ď8 ď8 ď8 ď8
f pCq “ f pCn q “ f pAn zBn q “ An`1 zBn`1 “ Cn`1 “ Cn
n“0 n“0 n“0 n“0 n“1
et 1D pDq “ D. 
Proposition 2.7 (Cantor–Bernstein). Soient X et Y des ensembles. S’il existe
une injection de X dans Y et une injection de Y dans X alors il existe une bijection
entre X et Y , c’est à dire, la relation ď est antisymétrique.
Démonstration. Soient f : X Ñ Y et g : Y Ñ X deux injections. Alors
g ˝f : X Ñ X
est une injection et gpf pXqq Ď gpY q Ď X. Bien sûr g ˝f est bijectif sur son image
gpf pXqq—voir figure 3. Proposition 2.6 nous donne une bijection X Ñ gpY q. L’in-
verse de la co-restriction de g à son image forme une bijection gpY q Ñ Y .
g˝f

 «
,2 gpY q lr
«
gpf pXqq ,2 X
Ď LR Ď

g|gpY q «
f

 y
Y
Leur composée est une bijection X Ñ Y . 
On conclut que ď est un ordre partiel. Une question naturelle est, si cet ordre
est total : étant donné deux ensembles X et Y , a-t-on toujours X ď Y ou Y ď X ?
La réponse classique (proposition 6.7) dépend de l’axiome du choix, qui implique
que chaque ensemble peut être bien ordonné (chapitre 3, proposition 7.9).
Exemples 2.8. (1) Q « N car N ď Z ď Q ď Z ˆ N ď Z ˆ Z “ N comme
expliqué dans les exemples 2.5.
(2) r0, 1s « s ´ 1, 1r car r0, 1s Ď s ´ 2, 2r donc r0, 1s ď s ´ 2, 2r “ s ´ 1, 1r , et
s ´ 1, 1r ď r0, 1s car
s ´ 1, 1r Ď r´1, 1s « r0, 2s « r0, 1s.

Étant donné un ensemble, il existe toujours un ensemble plus grand.


Proposition 2.9 (Théorème de Cantor). Si X est un ensemble, alors X ă
PpXq, c’est à dire qu’il y a une injection X Ñ PpXq mais il n’y a pas de bijections.
3. LES ENSEMBLES BIEN ORDONNÉS 9

Démonstration. La fonction t¨u : X Ñ PpXq : x ÞÑ txu est clairement injec-


tive. Supposons qu’il y existe une bijection f : X Ñ PpXq. On pose

A “ tx P X | x R f pxqu.

Ce A P PpXq et donc Da P X : f paq “ A.


Si a P A, alors a R f paq “ A. Si, par contre, a R A, alors a P f paq “ A : une
contradiction. 

Exemple 2.10. Comme annoncé dans exemple (5) de 2.5, l’inégalité dans Q ă R
est stricte. Pour voir que
N ă PpNq “ R,
par les résultats précédents il suffit de monter que 2N « r0, 1s. En effet, 2N « PpNq
par exemple (8) de 2.5 et R « r0, 1s par exemples (6) et (7) de 2.5 combiné avec
exemple (2) de 2.8.
On montre que 2N ď r0, 1s et r0, 1s ď 2N pour ensuite utiliser proposition 2.7.
Considérons les éléments de 2N comme des séquences pxn qnPN dans t0, 1u. Étant
donné une telle séquence de zéros et de uns, on peut la voir comme l’expan-
sion décimale d’un nombre réel dans l’intervalle r0, 1s. Par exemple, la séquence
1010101010 . . . ou, plus précisément,
#
1, si n est pair
pxn qn : N Ñ 2 : n ÞÑ xn “
0, si n est impair

représente le nombre
10
0, 10101010101010 ¨ ¨ ¨ “ .
99
(Les incrédules vérifieront que le nombre x “ 0, 101010101010 . . . est une solution de
l’équation 100x ´ x “ 10.) Ceci définit une injection 2N Ñ r0, 1s. Réciproquement,
tout nombre de l’intervalle r0, 1s a une expansion binaire, donc peut être représenté
comme une suite de zéros et uns, donc comme un élément de 2N . Ceci définit une
injection r0, 1r Ñ 2N .
(Ici il faut faire attention car les expansions binaires (ou décimales) ne sont pas
toujours uniques ; mais il suffit de choisir la plus petite dans l’ordre lexicographique
pour définir une fonction. Par exemple,
1
0, 0111111 ¨ ¨ ¨ “ 2 “ 0, 100000 ¨ ¨ ¨

et on choisit la première représentation.)

3. Les ensembles bien ordonnés


3.1. Comment compter les éléments d’un ensemble ? Notre but ultime
ici est de choisir des représentants pour les classes d’équivalence de la relation
« équipotence » entre ensembles. Quand on compte les éléments d’un ensemble fini
ou dénombrable X on les numérote (figure 4). Ce numérotage transporte l’ordre de
l’ensemble t0, . . . , nu ou de N vers l’ensemble X. Donc dans l’exemple, ¨ ă ‚ ă ˝ ă ‹
est l’ordre sur X induit par le numérotage choisi. (Bien sûr d’autres choix sont
possibles !) C’est dans ce sens-là que les ensembles t0, . . . , nu ou N représentent des
classes d’ensembles finis ou dénombrables. On va étendre ce principe à tous les
ensembles.
10 2. LA THÉORIE NAÏVE DES ENSEMBLES : LES ORDINAUX ET LES CARDINAUX

X
1
‚ 3
0 ‹
¨ 2
˝

Figure 4. Numéroter un ensemble de quatre éléments X “ t¨, ‚, ˝, ‹u

t0, 1, 2u

t0, 1u t0, 2u t1, 2u

t0u t1u t2u

Figure 5. L’ensemble ordonné pX, ďq “ pPpt0, 1, 2uq, Ďq et son


sous-ensemble Y “ XztHu

3.2. Minimum, minimal, minorant. Soit pX, ďq partiellement ordonné et


Y Ď X. Alors m P Y est un minimum de Y quand @y P Y : m ď y. Donc en
particulier, m est en relation avec tout élément de l’ensemble Y . Un minimum, s’il
existe, est forcément unique. Dans l’exemple de figure 4, ¨ est le minimum de X
et ‚ est le minimum de t‚, ‹u Ď X.
Un élément m P Y est minimal dans Y quand
@y P Y : y ď m ñ y “ m.
S’il existe, un minimum est toujours minimal, mais en général plusieurs éléments
de Y peuvent être minimaux. Considérons l’exemple donné dans figure 5. L’en-
semble ordonné X a un minimum (l’élément H), tandis que le sous-ensemble or-
donné Y “ XztHu a trois éléments minimaux (les singleton t0u, t1u et t2u) au
lieu d’un minimum. Par contre, si pX, ďq est totalement ordonné, alors pour tout
Y Ď X et m P Y ,
m est minimum ô m est minimal.
Un élément m P X est un minorant de l’ensemble Y quand @y P Y : m ď y.
Donc m n’est pas forcément dans Y ou unique.
Les notions maximum, maximal et majorant sont définies de façon duale.
Définition 3.3. Un ensemble partiellement ordonné pX, ďq est bien ordonné
(ď est un bon ordre) quand tout sous-ensemble non-vide de X a un minimum.
Exemples 3.4. (1) Étant donné un ensemble X, la paire pPpXq, Ďq de 2.2
n’est pas bien ordonnée dès que X a deux éléments.
(2) Les paires pR, ďq et pQ, ďq sont totalement ordonnées mais ne sont pas
bien ordonnées.
3. LES ENSEMBLES BIEN ORDONNÉS 11

¨¨¨ ¨¨¨

0 1 2 n n`1

Figure 6. Une chaîne de dominos prête à tomber

(3) Les ensembles ordonnés pt0, . . . , n ´ 1u, ďq et pN, ďq sont bien ordonnés,
ainsi que 2N avec l’ordre induit, et N Y t8u où @n P N : n ă 8.
(4) L’ensemble vide H avec son ordre canonique est bien ordonné.
Remarquons qu’un sous-ensemble d’un ensemble bien ordonné, muni de l’ordre
induit, est toujours bien ordonné.
Proposition 3.5. Soit pX, ďq un ensemble partiellement ordonné. Alors les
conditions suivantes sont équivalentes :
(1) pX, ďq est bien ordonné ;
(2) pX, ďq est totalement ordonné et tout sous-ensemble non-vide de X a un
élément minimal ;
(3) pX, ďq est totalement ordonné et il n’y a pas de séquences strictement
descendantes dans X.
Démonstration. (1) ñ (2) parce que toute paire tx, yu dans X a un mini-
mum, c’est à dire que x ď y ou y ď x.
(2) ñ (1) car dans un ensemble totalement ordonné tout élément minimal est
un minimum.
(2) ñ (3) par sa contraposée (3) ñ (2) : on suppose que pX, ďq est totale-
ment ordonné et pxn qnPN est une séquence strictement descendante
x0 ą x1 ą ¨ ¨ ¨ ą xn ą ¨ ¨ ¨
dans X. Alors Y “ tx0 , x1 , . . . , xn , . . .u n’a pas d’élément minimal.
(3) ñ (2) via (2) ñ (3) : soit pX, ďq totalement ordonné et Y Ď X, Y ‰ H,
sans élément minimal. On choisit x0 P Y et on prend x1 P Y tel que x0 ą x1 .
Après avoir choisi x0 , . . ., xn on prend xn`1 P Y tel que xn ą xn`1 . Alors la
séquence x “ pxn qnPN définie de telle manière inductive est strictement descendante
dans pX, ďq. 

3.6. Le principe d’induction mathématique. On démontrera plus tard


(dans le chapitre 3, proposition 5.8) qu’en effet, des constructions « par induction »
comme celle de la séquence pxn qnPN sont valides, c’est à dire que cette séquence est
bien une fonction x : N Ñ X : n ÞÑ xn dans le sens formel.
Rappelons-nous ce principe classique qui n’est rien d’autre que l’effet domino.
Soit P pnq une propriété qui dépend d’un nombre naturel n : un prédicat avec une
variable n P N. Par exemple on peut considérer la chaîne de dominos dans figure 6
et prendre
P pnq “ « domino numéro n tombe (vers la droite) ».
Ou bien on prend
n
Qpnq “ « d
dx px q “ nxn´1 »
12 2. LA THÉORIE NAÏVE DES ENSEMBLES : LES ORDINAUX ET LES CARDINAUX

(comme fonctions définies sur R0 ). Que faut-il faire pour assurer que tous les domi-
nos tombent, ou pour prouver que l’égalité
dxn
“ nxn´1 (A)
dx
est valide pour n’importe quel n P N ? Il faut mettre les dominos assez proches l’un
de l’autre, et il faut pousser le premier. Donc il suffit que
(1) P p0q est vrai
(2) si P pnq est vrai, alors P pn ` 1q est vrai
et P pnq sera vrai pour tout n P N. La preuve de (A) suit ce modèle : certainement
la dérivée de 1 est 0 donc Qp0q est vrai, et si Qpnq est vrai alors
n`1
d
dx px q “ d
dx px ¨ xn q “ d
dx pxq ¨ xn ` x ¨ d n
dx px q
“ x ` x ¨ nxn´1 “ pn ` 1qxn .
n

Il existe aussi la version a priori plus forte (mais, en fait, équivalente) suivante qui
s’appelle induction complète :
(1) P p0q est vrai
(2) si P piq est vrai pour tout 0 ď i ď n, alors P pn ` 1q est vrai
et P pnq sera vrai pour tout n P N.
Exemple 3.7. On montre que tout nombre naturel ą 1 est un produit de
nombres premiers. Soit
P pnq “ « n ` 2 est un produit de nombres premiers ».
Certainement P p0q est vrai car 2 est un nombre premier. Soit donc n ě 0. Ou
bien pn ` 1q ` 2 est un nombre premier et il n’y a rien a prouver. Ou bien pn ` 1q ` 2
est un produit kl avec 1 ă k, l ă n ` 3. Alors k et l sont produits de nombres
premiers par l’hypothèse d’induction.
En fait, les preuves ou les constructions par induction, jusqu’à présent utilisées
pour montrer des propriétés pour chaque élément d’un ensemble fini ou dénom-
brable, sont également valides pour n’importe quel ensemble bien ordonné. Cette
technique de preuve n’a donc pas à voir avec la taille d’un ensemble, mais tout avec
des propriétés d’ordre. On pourrait dire que dans ce cas-là, le bon ordre sur l’en-
semble met ses éléments sur une seule ligne très très longue. Le prochain résultat
forme la base de ce que plus loin on appellera « l’induction transfinie. »
Proposition 3.8. Soit pX, ďq bien ordonné et E Ď X. Si
(1) le minimum de X appartient à E
(2) pour tout x P Xztmin Xu : py ă x ñ y P Eq ñ x P E
alors E “ X.
Il faut voir E comme un sous-ensemble d’éléments de X avec une certaine pro-
priété : on veut montrer que chaque élément de X a cette propriété. Par exemple, en
prenant X “ N et E “ tn P N | P pnq est vraiu on retrouve le principe d’induction
complète.
Remarquons que l’hypothèse (1) + (2) peut être formulée dans une seule
phrase :
@x, y P X : py ă x ñ y P Eq ñ x P E.
En effet, x “ min X implique y ­ă x, donc x P E.
Par contre, (1) est nécessaire, car toujours E “ H satisfait (2).
3. LES ENSEMBLES BIEN ORDONNÉS 13

Démonstration. On assume que E ‰ X. L’ensemble XzE a un minimum m


car pX, ďq est bien ordonné. L’hypothèse (1) implique que m n’est pas minimal
dans X. Par définition de m on a y ă m ñ y P E. Donc (2) implique que m P E,
ce qui nous donne une contradiction. 
Définition 3.9. Un morphisme entre ensembles partiellement ordonnés
f : pX, ďq Ñ pY, ďq
est une fonction qui préserve l’ordre : @p, q P X,
pďq ñ f ppq ď f pqq.
Ceci définit la catégorie Ord des ensembles partiellement ordonnés avec leurs mor-
phismes.
Le morphisme f est un isomorphisme quand il y a un morphisme
g : pY, ďq Ñ pX, ďq
tel que g ˝f “ 1X et f ˝g “ 1Y . On écrit pX, ďq – pY, ďq quand il existe un isomor-
phisme entre pX, ďq et pY, ďq.
Proposition 3.10. (1) Une fonction f : pX, ďq Ñ pY, ďq est un isomor-
phisme ssi f est bijectif et
păq ô f ppq ă f pqq.
(2) Quand pX, ăq et pY, ăq sont totalement ordonnés, f est un isomorphisme
ssi f est bijectif et
păq ñ f ppq ă f pqq.
(3) Quand pX, ăq et pY, ăq sont totalement ordonnés, f est un isomorphisme
ssi f est surjectif et
p ă q ñ f ppq ă f pqq. 
Remarquons qu’un morphisme d’ordres partiels qui est bijectif n’est pas forcé-
ment un isomorphisme : comme exemple on peut prendre
$

’ H ÞÑ 0

&t0u ÞÑ 1
f : pPpt0, 1uq, Ďq Ñ pt0, 1, 2, 3u, ďq :
’t1u

’ ÞÑ 2
%
t0, 1u ÞÑ 3.
Par contre, pPpt0, 1uq, Ďq n’est pas totalement ordonné.
Proposition 3.11. Soit pX, ďq bien ordonné, Y Ď X et f : pX, ďq Ñ pY, ďq
un isomorphisme, alors
@x P X : x ď f pxq.
Démonstration. Soit E “ tx P X | f pxq ă xu. Si E ‰ H, prenons le
minimum m de E. Ce m est un élément de E, donc e “ f pmq ă m. Maintenant
f peq ă f pmq “ e ce qui montre qu’aussi e P E. Ceci contredit la définition de m. 
On obtient un premier résultat important.
Proposition 3.12. Entre deux ensembles bien ordonnés, il y a un seul isomor-
phisme au plus.
Démonstration. Soient f : pX, ďq Ñ pY, ďq et g : pX, ďq Ñ pY, ďq deux iso-
morphismes, alors h “ f ´1 ˝g : pX, ďq Ñ pX, ďq est aussi un isomorphisme. Donc
pour tout x P X, x ď hpxq. Par conséquence, @x P X : f pxq ď gpxq. 
14 2. LA THÉORIE NAÏVE DES ENSEMBLES : LES ORDINAUX ET LES CARDINAUX

ă a X
Xa

Figure 7. Le segment Xa de a dans X

X
ă a
Xa
b
Xb

Figure 8. Les segments Xa et Xb quand a ă b

Exemple 3.13. La fonction N Ñ 2N : n ÞÑ 2n est le seul isomorphisme entre


ces deux ensembles ordonnés.
Définition 3.14. Soit pX, ďq bien ordonné, a P X. L’ensemble
Xa “ tx P X | x ă au
s’appelle le segment de a dans X (figure 7).
Exemples 3.15. (1) N “ X8 est un segment dans X “ N Y t8u
(2) N “ Y01 et Y11 “ N Y t01 u – N Y t8u sont des segments dans Y “ N Y N1 :
0, 1, 2, . . . , n, . . . , 01 , 11 , 21 , . . . , n1 , . . .
Proposition 3.16. Soit pX, ďq bien ordonné, alors il n’existe jamais un iso-
morphisme de pX, ďq sur un de ses segments : @a P X, X fl Xa .
Démonstration. Si f : pX, ďq Ñ pXa , ďq est un isomorphisme, alors pour
tout x P X, x ď f pxq par proposition 3.11. En particulier, a ď f paq. Par contre
f paq P Xa et donc f paq ă a, ce qui donne une contradiction. 
Étant donné un segment d’un ensemble bien ordonné, on peut toujours retrou-
ver l’élément qui le détermine.
Lemme 3.17. Soit pX, ďq bien ordonné et a P X, alors a “ minpXzXa q.
Démonstration. Comme a ­ă a, certainement a R Xa , donc a P XzXa . Soit
maintenant x ă a, alors x P Xa donc x R XzXa et a est minimal. 
Proposition 3.18. Soit pX, ďq bien ordonné et A “ tXa | a P Xu équipé avec
l’ordre Ď. Alors pX, ďq et pA, Ďq sont isomorphes.
Démonstration. On considère la fonction f : X Ñ A : a ÞÑ Xa . Cette fonc-
tion est une surjection par construction de A. Proposition 3.10 nous dit qu’il suffit
de contrôler que si a ă b dans X alors Xa Ă Xb dans A. Ceci est une conséquence
immédiate des définitions et du lemme 3.17—voir figure 8—et montre d’un coup
que pA, Ďq est totalement ordonné (car pX, ďq l’est). 
Remarque 3.19. Dans cette preuve, comme dans le reste du texte, le symbole
« Ă » est utilisé dans le sens strict « Ł » en analogie avec le symbole « ă ».

4. Les ordinaux
Notre but est maintenant de trouver des représentants pour les classes d’équi-
valence de la relation – entre les ensembles bien ordonnés.
4. LES ORDINAUX 15

1
0 0
1
0
0

Figure 9. Les ordinaux 0, 1 et 2

Définition 4.1. Un ensemble bien ordonné pX, ďq est un ordinal quand


Xa “ a @a P X.
Donc dans un ordinal, tout élément est aussi un sous-ensemble ! Comme pro-
bablement au début cette définition semble fausse (ou, au moins, folle) on donne
quelques exemples typiques.
Exemples 4.2. H, tHu, tH, tHuu et tH, tHu, tH, tHuuu, tous avec l’ordre Ď,
sont des ordinaux. « Un sac vide est toujours un sac, et si on met ce sac vide dans
un autre sac, alors cet autre sac n’est plus vide, mais contient. . . un sac. »

Notation 4.3. On écrit 0 “ H, 1 “ t0u, 2 “ t0, 1u, . . ., n “ t0, 1, . . . , n ´ 1u


Remarquons que si pX, ďq est un ordinal et m0 est le minimum de X alors
m0 “ Xm0 “ tx P X | x ă m0 u “ H. Ensuite, si m1 est le minimum de Xztm0 u,
alors m1 “ tHu, car Xm1 “ m1 “ tm0 u.
Proposition 4.4. Si pX, ďq est un ordinal, aussi tout segment Xb est un or-
dinal.
Démonstration. Si a P Xb alors pXb qa “ Xa “ a (Figure 8). 
Proposition 4.5. (1) Si pX, ďq est un ordinal et a P X alors a est un
ordinal.
(2) Sur un ordinal pX, ďq l’ordre ne doit pas être spécifié, car dans X
xăy ô Xx Ă Xy ô x Ă y,
mais aussi
xăy ô x P Xy ô x P y. 
Donc dans ce cas-ci, la relation P forme un bon ordre. En général cette relation
(sur un ensemble d’ensembles) n’est même pas transitive !
Exemple 4.6. t0, 1, . . . , n, . . .u est un ordinal ; on écrit cet ordinal ω. C’est donc
l’ensemble N défini d’une façon très spécifique telle que l’ordre naturel ă coïncide
avec Ă et P.
Si les ordinaux doivent jouer le rôle de représentants pour les classes d’équiva-
lence de la relation –, il faut montrer que
(1) toute classe d’équivalence contient un ordinal au plus (deux ordinaux iso-
morphes sont égaux !) ;
(2) toute classe d’équivalence contient un ordinal au moins.
On commence avec la preuve de (1) en passant par quelques résultats prélimi-
naires qui mènent vers proposition 4.10. Par exemple, une partie est toujours un
segment :
16 2. LA THÉORIE NAÏVE DES ENSEMBLES : LES ORDINAUX ET LES CARDINAUX

Proposition 4.7. Si X et Y sont des ordinaux et Y Ă X, alors il existe a P X


tel que Y “ Xa .
Démonstration. Prenons a “ minpXzY q. Déjà Xa Ď Y car
yăa ñ y R XzY ñ y P Y.
On montre qu’aussi Y Ď Xa , c’est à dire, tous les éléments de Y sont strictement
plus petits que a. Soit y P Y . Certainement y ‰ a, sinon a P Y . Et si a ă y, alors
a P Xy “ y “ Yy Ď Y donc a P Y , une contradiction. 
Par contre, si X “ Xa , aussi X “ a P X, mais alors a ă a, une contradiction.
Attention aussi à la condition que Y soit un ordinal : le sous-ensemble t1u de
2 “ t0, 1u n’est pas un segment de 2, et en effet t1u est un ensemble bien ordonné
qui n’est pas un ordinal.
Proposition 4.8. Si X et Y sont des ordinaux, aussi X X Y est un ordinal.
Démonstration. Certainement une intersection de deux (bons) ordres est
toujours un (bon) ordre. Maintenant pX X Y qa “ Xa X Ya “ a X a “ a et X X Y
est un ordinal. 
Proposition 4.9. Si X ‰ Y sont deux ordinaux, un est un segment de l’autre.
Démonstration. Par proposition 4.7 il suffit de montrer que X Ă Y ou
Y Ă X. Supposons, par contre, que X Ć Y et Y Ć X. Alors X XY Ă X et
X X Y Ă Y , où l’inclusion est stricte. Par conséquence, Da P X, Db P Y tels
que X X Y “ Xa “ a et X X Y “ Yb “ b. Mais alors a “ b P XXY “ Xa et
donc a P Xa ou a ă a, ce qui est impossible. 
Proposition 4.10. Si X – Y sont deux ordinaux alors X “ Y .
Démonstration. Si X ‰ Y sont deux ordinaux, X Ă Y ou Y Ă X. Si, par
exemple, Y Ă X, l’ordinal Y est un segment de X, ce qui contredit proposition 3.16.

On peut déjà conclure que toute classe d’équivalence contient au plus un ordi-
nal. Maintenant on montre qu’il y a au moins un ordinal dans chaque classe.
Proposition 4.11. Soit pX, ďq bien ordonné et tel que Xa est isomorphe avec
un ordinal pour tout a P X. Alors pX, ďq est isomorphe avec un ordinal.
Démonstration. Étant donné x P X, nous allons écrire l’unique isomor-
phisme induit vers un ordinal
gx : Xx Ñ Zpxq.
On considère maintenant l’ensemble W “ tZpxq | x P Xu avec son ordre partiel Ď
et la fonction
f : X Ñ W : x ÞÑ Zpxq.
On va montrer que
(1) f : pX, ďq Ñ pW, Ďq est un isomorphisme d’ordres partiels ;
(2) alors pW, Ďq est bien ordonné ;
(3) finalement, pW, Ďq est un ordinal.
Pour la preuve de (1), considérons x ă y dans X. Alors
Zpxq – Xx – gy pXx q – Zpyqgy pxq (B)
comme l’indique figure 10. Mais proposition 4.10 donne l’égalité Zpxq “ Zpyqgy pxq ,
et ce dernier ensemble est contenu dans Zpyq, car il en est un segment.
4. LES ORDINAUX 17

X
ă x y
Xx
Xy
gy

Zpyq
Zpxq ă gy pxq

Figure 10. La situation (B) étant donné x ă y dans X

(2) est une conséquence immédiate de (1) : un isomorphisme entre deux ordres
partiels préserve aussi les propriétés de ces ordres. Soit maintenant y un élément
quelconque de X. Alors
déf iso
WZpyq “ tZpxq | Zpxq Ă Zpyqu “ tZpxq | x ă yu
(B) ordinal
“ tZpyqgy pxq | x ă yu “ tgy pxq | x ă yu
déf
“ gy pXy q “ Zpyq,
ce qui termine la preuve de (3). 

Proposition 4.12. Tout ensemble bien ordonné est isomorphe avec un ordinal.
Démonstration. Par proposition 4.11 il suffit de montrer que pour tout élé-
ment a de X, le segment Xa est isomorphe avec un ordinal. Considérons le sous-
ensemble
E “ tx P X | Xx n’est pas isomorphe avec un ordinalu
de X. Si E ‰ H, soit a “ minpEq. Alors pour tout x ă a, le segment Xx est
isomorphe avec un ordinal. Aussi pour tout x P Xa , le segment pXa qx est isomorphe
avec un ordinal. Mais alors Xa est isomorphe avec un ordinal par proposition 4.11.
Ceci est en contradiction avec la définition de a. 

4.13. Conclusion. Soit ORD la classe de tous les ordinaux. (On montrera
plus tard, en proposition 5.5, que ORD ne peut pas être un ensemble.) Alors pour
tout ensemble bien ordonné pX, ďq il existe un seul ordinal ordpX, ďq tel que pX, ďq
et ordpX, ďq sont isomorphes. En outre,
pX, ďq – pY, ďq ô ordpX, ďq “ ordpY, ďq :
les ordinaux « mesurent la longueur des ensembles bien ordonnés. »
Notation 4.14. Suivant proposition 4.5 il convient de changer nos notations.
On écrira les ordinaux α, β, γ, . . . Car un ordinal α n’a que d’autres ordinaux
comme éléments, et comme l’ordre sur α coïncide avec « Ă » et avec « P », on peut
reformuler 4.5 de manière suivante :
α “ tβ | β P αu “ tβ | β ă αu.
Ecrit ainsi, la conclusion 4.13 devient : pour tout ensemble bien ordonné pX, ăq il
existe un seul ordinal α et un seul isomorphisme
x : α Ñ pX, ăq : β ÞÑ xβ .
18 2. LA THÉORIE NAÏVE DES ENSEMBLES : LES ORDINAUX ET LES CARDINAUX

Bien sûr cet isomorphisme satisfait


βăγ ô xβ ă xγ .
L’isomorphisme x “ pxβ qβăα même est un exemple d’une séquence transfinie,
une fonction définie sur un ordinal. Si α “ ω, alors x “ pxn qnăω est une séquence
dans le sens quotidien.
Les ordinaux ont été décrits par von Neumann de la façon alternative suivante.
Définition 4.15. Un ensemble X est transitif si tout élément est aussi un
sous-ensemble :
aPX ñ a Ď X.
Exemple 4.16. L’ensemble tH, tHu, ttHuuu est transitif mais n’est pas un
ordinal. (Pourquoi n’est il pas bien ordonné par « P » ?)
Proposition 4.17 (von Neumann). Les conditions suivantes sont équivalentes.
(1) X est un ordinal ;
(2) X est transitif et P est un bon ordre sur X.
Démonstration. Pour montrer (2) ñ (1), remarquons que si la relation P est
un bon ordre sur X, alors pour tout a P X, le segment Xa est l’ensemble
tx P X | x P au.
Si maintenant a Ď X par la transitivité de X, alors Xa “ a.
Réciproquement, proposition 4.5 explique que P est un bon ordre sur X. De
plus, si a P X on a a “ Xa Ď X et X est transitif. 
Le mot transitif est expliqué par le fait que X est un ensemble transitif si et
seulement si P est « transitif » dans le sens suivant : si x P a P X alors x P X.
Attention, ce P n’est même pas une relation binaire sur X !

5. Les ordinaux comme un système de nombres


Jusqu’à présent les seuls exemples d’ordinaux qu’on connait sont les nombres
naturels 0 “ H, n “ t0, . . . , n´1u et l’ordinal infini ω “ t0, . . . , n, . . .u. Les nombres
naturels sont précisément les ordinaux finis : en effet, si α est un ordinal,
αRω ñ α ­ă ω ñ ωďα ñ ω Ď α,
c’est à dire que si α n’est pas un des n il contient ω et est donc infini. On examine
maintenant comment construire de nouveaux ordinaux.
Proposition 5.1. Si α est un ordinal, aussi α Y tαu est un ordinal.
Démonstration. L’ensemble α Y tαu est clairement bien ordonné (quand
β P α on choisit β ă α). Soit β P α Y tαu. Si β P α, alors
tγ P α Y tαu | γ ă βu “ tγ P α | γ ă βu “ β
car α est un ordinal. Si, par contre, β “ α, alors
tγ P α Y tαu | γ ă βu “ tγ P α | γ ă αu “ α,
qui est égal à β. 
Définition 5.2. On écrit α ` 1 “ α Y tαu et appelle cet ordinal le successeur
de α. Tout ordinal qui n’est pas un successeur s’appelle un ordinal limite.
Attention, 1 ` α n’est pas le même ordinal, il sera défini plus tard en 5.7.
Le nom successeur est bien choisi : il n’y a pas d’ordinal β entre α et α ` 1
car α ă β implique α P β donc α ` 1 ď β.
Remarquons aussi que β Ď α si et seulement si β Ă α ` 1.
5. LES ORDINAUX COMME UN SYSTÈME DE NOMBRES 19

Ť
A A
O O
\ E \ E
Z ` Z `
h h
e e

Ť
Figure 11. La réunion A d’un ensemble d’ensembles A

Exemples 5.3. Pour les nombres naturels on trouve la définition qu’on connait :
n ` 1 “ n Y tnu “ t0, . . . , n ´ 1u Y tnu “ t0, . . . , nu.
Les ordinaux 0 et ω sont des limites, car un successeur a toujours un maximum.
On trouve maintenant qu’aussi ω ` 1 “ ω Y tωu “ t0, . . . , n, . . . , ωu (isomorphe
à N Y t8u) et ω ` 2, . . ., ω ` n, . . . sont des ordinaux.
Ť
Proposition 5.4. Si A est un ensemble d’ordinaux alors aussi sa réunion A
est un ordinal.
Ť
Rappelons que x P A quand il existe a P A tel que x P a ; voir figure 11.
Ť exemple, étant donné deux ensembles A et B, leur union A Y B est égale à
Par
tA, Bu. Ť
Qu’est-ce l’union d’un ordinal successeur, pα ` 1q ?
Démonstration. OnŤ utilise la caractérisation desŤ
ordinaux de von Neumann,
proposition
Ť 4.17. L’union A est transitive car aŤ P A ñ Dβ PŤA : a P β, et
a Ď β Ď A. La relation P est un ordre total sur A : si x et y P A, alors il y
a α et β P A tels que x P α et y P β. On a α Ď β ou β Ď α, et x ă y ou y ă x dans
le plus grand de ces deux ordres totaux. Ť
Maintenant on montre que P est un bon ordre sur A. On utilise
Ť proposi-
tion 3.5. Soit donc pxn qnPω une séquence strictement descendante dans A. Alors
il existe un ordinal α dans A tel que x0 P α. Mais pour tout n P ω, xn ď x0 P α,
donc xn P α, et pxn qnPω est une séquence strictement descendante dans l’ordinal α :
une contradiction. 
Maintenant on est prêt pour prouver le paradoxe de Burali-Forti (1897, huit
ans avant le paradoxe de Russell), une des premières indications sérieuses qu’une
théorie trop naïve des ensembles n’est pas tenable. On en donne une interprétation
anachronique : le résultat n’est pas présenté comme une contradiction, mais comme
une proposition dans le cadre de la théorie des ensembles de Zermelo et Fraenkel
(ou celle de von Neumann, Bernays et Gödel).
Proposition 5.5 (Paradoxe de Burali-Forti). La classe ORD n’est pas un en-
semble.
Ť
Démonstration. Si ORD serait un ensemble, aussi son union α “ ORD
serait un ordinal. Mais alors son successeur
Ť α ` 1 serait un ordinal qui n’appartient
pas à ORD. (Si α Y tαu P ORD alors α P ORD “ α.) 
Un infimum est un minorant maximal, un supremum est un majorant mini-
mal.
Proposition 5.6. La paire pORD, ăq est une classe totalement ordonnée. Tout
ensemble non-vide d’ordinaux a un minimum, tout ensemble d’ordinaux a un su-
premum dans ORD.
20 2. LA THÉORIE NAÏVE DES ENSEMBLES : LES ORDINAUX ET LES CARDINAUX

Démonstration. On sait déjà que l’ordre ă est total par proposition 4.9.
Ť
Étant donné un ensemble d’ordinaux A, leur supremum suppAq est l’union A.
En effet,
Ť Ť
(1) si α P A, α Ď A, donc déjà α ď A ;
(2) si l’ordinal β est un
Ť autre majorant, donc si α ď β pour tout α P A, alors
@α P A : α Ď β et A ď β.
Maintenant tout ensemble non-vide d’ordinaux A a un minimum, car A est un
sous-ensemble de l’ordinal γ “ suppAq ` 1 :
ď
αPA ñ αĎ A “ suppAq,
donc α P γ. 
Soulignons que dans la proposition précédente en parle bien d’ensembles d’or-
dinaux : comme le montre proposition 5.5, une classe propre d’ordinaux n’a pas
forcément de supremum dans ORD.
5.7. Les opérations sur les ordinaux. Si α et β sont des ordinaux, leur
somme α ` β est « α suivi de β. » Formellement, A “ α ˆ t0u Y β ˆ t1u avec le bon
ordre
pγ, iq ă pδ, jq ô i ă j ou pi “ j et γ ă δq
et α ` β “ ordpA, ăq.
En particulier, α`1 coïncide avec le successeur de α. Remarquons que ω`1 ą ω
mais 1 ` ω “ ω.
Si α et β sont des ordinaux, leur produit α ¨ β est « une séquence
α ` α ` ¨¨¨ ` α
de longueur β. » Donc
ÿ ´ď ¯
α¨β “ αγ “ ord αγ ˆ tγu
γăβ γăβ

où αγ “ α.
En particulier, ω ¨ 2 “ ω ` ω. Remarquons que ω ¨ 2 ą ω mais 2 ¨ ω “ ω.
5.8. L’induction transfinie. On donne trois versions du principe d’induction
transfinie (cf. 3.6).
Proposition 5.9 (Induction transfinie, I). Soit P pxq une propriété d’ordinaux.
Soit α un ordinal fixe. Si
(1) P p0q est vrai
(2) pour tout γ P α : pη ă γ ñ P pηq est vraiq ñ P pγq est vrai
alors P pβq sera vrai pour tout β P α.
Démonstration. On prend pX, ďq égal à α et E “ tβ P α | P pβq est vraiu
dans proposition 3.8. 
Proposition 5.10 (Induction transfinie, II). Soit P pxq une propriété d’ordi-
naux. Si
(1) P p0q est vrai
(2) pη ă γ ñ P pηq est vraiq ñ P pγq est vrai
alors P pαq sera vrai pour tous les ordinaux α.
Démonstration. Soit α un ordinal. La version I de l’induction transfinie nous
admet de conclure que si β ă α alors P pβq est vrai. Mais alors (2) nous dit que
P pαq est vrai. 
6. LES CARDINAUX 21

Proposition 5.11 (Induction transfinie, III). Soit P pxq une propriété d’ordi-
naux. Si
(1) P p0q est vrai
(2) P pβq est vrai ñ P pβ ` 1q est vrai
(3) γ ‰ 0 ordinal limite, pη ă γ ñ P pηq est vraiq ñ P pγq est vrai
alors P pαq sera vrai pour tous les ordinaux α.
Démonstration. Pour pouvoir utiliser la version II de l’induction transfinie
il suffit de considérer le cas où γ est un ordinal successeur β ` 1. Supposant que
η ă γ ñ P pηq est vrai, certainement P pβq est vrai, donc (2) implique que P pγq est
vrai. 

6. Les cardinaux
Il y a trop d’ordinaux ! On verra qu’une classe d’équipotence d’ensembles peut
en contenir plusieurs. On devra donc choisir une classe plus restreinte d’ordinaux
qui peuvent servir comme représentants.
Ici on supposera que tout ensemble peut être bien ordonné. On montrera plus
tard (dans proposition 7.8 du chapitre 3) que cette hypothèse est équivalente à
l’axiome du choix.
Dans la section 5 on a vu qu’un ensemble fini (donc équipotent à un nombre
naturel) porte essentiellement (c’est à dire, à bijection près) un seul bon ordre. Tous
les bons ordres sur l’ensemble t0, . . . , n ´ 1u “ n sont isomorphes à l’ordinal n.
La situation change quand on considère des ensembles infinis. Bien qu’ils ne
sont pas isomorphes comme ordres, les ordinaux ω, ω ` 1, . . ., ω ` n, . . ., ω ¨ 2, . . .
sont tous équipotents :
ω: 0  A1 A2 A3 ¨¨¨ n n: ` 1 ¨¨¨

z z z x *0 ω
ω ` 1: 0 1 2 3 ¨¨¨ n ¨¨¨
et
ω: 0 1  N2 3  84 ¨¨¨ 72n 2n ` 1 ¨¨¨
_ 

 
w w &- "*
n &- ω
ω ¨ 2: 0 1 2 ¨¨¨ ¨¨¨ ω`1 ¨¨¨ ω`n ¨¨¨
On peut même montrer que ω et ω ¨ ω sont équipotents.
En effet, la relation – entre ensembles bien ordonnés est plus fine que la relation
« entre leurs ensembles sous-jacents : pX, ďq – pY, ďq implique X « Y , car tout
isomorphisme d’ordres est une bijection. Les exemples au-dessus montrent que la
réciproque n’est pas valide. On pourrait dire que « coupe la classe des ensembles
bien ordonnés en morceaux disjoints, mais que – les découpe alors encore une fois
en morceaux bien plus petits.
Définition 6.1. Un ordinal α est un cardinal quand α n’est pas équipotent
à un ordinal strictement plus petit.
Deux cardinaux équipotents sont égaux—par définition ; à ne pas confondre
avec proposition 4.10.
Exemples 6.2. 0, n, ω sont des cardinaux, tandis que ω ` 1, ω ` n, ω ¨ n, ω ¨ ω
ne sont pas des cardinaux.
Proposition 6.3. Tout cardinal infini est un ordinal limite.
22 2. LA THÉORIE NAÏVE DES ENSEMBLES : LES ORDINAUX ET LES CARDINAUX

Démonstration. Soit α ě ω. Alors il y existe une bijection entre α ` 1 et α,


ce qui montre que α ` 1 n’est pas un cardinal. En effet, il y a f : α Ñ α ` 1 définie
comme f p0q “ α, f pn ` 1q “ n, et f pβq “ β pour tout ω ď β ă α. 

Que la réciproque de cette proposition n’est pas valide suit de 6.2.


Notation 6.4. Si on désire indiquer clairement que les ordinaux qu’on travaille
avec sont des cardinaux, on les écrit κ, λ, µ, . . .
Définition 6.5. Soit X un ensemble. On pose
|X| “ mintα | α ordinal, α équipotent à Xu
la cardinalité de X.
Remarquons que cette définition n’a du sens que quand on assume que X porte
au moins un bon ordre. Plus tard on verra aussi que
tα | α ordinal, α équipotent à Xu
est bien un ensemble.
Proposition 6.6. (1) Pour tout ensemble X, |X| est un cardinal.
(2) X et Y sont équipotents ô |X| “ |Y |.
Démonstration. (1) suit directement des définitions. Pour (2) il suffit de
considérer les deux diagrammes suivants.

X
« ,2 Y XLR
« ,2 Y
LR
« « « «
 
|X| |Y | |X| ,2 |Y |
«

Le diagramme à gauche montre l’implication de droite à gauche, tandis que celui à


droite montre l’autre implication : deux cardinaux équipotents sont égaux. 

Maintenant on va montrer que la relation X ď Y coïncide avec l’ordre qui est


induit sur les cardinaux—et donc aussi sur les cardinalités—par ORD.
Proposition 6.7. Si X et Y sont des ensembles, alors les conditions suivantes
sont équivalentes :
(1) |X| ď |Y | avec ď la relation sur ORD ;
(2) X ď Y comme défini dans 2.4.
Démonstration. (1) ñ (2) Si |X| ď |Y |, l’inclusion |X| Ď |Y | induit une
injection canonique i : |X| Ñ |Y |. Composée avec les bijections de X vers |X| et
de |Y | vers Y elle nous donne une injection de X dans Y .
(2) ñ (1) Soit f : X Ñ Y une injection de X dans Y . Ou bien |X| “ |Y | et
on a (1). Ou bien |X| ‰ |Y | ; on assume |Y | ă |X|. On écrit g : Y Ñ X l’injection
induite. Proposition 2.7 nous donne une bijection entre X et Y , une contradiction.
Donc |X| ă |Y |. 

Ceci implique qu’aussi X ď Y est un « ordre total » entre classes d’équipotence


d’ensembles.
Le théorème de Cantor montre qu’il existe des cardinaux strictement plus
grands que ω. En particulier, |N| ă |R|.
6. LES CARDINAUX 23

Définition 6.8. Si κ est un cardinal, on pose


κ` “ mintλ | λ cardinal, κ ă λ ď |Ppκq|u
le cardinal successeur de κ. (L’inégalité est là pour assurer qu’on prend bien le
minimum d’un ensemble.) On introduit maintenant la séquence de cardinaux infinis
suivante :
ℵ0 “ ω, ℵ1 “ ℵ` 0, . . . , ℵn`1 “ ℵ`
n, ...
Dans cette séquence, ℵ1 (qui est aussi écrit Ω) est le premier cardinal (ordinal)
non-dénombrable :
ℵ1 “ mintλ | λ cardinal, ω ă λ ď |Ppωq|u.
Comme on sait déjà que |Ppωq| “ |R|, certainement ℵ1 ď |R|. La phrase « ℵ1 “ |R| »
s’appelle l’hypothèse du continu (CH). Elle signifie qu’il n’y a pas de cardinalités
strictement entre entre celle de N ou Q et celle de R.
On montre maintenant que la suite
ℵ0 , ℵ1 , . . . , ℵn , . . .
ne s’arrête pas après ω pas. À cette fin on étudie les unions de séquences transfinies
de cardinaux.
Proposition
Ť 6.9. Si pκα qαăγ est une séquence transfinie de cardinaux, alors
aussi κ “ tκα | α ă γu est un cardinal.
Démonstration. Si κ n’est pas un cardinal et λ “ |κ| on a
ď
λăκ“ κα .
αăγ

Par conséquence, λ P κ et il y a un ordinal α ă γ tel que λ P κα ď κ. Comme


maintenant λ Ă κα ď κ, proposition 2.6 nous donne une bijection de κ vers κα . Il
existe alors une bijection entre λ et κα , ce qui donne une contradiction. 
Proposition 6.10. Soit pκα qαăγ une séquence transfinie de cardinaux,
Ť stric-
tement ascendante et avec γ un ordinal limite. Alors le cardinal κ “ αăγ κα est
différent de tous les κα .
Démonstration. Si κ “ κα pour un ordinal α ă γ, aussi α ` 1 ă γ car γ est
un ordinal limite, et donc κ “ κα ă κα`1 , une contradiction. 
Définition 6.11. On écrit ℵ0 “ ω, ℵα`1 “ ℵ`
α et
ď
ℵα “ suptℵβ | β ă αu “ ℵβ
βăα

quand α est un ordinal limite.


On doit encore montrer que pℵβ qβăα , pour α un ordinal limite, est une séquence
strictement ascendante.
Proposition 6.12. α ă β ñ ℵα ă ℵβ
Démonstration. On utilise l’induction transfinie (version III, donc proposi-
tion 5.11) pour montrer que tout ordinal β a la propriété
P pβq “ « @α ă β : ℵα ă ℵβ ».
(1) P p0q est vrai car il n’y a pas de α ă 0. Pour (2), supposons que P pβq est vrai
et que γ ă β ` 1. Dans cette situation-là,
– ou bien γ ă β et alors ℵγ ă ℵβ ă ℵβ`1 ;
– ou bien γ “ β et alors ℵγ “ ℵβ ă ℵβ`1 .
24 2. LA THÉORIE NAÏVE DES ENSEMBLES : LES ORDINAUX ET LES CARDINAUX

Pour la preuve de (3), supposons maintenant que γ ‰ 0 est un ordinal limite


et que P pηq est vrai pour tout η ă γ. C’est à dire, si ρ ă η ă γ alors ℵρ ă ℵη .
Donc la séquence de cardinaux pℵρ qρăγ est strictement ascendante. Proposition 6.10
implique maintenant que ℵρ ă ℵγ pour tout ρ ă γ, c’est à dire que P pγq est vrai. 
Corollaire 6.13. Dans la définition 6.11, chaque pas introduit un nouveau
cardinal.
Proposition 6.14. α ď ℵα pour tout ordinal α.
Démonstration. Par induction transfinie : (1) 0 ă ℵ0
(2) β ď ℵβ ñ β ă ℵβ`1 , un ordinal limite ; donc β ` 1 ă ℵβ`1 .
(3) Soit γ ‰ 0 un ordinal limite et supposons que η ă ℵη pour tout η ă γ.
Alors ď ď
ηď ℵη “ ℵγ .
ηăγ ηăγ
Comme γ est un ordinal limite, ď
γ“ η
ηăγ
et on a γ ď ℵγ . 
Remarque 6.15. L’inégalité non-stricte dans 6.14 est nécessaire, car étonnam-
ment il y existe des cardinaux où l’égalité se produit ! Ce sont les points fixes de la
fonction
ℵp¨q : ORD Ñ CARD : α ÞÑ ℵα
où on écrit CARD la classe de tous les cardinaux. Une manière pour en trouver est
par (variation sur) la construction suivante. On met α0 “ ℵ0 et αn`1 “ ℵαn , ce qui
donne la séquence
ℵ0 , ℵℵ0 , ℵℵℵ0 , ℵℵℵℵ , ℵℵℵℵ , ℵℵℵℵ , ...
0 ℵ0 ℵℵ
0

On écrit α pour l’ordinal limite suptαn | n P ωu. Maintenant on sait que ce supre-
mum est le cardinal
ď ď
tαn | n P ωu “ tℵβ | β ă αu “ ℵα
et donc α “ ℵα .
Proposition 6.16. Tous les cardinaux infinis sont de la forme ℵα avec α un
ordinal.
Démonstration. Il suffit de montrer la vérité de
P pαq “ « @κ ă ℵα cardinal infini, Dγ ă α ordinal : κ “ ℵγ »
pour tout ordinal α par induction transfinie. En effet, si κ est un cardinal, il existe
toujours un ordinal α tel que κ ă ℵα : on prend α “ κ ` 1, et alors κ ă α ď ℵα
par proposition 6.14.
(1) P p0q est vrai, car si κ ă ℵ0 alors κ n’est pas un cardinal infini.
(2) Si κ ă ℵβ`1 , κ ď ℵβ , donc
– ou bien κ “ ℵβ ,
– ou bien κ ă ℵβ , et dans ce cas-là Dγ ă β : κ “ ℵγ par hypothèse.
(3) Soit κ ă ℵγ pour γ un ordinal Ť limite. On doit montrer qu’il existe δ ă γ
tel que κ “ ℵδ . Par définition ℵγ “ ηăγ ℵη , ce qui donne un ordinal η ă γ avec
κ ă ℵη . Par l’hypothèse d’induction on trouve δ ă η ă γ avec κ “ ℵδ . 
Remarque 6.17. Si on n’accepte pas l’hypothèse du continu, et si on assume
donc par contre sa négation ℵ1 ‰ 2ℵ0 , la question suivante se pose : Pour quel
ordinal α est-ce que ℵα “ 2ℵ0 , la cardinalité de R ? (Il y a des recherches récentes
qui indiquent que ℵ2 “ 2ℵ0 serait un choix raisonnable !)
7. OPÉRATIONS SUR LES CARDINAUX 25

On a clairement :
Proposition 6.18. CARD n’est pas un ensemble.
Ť
Démonstration. Si CARD est un ensemble, alors α “ CARD est un ordinal.
De plus, α ď ℵα ă ℵα`1 , donc ℵα`1 est un cardinal qui n’appartient pas à la classe
CARD. 

Et donc :
Corollaire 6.19. SET n’est pas un ensemble. 1
Démonstration. Si SET est un ensemble, CARD en est un sous-ensemble. 

7. Opérations sur les cardinaux


L’addition, le produit et l’exponentiation pour les cardinaux sont introduits de
la même façon que pour les nombres naturels : en partant des opérations sur les
ensembles. On donne les définitions de base et se concentre ensuite sur la question
suivante : étant donné deux ordinaux α et β, comment calculer la somme ℵα ` ℵβ ,

le produit ℵα ¨ ℵβ , la puissance ℵαβ ?

Définition 7.1 (Somme). Étant donné deux cardinaux κ et λ, on choisit X


et Y disjoints tels que |X| “ κ et |Y | “ λ. Alors
κ ` λ “ |X Y Y |.
Il est clair que cette définition est indépendante du choix de X et Y . En effet,
quand f : X Ñ X 1 et g : Y Ñ Y 1 sont deux bijections, aussi f Yg : X Y X 1 Ñ Y Y Y 1
est une bijection. En particulier, on peut choisir X “ κ ˆ t0u et Y “ λ ˆ t1u.
Considérons, par exemple, 2 “ t0, 1u et 3 “ t0, 1, 2u ; si on prend juste leur
union on obtient t0, 1, 2u—ce qui n’est pas la bonne réponse ! On doit remplacer
les cardinaux 2 et 3 par deux ensembles équipotents qui sont disjoints. La méthode
canonique est de multiplier l’un avec t0u, l’autre avec t1u. Donc dans l’exemple,
2 ˆ t0u “ tp0, 0q, p1, 0qu et 3 ˆ t1u “ tp0, 1q, p1, 1q, p2, 1qu qui ont comme union
tp0, 0q, p1, 0q, p0, 1q, p1, 1q, p2, 1qu, un ensemble de cardinalité 5.
Définition 7.2 (Produit). Étant donné deux cardinaux κ et λ, on choisit X
et Y tels que |X| “ κ et |Y | “ λ. Alors
κ ¨ λ “ |X ˆ Y |.
Cette définition est indépendante du choix de X et Y : si f : X Ñ X 1 et
g : Y Ñ Y 1 sont deux bijections, alors aussi f ˆ g : X ˆ X 1 Ñ Y ˆ Y 1 est une bijec-
tion. En particulier, on peut choisir X “ κ et Y “ λ.
Définition 7.3 (Puissance). Étant donné deux cardinaux κ et λ, on choisit X
et Y tels que |X| “ κ et |Y | “ λ. Alors
κλ “ |X Y |.
Pour voir que cette définition est indépendante du choix de X et Y , il suffit de
montrer que si f : X Ñ X 1 et g : Y Ñ Y 1 sont bijectifs, alors aussi
Y1
F : XY Ñ X1 : k ÞÑ F pkq “ f ˝k ˝g ´1

1. « Toutes les choses retournent à l’Un, mais où cet Un retourne-t-il ? » (sûtra bouddhiste)
26 2. LA THÉORIE NAÏVE DES ENSEMBLES : LES ORDINAUX ET LES CARDINAUX

est une bijection. Remarquons que F pkq est la fonction unique qui rend le carré

Y
g
,2 Y 1

@ k D! F pkq
 
X ,2 X 1
f

commutatif.
En particulier, on peut choisir X “ κ et Y “ λ.
Proposition 7.4. On a les égalités suivantes : κ ¨ pλ ` µq “ κ ¨ λ ` κ ¨ µ

κ`λ“λ`κ κ¨λ“λ¨κ
κ ` pλ ` µq “ pλ ` κq ` µ κ ¨ pλ ¨ µq “ pλ ¨ κq ¨ µ
κďκ`λ κďκ¨λ pour λ ‰ 0

κ1 ď κ2 , λ1 ď λ2 ñ κ1 ` λ1 ď κ2 ` λ2 et κ1 ¨ λ1 ď κ2 ¨ λ2 
Ces propriétés de sommes et de produits suivent directement des relations cor-
respondantes concernant les unions et les produits des ensembles. Aussi l’exponen-
tiation satisfait des propriétés qui sont parallèles aux relations classiques pour les
nombres naturels :
Proposition 7.5. (1) κ ď κλ pour λ ą 0
(2) λ ď κλ pour κ ą 1
(3) κ1 ď κ2 , λ1 ď λ2 ñ κλ1 1 ď κλ2 2
(4) κλ`µ “ κλ ¨ κµ
(5) pκλ qµ “ κ먵
Démonstration. (1) Les éléments de κ correspondent aux fonctions constan-
tes λ Ñ κ. (2) Les éléments de λ correspondent aux fonctions
#
1 si ν “ µ
δµ : λ Ñ κ : ν ÞÑ
0 si ν ‰ µ.
(3) Toute fonction λ1 Ñ κ1 a une extension λ2 Ñ κ2 . (4) Toute fonction λ ` µ Ñ κ
est complètement déterminée par une fonction λ Ñ κ ensemble avec une fonction
µ Ñ κ. (Propriété universelle de l’union disjointe des ensembles, qui est la somme
dans le sens catégorique.) (5) Considérons le triangle commutatif
X ˆ Yg] X
ev ,2 Y
:D

1X ˆh˚ h

X ˆZ
dans lequel evpx, f q “ f pxq et
h˚ : Z Ñ Y X : h˚ pzqpxq “ hpx, zq.
Alors la fonction
p¨q˚ : Y XˆZ Ñ pY X qZ : h ÞÑ h˚
est une bijection. 
On montre quelques connections entre somme et produit, entre produit et puis-
sance.
7. OPÉRATIONS SUR LES CARDINAUX 27

Proposition 7.6. (1) κ ` κ “ κ ¨ 2


2
(2) κ ¨ κ “ κ
(3) |Ppκq| “ 2κ
Démonstration. (1) κ ˆ t0u Y κ ˆ t1u “ κ ˆ t0, 1u
(2) κ ˆ κ « κt0,1u
(3) Ppκq « t0, 1uκ 
On se concentre maintenant sur les cardinaux infinis—par proposition 6.16,
ce sont les ℵα —en se posant la question où dans la séquence des ℵ se trouvent

ℵα ` ℵβ , ℵα ¨ ℵβ et ℵαβ . La proposition technique suivante mène vers une réponse.
Remarquons que toujours ℵγ ď ℵγ ¨ ℵγ par 7.4. En fait on a l’égalité :
Proposition 7.7. Pour tout ordinal γ on a ℵγ ¨ ℵγ ď ℵγ .
On trouve alors directement :
Proposition 7.8. (1) ℵγ ¨ ℵγ “ ℵγ pour tout ordinal γ ;
(2) ℵα ¨ ℵβ “ ℵmaxtα,βu ;
(3) n ¨ ℵβ “ ℵβ pour tout n ‰ 0 fini.
Démonstration. (2) Soit α ď β, alors
ℵβ “ 1 ¨ ℵβ ď ℵα ¨ ℵβ ď ℵβ ¨ ℵβ ď ℵβ .
(3) suit de ℵβ “ 1 ¨ ℵβ ď n ¨ ℵβ ď ℵ0 ¨ ℵβ “ ℵβ . 
Proposition 7.9. (1) ℵα ` ℵβ “ ℵmaxtα,βu ;
(2) ℵα ` ℵα “ ℵα ;
(3) n ` ℵα “ ℵα pour tout n ‰ 0 fini.
Démonstration. (1) Soit α ď β, alors ℵβ ď ℵα ` ℵβ ď ℵβ ` ℵβ “ 2 ¨ ℵβ ď
ℵβ ¨ ℵβ “ ℵβ . 
Donc en particulier, si κ et λ sont des cardinaux infinis, alors κ ` λ “ κ ¨ λ.
Proposition 7.10. ℵℵαα “ 2ℵα pour tout ordinal α.
Démonstration. ℵℵαα ď p2ℵα qℵα “ 2ℵα ¨ℵα “ 2ℵα ď ℵℵαα . 

Proposition 7.11. ℵαβ “ 2ℵβ si α ď β.
ℵ ℵ
Démonstration. ℵαβ ď p2ℵα qℵβ “ 2ℵα ¨ℵβ “ 2ℵβ ď ℵαβ . 

Il est aussi possible de calculer ℵαβ quand α ą β, mais le calcul est plus
compliqué et dépend de la situation : ou bien la réponse est ℵα , ou bien ℵα`1 .
Notation 7.12. On écrit i0 “ ℵ0 , puis iβ`1 “ 2iβ pour β un ordinal quel-
conque, et finalement iγ “ suptiη | η ă γu pour γ un ordinal limite.
Sous l’hypothèse du continu (CH), bien sûr ℵ1 “ i1 . L’hypothèse du continu
généralisée est l’égalité ℵα “ iα pour tous les ordinaux α. Les nombres i sont
utiles en pratique surtout quand on n’assume pas cette simplification :
Exemples 7.13. (1) |N| “ |Z| “ |Q| “ ℵ0 “ i0
(2) |R| “ 2ℵ0 “ i1
(3) |C| “ 2ℵ0 ¨ 2ℵ0 “ 2ℵ0 “ i1
(4) |NN | “ ℵℵ0 0 “ 2ℵ0 “ i1
(5) |RN | “ p2ℵ0 qℵ0 “ 2ℵ0 ¨ℵ0 “ 2ℵ0 “ i1
28 2. LA THÉORIE NAÏVE DES ENSEMBLES : LES ORDINAUX ET LES CARDINAUX

ℵ0 ℵ0 ℵ0
(6) |RR | “ p2ℵ0 q2 “ 2ℵ0 ¨2 “ 22 “ i2
Proposition 7.7 nous reste à prouver.

Démonstration de la proposition 7.7. On donne une preuve par induc-


tion (type I, proposition 5.9). On sait déjà ((2) dans exemples 2.5) que ℵ0 ¨ ℵ0 “ ℵ0 .
Supposons donc que ℵη ¨ ℵη ď ℵη pour tout η ă γ. On montre que ℵγ ¨ ℵγ ď ℵγ .
On écrira ωγ pour le cardinal ℵγ quand on veut accentuer l’ordre. D’abord dans
(1) on construit un bon ordre ă sur l’ensemble ωγ ˆ ωγ . Ensuite dans (2) on montre
que
ordpωγ ˆ ωγ , ăq ď ωγ ,
en appliquant l’hypothèse d’induction, ce qui nous donne
ℵγ ¨ ℵγ “ |ωγ ˆ ωγ | ď ordpωγ ˆ ωγ , ăq ď ωγ “ |ωγ | “ ℵγ .
(1) Construction d’un bon ordre sur ωγ ˆ ωγ : on pose pα, βq ă pα1 , β 1 q si et
seulement si
$
1 1
&maxtα, βu ă maxtα , β u,
’ ou bien
1 1 1
maxtα, βu “ maxtα , β u et α ă α , ou bien

maxtα, βu “ maxtα1 , β 1 u, α “ α1 et β ă β 1 .
%

La relation ă est clairement un ordre total. On montre que c’est un bon ordre.
Soit H ‰ X Ď ωγ ˆ ωγ . On pose
δ “ mintmaxtα, βu | pα, βq P Xu
et
Y “ tpα, βq P X | maxtα, βu “ δu.
Certainement X et Y ont le même minimum. Soit
α0 “ mintα | Dβ pα, βq P Y u
et
Z “ tpα, βq P Y | α “ α0 u.
Cet ensemble aura de nouveau le même minimum que X. Soit
β0 “ mintβ | pα0 , βq P Zu.
Finalement, le couple pα0 , β0 q sera le minimum de X.
(2) On montre que ordpωγ ˆ ωγ , ăq ď ωγ . Supposons, par contre, que  “
ordpωγ ˆ ωγ , ăq et ωγ ă . Soit f l’isomorphisme d’ordres
f :  Ñ pωγ ˆ ωγ , ăq
et pα1 , β1 q “ f pωγ q. Soit
X “ tpα, βq P ωγ ˆ ωγ | pα, βq ă pα1 , β1 qu.
Alors la restriction à ωγ de f
f |ωγ : ωγ Ñ X
est toujours un isomorphisme d’ordres. Par conséquence, |X| “ ℵγ .
Soit maintenant δ “ maxtα1 , β1 u ` 1. Alors δ est infini. De plus, δ ă ωγ car ℵγ
est un cardinal, donc un ordinal limite. Par conséquence, X Ď δˆδ. Soit maintenant
ℵη “ |δ|, alors η ă γ et donc par hypothèse
|X| ď ℵη ¨ ℵη ď ℵη ă ℵγ ,
une contradiction. 
8. CONCLUSION 29

8. Conclusion
Le but de ce chapitre était de formaliser l’idée de taille d’un ensemble. On a
étudié essentiellement deux approches différentes :
(1) l’existence d’une injection codifie qu’un ensemble est plus petit que l’autre,
ce qui définit un ordre ď sur les classes d’équipotence d’ensembles X ;
(2) la théorie des cardinaux nous permet de compter le nombre d’éléments
|X| que contient un ensemble X.
La première approche mène naturellement vers la deuxième, car il n’est a priori pas
clair que l’ordre ď soit total—donc deux ensembles pourraient être incomparables.
La solution est de comparer leurs cardinalités.
Comment calculer alors la cardinalité d’un ensemble ? Combien d’éléments
contient-il ? La réponse qu’a donné Cantor à cette question passe par la théorie
des ensembles bien ordonnés. Il assume que tout ensemble X peut être muni d’un
bon ordre pX, ďq. Ensuite il montre que chaque classe d’isomorphisme d’ensembles
bien ordonnés contient un seul ordinal. Mais un ensemble peut en général porter
plusieurs ordres non-isomorphes—les classes d’équipotence sont plus petites que les
classes d’isomorphisme d’ordres, la première relation est plus fine que la seconde—
et donc il y a trop d’ordinaux. Maintenant la cardinalité |X| d’un ensemble X
est simplement le plus petit de tous les ordinaux α qui sont équipotents avec cet
ensemble.
Cette définition de cardinalité est la bonne, car elle est compatible avec l’ordre
défini dans (1),
XďY ô |X| ď |Y |.
Une question reste encore ouverte : est-ce raisonnable de supposer que tout ensemble
peut être bien ordonné ? La réponse dépend de l’axiomatique de la théorie des
ensembles, le sujet du chapitre 3.
CHAPITRE 3

La théorie axiomatique des ensembles

1. Introduction
Presque toute la mathématique du XXe siècle sera fondée sur la théorie des
ensembles. La définition qu’avait donné Cantor pour la notion d’ensemble restait
plutôt intuitive : un ensemble est « chaque regroupement dans un tout d’objets
bien distincts de notre intuition ou de nos pensées » : c’est un sac, avec des trucs
dedans.
La désillusion est venue dix ans après le début du travail fondateur de Cantor.
Déjà en 1897 Burali-Forti formulait un premier paradoxe concernant les ordinaux.
En 1899 c’est Cantor même qui trouve un paradoxe dans la théorie des cardinaux.
En 1905, après l’étude du travail de Cantor, Russell peut formuler un paradoxe qui
n’utilise ni les ordinaux, ni les cardinaux, et qui est donc accepté plus facilement.
Ce paradoxe de Russell y consiste de remarquer que si

Y “ tX | X est un ensemble, X R Xu

lui-même est un ensemble, alors Y P Y ou Y R Y . Maintenant,


– si Y P Y aussi Y R Y par définition de Y ,
– mais si Y R Y alors Y P Y :
une contradiction.
Ce paradoxe dans la théorie des ensembles venait d’autant plus inattendu parce
que c’est justement cette théorie-là qui avait fait l’ouverture pour énormément de
progrès. La seule conclusion pourrait être qu’il est impossible de fonder la mathé-
matique sur rien d’autre que l’intuition. L’alternatif est un fondement axiomatique
pour la théorie des ensembles. Dans ce chapitre on donne une description de cette
approche.
Il y a la théorie axiomatique de Zermelo et Fraenkel qui évite parler d’objets qui
sont « trop grands » pour être des ensembles (1908). Dans cette théorie, des objets
comme tX | X est un ensemble, X R Xu n’ont pas le droit d’existence. D’autre part
il y a l’axiomatique de von Neumann, Bernays et Gödel dans laquelle on considère
deux genres d’objets : les ensembles et les classes. (S’il est impossible de rassembler
tous les sacs du monde dans un (grand) sac, rassemblons-les dans un dépôt.) Cette
deuxième axiomatique est une bonne fondation pour les catégories. Bourbaki et
Grothendieck ont une solution alternative où ils travaillent dans un ensemble choisi
qu’ils appellent l’univers U : les éléments de U sont les petits ensembles. Ils assument
que si l’univers choisi U n’est pas assez grand pour nos besoins on peut toujours en
trouver un autre, V, tel que U Ă V.
Ces théories axiomatiques sont des théories formelles exprimées dans la langue
de la logique des propositions et des prédicats avec des variables X, Y , . . . et un
prédicat P. Pour les formalistes, peu importe la signification de ces « variables » et
de cette relation « P », car il n’y existe rien d’autre que la théorie formelle. Pour
eux la théorie formelle servira à la découverte de vérités sur un monde abstrait. En
1905, Hermite dit la-dessus : « Je crois que les nombres et les fonctions de l’analyse
ne sont pas le produit de notre esprit ; je pense qu’ils existent en dehors de nous,
31
32 3. LA THÉORIE AXIOMATIQUE DES ENSEMBLES

avec le même caractère de nécessité que les choses de la réalité objective et nous les
découvrons et étudions, comme les physiciens, les chimistes et les zoologistes. »
Pour la théorie formelle même, la différence entre une vision formaliste ou intui-
tionniste n’est pas importante. Il est claire que Zermelo–Fraenkel et von Neumann–
Bernays–Gödel voulaient arriver à une théorie qui serait assez riche pour contenir
la théorie de Cantor—d’une telle façon bien sûr que tout paradoxe en serait exclu.
Dans ce cadre axiomatique on a de nouveau l’opportunité de considérer les deux
problèmes que Cantor ne pouvait pas résoudre : le premier mène vers l’axiome du
choix, le deuxième vers l’hypothèse du continu. On traitera la notion de consistance
et on examine les résultats sur la consistance relative de ces deux axiomes. On
regarde que sont les conséquences pour la mathématique si on accepte ses axiomes
ou leur négation.

2. Un langage formel pour la théorie des ensembles


Le chapitre 2 nous a confronté avec le besoin d’une théorie formelle des en-
sembles. Il nous faut des critères pour décider si ou non on objet donné, ou une
collection d’objets satisfaisant une certaine « propriété », peut être appelé ensemble.
Par exemple, des objets comme
tx | x est un ordinalu
ou
tx | x est un cardinalu
ne pourront pas satisfaire ces critères-là. En outre, on devra clarifier ce que signifie le
mot « propriété ». Par exemple, « n est grand » ne devrait pas être admis comme
propriété définissante d’un ensemble, ni une phrase comme « n est le plus petit
nombre naturel positif qui ne peut pas être défini par une expression dans la langue
française qui contient moins de quarante mots ». Les propriétés qu’on travaillera
avec devront être exprimables dans la langue formelle de la logique des prédicats.
Une deuxième raison qu’on a besoin d’un langage formel est pour pourvoir
répondre aux questions comme « Tout ensemble peut-il être bien ordonné ? » et
« L’hypothèse du continu, peut-elle être prouvée ? »
Pour pouvoir répondre à ces questions-là on doit d’abord bien préciser ce que
c’est un théorème, ce que c’est une démonstration. On devra suivre des règles très
strictes (la déduction formelle) pour pouvoir déduire de certaines formules données
(les axiomes) de nouvelles formules (les théorèmes).
2.1. Syntaxe. La langue qu’on utilisera est celle de la logique des prédicats.
En premier lieu on se limitera à l’alphabet contenant les symboles suivants :
– les variables v1 , v2 , . . .
– les constantes w1 , w2 , . . .
– les connectifs et _
– les prédicats “ et P
– le quantificateur D
– le faux K
– les symboles de ponctuation q et p.
Une expression dans la langue formelle est toute suite de symboles de l’alpha-
bet. Certaines suites bien formées seront des formules :
v “ vn vm “ wn wm “ vn wm “ wn
(1) les formules atomaires sont m
vm P vn vm P wn wm P vn wm P wn
et le faux K ;
(2) si ϕ et ψ sont des formules, alors aussi
pϕ _ ψq, ϕ et pDvm ϕq
2. UN LANGAGE FORMEL POUR LA THÉORIE DES ENSEMBLES 33

sont des formules.


Par exemple
pDv0 pDv1 pv0 P v1 _ v1 P v0 qqq
est une formule mais
pDv0 v0 q
ne l’est pas.
Les symboles m, n, ϕ et ψ ne font pas partie du langage formel.
Strictement parlant il n’y a pas d’autres manières pour former des formules.
Mais pour éviter que les formules deviennent très longues et difficiles à lire on adopte
quelques abréviations :
vm ‰ vn pour pvm “ vn q
vm R vn pour pvm P vn q
pϕ ^ ψq pour p ϕ _ ψq
pϕ ñ ψq pour p ϕ _ ψq
pϕ ô ψq pour ppϕ ñ ψq ^ pψ ñ ϕqq
p@vm ϕq pour pDvm ϕq
On enlève ou on ajoute des parenthèses ou les symboles « : » ou « , » pour augmenter
la lisibilité quand cela ne provoque pas de confusion. On écrira aussi x, y, z, . . . et
X, Y , Z, . . . pour les variables.
2.2. Variables libres et liées. Une sous-formule d’une formule ϕ est une
séquence ininterrompue de symboles de ϕ qui elle-même forme une formule. Par
exemple, les cinq sous-formules de
pDv0 pv0 P v1 qq ^ pDv1 pv1 P v2 qq (C)
sont v0 P v1 , Dv0 pv0 P v1 q, v1 P v2 , Dv1 pv1 P v2 q et la formule (C) elle-même.
La portée d’un quantificateur Dvm (ou de @vm ) est la sous-formule qui suit cette
occurrence spécifique de Dvm . Par exemple, la portée de Dv0 dans (C) est v0 P v1 .
Lorsqu’une variable vm apparait dans une formule ϕ et n’est pas dans la portée
d’un quantificateur Dvm ou @vm , elle est dite libre dans ϕ. Si une variable vm n’est
pas libre, elle est liée par le dernier quantificateur Dvm ou @vm qui a vm dans sa
portée. Par exemple, dans (C) la variable v0 est liée par Dv0 , la première v1 est
libre, la deuxième v1 est liée, et v2 est libre. Dans
Dv0 pv0 P v1 ^ p@v0 pv0 R v2 qqq
la première v0 est liée par Dv0 , la deuxième par @v0 .
L’intuition est qu’une formule exprime une propriété de ses variables libres. On
pourrait écrire ϕpv1 , v2 q si on veut accentuer le fait que v1 et v2 sont des variables
libres de la formule ϕ de (C). Alors une substitution des variables liées dans ϕ par
d’autres variables comme dans
pDv3 pv3 P v1 qq ^ pDv4 pv4 P v2 qq
ne change pas le sens de ϕpv1 , v2 q.
On écrit ϕpx1 , . . . , xn q pour exprimer que ϕ dépend de x1 , . . . , xn , c’est à
dire, a x1 , . . . , xn comme variables libres (et il n’y en a pas d’autres). De telle
manière une formule ϕ qui dépend de x1 , . . . , xn définit un nouveau prédicat n-
aire. Étant donné d’autres variables y1 , . . . , yn , alors ϕpy1 , . . . , yn q est la formule
qui se crée en substituant toute variable libre xi par yi . Une telle substitution
ϕry1 {x1 , . . . , yn {xn s est légitime quand aucune variable libre xi ne se trouve dans
la portée d’un quantificateur Dyi ou @yi . Le but est que ϕpy1 , . . . , yn q dit sur y1 ,
. . . , yn ce que ϕpx1 , . . . , xn q dit sur x1 , . . . , xn . Une formule close (un énoncé)
34 3. LA THÉORIE AXIOMATIQUE DES ENSEMBLES

est une formule dont toutes les variables sont liées. Intuitivement une telle formule
exprime une assertion qui est ou bien vraie, ou bien fausse. Elle se comporte donc
comme une proposition.
2.3. Les axiomes et les règles de déduction de la logique. On considé-
rera un des systèmes standards d’axiomes et de règles de déduction de la logique
des prédicats.
Soit Γ une collection de formules ϕ0 , . . ., ϕk , . . . et ψ une formule quelconque.
Une déduction ou preuve de ψ à partir de Γ est une suite finie de formules
ψ0 , . . ., ψn où ψn “ ψ et
(1) ψi est dans la collection Γ, ou
(2) ψi peut être déduit de ψ0 , . . ., ψi´1 en utilisant les règles de déduction.
On écrit Γ $ ψ. Si Γ n’est pas fini, alors Γ $ ψ signifie que ψ peut être déduit d’un
nombre fini de formules de Γ.
La première option (1) correspond à l’axiome logique qui est normalement écrit
Γ, ϕ $ ϕ
et qui signifie que d’hypothèses contenant ϕ on peut déduire ϕ. (On a donc ϕ
dans la collection Γ1 , où Γ1 est la collection Γ avec ϕ ajouté.)
Alors on assume les règles de déduction suivantes. Les règles pour l’implica-
tion :
Γ, ϕ $ ψ Γ $ pϕ ñ ψq Γ$ϕ
et ;
Γ $ pϕ ñ ψq Γ$ψ
la disjonction :
Γ$ϕ Γ$ψ Γ $ pϕ _ ψq Γ, ϕ $ ρ Γ, ψ $ ρ
, et ;
Γ $ pϕ _ ψq Γ $ pϕ _ ψq Γ$ρ
le faux et la négation :
Γ $K Γ$ϕ Γ$ ϕ Γ, ϕ $K
, et ;
Γ$ϕ Γ $K Γ$ϕ
et le quantificateur existentiel, sous condition que les substitutions sont légitimes :
Γ $ ϕrt{xs Γ $ Dxϕ Γ, ϕrt{xs $ ψ
et .
Γ $ Dxϕ Γ$ψ
Plus tard on prendra comme Γ les phrases de (ZF) ensemble avec les axiomes
de l’égalité. On appellera une formule déduite de ces axiomes-là un théorème
de (ZF).
Si une formule ψ peut être déduite sans qu’on assume aucune hypothèse elle
est un théorème logique. Par exemple, ϕ ñ ϕ est un théorème logique,
donc $ p ϕ ñ ϕq, car ϕ $ ϕ puisque ϕ, ϕ $K. Un autre exemple
est pϕ ñKq ô ϕ, car $ pψ _ Kq ô ψ.
Les règles de déduction se combinent en nouvelles règles. Par exemple, on a la
règle
Γ, ϕ $K
Γ$ ϕ
car Γ, ϕ $K puisque $ p ϕ ñ ϕq et donc Γ, ϕ $ ϕ tandis que Γ, ϕ $K.
Ce système de règles n’est pas minimal, car certaines règles suivent des autres :
par exemple, la règle
Γ$ϕ Γ$ ϕ
Γ $K
est le cas spécial de
Γ $ pϕ ñ ψq Γ$ϕ
Γ$ψ
3. UNE INTERPRÉTATION CLASSIQUE DE (ZF) 35

où ψ est le faux K.
Une manière pour obtenir des logiques non-classiques est en éliminant certaines
règles, comme la réduction à l’absurde
Γ, ϕ $K
.
Γ$ϕ
Sans cette règle-là il nous sera impossible de faire des preuves par contradiction, et
donc certains résultats en mathématique deviennent improuvables.
2.4. Les autres axiomes. A côté de l’axiome purement logique de 2.3 on
a besoin d’axiomes qui décrivent les propriétés des prédicats « “ » et « P ». Ces
formules seront toujours dans la suite d’hypothèses Γ qu’on considérera. Les axiomes
de « “ » sont
R: x “ x
S: x “ y ñ y “ x
T: x “ y ^ y “ z ñ x “ z
L: x “ y ñ pϕpxq ô ϕpyqq
Les trois premiers définissent « “ » comme une relation d’équivalence. La loi
de Leibniz, l’axiome L, est ce qui caractérise « “ » entre les autres relations
d’équivalence et exprime que l’égalité x “ y est plus forte que n’importe quel
autre lien ϕpxq ô ϕpyq que peuvent avoir x et y. Ici ϕ est un prédicat unaire
quelconque. C’est à dire, s’il y a une propriété ϕ que x et y n’ont pas en commun,
donc ϕpxq sans ϕpyq ou l’inverse, alors ils doivent être différents : x ‰ y. En fait,
L n’est donc pas un seul axiome, mais une collection infinie d’axiomes, avec une
version pour chaque choix de ϕ. (En logique de deuxième ordre on pourrait écrire
@ϕpx “ y ñ pϕpxq ô ϕpyqqq, mais on n’aura pas strictement besoin de ce niveau
de formalisation, donc on l’évite.)
Les axiomes de « P » sont plus compliqués. En fait il y a plusieurs options ;
dans ce cours on étudiera le système (ZF) de Zermelo et Fraenkel et son extension
(NBG) de von Neumann, Bernays et Gödel.

3. Une interprétation classique de (ZF)


Les axiomes de (ZF) qu’on décrira dans la section 4 sont des phrases comme
@x@yDzpx P z ^ y P zq.
La question de quel genre d’objets cette théorie parle, a plusieurs réponses clas-
siques.
3.1. Deux visions. La première part d’une une vision platonique des objets
mathématiques : dans ce domaine, les notions, les structures, etc., ont une réelle
existence qui ne dépend pas de l’être humain, parce qu’elles appartiennent à un
domaine idéal ; « connaître » du point de vue mathématique signifie découvrir des
entités et leurs relations dans ce domaine. Donc la mathématique existe quelque
part déjà et on ne fait rien d’autre que décrire cette réalité—comme en physique,
on décrit les propriétés de la matière, et en biologie, celles des êtres vivants.
Une deuxième dit simplement que les objets mathématiques sont une inven-
tion humaine et n’existent que dans notre fantaisie. Bien sûr ces structures ima-
ginées suivent certaines règles qu’on est tous accords avec, ou pas. Ces règles qui
déterminent notre imagination collective sont culturellement déterminées—on les
apprend, on les met en question, etc.
Il y a d’autres interprétations, bien sûr, et on est libre d’accepter l’une ou
l’autre, ou de n’accepter aucune. À la fin la mathématique classique ne dépend pas
36 3. LA THÉORIE AXIOMATIQUE DES ENSEMBLES

(1) existence DX @y py R Xq
(2) extensionnalité @X @Y pp@zpz P X ô z P Y qq ñ X “ Y q
(3) sélection @Z DY @x px P Y ô px P Z ^ ϕpxqqq
(4) paire @x @y DZ px P Z ^ y P Zq
(5) réunion @Y DX @y @x px P y ^ y P Y ñ x P Xq
(6) parties @X DY @z pz Ď X ñ z P Y q
(7) infinité DX pH P X ^ @y py P X ñ y Y tyu P Xqq
(8) remplacement @X pp@x P X D!y ϕpx, yqq ñ pDY @x P X Dy P Y ϕpx, yqqq
Table 1. Les axiomes de (ZF)

de nos croyances sur ce point. Mais on se trouve quand même dans un domaine ou
c’est bien de se rendre compte que ces choix-là existent.

3.2. L’univers des ensembles. Dans la vision platonique on accepte donc


l’existence d’un univers d’ensembles. Sinon on l’imagine. Les variables x, y, z,. . .
obtiennent alors une interprétation dans cet univers et « P » signifie « est membre
de ». Dans cette interprétation on accepte que la vérité des phrases de (ZF) est
évidente. Ici une formule ϕ, comme par exemple l’hypothèse du continu, est une
affirmation sur l’univers d’ensembles qui est ou bien vraie, ou bien fausse. Le fait
que (ZF) & ϕ et (ZF) & ϕ ne donne simplement pas d’information sur la vérité
de ϕ, qui se trouve en dehors du cadre formel (et dans le domaine idéal, ou dans
notre fantaisie). On peut seulement conclure que d’autres vérités évidentes devront
être ajoutées à la liste d’axiomes si on veut pouvoir décider cette matière en passant
par la théorie formelle.

3.3. Les ensembles héréditaires. Comment les ensembles qui se trouvent


dans cet univers platonique se comportent-ils ? La théorie formelle ne dispose que
d’un type de variables. Dans cette interprétation il n’existe donc rien d’autre que
des « ensembles ». En écrivant « x P y » on accepte que x aussi bien que y sont
des ensembles. Donc tous les éléments d’un ensemble seront eux-mêmes des en-
sembles. Si maintenant z P x, alors z est aussi un ensemble. On parle d’ensembles
héréditaires.
Plus tard on devra contrôler que la théorie formelle des ensembles héréditaires
est assez riche pour pouvoir servir comme fondements de la mathématique entière.
En particulier, on devra trouver des constructions pour N, Z, Q et R comme en-
sembles héréditaires.

4. Les axiomes de Zermelo et Fraenkel


Aux axiomes pour « “ » de 2.4 on ajoute maintenant les axiomes pour « P »
de Zermelo et Fraenkel (1908, modifié en 1922). Le système (ZF) a en total huit
phrases (Table 1), mais certaines d’entre elles ont une infinité de versions, car comme
l’axiome L elles contiennent un prédicat ϕ.

4.1. Existence, extensionnalité, compréhension. L’axiome (1) d’exis-


tence exprime qu’il y a un ensemble vide :
DX @y py R Xq.
En effet, ce X ne contient aucun élément.
L’axiome (2) d’extensionnalité caractérise un ensemble par ses éléments :
@X @Y pp@zpz P X ô z P Y qq ñ X “ Y q.
4. LES AXIOMES DE ZERMELO ET FRAENKEL 37

Combiné avec l’axiome L de 2.4, qui dans le cas que ϕpXq est la phrase « z P X »
donne
@X @Y pX “ Y ñ p@zpz P X ô z P Y qqq,
on obtient l’équivalence

@X @Y pX “ Y ô p@zpz P X ô z P Y qqq :

deux ensembles sont égaux précisément quand ils ont les mêmes éléments.
L’ensemble vide que l’axiome d’existence nous donne est donc unique. On le
dénote H.
Ensuite il y a l’axiome (3) de sélection de sous-ensembles ou compréhen-
sion, qui dit
@Z DY @x px P Y ô px P Z ^ ϕpxqqq
pour toute formule ϕ qui n’a pas Y comme variable libre. (En fait il y a donc
infiniment d’axiomes de compréhension, un axiome pour chaque choix de ϕ.) Cet
axiome nous permet de sélectionner parmi les éléments x de l’ensemble Z tout ceux
qui satisfont ϕpxq, et ces éléments-la forment un nouvel ensemble Y . Cet ensemble
sera unique par l’axiome extensionnalité, donc on a le droit de noter Y comme

tx P Z | ϕpxqu.

Par contre, la notation tx | ϕpxqu n’a pas de sens, car on doit sélectionner nos
éléments dans un ensemble z qui est déjà donné d’avance.
Exemples dans le chapitre 2 : les définitions 6.8 et 6.5.

4.2. Paire, réunion, ensemble des parties. L’axiome (4) de paire dit

@x @y DZ px P Z ^ y P Zq.

En combinaison avec (3) on trouve donc l’ensemble

tz P Z | z “ x _ z “ yu

qu’on écrira tx, yu. En effet, (2) implique que cet ensemble est indépendant du choix
de Z. Quand x “ y on écrit txu.
On trouve donc des ensembles tels que tHu, tH, tHuu, tH, tHu, tH, tHuuu,
etc. qu’on écrira 0, 1, 2, . . ., mais aussi ttHuu, tH, tH, tHuuu, etc.
L’axiome (5) de réunion s’exprime

@Y DX @y @x px P y ^ y P Y ñ x P Xq.

En utilisant de nouveau l’extensionnalité et la compréhension cet axiome définit la


réunion de Y :
ď
Y “ tx P X | Dy P Y x P yu.
Ť
En particulier on trouve l’union A Y B de deux ensembles A et B comme tA, Bu.
On adopte maintenant l’abréviation suivante. Si y et z sont des ensembles, alors
y Ď z signifie @x px P y ñ x P zq. L’axiome (6) de l’ensemble des parties dit

@X DY @z pz Ď X ñ z P Y q.

L’axiome de sélection nous donne l’ensemble tz P Y | z Ď Xu qu’on dénote PpXq.


38 3. LA THÉORIE AXIOMATIQUE DES ENSEMBLES

4.3. Infinité et remplacement. La combinaison de (4) et (5) nous donne


que pour tout ensemble y, aussi tyu, ty, tyuu et y Y tyu sont des ensembles. On
obtient donc les nombres naturels comme dans le chapitre 2 :
0“H et n ` 1 “ n Y tnu.
Par contre, on ne peut pas encore conclure que la collection de tous les nombres
naturels forme un ensemble, d’ou l’axiome (7) d’infinité suivant.
DX pH P X ^ @y py P X ñ y Y tyu P Xqq
Cet axiome exprime l’existence d’un ordinal limite. En particulier, l’axiome de
sélection donne l’ensemble ω : pour voir cela, écrivons ψpY q pour
H P Y ^ @y py P Y ñ y Y tyu P Y q;
alors
ty P X | @Y pψpY q ñ y P Y qu
définit un ensemble ω qui ne consiste que des nombres naturels.
Les autres constructions nous permettent donc déjà d’obtenir aussi ω ` 1, . . .,
ω ` n. Par contre, on n’a pas encore la garantie que ω ` ω soit aussi un ensemble.
On introduit donc l’axiome (8) de remplacement :
@X pp@x P X D!y ϕpx, yqq ñ pDY @x P X Dy P Y ϕpx, yqqq,
où ϕ une formule et Y n’est pas une variable libre de ϕ. On conclut que
ty P Y | Dx P X ϕpx, yqu
est un ensemble. Le prédicat ϕ se comporte comme une fonction, car il associe un
seul y à tout x donné. L’axiome de remplacement nous dit que la collection de
toutes les valeurs de cette « fonction »—son « ensemble image »—est réellement
un ensemble.
Si maintenant ϕpn, yq quand y est le n-ème successeur de ω, donc y “ ω ` n,
et X “ ω, alors
@n P ω D!y py “ ω ` nq.
Par conséquence, il y a un ensemble Y tel que
@n P ω Dy P Y py “ ω ` nq.
Donc ty P Y | Dn P ω py “ ω`nqu est un ensemble. Sélection nous donne maintenant
l’ensemble ω ` ω.
La preuve de proposition 4.11 dans le chapitre 2 contient un autre exemple.

5. (ZF) est assez riche


On explique maintenant que toute la théorie naïve des ensembles peut être
exprimée dans (ZF). La théorie de Zermelo et Fraenkel est donc assez riche.

5.1. Intersection. Si A et B sont des ensembles, aussi tx P A | x P Bu par


sélection de sous-ensembles (3). On écrit cet ensemble A X B. Si Y est non-vide,
č
Y “ tx | @y P Y x P yu

est l’intersection de tous les éléments de Y . Cet ensemble existe car si X P Y , alors
č
Y “ tx P X | @y P Y x P yu.
5. (ZF) EST ASSEZ RICHE 39

5.2. Couple, produit. Un couple est une paire ordonnée. Si x et y sont deux
ensembles, on écrit la paire ttxu, tx, yuu comme un couple px, yq. La différence entre
le couple px, yq et la paire tx, yu est l’ordre :
tx, yu “ ty, xu
car ces deux ensembles ont les mêmes éléments (axiome (2), extensionnalité). Mais
px, yq ‰ py, xq
puisque txu est un élément de px, yq qui n’est pas dans py, xq.
Étant donné deux ensembles X et Y , l’ensemble des couples
X ˆ Y “ tpx, yq | x P X, y P Xu,
qu’on appelle le produit de X et Y , existe car il peut être obtenu comme
tpx, yq P PpPpX Y Y qq | x P X, y P Xu.
(Le couple px, yq “ ttxu, tx, yuu est un ensemble de sous-ensembles de X Y Y .)

5.3. Relation, fonction, espace fonctionnel. Une relation est un en-


semble de couples. Si R est une relation, son domaine et son image sont les
ensembles des premières et secondes projections
! ď´ď ¯ˇˇ )
domR “ x P R ˇ Dy px, yq P R
! ď´ď ¯ˇˇ )
imR “ y P R ˇ Dx px, yq P R .

Si domR Ď A et imR Ď B, alors R Ď A ˆ B. On dit que R est une relation de A


vers B, et une relation sur A quand A “ B. Bien sûr tout sous-ensemble du
produit A ˆ B définit une relation de A vers B. On écrit aussi xRy pour exprimer
que px, yq P R.
Une fonction ou application est une relation f telle que
@x P domf D!y P imf px, yq P f.
Étant donné deux ensembles A et B, une fonction de A vers B (avec domaine A
et codomaine B) est une fonction f qui forme une relation de A vers B, donc telle
que A “ domf et imf Ď B. Si x P A alors f pxq est l’élément unique y de B tel que
px, yq P f . On écrit
f : A Ñ B : x ÞÑ f pxq.
Étant donné les ensembles A et B, aussi
B A “ tf | f fonction de A vers Bu
sera un ensemble, car
B A “ tf P PpA ˆ Bq | f fonctionu.
Quand f est une fonction avec imf Ď B et domf Ď A, donc f n’est pas forcément
défini sur tout l’ensemble A, on dit que f est une fonction partielle de A vers B.
Notons qu’un codomaine n’est pas déterminé par une fonction considéré comme
ensemble de couples, mais doit être choisi d’avance. L’image imf de f est le plus
petit codomaine possible. Quand cela est aperçu comme problématique on peut
coder cette information en voyant une fonction f : A Ñ B comme un couple pf, Bq
ou un triple pA, f, Bq. (Comment alors définir les triples ?)
Avec les définitions de fonction et de relation on a maintenant assez de maté-
riel pour pouvoir exprimer ce que c’est un ordre, une bijection etc., et pour donc
développer la théorie naïve des ensembles du chapitre 2.
40 3. LA THÉORIE AXIOMATIQUE DES ENSEMBLES

5.4. Le quotient d’une relation d’équivalence. Si R est une relation


d’équivalence sur un ensemble X, donc si
R: xRx
S: xRy ñ yRx
T: xRy ^ yRz ñ xRz,
la classe d’équivalence de x P X est l’ensemble
Rx “ ty P X | yRxu P PpXq
et le quotient X{R est l’ensemble des classes d’équivalence
tY P PpXq | Dx P X : Y “ Rx u.

5.5. Les ensembles N, Z, Q, R, C. Les axiomes de (ZF) garantissent l’exis-


tence de l’ensemble N “ ω. Cette définition des nombres naturels sera compatible
avec les axiomes de Peano (voir 5.9).
Maintenant Z peut être obtenu comme le quotient pN ˆ Nq{„ , où un couple
pm, nq P N ˆ N représente la différence m ´ n et la relation d’équivalence „ est
définie par
pm, nq „ pk, lq ô m ` l “ n ` k.
Donc 0 est représenté par les couples p0, 0q, p1, 1q, p2013, 2013q etc., ´1 “„p0,1q est
la classe de p0, 1q, et ´1 ` 1 est la classe de p4, 5q ` p4, 3q “ p8, 8q, donc zéro.
L’ensemble Q est maintenant le quotient pZ ˆ Z0 q{» où un couple pp, qq repré-
sente une fraction pq . La relation d’équivalence » sur Z ˆ Z0 est définie comme
pp, qq » pr, sq ô ps “ rq.
1
La fraction est donc représentée par les couples p1, 2q, p3, 6q, etc.
2
La définition de R est beaucoup plus compliquée. A posteriori on peut dire
que R est la clôture de Q comme espace métrique, mais cela n’a pas de sens avant
que les réels sont construits. . . Comme illustration on peut quand même donner
celle en termes de coupures de Dedekind :

R “ tX P PpQq | X n’a pas de minimum, H Ă X Ă Q, et


@x P X @y P Q px ă y ñ y P Xqu.
L’idée est que tout nombre réel x peut être représenté par l’ensemble induit
ty P Q | x ă yu.
Par exemple, 2 est représenté par
ty P Q | 2 ă yu
?
et 2 par
ty P Q | 0 ă y ^ 2 ă y 2 u.
Si pxn qn est une séquence descendante dans Q qui converge vers π—prenons, par
exemple, xn “ z1n où
n
ÿ pp2kq!q3 p42k ` 5q
zn “
k“0
pk!q6 163k`1
—alors π est représenté par l’ensemble
ty P Q | Dn P N xn ă yu.
Finalement, C est le produit R ˆ R. Ici un couple px, yq représente le nombre
complexe x ` yi.
5. (ZF) EST ASSEZ RICHE 41

5.6. Compatibilité de fonctions. Deux fonctions f et g sont compatibles


quand f pxq “ gpxq pour tout x P domf Xdomg. On a clairement que dans ce cas-là,
aussi f Y g est une fonction : c’est un ensemble de couples, et avec un élément du
domaine domf Y domg ne correspond qu’un élément de l’image.
Un ensemble de fonctions F s’appelle compatible quand Ť f , g P F implique
que f et g sont compatibles.
Ť Ceci
Ť suffit pour que l’union F soit de nouveau une
fonction. En outre, dom F “ f PF domf .

5.7. Fonctions récursives. On montre que la construction de fonctions ré-


cursives définies sur N est valide. Comme illustration, considérons la fonction fac-
torielle, f : N Ñ N définie en spécifiant que f0 “ 1 et fn`1 “ fn ¨ pn ` 1q, donc
fn “ n!. On devra montrer qu’en effet, f peut être construit comme ensemble de
couples.
En fait, de telles constructions sont valides pour n’importe quel ordinal α ou
même pour tous les ordinaux, mais on ne donnera la démonstration que dans le
cas où α “ ω : le cas général est très similaire. Un exemple de cette situation est
définition 6.11 dans chapitre 2. Une situation encore plus subtile apparaît dans la
proposition 7.11 du chapitre présent.

Proposition 5.8. Soit g : A ˆ N Ñ A une fonction et a P A. Alors il existe


une fonction unique f : N Ñ A telle que

f0 “ a et fn`1 “ gpfn , nq

pour tout n P N.

Dans l’exemple de fn “ n! on prend g : N Ñ N : pk, nq ÞÑ k ¨ pn ` 1q.

Démonstration de la proposition 5.8. On commence avec l’existence de


la fonction f . Une fonction
t: n ` 1 Ñ A

est appelée le stade n du calcul basé sur a et g quand t0 “ a et pour tout


i P n, ti`1 “ gpti , iq. Par exemple, tp0, aqu est le stade 0 du calcul. Ensuite, si t
est le stade n du calcul, alors t` : n ` 2 Ñ A défini par t`i “ ti quand i P n ` 1 et
t`
n`1 “ gptn , nq est le stade n ` 1 du calcul.
Par induction sur n on conclut que le stade n du calcul basé sur a et g existe
pour tout n. Étant une fonction partielle de N vers A, tout tel calcul est une partie
de N ˆ A. On pose maintenant

F “ tt P PpN ˆ Aq | t est un stade du calcul basé sur a et gu,


Ť
puis f “ F . Par 5.6, pour montrer que f est bien une fonction, il suffit de
contrôler que F est compatible comme ensemble de fonctions. Si t : n ` 1 Ñ A et
u : m ` 1 Ñ A sont dans F et m ď n, alors il suffit que ti “ ui pour tout i ď m.
Ceci suit par induction sur i. Ť
Le domaine domf de f est tPF domt “ N car pour tout n il y a un calcul du
stade n. Finalement, la fonction f satisfait les propriétés car elle est une extension
de calculs basés sur a et g, donc f0 “ a et fn`1 “ tn`1 “ gptn , nq “ gpfn , nq.
On contrôle maintenant qui ce f est unique. Soit h : N Ñ A une autre fonction
telle que h0 “ a et hn`1 “ gphn , nq pour tout n. Une autre preuve par induction
montre alors que hn “ fn pour tout n. En effet, h0 “ f0 “ a et hn`1 “ gphn , nq “
gpfn , nq “ fn`1 . 
42 3. LA THÉORIE AXIOMATIQUE DES ENSEMBLES

5.9. L’arithmétique de Peano. Au début du XXème siècle, la description


axiomatique des nombres naturels de Peano (1888) était considérée comme la fon-
dation des mathématiques : en effet, elle donne le premier cadre vraiment formel
pour l’arithmétique. On montre ici que les axiomes de Peano peuvent être déduits
facilement dans (ZF). Comme le cadre sous-jacent de (ZF) est déjà assez formel,
on considère une version relativement informelle de ce système d’axiomes. Ici un
nombre naturel sera un élément d’un ensemble N qui satisfait les axiomes sui-
vants.
P1: Il y a un nombre naturel qui s’appelle zéro, écrit 0.
P2: Tout nombre naturel n a un unique successeur, noté spnq.
P3: Aucun nombre naturel n’a 0 pour successeur.
P4: Deux nombres naturels ayant le même successeur sont égaux.
P5: Si un ensemble de nombres naturels contient 0 et contient le successeur
de chacun de ses éléments, alors cet ensemble est égal à N .
Il est clair que prendre N égal à N “ ω donne un modèle pour ces axiomes, avec 0 “
H et spnq “ n ` 1. De plus, entre deux ensembles de nombres naturels pM, 0M , sM q
et pN, 0N , sN q il y a toujours un isomorphisme f : M Ñ N , défini par induction en
posant f p0M q “ 0N et f psM pmqq “ sN pf pmqq.

6. Les classes dans (ZF) et dans (NBG)


6.1. L’approche naïve. Les axiomes de (ZF) ne nous permettent pas de
considérer
tx | ϕpxqu
comme ensemble pour n’importe quelle formule ϕ. De telles collections ne peuvent
jamais apparaitre dans une preuve formelle qui parle d’ensembles.
Ces collections peuvent néanmoins être considérées comme des classes. Une
classe est vraie ou propre quand elle n’est pas un ensemble.
L’axiome de compréhension (3) exprime que toute sous-classe d’un ensemble
est de nouveau un ensemble. Si ϕ est une formule dans la langue de la théorie des
ensembles où ϕpxq exprime que x est un ordinal, alors ORD “ tx | ϕpxqu est un
exemple d’une vraie classe.
Dans le chapitre 2 on a travaillé avec les classes comme si ce seraient des
ensembles : on a considéré des fonctions entre deux classes, par exemple. Pour bien
justifier cette approche on a besoin d’une extension des axiomes de (ZF) qui donne
une description formelle de ce que c’est une classe.
6.2. Les axiomes de von Neumann–Bernays–Gödel. Dans le système
d’axiomes (NBG) de von Neumann (1925), Bernays (1930) et Gödel (1940), les
objets de base ne sont pas les ensembles mais les classes.
Une classe x sera un ensemble quand elle est membre d’au moins une classe :
DCpx P Cq. Une classe C est propre quand elle n’est pas un ensemble, et n’ap-
partient donc à aucune autre classe : EDpC P Dq. Les axiomes de (NBG) sont tels
que la notion d’ensemble coïncide avec celle de (ZF) ; ils ne sont que plus précis en
concernant les classes.
Il suffit alors que ORD soit une classe dans le sens formel de (NBG) pour que
la collection de toutes les classes ne soit pas une classe elle-même : l’existence d’une
classe propre rend cela impossible. C’est de telle façon qu’on évite (la version pour
les classes de) le paradoxe de Russell dans (NBG).
Par contre, la classe de tous les ensembles existe dans (NBG). On l’écrira SET,
et elle satisfait donc
x P SET ô DCpx P Cq.
7. L’AXIOME DU CHOIX 43

(1) existence D˚ x @C pC R xq
(2) extensionnalité @C @D pp@zpz P C ô z P Dqq ñ C “ Dq
(3) sélection DC @˚ x px P C ô ϕpxqq
(4) paire @˚ x @˚ y D˚ z px P z ^ y P zq
(5) réunion @˚ y D˚ x @z @w pw P z ^ z P y ñ w P xq
(6) parties @˚ x D˚ y @z pz Ď x ñ z P yq
(7) infinité D˚ x pH P x ^ @y py P x ñ y Y tyu P xqq
(8) remplacement @˚ w pp@x P w D˚ !y ϕpx, yqq ñ pD˚ z @x P w Dy P z ϕpx, yqqq
Table 2. Les axiomes de (NBG)

Ť
S S
O O
\ E \ E
Z ` Z `
h h
e e

Ť
Figure 1. Une fonction de choix f : S Ñ S

On écrit @˚ x ϕpxq quand on veut exprimer que ϕpxq est vrai pour tout ensemble x,
comme abréviation donc de @xpDCpx P Cq ñ ϕpxqq. De même, D˚ x ϕpxq veut dire
qu’il existe un ensemble x tel que ϕpxq est vrai, donc
DxpDCpx P Cq ^ ϕpxqq.
Table 2 donne une version compacte des axiomes de (NBG), qui forment essentielle-
ment une variation sur les axiomes de (ZF). Remarquons que la formule ϕ dans (3)
ne peut pas contenir des expressions qui sont quantifiées par des classes, et que z
ne peut pas être une variable libre dans la formule ϕ de (8). Pourquoi est-ce qu’une
version de l’axiome (6) pour les classes n’a pas de sens ? Et est-ce qu’on a vraiment
besoin de (1) ?
Exemples 6.3. (1) La classe SET de tous les ensembles existe par sélec-
tion, l’axiome (3) : elle est déterminée par @˚ x px P SET ô x R Hq.
(2) Maintenant ORD est une classe par sélection dans SET.
(3) Un autre exemple d’une classe propre est la classe des singletons. La pro-
priété D˚ y ppy P xq ^ @z pz P x ñ z “ yqq, donc « x a un seul élément »
détermine une sous-classe de SET. Cette classe est propre. Sinon, par
l’axiome (4)—dont on déduit que, pour tout ensemble x, le singleton txu
est aussi un ensemble—et par l’axiome (5), on pourrait montrer que la
classe de tous les ensembles est un ensemble.

7. L’axiome du choix
Ť
Définition 7.1. Soit S un ensemble, H R S. Une fonction f : S Ñ S s’ap-
pelle fonction de choix si @x P S f pxq P x.

Exemples 7.2. (1) Figure 1 montre une fonction de choix pour l’en-
semble S donné.
Ť
(2) S “ H a une seule fonction de choix H Ñ H “ H.
44 3. LA THÉORIE AXIOMATIQUE DES ENSEMBLES

(3) S “ tXu où X est non-vide a une fonction de choix pour tout x P X : le


singleton tpX, xqu, c’est à dire la fonction cx : tXu Ñ X : X ÞÑ x.
(4) Tout ensemble fini S qui ne contient pas H a une fonction de choix. On en
construit une par induction sur la cardinalité de S. Supposons que tout
S S H à n éléments a une fonction de choix. Supposons que S “ A Y tXu
où A a n éléments. Soit alors g une fonction de choix pour A et x un
élément de X ; l’ensemble

f “ g Y tpX, xqu

sera une fonction de choix pour S.


(5) Tout ensemble S d’ordinaux non-zéros a une fonction de choix. En effet,
ď
SÑ S : α ÞÑ 0 P α

est une fonction de choix.

7.3. L’axiome du choix. L’affirmation que


« tout ensemble qui ne contient pas l’ensemble vide a une fonction de choix »
s’appelle l’axiome du choix (AC). Cet axiome étend donc la situation des en-
sembles finis ou des ensembles des ordinaux vers le cas général infini. On écrit
(ZFC) pour le système d’axiomes (ZF) avec (AC) ajouté. On verra que le nouvel
axiome est plus compliqué que les autres, mais essentiel pour certains résultats en
mathématique.
On commence avec quelques formulations alternatives où l’équivalence avec
(AC) est plus ou moins immédiate.

7.4. Produits infinis. Une première version alternative (AC1 ) parle de pro-
duits possiblement infinis :
« le produit d’une famille d’ensembles non vides est non vide »,
c’est à dire que pour toute famille d’ensembles pXi qiPI
`ź ˘
p@i P I Xi ‰ Hq ñ Xi ‰ H .
iPI
ś
Rappelons que le produit iPI Xi est l’ensemble
! ´ď ¯I  ď )
xP Xi x : I Ñ Xi fonction, @i P I xpiq “ xi P Xi .

iPI iPI

Par exemple, ś quand I “ 2 “ t0, 1u on retrouve le produit binaire de 5.2 : les


éléments de iP2 Xi sont déterminés par un élément x0 P Xś 0 et un élément x1 P X1 ,
c’est à dire par le couple px0 , x1 q P ś
X0 ˆ X1 . On a donc iP2 Xi « X0 ˆ X1 . En
particulier, quand I “ 2 le produit iPI Xi sera non-vide si X0 et X1 le sont. En
général, un produit fini d’ensembles non-vides est toujours non-vide.
Lesśaxiomes de (ZF) ne garantissent pas l’existence d’un élément dans l’en-
semble iPI Xi , même quand les Xi sont non-vides. Par contre, l’énoncé (AC1 ) est
impliqué par l’axiome du choix, car tout élément
ď
x: I Ñ S : i ÞÑ xi

de ce produit, donc tel que xi P Xi pour tout i, est complètement déterminé par
une fonction de choix définie sur l’ensemble S “ tXi | i P Iu des éléments de la
7. L’AXIOME DU CHOIX 45

famille :
i ,2 Xi

I ,2 S
s

x f
$
Ť y
S
Réciproquement, étant donné un ensemble S qui ne contient pas H, on prend
I “ S et écrit Xi “ x pour tout i “ś
x P S. Alors les fonctions de choix sur S sont
exactement les éléments du produit iPI Xi , donc (AC) est impliqué par (AC1 ).
7.5. Ensembles de parties. Une autre version alternative est (AC2 ) :
« Étant donné un ensemble E ‰ H, il existe une fonction définie sur PpEq, et qui
à toute partie non vide de E associe un élément de cette partie. »
(AC2 ) suit du le cas spécial de (AC) où S est l’ensemble tX Ď E | X ‰ Hu. On
envoie H P PpEq sur un élément
Ť de E quelconque. Pour retrouver (AC) à partir
de (AC2 ) on prend E “ S. On a S Ď PpEq, etŤdonc la fonction PpEq Ñ E
donnée par (AC2 ) induit une fonction de choix S Ñ S par restriction.
7.6. Épimorphismes scindés. Un épimorphisme d’ensembles est une sur-
jection, tandis qu’un épimorphisme scindé est une fonction qui est inversible
à droite : p : X Ñ I telle qu’il existe un scindage, une fonction s : I Ñ X
où p˝s “ 1I . Ť
Par exemple, dans figure 1 on peut choisir I “ S, X “ S et p : X Ñ I la
fonction qui envoie un élément de X vers l’ensemble dans I qui le contient. Alors
la fonction de choix f sera un scindage s pour p.
Tout épimorphisme scindé est un épimorphisme, car i P I est toujours l’image
ppxq de x “ spiq. Par contre, l’inverse (AC3 ) :
« tout épimorphisme d’ensembles est scindé »
est équivalent à l’axiome du choix. Soit p : X Ñ I une surjection, alors on choisit
Xi “ p´1 piq “ txi P X | ppxi q “ iu
ś
et l’élément s du produit iPI Xi que donne (AC1 ) est un scindage pour p.
Réciproquement, étant donné une famille d’ensembles pXi qiPI on considère sa
réunion disjointe (son coproduit)
ž ď` ˘
Xi “ Xi ˆ tiu
iPI iPI

qui consiste de couples pxi , iq où xi P Xi . Quand les Xi sont non-vides, la fonction


ž
Xi Ñ I : pxi , iq ÞÑ i
iPI
ś
sera un épimorphisme, et son scindage donne un élément du produit iPI Xi .
7.7. Partitions. Soit X un ensemble. Un ensemble
Ť S Ď PpXq de sous-ensem-
bles non-vides de X s’appelle une partition si S “ X et A, B P S, A ‰ B
implique A X B “ H. Une partition de X est donc une manière de couper X en
morceaux disjoints.
Tout élement A d’une partition S est représenté par ses elements, dans le sens
que a P A détermine l’ensemble A P S auquel il appartient : si a P B P S alors
A “ B. Un ensemble de représentants R pour S est un sous-ensemble de X tel
que @A P S D!a P R : a P A.
Il est clair que (AC) est équivalent à (AC4 )
« toute partition a un ensemble de représentants »
46 3. LA THÉORIE AXIOMATIQUE DES ENSEMBLES

quand on passe par (AC3 ) : si p : X Ñ I une surjection, l’ensemble des images


inverses tp´1 piq P PpXq | i P Iu est une partition de X, et l’ensemble de représen-
tants donné par (AC4 ) définit un scindage pour p. Plus précisément, s : I Ñ X est
l’ensemble tpi, rq | r P R X p´1 piqu.
Par contre, étant donné une partition S de X, on obtient un épimorphisme
p : X Ñ S qui envoie un élément de X sur l’ensemble auquel il appartient. Le
scindage donné par (AC3 ) détermine un ensemble de représentants.

7.8. Le théorème de Zermelo. Le principe de base derrière la théorie des


ordinaux et des cardinaux était que
« tout ensemble peut être bien ordonné ».
Ce principe s’appelle le théorème de Zermelo (W) ; il est équivalent à (AC). On
écrit (W) car (Z) est réservé pour 7.10 : « Ensemble bien ordonné » = « well-ordered
set », « wohlgeordnete Menge », « welgeordende verzameling ».
Proposition 7.9. (AC) ô (W)
Démonstration. On commence avec (AC) ñ (W) en passant par (AC2 ).
Soit A un ensemble. Alors (AC2 ) nous donne une fonction g : PpAq Ñ A telle que
gpaq P a pour tout H ‰ a Ď A. On dénombre maintenant les éléments de A.
` Si A ˘‰ H on choisit a0 “ gpAq. Si maintenant Azta0 u ‰ H on pose a1 “
g Azta0 u . On continue par induction transfinie (version II, proposition 5.10) en
posant
` ˘
aα “ g Aztaβ | β ă αu
pour tout ordinal α tel que Aztaβ | β ă αu est non-vide. On montre maintenant
qu’il y a un ordinal α pour lequel A “ taβ | β ă αu.
Supposons par contre que A ‰ taβ | β ă αu pour tout α. On écrit alors
B “ ta P A | Dβ a “ aβ u
et @b P B D!β b “ aβ . L’axiome (8) de remplacement implique maintenant que la
classe de tous les ordinaux ORD est un ensemble, ce qui est en contradiction avec
proposition 5.5.
L’implication (W) ñ (AC) est plus facile. De plus, une autre preuve suivra de
la proposition 7.11, ou par induction comme dans le cas fini (exemple (4) dans 7.2).
Soit A un ensemble, ď le bon ordre induit. Pour prouver (AC2 ) on a besoin d’une
fonction g : PpAq Ñ A telle que gpaq P a pour tout H ‰ a Ď A. Il suffit de prendre
gpaq “ min a et gpHq “ min A. 

7.10. Le lemme de Zorn. Une chaîne dans un ensemble partiellement or-


donné est une partie totalement ordonnée. Un ensemble partiellement ordonné
pX, ďq s’appelle ensemble inductif si toute chaîne dans pX, ďq a un majorant.
Le lemme de Zorn (Z) dit maintenant que
« tout ensemble inductif a des éléments maximaux ».
Une application classique du lemme de Zorn est l’existence d’une base dans un
espace vectoriel quelconque. Un base est un système de vecteurs libre maximal, et
il suffit donc de remarquer que la réunion d’une famille croissante pour l’inclusion
de systèmes libres est encore un système libre pour pouvoir appliquer le lemme de
Zorn.
Proposition 7.11. (AC) ô (Z)
Démonstration. On passe par proposition 7.9 et on montre (W) ñ (Z). Soit
pA, ďq un ensemble inductif. On cherche donc un élément maximal pour ď.
7. L’AXIOME DU CHOIX 47

L’hypothèse (W) nous permet de placer un bon ordre ă sur l’ensemble A. Cet
ensemble est donc isomorphe à un ordinal γ ; on écrit l’isomorphisme a : γ Ñ A. En
particulier, on a A “ taα | α P γu et aα ă aβ si et seulement si α ă β ă γ.
On définit une fonction f : ORD Ñ γ ` 1 par f p0q “ 0 et
#
mintα P γ | β ă ξ ñ pf pβq P γ ^ af pβq ă aα qu si un tel α existe,
f pξq “
γ sinon.

On montre qu’il existe un ξ tel que f pξq “ γ. Supposons le contraire. Alors f est
une injection : si ζ ă ξ alors ou bien af pζq ă af pξq , ou bien f pξq “ γ, ce qui est
impossible. De plus, f pORDq est un sous-ensemble de l’ensemble γ. Et car f est une
injection, l’axiome de remplacement (8) implique qu’aussi ORD est un ensemble—
une contradiction.
Soit donc ξ le plus petit ordinal tel que f pξq “ γ. Ce ξ ne peut pas être un
ordinal limite, car dans ce cas-là l’ensemble taf pβq | β ă ξu est une chaîne sans
majorant. Par conséquence, il y a un ordinal δ tel que ξ “ δ ` 1. L’élément af pδq
est alors maximal dans A :
f pδq “ mintα P γ | β ă δ ñ af pβq ă aα u,
donc déjà tous les af pβq pour β ă δ sont plus petits que af pδq . Soit maintenant
a “ aα un élément de A quelconque. Supposons aα ą af pδq . Alors cet α est tel que
β ă ξ “ δ ` 1 ñ β ď δ ñ af pβq ă aα , donc f pξq ‰ γ : une contradiction. Par
conséquence, af pδq est maximal dans A.
On montre maintenant que (Z) implique (AC). Soit donc S un ensemble non-
vide qui ne contient pas l’ensemble vide. On obtiendra une fonction de choix pour S
comme élément maximal de l’ensemble inductif pF, Ďq où
! ´ ď ¯ )
F “ f P P S ˆ S f fonction, domf Ď S, @X P domf f pXq P X .

L’ensemble F est non-vide car il contient la fonction Ť xqu


` tpX, ˘ pour x P X P S. Il est
partiellement ordonné comme sous-ensemble de P S ˆ S . Si maintenant G Ď F
est une chaîne dans F , cet ensemble de fonctions est compatible
Ť (voir 5.6), car f ,
g P G implique f Ď g ou g Ď f . Par conséquence, l’union G est un majorant
pour G.
L’ordre pF, Ďq est donc un ensemble inductif. Soit maintenant f un élément
maximal. Alors domf “ S et, par conséquence, f est une fonction de choix pour S.
Supposons que X P Szdomf . L’ensemble X est non-vide, donc contient un élé-
ment x. Alors f Y tpX, xqu est dans F et f Ď f Y tpX, xqu, ce qui contredit la
maximalité de f . 

Bertrand Russell disait à propos de l’axiome du choix : « Pour choisir une


chaussette plutôt que l’autre pour chaque paire d’une collection infinie, on a besoin
de l’axiome du choix. Mais pour les chaussures, ce n’est pas la peine. » Par contre,
on a

7.12. Conséquences de l’axiome du choix. Juste pour avoir une idée de


l’importance de cet axiome, une liste de quelques résultats qui en ont besoin.
– Tout espace vectoriel a une base.
– Le théorème de Krull : tout anneau unitaire a des idéaux maximaux.
– Le théorème de Tychonoff : un produit d’espaces compacts est compact.
– Le théorème de Nielsen–Schreier : tout sous-groupe d’un groupe abélien libre
est abélien libre.
– L’existence d’ensembles non-mesurables au sens de Lebesgue.
48 3. LA THÉORIE AXIOMATIQUE DES ENSEMBLES

– Le théorème de Hahn–Banach : l’existence d’une forme linéaire sur un espace


de Banach vérifiant certaines conditions ; les valeurs sont imposées sur une
partie de l’espace, mais limitées partout.
– Le théorème de Stone : dualité entre la catégorie des algèbres de Boole et celle
des espaces topologiques de Hausdorff compacts et totalement discontinus.
On montre maintenant comment deux résultats élémentaires sur les réels ont
besoin de l’axiome du choix.
7.13. Les points de fermeture dans R. La définition usuelle dit qu’une
séquence pxn qnPN dans R converge vers a P R quand pour tout nombre réel  ą 0
il existe n P N tel que |xn ´ a| ă  pour tout nombre naturel n ě n . (Ici |x| dénote
la valeur absolue au lieu de la cardinalité.) On écrit xn Ñ a.
Soit A Ď R. Les points de fermeture de A sont normalement caractérisés
d’une des deux manières suivantes.
(1) a est point de fermeture de A si et seulement si il existe une séquence
pxn qnPN dans A qui converge vers a.
(2) a est point de fermeture de A si et seulement si pour tout nombre réel
 ą 0 il existe x P A tel que |x ´ a| ă .
Il faut alors montrer que (1) et (2) sont équivalents.
(1) ñ (2) Étant donné  ą 0 il existe n P N tel que |xn ´ a| ă  pour tout
n ě n . En particulier, xn P A et |xn ´ a| ă .
(2) ñ (1) Soit X0 “ A et Xn “ tx P A | |x ´ a| ă n1 u. Par (2), tous les Xn
sont non-vides. Soit pxn qnPN une séquence telle que xn P Xn pour tout n P N. Alors
tout xn P A et xn Ñ a.
Ce qui manque normalement dans cette démonstration, c’est la preuve que
x “ pxn qnPN est bien une séquence dans le sens formel. En fait, dans (ZF) une telle
preuve n’existe pas ! Par contre, (ACś 1 ) nous donne un argument valide : x peut être
obtenu comme élément du produit nPN Xn .
7.14. La continuité d’une fonction R Ñ R. Il y a un problème très similaire
avec la définition de continuité pour les fonctions R Ñ R. De nouveau on a deux
définitions naturelles :
(1) f : R Ñ R est continu dans a P R si et seulement si pour tout nombre réel
 ą 0 il existe δ ą 0 tel que |f pxq ´ f paq| ă  dès que |x ´ a| ă δ.
(2) f : R Ñ R est continu dans a P R si et seulement si pour toute séquence
pxn qnPN qui converge vers a, la séquence pf pxn qqnPN converge vers f paq.
(1) ñ (2) Si xn Ñ a et  ą 0 est donné, on considère le δ ą 0 venant de (1).
La convergence de pxn qnPN nous donne n tel que |xn ´ a| ă  pour tout n ě n .
Certainement, pour tout tel n on a |f pxn q ´ f paq| ă  par (1).
Si on assume l’axiome du choix, (2) ñ (1) et les deux définitions sont bien
équivalentes. On montre (1) ñ (2). Par hypothèse il y a  ą 0 tel que pour tout
δ ą 0 il existe x satisfaisant |x ´ a| ă δ mais |f pxq ´ f paq| ě . En particulier, pour
tout n P N on choisit x0 “ a et xn tel que |xn ´ a| ă n1 et |f pxn q ´ f paq| ě . La
séquence pxn qnPN —c’est ici qu’on utilise (AC)—converge vers a, mais pf pxn qqnPN
ne converge pas vers f paq.
Ici aussi on peut vérifier que les axiomes (ZF) sans (AC) ne suffisent pas pour
avoir l’équivalence.

8. Cohérence
Définition 8.1. Une collection de formules Γ est cohérente ou consistante
s’il n’existe pas de formule ψ telle que
Γ$ψ et Γ$ ψ.
8. COHÉRENCE 49

Une collection de formules est incohérente si elle n’est pas cohérente.


Proposition 8.2. Γ est incohérente si et seulement si pour toute formule ϕ,
Γ $ ϕ.
Démonstration. Si la collection Γ est incohérente on a une formule ψ telle
que Γ $ ψ et Γ $ ψ. On déduit
Γ$ψ Γ$ ψ Γ $K
et donc .
Γ $K Γ$ϕ
Réciproquement, si Γ $ ϕ pour toute formule ϕ on peut choisir n’importe quelle
formule ψ et conclure que Γ $ ψ et Γ $ ψ. 
Proposition 8.3. Soit Γ une collection de formules et ϕ une formule, alors la
collection Γ Y tϕu est incohérente si et seulement si Γ $ ϕ.
Démonstration. Supposons Γ $ ϕ. Alors aussi Γ, ϕ $ ϕ. Mais l’axiome
de déduction logique implique Γ, ϕ $ ϕ, donc la collection Γ Y tϕu est incohérente.
Si, par contre, la collection Γ Y tϕu est incohérente, on déduit Γ, ϕ $ ϕ. Par
conséquence, Γ $ pϕ ñ ϕq. Maintenant pϕ ñ ϕq $ ϕ car
pϕ ñ ϕq, ϕ $ ϕ pϕ ñ ϕq, ϕ $ ϕ
,
pϕ ñ ϕq, ϕ $K
donc Γ $ ϕ. 
Corollaire 8.4. Γ Y tϕu est cohérente si et seulement si Γ & ϕ. 
Car les axiomes de (ZF) sont assez forts pour être capable de « formaliser
l’arithmétique », c’est à dire de déduire—comme on explique en 5.9—les axiomes
de Peano, le second théorème d’incomplétude de Gödel (1931) implique qu’il est
impossible de donner une démonstration de la consistance de (ZF). Cela signifie
qu’une telle preuve ne peut pas être exprimée dans le langage de (ZF) même.
Donc dans un sens fondamental, toute tentative à une formalisation de la théorie
des ensembles est condamnée dès le début : on ne peut jamais être certain que le
système formel n’est pas contradictoire.
On peut quand même sauver quelque chose en affaiblissant la notion de cohé-
rence. Au lieu on considère une notion de « cohérence relative ».
Définition 8.5. Étant donné deux collections de formules Γ et ∆, la collection
∆ est cohérente relatif à Γ si la cohérence de Γ implique celle de ∆.
Donc bien qu’on ne sait rien sur la cohérence de Γ, la collection de formules ∆
ne sera pas moins cohérente : la situation ne devient pas pire.
La consistance relative est montrée en donnant une interprétation ad-hoc. Un
modèle donc pour Γ, dans lequel les formules de ∆ sont vraies. Si alors Γ est cohérent
et ϕ est une formule de ∆, il est impossible de montrer que Γ $ ϕ, car ϕ est vraie
dans le modèle. Par corollaire 8.4 la collection Γ Y tϕu sera cohérente. De la même
manière la cohérence de tout ∆ suivra de la cohérence de Γ.
8.6. Le modèle M des ensembles finis. Comme exemple on prend pour Γ
la collection qui consiste des axiomes pour « “ » ensemble avec les axiomes (1)–(6)
de (ZF). On montrera que l’axiome d’infinité (7) ne peut pas être déduit de Γ. C’est
à dire, la collection ∆ “ Γ Y tϕu où ϕ est la négation de (7) est cohérente relatif
à Γ.
On construit un modèle de Γ où (7) n’est pas valide : une « théorie des en-
sembles » qui ne contient pas d’ensemble infini. Ceci montre que de (1)–(6) il est
impossible de conclure qu’un ensemble infini existe.
50 3. LA THÉORIE AXIOMATIQUE DES ENSEMBLES

Les axiomes (1)–(6) nous permettent à construire la classe d’ensembles M sui-


vante : on prend M0 “ H, puis Mn`1 “ PpMn q, et
M “ tX | Dn X P Mn u.
(Donc, en particulier, M1 “ tHu.) On montre que les axiomes (1)–(6) sont valides
dans M , mais (7) ne l’est pas. Remarquons que M est une classe transitive : X P M
implique que X Ď M , car il existe n tel que X P Mn`1 “ PpMn q. De plus, les
ensembles Mn forment une chaîne
M0 Ă M1 Ă M2 Ă ¨ ¨ ¨ Ă Mn Ă Mn`1 Ă ¨ ¨ ¨ Ă M :
il est clair que M0 Ă M1 , et Mn Ă Mn`1 suit par induction sur n.
(1) H P M1
(2) @X P M @Y P M pp@z P M pz P X ô z P Y qq ñ X “ Y q par la
transitivité de la classe M et par induction sur n
(3) pour tout X in M aussi PpXq Ď M par définition de M ; en particulier,
tout sous-ensemble Y trouvé par sélection sera dans M
(4) si x, y P Mn alors tx, yu P PpMn q “ Mn`1
Ť
(5) si Y Ď Mn alors Y P Mn
(6) si X Ď Mn alors PpXq Ď PpMn q “ Mn`1
(7) tous les ensembles dans M sont finis !
M est donc un modèle pour ∆ et ∆ est cohérent relatif à Γ. L’axiome (7) ne suit
donc pas de (1)–(6).
Cet exemple suit un principe général :
Proposition 8.7. Soient Γ et ∆ deux collections de formules dans le langage
de la théorie des ensembles. Supposons que les formules de Γ nous donnent une
classe non-vide M qui est un modèle pour ∆. Alors ∆ est cohérent relatif à Γ. 
Dans les années 1930, Gödel a construit le modèle L des ensembles construc-
tibles. Ici on suppose que (ZF) est cohérent. Dans L l’axiome du choix est va-
lide : donc (ZFC) est cohérent relatif à (ZF) et la cohérence de (ZF) implique que
(ZF) & (AC).
En 1969, Cohen a construit un modèle dans lequel la négation de l’axiome du
choix est valide. Donc (ZF) + (AC) est cohérent relatif à (ZF) et la cohérence
de (ZF) implique que (ZF) & (AC).
On conclut que si (ZF) est cohérent, alors l’axiome du choix est indépendant
de (ZF). De la même façon on peut montrer que l’hypothèse du continu est indé-
pendante de (ZF). L’hypothèse du continu est valide dans le modèle de Gödel, mais
invalide dans celui de Cohen.
CHAPITRE 4

Exercices

1. Ordres
(1) Montrez l’équivalence entre l’induction et l’induction complète.
(2) Prouvez proposition 3.10.
Ť Ť
(3) Qu’est-ce tXu ? et H ?
`Ť ˘
(4) Montrez que p@i P I : Xi Ď Y q ñ iPI Xi Ď Y
Ť `Ť ˘
(5) Montrez que iPI pXi X Y q “ iPI Xi X Y
(6) Trouvez un contre-exemple pour proposition 3.12 quand les ordres ne sont
pas bons. (Indication : essayez pZ, ďq.)
(7) Même question pour proposition 3.11.
(8) Même question pour proposition 3.16. (Indication : essayez pZ´ , ďq.)
(9) On sait qu’un ensemble de sous-ensembles d’un ensemble est toujours par-
tiellement ordonné par l’inclusion. À isomorphisme près ce sont les seuls
ordres qui existent ! (Indication : essayez la preuve de proposition 3.18.)
(10) Montrez que, si α est un ordinal,
– ou bien α est un ordinal limite ;
– ou bien il existe n P ω et un ordinal limite β tels que α “ β ` n.
(Indication : utilisez proposition 3.8.)
(11) Soit pX, ďq un ordre total. Un segment initial de X est un sous-ensemble
S Ă X tel que pour tout s P S, tout x ă s est dans S.
(a) Si pX, ďq est bien ordonné et S est un segment initial de X il existe
a P X tel que S “ Xa .
(b) Trouvez un exemple d’un ordre total pX, ďq avec un segment initial S
qui n’est pas de la forme Xa pour a P X.

51
52 4. EXERCICES

pñq
p ñ q
1 1 1
0 1 1
1 0 0 p q
0 1 0

Figure 1. Tableau de vérité et diagramme de Venn pour p ñ q

2. La logique des propositions


Une formule dans la logique des propositions est chaque expression construite
de la manière suivante :
F1: les lettres propositionnelles p, q, r, . . . sont des formules ;
F2: K est une formule ;
F3: si ϕ est une formule, alors aussi la suite ϕ est une formule ;
F4: si ϕ et ψ sont des formules, aussi pϕ ^ ψq, pϕ _ ψq, pϕ ñ ψq et pϕ ô ψq
sont des formules.
En donnant des valeurs de vérité (1 : vrai ou 0 : faux) aux lettres propositionnelles
qu’elle contient (et 0 à K), une formule devient vraie ou fausse conformément au
sens usuel des connectifs , ^, _, ñ et ô.
(1) Donnez des exemples d’expressions qui ne sont pas des formules.
(2) Réalisez le tableau de vérité et le diagramme de Venn des formules sui-
vantes 1 (voir figure 1) :

(a) p ^ q (i) pp ñ qq ^ pp ^ qq
(b) pp ñ qq (j) pp ñ qq ñ p p ñ qq
(c) pp _ qq ^ p (k) pp ñKq ô p
(d) pô q (l) pp ñ qq ^ pp p ñ qq ^ qq
(e) p _ p (m) pp ô pq ^ qqq
(f) pô p (n) pp ^ qq ô pp _ qq
(g) p ñ pq _ pq (o) ppp ñ qq ñ pq ñ p
(h) pp ^ qq _ p p ^ qq (p) p p ñ pq ñ p

(3) Classez ces formules en lois logiques (tautologies : vraie dans toute
réalisation, toute réalisation est un modèle), contradictions (vraie dans
aucune réalisation, il n’y a pas de modèles) et formules contingentes
(vraie dans certaines réalisations (= les modèles), fausse dans d’autres).
Quand ϕ est une tautologie on écrit ( ϕ. Deux formules ϕ et ψ sont équivalentes
quand la formule pϕ ô ψq est une tautologie, ( pϕ ô ψq. Il suffit de contrôler que
tout modèle de l’une formule est aussi modèle de l’autre.
(4) Montrez que t , ^, _u est fonctionnellement complet : toute formule
ϕ est équivalente à une formule ψ qui ne contient que les connectifs , ^
et _.
(5) Aussi t , ^u et tñ, Ku sont fonctionnellement complets.

1. S’il n’y a pas de confusion possible on n’écrit pas les parenthèses extérieures.
2. LA LOGIQUE DES PROPOSITIONS 53

$ ϕ ñ pψ ñ ϕq
$ pϕ ñ pψ ñ χqq ñ ppϕ ñ ψq ñ pϕ ñ χqq
$p ϕñ ψq ñ pψ ñ ϕq

Figure 2. Les axiomes de Łukasiewicz

(6) Le connectif nor « ni p, ni q » est normalement écrit Ó. La formule p Ó q


n’est vraie que quand p et q sont tous les deux faux. Exprimez Ó en termes
des connectifs connus. Montrez que tÓu est fonctionnellement complet.
Cette approche à l’équivalence de formules qui passe par ce que ces formules si-
gnifient en termes de vérité s’appelle sémantique. Il y a aussi une approche syn-
taxique qui reste purement formelle, où des théorèmes sont déduits de certains
axiomes de base en utilisant de règles de déduction. On écrit $ ϕ si la formule ϕ
est un théorème. On considère le système de Hilbert trouvé par Łukasiewicz qui
est très compact : il y a une seule règle de déduction, le modus ponens
$ pϕ ñ ψq, $ϕ

et un système d’axiomes comme ceux dans figure 2. (Plusieurs variations existent.)
Ici on traitera ϕ comme une abréviation de ϕ ñK ; on écrira ϕ _ ψ pour ϕ ñ ψ,
etc.
(7) Montrez que, pour n’importe quel choix de formules ϕ et ψ, les formules
qui apparaissent dans les axiomes de figure 2 sont des tautologies.
(8) Démontrez les théorèmes suivants.

(a) $ ϕ ñ ϕ (c) $ ϕ _ ϕ
(b) $ ϕ ô ϕ (d) $ p ϕ ñ ϕq ñ ϕ

Heureusement il y a des systèmes de déduction plus efficaces, comme la déduction


naturelle et le calcul des séquents.
Alors que la déduction à la Hilbert manipule et démontre des théorèmes, la
déduction naturelle démontre des propositions sous des hypothèses et quand il
n’y a pas (plus) d’hypothèses, ce sont des théorèmes. Pour dire qu’une proposition ϕ
est conséquence d’un ensemble Γ d’hypothèses, on écrit Γ $ ϕ. Donc H $ ϕ est
équivalent à $ ϕ. Alors que dans la déduction à la Hilbert, il n’y a qu’une règle
et plusieurs axiomes, dans la déduction naturelle il y a un seul axiome et plusieurs
règles. Pour chaque connecteur, on classe les règles en règles d’introduction et en
règles d’élimination. L’axiome est
Γ, ϕ $ ϕ.
La règle d’introduction de l’implication :
Γ, ϕ $ ψ
Γ $ pϕ ñ ψq
La règle d’élimination de l’implication :
Γ $ pϕ ñ ψq Γ$ϕ
Γ$ψ
Les deux règles d’introduction de la disjonction, droite et gauche :
Γ$ϕ Γ$ψ
Γ $ pϕ _ ψq Γ $ pϕ _ ψq
54 4. EXERCICES

La règle d’élimination de la disjonction :


Γ $ pϕ _ ψq Γ, ϕ $ ρ Γ, ψ $ ρ
Γ$ρ
L’introduction du faux :
Γ$ϕ Γ$ ϕ
Γ $K
La règle d’élimination du faux :
Γ $K
Γ$ϕ
En outre, il faut une règle qui est la réduction à l’absurde, nécessaire en logique
classique :
Γ, ϕ $K
Γ$ϕ
On remarquera que la règle d’élimination de l’implication est très proche du modus
ponens, d’ailleurs on l’appelle aussi modus ponens.
(9) Les formes de raisonnement suivantes sont correctes. Trouvez une déduc-
tion naturelle qui les prouve.
(a) pϕ ñ ψq, pψ ñ ρq, ϕ $ ρ
(b) pϕ _ ψq $ pψ _ ϕq
(c) pϕ ñ pψ _ ρqq, ϕ, ψ $ ρ
(d) pϕ ñ pψ _ ρqq, ψ, ρ $ ϕ
(e) ϕ, pϕ ô ψq $ ψ
(f) ppϕ _ ψq ñ ρq, ppψ ^ ρq ñ ϕq, ψ $ pϕ ô ρq
(g) pϕ ñ ψq, ppϕ _ ρq ñ ψq $ ρ
(h) pϕ ñ pψ ^ ρqq, pψ ^ ρq $ ϕ
(i) pϕ _ ψq, pϕ ñ ρq, pψ ô τ q $ pρ _ τ q
(j) pϕ ñ ψq $ pϕ ^ ψq
(k) pϕ ^ ψq $ pϕ ñ ψq
(l) pϕ ^ ϕq $K
(m) ppϕ _ ϕq ñ ψq $ ψ
(n) p ϕ ñ ψq $ pϕ _ ψq
(o) ppϕ ñ ψq ñ ρq, ρ $ pϕ ^ ψq
(p) pϕ ^ p ψ ñ ρqq, pϕ ñ ρq $ ψ
(10) Démontrez les théorèmes de (8) en utilisant la déduction naturelle.
Syntaxe et sémantique sont compatibles dans le sens que
( ϕ si et seulement si $ ϕ :
une formule ϕ est une tautologie précisément quand elle est un théorème. L’im-
plication p( ϕq ñ p$ ϕq qui signifie que tout ce qui est vrai peut être déduit
s’appelle la complétude de la logique des propositions. Que le calcul proposition-
nel est correct—tout théorème est tautologie—est exprimé par l’autre implication
p( ϕq ð p$ ϕq. Un autre aspect important de ce système est sa consistance ou
cohérence : il n’existe pas de ϕ tel que $ ϕ et $ ϕ.
3. LA LOGIQUE DES PRÉDICATS 55

3. La logique des prédicats


Si une proposition est une assertion ayant une valeur de vérité, un prédicat est
lui une proposition dont la valeur de vérité dépend de variables qu’elle renferme.
On se donne pour alphabet :
– des symboles appelés variables : x, y, z, . . .
– des symboles appelés constantes : a, b, c, . . .
– des symboles de prédicats : P , Q, R, . . .
Chaque symbole de prédicat a une arité qui détermine le nombre d’arguments ou
d’objets auxquels il est appliqué. Par exemple, le prédicat B pour « est bleu(e) »
a une arité d’un, tandis que le prédicat “ pour « est égal à » a une arité de deux
et K pour la proposition « faux » a une arité de zéro. En fait, les propositions sont
précisément les prédicats d’arité zéro.
– Les symboles @ et D, appelés quantificateurs ;
– les symboles , ^, _, ñ, ô, les connectifs du calcul des propositions ;
– les symboles de ponctuation q et p.
Les formules du calcul des prédicats du premier ordre sont les suivantes, et uni-
quement les suivantes :
P1: P pt1 , . . . , tn q, si P est n-aire et tout ti est une variable ou une constante ;
P2: si ϕ est une formule, alors aussi Dtϕ et @tϕ, où t est une variable, sont
des formules ;
P3: si ϕ est une formule, alors aussi la suite ϕ est une formule ;
P4: si ϕ et ψ sont des formules, aussi pϕ ^ ψq, pϕ _ ψq, pϕ ñ ψq et pϕ ô ψq
sont des formules.
On appelle énoncé ou formule close une formule dont toutes les variables sont
liées par un quantificateur (donc qui n’a pas de variable libre).
(1) Dans les expressions suivantes,
– x, y et z sont des variables,
– P , Q sont des symboles de prédicats unaires,
– R est un symbole de prédicat binaire, et
– a et b sont des constantes.
Repérez dans la liste les formules. Si une expression est mal formée, pro-
posez une correction.

(a) Rpy, aq (l) pP paq ñ Qpbqq


(b) Rpa, bq (m) @xpP ^ Qqpxq
(c) @x@y@yP px, yq (n) D@zP pzq
(d) pDxP pxqq ^ p@yQpyqq (o) p@xP pxqq ñ Qp aq
(e) DzpP pzq ñ Qpzqq
(p) D xQpxq
(f) @y DxP px ^ yq
(q) Rpbq
(g) ppDaP paqq ^ pDxP pxqqq
(h) @xDy@zpP pxq ñ P pzqq (r) @P DQpP paq _ Qpaqq
(i) @xDypQpyq ñ @z P pzqq (s) Dz@yRpz, yq
(j) pQpyq ñ DypQpyq _ P pyqqq (t) @xRpx, xq
(k) P paq ô Qpaq (u) DxRpx, bq

À partir de maintenant on enlève ou on ajoute des parenthèses pour augmenter


la lisibilité quand cela ne provoque pas de confusion.
La sémantique du calcul des prédicats fonctionne de manière suivante. Un
réalisation (un « monde ») d’un langage du premier ordre est un ensemble dans
56 4. EXERCICES

lequel on donne un sens aux symboles du langage. On peut alors attribuer une
valeur de vérité (vrai ou faux) aux formules du langage dans cette réalisation.
(2) Considérons l’ensemble X “ t‚, ˝, ‚, ˝, ˛, ˛u. On considère le langage pré-
dicatif et l’interprétation des symboles suivants : les variables x, y, z, . . .
qui représentent des éléments de X, les constantes
a “ ‚, b “ ˝, c “ ‚, d “ ˝, e “ ˛, f “˛
et les prédicats
Bpxq “ « x est blanc »
N pxq “ « x est noir »
Cpx, yq “ « x est de la même couleur que, mais différent de, y »
F px, yq “ « x est de la même forme que, mais différent de, y »
Lpx, yq “ « x est dans la même colonne que, mais différent de, y ».
Plaçons-nous dans le monde M1 suivant :
˝ ‚
˛ ‚
˛ ˝
(a) Quelles valeurs peut-on attribuer aux variables libres des formules
suivantes pour que ces formules soient satisfaites dans la réalisa-
tion M1 ? Attribuez une valeur à chaque variable (il y a parfois plu-
sieurs possibilités).
(i) pCpx, yq ^ Lpy, zqq ^ Bpzq
(ii) Cpe, xq
(iii) pF px, cq _ F px, eqq ^ pF py, aq ^ Lpx, yqq
(iv) F px, aq ^ Cpx, dq
(v) pN pxq ñ Lpx, yqq ^ F pz, yq
(vi) Bpxq ñ N paq
(vii) pBpxq ^ F px, aqq _ pN pxq ^ Lpx, dqq
(viii) pCpx, yq ^ Lpx, yqq
(b) Pour les formules qui suivent, on décide d’attribuer ‚ comme valeur
à la variable libre x. Dessiner alors pour chacune des formules un
monde dans lequel elle est satisfaite (c.à.d., répartir les six objets
de X dans les trois colonnes).
(i) Lpx, cq ^ Lpx, dq
(ii) Lpx, eq ô Lpx, f q
(iii) pBpxq ñ Lpx, dqq ^ pN pxq ñ Lpx, cqq
(iv) @ypN pyq ñ Lpx, yqq
(v) DypF px, yq ^ Lpx, yqq ^ DypF pc, yq ^ Lpx, yqq
(vi) DyLpy, xq _ @ypCpy, xq ñ Lpy, xqq
(c) Dans les formules qui suivent, certaines variables sont libres et d’au-
tres sont liées. Repérer les variables libres et leur attribuer une valeur
afin que la formule soit satisfaite dans la réalisation M1 .
(i) DxLpx, yq
(ii) DypBpyq ^ Lpz, yqq
(iii) Bpxq ^ @ypLpx, yq ñ Bpyqq
3. LA LOGIQUE DES PRÉDICATS 57

(iv) DxpLpx, yq ^ pCpx, yq _ F px, yqqq


(v) @zpCpx, zq ñ Lpx, zqq
(vi) DxpF px, cq ^ Lpx, yqq _ DxpF px, eq ^ Lpx, yqq
(vii) @y pLpx, yq ^ Cpx, yqq
(viii) DxpN pxq ^ Lpy, xqq ^ DzpF pz, dq ^ Lpz, yqq
(d) On change à présent de monde et se place dans le monde M2 suivant.
˛ ‚
˝ ‚
˝ ˛
Refaites les points (a) et (c) dans cette nouvelle réalisation.

On dit qu’une formule ϕ du langage est une loi logique si cette formule est
vraie dans toute réalisation du langage, ce qu’on note ( ϕ. (Donc toute réalisa-
tion est un modèle de ϕ, cf. les tautologies dans le calcul des propositions.) Une
formule ψ est une conséquence logique d’une formule ϕ si tout modèle de ϕ est
aussi un modèle de ψ ; on écrit ϕ ( ψ. Deux formules ϕ et ψ sont équivalentes
quand ( pϕ ô ψq.
(3) Montrez que, si P désigne un prédicat binaire quelconque, la formule
Dx@yP px, yq ñ @yDxP px, yq
est une loi logique. Par contre, la formule
@yDxP px, yq ñ Dx@yP px, yq
ne l’est pas : trouvez un contre-exemple.
(4) Montrez qu’une formule ψ est une conséquence logique de ϕ si et seule-
ment si pϕ ñ ψq est une loi logique. Que peut-on alors conclure pour les
équivalences ?
(5) Dans la liste suivante, trouvez les formules équivalentes.

(a) DxpP pxq ^ Qpxqq (g) @xP pxq _ DxQpxq


(b) @xpP pxq ^ Qpxqq (h) p@xP pxq ^ @xQpxqq
(c) Dxp P pxq _ Qpxqq (i) @xP pxq _ DxQpxq
(d) @xpP pxq _ Qpxqq (j) @x pP pxq ^ Qpxqq
(e) @xP pxq ^ @xQpxq (k) Dx pP pxq _ Qpxqq
(f) DxP pxq ^ Dx Qpxq (l) DxP pxq ^ DxQpxq

(6) Une paire pX, ăq est un ensemble strictement ordonné quand ă est
une relation sur l’ensemble X qui satisfait les deux formules suivantes :
τ : @x@y@zppx, y, zq P X 3 ^ ppx ă y ^ y ă zq ñ x ă zqq ;
α: @x@yppx, yq P X 2 ^ ppx ă yq ñ py ă xqq.
C’est à dire, pX, ăq est un modèle pour τ ^ α. Montrez que l’axiome de
totalité, i.e. la formule
σ: @x@yppx, yq P X 2 ^ ppx ă yq _ px “ yq _ py ă xqq
est indépendant de τ ^ α : ni la formule σ, ni sa négation σ n’est une
conséquence de τ ^ α. (Donnez des contre-exemples.)
58 4. EXERCICES

Comme dans le cas des propositions, il y a l’approche syntaxique où des règles


de déduction servent à la déduction de théorèmes de certains axiomes de base.
On écrit de nouveau $ ϕ si la formule ϕ est un théorème. On peut simplement
étendre le système de déduction naturelle des propositions avec des règles pour
l’introduction et d’élimination pour les quantificateurs. On commence avec la règle
d’introduction du quantificateur universel :
Γ$ϕ
,
Γ $ @xϕ
à condition que la variable x n’apparait dans aucune des formules de Γ. La règle
d’élimination du quantificateur universel :
Γ $ @xϕ
,
Γ $ ϕrt{xs
où ϕrt{xs signifie que la nouvelle constate ou variable t remplace la variable libre x
dans ϕ—à condition que ce remplacement n’introduit pas de nouveaux liens. La
règle d’introduction du quantificateur existentiel :
Γ $ ϕrt{xs
,
Γ $ Dxϕ
si le remplacement n’introduit pas de nouveaux liens. Sous la même condition on a
la règle d’élimination du quantificateur existentiel :
Γ $ Dxϕ Γ, ϕrt{xs $ ψ
.
Γ$ψ
(7) Si cette substitution est légitime, écrivez ϕry{xs pour les formules ϕ sui-
vantes.

(a) DypP pyq _ Qpxqq (e) Rpx, x, aq ^ P pyq


(b) @yDxRpx, yq (f) DyRpx, x, aq ^ P pyq
(c) DxRpx, yq (g) DyRpx, x, aq
(d) Rpx, x, aq (h) @xRpxq ^ P pyq

(8) Vrai ou faux ? Donnez une déduction naturelle ou un contre-exemple.


(a) @zApzq $ Apaq ^ Apbq
(b) DxQpxq $ Qpaq _ Qpbq
(c) Qpaq _ Qpbq $ DxQpxq
(d) P pcq $ @yP pyq
(e) @xP pxq, @xpP pxq ñ Qpxqq $ Qpaq
(f) P pbq, DxpP pxq ñ Qpxqq $ Qpbq
(g) @xpBpxq _ Apxqq, Apcq $ Bpcq
(h) DyBpyq, @ypApyq ñ Bpyqq $ DyApyq
(i) P paq, Bpbq $ @xpP pxq ñ Bpxqq
(j) DxP pxq, DxBpxq $ DxpP pxq ^ Bpxqq
(k) $ p Qpaq ^ P paqq ñ DxpQpxq ñ P pxqq
(l) @zBpzq ^ @zQpzq $ @zpBpzq ^ Qpzqq
(m) DxBpxq, @xpBpxq ñ Apxqq $ DxpApxq _ P pxqq
(n) @y pApyq _ Qpyqq $ Dyp Apyq ^ Qpyqq
(9) Trouvez une déduction naturelle qui montre que les raisonnements sui-
vants sont corrects :
3. LA LOGIQUE DES PRÉDICATS 59

(a) P pbq $ DxpP pxq _ Qpxqq


(b) @xpP pxq _ Qpxqq, Qpbq $ P pbq
(c) P paq, Qpaq $ DxpP pxq ^ Qpxqq
(d) p@xApxq ^ @xBpxqq $ @xpApxq ^ Bpxqq
(e) $ DxpApxq ^ Apxqq
(f) DxpRpxq ^ Qpxqq $ pRpaq ñ Qpaqq
(g) DxpRpxq ^ Qpxqq $ pDxRpxq ^ DxQpxqq
(h) DxpApxq _ Qpxqq, @x Qpxq $ DxApxq
(i) Dx@yRpx, yq $ @yDxRpx, yq
(j) @xpP pxq ^ Qpxqq $ @yP pyq ^ @zQpzq
Comme pour la logique des propositions, syntaxe et sémantique sont compatibles :
le calcul des prédicats (du premier ordre) est complet et correct,
( ϕ si et seulement si $ ϕ.
Une formule ϕ est donc une loi logique précisément quand elle est un théorème.
60 4. EXERCICES

4. Opérations sur les cardinaux


(1) Si X est fini et Y Ď X, alors Y est fini.
(2) Si X est fini, alors |PpXq| “ 2|X| . (Indication : donnez une preuve par
induction.)
(3) Tout sous-ensemble infini d’un ensemble dénombrable est dénombrable.
(4) Montrez que l’ensemble des entiers premiers est dénombrable.
(5) Montrez que N˚ , l’ensemble des suites finies de nombres naturels, est dé-
nombrable.
(6) Est-ce que AN et B N équipotents implique A et B équipotents ?
(7) Donnez une preuve pour les égalités dans proposition 7.4, chapitre 2.
(8) Donnez une preuve directe pour l’égalité ℵα “ ℵα ` ℵα de proposition 7.9
du chapitre 2 en exprimant ℵα comme une union disjointe de deux en-
sembles de cardinalité ℵα .
(9) Donnez une preuve directe pour l’égalité ℵβ “ n ¨ ℵβ de proposition 7.8
du chapitre 2 en construisant une bijection entre ℵβ et n ¨ ℵβ .
(10) Si X est l’image de ℵβ par une fonction f , alors |X| ď ℵβ .
(11) Si X est un sous-ensemble de ℵα tel que |X| ă ℵα , alors |ℵα zX| “ ℵα .
(12) L’hypothèse du continu (CH) dit qu’il n’y a pas de cardinaux entre ℵ0
et i0 “ 2ℵ0 . Assumant la négation de (CH), trouvez un majorant pour le
nombre de cardinaux entre ℵ0 et i0 .
(13) Trouvez la cardinalité de CpR, Rq “ tf P RR | f continuu.
5. L’AXIOME DU CHOIX 61

5. L’axiome du choix
(1) Soit pA, ďq totalement ordonné et X Ď PpAq tel que tout élément de X
est fini mais non-vide. Alors X a une fonction de choix.
(2) Tout ensemble infini a un sous-ensemble dénombrable.
(3) Si tout ensemble est équipotent à un ordinal, (AC) est valide.
(4) Un ensemble est infini si et seulement si il est équipotent à un sous-
ensemble strict.
(5) r0, 1sN ‰ H et t˚, ¨, ‹uR ‰ H
ś
(6) Soit Xn “ Nzn, alors nPω Xn ‰ H
(7) « Tout monomorphisme d’ensembles est scindé » : vrai ou faux ?
L’axiome du choix dépendant (ACD) est l’énoncé suivant : « Pour tout
ensemble E, pour toute relation binaire sur E telle que @x P E Dy P E xRy,
pour tout e P E, il existe une suite pxn qnPN telle que x0 “ e et pour tout n P N,
xn Rxn`1 . »
L’axiome du choix dénombrable (ACω ) est la version de l’axiome du choix
dans le cas dénombrable. Par exemple, l’énoncé « Le produit de toute famille dé-
nombrable d’ensembles non-vides est non-vide. »
(8) Montrez que (AC) implique (ACD) et (ACω ). (Indication pour (ACD) :
utilisez le lemme de Zorn sur l’ensemble
tx : N Ñ E | N Ď N segment initial, @n P N pn ` 1 P N ñ xn Rxn`1 qu
ordonné par l’inclusion ; voir la définition sur la page 51.)
(9) Complétez la preuve de l’implication (3) ñ (2) dans la proposition 3.5,
chapitre 2, en expliquant pourquoi pxn qnPN est une séquence dans le sens
formel.
(10) Montrez que (ACD) implique (ACω ).
(11) Montrez que sous (ACω ), la réunion d’une famille dénombrable d’en-
sembles dénombrables est dénombrable. Et sans (ACω ) ?
(12) Montrez que le lemme de Zorn se déduit du principe de maximalité
de Hausdorff : soit pE, ďq un ensemble ordonné, alors l’ensemble des
chaînes de pE, ďq, ordonné par l’inclusion, possède un élément maximal.
(13) Montrez que (AC) implique le principe de maximalité de Hausdorff. (In-
dication : passez par le lemme de Zorn.)
Table des matières

Chapitre 1. Introduction 3
1. Les paradoxes, et comment les éviter 3
2. Bibliographie 4
Chapitre 2. La théorie naïve des ensembles : les ordinaux et les cardinaux 5
1. Introduction 5
2. Comment comparer deux ensembles ? 5
3. Les ensembles bien ordonnés 9
4. Les ordinaux 14
5. Les ordinaux comme un système de nombres 18
6. Les cardinaux 21
7. Opérations sur les cardinaux 25
8. Conclusion 29

Chapitre 3. La théorie axiomatique des ensembles 31


1. Introduction 31
2. Un langage formel pour la théorie des ensembles 32
3. Une interprétation classique de (ZF) 35
4. Les axiomes de Zermelo et Fraenkel 36
5. (ZF) est assez riche 38
6. Les classes dans (ZF) et dans (NBG) 42
7. L’axiome du choix 43
8. Cohérence 48
Chapitre 4. Exercices 51
1. Ordres 51
2. La logique des propositions 52
3. La logique des prédicats 55
4. Opérations sur les cardinaux 60
5. L’axiome du choix 61

63

Vous aimerez peut-être aussi