Académique Documents
Professionnel Documents
Culture Documents
Introduction
2. Bibliographie
[1] E. Colebunders, Wiskundige methodenleer. Fundamenten van de Wiskunde, Vrije Universiteit
Brussel, 2000
[2] K. J. Devlin, Fundamentals of Contemporary Set Theory, Springer, 1979
[3] K. Hrbacek, K. T. Jech, Introduction to Set Theory, 3rd Edition, Marcel Dekker, 1999
[4] T. Lucas, I. Berlanger, I. De Greef, Initiation à la logique formelle, De Boeck, 2003
Ce texte est basé sur les notes du cours [1]. Les autres références de base sont [2]
et [3] pour la théorie, [4] pour les exercices, et Wikipédia un peu pour tout.
CHAPITRE 2
1. Introduction
Ce sont des problèmes dans la mathématique elle-même (plus précisément,
en analyse) qui à la fin du XIXe siècle mènent vers l’invention de la théorie des
ensembles. Là où auparavant on ne considérait que des ensembles finis, naissait
le besoin d’admettre aussi des ensembles infinis dans la formulation de certains
théorèmes en analyse. Déjà dans le travail de Bolzano, et plus tard dans le travail
de Cantor sur les séries trigonométriques, il devenait nécessaire de considérer des
parties infinies de R.
En 1872 Cantor publie un travail de pionnier sur la théorie des ensembles. La
définition d’un ensemble infini, l’équipotence de Q et N, la non-équipotence de R
et N, l’équipotence de Rn et R sont toutes de sa main. Toute la construction des
théories des ensembles ordonnés et bien ordonnés, de la cardinalité, du principe
de l’induction transfinie sont dus à Cantor. On développera cette théorie dans le
chapitre présent.
En conséquence du travail innovateur de Cantor, au début du XXe siècle la
théorie des ensembles devient la fondation des mathématiques. Les nombres naturels
sont dorénavant définis en termes d’ensembles, et les axiomes de Peano peuvent être
déduits.
En outre, le développement de la théorie des ensembles stimulait la naissance
de structure mathématiques abstraites comme les espaces métriques, topologiques
ou vectoriels, les groupes, les structures ordonnés, les espaces de Hilbert et de
Banach, etc. Les résultats de Cantor sur l’induction transfinie ont des conséquences
profondes pour l’analyse.
Il y a deux problèmes que Cantor ne pouvait pas résoudre et qui sont intéres-
sants pour nous :
– la question si tout ensemble peut être bien ordonné ;
– la question si toute partie infinie de R qui n’est pas équipotente à N est
équipotente à R même.
On verra que la première est liée à l’axiome du choix et au lemme de Zorn, et la
réponse positive sur la deuxième est connue comme l’hypothèse du continu.
p´1, 0q p0, 0q ,2 p0, 1q p0, 2q
LR
p´1, ´1q ,2 p0, ´1q ,2 p1, ´1q ,2 p2, ´1q
A0
B0
A1
B1
(3) Z ď Q car Z Ă Q.
(4) Q ď Z ˆ N car on a l’injection
p
Q Ñ Z ˆ N: ÞÑ pp, qq
q
où p, q P Z sont relativement premiers et q est positif.
(5) Q ď R car Q Ď R. On montrera plus tard (dans exemple 2.10) que l’inéga-
lité est stricte.
(6) R « s ´ π2 , π2 r : la tangente définit une bijection tan : s ´ π2 , π2 r Ñ R.
(7) s´1, 1r « s´ π2 , π2 r : on peut prendre sin : s´ π2 , π2 r Ñ s´1, 1r ou la function
x ÞÑ 2x
π .
(8) Étant donné un ensemble X, on écrit PpXq pour l’ensemble des sous-
ensembles de X, donc
PpXq “ tY | Y Ď Xu,
et 2X pour l’ensemble des fonctions X Ñ 2 “ t0, 1u. On a PpXq « 2X , car
tout sous-ensemble Y de X est complètement déterminé par sa fonction
caractéristique
#
1, si x P Y
δY : X Ñ 2 : x ÞÑ
0, si x R Y .
Y gpY q
X f pXq gpf pXqq
f g
la zone blanche reste sur place, la zone grise bouge un pas vers l’intérieur. Ce g est
certainement injectif, car f et 1D sont des injections et leurs images sont disjoints.
On montre que gpAq “ B :
ď8 ď8 ď8 ď8 ď8
f pCq “ f pCn q “ f pAn zBn q “ An`1 zBn`1 “ Cn`1 “ Cn
n“0 n“0 n“0 n“0 n“1
et 1D pDq “ D.
Proposition 2.7 (Cantor–Bernstein). Soient X et Y des ensembles. S’il existe
une injection de X dans Y et une injection de Y dans X alors il existe une bijection
entre X et Y , c’est à dire, la relation ď est antisymétrique.
Démonstration. Soient f : X Ñ Y et g : Y Ñ X deux injections. Alors
g ˝f : X Ñ X
est une injection et gpf pXqq Ď gpY q Ď X. Bien sûr g ˝f est bijectif sur son image
gpf pXqq—voir figure 3. Proposition 2.6 nous donne une bijection X Ñ gpY q. L’in-
verse de la co-restriction de g à son image forme une bijection gpY q Ñ Y .
g˝f
«
,2 gpY q lr
«
gpf pXqq ,2 X
Ď LR Ď
g|gpY q «
f
y
Y
Leur composée est une bijection X Ñ Y .
On conclut que ď est un ordre partiel. Une question naturelle est, si cet ordre
est total : étant donné deux ensembles X et Y , a-t-on toujours X ď Y ou Y ď X ?
La réponse classique (proposition 6.7) dépend de l’axiome du choix, qui implique
que chaque ensemble peut être bien ordonné (chapitre 3, proposition 7.9).
Exemples 2.8. (1) Q « N car N ď Z ď Q ď Z ˆ N ď Z ˆ Z “ N comme
expliqué dans les exemples 2.5.
(2) r0, 1s « s ´ 1, 1r car r0, 1s Ď s ´ 2, 2r donc r0, 1s ď s ´ 2, 2r “ s ´ 1, 1r , et
s ´ 1, 1r ď r0, 1s car
s ´ 1, 1r Ď r´1, 1s « r0, 2s « r0, 1s.
A “ tx P X | x R f pxqu.
Exemple 2.10. Comme annoncé dans exemple (5) de 2.5, l’inégalité dans Q ă R
est stricte. Pour voir que
N ă PpNq “ R,
par les résultats précédents il suffit de monter que 2N « r0, 1s. En effet, 2N « PpNq
par exemple (8) de 2.5 et R « r0, 1s par exemples (6) et (7) de 2.5 combiné avec
exemple (2) de 2.8.
On montre que 2N ď r0, 1s et r0, 1s ď 2N pour ensuite utiliser proposition 2.7.
Considérons les éléments de 2N comme des séquences pxn qnPN dans t0, 1u. Étant
donné une telle séquence de zéros et de uns, on peut la voir comme l’expan-
sion décimale d’un nombre réel dans l’intervalle r0, 1s. Par exemple, la séquence
1010101010 . . . ou, plus précisément,
#
1, si n est pair
pxn qn : N Ñ 2 : n ÞÑ xn “
0, si n est impair
représente le nombre
10
0, 10101010101010 ¨ ¨ ¨ “ .
99
(Les incrédules vérifieront que le nombre x “ 0, 101010101010 . . . est une solution de
l’équation 100x ´ x “ 10.) Ceci définit une injection 2N Ñ r0, 1s. Réciproquement,
tout nombre de l’intervalle r0, 1s a une expansion binaire, donc peut être représenté
comme une suite de zéros et uns, donc comme un élément de 2N . Ceci définit une
injection r0, 1r Ñ 2N .
(Ici il faut faire attention car les expansions binaires (ou décimales) ne sont pas
toujours uniques ; mais il suffit de choisir la plus petite dans l’ordre lexicographique
pour définir une fonction. Par exemple,
1
0, 0111111 ¨ ¨ ¨ “ 2 “ 0, 100000 ¨ ¨ ¨
X
1
‚ 3
0 ‹
¨ 2
˝
t0, 1, 2u
¨¨¨ ¨¨¨
0 1 2 n n`1
(3) Les ensembles ordonnés pt0, . . . , n ´ 1u, ďq et pN, ďq sont bien ordonnés,
ainsi que 2N avec l’ordre induit, et N Y t8u où @n P N : n ă 8.
(4) L’ensemble vide H avec son ordre canonique est bien ordonné.
Remarquons qu’un sous-ensemble d’un ensemble bien ordonné, muni de l’ordre
induit, est toujours bien ordonné.
Proposition 3.5. Soit pX, ďq un ensemble partiellement ordonné. Alors les
conditions suivantes sont équivalentes :
(1) pX, ďq est bien ordonné ;
(2) pX, ďq est totalement ordonné et tout sous-ensemble non-vide de X a un
élément minimal ;
(3) pX, ďq est totalement ordonné et il n’y a pas de séquences strictement
descendantes dans X.
Démonstration. (1) ñ (2) parce que toute paire tx, yu dans X a un mini-
mum, c’est à dire que x ď y ou y ď x.
(2) ñ (1) car dans un ensemble totalement ordonné tout élément minimal est
un minimum.
(2) ñ (3) par sa contraposée (3) ñ (2) : on suppose que pX, ďq est totale-
ment ordonné et pxn qnPN est une séquence strictement descendante
x0 ą x1 ą ¨ ¨ ¨ ą xn ą ¨ ¨ ¨
dans X. Alors Y “ tx0 , x1 , . . . , xn , . . .u n’a pas d’élément minimal.
(3) ñ (2) via (2) ñ (3) : soit pX, ďq totalement ordonné et Y Ď X, Y ‰ H,
sans élément minimal. On choisit x0 P Y et on prend x1 P Y tel que x0 ą x1 .
Après avoir choisi x0 , . . ., xn on prend xn`1 P Y tel que xn ą xn`1 . Alors la
séquence x “ pxn qnPN définie de telle manière inductive est strictement descendante
dans pX, ďq.
(comme fonctions définies sur R0 ). Que faut-il faire pour assurer que tous les domi-
nos tombent, ou pour prouver que l’égalité
dxn
“ nxn´1 (A)
dx
est valide pour n’importe quel n P N ? Il faut mettre les dominos assez proches l’un
de l’autre, et il faut pousser le premier. Donc il suffit que
(1) P p0q est vrai
(2) si P pnq est vrai, alors P pn ` 1q est vrai
et P pnq sera vrai pour tout n P N. La preuve de (A) suit ce modèle : certainement
la dérivée de 1 est 0 donc Qp0q est vrai, et si Qpnq est vrai alors
n`1
d
dx px q “ d
dx px ¨ xn q “ d
dx pxq ¨ xn ` x ¨ d n
dx px q
“ x ` x ¨ nxn´1 “ pn ` 1qxn .
n
Il existe aussi la version a priori plus forte (mais, en fait, équivalente) suivante qui
s’appelle induction complète :
(1) P p0q est vrai
(2) si P piq est vrai pour tout 0 ď i ď n, alors P pn ` 1q est vrai
et P pnq sera vrai pour tout n P N.
Exemple 3.7. On montre que tout nombre naturel ą 1 est un produit de
nombres premiers. Soit
P pnq “ « n ` 2 est un produit de nombres premiers ».
Certainement P p0q est vrai car 2 est un nombre premier. Soit donc n ě 0. Ou
bien pn ` 1q ` 2 est un nombre premier et il n’y a rien a prouver. Ou bien pn ` 1q ` 2
est un produit kl avec 1 ă k, l ă n ` 3. Alors k et l sont produits de nombres
premiers par l’hypothèse d’induction.
En fait, les preuves ou les constructions par induction, jusqu’à présent utilisées
pour montrer des propriétés pour chaque élément d’un ensemble fini ou dénom-
brable, sont également valides pour n’importe quel ensemble bien ordonné. Cette
technique de preuve n’a donc pas à voir avec la taille d’un ensemble, mais tout avec
des propriétés d’ordre. On pourrait dire que dans ce cas-là, le bon ordre sur l’en-
semble met ses éléments sur une seule ligne très très longue. Le prochain résultat
forme la base de ce que plus loin on appellera « l’induction transfinie. »
Proposition 3.8. Soit pX, ďq bien ordonné et E Ď X. Si
(1) le minimum de X appartient à E
(2) pour tout x P Xztmin Xu : py ă x ñ y P Eq ñ x P E
alors E “ X.
Il faut voir E comme un sous-ensemble d’éléments de X avec une certaine pro-
priété : on veut montrer que chaque élément de X a cette propriété. Par exemple, en
prenant X “ N et E “ tn P N | P pnq est vraiu on retrouve le principe d’induction
complète.
Remarquons que l’hypothèse (1) + (2) peut être formulée dans une seule
phrase :
@x, y P X : py ă x ñ y P Eq ñ x P E.
En effet, x “ min X implique y ă x, donc x P E.
Par contre, (1) est nécessaire, car toujours E “ H satisfait (2).
3. LES ENSEMBLES BIEN ORDONNÉS 13
ă a X
Xa
X
ă a
Xa
b
Xb
4. Les ordinaux
Notre but est maintenant de trouver des représentants pour les classes d’équi-
valence de la relation – entre les ensembles bien ordonnés.
4. LES ORDINAUX 15
1
0 0
1
0
0
X
ă x y
Xx
Xy
gy
–
Zpyq
Zpxq ă gy pxq
(2) est une conséquence immédiate de (1) : un isomorphisme entre deux ordres
partiels préserve aussi les propriétés de ces ordres. Soit maintenant y un élément
quelconque de X. Alors
déf iso
WZpyq “ tZpxq | Zpxq Ă Zpyqu “ tZpxq | x ă yu
(B) ordinal
“ tZpyqgy pxq | x ă yu “ tgy pxq | x ă yu
déf
“ gy pXy q “ Zpyq,
ce qui termine la preuve de (3).
Proposition 4.12. Tout ensemble bien ordonné est isomorphe avec un ordinal.
Démonstration. Par proposition 4.11 il suffit de montrer que pour tout élé-
ment a de X, le segment Xa est isomorphe avec un ordinal. Considérons le sous-
ensemble
E “ tx P X | Xx n’est pas isomorphe avec un ordinalu
de X. Si E ‰ H, soit a “ minpEq. Alors pour tout x ă a, le segment Xx est
isomorphe avec un ordinal. Aussi pour tout x P Xa , le segment pXa qx est isomorphe
avec un ordinal. Mais alors Xa est isomorphe avec un ordinal par proposition 4.11.
Ceci est en contradiction avec la définition de a.
4.13. Conclusion. Soit ORD la classe de tous les ordinaux. (On montrera
plus tard, en proposition 5.5, que ORD ne peut pas être un ensemble.) Alors pour
tout ensemble bien ordonné pX, ďq il existe un seul ordinal ordpX, ďq tel que pX, ďq
et ordpX, ďq sont isomorphes. En outre,
pX, ďq – pY, ďq ô ordpX, ďq “ ordpY, ďq :
les ordinaux « mesurent la longueur des ensembles bien ordonnés. »
Notation 4.14. Suivant proposition 4.5 il convient de changer nos notations.
On écrira les ordinaux α, β, γ, . . . Car un ordinal α n’a que d’autres ordinaux
comme éléments, et comme l’ordre sur α coïncide avec « Ă » et avec « P », on peut
reformuler 4.5 de manière suivante :
α “ tβ | β P αu “ tβ | β ă αu.
Ecrit ainsi, la conclusion 4.13 devient : pour tout ensemble bien ordonné pX, ăq il
existe un seul ordinal α et un seul isomorphisme
x : α Ñ pX, ăq : β ÞÑ xβ .
18 2. LA THÉORIE NAÏVE DES ENSEMBLES : LES ORDINAUX ET LES CARDINAUX
Ť
A A
O O
\ E \ E
Z ` Z `
h h
e e
Ť
Figure 11. La réunion A d’un ensemble d’ensembles A
Exemples 5.3. Pour les nombres naturels on trouve la définition qu’on connait :
n ` 1 “ n Y tnu “ t0, . . . , n ´ 1u Y tnu “ t0, . . . , nu.
Les ordinaux 0 et ω sont des limites, car un successeur a toujours un maximum.
On trouve maintenant qu’aussi ω ` 1 “ ω Y tωu “ t0, . . . , n, . . . , ωu (isomorphe
à N Y t8u) et ω ` 2, . . ., ω ` n, . . . sont des ordinaux.
Ť
Proposition 5.4. Si A est un ensemble d’ordinaux alors aussi sa réunion A
est un ordinal.
Ť
Rappelons que x P A quand il existe a P A tel que x P a ; voir figure 11.
Ť exemple, étant donné deux ensembles A et B, leur union A Y B est égale à
Par
tA, Bu. Ť
Qu’est-ce l’union d’un ordinal successeur, pα ` 1q ?
Démonstration. OnŤ utilise la caractérisation desŤ
ordinaux de von Neumann,
proposition
Ť 4.17. L’union A est transitive car aŤ P A ñ Dβ PŤA : a P β, et
a Ď β Ď A. La relation P est un ordre total sur A : si x et y P A, alors il y
a α et β P A tels que x P α et y P β. On a α Ď β ou β Ď α, et x ă y ou y ă x dans
le plus grand de ces deux ordres totaux. Ť
Maintenant on montre que P est un bon ordre sur A. On utilise
Ť proposi-
tion 3.5. Soit donc pxn qnPω une séquence strictement descendante dans A. Alors
il existe un ordinal α dans A tel que x0 P α. Mais pour tout n P ω, xn ď x0 P α,
donc xn P α, et pxn qnPω est une séquence strictement descendante dans l’ordinal α :
une contradiction.
Maintenant on est prêt pour prouver le paradoxe de Burali-Forti (1897, huit
ans avant le paradoxe de Russell), une des premières indications sérieuses qu’une
théorie trop naïve des ensembles n’est pas tenable. On en donne une interprétation
anachronique : le résultat n’est pas présenté comme une contradiction, mais comme
une proposition dans le cadre de la théorie des ensembles de Zermelo et Fraenkel
(ou celle de von Neumann, Bernays et Gödel).
Proposition 5.5 (Paradoxe de Burali-Forti). La classe ORD n’est pas un en-
semble.
Ť
Démonstration. Si ORD serait un ensemble, aussi son union α “ ORD
serait un ordinal. Mais alors son successeur
Ť α ` 1 serait un ordinal qui n’appartient
pas à ORD. (Si α Y tαu P ORD alors α P ORD “ α.)
Un infimum est un minorant maximal, un supremum est un majorant mini-
mal.
Proposition 5.6. La paire pORD, ăq est une classe totalement ordonnée. Tout
ensemble non-vide d’ordinaux a un minimum, tout ensemble d’ordinaux a un su-
premum dans ORD.
20 2. LA THÉORIE NAÏVE DES ENSEMBLES : LES ORDINAUX ET LES CARDINAUX
Démonstration. On sait déjà que l’ordre ă est total par proposition 4.9.
Ť
Étant donné un ensemble d’ordinaux A, leur supremum suppAq est l’union A.
En effet,
Ť Ť
(1) si α P A, α Ď A, donc déjà α ď A ;
(2) si l’ordinal β est un
Ť autre majorant, donc si α ď β pour tout α P A, alors
@α P A : α Ď β et A ď β.
Maintenant tout ensemble non-vide d’ordinaux A a un minimum, car A est un
sous-ensemble de l’ordinal γ “ suppAq ` 1 :
ď
αPA ñ αĎ A “ suppAq,
donc α P γ.
Soulignons que dans la proposition précédente en parle bien d’ensembles d’or-
dinaux : comme le montre proposition 5.5, une classe propre d’ordinaux n’a pas
forcément de supremum dans ORD.
5.7. Les opérations sur les ordinaux. Si α et β sont des ordinaux, leur
somme α ` β est « α suivi de β. » Formellement, A “ α ˆ t0u Y β ˆ t1u avec le bon
ordre
pγ, iq ă pδ, jq ô i ă j ou pi “ j et γ ă δq
et α ` β “ ordpA, ăq.
En particulier, α`1 coïncide avec le successeur de α. Remarquons que ω`1 ą ω
mais 1 ` ω “ ω.
Si α et β sont des ordinaux, leur produit α ¨ β est « une séquence
α ` α ` ¨¨¨ ` α
de longueur β. » Donc
ÿ ´ď ¯
α¨β “ αγ “ ord αγ ˆ tγu
γăβ γăβ
où αγ “ α.
En particulier, ω ¨ 2 “ ω ` ω. Remarquons que ω ¨ 2 ą ω mais 2 ¨ ω “ ω.
5.8. L’induction transfinie. On donne trois versions du principe d’induction
transfinie (cf. 3.6).
Proposition 5.9 (Induction transfinie, I). Soit P pxq une propriété d’ordinaux.
Soit α un ordinal fixe. Si
(1) P p0q est vrai
(2) pour tout γ P α : pη ă γ ñ P pηq est vraiq ñ P pγq est vrai
alors P pβq sera vrai pour tout β P α.
Démonstration. On prend pX, ďq égal à α et E “ tβ P α | P pβq est vraiu
dans proposition 3.8.
Proposition 5.10 (Induction transfinie, II). Soit P pxq une propriété d’ordi-
naux. Si
(1) P p0q est vrai
(2) pη ă γ ñ P pηq est vraiq ñ P pγq est vrai
alors P pαq sera vrai pour tous les ordinaux α.
Démonstration. Soit α un ordinal. La version I de l’induction transfinie nous
admet de conclure que si β ă α alors P pβq est vrai. Mais alors (2) nous dit que
P pαq est vrai.
6. LES CARDINAUX 21
Proposition 5.11 (Induction transfinie, III). Soit P pxq une propriété d’ordi-
naux. Si
(1) P p0q est vrai
(2) P pβq est vrai ñ P pβ ` 1q est vrai
(3) γ ‰ 0 ordinal limite, pη ă γ ñ P pηq est vraiq ñ P pγq est vrai
alors P pαq sera vrai pour tous les ordinaux α.
Démonstration. Pour pouvoir utiliser la version II de l’induction transfinie
il suffit de considérer le cas où γ est un ordinal successeur β ` 1. Supposant que
η ă γ ñ P pηq est vrai, certainement P pβq est vrai, donc (2) implique que P pγq est
vrai.
6. Les cardinaux
Il y a trop d’ordinaux ! On verra qu’une classe d’équipotence d’ensembles peut
en contenir plusieurs. On devra donc choisir une classe plus restreinte d’ordinaux
qui peuvent servir comme représentants.
Ici on supposera que tout ensemble peut être bien ordonné. On montrera plus
tard (dans proposition 7.8 du chapitre 3) que cette hypothèse est équivalente à
l’axiome du choix.
Dans la section 5 on a vu qu’un ensemble fini (donc équipotent à un nombre
naturel) porte essentiellement (c’est à dire, à bijection près) un seul bon ordre. Tous
les bons ordres sur l’ensemble t0, . . . , n ´ 1u “ n sont isomorphes à l’ordinal n.
La situation change quand on considère des ensembles infinis. Bien qu’ils ne
sont pas isomorphes comme ordres, les ordinaux ω, ω ` 1, . . ., ω ` n, . . ., ω ¨ 2, . . .
sont tous équipotents :
ω: 0 A1 A2 A3 ¨¨¨ n n: ` 1 ¨¨¨
z z z x *0 ω
ω ` 1: 0 1 2 3 ¨¨¨ n ¨¨¨
et
ω: 0 1 N2 3 84 ¨¨¨ 72n 2n ` 1 ¨¨¨
_
w w &- "*
n &- ω
ω ¨ 2: 0 1 2 ¨¨¨ ¨¨¨ ω`1 ¨¨¨ ω`n ¨¨¨
On peut même montrer que ω et ω ¨ ω sont équipotents.
En effet, la relation – entre ensembles bien ordonnés est plus fine que la relation
« entre leurs ensembles sous-jacents : pX, ďq – pY, ďq implique X « Y , car tout
isomorphisme d’ordres est une bijection. Les exemples au-dessus montrent que la
réciproque n’est pas valide. On pourrait dire que « coupe la classe des ensembles
bien ordonnés en morceaux disjoints, mais que – les découpe alors encore une fois
en morceaux bien plus petits.
Définition 6.1. Un ordinal α est un cardinal quand α n’est pas équipotent
à un ordinal strictement plus petit.
Deux cardinaux équipotents sont égaux—par définition ; à ne pas confondre
avec proposition 4.10.
Exemples 6.2. 0, n, ω sont des cardinaux, tandis que ω ` 1, ω ` n, ω ¨ n, ω ¨ ω
ne sont pas des cardinaux.
Proposition 6.3. Tout cardinal infini est un ordinal limite.
22 2. LA THÉORIE NAÏVE DES ENSEMBLES : LES ORDINAUX ET LES CARDINAUX
X
« ,2 Y XLR
« ,2 Y
LR
« « « «
|X| |Y | |X| ,2 |Y |
«
On écrit α pour l’ordinal limite suptαn | n P ωu. Maintenant on sait que ce supre-
mum est le cardinal
ď ď
tαn | n P ωu “ tℵβ | β ă αu “ ℵα
et donc α “ ℵα .
Proposition 6.16. Tous les cardinaux infinis sont de la forme ℵα avec α un
ordinal.
Démonstration. Il suffit de montrer la vérité de
P pαq “ « @κ ă ℵα cardinal infini, Dγ ă α ordinal : κ “ ℵγ »
pour tout ordinal α par induction transfinie. En effet, si κ est un cardinal, il existe
toujours un ordinal α tel que κ ă ℵα : on prend α “ κ ` 1, et alors κ ă α ď ℵα
par proposition 6.14.
(1) P p0q est vrai, car si κ ă ℵ0 alors κ n’est pas un cardinal infini.
(2) Si κ ă ℵβ`1 , κ ď ℵβ , donc
– ou bien κ “ ℵβ ,
– ou bien κ ă ℵβ , et dans ce cas-là Dγ ă β : κ “ ℵγ par hypothèse.
(3) Soit κ ă ℵγ pour γ un ordinal Ť limite. On doit montrer qu’il existe δ ă γ
tel que κ “ ℵδ . Par définition ℵγ “ ηăγ ℵη , ce qui donne un ordinal η ă γ avec
κ ă ℵη . Par l’hypothèse d’induction on trouve δ ă η ă γ avec κ “ ℵδ .
Remarque 6.17. Si on n’accepte pas l’hypothèse du continu, et si on assume
donc par contre sa négation ℵ1 ‰ 2ℵ0 , la question suivante se pose : Pour quel
ordinal α est-ce que ℵα “ 2ℵ0 , la cardinalité de R ? (Il y a des recherches récentes
qui indiquent que ℵ2 “ 2ℵ0 serait un choix raisonnable !)
7. OPÉRATIONS SUR LES CARDINAUX 25
On a clairement :
Proposition 6.18. CARD n’est pas un ensemble.
Ť
Démonstration. Si CARD est un ensemble, alors α “ CARD est un ordinal.
De plus, α ď ℵα ă ℵα`1 , donc ℵα`1 est un cardinal qui n’appartient pas à la classe
CARD.
Et donc :
Corollaire 6.19. SET n’est pas un ensemble. 1
Démonstration. Si SET est un ensemble, CARD en est un sous-ensemble.
1. « Toutes les choses retournent à l’Un, mais où cet Un retourne-t-il ? » (sûtra bouddhiste)
26 2. LA THÉORIE NAÏVE DES ENSEMBLES : LES ORDINAUX ET LES CARDINAUX
est une bijection. Remarquons que F pkq est la fonction unique qui rend le carré
Y
g
,2 Y 1
@ k D! F pkq
X ,2 X 1
f
commutatif.
En particulier, on peut choisir X “ κ et Y “ λ.
Proposition 7.4. On a les égalités suivantes : κ ¨ pλ ` µq “ κ ¨ λ ` κ ¨ µ
κ`λ“λ`κ κ¨λ“λ¨κ
κ ` pλ ` µq “ pλ ` κq ` µ κ ¨ pλ ¨ µq “ pλ ¨ κq ¨ µ
κďκ`λ κďκ¨λ pour λ ‰ 0
κ1 ď κ2 , λ1 ď λ2 ñ κ1 ` λ1 ď κ2 ` λ2 et κ1 ¨ λ1 ď κ2 ¨ λ2
Ces propriétés de sommes et de produits suivent directement des relations cor-
respondantes concernant les unions et les produits des ensembles. Aussi l’exponen-
tiation satisfait des propriétés qui sont parallèles aux relations classiques pour les
nombres naturels :
Proposition 7.5. (1) κ ď κλ pour λ ą 0
(2) λ ď κλ pour κ ą 1
(3) κ1 ď κ2 , λ1 ď λ2 ñ κλ1 1 ď κλ2 2
(4) κλ`µ “ κλ ¨ κµ
(5) pκλ qµ “ κ먵
Démonstration. (1) Les éléments de κ correspondent aux fonctions constan-
tes λ Ñ κ. (2) Les éléments de λ correspondent aux fonctions
#
1 si ν “ µ
δµ : λ Ñ κ : ν ÞÑ
0 si ν ‰ µ.
(3) Toute fonction λ1 Ñ κ1 a une extension λ2 Ñ κ2 . (4) Toute fonction λ ` µ Ñ κ
est complètement déterminée par une fonction λ Ñ κ ensemble avec une fonction
µ Ñ κ. (Propriété universelle de l’union disjointe des ensembles, qui est la somme
dans le sens catégorique.) (5) Considérons le triangle commutatif
X ˆ Yg] X
ev ,2 Y
:D
1X ˆh˚ h
X ˆZ
dans lequel evpx, f q “ f pxq et
h˚ : Z Ñ Y X : h˚ pzqpxq “ hpx, zq.
Alors la fonction
p¨q˚ : Y XˆZ Ñ pY X qZ : h ÞÑ h˚
est une bijection.
On montre quelques connections entre somme et produit, entre produit et puis-
sance.
7. OPÉRATIONS SUR LES CARDINAUX 27
ℵ0 ℵ0 ℵ0
(6) |RR | “ p2ℵ0 q2 “ 2ℵ0 ¨2 “ 22 “ i2
Proposition 7.7 nous reste à prouver.
La relation ă est clairement un ordre total. On montre que c’est un bon ordre.
Soit H ‰ X Ď ωγ ˆ ωγ . On pose
δ “ mintmaxtα, βu | pα, βq P Xu
et
Y “ tpα, βq P X | maxtα, βu “ δu.
Certainement X et Y ont le même minimum. Soit
α0 “ mintα | Dβ pα, βq P Y u
et
Z “ tpα, βq P Y | α “ α0 u.
Cet ensemble aura de nouveau le même minimum que X. Soit
β0 “ mintβ | pα0 , βq P Zu.
Finalement, le couple pα0 , β0 q sera le minimum de X.
(2) On montre que ordpωγ ˆ ωγ , ăq ď ωγ . Supposons, par contre, que “
ordpωγ ˆ ωγ , ăq et ωγ ă . Soit f l’isomorphisme d’ordres
f : Ñ pωγ ˆ ωγ , ăq
et pα1 , β1 q “ f pωγ q. Soit
X “ tpα, βq P ωγ ˆ ωγ | pα, βq ă pα1 , β1 qu.
Alors la restriction à ωγ de f
f |ωγ : ωγ Ñ X
est toujours un isomorphisme d’ordres. Par conséquence, |X| “ ℵγ .
Soit maintenant δ “ maxtα1 , β1 u ` 1. Alors δ est infini. De plus, δ ă ωγ car ℵγ
est un cardinal, donc un ordinal limite. Par conséquence, X Ď δˆδ. Soit maintenant
ℵη “ |δ|, alors η ă γ et donc par hypothèse
|X| ď ℵη ¨ ℵη ď ℵη ă ℵγ ,
une contradiction.
8. CONCLUSION 29
8. Conclusion
Le but de ce chapitre était de formaliser l’idée de taille d’un ensemble. On a
étudié essentiellement deux approches différentes :
(1) l’existence d’une injection codifie qu’un ensemble est plus petit que l’autre,
ce qui définit un ordre ď sur les classes d’équipotence d’ensembles X ;
(2) la théorie des cardinaux nous permet de compter le nombre d’éléments
|X| que contient un ensemble X.
La première approche mène naturellement vers la deuxième, car il n’est a priori pas
clair que l’ordre ď soit total—donc deux ensembles pourraient être incomparables.
La solution est de comparer leurs cardinalités.
Comment calculer alors la cardinalité d’un ensemble ? Combien d’éléments
contient-il ? La réponse qu’a donné Cantor à cette question passe par la théorie
des ensembles bien ordonnés. Il assume que tout ensemble X peut être muni d’un
bon ordre pX, ďq. Ensuite il montre que chaque classe d’isomorphisme d’ensembles
bien ordonnés contient un seul ordinal. Mais un ensemble peut en général porter
plusieurs ordres non-isomorphes—les classes d’équipotence sont plus petites que les
classes d’isomorphisme d’ordres, la première relation est plus fine que la seconde—
et donc il y a trop d’ordinaux. Maintenant la cardinalité |X| d’un ensemble X
est simplement le plus petit de tous les ordinaux α qui sont équipotents avec cet
ensemble.
Cette définition de cardinalité est la bonne, car elle est compatible avec l’ordre
défini dans (1),
XďY ô |X| ď |Y |.
Une question reste encore ouverte : est-ce raisonnable de supposer que tout ensemble
peut être bien ordonné ? La réponse dépend de l’axiomatique de la théorie des
ensembles, le sujet du chapitre 3.
CHAPITRE 3
1. Introduction
Presque toute la mathématique du XXe siècle sera fondée sur la théorie des
ensembles. La définition qu’avait donné Cantor pour la notion d’ensemble restait
plutôt intuitive : un ensemble est « chaque regroupement dans un tout d’objets
bien distincts de notre intuition ou de nos pensées » : c’est un sac, avec des trucs
dedans.
La désillusion est venue dix ans après le début du travail fondateur de Cantor.
Déjà en 1897 Burali-Forti formulait un premier paradoxe concernant les ordinaux.
En 1899 c’est Cantor même qui trouve un paradoxe dans la théorie des cardinaux.
En 1905, après l’étude du travail de Cantor, Russell peut formuler un paradoxe qui
n’utilise ni les ordinaux, ni les cardinaux, et qui est donc accepté plus facilement.
Ce paradoxe de Russell y consiste de remarquer que si
Y “ tX | X est un ensemble, X R Xu
avec le même caractère de nécessité que les choses de la réalité objective et nous les
découvrons et étudions, comme les physiciens, les chimistes et les zoologistes. »
Pour la théorie formelle même, la différence entre une vision formaliste ou intui-
tionniste n’est pas importante. Il est claire que Zermelo–Fraenkel et von Neumann–
Bernays–Gödel voulaient arriver à une théorie qui serait assez riche pour contenir
la théorie de Cantor—d’une telle façon bien sûr que tout paradoxe en serait exclu.
Dans ce cadre axiomatique on a de nouveau l’opportunité de considérer les deux
problèmes que Cantor ne pouvait pas résoudre : le premier mène vers l’axiome du
choix, le deuxième vers l’hypothèse du continu. On traitera la notion de consistance
et on examine les résultats sur la consistance relative de ces deux axiomes. On
regarde que sont les conséquences pour la mathématique si on accepte ses axiomes
ou leur négation.
est une formule dont toutes les variables sont liées. Intuitivement une telle formule
exprime une assertion qui est ou bien vraie, ou bien fausse. Elle se comporte donc
comme une proposition.
2.3. Les axiomes et les règles de déduction de la logique. On considé-
rera un des systèmes standards d’axiomes et de règles de déduction de la logique
des prédicats.
Soit Γ une collection de formules ϕ0 , . . ., ϕk , . . . et ψ une formule quelconque.
Une déduction ou preuve de ψ à partir de Γ est une suite finie de formules
ψ0 , . . ., ψn où ψn “ ψ et
(1) ψi est dans la collection Γ, ou
(2) ψi peut être déduit de ψ0 , . . ., ψi´1 en utilisant les règles de déduction.
On écrit Γ $ ψ. Si Γ n’est pas fini, alors Γ $ ψ signifie que ψ peut être déduit d’un
nombre fini de formules de Γ.
La première option (1) correspond à l’axiome logique qui est normalement écrit
Γ, ϕ $ ϕ
et qui signifie que d’hypothèses contenant ϕ on peut déduire ϕ. (On a donc ϕ
dans la collection Γ1 , où Γ1 est la collection Γ avec ϕ ajouté.)
Alors on assume les règles de déduction suivantes. Les règles pour l’implica-
tion :
Γ, ϕ $ ψ Γ $ pϕ ñ ψq Γ$ϕ
et ;
Γ $ pϕ ñ ψq Γ$ψ
la disjonction :
Γ$ϕ Γ$ψ Γ $ pϕ _ ψq Γ, ϕ $ ρ Γ, ψ $ ρ
, et ;
Γ $ pϕ _ ψq Γ $ pϕ _ ψq Γ$ρ
le faux et la négation :
Γ $K Γ$ϕ Γ$ ϕ Γ, ϕ $K
, et ;
Γ$ϕ Γ $K Γ$ϕ
et le quantificateur existentiel, sous condition que les substitutions sont légitimes :
Γ $ ϕrt{xs Γ $ Dxϕ Γ, ϕrt{xs $ ψ
et .
Γ $ Dxϕ Γ$ψ
Plus tard on prendra comme Γ les phrases de (ZF) ensemble avec les axiomes
de l’égalité. On appellera une formule déduite de ces axiomes-là un théorème
de (ZF).
Si une formule ψ peut être déduite sans qu’on assume aucune hypothèse elle
est un théorème logique. Par exemple, ϕ ñ ϕ est un théorème logique,
donc $ p ϕ ñ ϕq, car ϕ $ ϕ puisque ϕ, ϕ $K. Un autre exemple
est pϕ ñKq ô ϕ, car $ pψ _ Kq ô ψ.
Les règles de déduction se combinent en nouvelles règles. Par exemple, on a la
règle
Γ, ϕ $K
Γ$ ϕ
car Γ, ϕ $K puisque $ p ϕ ñ ϕq et donc Γ, ϕ $ ϕ tandis que Γ, ϕ $K.
Ce système de règles n’est pas minimal, car certaines règles suivent des autres :
par exemple, la règle
Γ$ϕ Γ$ ϕ
Γ $K
est le cas spécial de
Γ $ pϕ ñ ψq Γ$ϕ
Γ$ψ
3. UNE INTERPRÉTATION CLASSIQUE DE (ZF) 35
où ψ est le faux K.
Une manière pour obtenir des logiques non-classiques est en éliminant certaines
règles, comme la réduction à l’absurde
Γ, ϕ $K
.
Γ$ϕ
Sans cette règle-là il nous sera impossible de faire des preuves par contradiction, et
donc certains résultats en mathématique deviennent improuvables.
2.4. Les autres axiomes. A côté de l’axiome purement logique de 2.3 on
a besoin d’axiomes qui décrivent les propriétés des prédicats « “ » et « P ». Ces
formules seront toujours dans la suite d’hypothèses Γ qu’on considérera. Les axiomes
de « “ » sont
R: x “ x
S: x “ y ñ y “ x
T: x “ y ^ y “ z ñ x “ z
L: x “ y ñ pϕpxq ô ϕpyqq
Les trois premiers définissent « “ » comme une relation d’équivalence. La loi
de Leibniz, l’axiome L, est ce qui caractérise « “ » entre les autres relations
d’équivalence et exprime que l’égalité x “ y est plus forte que n’importe quel
autre lien ϕpxq ô ϕpyq que peuvent avoir x et y. Ici ϕ est un prédicat unaire
quelconque. C’est à dire, s’il y a une propriété ϕ que x et y n’ont pas en commun,
donc ϕpxq sans ϕpyq ou l’inverse, alors ils doivent être différents : x ‰ y. En fait,
L n’est donc pas un seul axiome, mais une collection infinie d’axiomes, avec une
version pour chaque choix de ϕ. (En logique de deuxième ordre on pourrait écrire
@ϕpx “ y ñ pϕpxq ô ϕpyqqq, mais on n’aura pas strictement besoin de ce niveau
de formalisation, donc on l’évite.)
Les axiomes de « P » sont plus compliqués. En fait il y a plusieurs options ;
dans ce cours on étudiera le système (ZF) de Zermelo et Fraenkel et son extension
(NBG) de von Neumann, Bernays et Gödel.
(1) existence DX @y py R Xq
(2) extensionnalité @X @Y pp@zpz P X ô z P Y qq ñ X “ Y q
(3) sélection @Z DY @x px P Y ô px P Z ^ ϕpxqqq
(4) paire @x @y DZ px P Z ^ y P Zq
(5) réunion @Y DX @y @x px P y ^ y P Y ñ x P Xq
(6) parties @X DY @z pz Ď X ñ z P Y q
(7) infinité DX pH P X ^ @y py P X ñ y Y tyu P Xqq
(8) remplacement @X pp@x P X D!y ϕpx, yqq ñ pDY @x P X Dy P Y ϕpx, yqqq
Table 1. Les axiomes de (ZF)
de nos croyances sur ce point. Mais on se trouve quand même dans un domaine ou
c’est bien de se rendre compte que ces choix-là existent.
Combiné avec l’axiome L de 2.4, qui dans le cas que ϕpXq est la phrase « z P X »
donne
@X @Y pX “ Y ñ p@zpz P X ô z P Y qqq,
on obtient l’équivalence
@X @Y pX “ Y ô p@zpz P X ô z P Y qqq :
deux ensembles sont égaux précisément quand ils ont les mêmes éléments.
L’ensemble vide que l’axiome d’existence nous donne est donc unique. On le
dénote H.
Ensuite il y a l’axiome (3) de sélection de sous-ensembles ou compréhen-
sion, qui dit
@Z DY @x px P Y ô px P Z ^ ϕpxqqq
pour toute formule ϕ qui n’a pas Y comme variable libre. (En fait il y a donc
infiniment d’axiomes de compréhension, un axiome pour chaque choix de ϕ.) Cet
axiome nous permet de sélectionner parmi les éléments x de l’ensemble Z tout ceux
qui satisfont ϕpxq, et ces éléments-la forment un nouvel ensemble Y . Cet ensemble
sera unique par l’axiome extensionnalité, donc on a le droit de noter Y comme
tx P Z | ϕpxqu.
Par contre, la notation tx | ϕpxqu n’a pas de sens, car on doit sélectionner nos
éléments dans un ensemble z qui est déjà donné d’avance.
Exemples dans le chapitre 2 : les définitions 6.8 et 6.5.
4.2. Paire, réunion, ensemble des parties. L’axiome (4) de paire dit
@x @y DZ px P Z ^ y P Zq.
tz P Z | z “ x _ z “ yu
qu’on écrira tx, yu. En effet, (2) implique que cet ensemble est indépendant du choix
de Z. Quand x “ y on écrit txu.
On trouve donc des ensembles tels que tHu, tH, tHuu, tH, tHu, tH, tHuuu,
etc. qu’on écrira 0, 1, 2, . . ., mais aussi ttHuu, tH, tH, tHuuu, etc.
L’axiome (5) de réunion s’exprime
@Y DX @y @x px P y ^ y P Y ñ x P Xq.
@X DY @z pz Ď X ñ z P Y q.
est l’intersection de tous les éléments de Y . Cet ensemble existe car si X P Y , alors
č
Y “ tx P X | @y P Y x P yu.
5. (ZF) EST ASSEZ RICHE 39
5.2. Couple, produit. Un couple est une paire ordonnée. Si x et y sont deux
ensembles, on écrit la paire ttxu, tx, yuu comme un couple px, yq. La différence entre
le couple px, yq et la paire tx, yu est l’ordre :
tx, yu “ ty, xu
car ces deux ensembles ont les mêmes éléments (axiome (2), extensionnalité). Mais
px, yq ‰ py, xq
puisque txu est un élément de px, yq qui n’est pas dans py, xq.
Étant donné deux ensembles X et Y , l’ensemble des couples
X ˆ Y “ tpx, yq | x P X, y P Xu,
qu’on appelle le produit de X et Y , existe car il peut être obtenu comme
tpx, yq P PpPpX Y Y qq | x P X, y P Xu.
(Le couple px, yq “ ttxu, tx, yuu est un ensemble de sous-ensembles de X Y Y .)
f0 “ a et fn`1 “ gpfn , nq
pour tout n P N.
(1) existence D˚ x @C pC R xq
(2) extensionnalité @C @D pp@zpz P C ô z P Dqq ñ C “ Dq
(3) sélection DC @˚ x px P C ô ϕpxqq
(4) paire @˚ x @˚ y D˚ z px P z ^ y P zq
(5) réunion @˚ y D˚ x @z @w pw P z ^ z P y ñ w P xq
(6) parties @˚ x D˚ y @z pz Ď x ñ z P yq
(7) infinité D˚ x pH P x ^ @y py P x ñ y Y tyu P xqq
(8) remplacement @˚ w pp@x P w D˚ !y ϕpx, yqq ñ pD˚ z @x P w Dy P z ϕpx, yqqq
Table 2. Les axiomes de (NBG)
Ť
S S
O O
\ E \ E
Z ` Z `
h h
e e
Ť
Figure 1. Une fonction de choix f : S Ñ S
On écrit @˚ x ϕpxq quand on veut exprimer que ϕpxq est vrai pour tout ensemble x,
comme abréviation donc de @xpDCpx P Cq ñ ϕpxqq. De même, D˚ x ϕpxq veut dire
qu’il existe un ensemble x tel que ϕpxq est vrai, donc
DxpDCpx P Cq ^ ϕpxqq.
Table 2 donne une version compacte des axiomes de (NBG), qui forment essentielle-
ment une variation sur les axiomes de (ZF). Remarquons que la formule ϕ dans (3)
ne peut pas contenir des expressions qui sont quantifiées par des classes, et que z
ne peut pas être une variable libre dans la formule ϕ de (8). Pourquoi est-ce qu’une
version de l’axiome (6) pour les classes n’a pas de sens ? Et est-ce qu’on a vraiment
besoin de (1) ?
Exemples 6.3. (1) La classe SET de tous les ensembles existe par sélec-
tion, l’axiome (3) : elle est déterminée par @˚ x px P SET ô x R Hq.
(2) Maintenant ORD est une classe par sélection dans SET.
(3) Un autre exemple d’une classe propre est la classe des singletons. La pro-
priété D˚ y ppy P xq ^ @z pz P x ñ z “ yqq, donc « x a un seul élément »
détermine une sous-classe de SET. Cette classe est propre. Sinon, par
l’axiome (4)—dont on déduit que, pour tout ensemble x, le singleton txu
est aussi un ensemble—et par l’axiome (5), on pourrait montrer que la
classe de tous les ensembles est un ensemble.
7. L’axiome du choix
Ť
Définition 7.1. Soit S un ensemble, H R S. Une fonction f : S Ñ S s’ap-
pelle fonction de choix si @x P S f pxq P x.
Exemples 7.2. (1) Figure 1 montre une fonction de choix pour l’en-
semble S donné.
Ť
(2) S “ H a une seule fonction de choix H Ñ H “ H.
44 3. LA THÉORIE AXIOMATIQUE DES ENSEMBLES
f “ g Y tpX, xqu
7.4. Produits infinis. Une première version alternative (AC1 ) parle de pro-
duits possiblement infinis :
« le produit d’une famille d’ensembles non vides est non vide »,
c’est à dire que pour toute famille d’ensembles pXi qiPI
`ź ˘
p@i P I Xi ‰ Hq ñ Xi ‰ H .
iPI
ś
Rappelons que le produit iPI Xi est l’ensemble
! ´ď ¯I ď )
xP Xi x : I Ñ Xi fonction, @i P I xpiq “ xi P Xi .
iPI iPI
de ce produit, donc tel que xi P Xi pour tout i, est complètement déterminé par
une fonction de choix définie sur l’ensemble S “ tXi | i P Iu des éléments de la
7. L’AXIOME DU CHOIX 45
famille :
i ,2 Xi
I ,2 S
s
x f
$
Ť y
S
Réciproquement, étant donné un ensemble S qui ne contient pas H, on prend
I “ S et écrit Xi “ x pour tout i “ś
x P S. Alors les fonctions de choix sur S sont
exactement les éléments du produit iPI Xi , donc (AC) est impliqué par (AC1 ).
7.5. Ensembles de parties. Une autre version alternative est (AC2 ) :
« Étant donné un ensemble E ‰ H, il existe une fonction définie sur PpEq, et qui
à toute partie non vide de E associe un élément de cette partie. »
(AC2 ) suit du le cas spécial de (AC) où S est l’ensemble tX Ď E | X ‰ Hu. On
envoie H P PpEq sur un élément
Ť de E quelconque. Pour retrouver (AC) à partir
de (AC2 ) on prend E “ S. On a S Ď PpEq, etŤdonc la fonction PpEq Ñ E
donnée par (AC2 ) induit une fonction de choix S Ñ S par restriction.
7.6. Épimorphismes scindés. Un épimorphisme d’ensembles est une sur-
jection, tandis qu’un épimorphisme scindé est une fonction qui est inversible
à droite : p : X Ñ I telle qu’il existe un scindage, une fonction s : I Ñ X
où p˝s “ 1I . Ť
Par exemple, dans figure 1 on peut choisir I “ S, X “ S et p : X Ñ I la
fonction qui envoie un élément de X vers l’ensemble dans I qui le contient. Alors
la fonction de choix f sera un scindage s pour p.
Tout épimorphisme scindé est un épimorphisme, car i P I est toujours l’image
ppxq de x “ spiq. Par contre, l’inverse (AC3 ) :
« tout épimorphisme d’ensembles est scindé »
est équivalent à l’axiome du choix. Soit p : X Ñ I une surjection, alors on choisit
Xi “ p´1 piq “ txi P X | ppxi q “ iu
ś
et l’élément s du produit iPI Xi que donne (AC1 ) est un scindage pour p.
Réciproquement, étant donné une famille d’ensembles pXi qiPI on considère sa
réunion disjointe (son coproduit)
ž ď` ˘
Xi “ Xi ˆ tiu
iPI iPI
L’hypothèse (W) nous permet de placer un bon ordre ă sur l’ensemble A. Cet
ensemble est donc isomorphe à un ordinal γ ; on écrit l’isomorphisme a : γ Ñ A. En
particulier, on a A “ taα | α P γu et aα ă aβ si et seulement si α ă β ă γ.
On définit une fonction f : ORD Ñ γ ` 1 par f p0q “ 0 et
#
mintα P γ | β ă ξ ñ pf pβq P γ ^ af pβq ă aα qu si un tel α existe,
f pξq “
γ sinon.
On montre qu’il existe un ξ tel que f pξq “ γ. Supposons le contraire. Alors f est
une injection : si ζ ă ξ alors ou bien af pζq ă af pξq , ou bien f pξq “ γ, ce qui est
impossible. De plus, f pORDq est un sous-ensemble de l’ensemble γ. Et car f est une
injection, l’axiome de remplacement (8) implique qu’aussi ORD est un ensemble—
une contradiction.
Soit donc ξ le plus petit ordinal tel que f pξq “ γ. Ce ξ ne peut pas être un
ordinal limite, car dans ce cas-là l’ensemble taf pβq | β ă ξu est une chaîne sans
majorant. Par conséquence, il y a un ordinal δ tel que ξ “ δ ` 1. L’élément af pδq
est alors maximal dans A :
f pδq “ mintα P γ | β ă δ ñ af pβq ă aα u,
donc déjà tous les af pβq pour β ă δ sont plus petits que af pδq . Soit maintenant
a “ aα un élément de A quelconque. Supposons aα ą af pδq . Alors cet α est tel que
β ă ξ “ δ ` 1 ñ β ď δ ñ af pβq ă aα , donc f pξq ‰ γ : une contradiction. Par
conséquence, af pδq est maximal dans A.
On montre maintenant que (Z) implique (AC). Soit donc S un ensemble non-
vide qui ne contient pas l’ensemble vide. On obtiendra une fonction de choix pour S
comme élément maximal de l’ensemble inductif pF, Ďq où
! ´ ď ¯ )
F “ f P P S ˆ S f fonction, domf Ď S, @X P domf f pXq P X .
8. Cohérence
Définition 8.1. Une collection de formules Γ est cohérente ou consistante
s’il n’existe pas de formule ψ telle que
Γ$ψ et Γ$ ψ.
8. COHÉRENCE 49
Exercices
1. Ordres
(1) Montrez l’équivalence entre l’induction et l’induction complète.
(2) Prouvez proposition 3.10.
Ť Ť
(3) Qu’est-ce tXu ? et H ?
`Ť ˘
(4) Montrez que p@i P I : Xi Ď Y q ñ iPI Xi Ď Y
Ť `Ť ˘
(5) Montrez que iPI pXi X Y q “ iPI Xi X Y
(6) Trouvez un contre-exemple pour proposition 3.12 quand les ordres ne sont
pas bons. (Indication : essayez pZ, ďq.)
(7) Même question pour proposition 3.11.
(8) Même question pour proposition 3.16. (Indication : essayez pZ´ , ďq.)
(9) On sait qu’un ensemble de sous-ensembles d’un ensemble est toujours par-
tiellement ordonné par l’inclusion. À isomorphisme près ce sont les seuls
ordres qui existent ! (Indication : essayez la preuve de proposition 3.18.)
(10) Montrez que, si α est un ordinal,
– ou bien α est un ordinal limite ;
– ou bien il existe n P ω et un ordinal limite β tels que α “ β ` n.
(Indication : utilisez proposition 3.8.)
(11) Soit pX, ďq un ordre total. Un segment initial de X est un sous-ensemble
S Ă X tel que pour tout s P S, tout x ă s est dans S.
(a) Si pX, ďq est bien ordonné et S est un segment initial de X il existe
a P X tel que S “ Xa .
(b) Trouvez un exemple d’un ordre total pX, ďq avec un segment initial S
qui n’est pas de la forme Xa pour a P X.
51
52 4. EXERCICES
pñq
p ñ q
1 1 1
0 1 1
1 0 0 p q
0 1 0
(a) p ^ q (i) pp ñ qq ^ pp ^ qq
(b) pp ñ qq (j) pp ñ qq ñ p p ñ qq
(c) pp _ qq ^ p (k) pp ñKq ô p
(d) pô q (l) pp ñ qq ^ pp p ñ qq ^ qq
(e) p _ p (m) pp ô pq ^ qqq
(f) pô p (n) pp ^ qq ô pp _ qq
(g) p ñ pq _ pq (o) ppp ñ qq ñ pq ñ p
(h) pp ^ qq _ p p ^ qq (p) p p ñ pq ñ p
(3) Classez ces formules en lois logiques (tautologies : vraie dans toute
réalisation, toute réalisation est un modèle), contradictions (vraie dans
aucune réalisation, il n’y a pas de modèles) et formules contingentes
(vraie dans certaines réalisations (= les modèles), fausse dans d’autres).
Quand ϕ est une tautologie on écrit ( ϕ. Deux formules ϕ et ψ sont équivalentes
quand la formule pϕ ô ψq est une tautologie, ( pϕ ô ψq. Il suffit de contrôler que
tout modèle de l’une formule est aussi modèle de l’autre.
(4) Montrez que t , ^, _u est fonctionnellement complet : toute formule
ϕ est équivalente à une formule ψ qui ne contient que les connectifs , ^
et _.
(5) Aussi t , ^u et tñ, Ku sont fonctionnellement complets.
1. S’il n’y a pas de confusion possible on n’écrit pas les parenthèses extérieures.
2. LA LOGIQUE DES PROPOSITIONS 53
$ ϕ ñ pψ ñ ϕq
$ pϕ ñ pψ ñ χqq ñ ppϕ ñ ψq ñ pϕ ñ χqq
$p ϕñ ψq ñ pψ ñ ϕq
(a) $ ϕ ñ ϕ (c) $ ϕ _ ϕ
(b) $ ϕ ô ϕ (d) $ p ϕ ñ ϕq ñ ϕ
lequel on donne un sens aux symboles du langage. On peut alors attribuer une
valeur de vérité (vrai ou faux) aux formules du langage dans cette réalisation.
(2) Considérons l’ensemble X “ t‚, ˝, ‚, ˝, ˛, ˛u. On considère le langage pré-
dicatif et l’interprétation des symboles suivants : les variables x, y, z, . . .
qui représentent des éléments de X, les constantes
a “ ‚, b “ ˝, c “ ‚, d “ ˝, e “ ˛, f “˛
et les prédicats
Bpxq “ « x est blanc »
N pxq “ « x est noir »
Cpx, yq “ « x est de la même couleur que, mais différent de, y »
F px, yq “ « x est de la même forme que, mais différent de, y »
Lpx, yq “ « x est dans la même colonne que, mais différent de, y ».
Plaçons-nous dans le monde M1 suivant :
˝ ‚
˛ ‚
˛ ˝
(a) Quelles valeurs peut-on attribuer aux variables libres des formules
suivantes pour que ces formules soient satisfaites dans la réalisa-
tion M1 ? Attribuez une valeur à chaque variable (il y a parfois plu-
sieurs possibilités).
(i) pCpx, yq ^ Lpy, zqq ^ Bpzq
(ii) Cpe, xq
(iii) pF px, cq _ F px, eqq ^ pF py, aq ^ Lpx, yqq
(iv) F px, aq ^ Cpx, dq
(v) pN pxq ñ Lpx, yqq ^ F pz, yq
(vi) Bpxq ñ N paq
(vii) pBpxq ^ F px, aqq _ pN pxq ^ Lpx, dqq
(viii) pCpx, yq ^ Lpx, yqq
(b) Pour les formules qui suivent, on décide d’attribuer ‚ comme valeur
à la variable libre x. Dessiner alors pour chacune des formules un
monde dans lequel elle est satisfaite (c.à.d., répartir les six objets
de X dans les trois colonnes).
(i) Lpx, cq ^ Lpx, dq
(ii) Lpx, eq ô Lpx, f q
(iii) pBpxq ñ Lpx, dqq ^ pN pxq ñ Lpx, cqq
(iv) @ypN pyq ñ Lpx, yqq
(v) DypF px, yq ^ Lpx, yqq ^ DypF pc, yq ^ Lpx, yqq
(vi) DyLpy, xq _ @ypCpy, xq ñ Lpy, xqq
(c) Dans les formules qui suivent, certaines variables sont libres et d’au-
tres sont liées. Repérer les variables libres et leur attribuer une valeur
afin que la formule soit satisfaite dans la réalisation M1 .
(i) DxLpx, yq
(ii) DypBpyq ^ Lpz, yqq
(iii) Bpxq ^ @ypLpx, yq ñ Bpyqq
3. LA LOGIQUE DES PRÉDICATS 57
On dit qu’une formule ϕ du langage est une loi logique si cette formule est
vraie dans toute réalisation du langage, ce qu’on note ( ϕ. (Donc toute réalisa-
tion est un modèle de ϕ, cf. les tautologies dans le calcul des propositions.) Une
formule ψ est une conséquence logique d’une formule ϕ si tout modèle de ϕ est
aussi un modèle de ψ ; on écrit ϕ ( ψ. Deux formules ϕ et ψ sont équivalentes
quand ( pϕ ô ψq.
(3) Montrez que, si P désigne un prédicat binaire quelconque, la formule
Dx@yP px, yq ñ @yDxP px, yq
est une loi logique. Par contre, la formule
@yDxP px, yq ñ Dx@yP px, yq
ne l’est pas : trouvez un contre-exemple.
(4) Montrez qu’une formule ψ est une conséquence logique de ϕ si et seule-
ment si pϕ ñ ψq est une loi logique. Que peut-on alors conclure pour les
équivalences ?
(5) Dans la liste suivante, trouvez les formules équivalentes.
(6) Une paire pX, ăq est un ensemble strictement ordonné quand ă est
une relation sur l’ensemble X qui satisfait les deux formules suivantes :
τ : @x@y@zppx, y, zq P X 3 ^ ppx ă y ^ y ă zq ñ x ă zqq ;
α: @x@yppx, yq P X 2 ^ ppx ă yq ñ py ă xqq.
C’est à dire, pX, ăq est un modèle pour τ ^ α. Montrez que l’axiome de
totalité, i.e. la formule
σ: @x@yppx, yq P X 2 ^ ppx ă yq _ px “ yq _ py ă xqq
est indépendant de τ ^ α : ni la formule σ, ni sa négation σ n’est une
conséquence de τ ^ α. (Donnez des contre-exemples.)
58 4. EXERCICES
5. L’axiome du choix
(1) Soit pA, ďq totalement ordonné et X Ď PpAq tel que tout élément de X
est fini mais non-vide. Alors X a une fonction de choix.
(2) Tout ensemble infini a un sous-ensemble dénombrable.
(3) Si tout ensemble est équipotent à un ordinal, (AC) est valide.
(4) Un ensemble est infini si et seulement si il est équipotent à un sous-
ensemble strict.
(5) r0, 1sN ‰ H et t˚, ¨, ‹uR ‰ H
ś
(6) Soit Xn “ Nzn, alors nPω Xn ‰ H
(7) « Tout monomorphisme d’ensembles est scindé » : vrai ou faux ?
L’axiome du choix dépendant (ACD) est l’énoncé suivant : « Pour tout
ensemble E, pour toute relation binaire sur E telle que @x P E Dy P E xRy,
pour tout e P E, il existe une suite pxn qnPN telle que x0 “ e et pour tout n P N,
xn Rxn`1 . »
L’axiome du choix dénombrable (ACω ) est la version de l’axiome du choix
dans le cas dénombrable. Par exemple, l’énoncé « Le produit de toute famille dé-
nombrable d’ensembles non-vides est non-vide. »
(8) Montrez que (AC) implique (ACD) et (ACω ). (Indication pour (ACD) :
utilisez le lemme de Zorn sur l’ensemble
tx : N Ñ E | N Ď N segment initial, @n P N pn ` 1 P N ñ xn Rxn`1 qu
ordonné par l’inclusion ; voir la définition sur la page 51.)
(9) Complétez la preuve de l’implication (3) ñ (2) dans la proposition 3.5,
chapitre 2, en expliquant pourquoi pxn qnPN est une séquence dans le sens
formel.
(10) Montrez que (ACD) implique (ACω ).
(11) Montrez que sous (ACω ), la réunion d’une famille dénombrable d’en-
sembles dénombrables est dénombrable. Et sans (ACω ) ?
(12) Montrez que le lemme de Zorn se déduit du principe de maximalité
de Hausdorff : soit pE, ďq un ensemble ordonné, alors l’ensemble des
chaînes de pE, ďq, ordonné par l’inclusion, possède un élément maximal.
(13) Montrez que (AC) implique le principe de maximalité de Hausdorff. (In-
dication : passez par le lemme de Zorn.)
Table des matières
Chapitre 1. Introduction 3
1. Les paradoxes, et comment les éviter 3
2. Bibliographie 4
Chapitre 2. La théorie naïve des ensembles : les ordinaux et les cardinaux 5
1. Introduction 5
2. Comment comparer deux ensembles ? 5
3. Les ensembles bien ordonnés 9
4. Les ordinaux 14
5. Les ordinaux comme un système de nombres 18
6. Les cardinaux 21
7. Opérations sur les cardinaux 25
8. Conclusion 29
63