Académique Documents
Professionnel Documents
Culture Documents
J.L. Krivine
2
Ce document est issu d’un polycopié de licence (actuelle L3) de l’université Paris 7 écrit dans les
années 1970, et distribué sous sa forme originale jusqu’à très récemment.
Il a été mis au format LATEX en août 2004 par Raphaël Giromini.
Compléments et corrections (de la copie) des chapitres 1 à 5, par Jean-Louis Krivine, Yves Legrand-
gérard, Paul Rozière.
Ne pas diffuser les chapitres 6 à 8, qui ne sont corrigés que partiellement.
État :
chap 6 : première relecture (superficielle sur les algèbres de Boole)
chap 7 : passage au correcteur orthographique (uniquement lexical)
chap 8 : passage du correcteur orthographique (uniquement lexical)
Envoyer les corrections à roziere@pps.jussieu.fr (ou à l’auteur krivine@pps.jussieu.fr).
Table des matières
2 Entiers Naturels. 13
2.1 Définition des entiers naturels. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2 Relation d’ordre sur les entiers. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3 Fonction sur les entiers. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3.1 L’addition des entiers. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3.2 Le produit de deux entiers. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3.3 Exponentiation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
5 Le théorème de Zorn. 29
5.1 Théorème de Zorn. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.1.1 Démonstration du théorème de Zorn. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.2 Applications du Théorème de Zorn. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3
4 TABLE DES MATIÈRES
5
Chapitre 1
7
8 CHAPITRE 1. THÉORIE INTUITIVE DES ENSEMBLES
Notons que d’après l’axiome d’extensionnalité, un tel ensemble b est déterminé de façon unique.
Remarque. On a pensé à énoncer l’axiome suivant : étant donné une propriété P (x), il existe un en-
semble b dont les éléments sont les ensembles qui ont la propriété P (x).
Mais cela mène à une contradiction quand on prend comme propriété P (x) : x 6∈ x (autrement dit la
propriété pour un ensemble de ne pas s’appartenir à lui-même). En effet, l’énoncer précédent donne
alors un ensemble b tel que pour tout ensemble x on ait x ∈ b ⇔ x 6∈ x. En particulier, pour x = b on
obtient b ∈ b ⇔ b 6∈ b ce qui est évidemment faux.
Cette remarque a été faite par B. Russell (d’où son nom : le paradoxe de Russell) et a imposé l’axiome de
compréhension tel que nous l’avons énoncé.
Ensembles et propriétés. L’ensemble des éléments de l’ensemble a qui ont la propriété P (x) est noté :
{x ∈ a ; P (x)}
Il existe un ensemble et un seul qui n’a aucun élément, on le note ; et on l’appelle « ensemble
vide ». Pour montrer son existence, on prend n’importe quel ensemble a et on considère {x ∈ a ; x 6= x} ;
cet ensemble n’a aucun élément. L’unicité est due à l’axiome d’extensionnalité.
Il n’existe aucun ensemble qui ait tous les ensembles comme éléments : en effet, si a est un tel
ensemble, on pose b = {x ∈ a ; x 6∈ x}. Alors pour tout ensemble x, on a x ∈ b ⇔ x 6∈ x, d’où une contra-
diction comme pour le paradoxe de Russell.
D’après l’axiome d’extensionnalité, il existe un seul ensemble ayant cette propriété, on le note {a, b}.
En particulier, lorsque a = b, on voit qu’il existe un ensemble dont a est le seul élément. On le note {a}.
Cet ensemble
[ b (unique d’après l’axiome d’extensionnalité) est appelé « réunion des éléments de a » et
noté x.
x∈a
Étant donné deux ensembles a, b, on appelle réunion de a et b (et on note a ∪ b) la réunion des
éléments de l’ensemble {a, b}. Pour tout ensemble x, on a donc
x ∈ a ∪ b ⇔ (x ∈ a ou x ∈ b) .
a ∪ b = b ∪ a ; a ∪ (b ∪ c) = (a ∪ b) ∪ c .
Ce dernier ensemble est noté a ∪ b ∪ c et est appelé réunion des ensemble a, b, c. On définit de même
la réunion de quatre ensemble a, b, c, d , etc.
Étant donné trois ensemble a, b, c, il existe un ensemble qui a comme éléments a, b, c et eux seule-
ment : c’est {a} ∪ {b} ∪ {c}. On le note {a, b, c}. On définit de même l’ensemble {a, b, c, d }, etc.
Étant donné deux ensembles a, b, on appelle intersection de a et b (et on note a ∩ b) l’ensemble
{x ∈ a ; x ∈ b} (défini grâce à l’axiome de compréhension). On a donc pour tout ensemble x,
x ∈ a ∩ b ⇔ x ∈ a et x ∈ b .
a ∩ b = b ∩ a ; a ∩ (b ∩ c) = (a ∩ b) ∩ c .
1.2. QUELQUES NOTIONS ÉLÉMENTAIRES. 9
Ce dernier ensemble est noté a ∩ b ∩ c et appelé intersection des ensemble a, b, c. On défini de même
l’intersection de quatre ensemble a, b, c, d , etc. Toujours à l’aide de l’axiome d’extensionnalité, on voit
que
a ∪ (b ∩ c) = (a ∪ b) ∩ (a ∪ c) et a ∩ (b ∪ c) = (a ∩ b) ∪ (a ∩ c) .
Étant donné un ensemble A et une partie X de A, l’ensemble {x ∈ A ; x 6∈ X } (défini grâce à l’axiome de
compréhension) est appelé complémentaire de X par rapport à A et noté ∁ A X (ou encore A − X ). On
voit aisément, à l’aide de l’axiome d’extensionnalité que si X , Y ⊂ A, on a
∁ A (X ∪ Y ) = ∁ A X ∩ ∁ A Y et ∁ A (X ∩ Y ) = ∁ A X ∪ ∁ A Y .
Cet ensemble b (unique d’après l’axiome d’extensionnalité) est appelé ensemble des parties de a et
noté P (A).
Nous énoncerons plus tard les deux derniers axiomes de la théorie des ensembles : l’axiome de
l’infini et l’axiome du choix.
T HÉORÈME 1.2.1
Si (a, b) = (a ′ , b ′ ), alors a = a ′ et b = b ′ .
Étant donné trois ensembles a, b, c, on appelle « triplet ordonné dont le premier élément est a, le second
b et le troisième c » l’ensemble (a, (b, c)). On le note (a, b, c).
T HÉORÈME 1.2.2
Si (a, b, c) = (a ′ , b ′ , c ′ ) alors a = a ′ , b = b ′ et c = c ′ .
En effet on a (a, (b, c)) = (a ′ , (b ′ , c)) donc a = a ′ et (b, c) = (b ′ , c ′ ) d’après le théorème précédent. D’où
b = b ′ et c = c ′ . C . Q . F. D.
On définit de même le quadruplet ordonné (a, b, c, d ) en posant (a, b, c, d ) = (a, (b, c, d )). Donc si (a, b, c, d ) =
(a ′ , b ′ , c ′ , d ′ ) alors a = a ′ , b = b ′ , c = c ′ et d = d ′ . Et ainsi de suite.
et il est clair que P est l’ensemble cherché. Cet ensemble P est appelé produit de A et B , et noté A × B .
Étant donné trois ensemble A, B , C , l’ensemble des triplets (x, y, z) avec x ∈ A, y ∈ B et z ∈ C est
l’ensemble A × (B ×C ). On le note A × B ×C et on l’appelle produit des ensembles A, B , C .
10 CHAPITRE 1. THÉORIE INTUITIVE DES ENSEMBLES
(E ′ est défini grâce à l’axiome de compréhension) E ′ est l’ensemble cherché. On l’appelle ensemble
quotient de E par la relation d’équivalence R, et on le note E /R.
On appelle « partition de E » un sous-ensemble P de P (E ) tel que :
– X ∈ P ⇒ X 6= ;
– X , Y ∈ P et X 6= Y ⇒ X ∩ Y = ;
S
– X ∈P X = E
Alors, E /R est une partition de E , comme on le voit immédiatement. Inversement, si P est une partition
de E , on lui associe une relation d’équivalence R sur E définie par :
Les relations d’équivalence sur l’ensemble E correspondent donc canoniquement aux partitions de E .
1.2.4 Fonctions.
Une application de l’ensemble A dans l’ensemble B (ou encore une fonction définie sur l’ensemble
A à valeurs dans B ), est par définition, un sous ensemble f de A × B qui a la propriété suivante : pour
tout élément x ∈ A, il existe un élément y ∈ B et un seul tel que (x, y) ∈ f . On écrit alors y = f (x) au lieu
de (x, y) ∈ f . On écrit f : A → B pour « f est une application de A dans B ».
Il existe un ensemble C dont les éléments sont les applications de A dans B . En effet, si f est une
application de A dans B , alors f ⊂ A × B , donc f ∈ P (A × B ). On peut donc (au moyen de l’axiome de
compréhension) définir l’ensemble
qui est l’ensemble cherché. L’ensemble des applications de A dans B est noté B A .
Par exemple, si A = ;, B A = {;} (; est une fonction de domaine ; et c’est la seule). Si B = ; et A 6= ;
on a B A = ; (il n’y a aucune fonction de domaine A 6= ; à valeur dans ;).
Une application f : A → B est dite :
– injective si x, x ′ ∈ A, x 6= x ′ ⇒ f (x) 6= f (x ′ )
– surjective si pour tout y ∈ B , il existe x ∈ A tel que y = f (x)
– bijective (ou biunivoque de A sur B ) si elle est à la fois injective et surjective.
Si f est une application biunivoque de A sur B , l’ensemble des couples (y, x) avec x ∈ A, y ∈ B et
(x, y) ∈ f est alors une application de B sur A qu’on note f −1 et qu’on appelle application inverse (ou
réciproque) de f .
1.2. QUELQUES NOTIONS ÉLÉMENTAIRES. 11
h ◦ (g ◦ f ) = (h ◦ g ) ◦ f .
En effet, on a :
(x, t ) ∈ h ◦ (g ◦ f ) ⇔ il existe z ∈ C tel que (x, z) ∈ g ◦ f et (z, t ) ∈ h.
⇔ il existe z ∈ C et y ∈ B tels que (x, y) ∈ f , (y, z) ∈ g et (z, t ) ∈ h.
⇔ il existe y ∈ B tel que (x, y) ∈ f et (y, t ) ∈ h ◦ g .
⇔ (x, t ) ∈ (h ◦ g ) ◦ f . C . Q . F. D.
Y
Cet ensemble est appelé « produit de la famille (a i )i ∈I » et noté ai .
i ∈I
Chapitre 2
Entiers Naturels.
On a donc :
1 = {;} ; 2 = {;, {;}} ; 3 = {{;, {;}, {;, {;}}} ; . . .
L’opération qui permet de passer d’un entier au suivant est une opération très simple sur les en-
sembles : celle qui, à l’ensemble x, associe l’ensemble x ∪ {x} (c’est-à-dire l’ensemble dont les éléments
sont x et les éléments de x). En effet on a, par exemple, 12 = {0, 1, 2, . . . , 11} et 13 = {0, 1, 2, . . . , 11, 12} donc
13 = 12 ∪ {12}.
Dans la suite de ce chapitre on utilisera la notation x + pour désigner l’ensemble x ∪ {x}.
On se propose de définir l’ensemble des entiers. Cet ensemble A doit avoir les propriétés suivantes :
½
;∈ A
(∗)
si x ∈ A alors x + ∈ A .
On ne peut pas déduire des axiomes déjà énoncés l’existence d’un ensemble A ayant les propriétés
(∗). On énonce donc un nouvel axiome :
T HÉORÈME 2.1.1
Il existe un ensemble et un seul qui a les propriétés (∗) et qui est contenu dans tout ensemble A qui a les
propriétés (∗).
On considère un ensemble A qui a les propriétés (∗), il en existe un d’après l’axiome de l’infini.
Soit B l’intersection de tous les sous-ensembles de A qui ont les propriétés (∗). Il est immédiat que B a
encore les propriétés (∗).
Soit C un ensemble quelconque ayant les propriétés (∗) ; alors C ∩ A a encore cette propriété et c’est
un sous-ensemble de A ; donc B ⊂ C ∩ A, par définition de B . Par suite B ⊂ C , ce qui montre que B est
l’ensemble cherché.
Si B ′ a la propriété (∗) et est inclus dans tout ensemble ayant la propriété (∗), alors B ′ ⊂ B et B ⊂ B ′
donc B = B ′ . C . Q . F. D.
13
14 CHAPITRE 2. ENTIERS NATURELS.
L’ensemble défini par le théorème précédent est appelé ensemble des entiers naturels et désigné par
N. Par définition un entier naturel est donc un élément de N, autrement dit un ensemble qui appartient
à tout ensemble ayant la propriété (∗).
L EMME 2.2.1
Si n ∈ N et m ∈ n alors m ∈ N (tous les éléments d’un entier sont des entiers).
On le montre par induction sur n. La propriété est vraie si n = 0 (n n’a pas d’élément). Supposons-la
vraie pour n. Si m ∈ n + comme n + = n ∪ {n} on a ou bien m ∈ n donc m est entier (hypothèse d’induc-
tion), ou bien m = n et m est encore entier. C . Q . F. D.
L EMME 2.2.2
Si n est entier et si m ∈ n, alors m ⊂ n.
Par induction sur n. C’est évident si n = 0. On suppose que c’est vraie pour n et soit m ∈ n ∪{n}. Alors
ou bien m ∈ n donc m ⊂ n (hypothèse d’induction) donc m ⊂ n ∪ {n} ; ou bien m = n, donc m ⊂ n ∪ {n}.
C . Q . F. D.
L EMME 2.2.3
Si n est entier, n 6∈ n.
C’est évident si n = 0 (n n’a pas d’élément). Supposons que n 6∈ n et que n ∪ {n} ∈ n ∪ {n}. On a alors
ou bien n ∪ {n} = n ou bien n ∪ {n} ∈ n. Dans le premier cas on a n ∈ n (car n ∈ n ∪ {n}) ce qui contredit
l’hypothèse. Dans le second, on a n ∪ {n} ⊂ n (lemme 2.2.2). Or n ∈ n ∪ {n}, donc n ∈ n contrairement à
l’hypothèse. C . Q . F. D.
L EMME 2.2.4
Si m, n sont entiers et m ⊂ n alors m = n ou bien m ∈ n.
On le montre par induction sur n : la propriété P (n) est alors « pour tout entier m, si m ⊂ n alors
m = n ou m ∈ n ».
C’est évident si n = 0 (car m ⊂ n ⇒ m = 0). Supposons que l’on ait P (n) et soit m ⊂ n ∪ {n} ; si n 6∈ m
alors m ⊂ n et donc (hypothèse d’induction) m = n ou m ∈ n ; dans ce cas m ∈ n ∪ {n}. Si n ∈ m on a
2.2. RELATION D’ORDRE SUR LES ENTIERS. 15
n ⊂ m (lemme 2.2.2) et {n} ⊂ m (car cela équivaut à n ∈ m). Donc n ∪ {n} ⊂ m et comme par hypothèse
on a l’inclusion inverse, m = n ∪ {n}. C . Q . F. D.
L EMME 2.2.5
Si m est un entier non nul, alors 0 ∈ m.
On montre par induction sur m que m = 0 ou 0 ∈ m. C’est évident si m = 0, si c’est vrai pour m on
a nécessairement 0 ∈ m ∪ {m} : car ou bien m = 0 et on sait que m ∈ m ∪ {m} ou bien m 6= 0 donc 0 ∈ m
(hypothèse d’induction) et 0 ∈ m ∪ {m}. C . Q . F. D.
L EMME 2.2.6
Si m, n sont entiers, alors un et un seul de trois cas suivants est réalisé : n ∈ m, n = m ou m ∈ n.
Dans toute la suite, nous ne nous servirons plus explicitement de la définition de N, mais seulement
du fait que N satisfait les propriétés (1), (2), (3) et (4).
T HÉORÈME 2.2.7
Si m, n ∈ N et m + = n + , alors m = n.
T HÉORÈME 2.2.8
Tout ensemble d’entier qui est non vide a un plus petit élément.
Soit X un sous-ensemble de N qui n’a pas de plus petit élément. On considère la propriété P (n) : « n
est un entier et aucun entier m ≤ n n’est élément de X ».
Comme X n’a pas de plus petit élément, en particulier 0 6∈ X et donc P (0). De plus P (n) ⇒ P (n + )
pour tout entier n : car n + n’étant pas le plus petit élément de X , si aucun entier inférieur ou égal à n
n’est élément de X , aucun entier inférieur ou égal à n + ne peut être élément de X .
D’après le principe d’induction, P (n) est donc vrai pour tout entier n mais cela implique que X est
vide. On en déduit le résultat par contraposée. C . Q . F. D.
16 CHAPITRE 2. ENTIERS NATURELS.
T HÉORÈME 2.3.1
Il existe une application f de N dans E , et une seule, telle que f (0) = a et f (n + ) = H (n, f (n)) pour tout
entier n.
Il est clair que l’intersection M 0 de tous ces ensembles M de N × E a encore ces propriétés. C’est
donc le plus petit sous-ensemble de N × E qui a ces propriétés. On va en déduire que c’est le
graphe d’une application de N dans E .
Pour tout entier n, il existe y ∈ E tel que (n, y) ∈ M 0 : c’est vrai pour n = 0, puisque (0, a) ∈ M 0 ; si
c’est vrai pour n, c’est vrai pour n + d’après la deuxième propriété satisfaite par M 0 .
Pour tout entier n, si (n, y) ∈ M 0 et (n, z) ∈ M 0 alors y = z. On raisonne par l’absurde et on consi-
dère le premier entier m tel qu’il existe y, z ∈ E , y 6= z, (m, y) ∈ M 0 , (m, z) ∈ M 0 .
Si m = 0, on a par exemple y 6= a ; soit M 0′ l’ensemble obtenu en ôtant (0, y) de M 0 (M 0′ = M 0′ −
{(0, y)}) ; Alors M 0′ a les deux propriétés ci-dessus. et est strictement inclus dans M 0 , ce qui contre-
dit la définition de M 0 .
On a donc m 6= 0 et par suite m = p + . D’après la définition de m, il existe un élément t et un
seul de E tel que (p, t ) ∈ M 0 ; alors (p + , H (p, t )) ∈ M 0 et on a, par exemple y 6= H (p, t ). On pose
M 0′ = M 0 − {(m, y)} = M 0 − {(p + , y)}. Alors M 0′ a les deux propriétés ci-dessus : car (0, a) ∈ M 0 et
(0, a) 6= (m, y), donc (0, a) ∈ M 0′ . Si (n, u ∈ M 0′ alors (n + , H (n, u)) ∈ M 0 et (n + , H (n, u)) 6= (m, y) :
c’est évident si n + 6= m et si n + = m alors n = p, donc u = t et y 6= H (p, t ). Donc (n + , H (n, u)) ∈ M 0′ .
Comme M 0′ est strictement inclus dans M 0 , on a encore contredit la définition de M 0 .
M 0 est donc le graphe d’une application f de N dans E et on a bien f (0) = a, f (n + ) = H (n, f (n))
pour chaque entier n.
C . Q . F. D.
Quand on utilise ce théorème pour définir une fonction f , on dit que f est définie par induction sur
les entiers.
Associativité de l’addition. k +(n +p) = (k +n)+p, ce qu’on montre par induction sur p. C’est évident
si p = 0, et on a
k + (n + p + ) = k + (n + p)+ = [k + (n + p)]+
D’après l’hypothèse d’induction, k + (n + p) = (k + n) + p et donc
k + (n + p + ) = [(k + n) + p]+ = (k + n) + p + .
2.3. FONCTION SUR LES ENTIERS. 17
1 + k + = (1 + k)+ = (k + 1)+ = k ++ = k + + 1 .
k + + n = (k + 1) + n = (1 + k) + n = 1 + (k + n) = 1 + (n + k)
= (1 + n) + k = (n + 1) + k = n + (1 + k) = n + k + .
Distributivité du produit par rapport à l’addition. On montre par induction sur k que n(m + k) =
n · m + n · k. C’est évident si k = 0, et on a :
n(m + k + ) = n[(m + k) + 1]
= n(m + k) + n
= nm + nk + n (hypothèse d’induction)
= nm + nk + .
associativité du produit. On montre par induction sur k que n(mk) = (nm)k. C’est évident si k = 0, et
on a
(nm)k + = (nm)k + nm
= n(mk) + nm (hypothèse d’induction)
= n(mk + m) (distributivité)
= n(mk + ) .
Commutativité du produit. On montre d’abord par induction sur k que 0 · k = k · 0 = 0. C’est évident
si k = 0, et :
0 · k+ = 0 · k + 0 · 1 (distributivité)
=0.
nk + = nk + n
= kn + n (hypothèse d’induction)
= (k + 1)n (d’après ce qu’on vient de montrer).
18 CHAPITRE 2. ENTIERS NATURELS.
2.3.3 Exponentiation.
Étant donné un entier k, on définit k n par induction sur n par les conditions :
½
k0 = 1
k n+1 = kn · k .
k n+p = k n · k p ; (k n )p = k n·p .
Chapitre 3
T HÉORÈME 3.1.1
Si a est un ensemble fini, il existe un et un seul entier qui puisse être mis en bijection avec a. Cet entier est
appelé le cardinal de a ou encore le nombre d’éléments de a. Il est noté a
L EMME 3.1.2
Soient a un ensemble non vide, x 0 ∈ a, f une bijection de a sur un entier n. Alors n 6= 0 et il existe une
bijection de a − {x 0 } sur n − 1.
T HÉORÈME 3.1.3
Si a est un ensemble fini et b une partie de a, alors b est fini et b ≤ a. De plus, si b 6= a, alors b < a.
T HÉORÈME 3.1.4
si a, b sont deux ensembles finis disjoints, A ∪ B = A + B . Si a, b sont deux ensembles finis quelconques,
a × b = a.b et P (a) = 2a .
19
20 CHAPITRE 3. ENSEMBLES FINIS ET DÉNOMBRABLES.
3.2 Équipotence
Deux ensembles quelconques a, b seront dit équipotents s’il existe une bijection de a sur b. On dit
aussi que a et b ont le même cardinal ou encore la même puissance. Mais on ne définira pas, comme
dans le cas des ensembles finis, le cardinal d’un ensemble quelconque a. On utilisera provisoirement la
notation a ∼ b pour « a est équipotent à b ». On a évidemment les propriétés suivantes :
a∼a
a ∼b⇔b∼a
(a ∼ b et b ∼ c) ⇒ a ∼ c
Un ensemble est donc fini si et seulement s’il est équipotent à un entier. Dans le cas contraire, il est
dit infini.
T HÉORÈME 3.3.1
Tout sous ensemble d’un ensemble dénombrable est fini ou dénombrable
On peut supposer que l’ensemble dénombrable considéré est N lui-même. On a donc un ensemble
A ⊂ N : supposons A infini. On définit par induction une bijection f : N → A. Pour cela on pose :
On a donc f (n + 1) > f (n) pour tout n ∈ N, donc f est une injection de N dans A.
La fonction f est surjective. En effet soit x 0 le plus petit élément de A non atteint par f , s’il en existe ;
l’ensemble {x ∈ A ; x < x 0 } a un plus grand élément x 1 = f (n) (il est atteint par f ). Mais x 0 est le plus
petit élément de A qui est strictement supérieur à f (n) donc x 0 = f (n + 1). C . Q . F. D.
T HÉORÈME 3.3.2
S’il existe une injection de A dans N ou bien une surjection de N dans A alors A est fini ou dénombrable.
Si f est une injection de A dans N, l’image de f est un sous ensemble de N qui est équipotent à A.
Donc A est fini ou dénombrable d’après le théorème précédent.
Soit g une surjection de N sur A. On définit une injection h : A → N en posant
£ ¤
h(x) = le premier entier n tel que g (n) = x .
C . Q . F. D.
T HÉORÈME 3.3.3
N × N est dénombrable.
Comme N × N n’est pas fini, il suffit, d’après le théorème précédent de trouver une injection f :
N × N → N. On peut poser, par exemple f (x, y) = 2x .3 y (unicité de la décomposition d’un nombre en
facteurs premiers). C . Q . F. D.
C OROLLAIRE 3.3.4
Le produit de deux ensembles dénombrables est dénombrable.
3.3. ENSEMBLES DÉNOMBRABLES. 21
C OROLLAIRE 3.3.5
Np est dénombrable, pour tout entier p ≥ 1.
C OROLLAIRE 3.3.6
Z et Q sont des ensembles dénombrables.
Définition. Une famille d’ensembles (a n )n∈N indexée par N (autrement dit une fonction de domaine
N) est aussi appelée une « suite d’ensembles ». Au lieu d’écrire « la suite d’ensembles (a n )n∈N » on écrit
souvent « la suite d’ensembles a 0 , a 1 , . . . , a n , . . . ». On a donc trois noms (et trois notations) différents
pour la même notion :
– une fonction de domaine N, notée f : N → E
– une famille d’ensembles indexée par N, notée (a n )n∈N
– une suite d’ensembles, notée a 0 , a 1 , . . . , a n , . . .
Lorsqu’on a un ensemble dénombrable E , on choisit souvent une bijection f = N → E qui est donc aussi
une suite a 0 , a 1 , . . . , a n , . . . . On dit que cette suite énumère E et on écrit :
E = {a 0 , a 1 , . . . , a n , . . .} .
22 CHAPITRE 3. ENSEMBLES FINIS ET DÉNOMBRABLES.
Chapitre 4
Autrement dit : le produit d’une famille d’ensemble non vides est non vide.
Étant donné un ensemble E , on appelle fonction de choix sur E une application f dont le domaine
est l’ensemble des parties non vides de E (c’est à dire P (E ) − {;}) à valeur dans E , telle que f (X ) ∈ X
pour toute partie non vide X de E
C OROLLAIRE 4.1.1
Sur tout ensemble E , il existe une fonction de choix.
En effet, il suffit d’appliquer l’axiome du choix à la famille des parties non vide de E (c’est à dire
l’application identique dont le domaine est l’ensemble des parties non vides de E ). C . Q . F. D.
T HÉORÈME 4.1.2
Tout ensemble infini possède un sous-ensemble dénombrable.
Φ(0) = { f (E )}
Φ(n + 1) = Φ(n) ∪ { f (E − Φ(n))}
Φ(n +1) est donc une partie de E , obtenue en ajoutant à Φ(n) un élément de E . Il en résulte que Φ(n) est
fini pour tout n ∈ N. Comme E n’est pas fini, E − Φ(n) 6= ;, donc (par définition de f ) f (E − Φ(n)) 6∈ Φ(n)
et, par suite, Φ(n + 1) − Φ(n) possède un élément et un seul. On peut alors définir ϕ : N → E en posant
ϕ(0) = f (E )
ϕ(n + 1) = le seul élément de Φ(n + 1) − Φ(n)
23
24 CHAPITRE 4. COMPARAISON DES ENSEMBLES INFINIS
C OROLLAIRE 4.1.3
Un ensemble est infini si et seulement s’il est équipotent à une partie propre.
Il est clair que f est une bijection de E sur E − {a 0 } ; donc une bijection de E sur une partie propre de E .
C . Q . F. D.
T HÉORÈME 4.1.4
La réunion d’une suite d’ensemble dénombrables ou finis est un ensemble dénombrable ou fini.
Soit (A n )n∈N une suite d’ensemble dénombrables ou finis. Il suffit de trouver une application sur-
S
jective de N sur n∈N A n .
Pour chaque n ∈ N, soit S n l’ensemble des applications surjectives de N sur A n . Par hypothèse, S n 6=
; pour chaque n ∈ N. D’après l’axiome du choix, il existe une fonction ϕ, de domaine N, telle que ϕ(n) ∈
S n pour tout n ∈ N. Autrement dit, ϕ(n) est, pour chaque entier n, une surjection de N sur A n .
S S
On définit Φ : N×N → n∈N A n en posant Φ(n, p) = ϕ(n)(p). Alors Φ est surjective. car si x ∈ n∈N A n ,
on a x ∈ A m donc x = ϕ(m)(a) pour un certain entier q, puisque ϕ(m) est surjective.
Comme N × N est dénombrable, on a le résultat cherché. C . Q . F. D.
[ On en déduit immédiatement que l’ensemble des suites finies d’entiers — autrement dit l’ensemble
Np ) — est dénombrable.
p∈N
L’ensemble P des polynômes à une variable, à coefficient dans Z est dénombrable : si Pk est l’en-
semble des polynômes de degré ≤ k, Pk est équipotent à Zk+1 (un polynôme de degré ≤ k est une suite
S
de k + 1 entiers relatifs) donc est dénombrable. L’ensemble considéré est P = k∈N Pk donc est dénom-
brable.
L’ensemble des nombres algébriques réels (nombres réels qui est racine d’un polynôme à une va-
riable à coefficient dans Z) est dénombrable. En effet, à chaque polynôme u ∈ P, associons l’ensemble
S
fini R u de ses racines réelles. L’ensemble étudié est u∈P R u . Comme P est dénombrable c’est la réunion
d’une suite d’ensemble finis, donc un ensemble dénombrable d’après le théorème précédent (ce n’est
évidemment pas un ensemble fini).
T HÉORÈME 4.2.1
P (N) n’est pas dénombrable.
Supposons qu’il existe une application surjective f : N → P (N). On définit x ∈ P (N) en posant X =
{n ∈ N ; n 6∈ f (n)}. Puisque f est surjective, il existe n 0 ∈ N tel que f (n 0 ) = X . Par définition de X , on a
n 0 ∈ X ⇔ n 0 6∈ f (n 0 ). Autrement dit n 0 ∈ X ⇔ n 0 6∈ X , ce qui est une contradiction. C . Q . F. D.
T HÉORÈME 4.2.2
L’intervalle [0, 1[ de R n’est pas dénombrable.
4.2. ENSEMBLES NON DÉNOMBRABLES. 25
Soit f une application surjective de N sur [0, 1[. Le réel f (n) possède une représentation décimale
0, a n0 a n1 · · · a nk · · · et une seule (où a nk ∈ {0, 1, . . . , 9}).
La suite (a nk )k∈N n’étant pas formée de 9 à partir d’un certain rang, on définit alors une suite (b k )k∈N
d’entiers (0 ≤ b k ≤ 9), en posant b k = 0 si a kk 6= 0 et b k = 1 si a kk = 0.
La suite b k n’étant pas formée de 9 à partir d’un certain rang (elle n’en c ontient pas), le réel 0, b 1 b 2 · · · b k · · ·
est donc un élément de [0, 1[ et comme f est surjective, il existe un entier n 0 tel que f (n 0 ) = 0, b 1 b 2 · · · b k · · · .
On a donc :
0, a n1 0 a n2 0 · · · a nk 0 · · · = 0, b 1 b 2 · · · b k · · ·
n
En particulier b n0 = a n00 , ce qui contredit la définition de b n0 . C . Q . F. D.
Bien entendu, il en résulte que R lui-même n’est pas dénombrable puisque R ⊃ [0, 1[.
Comme on a démontré plus haut que l’ensemble des nombres algébriques réels est dénombrables
on a ainsi prouvé : il existe un nombre réel transcendant (c’est-à-dire non algébrique). Et même l’en-
semble des nombres réels transcendants est non dénombrable (car la réunion de deux ensembles dé-
nombrables est dénombrable).
T HÉORÈME 4.2.3
Si E est infini et F est dénombrable ou fini, alors E ∪ F est équipotent à E .
T HÉORÈME 4.2.4
Si E est infini non dénombrable, on obtient un ensemble équipotent en lui retranchant une partie dé-
nombrable ou finie.
En effet, si A ⊂ E est dénombrable ou fini, E ′ = E − A est infini donc d’après le théorème précédent,
E ∼ E′ ∪ A = E.
′
C . Q . F. D.
On en déduit que les divers ensembles non dénombrables rencontrés jusqu’à présent sont tous
équipotents :
T HÉORÈME 4.2.5
R, P (N), les intervalles [a, b], [a, b[, ]a, b[ de R (a < b) sont des ensembles équipotents.
Il est clair que [a, b], [a, b[, ]a, b[ sont équipotents (d’après le théorème 4.2.4). Or ] − 1, 1[ est équi-
potent à ]a, b[ (considérer la fonction y = a + 21 (b − a)(x + 1) et ] − 1, 1[ est équipotent à R (considérer la
x
fonction y = 1−x 2 ).
Il suffit donc de montrer que P (N) est équipotent à un intervalle [a, b[, par exemple à [0, 1[. On
définit une application ϕ : [0, 1[→ P (N) de la façon suivante : si r ∈ [0, 1[, r possède une développement
binaire et un seul, soit 0, ε0 ε1 · · · εn · · · qui ne doit pas formé exclusivement de 1 à partir d’un certain
rang.
On pose ϕ(r ) = {n ∈ N ; εn = 0}. On montre aisément que ϕ est injective et que l’image de ϕ est
l’ensemble P ∞ (N) des parties infinies de N. Il en résulte que [0, 1[ est équipotent à P ∞ (N).
Or P ∞ (N) est obtenu en retranchant de P (N) un ensemble dénombrable (l’ensemble des parties
finies de N) donc (théorème 4.2.4) P ∞ (N) est équipotent à P (N). C . Q . F. D.
T HÉORÈME 4.2.6
Rn , P (N)n sont équipotents à R pour tout n ∈ N.
On montre d’abord que P (N)2 est équipotent à P (N) : soient A, B deux ensembles dénombrables
disjoints. Il est clair que P (N) est équipotent à P (A), P (B ), P (A ∪B ) (car A ∪B est aussi dénombrable).
Or, se donner une partie de A ∪ B revient à se donner une partie de A et une partie de B , donc P (A) ×
P (B ) ∼ P (A ∪ B ). Il en résulte que P (N)2 ∼ P (N).
Il en résulte que R2 est équipotent à R. On montre alors immédiatement par induction sur n, que
n
R ∼ R pour tout n ∈ N C . Q . F. D.
26 CHAPITRE 4. COMPARAISON DES ENSEMBLES INFINIS
Définition. On dit que le cardinal (ou la puissance) de l’ensemble E est inférieur ou égal à celui de F
s’il existe une injection de E dans F . On écrit alors E ≤ F .
On a immédiatement les propriétés suivantes :
– Si E ≤ F et F ≤ G, alors E ≤ G.
– Si E ∼ F alors E ≤ F et F ≤ E . La réciproque est vraie (mais non évidente) et sera démontrée un
peu plus loin (théorème 4.2.8 de Cantor-Bernstein).
– Si E ≤ E ′ et F ≤ F ′ , alors E × E ′ ≤ F × F ′
– Si E et E ′ sont des ensembles disjoints, ainsi que F et F ′ , et si E ≤ F et E ′ ≤ F ′ , alors E ∪ E ′ ≤ F ∪ F ′ .
T HÉORÈME 4.2.7
Soient E et F deux ensembles tel que E 6= ;. Alors E ≤ F si et seulement s’il existe une surjection de F sur
E.
L EMME 4.2.9
Si A ⊂ E , et s’il existe ϕ : E → A injective, alors A ∼ E .
(Théorème 4.2.8.) En effet, en admettant le lemme, considérons deux ensembles E , F tels que E ≤ F
et F ≤ E . On a donc deux injections f : E → F et g : F → E . Si A ⊂ E est l’image de g , F est équipotent à
A. Or g ◦ f est une injection de E dans A. D’après le lemme 4.2.9, E est équipotent à A, donc à F C . Q . F. D.
(Lemme 4.2.9.) Pour chaque x ∈ E , on définit par induction ϕn (x) pour tout n ∈ N :
ϕ0 (x) = 0
ϕn+1 (x) = ϕ(ϕn (x))
T HÉORÈME 4.2.10
L’ensemble NN des fonctions définies sur les entiers à valeur entières a la puissance du continu.
Si, à chaque partie de N, on associe sa fonction caractéristique, on obtient une injection de P (N)
dans NN .
D’autre part, une fonction f : N → N est un ensemble de couples d’entiers donc NN ⊂ P (N2 ). Comme
P (N2 ) est équipotent à P (N) (puisque N2 est dénombrable) on en déduit une injection de NN dans
P (N).
D’après le théorème de Cantor-Bernstein, NN est équipotent à P (N). C . Q . F. D.
On dira que l’ensemble E a une puissance strictement inférieure à celle de F (ce qu’on écrit E < F )
si E ≤ F et E 6= F . Autrement dit, s’il existe une injection de E dans F mais pas d’injection de F dans E .
Par exemple, R a une puissance strictement supérieure à celle de N.
Le théorème suivant montre que , pour tout ensemble, il en existe un de puissance strictement
supérieure.
Le théorème de Zorn.
E ≤E ;
³ ´
E ≤ F et F ≤ E ⇔ E = F ;
³ ´
E ≤ F et F ≤ G ⇒ E ≤ G .
Il serait maintenant intéressant de montrer qu’on peut comparer les puissances de deux ensembles
quelconques. Autrement dit : étant donné deux ensembles E et F , ou bien E ≤ F ou bien F ≤ E . Ce ré-
sultat sera obtenu comme application d’un théorème très important de théorie des ensembles attribué
à Zorn.
Rappelons que, si E est un ensemble ordonné et X une partie de E , un majorant de X est un élément
m de E tel que m ≥ x pour tout x ∈ X . Si, de plus, m 6∈ X , on dit que m est un majorant strict de X .
Un élément maximal de E est un élément a de E qui n’a pas de majorant strict (pour aucun x de E ,
on n’a x > a).
Avant de prouver le théorème de Zorn, donnons l’application indiquée à la comparaison des puis-
sances de deux ensembles.
T HÉORÈME 5.1.2
Quels que soient les ensembles E , F , il existe ou bien une injection de E dans F , ou bien une injection de
F dans E .
(Théorème 5.1.2.) Soit E l’ensemble des applications f injectives donc le domaine est une partie A f
de E et l’image une partie B f de F . On met sur E une relation d’ordre en posant :
¡ ¢
f ≤ g ⇔ A f ⊂ A g et f est la restriction de g à A f
29
30 CHAPITRE 5. LE THÉORÈME DE ZORN.
T
En effet, si x ∈ A f A f ′ , avec f , f ′ ∈ X , comme X est totalement ordonné on a par exemple f ≤ f ′ ,
donc f (x) = f ′ (x)) ; ϕ est le prolongement commun de tous les éléments de X , donc est un majorant
de X .
Soit f 0 : A 0 → B 0 un élément maximal de E ; il en existe d’après le théorème de Zorn. Si A 0 = E , f 0 est
une injection de E dans F . Si B 0 = F , f 0−1 est une injection de F dans E .
Supposons alors que A 0 6= E , B 0 6= F . On prend x 0 ∈ E − A 0 , y ∈ F − B 0 et on définir g 0 : A 0 ∪ {x 0 } →
B 0 ∪ {y 0 } comme le prolongement de f qui donne à x 0 la valeur y 0 . On a alors g 0 ∈ E et g 0 > f 0 ce qui
contredit la maximalité de f 0 . C . Q . F. D.
T HÉORÈME 5.1.3
Soit E un ensemble ordonné ayant les propriétés suivantes :
– toute chaîne de E a une borne supérieure ;
– si x ∈ E a un majorant strict, l’ensemble des majorants stricts de x a un élément minimal.
Alors E a un élément maximal.
On raisonne par l’absurde, en supposant que tout élément de E a un majorant strict. En utilisant
l’axiome du choix, on considère une fonction f : P (E ) → E telle que f (X ) ∈ X pour toute partie non
vide X de E .
Pour chaque x ∈ E , soit M x l’ensemble des majorants stricts minimaux de x. Par hypothèse M x 6= ;
pour tout x ∈ E .
On définit l’application µ : E → E en posant µ(x) = f (M x ). il en résulte que µ(x) est un majorant
strict minimal de x ; autrement dit, x < µ(x) et, si y ∈ E est tel que x ≤ y ≤ µ(x), on a x = y ou y = µ(x).
Soit X l’ensemble de toutes les parties X de E ayant les propriétés suivantes :
– si Y ⊂ X est une chaîne, alors sup(Y ) ∈ E ;
– si x ∈ X , µ(x) ∈ X .
On désigne par X 0 l’intersection de tous les X ∈ X . On vérifie immédiatement que X 0 ∈ X ; X 0 est donc
le plus petit élément de X (c’est-à-dire inclus dans tous éléments de X ).
Si on montre que X 0 est une chaîne, on aura la contradiction cherchée : en effet, d’après les proprié-
tés définissant les éléments de X , on aura alors sup(X 0 ) = a ∈ X 0 d’où µ(a) ∈ X 0 Or µ(a) est un majorant
strict de sup(X 0 ), donc de X 0 et ne peut être élément de X 0 .
Soit y ∈ X .
– Si y ≥ µ(x), on a µ(y) > y ≥ µ(x), donc µ(y) ∈ X .
– Si y ≤ x, on remarque que µ(y) ∈ X 0 (car y ∈ X 0 ) donc µ(y) est comparable à x ; si µ(y) ≤ x on a
µ(y) ∈ X ; si µ(y) ≥ x, on a y ≤ x ≤ µ(y) et donc y = x ou x = µ(y). Donc µ(y) = µ(x) ou µ(y) = x.
Dans les deux cas µ(y) ∈ X .
5.2. APPLICATIONS DU THÉORÈME DE ZORN. 31
Soit E l’ensemble des chaînes de C . Il suffit de prouver que E satisfait aux hypothèses du théorème
précédent.
Soit X ⊂ E une chaîne de E , donc si A, B ∈ X A et B sont des chaînes de C et on a A ⊂ B ou B ⊂ A. il
S
est alors immédiat de voir que A∈X A est une chaîne de C qui est la borne supérieure de X .
Soit A ∈ E , A ayant un majorant strict B . On a donc A ⊂ B , A 6= B , A,B étant des chaînes de C . On
choisit a ∈ B − A ; alors A ∪ {a} est un majorant strict minimal de A. C . Q . F. D.
T HÉORÈME 5.2.1
Soient E 1 , E 2 deux ensembles équipotents à un ensemble infini E . Alors
E1 ∪ E2 = E
C OROLLAIRE 5.2.2
Soient E 1 , . . . , E n des ensembles tels que E 1 ≥ E 2 , E 1 ≥ E 3 , . . ., E 1 ≥ E n , E 1 étant infini. Alors :
E1 ∪ E2 ∪ · · · ∪ En = E1 .
T HÉORÈME 5.2.3
Soient E un ensemble infini, E 1 , E 2 deux ensembles équipotents à E . Alors E = E 1 × E 2 .
B1 ⊂ E1 − A1 , B2 ⊂ E2 − A2 ;
donc si on pose C = A ∪ B , on a :
C 1 ×C 2 = (A 1 × A 2 ) ∪ (A 1 × B 2 ) ∪ (A 2 × B 1 ) ∪ (B 1 × B 2 ) .
C OROLLAIRE 5.2.4
Soient E 1 , . . . , E n des ensembles non vides tels que E 1 ≥ E 2 , E 1 ≥ E 3 , ... , E 1 ≥ E n , E 1 étant infini. Alors
E1 × E2 × · · · × En = E1 .
Donc E 1 × · · · × E n ≤ E 1 . L’inégalité inverse est évidente (parce que E 2 , . . . , E n sont non vides). C . Q . F. D.
Deuxième partie
33
35
L’objet de la logique est d’étudier et d’analyser le raisonnement mathématique. Pour cela, on exa-
mine les textes mathématiques effectivement écrits et on essaye de fabriquer des structures qui rendent
compte, avec plus ou moins de fidélité, des propriétés du langage mathématique. Les plus connues
parmi ces structures s’appelle le « calcul des propositions » (ou « calcul propositionnel ») et le « calcul
des prédicats ». Ce sont celles que nous examinerons dans ce cours.
Cette étude s’est révélée extrêmement intéressante, et a donné lieu à de nombreux résultats. Surtout,
elle a permis de se rendre compte clairement de ce qu’est la méthode axiomatique et des limites de cette
méthode ; par exemple, pour certains problèmes mathématiques qui n’avaient pas été résolus (le cas le
plus célèbre est ce qu’on appelle « l’hypothèse du continu »), on a pu ainsi prouver qu’ils étaient, en fait,
insolubles.
36
Chapitre 6
6.1 Syntaxe.
Dans le langage mathématique, on considère tout d’abord les « connecteurs propositionnels » ;
A, B,C , . . . étant certains énoncés (vrais ou faux, cela importe peu), il est habituel d’en former d’autres
du genre suivant :
– « A si et seulement si B » ; « Pour que A il faut et il suffit que B » ; « une condition nécessaire et
suffisante pour que A et B » ; ces trois nouveaux énoncés (et toutes les locutions synonymes) sont
écrits en abrégé : A ⇔ B .
– Les énoncés « A implique B » ; « Si A alors B » ; « A est une condition suffisante pour que B » ;
« B est une condition nécessaire pour que A » ; et toutes les expressions synonymes sont écrits en
abrégé : A ⇒ B .
– L’énoncé « il est faux que A » et toutes les expressions synonymes est écrit en abrégé : non A.
– On peut aussi former l’énoncé « A et B » (ce qui signifie que A et B sont vrais tous les deux) et
l’énoncé « A ou B » (qui signifie qu’au moins l’un des deux énoncé A, B est vrai).
Les symboles ⇔, ⇒, non, et, ou du langage mathématique sont appelés connecteurs propositionnels.
Pour étudier systématiquement ces connecteurs, on définit une structure mathématique adéquate :
c’est le calcul propositionnel.
On considère des lettres p, q, r, . . . appelées variables propositionnelles et des symboles :
↔, →, ¬, ∧, ∨, (, )
qui sont appelés respectivement symboles d’équivalence, d’implication, de négation, de conjonction,
de disjonction, parenthèse ouvrante et parenthèse fermante.
Les formules du calcul propositionnel sont, par définition, les suites finies formées de variables
propositionnelles et des symboles ci-dessus, qu’on obtient en appliquant un nombre fini de fois les
règles suivantes :
1. Chaque variable propositionnelle p, q, r . . . est une formule.
2. Si F est une formule ¬(F ) en est une (c’est la suite finie obtenue en mettant à la suite les symboles
¬, ( la suite finie constituée par F , et le symbole ) ; on l’appelle négation de F ).
3. Si F et G sont des formules alors (F )∧(G), (F )∨(G), (F ) → (G), (F ) ↔ (G) sont des formules (∧, ∨, →
, ↔ se lisent respectivement : et, ou, implique, équivaut à).
Par exemple ((¬(p)) → (q)) → ((r ) ∨ (s)) est une formule. Le nombre total de symboles et de variables
propositionnelles qui apparaissent dans une formule est appelée longueur de cette formule. Par exemple,
la longueur de la formule ci-dessus est 22.
T HÉORÈME 6.1.1
Pour chaque formule F , un et un seul des cas suivant se présente :
37
38 CHAPITRE 6. CALCUL PROPOSITIONNEL ET ALGÈBRES DE BOOLE.
D’après la définition des formules, il est clair qu’au moins l’un de ces cas se présente : F a été
construite en appliquant un nombre fini de fois les règles (1), (2), (3) et il suffit de considérer la der-
nière application de ces règles dans la construction de F .
Si F est une variable propositionnelle, seul le cas (1) peut se présenter.
Si le premier symbole de F est ¬, seul le cas (2) peut se présenter : car dans les autres cas, le premier
symbole est (.
La formule F étant donnée, on cherche à établir les couples de parenthèses (une ouvrante, une
fermante) qui entourent les formules partielles qui apparaissent dans la construction de F . Il est clair
z }| {
que deux tels couples on l’une des dispositions suivantes : ( ) ( ) ou bien ( ( ) ), mais qu’on ne peut
|{z} |{z} |{z}
avoir la disposition
z }| {
( ( ) ) (∗)
| {z }
L EMME 6.1.2
Pour toute suite finie de parenthèses, il y a au plus une façon de former des couples de parenthèses (une
ouvrante et une fermante) de façon à éviter la disposition (∗) et de façon que chaque parenthèse soit
couplée avec une autre.
On démontre ce lemme par induction sur le nombre de parenthèses. On considère la première pa-
renthèse fermante de la suite donnée. Elle est alors précédée d’une parenthèse ouvrante et on doit
nécessairement coupler ces deux parenthèses, sinon on obtient la disposition (∗) à éviter. En ôtant ce
couple on obtient une suite de parenthèses plus courte, d’où le résultat par récurrence. C . Q . F. D.
D’après le lemme, il n’y a donc qu’une façon de rétablir les couples de parenthèses dans F . Comme
F commence par (, on cherche la parenthèse ) qui lui est associée. Ces deux parenthèses entourent une
formule G qui est donc déterminée de façon unique. De même le symbole qui suit cette parenthèse
fermante est déterminé de façon unique ; c’est ∧, ∨, → ou ↔ et on est dans un seul de ces cas 3, 4, 5 ou
6. Ce symbole est suivi par (H ) et donc H est déterminé de façon unique. C . Q . F. D.
Pour alléger l’écriture des formules, on supprime les parenthèses autour des variables proposi-
tionnelles et des négations de variables propositionnelles. De plus on convient d’écrire les formules
(A ∧ B ) → (C ∨ D) et (A ∧ B ) ↔ (C ∨ D) sous la forme A ∧ B → C ∨ D et A ∧ B ↔ C ∨ D. Avec ces conven-
tions la formule ((¬(p)) → (q)) → ((r ) ∨ (s)) est écrite (¬p → q) → r ∨ v.
Dans la suite on notera F (p 1 , . . . , p n ) une formule dans laquelle les variables propositionnelles qui
apparaissent sont p 1 , . . . , p n . Si G est une formule quelconque, on note F (G, p 2 , . . . , p n ) la suite de sym-
boles obtenue en substituant G à p 1 partout où p 1 apparaît dans F .
T HÉORÈME 6.1.3
Si F (p 1 , . . . , p n ) et G sont des formules, alors F (G, p 2 , . . . , p n ) en est une.
Par induction sur la longueur de F : c’est évident si F est de longueur 1, car alors c’est une variable
propositionnelle.
Si F = ¬F ′ (p 1 , . . . , p n ) alors F ′ est plus courte que F , donc F ′ (G, p 2 , . . . , p n ) est une formule (hypo-
thèse de récurrence) donc aussi ¬F ′ (G, p 2 , . . . , p n ), c’est-à-dire F (G, p 2 , . . . , p n ).
Même raisonnement si F = F ′ ∨ F ′′ , F = F ′ ∧ F ′′ , F = F ′ → F ′′ et F = F ′ ↔ F ′′ . C . Q . F. D.
6.2. VALEUR D’UNE FORMULE POUR UNE DISTRIBUTION DE VALEURS DE VÉRITÉ. 39
G ¬G
0 1
1 0
G H G ∨H G H G ∧H
0 0 0 0 0 0
0 1 1 0 1 0
1 0 1 1 0 0
1 1 1 1 1 1
G H G→H G H G↔H
0 0 1 0 0 1
0 1 1 0 1 0
1 0 0 1 0 0
1 1 1 1 1 1
Noter que, dans cette définition, on s’est servi du fait que chaque formule F s’écrit d’une seule façon
sous l’une des forme G ∨ H ,G ∧ H ,G → H ,G ↔ H .
Définition. Une formule F (p 1 , . . . , p n ) qui prend la valeur 1 pour chaque distribution de valeur de vé-
rité sur ses variables propositionnelles est appelée une tautologie. On utilise la notation ⊢ F pour expri-
mer que F est une tautologie.
Deux formules F (p 1 , . . . , p n ),G(p 1 , . . . , p n ) sont dites tautologiquement équivalentes (ou, en abrégé,
équivalentes) si elles prennent la même valeur pour chaque distribution de valeur de vérité. On voir
aisément que cela revient à dire que la formule F ↔ G est une tautologie ; on écrit donc ⊢ F ↔ G pour
exprimer que F et G sont équivalentes.
Le théorème suivant (qui est intuitivement évident) exprime la propriété fondamentale de la notion
de valeur d’une formule qu’on vient de définir.
T HÉORÈME 6.2.1
Soient F (p 1 , . . . , p n ),G(p 1 , . . . , p n ) deux formules dont les variables propositionnelles sont prises parmi
p 1 , . . . , p n et soit ε1 , . . . , εn une distribution de valeurs de vérités sur ces variables, la formule G prenant
alors la valeur ε. Alors la valeur prise par la formule F (G, p 2 , . . . , p n ) pour cette distribution de valeurs de
vérité est F (ε, ε2 , . . . , εn ).
40 CHAPITRE 6. CALCUL PROPOSITIONNEL ET ALGÈBRES DE BOOLE.
La démonstration se fait par induction sur la longueur de F . Le théorème est immédiat si cette lon-
gueur est 1 : F est alors une variable propositionnelle.
Si F = ¬F ′ , la valeur prise par F ′ (G, p 2 , . . . , p n ) est F ′ (ε, ε2 , . . . , εn ) (d’après l’hypothèse de récurrence,
puisque F ′ est plus courte que F ). La valeur prise par F (G, p 2 , . . . , p n ) est donc 0 si F ′ (ε, ε2 , . . . , εn ) = 1 et
1 si F ′ (ε, ε2 , . . . , εn ) = 0. C’est exactement F (ε, ε2 , . . . , εn ).
Si F = F ′ ∨F ′′ , on a F (G, p 2 , . . . , p n ) = F ′ (G, p 2 , . . . , p n )∨F ′′ (G, p 2 , . . . , p n ). La valeur prise par F ′ (G, p 2 , . . . , p n )
est F ′ (ε, ε2 , . . . , εn ), celle prise par F ′′ (G, p 2 , . . . , p n ) est F ′′ (ε, ε2 , . . . , εn ), puisque F ′ et F ′′ sont plus courtes
que F . La valeur prise par F (G, p 2 , . . . , p n ) est donc 0 si ces deux valeurs sont 0, et 1 si l’une d’elles est 1.
Même démonstration lorsque F est l’une des formes F ′ ∧ F ′′ , F ′ → F ′′ , F ′ ↔ F ′′ . C . Q . F. D.
C OROLLAIRE 6.2.2
Si G i (q 1 , . . . , q n ) (1 ≤ i ≤ m) sont des formules dont les variables propositionnelles sont prises parmi
q 1 , . . . , q n et si ε1 , . . . , εn est une distribution de valeur de vérité sur ces variables, pour toute formule
F (p 1 , . . . , p m ) la valeur de F (G 1 , . . . ,G m ) pour cette distribution de valeur de vérité est F (η 1 , . . . , η m ) où
η i = G i (ε1 , . . . , εn ).
p ∨ (q 1 ∧ · · · ∧ q n ) ≡ (p ∨ q 1 ) ∧ · · · ∧ (p ∨ q n )
p ∧ (q 1 ∨ · · · ∨ q n ) ≡ (p ∧ q 1 ) ∨ · · · ∨ (p ∧ q n )
(p ∨ s) ∧ (p ∨ t ) ∧ (q ∨ s) ∧ (q ∨ t ) ∧ (r ∨ s) ∧ (r ∨ t )
Chaque formule F (p 1 , . . . , p n ) définit une application de {0, 1}n dans {0, 1} : celle qui au n-uplet
(ε1 , . . . , εn ) (εi = 0 ou 1) associe la valeur F (ε1 , . . . , εn ). Réciproquement, on a :
6.3. FORMES NORMALES. 41
T HÉORÈME 6.2.3
Toute fonction à variables et valeurs dans {0, 1} est représentée par une formule.
Soit Φ(p 1 , . . . , p n ) une application de {0, 1}n dans {0, 1}. On montre le théorème par récurrence sur n.
Si n = 1, il y a quatre applications de {0, 1} dans {0, 1} et elles sont représentées par les formules
p, ¬p, p ∧ ¬p, p ∨ ¬p.
On suppose le théorème vrai pour n − 1.
Alors les fonctions Φ(p 1 , . . . , p n−1 , 0) et Φ(p 1 , . . . , p n−1 , 1) sont représentées respectivement par les
formules F (p 1 , . . . , p n−1 ) et G(p 1 , . . . , p n−1 ). On voit immédiatement que Φ(p 1 , . . . , p n ) est alors repré-
senté par la formule
¡ ¢ ¡ ¢
¬p n ∧ F (p 1 , . . . , p n−1 ) ∧ p n ∧G(p 1 , . . . , p n−1 )
C . Q . F. D.
′
Deux formules F (p 1 , . . . , p n ), F (p 1 , . . . , p n ) sont tautologiquement équivalentes, si et seulement si
n
elles définissent la même fonction, à variable et à valeur dans {0, 1}. Or il y a 22 applications de {0, 1}n
dans {0, 1}. Il en résulte :
C OROLLAIRE 6.2.4
n
Avec n variables propositionnelles on peut écrire 22 formules deux à deux non équivalentes.
T HÉORÈME 6.2.5
Toute formule est tautologiquement équivalente à une formule qui ne contient que les connecteurs ¬ et
∨.
Les connecteurs ¬, ∨ qui permettent d’écrire toutes les formules (à une équivalence près) forment
ce qu’on appelle un système complet de connecteurs. On voit de la même façon que {¬, ∧} est aussi un
système complet de connecteurs ; voir d’autres exemples en exercice.
T HÉORÈME 6.3.1
Toute formule F (p 1 , . . . , p n ) équivaut à une formule sous forme normale disjonctive.
On le montre par récurrence sur le nombre de variables propositionnelles qui apparaissent dans la
formule. S’il n’y en a qu’une, la formule équivaut à l’une des formules p, ¬p, p ∧ ¬p, p ∨ ¬p, qui sont
sous forme normale disjonctive.
42 CHAPITRE 6. CALCUL PROPOSITIONNEL ET ALGÈBRES DE BOOLE.
Supposons le théorème démontré pour les formules qui ont au plus n − 1 variables. La formule
donnée F (p 1 , . . . , p n ) équivaut, comme on le voit immédiatement à
© ª © ª
p n ∧ F (p 1 , . . . , p n−1 , 1)) ∨ ¬p n ∧ F (p 1 , . . . , p n−1 , 0))
(N.B. l’écriture F (p 1 , . . . , p n−1 , 1) désigne n’importe laquelle des formules obtenues en remplaçant p n
par une tautologie dans F (p 1 , . . . , p n−1 , p n ). Par exemple F (p 1 , . . . , p n−1 , p 1 ∨ ¬p 1 ) ; toutes ces formules
sont équivalentes.
De même F (p 1 , . . . , p n−1 , 0) désigne par exemple la formule F (p 1 , . . . , p n−1 , p 1 ∧ ¬p 1 ).)
D’après l’hypothèse de récurrence, la formule F (p 1 , . . . , p n−1 , 1) équivaut à une formule H1 ∨· · ·∨ Hk
sous forme disjonctive ; la formule F (p 1 , . . . , p n−1 , 0) équivaut à H1′ ∨ · · · ∨ Hk′ sous forme disjonctive.
Donc F (p 1 , . . . , p n ) équivaut à
© ª © ª
p n ∧ (H1 ∨ · · · ∨ Hk ) ∨ ¬p n ∧ (H1′ ∨ · · · ∨ Hk′ )
Noter qu’il n’y a pas unicité pour cette forme normale disjonctive. Par exemple p ∨ q et (p ∧ ¬q) ∨ q
sont équivalentes et toutes deux sous forme normale disjonctive.
On montre de la même façon que
T HÉORÈME 6.3.2
Toute formule équivaut à une formule sous forme normale conjonctive.
On peut d’ailleurs le déduire du théorème précédent : étant donné une formule F , la formule ¬F se
met sous forme disjonctive G 1 ∨ · · · ∨G k ; alors F équivaut à ¬G 1 ∧ · · · ∧ ¬G k , qui est mise aisément sous
forme conjonctive : comme G i est de la forme p 1 ∧ · · · ∧ p l ∧ ¬q 1 ∧ · · · ∧ ¬q m , ¬G i équivaut à ¬p 1 ∨ · · · ∨
¬p l ∨ q 1 ∨ . . . q m .
Notons que la donnée de la table de vérité d’une formule permet de la mettre immédiatement sous
forme normale disjonctive. Par exemple la formule F (p, q, r ) qui a la table de vérité suivante :
p q r F (p, q, r )
0 0 0 0
0 0 1 1
0 1 0 0
0 1 1 1
1 0 0 0
1 0 1 1
1 1 0 0
1 1 1 0
T HÉORÈME 6.4.1
Si A est une algèbre de Boole, A est un anneau commutatif et x + x = 0 pour tout x ∈ A.
Sur une algèbre de Boole A, on définit une relation d’ordre en posant x ≤ y si et seulement si x y = x.
On vérifie les propriétés de définition d’une relation d’ordre :
– On a x ≤ x puisque x 2 = x.
– Si x ≤ y et y ≤ x alors x y = x = y donc x = y.
– Si x ≤ y et y ≤ z alors x y = x donc x y z = xz or x(y z) = x y = x donc x = xz et x ≤ z.
Il est clair que pour cet ordre 0 est le plus petit élément et 1 le plus grand.
Deux éléments quelconques x, y de A ont une borne inférieure qui est x y. En effet x y ≤ x (car x y x =
x 2 y = x y) et x y ≤ y si z ≤ x et z ≤ y on a zx = z donc zx y = z y = z et z ≤ x y.
L’application ϕ : A → A définie par ϕ(x) = 1 + x est une bijection de A sur lui-même, qui renverse
l’ordre x ≤ y ⇔ ϕ(x) ≥ ϕ(y) comme on le vérifie immédiatement.
Il en résulte que deux élément quelconque x, y de A ont une borne supérieure qui est 1 + (1 + x) +
(1 + y) c’est à dire x + y + x y.
Pour x, y ∈ A, on note respectivement x ∩ y et x ∪ y les bornes inférieures et supérieure de {x, y}.
Donc x ∩ y = x y, x ∪ y = x + y + x y.
On a les propriétés de distributivité :
x ∪ (y ∩ z) = (x ∪ y) ∩ (x ∪ z)
x ∩ (y ∪ z) = (x ∩ y) ∪ (x ∩ z)
L EMME 6.4.2
Si x 1′ est tel que x ∩ x 1′ = 0 et x ∪ x 1′ = 1 alors x 1′ = x ′ .
On a x +y = (x ∪y)∩(x ′ ∪y ′ ) en effet (x ∩y ′ )∪(x ′ ∩y) = (x ∪x ′ )∩(x ∪y)∩(x ′ ∪y ′ )∩(y ′ ∪y) par distributivité.
On vérifie immédiatement les propriétés suivantes :
Pour montrer que A muni de ces deux opérations est un anneau de Boole, il reste donc à vérifier l’asso-
ciativité de l’addition et la distributivité de la multiplication par rapport à l’addition.
Cela montre que (x + y) + z ne change pas quand on permute x, y, z de façon quelconque. Donc
(x + y) + z = (y + z) + x
On a donc bien défini sur A une structure d’anneau de Boole. L’ordre donné sur A est bien l’ordre donné
sur A est bien l’ordre associé à cette structure d’anneau de Boole, puisque x ≤ y ⇔ x ∩ y = x ⇔ x y = x.
Exemple. On prend A = P (E ) (ensemble des parties d’un ensemble E ). C’est un ensemble ordonné
par la relation d’inclusion (X ≤ Y ⇔ X ⊂ Y ) et cet ensemble ordonné satisfait les conditions 6.4 ci-
dessus.
C’est donc un anneau de Boole dans lequel l’addition et la multiplication sont :
X + Y = (X ∩ ∁Y ) ∪ (Y ∩ ∁X ) différence symétrique de X et Y
XY = X ∩Y .
X ∈A ⇒ ∁X ∈ A
X ,Y ∈ A ⇒ X ∪Y ∈ A
; ∈ A.
Il en résulte que A, ordonné par la relation d’inclusion, satisfait les conditions 6.4 ci-dessus et donc
est un anneau de Boole. Un anneau des parties de E est donc un sous-anneau de Boole de l’anneau
P (E ).
Le théorème suivant (qui sera démontré dans le cours de théorie des ensembles) montre que cet
exemple est le plus général possible :
T HÉORÈME 6.6.1
Soit E un ensemble de formule tel que tout sous-ensemble fini de E soit satisfaisable. Alors E est satisfai-
sable.
46 CHAPITRE 6. CALCUL PROPOSITIONNEL ET ALGÈBRES DE BOOLE.
On ne peut avoir à la fois F ∈ E et ¬F ∈ E car alors {F, ¬F } serait un sous-ensemble fini de E non satis-
faisable.
On définit alors la distribution δ en posant δp = 1 si p ∈ E , δp = 0 si p 6∈ E (p étant une variable
propositionnelle).
On montre, par induction sur la longueur de F que δF = 1 si et seulement si F ∈ E . C’est évident si
F est de longueur 1 (F est une variable propositionnelle).
– Si F = G ∨ H : supposons δF = 1, on a alors, par exemple, δG = 1, donc (hypothèse d’induction)
G ∈ E . Comme {¬F,G} n’est pas satisfaisable, on ne peut avoir ¬F ∈ E donc F ∈ E .
Inversement supposons F ∈ E comme {F, ¬G, ¬H } n’est pas satisfaisable, on ne peut avoir ¬G ∈
E , ¬H ∈ E . Donc, par exemple, G ∈ E . Par suite (hypothèse d’induction)à δG = 1, donc δF = 1.
– Si F = ¬G, supposons δF = 1 donc δG = 0 et par suite (hypothèse d’induction) G 6∈ E . Donc ¬G ∈
E , soit F ∈ E .
Inversement, si F ∈ E on ne peut avoir G ∈ E (car {F,G} n’est pas satisfaisable). Donc δG = 0 (hy-
pothèse d’induction) et par suite δF = 1.
On a donc bien trouvé une distribution δ qui satisfait toutes les formules de E (et celles-là seulement).
Revenons maintenant au cas général, où on ne suppose plus que E a la propriété 1, le problème
serait résolu si on trouve un ensemble E ′ de formules, E ′ ⊃ E ayant la propriété 1, tel que tout sous-
ensemble fini de E ′ soit satisfaisable.
Nous supposerons maintenant que l’ensemble P des variables propositionnelles est dénombrable.
Dans le cas général on utiliserait le théorème de Zorn (voir le cours de théorie des ensembles).
L’ensemble F de toutes les formules qu’on peut écrire avec les variables propositionnelles de P est
alors dénombrable. On a donc F = {F 1 , F 2 , . . . , F n , . . .}. On définit une suite E = E 1 ⊂ E 2 ⊂ · · · ⊂ E n ⊂ . . . de
sous-ensemble de F de façon que tout sous ensemble fini de E n soit satisfaisable.
Par hypothèse, c’est le cas pour E 1 . On procède par induction sur n : ayant défini E n , on considère
l’ensemble E n ∪ {F n }.
– Si tous les sous-ensembles finis de E n ∪ {F n } sont satisfaisables, on pose E n+1 = E n ∪ {F n }.
– Sinon, il existe un sous-ensemble fini de E n ∪ {F n } qui n’est pas satisfaisable, notons le X ∪ {F n }
(X est un sous-ensemble fini de E n ).
On pose alors E n+1 = E n ∪ {¬F n } et tous ses sous-ensembles finis sont satisfaisables : car s’il existe
un sous-ensemble fini Y ∪ {¬F n } qui ne l’est pas (Y étant un sous-ensemble fini de E n ), alors
X ∪Y est un sous-ensemble fini de E n qui n’est pas satisfaisable ; cela contredit l’hypothèse d’in-
duction sur E n .
S
On pose alors E ′ = n∈N E n . Alors tous sous-ensemble fini de E ′ est satisfaisable (car il est inclus
dans un E n ). De plus, pour toute formule F , on a F ∈ E ′ ou ¬F ∈ E ′ (car F = F n pour un certain entier n
et par construction de E n+1 on a F ∈ E n+1 ou bien ¬F ∈ E n+1 . C . Q . F. D.
Exemple d’application. Soit S une relation binaire sur un ensemble E (c’est-à-dire S ⊂ E × E ). On dira
que S est ordonnable s’il existe une relation d’ordre R sur E telle que S ⊂ R. On a alors :
C OROLLAIRE 6.6.2
Pour que S soit ordonnable, il faut et il suffit que, pour chaque sous-ensemble fini F de E , la restriction de
S à F le soit.
La condition est évidemment nécessaire. Pour montrer qu’elle est suffisante, à chaque couple (a, b) ∈
E × E associons une variable propositionnelle p (a,b) . Considérons l’ensemble de formules E suivant :
p (a,a) a décrivant E
¬[p (a,b) ∧ p (b,a) ] a, b décrivant E , a 6= b
p (a,b) ∧ p (b,c) → p (a,c) a, b, c décrivant E
p (a,b) le couple (a, b) décrivant S
6.7. RÈGLES DE DÉDUCTION POUR LE CALCUL PROPOSITIONNEL. 47
Soit δ une distribution de valeur de vérité satisfaisant cet ensemble E de formules. Si on définit la rela-
tion binaire R sur E en posant (a, b) ∈ R ⇔ δp (a,b) = 1 on voit aisément que R est une relation d’ordre
sur E et que S ⊂ R. Le problème est donc ramené à montrer qu’il existe une telle distribution δ.
D’après le théorème de compacité, il suffit de montrer que tout sous-ensemble fini de E est satisfai-
sable.
Soient U un sous-ensemble fini de E et a 1 , . . . , a n les éléments qui apparaissent en indice dans les
variables propositionnelles des formules de U . On pose F = {a 1 , . . . , a n }. C’est un sous-ensemble fini de
E , donc, par hypothèse il existe une relation d’ordre T sur F telle que T ⊃ S ∩ (F × F ) (où S ∩ (F × F ) est
la restriction de S à F ).
Les variables propositionnelles qui apparaissent dans les formules de U sont les p (ai ,a j ) (1 ≤ i , j ≤
n). On définit une distribution γ de valeurs de vérité sur ces variables en posant :
γp (ai ,a j ) = 1 si (a i , a j ) ∈ T
γp (ai ,a j ) = 0 si (a i , a j ) 6∈ T
Comme T est une relation d’ordre qui prolonge S ∩ (F × F ), on voit que γ satisfait U . C . Q . F. D.
Les conditions sont suffisantes : il est clair que la règle (1) ne fournit que des tautologies et que les
règles (2), (3) et (4) appliquées à partir des formules qui sont des tautologies, ne fournissent également
que des tautologies. Il en résulte que si une formule F est obtenue à l’aide des règles (1), (2), (3) et (4)
alors F est nécessairement une tautologie.
La condition est nécessaire : soit F une formule qui n’est pas déduite au moyen des règles (1), (2),
(3) ou (4). On a à montrer que F n’est pas une tautologie, donc à trouver une distribution de valeurs de
vérité qui satisfait ¬F .
Soient p 1 , . . . , p k les variables propositionnelles de F . Dans la suite, on ne considère plus que les
formules qu’on peut écrire avec ces variables propositionnelles, qui forment un ensemble dénombrable
48 CHAPITRE 6. CALCUL PROPOSITIONNEL ET ALGÈBRES DE BOOLE.
L EMME 6.7.2
Pour tout entier n, la formule F n n’est pas déduite.
L EMME 6.7.3
Pour toute formule G, il existe un entier m tel que F m ∨G ou bien F m ∨ ¬G soit déduite.
En effet on a G = G n pour un certain entier n. Alors F n+1 est soit F n ∨G soit F n ∨¬G. Dans le premier
cas F n+1 ∨ ¬G (soit (F n ∨ G) ∨ ¬G) est déduite, dans le second cas c’est F n+1 ∨ G (soit (F n ∨ ¬G) ∨ G) est
déduite (règle 1). C . Q . F. D.
On définit une distribution de valeurs de vérité sur les variables propositionnelles p 1 , . . . , p k en po-
sant :
δp i = 1 si et seulement s’il existe m tel que F m ∨ p i soit déduite
L EMME 6.7.4
Pour toute formule G, on a δG = 1 si et seulement s’il existe m tel que F m ∨G soit déduite.
Il est alors immédiat de montrer que la distribution δ satisfait ¬F : en effet, il existe bien un entier
m, à savoir m = 1 tel que F m ∨ ¬F soit déduite (règle 1). C . Q . F. D.
Chapitre 7
Dans ce chapitre, on revient à l’étude directe du langage mathématique, il n’y aura donc pas de dé-
monstrations, mais des « constatations expérimentales. » À partir de ces constatations, on pourra définir
une nouvelle structure mathématique, plus compliquée que le calcul propositionnel, mais qui donne
une meilleure approximation de la réalité constituée par le langage mathématique : c’est le « calcul des
prédicats », dont nous parlerons dans le chapitre suivant.
Par exemple :
[(x 1 , . . . , x n ) ∈ P 1 et (x 1 , . . . , x n ) 6∈ P 2 ] ⇔ (x 1 , . . . , x n ) 6∈ P 3
Un tel énoncé est noté E (x 1 , . . . , x n ) ; il exprime une propriété que peut avoir (ou ne pas avoir) un n-uplet
(a 1 , . . . , a n ) ∈ E 1 × · · · × E n . Il définit donc une partie de E 1 × · · · × E n qui ont cette propriété (autrement
dit l’ensemble {(a 1 , . . . , a n ) ∈ E 1 × · · · × E n ; E (a 1 , . . . , a n )}.
Étant donné un n-uplet (a 1 , . . . , a n ) ∈ E 1 ×· · ·×E n , comment vérifie-t-on qu’il a la propriété E (x 1 , . . . , x n ) ?
Autrement dit, que l’on a E (a 1 , . . . , a n ) ?
Pour ce faire, on examine tout d’abord les valeurs de vérité des énoncés élémentaires (a 1 , . . . , a n ) ∈ P i
(i = 1, 2, 3 dans le cas particulier ci dessus). Si par exemple, on a (a 1 , . . . , a n ) ∈ P 1 , (a 1 , . . . , a n ) ∈ P 2 et
(a 1 , . . . , a n ) 6∈ P 3 , ces valeurs de vérité sont 1, 1, 0.
On calcule alors les valeurs de vérité prise par la formule (p 1 ∧ ¬p 2 ) ↔ ¬p 3 , lorsque p 1 , p 2 , p 3 ont
respectivement les valeurs 1, 1, 0. On trouve 0, ce qui veut dire que dans ce cas, l’énoncé E (a 1 , . . . , a n ) est
faux.
Bien entendu, dans ce calcul, on peut remplacer la formule (p 1 ∧¬p 2 ) ↔ ¬p 3 par une formule équi-
valente. On la prend en général sous la forme normale disjonctive, ce qui donne (p 1 ∧ ¬p 2 ∧ ¬p 3 ) ∨
(¬p 1 ∧ p 3 ) ∨ (p 2 ∧ p 3 ). Cela revient à remplacer l’énoncé considéré par le suivant :
[(x 1 , . . . , x n ) ∈ P 1 et (x 1 , . . . , x n ) ∈ P 2 et (x 1 , . . . , x n ) 6∈ P 3 ]
ou [(x 1 , . . . , x n ) 6∈ P 1 et (x 1 , . . . , x n ) ∈ P 3 ]
ou [(x 1 , . . . , x n ) ∈ P 2 et (x 1 , . . . , x n ) ∈ P 3 ]
49
50 CHAPITRE 7. USAGE DES CONNECTEURS PROPOSITIONNELS ET DES QUANTIFICATEURS.
Exemple. Les variables x, y décrivent R. Les énoncés élémentaires considérés sont écrits : |x − y| ≤ 1 ;
|x + y| ≥ 1 ; x = 1 au lieu que (x, y) ∈ P 1 , (x, y) ∈ P 2 , (x, y) ∈ P 3 avec P 1 = {(x, y) ∈ R2 ; |x − y| ≤ 1}, P 2 =
{(x, y) ∈ R2 ; |x + y| ≥ 1} et P 3 = {(x, y) ∈ R2 ; x = 1}.
L’énoncé (|x − y| ≤ 1 ⇔ |x + y| ≥ 1) ⇒ x = 1 définit donc un sous-ensemble de R2 qui sera plus faci-
lement mis en évidence si on met l’énoncé sous forme disjonctive. La formule du calcul propositionnel
correspondant ) cet énoncé est (p 1 ↔ p 2 ) → p 3 ; sous forme disjonctive : (p 1 ∧ ¬p 2 ) ∨ (¬p 1 ∧ p 2 ) ∨ p 3 .
L’énoncé sous forme disjonctive est donc :
Remarque. Les « discussions » de systèmes d’équations ou d’inéquations que l’on fait dans les classes
secondaires, reviennent aussi, la plupart du temps, à écrire un énoncé sous forme disjonctive.
Considérons, par exemple, le système d’inéquation :
(
x−m
1+mx < 0
1−mx 2 x
x+m 2
> 0
1 1
(m = 0 et x < 0) ou (m > 0 et − < x < m) ou (m > 0 et m < x < − )
m m
1
(m = 0 et x > 0) ou (m 6= 0 et −m 2 < x <
m2
Pour chaque valeur du paramètre m, les solutions du système forment donc un intervalle ouvert (éven-
tuellement vide). Pour préciser les bornes de cet intervalle, on remplace dans l’énoncé ci dessus « m =
0 » par « 0 < m < 1 ou m ≥ 1 » et « m < 0 par −1 < m < 0 ou m ≤ −1 ». L’énoncé obtenu étant remis sous
1
forme disjonctive, on obtient la disjonction de 4 énoncés, dont le premier est : « m ≥ 1 et − m < x < m et
2 1
−m < x < m 2 . » Autrement dit :
1 1
m≥1 et −m <x< m2
non(E ), (E ) ou (F ), (E ) et (F ), (E ) ⇒ (F ), (E ) ⇔ (F )
2. Si E est un énoncé déjà construit, on construit les énoncés ∃x i (E ), ∀x i (E ) (où x i est l’une des
variables). Ces énoncés se lisent « il existe x i tel que E », « pour tout x i on a E » ; ∃ est appelé
quantificateur existentiel, ∀ quantificateur universel.
Ces deux derniers énoncés sont parfois écrit : ∃x i ∈ E i (E ), ∀x i ∈ E i (E ) lorsqu’on veut rappeler que le
domaine de variation de x i est l’ensemble E i .
Exemple. x, y ayant pour domaine de variation R, les énoncés élémentaires étant |x−y| ≤ 1 ; |x+y| ≥ 1,
on construit par exemple l’énoncé :
On appelle occurrence de la variable x dans l’énoncé E , chaque endroit où apparait cette variable
non précédé immédiatement d’un quantificateur (dans l’énoncé précédent, x a donc 3 occurrences).
On définit les occurrences libres d’une variable x dans l’énoncé E en suivant la construction de E à
partir des énoncés élémentaires :
– Toutes les occurrences de x dans un énoncé élémentaire sont libres.
– Les occurrences libres de x dans non E sont celles de x dans E .
– Les occurrences libres de x dans E et F , E ou F , E ⇒ F , E ⇔ F sont celles de x dans E et dans
F.
– Les occurrences libres de x dans ∃y E , ∀yE (y variable distincte de x) sont celles de x dans E .
– Aucune occurrence de x dans ∃x ∈ E , ∀x ∈ E n’est libre.
Les occurrences de x dans l’énoncé qui ne sont pas libres sont dites liées.
Une variable x est dite libre dans E si elle a une occurrence libre, elle est dite liée si toutes ses occur-
rences sont liées.
Par exemple dans l’énoncé 1, les trois occurrences de x sont liées, donc x est liée ; les deux premières
occurrences de y sont liées, la troisième est libre, donc y est libre.
Les énoncés considérés sont souvent écrit E (x 1 , . . . , x p ), en mettant en évidence les variables libres
x 1 , . . . , x p de E . Un tel énoncé exprime une propriété que peuvent avoir les p-uplets (a 1 , . . . , a p ) ∈ E 1 ×
· · · × E p . Il définit donc un sous)-ensemble de E 1 × · · · × E p : l’ensemble des p-uplets (a 1 , . . . , a p ) ∈ E 1 ×
· · · × E p qui ont cette propriété.
Par exemple, dans l’énoncé 1, il y a une seule variable libre. Il définit donc un sous ensemble de R.
On vérifie que c’est l’ensemble qui a pour seul élément 0.
Autre Exemple. La variable f a pour domaine de variation l’ensemble R[0,1] (ensemble des applica-
tions de [0, 1] dans R) ; x, y varient dans [0, 1], ε, η sont des variables qui décrivent l’ensemble des réels
> 0. L’énoncé :
∀ε∃η∀y [|x − y| ≤ η ⇒ | f (x) − f (y)| ≤ ε]
a pour seule variable libre f , x. Il définit donc un sous-ensemble de R[0,1] ×[0, 1] : l’ensemble des couples
( f , x) tel que f soit continue au point x.
52 CHAPITRE 7. USAGE DES CONNECTEURS PROPOSITIONNELS ET DES QUANTIFICATEURS.
L’énoncé ∀x∀ε∃η∀y [|x − y| ≤ η ⇒ | f (x) − f (y)| ≤ ε] a pour seule variable libre f . Il définit un sous-
ensemble de R[0,1] : c’est l’ensemble des fonctions continues.
Un énoncé E est dit clos s’il n’a aucune variable libre. Il est alors soit vrai, soit faux.
Par exemple l’énoncé ∀ f ∀x∀ε∃η∀y [|x − y| ≤ η ⇒ | f (x) − f (y)| ≤ ε] est clos. Il est faux.
Étant donné un énoncé E (x 1 , . . . , x p ) qui a x 1 , . . . , x p comme variables libres, l’énoncé clos ∀x 1 , . . . , x p E (x 1 , . . . , x p )
est appelé clôture de l’énoncé E .
Deux énoncés E (x 1 , . . . , x p ), E ′ (x 1 , . . . , x p ) sont dits équivalents s’ils définissent le même sous en-
semble de E 1 × · · · E p . Cela revient à dire que la clôture de l’énoncé E (x 1 , . . . , x p ) ⇔ E ′ (x 1 , . . . , x p ) est
vraie.
En particulier deux énoncés clos sont équivalents s’ils sont tous deux faux ou tous deux vrais.
Dans la suite, pour écrire que deux énoncés E , E ′ sont équivalents, on écrira souvent E ⇔ E ′ même
si E et E ′ ne sont pas clos (alors qu’on devrait écrire ∀x 1 , . . . , x p (E (x 1 , . . . , x p ) ⇔ E ′ (x 1 , . . . , x p ).
3. distributivité :
∃x [E (x, . . . ) ou E ′ (x, . . . )] ⇔ ∃x E (x, . . . ) ou ∃x E ′ (x, . . . )
∀x [E (x, . . . ) et E ′ (x, . . . )] ⇔ ∀x E (x, . . . ) et ∀x E ′ (x, . . . )
4. Les quatre énoncés ci-dessous (ou plutôt leur clôture) sont vrais, quelque soient les énoncés E , E ′
pourvu que la variable x ne soit pas libre dans E ′ :
∃x (E (x, . . . ) ou E ′ ) ⇔ ∃x E (x, . . . ) ou E ′
∃x (E (x, . . . ) et E ′ ) ⇔ ∃x E (x, . . . ) et E ′
∀x (E (x, . . . ) ou E ′ ) ⇔ ∀x E (x, . . . ) ou E ′
∀x (E (x, . . . ) et E ′ ) ⇔ ∀x E (x, . . . ) et E ′
Chaque quantificateur peut donc être défini à l’aide de l’autre et de la négation : ∀x peut être remplacé
par : non ∃x non. De même ∃x peut être remplacé par non ∀x non.
D’où la négation d’une chaîne de quantificateurs :
nonQ 1 x 1 . . .Q n x n E (x 1 , . . . , x n , . . . )
⇔
Q 1′ x 1 . . .Q n′ x n non E (x 1 , . . . , x n , . . . )
est vrai.
Cet énoncé équivaut à ∀x∃y∀z [non E (x, z) ou E (x, y)].
Comme z n’est pas libre dans dans E (x, y), ∀z [non E (x, z) ou E (x, y)] équivaut à ∀z non E (x, z) ou
E (x, y).
Donc ∃y [(∀z non E (x, z)) ou E (x, z)] équivaut à
L’énoncé 2 qui est vrai quel que doit le domaine de variation x, y, z et quelque soit l’énoncé E est dit
« universellement valide. »
Les règles 1, 2, 3, 4 et 5 donnent des exemples d’énoncés universellement valides. Voici d’autres
exemples d’énoncés universellement valide :
Autre exemple. Les variables x, y décrivent R ; ε, η décrivent des réels strictement positifs ; f décrit
l’ensemble RR des applications de R dans lui-même.
L’énoncé C ( f ) : ∀ε∀x∃η∀y [|x − y| ≤ η ⇒ | f (x) − f (y)| ≤ ε] définit un sous ensemble de RR : l’en-
semble des fonctions continues.
L’énoncé U ( f ) : ∀ε∃η∀x∀y [|x − y| ≤ η ⇒ | f (x) − f (y) ≤ ε] définit l’ensemble des fonctions unifor-
mément continues.
L’énoncé ∀ f (U ( f ) ⇒ C ( f )) est universellement valide. Par contre l’énoncé ∀ f (C ( f ) ⇒ U ( f )) est
faux ; il serait vrai si on avait pris [0, 1] pour domaine de variation de x, y et R[0,1] (ensemble des appli-
cations de [0, 1] dans R) pour domaine de variation de f .
Notation. On utilise parfois, à titre d’abréviation ∃!x qui se lit « il existe un x et un seul ». Donc l’expres-
sion ∃!xE (x, x 1 , . . . , x n ) est une abréviation pour l’énoncé ∃x E (x, x 1 , . . . , x n ) et ∀x∀x ′ [E (x, x 1 , . . . , x n ) et
E (x ′ , x 1 , . . . , x n ) ⇒ x = x ′ ].
54 CHAPITRE 7. USAGE DES CONNECTEURS PROPOSITIONNELS ET DES QUANTIFICATEURS.
Q 1 x 1 , . . .Q n x n E (x 1 , . . . , x n , y 1 , . . . y p )
L EMME 7.4.1
Tout énoncé équivaut à un énoncé sous forme prénexe.
Q 1′ y 1 [G ou Q 2′ y 2 . . .Q p′ y p H ]
Q 1 x 1 . . .Q n x n Q 1′ y 1 . . .Q p′ y p [G ou H ]
Exemple. f est une variable qui décrit R[0,1] . L’énoncé « f a une limite quand x → 0 et quand x → 1 »
s’écrit
∃l ∀ε∃η∀x [|x| ≤ η ⇒ | f (x) − l | ≤ ε] et ∃l ∀ε∃η∀x [|x − 1| ≤ η ⇒ | f (x) − l | ≤ ε]
(x décrit [0, 1] ; l décrit R ; ε, η décrivent l’ensemble des réels > 0). Sous forme prénexe, on trouve :
L EMME 7.5.1
Considérons un énoncé A(x 1 , . . . , x k , y, z 1 , . . . , z l ), x 1 , . . . , x n variant respectivement dans E 1 , . . . , E k , y va-
riant dans F , z 1 , . . . , z l variant respectivement dans des ensembles G 1 , . . . ,G l . Alors les énoncés suivants
sont équivalents :
∀x 1 , . . . , ∀x k ∃y A(x 1 , . . . , x k , y, z 1 , . . . , z l ) (3)
∃ f ∀x 1 , . . . , ∀x k A(x 1 , . . . , x k , f (x 1 , . . . , x k ), z 1 , . . . , z l ) (4)
où f est une variable qui décrit l’ensemble des applications de E 1 × · · · × E k dans F .
En effet, soient U1 ,U2 les deux sous-ensembles de G 1 ×· · ·×G l définies respectivement par (3) et (4).
Si (z 1 , . . . , z l ) ∈ U2 et si x 1 , . . . , x k appartiennent à E 1 , . . . , E k , alors il existe y ∈ F tel que A(x 1 , . . . , x k , y, z 1 , . . . , z l ) ;
donc U2 ⊂ U1 .
Inversement, si Si (z 1 , . . . , z l ) ∈ U1 , on définit f : E 1 ×· · ·×E k → F en choisissant pour chaque (x 1 , . . . , x k ) ∈
E 1 × · · · × E k un élément y de F tel que A(x 1 , . . . , x k , y, z 1 , . . . , z l ). Donc U1 ⊂ U2 . C . Q . F. D.
Si l’énoncé A est sans quantificateur (4) est donc une forme de Skolem de l’énoncé (3). En appli-
quant systématiquement cette transformation, on ramène chaque énoncé prénexe à une forme de Sko-
lem. Faisons-le sur un exemple :
∀x∀y∃z∀t ∃u A(x, y, z, t , u, v)
où A est un énoncé sans quantificateur ; x, y, z, t , u, v sont des variables qui décrivent respectivement
des ensembles X , Y , Z , T,U ,V .
Cet énoncé s’écrit ∀x∀y∃z B (x, y, z), il équivaut donc à
∃ f ∀x∀y B (x, y, f (x, y))
où f est une variable qui décrit l’ensemble des applications de X × Y dans Z .
L’énoncé ∀x∀y B (x, y, f (x, y)) est ∀x∀y∀t ∃u A(x, y, f (x, y), t , u, v), il équivaut donc à ∃g ∀x∀y∀t A(x, y, f (x, y), t , g (x, y, t
où g est une variable qui décrit l’ensemble des applications de X × Y × T dans U . Finalement l’énoncé
considéré équivaut à
∃ f ∃g ∀x∀y∀t A(x, y, f (x, y), t , g (x, y, t ), v)
qui est sous forme de Skolem.
Cette méthode est valable pour un énoncé prénexe quelconque
Q 1 x 1 . . .Q n x n A(x 1 , . . . , x n , y 1 , . . . , x p )
La règle générale pour mettre sous forme de Skolem est la suivante : on introduit pour chaque variable
x i quantifiée existentiellement une variable de fonction qui dépend des variables x j quantifiées uni-
versellement qui précèdent x i .
Par exemple pour l’énoncé ∃x∀y∃z∀t ∃u A(x, y, z, t , u, v) on obtient l’énoncé équivalent sous forme
de Skolem : ∃x∃ f ∃g ∀y∀t A[x, y, f (y), t , u, g (y, t )] ( f décrit l’ensemble des applications de Y dans Z , g
l’ensemble des applications de Y × T dans V ).
Noter que l’on ne touche pas aux quantificateurs existentiels qui se trouveraient en début d’énoncé.
Les fonctions f , g , . . . dont la forme de Skolem affirme l’existence s’appellent des fonctions de Sko-
lem pour l’énoncé considéré.
56 CHAPITRE 7. USAGE DES CONNECTEURS PROPOSITIONNELS ET DES QUANTIFICATEURS.
Exemple. n, N sont des variables d’entiers ; ε décrit l’ensemble P des réels > 0, u est une variable qui
décrit l’ensemble des applications de N dans R (ensemble des suites de réels, u(n), noté u n ) ; l décrit R.
L’énoncé
∃l ∀ε∃N ∀n (n ≥ N ⇒ |u n − l | ≤ ε) (5)
exprime que la suite u a une limite (c’est-à-dire définit l’ensemble des suites convergentes). Sous forme
de Skolem il s’écrit :
∃l ∃K ∀ε∀n (n ≥ K (ε) ⇒ |u n − l | ≤ ε)
où K décrit l’ensemble des applications de P dans N.
Si x décrit R, et f l’ensemble des applications de N × R dans R c’est à dire l’ensemble des suites de
fonctions à variable réelle ( f (n, x) est noté f n (x), l’énoncé
définit l’ensemble des suites de fonctions qui convergent en tout point de R. Sous forme de Skolem on
trouve l’énoncé
∃g ∃K ∀x∀ε∀n (n ≥ K (ε, x) ⇒ | f n (x) − g (x)| ≤ ε
où g décrit l’ensemble des applications de R dans R et K l’ensemble des applications de P × R dans N.
La fonction de Skolem g est donc la limite (simple) de la suite de fonction f .
∀x 1 . . . ∀x k ∃y 1 . . . ∃y l E (x 1 , . . . , x k , y 1 , . . . , y l , z 1 , . . . , z m )
Q 1 x 1 . . .Q n x n A(x 1 , . . . , x n , y 1 , . . . , y p )
sous forme de Herbrand est donc : on introduit pour chaque variablex i quantifié universellement une
variable de fonction qui dépend des variables x j quantifiées existentiellement qui précèdent x i . Par
exemple pour l’énoncé
∃x∀y∃z∀t ∃v A(x, y, z, t , u, v)
(où x, y, z, t , u, v varient respectivement dans X , Y , Z , T,U ,V )
On obtient l’énoncé équivalent sous forme de Herbrand :
∃l ∀ε∃N ∀n (n ≥ N ⇒ |u n − l | ≤ ε)
(qui exprime que la suite u de nombre réels à une limite) a pour forme de Herbrand :
∀ϕ∀K ∃l ∃N [K (N , l ) ≥ N ⇒ |u K (N ,l ) − l | ≤ ϕ(l )]
Avec le choix qu’on a fait pour E , P, S l’énoncé E est vrai : car il signifie que quels que soient les réels
x, y, x 6= y, il existe un réel z tel que x < z < y ou y < z < x et 2z = x + y.
Si par contre, on prend E = Z , P = {(x, y) ∈ Z 2 ; x < y}, S = {(x, y, z) ∈ Z 3 ; z = x + y}, le même énoncé
E est alors faux. Il serait vrai si on prenait E = Z , P = {(x, y) ∈ Z 2 ; x < y}, S = {(x, y, z) ∈ Z 3 ; z 6= x; z 6= y}.
On voit donc qu’un tel énoncé peut être interprété dans beaucoup de structures différentes ; dans
chacun de ces structures, il prend une valeur de vérité (1 ou 0, c’est à dire vrai ou faux).
Les énoncés de ce type seront appelées des « formules » et les structures dans lesquelles on peut les
interpréter des « modèles. »
Nous donnons maintenant de façon précise les définitions des formules et des modèles.
x=y
P i (x 1 , . . . , x n )
57
58 CHAPITRE 8. CALCUL DES PRÉDICATS.
1. Si A, B sont des formules déjà construites, alors non(A), (A) ou (B ), (A) et (B ), (A) ⇒ (B ), (A) ⇔ (B )
sont des formules.
2. Si A est une formule, alors ∀x (A), ∃x (A) sont des formules.
Nous avons déjà défini précédemment ce qu’on appelle les variables libres d’un énoncé. On sait donc
déjà ce que sont les variables libre d’une formule A. On écrit une formule sous la forme A(x 1 , . . . , x p )
pour mettre en évidence les variables libres de la formule. Une formule close est une formule sans va-
riable libre.
Définition. On appelle « modèle » la donnée d’un ensemble E 6= ; et pour chaque symbole de rela-
tion P i (à n i arguments) la donnée d’un sous-ensemble P i de E ni . E est appelé l’ensemble de base du
modèle.
Par exemple, si on a deux symboles de relation P, S à 2 et 3 arguments respectivement, un modèle et
un triplet M = {E , P , S} avec E 6= ;, P ⊂ E 2 , S ⊂ E 3 .
Plaçons-nous dans ce cas particulier, pour fixer les idées, et considérons une formule A(x 1 , . . . , x p )
(ayant x 1 , . . . , x p comme variables libres) et un p-uplet (a 1 , . . . , a p ) d’éléments de E .
On va définir ce que l’on entend par « le p-uplet (a 1 , . . . , a p ) satisfait la formule A(x 1 , . . . , x p ) dans le
modèle M » ou de façon synonyme « Le modèle M satisfait la formule A(a 1 , . . . , a n ) » ou encore « La
formule A(a 1 , . . . , a p ) est vraie dans le modèle M . »
Lorsque A(x 1 , . . . , x p ) est une formule élémentaire, la définition est immédiate :
– on dit que le couple (a 1 , a 2 ) satisfait la formule P (x 1 , x 2 ) dans le modèle M si et seulement si
a1 = a2
– on dit que le couple (a 1 , a 2 ) satisfait la formule P (x 1 , x 2 ) dans le modèle M si et seulement si
(a 1 , a 2 ) ∈ P . De même pour un triplet (a 1 , a 2 , a 3 ) et la formule S(x 1 , x 2 , x 3 ).
Pour une formule quelconque A(x 1 , . . . , x p ) on donne la définition en la supposant déjà connue pour
les formules (plus courte) qui ont servi à construire la formule A(x 1 , . . . , x p ). D’après la définition des
formules, la formule A(x 1 , . . . , x p ) à l’une des formes suivante :
– non B (x 1 , . . . , x p ) : alors par définition, A(x 1 , . . . , x p ) est vrai dans le modèle M si et seulement si
B (a 1 , . . . , a p ) ne l’est pas.
– B (x 1 , . . . , x p ) ou C (x 1 . . . , x p ) : alors par définition A(x 1 , . . . , x p ) est vraie dans M si et seulement si
au moins l’une des formules B (x 1 , . . . , x p ), C (x 1 , . . . , x p ) est vraie dans ce modèle.
– Dans les trois cas suivant :
B (x 1 , . . . , x p ) et C (x 1 . . . , x p )
B (x 1 , . . . , x p ) ⇒ C (x 1 . . . , x p )
B (x 1 , . . . , x p ) ⇔ C (x 1 . . . , x p )
la définition analogue au cas précédent (on applique la table de vérité des connecteurs et, ⇒, ⇔.
– ∃x B (x, x 1 , . . . , x p ) : par définition A(x 1 , . . . , x p ) est vraie dans le modèle M si et seulement s’il existe
a ∈ E tel que B (a, a 1 , . . . , a p ) soit vrai dans M .
– ∀x B (x, x 1 , . . . , x p ) : par définition A(x 1 , . . . , x p ) est vraie dans le modèle M si et seulement si pour
tout a ∈ E la formule B (a, a 1 , . . . , a p ) est vraie dans le modèle M .
La notation pour « le p-uplet (a 1 , . . . , a p ) satisfait la formule A(x 1 , . . . , x p ) dans le modèle M » est :
M |= A(a 1 , . . . , a p ) (lire « M satisfait A(a 1 , . . . , a p ) »).
Chaque formule close a donc une valeur de vérité dans chaque modèle. Une formule quelconque
A(x 1 , . . . , x p ) ayant p variables libre définit dans chaque modèle M d’ensemble de base E une partie
E p : l’ensemble des p-uplets qui la satisfont dans ce modèle.
Si le modèle M satisfait la formule close F (ou l’ensemble des formules closes C ) on dira que M
est un modèle de F (ou un modèle de C . Un ensemble de formules closes est aussi appelé un système
d’axiomes. On parlera donc de modèle de système d’axiomes.
∀x R(x, x)
∀x∀y [R(x, y) et R(y, x) ⇒ x = y]
∀x∀y∀z [R(x, y) et R(y, z) ⇒ R(x, z)
8.2. FORMULES UNIVERSELLEMENT VALIDES. 59
forment un système d’axiomes dont les modèles sont les ensembles munis d’une relation d’ordre. On
dit qu’on a écrit les axiomes des ensembles ordonnées. Si on ajoute la formule ∀x∀y [R(x, y) ou R(y, x)]
on obtient les axiomes d’ensembles totalement ordonné.
Exemple 2. Système d’axiomes pour la structure de groupe : Soit S un symbole de relation à 3 argu-
ments, on considère les formules suivantes :
1. ∀x∀y∃z S(x, y, z); ∀x∀y∀z∀z ′ [S(x, y, z) et S(x, y, z ′ ) ⇒ z = z ′ ]
2. ∀x∀y∀z∀u∀v∀t [S(x, y, u) et S(u, z, t ) et S(y, z, v) ⇒ S(x, v, t )]
3. ∃x∀y [S(x, y, y) et S(y, x, y)]
4. ∀x∃y∀z∀t [S(x, y, z) ⇒ S(t , z, t )]
Les modèles de (1) sont les ensembles munis d’une relation (à 3 arguments) qui est le graphe d’une
fonction (à 2 arguments) ; autrement dit les ensembles munis d’une loi de composition interne binaire ;
(2) exprime que cette loi de composition est associative ; (3) qu’elle possède un élément neutre à droite
et à gauche ; (4) que tout élément à un inverse à droite.
Il en résulte que les modèles de ce système d’axiomes sont exactement les groupes. Pour avoir les
groupes commutatifs, il suffit d’ajouter l’axiome
1. ∀x∀y∀z [S(x, y, z) ⇒ S(y, x, z)]
Définition. Deux formules F (x 1 , . . . , x n ), G(x 1 , . . . , x n ) sont dites équivalentes si, dans tous les modèles
elles définissent le même sous-ensemble de E n (E étant l’ensemble de base du modèle).
Cela revient à dire que la formule
∀x 1 . . . ∀x n [F (x 1 , . . . , x n ) ⇔ G(x 1 , . . . , x n )]
est vraie dans tous les modèles ; autrement dit que l’on a ⊢ F (x 1 , . . . , x n ) ⇔ G(x 1 , . . . , x n ). Beaucoup
d’exemples de formules équivalentes ont été donné au chapitre précédent.
Un système d’axiome C est dit « contradictoire » s’il n’a pas de modèle. Notons que si C est un
système d’axiomes contradictoire, alors C ⊢ F quelque soit la formule close F .
L’un des problèmes fondamentaux de la logique mathématique consiste à trouver une méthode qui,
étant donné une formule close F , permette de savoir si elle est universellement valide.
L’exemple suivant montre tout de suite pourquoi la solution de ce problème serait très intéressante
pour le mathématicien : considérons une formule close F , écrite à l’aide du symbole de relation S à 3
arguments ; le problème est de savoir si F est vraie dans tous les groupes se ramène à déterminer si la
60 CHAPITRE 8. CALCUL DES PRÉDICATS.
formule G ⇒ F est universellement valide (G étant la conjonctions des axiomes (1), (2), (3), (4) écrits
précédemment).
Herbrand a découvert une méthode pour déterminer si une formule close F est universellement
valide, on l’exposera sur deux exemples.
Exemple 1. On considère la formule ∀x∃y∀z [R(x, z) ⇒ R(x, y)] où R est un symbole de relation à
deux arguments. On veut montrer que cette formule est universellement valide. Si ce n’est pas le cas, sa
négation
∃x∀y∃z [R(x, z) et non R(x, y)]
est vraie dans un certain modèle (E , R) où E est un ensemble non vide et R une partie de E 2 . Donc la
forme de Skolem qui est :
∃x∃ f ∀y [R(x, f (y)) et non R(x, y)]
est vraie aussi ( f varie dans E E ; noter que la forme de Skolem n’est pas une formule). Il existe donc
a ∈ E et f : E → E tels que l’on ait :
On substitue à y les éléments de E obtenus à l’aide de f et de a, c’est-à-dire les éléments a, f (a), f 2 (a), . . . , f n (a), . . .
où f n (a) désigne f ( f (· · · ( f ( a)) · · · )). On obtient ainsi
| {z }
n fois
Et on a la contradiction cherchée dès le deuxième essai. Donc la formule considérée au départ est uni-
versellement valide.
est donc vraie dans un modèle (E , T ,U ), E étant un ensemble non vide et T ,U des parties de E .
La forme de Skolem de cette dernière formule, à savoir ;
On a ici une contradiction : la première ligne donne : non T ( f (a) ; la deuxième donne : nonU ( f 2 (a)) ou
T ( f (a)) ; et par suite on a nonU ( f 2 (a)) ; la troisième ligne donne : U ( f 2 (a)) ou T ( f 2 (a)), et par suite on a
8.3. INTRODUCTION DE SYMBOLES DE FONCTION. 61
T ( f 2 (a)) ; mais cela contredit la formule non T ( f 2 (a)) de la deuxième ligne. Donc la formule considérée
initialement est donc universellement valide.
On montre que cette méthode est toujours valable, tout au moins pour des formules ne compor-
tant pas le symbole =. Cela veut dire que si une formule close (ne comportant pas le symbole =) est
universellement valide, alors on s’en apercevra nécessairement à l’aide de cette méthode, au bout d’un
nombre fini d’essais.
Mais si la formule dont on part n’est pas universellement valide, la méthode ne permet pas de s’en
apercevoir et les calculs continuent indéfiniment.
∀x (x 2 = e ⇒ x = e)
∀x (x 3 = e ⇒ x = e)
..
.
∀x (x n = e ⇒ x = e)
..
.
Ce qui permet d’introduire deux symboles de fonction à deux arguments et d’écrire z = x + y pour
A(x, y, z) et z = x y pour P (x, y, z).
62 CHAPITRE 8. CALCUL DES PRÉDICATS.
(ii) ∀x∀y∀z [x + (y + z) = (x + y) + z]
∃!x∀y [x + y = y et y + x = x]
∀x∃y [x + y = 0]
∀x∀t [x + y = y + x]
∀x∀y∀z∀t ∀u∀v∀w
[A(y, z, t ) et P (t , x, u) et P (y, x, v) et P (z, x, w) ⇒ A(v, w, u)]
Axiome d’extensionnalité :
∀x∀y [∀z (z ∈ x ⇔ z ∈ y) ⇒ x = y] (1)
Si, par exemple M = N, E = {(m, n); m ≤ n} cet axiome est satisfait ; si E = {(m, n); m est un diviseur premier de n},
cet axiome n’est pas satisfait.
Axiome de la paire :
∀x∀y∃z∀t [t ∈ z ⇔ t = x ou t = y] (2)
Soit F 1 (x, y, z) la formule ∀t [t ∈ z ⇔ t = x ou t = y]. Dans tout modèle de (1), (2) on a ∀x∀y∃!zF 1 (x, y, z).
On introduit donc un symbole de fonction à deux arguments et F 1 (x, y, z) est noté z = {x, y} ; F 1 (x, x, z)
est noté z = {x}.
Axiome de la réunion :
∀x∃y∀z [z ∈ y ⇔ ∃t (t ∈ x et z ∈ t )] (3)
Soit F 2 (x, y) la formule ∀z [z ∈ y ⇔ ∃t (t ∈ x et z ∈ t )].
S
Dans tout modèle de (1), (3) on a ∀x∃!y F 2 (x, y). On écrit alors y = x (lire « y est la réunion des
S
éléments de x ») pour F 2 (x, y). On écrit z = x ∪ y pour z = {x, y}.
8.6. LE THÉORÈME DE LOWENHEIN-SKOLEM. 63
Axiome de compréhension. Pour écrire cet axiome, on considère qu’une propriété P (x) est décrite
par la formule F (x, a 1 , . . . , a k ) à une variable libre à paramètres dans le modèle ? On veut donc que le
modèle satisfasse toutes les formules : ∀y∃z∀x [x ∈ z ⇔ x ∈ y et F (x, a 1 , . . . , a k )] quelque soit la formule
F (x, a 1 , . . . , a k ) à paramètres dans le modèle. On écrit donc la suite infinie d’axiome suivante appelée le
schéma d’axiomes de compréhension :
où F (x, x 1 , . . . , x k ) est une formule quelconque (sans paramètre) ayant au moins x comme variable libre.
Dans tout modèle de (1), (5) on a ∃!z∀x (x 6∈ z) (utiliser (5) en prenant pour F la formule x 6= x). On
introduit le symbole de constante ; et on écrit z = ; pour ∀x (x 6∈ z).
Axiome de L’infini :
∃x [; ∈ x et ∀y (y ∈ x ⇒ y ∪ {y} ∈ x)] (6)
Cette écriture de l’axiome de l’infini comporte un certain nombre de symboles abréviateurs (sym-
boles de constantes et de fonctions) déjà introduit :;, ∪, { }. Il est facile de revenir à une formule qui
n’utiliserait pas ces symboles.
Axiome du choix. On peut énoncer l’axiome du choix sous la forme suivante : pour tout ensemble x
dont les éléments sont non vide et deux à deux disjoints, il existe un ensemble y dont l’intersection avec
chaque élément de x a un élément et un seul. Cela donne la formule suivante :
∀x [(∀u (u ∈ x ⇒ u 6= ;)
et ∀u∀v (u ∈ x et v ∈ x et u 6= v ⇒ u ∩ v = ;)) (7)
⇒ ∃y∀u (u ∈ x ⇒ ∃z (u ∩ y = {z}))]
Remarquons tout d’abord que l’ensemble des formules (écrites avec les symboles de relation P 1 , . . . , P k )
est dénombrable : car une formule est une suite finie formée de l’alphabet A suivant : P 1 , . . . , P k , =,
x 1 , . . . , x n , . . . (les variables), (, ), ∃, ∀, non, ou, et, ⇒, ⇔.
Cet alphabet étant dénombrable, l’ensemble de suites finies d’éléments de A l’est aussi ; donc aussi
l’ensemble des formules, comme partie d’un ensemble dénombrable.
Plus généralement, si A est un ensemble dénombrable, l’ensemble des formules à paramètres dans
A est aussi dénombrable : car une formule à paramètres dans A est une suite finie formée d’éléments
de A ∪ A, qui est encore un alphabet dénombrable.
Considérons alors un modèle M de C , d’ensemble de base M . On définit une suite croissante N1 ⊂
N2 ⊂ · · · ⊂ Nk ⊂ · · · de parties dénombrables ou finies de M , par induction sur k.
– Pour cela, on considère toutes les formules F (x) à une variable libre telle que M |= ∃x F (x). Pour
chacune de ces formules on choisit un élément a F de M tel que M |= F (a F ). Ces éléments a F
forment une partie dénombrable ou finie N1 de M (il n’y en a pas plus que de formules).
– Définissons maintenant Nk+1 , en supposant défini Nk , partie dénombrable ou finie de M : on
considère maintenant toutes les formules F (x) à une variable libre et à paramètres dans Nk (F (x)
s’écrit donc F (x, a 1 , . . . , a n ) avec a 1 , . . . , a n ∈ Nk telle que M |= ∃x F (x). Pour chacune de ces for-
mules, on choisit un élément a F de M tel que M |= F (a F ). Ces éléments forment une partie dé-
nombrable ou finie Nk′ de M (il n’y en a pas plus que de formules à paramètres dans Nk ). On pose
alors Nk+1 = Nk ∪ Nk′ . Donc Nk ⊂ Nk+1 ⊂ M et Nk+1 est dénombrable ou fini.
S
On pose alors N = k∈N Nk et on désigne par N le sous-modèle de M dont l’ensemble de base est
N . C’est un sous-modèle dénombrable ou fini de M .
On montre de N est un modèle de C et plus généralement on montre que
L EMME 8.6.2
Toute formule close F (a 1 , . . . , a k ) à paramètres dans N a la même valeur de vérité dans M et dans N
Cela donne bien le résultat cherché, puisque les formules de C sont des formules closes sans para-
mètres ; étant vraies dans M par hypothèse, elles le seront dans N . C . Q . F. D.
(Lemme 8.6.2) Si la formule F (a 1 , . . . , a k ) est atomique on a déjà vu qu’elle a la même valeur de vérité
dans M et dans N (par définition du sous-modèle). On peut alors faire la démonstration par induction
sur la longueur de la formule F (x 1 , . . . , x k ).
On suppose le résultat vrai pour toutes les formules plus courtes que F et on montre alors le résultat
pour la formule F . Il y a trois cas possible : F (x 1 , . . . , x k ) peut être soit de la forme nonG(x 1 , . . . , x k ) ; soit
de la forme G(x 1 , . . . , x k ) ou G ′ (x 1 , . . . , x k ) ; soit de la forme ∃x G(x, x 1 , . . . , x k )
– Premier cas : par hypothèse d’induction, G(a 1 , . . . , a k ) a la même valeur de vérité dans M et N . Il
en est donc de même pour nonG(a 1 , . . . , a k ), c’est-à-dire F (a 1 , . . . , a k ).
– Deuxième cas : Par hypothèse d’induction, G(a 1 , . . . , a k ) a la même valeur de vérité dans M et N ;
G ′ (a 1 , . . . , a k ) aussi. Il en est donc de même pour G(a 1 , . . . , a k ) ou G ′ (a 1 , . . . , a k ), c’est à dire pour
F (a 1 , . . . , a k ).
– Supposons F (a 1 , . . . , a k ) est vraie dans N .
Donc ∃x G(x, a 1 , . . . , a k ) est vraie dans N et il existe a ∈ N tel que la formule G(a, a 1 , . . . , a k )
soit vraie dans N . D’après l’hypothèse d’induction, cette formule est vraie dans M ; donc aussi
∃x G(x, a 1 , . . . , a k ), c’est-à-dire F (a 1 , . . . , a k ).
Supposons maintenant la formule F (a 1 , . . . , a k ) vraie dans M .
Donc ∃x G(x, a 1 , . . . , a k ) est vraie dans M . on montre qu’il existe a ∈ N tel que G(a, a 1 , . . . , a k )
8.7. THÉORÈMES DE COMPACITÉ DES PRÉDICATS. 65
S
soit vraie dans M : en effet, comme N = p∈N N p il existe un entier p tel que a 1 , . . . , a k ∈ N p . Par
définition de N p+1 il existe donc a ∈ N p+1 tel que la formule G(a, a 1 , . . . , a k ) soit vraie dans M .
D’après l’hypothèse d’induction G(a, a 1 , . . . , a k ) est vraie dans N , donc aussi ∃x G(x, a 1 , . . . , a k )
c’est-à-dire F (a 1 , . . . , a k ).
C . Q . F. D.
Exemple. Considérons le système d’axiome C écrit avec un symbole R de relation à deux variables :
∀x R(x, x)
∀x∀y [R(x, y) et R(y, x) ⇒ x = y]
∀x∀y∀z [R(x, x) et R(y, z) ⇒ R(x, z)]
∀x∀y [R(x, y) ou R(y, x)]
∀x∃y non R(x, y)
∀x∃y non R(y, x)
∀x∀y [non R(y, x) ⇒ ∃z (non R(z, x) et non R(y, z))]
Les modèles de C sont les ensembles M totalement ordonnés, qui n’ont ni plus petit élément ni plus
grand élément et qui sont denses (c’est à dire qu’entre deux élément distincts il en existe toujours un
troisième).
L’ensemble ordonné R est donc un modèle de ce système d’axiomes. Le théorème 8.6, de Lowenheim-
Skolem affirme l’existence d’un sous-modèle dénombrable de ce système d’axiomes ; ce que nous sa-
vions déjà puisque Q, par exemple est un tel sous-modèle.
C OROLLAIRE 8.7.2
Soient C un système d’axiomes et F une formule close qui est conséquence de C , alors F est conséquence
d’un sous-ensemble fini de C .
Exemple d’application. Nous avons écrit un système d’axiomes pour la structure d’anneau à l’aide de
deux symboles de relation A, P à trois arguments (en introduisant d’ailleurs successivement les sym-
boles de fonction 0, +, .). On ajoute les axiomes suivants :
On obtient les axiomes d’anneau commutatif avec unité. Comme dans un tel anneau l’élément unité
est unique, on introduit le symbole de constante 1, défini par la formule F (x) : ∀y (x.y = y). Si on ajoute
l’axiome
∀x [x 6= 0 ⇒ ∃y (x.y = 1)]
on obtient un système d’axiome K pour la structure de corps commutatif. Pour chaque nombre pre-
mier p, désignons par Fp la formule
{z· · · + x} = 0
∀x |x + x +
p fois
L EMME 8.7.3
Si le polynôme ϕ(x 1 , . . . , x n ) à coefficients dans Z a un zéro dans tout corps commutatif de caractéristique
0, il existe un entier p 0 tel qu’il ait un zéro dans tout corps commutatif de caractéristique p > p 0 .
∀x 1 . . . ∀x n ∀y 1 . . . ∀y n
[(x 1 = y 1 et . . . et x n = y n et P (x 1 , . . . , x n )) ⇒ P (y 1 , . . . , y n )]
On peut alors définir la notion de « démonstration à l’aide d’un système d’axiomes C . » C’est, par
définition, une suite de formule Φ, Φ1 , . . . , Φn ayant les propriétés suivantes : Φ1 est obtenu en appli-
quant l’une des règles 1, 2 ou 3 ; pour chaque i (1 ≤ i ≤ n), Phi i est obtenue à partir des formules
précédentes en appliquant l’une des règles 1, 2, ..., 8. Par définition, Φn est la formule démontré par
cette démonstration.
D’après le théorème de complétude, une formule Φ est conséquence de C si et seulement s’il existe
une démonstration de Φ à l’aide des axiomes de C .
On peut ainsi développer de façon complètement formelle la théorie des ensembles de Zermelo (et,
en fait, n’importe quelle théorie) : on écrit le système d’axiomes Z , comme on l’a fait précédemment, et
on définit comme ci-dessus la notion de démonstration à partir du système d’axiome Z . Les théorèmes
de théorie des ensembles sont alors les formules dont on peut trouver une démonstration.