Vous êtes sur la page 1sur 13

Cours n°3

LOGIQUE ET MATHEMATIQUE - 1

1- Des mathématiques à la logique


Gottlob Frege (1848 – 1925) le dit en ouverture de son livre « Les Fondements de
l’arithmétique » (Grundlagen der Arithmetik, 1884) :

« Après que la mathématique se fut pour un temps écartée de la rigueur euclidienne, elle
y revient, et non sans de vifs efforts pour la dépasser »

Qu’est-ce à dire ? Tout simplement que depuis longtemps, on a relâché l’exigence de rigueur
des Grecs et que cela a des conséquences fâcheuses pour une science qui se veut « exacte »
comme les mathématiques. Ainsi, pour les mathématiciens du XIXème siècle, ne parvient-on
pas facilement à faire la différence entre une fonction continue et une fonction dérivable. Les
paradoxes de Zénon demeurent inexpliqués et inexplicables. Comment expliquer qu’Achille
rattrape la Tortue puisqu’en effet, il faut procéder à l’effectuation d’une somme infinie de
termes pour en rendre compte ? Une somme d’une quantité infinie de nombres n’est-elle pas
elle-même par nature une quantité infinie ? Leibniz et Newton ont inventé à peu près en
même temps le calcul infinitésimal (calcul différentiel) : celui-ci s’est révélé d’une grande
fécondité dans l’explication des phénomènes physiques, en particulier pour parvenir à la
formulation de la loi de la gravitation universelle, mais il fait intervenir sans cesse des notions
souvent vagues et qui peuvent s’avérer contradictoires. Ainsi Newton considère une quantité
comme un flux, lequel a un volume qui varie en fonction du temps et du débit ou « taux
d’écoulement » (fluendi ratio). Ce taux, il l’appelle fluxion. Si une quantité s’écoule durant
une durée infime, considérée comme « particule atomique de temps », alors le volume de son
flux est proportionnel à sa fluxion. Newton note « o » une telle particule, c’est l’élément
fondamental de tout accroissement. Le volume du flux durant cet élément fondamental du
• •
temps est : x o où x est la fluxion. Ce volume correspond à la notion d’accroissement
infiniment petit de x. Notons que ce procédé est fécond. Grâce à lui, Newton peut calculer la
fluxion d’une quantité y dépendant de x si la relation est donnée par y = x3 par exemple. En
effet, connaissant sa célèbre formule du binôme, il écrit :
( x + o) 3 = x 3 + 3 x 2 o + 3 xo 2 + o 3 , d’où : ( x + o ) 3 − x 3 = 3 x 2 o + 3 xo 2 + o 3 , comme o2 et o3 sont
négligeables devant o, il les supprime et obtient que la fluxion de y est en ce cas 3x2. Ceci est
bel et bien, mais qu’est-ce que ce « o » ? Comment peut-on parler de « particule atomique du
temps » ? si o est un infiniment petit, comment en rendre compte ? Un infiniment petit, nous
dit-on, est, parmi les nombres positifs ou nuls, plus petit que n’importe quel nombre positif,
aussi petit soit-il. Mais nous ne connaissons qu’un seul candidat à cette place : c’est zéro ! or
il faut bien considérer que si nous remplaçons o par 0 dans le raisonnement précédent, plus
rien ne marche ! (x + 0)3 – x3 = 0 et il n’est plus question de fluxion ! La notion d’infiniment
petit est contradictoire en elle-même.
Les mathématiciens du XIXème siècle se heurtaient à d’autres questions du même genre :
comme nous l’avons déjà vu à propos des paradoxes de Zénon, ils rencontraient des séries
infinies. Parmi celles-ci on peut considérer la série de terme général (- 1)n, qui donne :
1 − 1 + 1 − 1 + 1 − 1 + 1 − 1... Bien sûr, si on regroupe les termes deux par deux, on obtient :
(1 − 1) + (1 − 1) + (1 − 1) + (1 − 1) + ... = 0 + 0 + 0 + .... et il n’y a aucune raison de ne pas accepter
qu’une somme infinie de « 0 » est égale à 0. Mais si on opère un autre regroupement :
1 − (1 + 1) − (1 + 1) − (1 + 1) − 1... on obtient : 1 − 2 − 2 − 2 − .... qui n’a plus aucune raison d’être
nulle, mais qui au contraire semble être un infini négatif. Changeons un peu l’ordre des
termes, et nous obtenons : − 1 + 1 − 1 + 1 − 1 + 1 − 1 + 1... = −1 + (1 − 1) + (1 − 1) + (1 − 1) + 1 , qui
cette fois semble vouloir donner -1 etc. C’est ce qui fait dire au mathématicien Abel, en 1879,
à propos des séries divergentes : « elles sont quelque chose de bien fatal et c’est une honte
qu’on ose y fonder aucune démonstration… Ce sont elles qui ont fait tant de malheurs et
causé tant de paradoxes ».
On ne peut sortir de ces difficultés qu’en donnant des définitions rigoureuses et en s’y tenant.
Ce sont les mathématiciens Cauchy et Weierstrass qui vont en particulier donner une solution
aux problèmes des séries. Tout repose sur la notion de limite. Etant donnée une série de terme
n
général un, on fera d’abord les sommes partielles : ∑u
i =1
i et on étudiera la convergence de la

suite formée par ces sommes partielles. La série sera dite de somme S si et seulement si la
n
suite de terme général ∑u
i =1
i tend vers la limite S. On notera alors que la suite précédente est

divergente puisque la suite formée par les sommes partielles est oscillante et n’a pas de limite.
Encore faut-il définir le concept de limite. Le tour de force ici sera d’éviter soigneusement
tout recours à la notion d’infini. On obtient alors la définition bien connue (de Weierstrass) :
→ l quand n tend vers ∞
un 
si et seulement si :
∀ε > 0 ∃N ∀n (n ≥ N ) ⇒ u n − l < ε
Mais encore faut-il avoir le langage pour formuler une telle définition !
Le premier objectif de la logique de la fin du XIXème siècle est donc de parvenir à un
système de notation qui permette d’exprimer en toute rigueur une définition comme celle de
la limite ou celle de la continuité d’une fonction à variable réelle. Insistons au passage sur le
fait qu’un tel langage doit pouvoir nous permettre d’exprimer des idées fondamentales à
propos de l’infini sans jamais recourir explicitement à la notion d’infini : on procède par
élimination de l’infini.

2- Frege et l’idéographie
Gottlob Frege s’attaque donc à ce problème. L’objectif est de fournir un « formulaire », un
système de notation dépourvu de toute ambiguïté, rendu nécessaire par l’exigence de rigueur
des mathématiques, une « langue parfaite » en quelque sorte, autre que la langue usuelle en ce
qu’elle dévoilerait les structures logiques fondamentales qui sont plus ou moins « masquées »
par elle. Ce système c’est la Begriffschrift (1879) ou, littéralement, « Ecriture des Concepts »,
qu’on a aussi parfois traduit comme « idéographie » (C. Imbert, 1969). Il doit permettre
d’écrire toutes les idées dont on a besoin en mathématiques. Il est à noter que le but de Frege
se distingue de celui d’autres logiciens qui l’ont précédé et en qui on a voulu voir aussi les
inventeurs d’une nouvelle logique : Boole, Schröder, De Morgan. Ces derniers ont vu tout le
parti qu’ils pouvaient tirer d’une application de l’algèbre à la logique, mais il s’agit
simplement d’une application, il ne s’agit pas d’une « re-création » comme c’est le cas chez
Frege.
Le sous-titre de la Begriffschrift est : « langue de la pensée pure conçue à l’image des
formules de l’arithmétique ». Dans une réponse à Schröder, Frege dira : « je n’ai pas voulu
faire un simple calculus ratiocinator, mais une lingua characteristica au sens de Leibniz ».
Nous reviendrons plus loin sur cette distinction, car elle s’avèrera féconde pour distinguer
plusieurs conceptions de la logique, en tout cas celle du XXème siècle. Tout en exposant les
principes de cette écriture, Frege accomplit quelques révolutions. Tout d’abord, il remplace
l’antique distinction « sujet – prédicat » par le couple « argument – fonction ».
« Une distinction entre sujet et prédicat n’apparaît pas dans ma façon de représenter un
jugement. De manière à justifier cela, je remarque que les contenus de deux jugements
peuvent différer de deux manières : ou bien les conséquences dérivables du premier,
quand il est combiné avec d’autres jugements, s’ensuivent toujours également du
deuxième, quand il est combiné avec les mêmes jugements (et réciproquement), ou bien
ce n’est pas le cas. Les deux propositions « Les Grecs défirent les Perses à Platée » et
« Les Perses furent défaits par les Grecs à Platée » diffèrent de la première manière.
Même si on peut détecter une légère différence dans la signification, l’accord entre les
deux la surpasse nettement. J’appelle donc cette partie du contenu qui est la même dans
les deux le contenu conceptuel. Puisque c’est la seule chose qui soit significative pour
notre idéographie, nous n’avons pas besoin d’introduire une distinction entre des
propositions qui ont le même contenu ».

Frege montre ainsi comment s’abstraire du langage ordinaire. Lorsqu’on considère une
expression algébrique telle que :
x2 – 4x
la lettre « x » marque une place vide qui peut être occupée par n’importe quel nombre. Selon
le nombre occupant cette place, l’expression algébrique aura une valeur différente : c’est
exactement le sens qu’il faut donner au mot « fonction » en mathématiques. Il s’agit, selon les
termes de Frege, d’une forme insaturée. Si nous prenons en compte des propositions
courantes, comme « César conquit la Gaule », nous voyons que « César » peut être remplacé
par d’autres noms (« Vercingétorix », « Napoléon », « Chirac »…) et chaque fois il en
résultera également une valeur différente de la proposition (elle sera vraie ou fausse). On peut
donc abstraire de cette proposition une forme : « _ conquit la Gaule » qui elle-même est une
forme insaturée, donc une fonction. Quant à « César » (ou « Vercingétorix », ou
« Napoléon », ou « Chirac »…), il ne contient aucune place vide en lui-même : c’est une
forme saturée, autrement dit un objet.

« On voit combien ce que l’on appelle concept en logique est étroitement lié à ce que
nous appelons fonction. On pourra même dire simplement : un concept est une fonction
dont la valeur est toujours une valeur de vérité » (Ecrits logiques et philosophiques, trad.
C. Imbert, p. 90)

et :

« un objet est tout ce qui n’est pas fonction, c’est ce dont l’expression ne comporte
aucune place vide » (ibid. p. 92)

On notera au passage que cela nécessite d’admettre que la proposition est susceptible de
prendre deux valeurs : le vrai et le faux. Si on compare avec les fonctions mathématiques
ordinaires, qui se caractérisent par un ensemble de valeurs possibles, les fonctions qui
a
b
a

a
c
b
c
a
b
c

a
c
b
c
a
b

Figure 1

interviennent en logique ont, elles aussi, un ensemble de valeurs possibles : {0, 1}. Les objets,
puisqu’ils sont définis comme expressions saturées sont des entités dans le langage. Ils
entretiennent donc une certaine relation avec un « objet du monde » : il s’agit de la relation de
dénotation. De même, une proposition est une entité saturée, donc un objet. Il s’agira donc de
dire quelle est la dénotation de ce genre d’objet. La réponse de Frege est : une valeur de vérité
(0 ou 1). Ainsi apparaît la théorie frégéenne selon laquelle les propositions ont pour
dénotation « le vrai » ou « le faux », de la même manière qu’un terme comme « César » a
pour dénotation un individu dans le monde qui est César.

3- La notion de système formel


3-1 Déductions formelles
L’autre grande innovation frégéenne est l’idée de système formel. Nous avons vu que la rigueur
euclidienne devait être retrouvée. Pour remplir cet objectif, il faudra donc procéder comme Euclide, au
moyen d’axiomes et de déductions à partir d’eux. Comme par ailleurs, le langage introduit par la
Begriffschrift est celui d’une « pensée pure », les déductions devront avoir lieu intégralement dans ce
langage, par le seul moyen des règles données « pour l’utilisation de nos signes », et donc sans aucun
recours à l’intuition. L’idée kantienne que les vérités de la logique sont « synthétiques » est battue en
brèche puisque loin d’être des évidences captées par l’intuition transcendantale, elles sont
démontrables au sein d’un système. Comme dans l’exposé euclidien, un petit nombre de « lois » est
posé comme point de départ. Dans le langage de l’idéographie, on les note selon la figure 1, où sont
représentés trois des axiomes, que, de nos jours, on représenterait par respectivement :
a ⇒ (b ⇒ a)
(c ⇒ (b ⇒ a )) ⇒ ((c ⇒ b) ⇒ (c ⇒ a))
et
(b ⇒ a) ⇒ ((c ⇒ b) ⇒ (c ⇒ a))
(ces trois axiomes ne contiennent que le symbole d’implication).
En ce qui concerne l’inférence, Frege se limite à un seul « mode » et il montre que les autres modes
(ceux qu’envisageait Aristote par exemple) peuvent s’y réduire. C’est là sans doute qu’il croit son
idéographie « commode ». La règle employée y est en effet authentiquement une règle de
« détachement ». Si X est le jugement : − − − Γ , alors de X et de :

A
Γ
On peut inférer :

La négation est notée au moyen d’une petite barre verticale :

Ce qui permet d’ajouter les trois nouveaux axiomes :

b
a
a
b
a
a

a
a
autrement dit :
(b ⇒ a ) ⇒ (¬a ⇒ ¬b)
¬¬a ⇒ a
et
a ⇒ ¬¬a

Dans l’idéographie, les déductions se font comme suit. Soit à déduire :


a
c
b
c
a
b
c
a
b

Dans le premier axiome a


b
a
On remplace a par
a
c
b
c
a
b
c

et b par
a
b

on obtient : a
c
b
c
a
b
c

a
b

a
c
b
c
a
b
c
Et comme on a :
a
c
b
c
a
b
c
On peut supprimer la dernière branche de manière à obtenir :

a a
c c
b b
c c
a a
b b
c c

a a
b b

a
c
b
c
a
b
c
3-2 Fonctions et champ
Lorsqu’il s’agit d’inclure des fonctions dans le calcul, Frege utilise la notation désormais classique
Φ(A) pour une fonction Φ appliquée à un argument A. De sorte que :

Φ(A)
peut se lire : « A a la propriété Φ ».
Maintenant, « si nous remplaçons l’argument par une lettre germanique et si dans la barre de contenu
nous introduisons une concavité avec cette lettre enfermée en elle, comme dans :

a Φ(a)
ceci représente le jugement que, quoique ce soit nous donnions comme argument, « la fonction est un
fait ». Désormais, le contenu : a Φ(a)
peut apparaître dans un jugement, par exemple dans :

a Φ(a)

ou dans :
A

a Φ(a)
mais attention, il n’est pas dit que nous puissions continuer à obtenir des jugements moins généraux en
substituant à a quelque chose de défini. En effet, le premier de ces deux schémas a pour signification
le fait de nier que quelque soit l’objet mis à la place de a, on ait toujours Φ(a), cela ne revient pas à
nier qu’on puisse spécifier un objet défini ∆ pour a tel que Φ(∆) soit le cas. De la même
manière, le deuxième schéma signifie que le cas où Φ(a) est affirmé de toute valeur de a et A
est nié n’apparaît jamais. Cela n’entraîne pas que le cas où Φ(∆) serait affirmé et A dénié ne
pourrait arriver. On voit ici apparaître le rôle de la petite concavité : celui de marquer le
champ (scope, Gebiet) couvert par la généralité indiquée par la lettre. En langage moderne,
ces deux schémas correspondent à, respectivement :
¬∀xΦ (x)
et
(∀xΦ ( x)) ⇒ A
Dans le premier cas, la négation n’est pas dans le champ du quantificateur : ce qui est nié c’est que Φ
soit vraie de tout x, ce n’est pas que Φ puisse être vraie d’un x particulier. Dans le second, la portée du
quantificateur est limitée à l’antécédent de l’implication : A n’y figure pas. La vérité de cette
implication n’oblige pas à ce qu’une certaine valeur de x soit telle que Φ( x) ⇒ A soit le cas. Ainsi
Frege découvre-t-il la notion fondamentale de champ d’un quantificateur.
Cette notion jouera aussi un rôle fondamental en linguistique. Des phrases comme :
Beaucoup de flèches n’ont pas atteint la cible
Pas beaucoup de flèches ont atteint la cible
n’ont pas la même signification. On peut s’en rendre compte en les coordonnant avec la
phrase beaucoup de flèches ont atteint la cible.
Beaucoup de flèches ont atteint la cible mais beaucoup de flèches n’ont pas atteint la
cible est possible,
Beaucoup de flèches ont atteint la cible mais pas beaucoup de flèches ont atteint la cible
est une contradiction.
On notera qu’au passif, les deux formes semblent se convertir en une seule phrase : la cible
n’a pas été atteinte par beaucoup de flèches, qui a le sens de la deuxième. Autrement dit, à
partir du moment où une règle syntaxique contraint à un certain ordre entre quantificateur et
négation, c’est cet ordre qui détermine la signification et non les structures soi-disant
profondes d’où viendrait la forme de surface. Cet argument a sonné le glas du premier modèle
générativiste chez Chomsky, qui considérait que « les structures profondes étaient les seules
porteuses de sens ».
Un autre rapport avec le langage apparaît dans la notation introduite par Frege. Nous avons
déjà utilisé des schémas avec des barres verticales :
A

a Φ(a)

et des schémas sans :

a Φ(a)

Quelle différence ? Dans l’idéographie, la barre horizontale précède un contenu, c’est la « barre de
contenu ». La barre verticale qui la précède indique un « jugement ». Si on omet la barre verticale en
question, le jugement est transformé en une simple combinaison d’idées. On a souvent par la suite
comparé cette conception à celle qui est apparue en pragmatique à propos de la problématique des
actes de langage (Austin, Searle…). Les pragmaticiens parlent « d’assertion » ou d’acte d’assertion :
c’est ce qui est indiqué par la fameuse petite barre verticale. Si une idée n’est pas assertée, elle est
simplement « assumée ». Il y a une différence entre asserter que « les nombres pairs sont en bijection
avec tous les entiers » et la simple idée que « les nombres pairs sont en bijection avec les entiers ».
dans le premier cas, on peut parler d’une sorte d’engagement : si j’asserte une telle proposition, on
peut me demander d’en donner une preuve. Les pragmaticiens parlent plus généralement de force
illocutoire attachée à une énonciation. Dans la même série, on peut penser à des actes (et donc des
forces illocutoires) comme questionner, ordonner, promettre… Frege ne s’est pas occupé de tels actes
car il était principalement préoccupé par les mathématiques.
4- De la logique aux mathématiques : les nombres entiers
Frege ne se contente pas de donner un système de notation des concepts mathématiques. Il tente aussi
de donner une définition rigoureuse des nombres, une définition qui les soustrairait à l’empire de la
seule intuition. Pour cela, l’idée géniale est de s’en remettre au jeu de concepts qu’il a lui-même créé.
Un concept est dit subsumer un objet (ou un objet tomber sous un concept) si l’objet appartient à
l’extension du concept. Intuitivement, deux concepts donnés (par exemple « satellite de Jupiter » et
« point cardinal ») peuvent être mis en relation via leurs extensions. Celles-ci sont dites avoir le même
nombre d’éléments si on peut les mette en bijection. On dira en ce cas que les concepts sont
équinumériques. Mais alors, le fait de parler de quelque chose d’équinumérique à un concept donné F
définit un nouveau concept : le concept « équinumérique à F ». Le nombre est alors l’extension de ce
concept. Cette définition ne fut pas comprise immédiatement. Cantor, notamment, avait écrit :
« l’auteur en vient à l’idée malencontreuse de prendre pour fondement du concept de nombre ce qu’on
appelle extension d’un concept ; il oublie ce faisant que l’extension d’un concept est, en général,
entièrement indéterminée eu égard à la quantité ». A quoi Frege répondit que la critique serait
pertinente s’il avait défini le nombre des satellites de Jupiter comme l’extension du concept « satellite
de Jupiter ». Mais la critique n’atteint pas la définition véritablement proposée, laquelle identifie le
nombre des satellites de Jupiter à l’extension du concept « équinumérique au concept « satellite de
Jupiter » ». Comme le dit C. Imbert, « Cantor n’a pas pris garde à l’ordre ou niveau des concepts ni à
la mise en évidence du nombre au moyen d’un critère d’égalité purement logique ».
Il reste que si on veut être crédible, il faut montrer que par ces outils, on peut donner un sens à la
succession des entiers, autrement dit à la fois à la notion (considérée comme primitive chez Peano) de
« zéro » et à celle de « successeur ». C’est ce que fait Frege dans le texte qui suit, extrait des
Fondements de l’Arithmétique.

« Puisque rien ne tombe sous le concept : « non identique à soi-même », je pose par définition : 0
est le nombre cardinal qui appartient au concept « non identique à soi-même ». On trouvera
peut-être étrange que je parle ici d'un concept. On objectera que ce concept implique
contradiction et que cela rappelle de vieilles connaissances, telles que le fer en bois et le cercle
carré. Après tout, je pense qu'elles ne méritent pas le mal qu'on en dit. On ne prétendra pas que ces
concepts soient utiles, mais ils ne peuvent pas nuire non plus si on prend soin de ne pas supposer
qu'ils subsument quelque chose; et cela n'est pas supposé dans le simple usage du concept. La
contradiction éventuellement enveloppée dans un concept n'est pas toujours si évidente qu'elle
apparaisse sans recherche; encore faut-il d'abord prendre ce concept en considération et le traiter
selon les lois logiques, comme n 'importe quel autre. Or la logique et la rigueur des preuves exigent
seulement qu'un concept ait des limites parfaitement définies, que pour tout objet on puisse dire
s'il tombe sous ce concept ou non. Les concepts qui recèlent une contradiction comme « non
identique à soi-même » satisfont entièrement à cette exigence; quel que soit l'objet choisi, on sait
qu'il ne tombe pas, sous un tel concept. J'emploie le mot « concept » de telle sorte que
« a tombe sous le concept F »

soit la forme générale d'un contenu de jugement portant sur un objet a et demeure un contenu de
jugement quoi que ce soit que l'on substitue pour a. Et en ce sens,
« a tombe sous le concept non identique à soi-même »
veut dire la même chose que
« a n'est pas identique à soi-même »
ou
« a n'est pas identique à a »

Pour définir le 0, j'aurais pu prendre n'importe quel concept sous lequel rien ne tombe. Mais il
convenait de choisir un concept tel que cette particularité puisse en être démontrée par des moyens
purement logiques; ce à quoi le concept « non identique à soi-même » semble plus favorable, étant
entendu que je donne à « identique » la définition leibnizienne introduite plus haut, définition
purement logique ».

Ceci définit le zéro. Encore faut-il définir la notion de successeur.

« 76. Je me propose maintenant de définir la relation qui affecte deux membres voisins de la suite
naturelle des nombres. Posons que la proposition :
« il existe un concept F et un objet x qui tombe sous ce concept tels que le nombre cardinal qui
appartient à ce concept est n et que le nombre cardinal qui appartient au concept 'qui tombe sous
F mais n'est pas identique à x' est m ».
veut dire la même chose que
« n suit immédiatement m dans la suite naturelle des nombres. » J'évite l'expression « n est le nombre
cardinal le plus rapproché de m dans la suite » car l'emploi de l'article défini requiert à son tour la
démonstration préalable de deux proposition. Pour la même raison, je ne peux pas encore dire : « n
= m + 1 », car la présence du signe = fait de (m + 1) un objet.

77. Pour en venir au nombre 1, nous devons d'abord montrer que quelque chose suit immédiatement
0 dans la suite naturelle des nombres. Examinons le concept — ou si on préfère, le prédicat — « iden-
tique à 0 ». 0 tombe sous ce concept. Par contre, sous le concept « identique à 0 mais non identique à
0 » aucun objet n'est subsume; en sorte que 0 est le nombre cardinal qui lui appartient. Nous avons
donc un concept « identique à 0 » et un objet 0 qui tombe sous ce concept dont on peut dire : le
nombre cardinal qui appartient au concept « identique à 0 » est identique au nombre cardinal qui
appartient au concept « identique à 0 » ; le nombre cardinal qui appartient au concept « identique
à 0 mais non identique à 0 » est 0. D'après notre définition, le nombre qui appartient au concept «
identique à 0 » suit immédiatement 0 dans la suite naturelle des nombres.
Si nous posons par définition : 1 est le nombre cardinal qui appartient au concept « identique à 0 »,
nous pouvons exprimer la dernière proposition comme suit : 1 suit immédiatement 0 dans la
suite naturelle des nombres.
Peut-être n'est-il pas superflu de remarquer que la définition de 1 a une légitimité objective qui
n'est subordonnée à aucune constatation. On confond souvent une définition objective avec le fait que
certaines conditions subjectives doivent être satisfaites pour que nous soyons en mesure de formuler
une définition, et que l'occasion nous en est donnée par des perceptions sensibles. Ces conditions ne
sauraient altérer le caractère a priori des propositions déduites. Il est requis, par exemple, que le
cerveau, au moins pour ce que nous en savons, soit irrigué d'un sang normalement constitué et en
quantité suffisante. Mais la vérité de notre dernière proposition n'en dépend pas. Elle demeure vraie
quand ces conditions disparaissent; et même si tous les êtres rationnels devaient sombrer tous
ensemble dans un sommeil hivernal, elle ne serait pas abolie pendant ce temps, mais demeurerait
inaltérée. La vérité d'une proposition ne réside pas dans le fait qu'elle est pensée. »

C’est ainsi que Frege définit les cardinaux finis et il peut facilement ensuite passer aux cardinaux infinis : le nombre
cardinal infini est le nombre qui appartient au concept « nombre cardinal fini ». Ce faisant, Frege retrouve les intuitions
de Cantor concernant les nombres infinis, que Cantor avait obtenu par une autre démarche : celle des ordinaux. Il faudra
donc réconcilier les deux démarches.
En chemin, nous aurons rencontré ce fait capital, auquel nous n’aurions pas cru au début de l’aventure, puisque le
langage logique avait pour but initialement de contourner le problème de l’infini : les infinis ont acquis leur droit de cité
dans la logique et les mathématiques modernes. Ce n’est plus seulement l’infini potentiel au sens d’Aristote, c’est un
infini actuel.

5- Les ordinaux
Afin de faire mieux comprendre l’idée d’ordinal, je me réfèrerai à une présentation moderne de la théorie, postérieure à la
formulation axiomatique de la théorie des ensembles. Nous supposerons connues la relation d’appartenance et la relation
d’inclusion. On dit qu’un ensemble α est un ordinal s’il a les deux propriétés suivantes :
1) La relation x ∈ y est sur α une relation d’ordre total strict qui est un bon ordre ;
2) Si x ∈ α alors x ⊂ α
Dire qu’un ordre sur α est un « bon » ordre, c’est dire que tout sous-ensemble non vide de α possède un
élément minimum.
Par exemple, les ensembles suivants sont des ordinaux :
∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}, {∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}} etc.
On voit que « curieusement » dès qu’on a un ensemble « initial » d’ordinaux (c’est-à-dire un ensemble
d’ordinaux commençant par le plus petit d’entre eux et qui se suivent)... on a un nouvel ordinal : cet
ensemble justement ! et ainsi de suite. On peut voir aussi sur cet exemple que si α est un ordinal, alors
α ∪ {α} est un ordinal. On note alors ce nouvel ordinal : α+, c’est le successeur de α.
Un ordinal est dit fini si lui-même et chacun de ses éléments est successeur d’un ordinal. Dans le cas
contraire, on parle d’ordinal limite. Or, si nous considérons l’ensemble de tous les ordinaux finis, on
peut démontrer assez facilement qu’il s’agit d’un ordinal, mais on ne peut pas trouver d’ordinal dont il
soit le successeur ! autrement dit c’est un ordinal limite. Notons-le ω. On peut montrer que tout ordinal
inférieur à cet ω est un ordinal fini, donc ω est « le plus petit des ordinaux finis ». Mais on peut
évidemment noter que le procédé qui nous a permis d’obtenir un ordinal à partir d’un autre par
l’opération de « successeur » s’applique toujours ! ω ∪ {ω} a évidemment un sens, et ω ∪ {ω} ≠ ω.
Donc ω+, ou si l’on préfère : ω + 1 est un autre ordinal infini, mais distinct du précédent (puisque c’est
son successeur) et ainsi de suite. On engendre ainsi la suite :
ω, ω + 1, ω + 2, ω + 3, …. jusqu’à ω + ω = 2ω, puis 3ω, 4ω etc. jusqu’à ωω = ω2, puis ω3, …, jusqu’à
ωω et il n’y pas de raison que ça s’arrête.
ω
ω
ω

est encore un ordinal et ainsi de suite ! Cantor avait bien vu qu’à partir du moment où on ouvrait la
porte à un infini actuel, c’est toute une myriade d’infinis qui s’engouffrent, qu’il appelait les ordinaux
transfinis.
On peut bien sûr maintenant établir un lien avec les cardinaux de Frege. La notion de cardinal ne fait
entrer en ligne de compte que celle d’équinuméricité (on dit « équipotence » dans les livres de
mathématiques d’aujourd’hui), alors que celle d’ordinal fait intervenir celle d’ordre, et même de bon
ordre. Si deux ordinaux qui se suivent sont distincts c’est que l’ordre permet toujours de distinguer des
autres l’élément qu’on a rajouté pour passer de l’un à son successeur.
D’autre part, un cardinal était défini comme « classe d’équivalence » d’un ensemble d’ensembles (par
la relation d’équinuméricité). L’existence des ordinaux nous garantit qu’il y a suffisamment
d’ensembles pour servir à définir tous les cardinaux ! Maintenant, on peut poser, pour compléter la
démarche de Frege, la définition suivante : pour un ensemble quelconque a, on appelle cardinal de a le
plus petit ordinal équipotent à a. Mais dira-t-on… encore faudrait-il que a puisse être muni d’une
relation de bon ordre ! Cela n’est pas évident et en réalité va découler (mais bien plus tard…) d’un
axiome, le fameux axiome du choix. En tout cas, pour les ensembles finis, il n’y a pas de problème :
les ordinaux et les cardinaux coïncident dans le cas fini, mais les cardinaux infinis ont des propriétés
étranges : il est tout à fait possible de prouver que deux ensembles E et F tels que l’un soit strictement
inclus dans l’autre ont pourtant même cardinalité. C’est le cas de l’ensemble P des nombres pairs, vis-
à-vis de l’ensemble N des entiers, mais c’est aussi le cas de N vis-à-vis de Z, de N vis-à-vis de Q etc.
Or, Cantor a démontré que pourtant ce n’est pas le cas de N vis-à-vis de R : on dit que R n’est pas
dénombrable (et cela se démontre par l’argument de la diagonale).
Si on met donc en parallèle la suite des ordinaux et la suite des cardinaux, on verra que sur le fini, elles
coïncident, et que quand on arrive au premier cardinal infini, celui correspondant à l’ensemble N, on a
encore identité. Soit ℵ0 le cardinal en question, on a : ℵ0 = ω. Si étant donné un cardinal nous
définissons son successeur comme le plus petit cardinal qui lui est supérieur, alors on peut définir
toute une suite d’alephs par la relation ℵα +1 = ℵα+ autrement dit, à tout ordinal α, on associe un
cardinal de telle sorte que le cardinal associé à α+1 soit le successeur du cardinal associé à α.
Maintenant, sachant que R a la cardinalité de ℘(N) et que donc Card(R) = 2ℵ0 , est-ce que 2ℵ0 = ℵ1 ?
C’est cette égalité que l’on appelle « l’hypothèse du continu ».
6- Les paradoxes de l’infini
Arrivés à ce point, nous pouvons nous retourner un moment et considérer la perplexité qui s’emparait
des mathématiciens du début du XXème siècle devant une telle construction. Le sol des intuitions se
dérobait sous leurs pieds.
C’est là qu’apparurent les premières difficultés, sous la forme des premiers paradoxes. L’un des
premiers à paraître fut celui qu’exposa le mathématicien italien Burali-Forti en 1897 (« Une question
sur les nombres transfinis »). La formulation de ce paradoxe est simple : « l’ensemble de tous les
ordinaux est muni d’un bon ordre, donc est un ordinal, cet ordinal est ainsi à la fois un élément de
l’ensemble des ordinaux et strictement plus grand que tous les ordinaux contenus dans cet ensemble ».
Il s’agit bien là en effet d’une contradiction !
Et de telles contradictions, il va à partir de ce moment en pleuvoir… Frege, dans sa théorie exposée
dans la Begriffschrift, n’impose aucune limitation à la création des « concepts ». On a des concepts
d’objets (c’est-à-dire des fonctions prenant pour arguments des objets « individuels »), mais aussi des
concepts de concepts, des concepts de concepts de concepts et ainsi de suite. De plus, la Begriffschrift
est un langage « universel », c’est-à-dire qu’elle embrasse tout le discours. A priori lorsqu’on a une
fonction Φ(…), c’est-à-dire un schéma insaturé, n’importe quelle expression du langage peut venir
occuper la place vide. En 1902, Russell va mettre le doigt sur une contradiction, elle réside dans le fait
que Φ pourrait très bien s’appliquer à elle-même comme objet. On aurait alors une expression telle que
Φ(Φ). Posons Φ̂ = {x ; Φ(x)} (l’extension de Φ) . Alors en ce cas, on peut très bien envisager un
concept nouveau qui serait le concept « ne pas s’appliquer à lui-même », c’est-à-dire être tel que
l’extension de ce nouveau concept serait Φ̂ = {ϕ ; Φ(ϕ)} = {ϕ ; ¬ϕ (ϕ)} et se poser la question de
savoir si ce concept lui-même s’applique ou ne s’applique pas à lui-même. Alors on a deux cas : ou
bien la réponse est oui : « ne pas s’appliquer à soi-même » s’applique à lui-même, mais alors on a
Φ(Φ) et par la définition précédente, Φ ∉ Φ̂ , autrement dit Φ ne s’applique pas à lui-même, ou bien
la réponse est non : « ne pas s’appliquer à soi-même » ne s’applique pas à lui-même, mais alors Φ∈
Φ̂ , autrement dit Φ s’applique à lui-même. Ce paradoxe ressemble à l’antique paradoxe d’Epiménide
le Crétois qui en tant que Crétois, affirmait que « tous les Crétois sont des menteurs ». Bien entendu, si
cette phrase est vraie, comme Epiménide est crétois, elle est fausse, et si elle est fausse, alors il existe
un Crétois non menteur et c’est peut-être Epiménide, auquel cas elle est vraie et Epiménide est un
menteur ! Le paradoxe est plus nette si on prend la phrase « je mens » : si elle est vraie, elle est fausse
et si elle est fausse, elle est vraie. On connaît une multitude de paradoxes du même genre, ainsi de :
cette proposition est fausse
évidemment, si elle est vraie, elle est fausse et si elle est fausse, elle est vraie. Une échappatoire
consiste à dire que simplement ces objets ne sont pas des propositions : ils ne veulent rien dire, en
quelque sorte. Qu’en est-il maintenant de la proposition :
cette proposition est vraie
bien sûr, si elle est vraie… elle est vraie ! et si elle est fausse… elle est fausse ! Il ne semble pas y
avoir de problème relativement à elle : après tout, on peut dire la même chose de toute proposition ! (si
elle est vraie, elle est vraie, si elle est fausse, elle est fausse, ce qu’on a dans l’équivalence
tautologique : p ⇔ p). Mais si nous l’acceptions comme proposition, alors il faudrait accepter aussi sa
négation comme proposition (au nom d’une stabilité des opérateurs propositionnels), et nous
retomberions sur la précédente. La solution la plus satisfaisante semble donc de rejeter les propositions
dites « auto-référentielles ». Et c’est la solution qui a prévalu jusqu’à très récemment. C’est dans les
années quatre-vingt que certains chercheurs n’ont pas souhaité en rester là, constatant ce qu’ils
perdaient par un tel rejet : les phénomènes de circularité, dont l’auto-référence est un cas particulier,
sont en effet au cœur de nombreux phénomènes et se rencontrent en informatique aussi bien qu’en
philosophie en biologie, en sciences cognitives ou en sciences du langage. Nous y reviendrons dans un
chapitre particulier.

Vous aimerez peut-être aussi