Vous êtes sur la page 1sur 11

Modélisation d’une forme simple de compréhension

Daniel Goossens

To cite this version:


Daniel Goossens. Modélisation d’une forme simple de compréhension. Journées d’Intelligence Artifi-
cielle Fondamentale (JIAF), Jun 2018, Amiens, France. ฀hal-01871832฀

HAL Id: hal-01871832


https://hal.archives-ouvertes.fr/hal-01871832
Submitted on 11 Sep 2018

HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est


archive for the deposit and dissemination of sci- destinée au dépôt et à la diffusion de documents
entific research documents, whether they are pub- scientifiques de niveau recherche, publiés ou non,
lished or not. The documents may come from émanant des établissements d’enseignement et de
teaching and research institutions in France or recherche français ou étrangers, des laboratoires
abroad, or from public or private research centers. publics ou privés.
Actes JIAF 2018

Modélisation d’une forme simple de compréhension

Daniel Goossens
Chercheur indépendant
danielgoos.ia@gmail.com

Résumé univers reste un pré-requis à un raisonnement de sens com-


Cet article présente un nouvel outil pour représenter et mun généralisé.
raisonner sur les connaissances booléennes. L’objectif de Il faut distinguer cette compréhension d’autres formes
cet outil est de modéliser une forme simple de compré- de raisonnement, comme la résolution de problèmes ou la
hension abstraite, locale à un micro-univers, où un petit démonstration automatique. On peut illustrer ses objectifs
nombre de contraintes booléennes rend compte d’une mul- mais pas les formaliser. Un critère opérationnel pour
titude d’évidences implicites. La façon dont l’outil struc- la caractériser est la capacité d’un programme à traiter
ture les connaissances booléennes rend possible une inter- adéquatement toutes les phrases exprimables avec les
action qui maîtrise partiellement cette compréhension. Elle mots d’un dictionnaire restreint lié à un micro-univers
est illustrée par un système question-réponse en langage na-
quelconque. Si le raisonnement booléen est mieux maîtrisé
turel sur le micro-univers de la géométrie des quadrilatères
de niveau du cours élémentaire.
grâce au test de satisfiabilité complet et efficace, aucun
système basé sur une logique du premier ordre ne peut
Abstract aujourd’hui relever ce défi.
This paper presents a new tool for representation and
reasoning on Boolean knowledge. The tool aims at mo- Cet article propose un outil, les graphes de bipartitions
deling a simple form of abstract understanding, locally to a abstraites (GBA), issu des graphes de partitions de [5]. Cet
micro-world, where a small number of Boolean constraints outil est capable d’une forme simple de compréhension
account for a great number of implicit evidences. The abstraite, sur des connaissances booléennes. Il est illustré
Boolean knowledge is organized in a way that makes possi-
par un système question-réponse en langage naturel,
ble an interaction that partially achieves this understanding.
proposé dans [5] et réalisé ici. Le système raisonne
This is illustrated by a natural language question answering
system over the micro-world of the geometry of quadrilat- sur des GBA qui décrivent des connaissances de cours
erals, at the elementary course level. élémentaire, c’est à dire accessibles à l’intuition commune,
du micro-univers des quadrilatères.

1 Introduction Ce micro-univers a été choisi aussi étroit que possible


pour démontrer que si la compréhension y est difficile à
Il existe un raisonnement de sens commun généralement automatiser, ce n’est pas par manque de connaissances. La
considéré comme inatteignable [3] via les technologies de compréhension dans ce micro-univers ne nécessite aucune
l’apprentissage profond et des grands volumes de données connaissance extérieure. Il n’y a ni métaphore, ni ambi-
ou par les technologies basées sur les ontologies, comme guïté lexicale. Chaque mot du lexique désigne un concept
les logiques de description [1]. unique d’un univers formalisé. Il n’y a pas de sous-entendu
Automatiser la compréhension d’un article de journal ou ou de second degré. Toutes les connaissances nécessaires
même d’un conte pour enfants exige des quantités indé- sont disponibles ou déductibles. Pourtant, ce micro-univers
finies de connaissances implicites. Cependant, la consti- multiplie les exemples de subtilités sémantiques, illustrées
tution d’immenses bases de connaissances [11] évidem- ici par une interaction en langage naturel, qui semblent dif-
ment indispensables, ne suffira pas. Même sur des micro- ficiles à gérer avec des stratégies logiques simples.
univers où aucune connaissance extérieure n’est néces- La connaissance, même formalisée, nécessite parfois
saire, l’automatisation de la compréhension peut rester dif- de la part de notre compréhension des acrobaties. Par
ficile. La maîtrise de cette compréhension sur des micro- exemple, les questions "Combien ... " espèrent par défaut
une réponse sous la forme d’un nombre. La question : de la compréhension modélisée. La section 4 présente une
Combien un carré a-t-il de côtés égaux ? interaction en langage naturel avec le système programmé
attend la réponse "Quatre côtés égaux". La question : et discute des limitations de cette approche.
Combien un rectangle a-t-il de côtés égaux ?
embarrasse notre compréhension mais elle se débrouille,
soit pour répondre "deux fois deux côtés égaux", soit pour 2 Les graphes de bipartitions abstraites
corriger la question mal posée en "Combien un rectangle (GBA)
a-t-il de paires de côtés égaux ?".
Une deuxième raison pour ce choix de micro-univers est 2.1 Les graphes de partitions
qu’il peut se décrire en grande partie au niveau booléen. Les graphes de partitions (Partitioning Graphs) appa-
Les progrès dans la maîtrise du raisonnement booléen per- raissent explicitement en Intelligence Artificielle avec [7].
mettent de simuler des capacités originales d’interaction Ils servaient à représenter les connaissances basées sur les
en langage naturel. Il constitue donc un test déterminant relations sorte-de ou partie-de. Depuis, [4, 5] en ont fait un
pour tout système qui vise à maîtriser un raisonnement de formalisme pour représenter les connaissances booléennes.
type compréhension.
Les graphes de partitions sont des hypergraphes dont les
nœuds sont des variables booléennes et les hyper-arêtes des
L’interaction en langage naturel du système question- contraintes sur ces variables booléennes. Dans un graphe
réponse présenté ici montre une intuition géométrique ba- de bipartitions, chaque hyper-arête est un triplet hx, y, zi de
sique. Cependant, même localement à ce micro-univers des variables booléennes, noté x = y + z et interprété comme
quadrilatères, les phrases exprimables sont tellement di- une bipartition (x = y ∨ z) ∧ (y ∧ z = 0). Cette contrainte
verses, variées et inattendues que l’objectif de les traiter s’écrit en FNC : (x ∨ y ∨ z) ∧ (x ∨ y) ∧ (x ∨ z) ∧ (y ∨ z).
toutes adéquatement est loin d’être atteint, sauf à dévelop-
Dans ces graphes de bipartitions, on représente les
per un travail spécifique, non généralisable, aussi impor-
connecteurs booléens ∧, ∨, − comme illustré dans la fi-
tant que celui développé par Terry Winograd pour son pro-
gure 1.
gramme fondateur SHRDLU [9].
La raison principale de ces limitations est que le raison-
nement des GBA fonctionne sur tout ce qui se représente
au niveau booléen mais ne se généralise pas encore aux
ordres supérieurs.

Les GBA séparent la connaissance booléenne en un


graphe d’implications et un système d’équations linéaires
modulo 2. Le graphe d’implications étend progressivement
l’extension (implicants) et l’intension (impliqués) des
concepts définis. Il facilite ainsi la recherche de bases Figure 1 – Graphes de bipartitions. Le graphe de gauche est
booléennes simples pour exprimer des concepts et ainsi la bipartition isolée x = y ∨ z avec la contrainte y ∧ z = 0.
répondre aux questions "Qu’est-ce que ..." de façon perti- Le graphe de droite contient quatre bipartitions. Elles im-
nente. Le système d’équations donne aux GBA le pouvoir posent sur les six nœuds une contrainte qui fait que quatre
expressif de l’algèbre de Boole et se résout efficacement des nœuds (x-y, y-x, xy et xvy) sont les fonctions boo-
par élimination gaussienne. Les capacités du système léennes indiquées (x ∧ y, y ∧ x, x ∧ y et x ∨ y) de x et y.
question-réponse ne signifient pas que ce soit la seule
façon de structurer les connaissances booléennes pour
modéliser la compréhension. Elles signifient seulement La bipartition ainsi conçue est une primitive pratique
que cette façon est adaptée. pour représenter des hiérarchies croisées. Les bipartitions
intègrent les relations d’implication et d’exclusion mu-
Les deux contributions principales de cet article sont : tuelle pour organiser les connaissances. Le formalisme a
— la nouvelle architecture des GBA pour représenter le pouvoir expressif de l’algèbre de Boole.
les connaissances booléennes et raisonner avec, ba- Une bizarrerie de ces bipartitions exclusives, cependant,
sée sur des implications et des équations linéaires est la dissymétrie qu’elles imposent dans la représentation
modulo 2, des disjonctions et des conjonctions, pourtant duales. Sur le
— la réalisation d’un programme d’interaction en lan- graphe de droite de la figure 1, x∧y et x∨y ont des construc-
gage naturel capable d’une forme de compréhension. tions différentes. Cette dissymétrie disparaît si on remplace
La section 2 présente les GBA. La section 3 présente la bipartition par une bipartition abstraite, qui peut se trans-
les techniques de raisonnement booléen qui sont à la base former en une bipartition ou une bipartition duale.
2.2 Les bipartitions abstraites
L’ensemble des parties d’un ensemble d’atomes {1 . . . n},
les disjonctions ou les conjonctions seules d’un ensemble
de générateurs {1 . . . n}, sont des demi-treillis isomorphes.
Pour profiter de ces isomorphismes, il suffit d’interpréter la
bipartition de différentes façons.
Une bipartition x = y + z est exclusive. A la contrainte
x = y∨z s’ajoute y∧z = 0. Elle s’interprète comme une dis-
jonction inclusive, si on abandonne la contrainte y ∧ z = 0.
On peut aussi créer la bipartition duale, qui s’interprète
comme une conjonction x = y ∧ z (figure 2).
Figure 3 – Les graphes de bipartitions abstraites (GBA).
Le graphe de gauche est la bipartition abstraite isolée
ha, b, a ∨ b, a ∧ bi. Chaque implication x → y est dessinée
par un trait du haut de x vers le bas de y. Elle se définit clas-
siquement, comme la contrainte ¬x∨y. Chaque équation li-
néaire est un cercle connecté à ses variables. La connexion
pointée est la variable définie, dans le système résolu. Le
graphe du milieu est une hiérarchie de deux bipartitions ex-
clusives quand le nœud ∅ vaut 0, car a ∧ b = (a ∨ b) ∧ c = ∅.
Le graphe de droite est la construction duale.
Figure 2 – Le graphe de gauche est la bipartition duale iso-
lée x = y ∧ z avec la contrainte y ∨ z = 1. Son dessin est ce-
lui, inversé, d’une bipartition. Le graphe de droite contient
deux bipartitions. Si on lève les deux contraintes x ∧ y = 0
et x ∨ y = 1, le graphe impose sur les quatre nœuds une du bas de la bipartition abstraite, on retrouve l’usage de la
contrainte qui fait que deux des nœuds (x ∨ y et x ∧ y) sont bipartition exclusive en faisant partager un même nœud du
les fonctions booléennes indiquées de x et y. Si x ∧ y = 0, bas à plusieurs bipartitions abstraites. Dans la construction
le graphe est une bipartition. Si x ∨ y = 1, le graphe est une duale, les bipartitions abstraites partagent un même nœud
bipartition duale. du haut (figure 3).

Les bipartitions abstraites permettent donc de construire


Au lieu de l’hyper-arête à trois nœuds, la bipartition ex- les treillis distributifs. Pour les étendre en treillis booléens,
clusive x = y + z peut se représenter avec deux implica- il suffit de l’opération de complément local. Si a, c, d sont
tions : {y → x, z → x}, et une équation linéaire modulo 2 : trois nœuds tels que d → a et a → c alors la bipartition
x ⊕ y ⊕ z = 0. Symétriquement, la bipartition duale exclu- ha, b, c, di fournit le complémentaire b de a entre c et d.
sive se représente avec deux implications : {x → y, x → z},
et une équation linéaire modulo 2 : x ⊕ y ⊕ z = 1. Une présentation formelle des GBA devra choisir une
On peut alors combiner la bipartition inclusive et sa définition constructive. Ici, on se contente de définir un
duale en un seul opérateur, composé de quatre nœuds, GBA comme une conjonction de bipartitions abstraites et
quatre implications et une équation linéaire modulo 2 d’implications, possiblement transformée par des règles de
(graphe de gauche de la figure 3). C’est la bipartition abs- raisonnement.
traite :
Cette nouvelle conception des bipartitions retrouve des
Définition 1 Une bipartition abstraite est une conjonc- formes logiques classiques. Les portes logiques a ∨ b et
tion de quatre implications et une équation linéaire mo- a ∧ b se définissent avec l’opérateur ⊕ de l’anneau booléen
dulo 2 sur quatre variables booléennes a, b, c, d : [8]. Sans les équations linéaires, le graphe d’implications
{d → a, d → b, a → c, b → c, a ⊕ b ⊕ c ⊕ d = 0}. On la d’un GBA est le diagramme de Hasse d’un ordre partiel.
note ha, b, c, di.
La combinaison d’un graphe d’implications et d’un sys-
On vérifie facilement sur un diagramme de Venn à 4 tème d’équations linéaires modulo 2 constitue une solu-
variables qu’une bipartition abstraite ha, b, c, di implique tion originale pour représenter et raisonner sur les connais-
c = a ∨ b et d = a ∧ b. Une bipartition abstraite isolée sances booléennes. Les GBA permettent d’utiliser la même
représente donc à la fois la disjonction a ∨ b et la conjonc- machinerie déductive sur les différentes sortes de demi-
tion a ∧ b. Si on appelle c le nœud du haut et d le nœud treillis isomorphes cités au début du paragraphe 2.2.
3 Le raisonnement sur les GBA contradictions ou équivalences booléennes triviales hors du
système linéaire, même si ces contradictions ou équiva-
Quand une expression booléenne est non-contradictoire, lences sont potentiellement représentables avec des équa-
le test de satisfiabilité produit une seule solution, un seul tions linéaires, tant que ces équations ne sont pas explici-
exemple satisfiant. S’il y a plusieurs solutions, la solution tement dérivées. Du point de vue de la compréhension hu-
produite implique l’expression mais pas l’inverse. maine, ses capacités peuvent donc parfois être étonnantes
La compréhension abstraite modélisée ici a besoin d’un et ses déficiences inattendues et décevantes.
raisonnement déductif qui ne déduit que des faits impli-
qués. Les opérations qui modifient une base de connais-
3.3 Les raisonnements mixtes
sances doivent conserver l’équivalence avec la base de dé-
part. La fonction de ce raisonnement déductif est de main- La combinaison des implications et des équations li-
tenir les nœuds interclassés de façon à faciliter les raison- néaires modulo 2 permet beaucoup de déductions de va-
nements ultérieurs, dans la philosophie des mécanismes de leurs booléennes, implications et équations linéaires. Voici
classification des logiques de description [1] mais au ni- les exemples les plus utiles parmi ceux déjà expérimentés.
veau booléen. Ce raisonnement assure trois fonctions clas- Leur correction correspond à des théorèmes booléens ba-
siques : inférer des implications destinées à interclasser des siques :
expressions, chercher et supprimer des expressions contra-
dictoires, chercher et fusionner des expressions équiva- La propagation gaussienne : On itère la propagation
lentes (en particulier, reconnaître des concepts déjà pré- et l’élimination gaussienne tant qu’il y a des nœuds
sents, exprimés différemment). nouvellement valués. Comme on ne peut itérer plus
qu’il n’y a de nœuds, la propagation gaussienne est
bornée polynomialement.
3.1 La propagation
La déduction d’implications : Pour toute paire de
Les nœuds d’un GBA peuvent être valués booléenne- nœuds {n, m} et v valeur booléenne, si n = v ne
ment. On note n = 0 ou n = 1 la valuation d’un nœud n. propage pas m = v sur le seul graphe des implica-
Une valuation d’un GBA est une application de l’ensemble tions mais le fait sur le graphe entier (avec les équa-
de ses nœuds dans {0, 1}. tions linéaires), alors on ajoute au graphe l’implica-
La propagation des valeurs booléennes sur un GBA cor- tion n → m si v = 1 ou m → n si v = 0.
respond à la propagation de contraintes booléennes (BCP)
Chaque fois que le nœud x ∧ y est construit à partir
ou propagation unitaire, sur des 2-clauses et des XOR-
de nœuds x et y, pour tout nœud n qui implique à la
clauses. Sa complexité est donc linéaire.
fois x et y dans le graphe d’implications, on ajoute
l’implication n → (x ∧ y). On procède dualement
3.2 L’élimination gaussienne pour x ∨ y.
On utilise l’élimination gaussienne pour résoudre le sys- Fusionner les circuits d’implications : Quand un cir-
tème linéaire modulo 2, chaque fois qu’on ajoute une nou- cuit d’implications {x1 → x2 , . . . xi−1 → xi , xi → x1 }
velle équation au système. Sa complexité est de O(m2 n) s’est formé, les nœuds du circuit sont fusionnés car
pour n variables et m équations, donc polynomiale. équivalents.
L’élimination gaussienne est complète pour détecter Eliminer les implications redondantes : Pour toute
les nœuds contradictoires et les paires de nœuds équiva- implication I = (n → m), si n = 1 propage m = 1
lents, localement au système d’équations linéaires. Dans sur le graphe des implications sans I, on supprime
un graphe non valué, un nœud contradictoire (x = 0) dé- I. C’est l’équivalent de la suppression des arcs de
tecté est supprimé et deux nœuds équivalents (x = y) sont transitivité dans un diagramme de Hasse.
fusionnés.
L’élimination gaussienne associée à la propagation étend Affiner le graphe d’implications : A chaque nouvelle
cette reconnaissance de nœuds contradictoires ou équiva- implication déduite y → z, on propage la valuation
lents aux expressions booléennes mais sans bien évidem- (y = 0)∧(z = 1). Pour chaque impliqué x de y tel que
ment conserver la complétude. x = 1 et qui n’est pas un impliqué de z (dual impli-
Le rôle de l’élimination gaussienne dans le raisonnement cant x de z tel que x = 0 et qui n’est pas un implicant
booléen est encore difficile à comprendre. Elle est capable de y), on ajoute l’implication déductible z → x (dual
d’effectuer facilement des tests de satisfiabilité hors de por- x → y). Voir un exemple en figure 4.
tée des SAT-solvers basés sur l’algorithme DPLL seul [2]. Propager les égalités : l’évaluation du système linéaire
Elle permet de détecter spontanément des nœuds contra- partiellement valué infère des équations temporaires,
dictoires ou équivalents, parfois totalement hors de portée impliquées par le graphe et sa valuation temporaire.
de l’intuition, mais elle n’a aucun pouvoir de détecter les Pour chaque équation temporaire x = y, pour tout
nœud n tel que ((x → n) ∧ (n → y)), on déduit les une valuation, elle déclenche d’autant plus de tests de sa-
équations temporaires x = n et n = y. tisfiabilité qu’il y a de nœuds vierges dans le graphe. Beau-
Propager les inégalités : Pour chaque équation tempo- coup de ces tests sont inutiles même quand ils étendent ef-
raire x ⊕ y = 1, si x → y est inférable, on déduit fectivement la valuation, parce que ces informations éten-
x = 0 ∧ y = 1. dues ne sont pas pertinentes. En pratique, les temps de cal-
cul de cette propagation complète augmentent exponentiel-
lement avec la taille du graphe. Elle n’est utilisable que sur
des graphes de taille modeste (une centaine de nœuds), sauf
à découvrir de nouvelles façons de limiter encore les tests.
L’efficacité du SAT-solving semble pouvoir se dispen-
ser d’une structuration particulière des connaissances boo-
léennes. Cet article défend l’idée que si c’est vrai en partie
pour les problèmes de décision, ce n’est pas le cas pour la
modélisation de la compréhension présentée ici.

Figure 4 – Si la valuation (y = 0) ∧ (z = 1) propage x = 1 4 Un système de question-réponse sur les


pour x impliqué de y, et x = 0 pour x implicant de z, le quadrilatères
graphe de gauche s’affine en celui de droite.
Cette section présente un système de question-réponse
en langage naturel sur le micro-univers des quadrilatères
La limite à intégrer de nouvelles règles de raisonnement, en géométrie du cours élémentaire. Son dictionnaire est en
c’est le coût en temps de calcul. Ici, contrairement au pré- annexe A. Il est programmé en C++ et en Objective-C.
traitement des SAT-solvers qui doit économiser du temps Pendant l’interaction, chaque phrase est analysée syn-
pour un seul problème, le raisonnement peut être coûteux taxiquement puis évaluée sémantiquement puis la réponse
car chaque amélioration du GBA sert à tous les raisonne- est imprimée.
ments ultérieurs qui utiliseront la base de connaissances. L’analyse syntaxique des phrases est effectuée par un
Tous ces raisonnements sont utilisés dans des stratégies Chart Parser classique [6] car les grammaires hors-
bornées polynomialement et sont donc incomplets pour le contexte ne s’expriment pas au niveau booléen.
raisonnement booléen. Ceci n’est évidemment pas un obs- L’arbre résultant de l’analyse syntaxique est évalué
tacle pour la modélisation d’un raisonnement de type com- comme on évalue une expression imbriquée. La connais-
préhension intuitive. sance est représentée dans un ensemble de GBA indépen-
dants. Un même ensemble de concepts peuvent apparaître
3.4 Le raisonnement booléen complet dans plusieurs GBA, sous des contraintes booléennes diffé-
rentes. L’évaluation d’un syntagme retourne un nœud d’un
Le raisonnement booléen déductif peut être basé sur le GBA. Chaque type de question déclenche une procédure
test de satisfiabilité booléen complet, effectué par un SAT- qui contrôle à sa façon l’évaluation des syntagmes qui la
solver. Il est alors lui-même complet. A partir d’une va- composent.
luation partielle du graphe, il peut inférer les valuations de Les opérations de base de cette évaluation sont la
tous les nœuds dont la valeur booléenne est impliquée par construction de nouvelles bipartitions abstraites (par
la valuation partielle. exemple pour construire ou reconnaître le ∧ ou le ∨ de
Pour étendre une valuation partielle à tous les nœuds deux concepts ou le complémentaire local d’un concept),
dont elle implique la valeur, on procède ainsi : pour chaque et la propagation de valeurs booléennes. Ces opérations uti-
nœud n non valué, on applique le test de satisfiabilité com- lisent le raisonnement incomplet décrit en section 3.
plet sur la conjonction du graphe, de la valuation partielle
et de n = 1 ou n = 0, traduite en FNC. Si le test dé- 4.1 Le modèle des quadrilatères
tecte une contradiction, on inverse la valeur de n. On profite
du graphe d’implications pour limiter ces tests coûteux. Si La base de connaissances de départ est réduite à un mo-
x → y et si x = 1 a été testé non-contradictoire, il est inutile dèle très simple des quadrilatères. Un quadrilatère est dé-
de tester y = 1, et dualement pour y = 0 et x = 0. fini par ses quatre côtés a, b, c, d. Avec ces côtés, on ins-
La propagation complète ainsi obtenue est utile pour dé- tancie les relations d’incidence (×), de parallélisme (k), de
couvrir des théorèmes booléens ou étudier les propriétés perpendicularité (⊥) et d’égalité de longueur (=), pour pro-
des GBA. Elle est nécessaire pour construire le modèle des duire une base de générateurs booléens (figure 5).
quadrilatères utilisé ici mais elle n’est pas l’outil adéquat à Le concept de quadrilatère est défini comme la conjonc-
long terme pour modéliser la compréhension. Pour étendre tion (a × b) ∧ (b × c) ∧ (c × d) ∧ (a × d) (on fait l’hypothèse
Figure 5 – Pour chaque paire de côtés (ici a et b), on produit
ce graphe. Quand bot = 0, il garantit l’exclusion mutuelle
des trois générateurs a k b, a ⊥ b et son complémentaire
sous a × b. On produit également le générateur a = b. Figure 6 – Après la définition des concepts abstraits, le
GBA contiendra un graphe d’implications comme celui-ci
entre les propriétés définies. Il manque encore des impli-
cations intuitives, qui seront déduites de connaissances a
que les quatre côtés se croisent ainsi). priori.
Toujours dans la base des générateurs, on définit boo-
léennement les concepts abstraits :

2-côtés-parallèles, 2-fois-2-côtés-parallèles, claire. On les intègre dans la base de connaissances avant


2-côtés-égaux, 3-côtés-égaux, 4-côtés-égaux, toute interaction en langage naturel.
2-fois-2-côtés-égaux, Ce sont par exemple les contraintes géométriques sur les
1-angle-droit, 2-angles-droits, 3-angles-droits, droites parallèles ou perpendiculaires. La contrainte
2-côtés-adjacents-égaux, 2-côtés-opposés-égaux,
2-fois-2-côtés-adjacents-égaux, ∀x∀y∀z ((x k y) ∧ (y k z)) → (x k z))
2-fois-2-côtés-opposés-égaux, appliquée sur tous les triplets d’un ensemble de droites,
2-côtés-parallèles-et-égaux. ajoute au graphe autant de sous-graphes comme celui de
la figure 7, construits à partir de la base des générateurs.
Le concept 2-côtés-parallèles, par exemple,
se définit simplement comme (a k c) ∨ (b k d) et
2-fois-2-côtés-parallèles comme (a k c) ∧ (b k d). D’autres
se définissent moins simplement, comme 2-angles-droits
ou 2-côtés-égaux. Un angle droit, c’est une instance de
la relation x ⊥ y. Deux angles droits, c’est la conjonction
de deux instances de cette relation. La définition de
2-angles-droits, c’est donc la disjonction de toutes ces
conjonctions de deux instances.
Après la définition de ces concepts, le GBA contient le
graphe d’implications de la figure 6. Figure 7 – Ce GBA impose aux trois propositions (a k b),
A cette étape, certaines implications intuitives (b k c), (a k c) que si deux sont vraies, la troisième est vraie
manquent. Si le quadrilatère a trois angles droits, par aussi.
exemple, il en a quatre et c’est un rectangle. Le concept
3-angles-droits devrait impliquer 2-côtés-opposés-égaux.
Ces implications manquantes nécessitent certaines Pour notre modèle des quadrilatères, les contraintes
connaissances a priori, comme les liens entre les relations utiles sont celles qui lient les relations k et ⊥, ainsi que
k, ⊥ et =. la transitivité de l’égalité de longueur. On applique de la
même manière :
4.2 Les connaissances a priori
∀x∀y∀z ((x k y) ∧ (y ⊥ z)) → (x ⊥ z))
On considère certaines connaissances géométriques
∀x∀y∀z ((x = y) ∧ (y = z)) → (x = z))
comme données a priori. La façon de les enseigner par
une interaction en langage naturel à partir de rien n’est pas sur les triplets de côtés {acb, acd, bda, bdc}.
4.3 Les différents types de quadrilatères 4.4 Interactions en langage naturel
Les différents types de quadrilatères étudiés au cours Une fois quelques quadrilatères définis, on peut rensei-
élémentaire (trapèze, trapèze rectangle, trapèze isocèle, gner le système sur certaines intuitions géométriques ba-
parallélogramme, losange, rectangle, carré, cerf-volant), siques, par une interaction en langage naturel.
peuvent être définis, à partir des concepts déjà disponibles, On peut aussi les définir à partir du modèle de départ
de beaucoup de façons différentes. Dans toutes les sé- du quadrilatère, sans se référer aux quadrilatères définis.
quences expérimentées, avec le raisonnement incomplet, Ces intuitions géométriques constituent alors un savoir a
les mêmes relations d’implication entre quadrilatères priori. Elles accompagnent les présupposés de la géométrie
(figure 8) ont été déduites. du cours élémentaire : elle est euclidienne et les quadrila-
tères sont convexes.
Voici celles utilisées ici :
— Un quadrilatère avec deux-fois-deux côtés opposés
égaux est un parallélogramme.
Cette contrainte peut être définie comme ((a = c) ∧
(b = d)) ↔ ((a k c) ∧ (b k d)).
— Un cerf-volant avec deux côtés parallèles est un lo-
sange :
(2-fois-2-côtés-adjacents-égaux ∧ ((a k c) ∨ (b k d)))
↔ (a = b = c = d).
— Un rectangle est un trapèze-rectangle avec deux cô-
tés opposés égaux.
— Un quadrilatère qui a deux côtés parallèles et égaux
est un parallélogramme :
((a k c) ∧ (a = c)) ↔ ((b k d) ∧ (b = d))
— Un quadrilatère avec trois côtés égaux et deux angles
droits est un carré.

Ici, chacune de ces contraintes, de la forme "Un x est un


y", provoque la fusion de deux nœuds, qui sont construits
Figure 8 – Le graphe d’implications entre les quadrilatères ou reconnus en évaluant x et y.
définis en langage naturel apparaît spontanément, quel que Les interactions en langage naturel qui suivent montrent
soit l’ordre des définitions, pourvu qu’elles soient exactes que la multitude de petites évidences implicites que néces-
et complètes. site le sens commun peut, localement à ce micro-univers,
être représentée par un petit nombre de contraintes boo-
léennes. Les questions sont toutes à portée d’intuition mais
Le carré, par exemple, est la figure qui admet le plus de demandent parfois une certaine concentration.
définitions différentes :

— Un carré est un quadrilatère avec quatre côtés égaux 4.4.1 Une interaction sans figure prédéfinie
et quatre angles droits.
— Un carré est un quadrilatère qui a quatre côtés égaux Voici un exemple d’interaction avec le système, où
et un angle droit. aucun quadrilatère n’a encore été défini. Ses réponses sont
— Un carré est un rectangle avec quatre côtés égaux. en italiques.
— Un carré est un rectangle avec trois côtés égaux.
— Un carré est un rectangle qui a deux côtés adjacents ?- Qu’est-ce qu’un trapèze ?
égaux. Je ne sais pas
— Un carré est un losange avec un angle droit. ?- Un trapèze est un quadrilatère avec deux côtés paral-
— Un quadrilatère qui a deux angles droits et trois côtés lèles.
égaux est un carré. Ok
— Un rectangle qui est un losange est un carré. ?- Un parallélogramme est un quadrilatère qui a deux-fois-
C’est la capacité du raisonnement de reconnaître sponta- deux côtés parallèles.
nément des expressions différentes mais équivalentes, qui Ok
rend le système indifférent à la façon dont les concepts sont ?- Est-ce qu’un parallélogramme est un trapèze ?
définis. Oui
?- Est-ce qu’un trapèze est un parallélogramme ? partir de laquelle décrire un concept-réponse. Il y a souvent
Non plusieurs bases de générateurs qui peuvent exprimer un
concept. Ici, le choix de la base est aléatoire.
?- Un rectangle est un quadrilatère qui a quatre angles
droits. ?- Qu’est-ce qu’un carré ?
Ok un losange avec un angle droit
?- Un cerf-volant est un quadrilatère qui a deux-fois-deux ?- Qu’est-ce qu’un parallélogramme qui a un angle droit ?
côtés adjacents égaux. un rectangle
Ok ?- Qu’est-ce qu’un rectangle qui a deux côtés adjacents
?- Un carré est un quadrilatère qui a quatre angles droits et égaux ?
quatre côtés égaux. un carré
Ok ?- Qu’est-ce qu’un trapèze qui a un angle droit et trois côtés
?- Qu’est-ce qu’un cerf-volant qui est un rectangle ? égaux ?
Un carré un carré
?- Qu’est-ce qu’un cerf-volant avec deux côtés opposés
Ici, une phrase comme "Un trapèze est un quadrilatère égaux ?
avec deux côtés parallèles" est inteprétée comme une défi- un losange
nition. Les phrases nominales "un quadrilatère" et "deux
côtés parallèles" s’évaluent chacune en un nœud. Leur On peut définir des figures nouvelles, comme le trapèze
conjonction devient la définition du mot "trapèze", qui est isocèle, ou fantaisistes, comme le quadri-truc :
ajouté au lexique.
?- un trapèze-isocèle est un trapèze qui a deux côtés oppo-
4.4.2 Les questions "Est-ce que" sés égaux.
Ok
Ces questions sont des problèmes de décision. Le test
?- qu’est-ce qu’un trapèze-isocèle qui a un angle droit ?
de satisfiabilité complet répond à toutes. Le raisonnement
un rectangle
incomplet suffit pour gérer des interactions comme celle-
ci, qui suppose les figures mentionnées préalablement
?- un quadri-truc est un quadrilatère qui a deux-fois-deux
définies :
côtés égaux.
Ok
?- Un rectangle a-t-il trois côtés égaux ?
Pas forcément ?- qu’est-ce qu’un quadri-truc qui a deux côtés adjacents
?- Est-ce qu’un carré a trois côtés égaux ? égaux ?
Oui un cerf-volant
?- qu’est-ce qu’un parallélogramme ?
?- Est-ce qu’un parallélogramme qui n’est pas un losange un quadri-truc avec deux côtés opposés égaux
a deux côtés adjacents égaux ?
Non 4.4.4 Les questions "Combien"
?- Est-ce qu’un parallélogramme qui n’est pas un losange
a deux côtés opposés égaux ? L’algèbre de Boole ne sait pas compter les occurrences
Oui d’un motif dans un espace combinatoire. Les nombres sont
ici traités comme des propriétés booléennes (et chaque
?- Est-ce qu’un losange avec un angle droit est un rec- nombre sous-entend "au moins"). Le résultat est une
tangle avec deux côtés adjacents égaux ? interaction subtile qui donne l’illusion d’une intuition
Exactement géométrique. Ça ne signifie pas que l’intuition humaine
fonctionne de cette façon (par exemple, le système répond
Le contrôle spécifique de l’évaluation par les questions correctement au nombre de côtés égaux d’un rectangle
"Est-ce que x est y ?" distingue le cas où x et y sont déjà mais il n’est pas embarrassé par la question). Cependant,
connus pour être un seul et même concept, en quel cas la une modélisation du sens commun doit maîtriser ce genre
réponse est "Exactement" au lieu de "Oui". d’interaction.

?- Combien de côtés égaux a un carré ?


4.4.3 Les questions "Qu’est-ce que"
quatre côtés égaux
Les questions de la forme "Qu’est-ce qu’un <figure> ?" ?- Combien un rectangle a-t-il de côtés égaux ?
utilisent une stratégie qui recherche une base de concepts à deux fois deux côtés égaux
?- Combien de côtés parallèles a un carré ? La négation contrôle l’évaluation de manière spécifique.
deux fois deux côtés parallèles Il existe un nœud ∅ qui implique tous les autres et signi-
?- Combien un cerf-volant avec deux côtés parallèles a-t-il fie "contradiction". Dans la phrase nominale "un rectangle
de côtés égaux ? qui n’est pas un carré", elle sépare l’évaluation de "un rec-
quatre côtés égaux tangle" et "un carré" et construit ou reconnaît le complé-
?- Combien de côtés égaux a un quadrilatère qui a deux mentaire c du nœud carré entre le nœud rectangle et le
côtés adjacents égaux et deux côtés opposés égaux ? nœud ∅. On a ainsi c → rectangle et c ∧ carré = ∅. Dans
trois côtés égaux une question "Qu’est-ce que X ?", quand X s’évalue en le
nœud ∅, la réponse est "C’est une figure impossible".
La question "Combien de côtés égaux a un carré ?"
illustre le traitement procédural extérieur au raisonnement
booléen. L’évaluation de "un carré" donne le nœud carré du 4.5 Limitations
GBA qui décrit les types de quadrilatères. L’évaluation de Le système d’interaction en langage naturel présenté ici
"côtés égaux" donne un nœud côtés-égaux. Le mot "com- se limite à illustrer la compréhension intuitive visée. Il ne
bien" cherche dans le GBA qui décrit les quelques nombres contient pas de modèle de discours. Chaque phrase est trai-
utilisés ici, celui qui, conjoint au nœud côtés-égaux, est im- tée isolément. Le système est maximalement crédule. Il
pliqué par le nœud carré. La réponse est ce nombre. n’intègre pas de méthode de révision de ses croyances. Il
Pour que ce raisonnement procédural fonctionne aussi n’a pas de protection de la cohérence de ses savoirs contre
simplement, il faut que les nœuds qui y interviennent soient les interactions avec l’utilisateur. Il ne gère pas les ques-
correctement insérés (interclassés) dans leurs GBA respec- tions comme "Combien un côté a-t-il d’angles ?" ou "Est-ce
tifs, quelle que soit la façon dont les différents quadrilatères qu’un côté est adjacent ?" que notre compréhension recon-
sont définis. C’est la fonction du raisonnement booléen dé- naît comme bizarres ou absurdes. Egalement, Il n’évalue
crit à la section 3. pas ses choix (aléatoires) d’explications de figures.
Dans le modèle des quadrilatères utilisé, il n’y a ni les
4.4.5 La négation sommets, ni les diagonales, ni les droites qui prolongent
les côtés, ni les plans qu’elles séparent, etc. L’interaction
L’algèbre de Boole permet de gérer la négation. Avec en langage naturel est donc très limitée. Par exemple, à la
la négation, on peut décrire les versions strictes des question "Qu’est-ce qu’un quadrilatère ?", la réponse est
quadrilatères définis, comme par exemple un rectangle qui "Je ne sais pas". Elle permet malgré tout d’illustrer des
n’est pas un carré. évidences et des subtilités sémantiques, quasiment toutes
accessibles à l’intuition, qu’on ne trouve dans aucune en-
?- Est-ce qu’un parallélogramme qui n’est pas un rectangle cyclopédie. Il semble difficile d’imaginer pouvoir glaner ce
a un angle droit ? genre de connaissances sur Internet malgré les grands vo-
Non lumes de données.
?- Qu’est-ce qu’un rectangle qui n’a pas de côtés égaux ? Pour traiter l’exemple de la question "Combien un rec-
C’est une figure impossible tangle a-t-il de côtés égaux ?" ou "Combien un carré a-t-
?- Un trapèze-isocèle-strict est un trapèze-isocèle qui n’est il de côtés parallèles ?", on utilise la propriété booléenne
pas un parallélogramme. deux-fois-deux ou deux-paires-de et on se débrouille en
Ok restant au niveau booléen. Si le mot "paires" est ajouté au
?- Qu’est-ce qu’un trapèze-isocèle-strict qui a un angle dictionnaire, alors il faut aussi gérer la question plus arti-
droit ? ficielle mais néanmoins à portée de notre compréhension
C’est une figure impossible "Combien un carré a-t-il de paires de côtés égaux ?" 1 . Sa
réponse nécessite un algorithme de comptage explicite et
L’interaction qui suit utilise une stratégie facile à pro- donc une logique d’ordre supérieur à l’algèbre de Boole.
grammer avec les GBA. Elle cherche une base de concepts Le modèle géométrique est donc sérieusement limité par
proche qui permet d’exprimer la réponse : la représentation booléenne, qui fait exploser la taille de
concepts qui se définissent simplement aux ordres supé-
?- Qu’est-ce qu’un rectangle qui n’est pas un carré ? rieurs. Pour étendre le modèle géométrique et enrichir les
C’est un rectangle qui n’est pas un losange capacités d’interaction en langage naturel, la direction prin-
?- Qu’est-ce qu’un rectangle qui n’est pas un losange ? cipale est la recherche de solutions pour gérer le raisonne-
C’est un rectangle qui n’a pas trois côtés égaux ment de type compréhension sur des logiques d’ordre su-
?- Qu’est-ce qu’un rectangle qui n’a pas trois côtés égaux ? périeur.
C’est un rectangle qui n’a pas deux côtés adjacents égaux
1. Cet exemple est de Patrick Greussay
5 Conclusion book: Theory, Implementation and Applications.
Cambridge University Press, 2010.
Cet article a présenté une nouvelle architecture, les [2] Baumgartner, P. et F. Massacci: The taming of the
graphes de bipartitions abstraites (GBA), pour représen- (x)or. Dans Computational Logic — CL 2000, pages
ter les connaissances booléennes et raisonner avec. Elle est 508–522. Springer Berlin Heidelberg, 2000.
illustrée par un système de question-réponse en langage na-
turel sur le micro-univers de la géométrie des quadrilatères [3] Davis, E. et G. Marcus: Commonsense reasoning and
de niveau du cours élémentaire. commonsense knowledge in artificial intelligence.
Ce micro-univers a été choisi d’une part parce qu’il Commun. ACM, 58(9):92–103, 2015.
se décrit au niveau booléen et d’autre part pour montrer [4] Goossens, D.: Automatic node recognition in a
que la compréhension pouvait être difficile à automatiser partitioning graph. Dans Advances in Artificial
même quand toutes les connaissances nécessaires sont dis- Intelligence-2, pages 327–333, Vancouver, 1987.
ponibles ou déductibles. Le raisonnement déductif et in- North Holland.
complet sur les GBA est capable de maîtriser une forme [5] Goossens, D.: Boolean reasoning with graphs
simple de compréhension abstraite, localement au micro- of partitions. https://hal.inria.fr/
univers choisi. Un petit nombre de contraintes booléennes inria-00508299/file/GP.pdf, version longue
rend compte d’un grand nombre d’évidences implicites. du papier court ”A Dynamic Boolean Knowledge
Cette compréhension n’est pas prise en charge par les sys- Base” (ICTAI 2010), 2010.
tèmes de question-réponse actuels, orientés vers les ques-
[6] Kay, M: Algorithm schemata and data structures in
tions factuelles et les grands volumes de données.
syntactic processing. Dans Grosz, B. J. et al. (ré-
Les avantages du formalisme des GBA se situent dans
dacteur): Readings in Natural Language Processing,
sa façon de gérer les ordres partiels et assurer ainsi des
pages 35–70. Morgan Kaufmann Publishers Inc., San
fonctions cruciales, comme l’inter-classification, par la dé-
Francisco, CA, USA, 1986.
duction d’implications, des concepts définis, ou la recon-
naissance d’expressions existantes. On pourrait dire que [7] Papalaskaris, M.A. et L.K. Schubert: Parts inference:
si le système de question-réponse réussit quelque chose, Closed and semi-closed partitioning graphs. Dans
c’est juste parce qu’il range bien ses affaires. Un dilemme Proceedings of the 7th IJCAI, pages 304–309, Van-
sous-jacent est celui-ci : faut-il ranger les expressions boo- couver, 1981.
léennes explicitement, c’est-à-dire structurer la base de [8] Stone, M. H.: The representation of boolean algebras.
connaissances, ou ne privilégier aucun format de la base Bull. Amer. Math. Soc., 44:807–816, 1938.
et s’en remettre à un test de satisfiabilité booléen complet [9] Winograd, T.: Understanding Natural Language.
et efficace ? Il serait intéressant d’appliquer d’autres forma- Academic Press, 1972.
lismes à ce micro-univers des quadrilatères.
Il faut également distinguer la compréhension ainsi illus- [10] Wu, Wen Tsü: Automatic geometry theorem-proving
trée sur les quadrilatères, des méthodes de résolution de and automatic geometry problem-solving. Dans Auto-
problèmes en géométrie, telles que [10]. Ces méthodes mated Deduction in Geometry, pages 1–13. Springer
démontrent des théorèmes ou résolvent des problèmes, Berlin Heidelberg, 1999.
possiblement très difficiles, hors de portée de l’intuition. [11] Zang, Liang Jun et al.: A survey of commonsense
La compréhension illustrée ici ne se limite pas à véri- knowledge acquisition. Journal of Computer Science
fier un théorème ou chercher une solution qui satisfait des and Technology, 28(4):689–719, 2013.
contraintes. Elle constitue une sorte de navigation maîtrisée
dans la connaissance.
La restriction à la connaissance booléenne ne permet A Le dictionnaire utilisé
pas pour le moment d’espérer atteindre l’objectif à long
terme, qui est de traiter adéquatement toutes les phrases Voici le dictionnaire de 30 mots, utilisés dans les phrases
exprimables à partir d’un dictionnaire limité des mots d’un soumises au programme, auxquels s’ajoutent les mots
micro-univers quelconque à portée d’intuition humaine. Il définis pendant l’interaction (sortes de quadrilatères) et
s’agit maintenant de chercher à généraliser les techniques leurs accords en genre et en nombre :
de représentation et de raisonnement des GBA, à des lo-
giques d’ordre supérieur. que, qu, est-ce, quel, combien,
est, a, a-t-il, qui, avec, à, de, et, ou, n, pas,
un, deux, trois, quatre, deux-fois-deux,
Références droit, égaux, adjacents, opposés, isocèle, parallèles,
côté, angle, quadrilatère
[1] Baader, F. (rédacteur): The Description Logic Hand-

Vous aimerez peut-être aussi