Vous êtes sur la page 1sur 30

Les informations incompltes dans les

bases de donnes et en intelligence


artificielle
1

Patrick Bosc Laurence Cholvy Didier Dubois Nourredine


3
1
4
3
Mouaddib Olivier Pivert Henri Prade Guillaume Raschia
5
Marie-Christine Rousset

1. IRISA/ENSSAT, Technopole ANTICIPA, BP 447, 22305


Lannion Cedex, {bosc, pivert}@enssat.fr
2. ONERA-Toulouse, 2 avenue Edouard Belin, 31055 Toulouse,
Laurence.Cholvy@cert.fr
3. IRIN, Ecole Polytechnique de lUniversit de Nantes,
{mouaddib, raschia}@irin.univ-nantes.fr
4. IRIT, Univ. Paul Sabatier, 118 route de Narbonne, 31062
Toulouse Cedex 4, {dubois, prade}@irit.fr
5. LRI, Universit de Paris-Sud, 91405 Orsay cedex, MarieChristine.Rousset@lri.fr
Rsum Larticle discute les principaux problmes que
soulve la prise en compte dinformations incompltes, et
prsente les approches qui ont t dveloppes en bases de
donnes et en intelligence artificielle. Il fait une place
importante des ides proposes rcemment : prise en compte
dinformations de compltude et de validit, interrogation
portant explicitement sur le caractre incomplet de
linformation, modlisation bipolaire de linformation, gestion
de vues incompltes, notamment. Il traite enfin de la
gnration dinformations synthtiques.

1 INTRODUCTION
Les bases dinformations (bases de donnes, bases de connaissances
etc) sont des systmes utiliss pour reprsenter les croyances et

Actes des deuximes assises nationales du GdR I3

connaissances que lon peut avoir sur le monde rel ou tout au moins, sur
une partie du monde rel. Cette reprsentation doit tre la plus fidle
possible afin que la seule interrogation de ce systme permette son
utilisateur de se faire une ide la plus exacte possible et de prendre des
dcisions adquates. Par exemple, si lon utilise une base de donnes
dans une bibliothque pour enregistrer les livres emprunts, il est
souhaitable que la base contienne les informations prcises sur les livres
emprunts (nom de la personne qui a emprunt le livre, date demprunt
etc.) si lon doit envoyer une lettre de rappel aux personnes qui nont pas
rendu les livres emprunts dans les dlais autoriss.
Souvent, la reprsentation du monde rel quest la base, est
incomplte. Par exemple, on a pu (parce quon a oubli ou parce quon ne
le connat pas) ne pas enregistrer le prnom de lemprunteur dun livre, ou
bien le jour de lemprunt. On parle alors de bases incompltes.
Lincompltude dans les bases dinformations est le sujet central de cet
article. Avant de voir comment ce problme se dcline en bases de
donnes et en intelligence artificielle, essayons den donner une dfinition
informelle au travers dexemples.
De manire informelle, et classique, on dit quune base est incomplte
lorsquil existe des noncs pour lesquels on peut tablir, partir de la
base, ni quils sont vrais, ni quils sont faux, ou autrement dit quil
existe des questions, auxquelles on ne peut rpondre ni par oui ni par non
en exploitant linformation contenue dans la base. Par exemple, de la
seule information Jean est le fils de Paul, on ne peut videmment
rpondre ni positivement ni ngativement la question Est-ce que Pierre
est galement le fils de Paul ? De la seule information Jean a un pre, on
ne peut pas dterminer la valeur de vrit de la proposition Pierre est le
pre de Jean, et donc, la question Est-ce que Pierre est le pre de
Jean ?, on ne rpondra ni oui ni non. De mme, de la seule information
Jean a entre 20 et 30 ans, on ne peut pas dire avec prcision quel ge a
Jean. Ainsi, on ne peut rpondre la question Est-ce que Jean a 26 ans ?
Tous les exemples prcdents traitent dinformations prcises et
certaines. Mais on peut se trouver galement face des questions
auxquelles on nest pas en mesure de rpondre par vrai ou faux, de
manire certaine, car on ne dispose que dinformations incertaines ou
vagues. Par exemple, de la seule information Jean a peut-tre travaill en
automatique de 1975 1980, il est impossible de rpondre de manire
certaine Est-ce que Jean travaillait en automatique en 1978 ?
Mme en cas dinformation prcise et certaine, on peut rencontrer
dautres difficults. Ainsi, de la seule information Jean a 25 ans, il est

Informations incompltes

impossible de rpondre par vrai ou par faux la question Jean est-il


jeune ?, la notion de jeune tant suppose ici tre une proprit graduelle.
Ce dernier exemple indique que la dfinition informelle admise plus haut
doit tre amende de la manire suivante : on dit quune base est
incomplte lorsquil existe des noncs, auxquels on ne peut assigner un
degr de vrit prcis en exploitant linformation contenue dans la base (et
la dfinition des proprits graduelles figurant dans lnonc).
En ce qui concerne les bases de donnes, des conventions pour limiter,
voire liminer, lincompltude sont couramment adoptes. La premire de
ces conventions est la CWA (Closed World Assumption) ou Hypothse
du Monde Ferm . Son effet principal est de donner implicitement la
valeur de vrit FAUX toute information qui nest pas drivable de la
base (c.--d., toute information dont on ne peut pas dire partir de la
base quelle est vraie) pourvu que cela ne rentre pas en contradiction avec
les informations de la base. Nous verrons que, dans le cas o la base de
donnes contient des faits atomiques ou des faits disjonctifs, cette
hypothse sexprime par la donne daxiomes dits de compltion associs
chacune des relations de la base. Par exemple, si lon fait la CWA sur la
base qui ne contient que Jean est le fils de Paul, alors on rpondra
ngativement la question Est-ce que Pierre est le fils de Paul ?
(puisque linformation Pierre est le fils de Paul manque).
Le deuxime outil que lon peut exploiter pour complter une base,
tout au moins partiellement, est la prise en compte dune proprit de la
base, si on la connat, qui est sa compltude vis--vis du monde rel et
relativement certaines informations. Considrons par exemple, une base
qui stocke des informations sur tous les vols au dpart de Toulouse. On
peut savoir que, en ce qui concerne les vols dAir France, cette base est
complte. Cela signifie que toutes les informations (relatives aux attributs
considrs dans la base), sur les vols dAir France au dpart de Toulouse,
sont bien stockes dans la base. En consquence, on saura rpondre
positivement ou ngativement toute question relative un vol dAir
France partant de Toulouse. Par contre, on ne saura peut tre pas rpondre
ni positivement, ni ngativement certaines questions relatives aux vols
de British Airways.
Cet article est organis comme suit. La section 2 traitera le problme
de lincompltude dans les bases de donnes (bases de donnes avec faits
disjonctifs, bases sans CWA, bases de donnes avec informations floues,
bases distinguant entre des informations non-impossibles et des
informations garanties possibles). La section 3 traite de lincompltude
dans le cadre de lintgration de bases de donnes multiples. La section 4
sera consacre aux problmes poss par le traitement de lincompltude

Actes des deuximes assises nationales du GdR I3

dans le raisonnement. Aprs ces trois sections consacres des questions


dinfrence partir dinformations incompltes, la section 5 discute la
problmatique du rsum de donnes comme un processus de production
dinformations incompltes, mais synthtiques, et donc plus facilement
communicables des utilisateurs.
Cet article utilise principalement deux cadres reprsentationnels, celui
de la logique classique, et celui de la thorie des possibilits (ou celui de
sa contrepartie logique, qui gnralise la logique classique en associant
des niveaux de certitude aux formules). Dautres cadres de reprsentation
de lincertitude, tels que celui des probabilits, ne seront pas considrs
afin de restreindre lampleur de lexpos.

2 INCOMPLETUDE DANS LES BASES DE DONNEES


Cette section est organise en deux grands volets correspondant
respectivement au cas o les donnes de la base reprsentent des
informations certaines et prcises, et au cas o ces donnes peuvent tre
imprcises ou incertaines.

2.1 Informations certaines et prcises


On prsente dans la suite, de faon non exhaustive, des approches la
notion dinformations incompltes dans les bases de donnes
relationnelles. Les informations reprsentes dans ces bases tant certaines
et prcises, loutil de formalisation adopt est ici la logique classique,
dont nous rappelons quelques notions.

2.1.1 Rappels
Thorie complte. Soit L un langage du premier ordre. Soit T, une
thorie de L, cest--dire un ensemble de formules de L. T est dite
complte si et seulement si f T | f ou T | f.
Modle de Herbrand dun ensemble de clauses. Soit S un ensemble de
clauses. Lunivers de Herbrand de S est lensemble de tous les termes que
lon peut construire partir des symboles de constantes et des symboles
de fonction apparaissant dans S. Une interprtation de Herbrand est une
interprtation dont le domaine dinterprtation est lunivers de Herbrand.
Un modle de Herbrand de S est une interprtation de Herbrand qui
satisfait les clauses de S.

Informations incompltes

Relation entre thorie complte et modles de Herbrand. Soit T un


ensemble non contradictoire de formules dun langage L. Notons cl(T)
lensemble des clauses obtenu partir de T aprs mise sous forme
clausale et notons cl(L) le langage dont les symboles apparaissent dans
cl(T). On remarquera que, du fait de lintroduction ventuelle de
constantes de Skolem et de fonctions de Skolem, cl(L) nest en gnral,
pas identique L. T est complte si et seulement cl(T) a un unique
modle de Herbrand.

2.1.2 Bases de donnes compltes


Les bases de donnes relationnelles classiques sont des ensembles
de tables, une table tant un ensemble de n-uplets de valeurs, chacune des
ces valeurs appartenant des domaines de valeurs bien dfinis et
ventuellement restreintes par des contraintes dintgrit (clefs,
dpendances). Reiter (1983) a montr que toute base de donnes
relationnelles classique pouvait tre modlise, en logique, selon
deux approches respectivement appeles approche thorie de la preuve
et approche thorie des modles . Toutes deux supposent donns un
langage du premier ordre, un ensemble de formules de ce langage
exprimant le schma de la base. Elles diffrent sur la faon de reprsenter
ltat de la base. Dans lapproche thorie de la preuve ltat de la base
est reprsent par un ensemble de formules, alors que dans lapproche
thorie des modles ltat est reprsent par une interprtation de
Herbrand.
Exemple. Considrons une base de donnes dont lunique relation est
la relation binaire Employ. Cette relation est utilise pour relier des
personnes et les dpartements auxquels elles sont rattaches. Supposons
pour simplifier, quil ny ait pas de contrainte particulire (en particulier,
nous omettons les contraintes qui imposent que les valeurs dattributs
appartiennent certains domaines). Enfin, supposons que ltat courant de
cette base soit tel que la relation ne contienne que les deux couples (Jean,
informatique) et (Paul, maths). Daprs les dfinitions de Reiter, cette
base de donnes peut tre modlise en logique, par :
- La donne dun langage du premier ordre : les symboles de prdicats
tant ici les prdicats binaires Employ et lgalit, =, et les symboles de
constantes, ici Jean, Paul,, Pierre, informatique,, maths.
- Un ensemble de formules de ce langage, exprimant que deux
symboles diffrents reprsentent deux individus diffrents. Ces formules,
appeles axiomes dunicit des noms, sont ici : (Jean = Paul), (Jean
= Pierre), (informatique = maths),

Actes des deuximes assises nationales du GdR I3

- Un ensemble de formules de ce langage, numrant la liste des


individus du domaine. Cette formule, appele axiome de fermeture du
domaine est ici :x (x = Jean) (x = Pierre) (x = informatique)
(x = maths).
Si lon se place dans lapproche thorie de la preuve, on considre
lensemble des formules atomiques instancies qui expriment le contenu
des tables ainsi que des formules appeles axiomes de compltion. Ces
axiomes sont indispensables sous lhypothse du monde ferm selon
laquelle sont considres comme vraies les informations reprsentes par
les tuples des relations, et uniquement celles-ci. Lensemble qui modlise
ltat de la base selon lapproche thorie de la preuve est donc ici :
{Employ(Jean, informatique), Employ(Paul, maths), x y Employ(x,
y) ((x = Jean) (y = informatique)) ((x = Paul) (y = maths)) }
Notons BDR lensemble constitu des axiomes dunicit des noms, de
laxiome de fermeture du domaine et de lensemble de formules qui
reprsentent ltat, y compris les axiomes de compltion. On peut
montrer que lensemble des clauses associ BDR a un unique modle (
un isomorphisme prs sur les domaines dinterprtations) et donc un
unique modle de Herbrand . BDR est donc une thorie complte.
Si lon se place dans lapproche thorie des modles , ltat de la
base pourrait tre reprsent par nimporte lequel des modles de BDR,
mais il est courant de la reprsenter par lunique modle de Herbrand de
lensemble des clauses associ BDR, cest--dire, par le modle qui
interprte tout symbole de constante par lui-mme, qui interprte le
prdicat dgalit par tout couple (a, a) o a est un symbole de constante,
et qui ici, interprte le prdicat Employ par lensemble {(Jean,
informatique), (Paul, maths)}.

2.1.3 Prise en compte de valeurs nulles, de faits disjonctifs


Les notions de valeurs nulles, valeurs nulles marques, ou tuples
conditionnels, faits disjonctifs (Codd 1979, Reiter 1983, Imielinski,
Lipski, 1984) ont t introduites successivement dans les bases de
donnes pour reprsenter, avec un pouvoir dexpression de plus en plus
grand, un certain type dincertitude quant la valeur de certaines valeurs
dattributs. Il sagit de pouvoir exprimer quune valeur existe, mais quon
ne la connat pas (on ne la connat pas et on ne sait rien sur elle, ou bien
on ne la connat pas mais on sait quelle est contrainte de telle ou telle
faon) ou bien le fait que telle valeur appartient telle liste de valeurs

Informations incompltes

En terme de modlisation selon lapproche thorie de la preuve ,


ltat de la base nest plus reprsent par des formules atomiques
instancies, mais par des formules dont certaines sont des disjonctions ou
sont exprimes laide de quantificateurs existentiels. Comme de telles
bases adoptent toujours lhypothse du monde ferm, il faut noter que les
axiomes de compltion doivent tre modifis (Minker, 1982), (Reiter,
1984). En terme de modlisation selon lapproche thorie des
modles , une telle base de donnes ne peut plus tre associe une
unique interprtation de Herbrand mais plusieurs. Elle est donc
incomplte.
Exemple. Reprenons la base de donnes prcdente. Cette fois, on sait
que Jean et Paul sont deux employs. On ne connat pas le dpartement
de rattachement de Jean, ni celui de Paul mais on sait que celui-ci ci nest
pas le dpartement dinformatique. Les valeurs nulles marques avec
tuples conditionnels permettent de reprsenter ces informations en
stockant dans la relation Employ, le couple (Jean, ) sans condition, et
le couple (Paul, ) avec la condition ( informatique). Ici, et sont
des nouveaux symboles constantes.
Selon lapproche thorie de la preuve , les informations sont
reprsents par les formules
{ x Employ(Jean, x), x Employ(Paul, x) (x = informatique)}
Supposons quil existe une contrainte qui exprime que les seuls
dpartements sont informatique, automatique et maths. Alors, cet
ensemble est quivalent : {Employ(Jean, informatique)
Employ(jean, automatique) Employ(Jean, maths), Employ(Paul
automatique) Employ(Paul, maths)}.
Sous lhypothse du monde ferm, il convient de considrer laxiome
de compltion : x y Employ(x, y) ((x = Jean) ((y =
informatique) (y = automatique) (y = maths)) ((x = Paul) ((y =
automatique) (y = maths)), ce qui permettra de conclure que Paul est
peut-tre employ au dpartement de maths, mais nest certainement pas
employ en informatique.
Selon lapproche thorie des modles , les interprtations de
Herbrand qui reprsentent cette base sont toutes les interprtations de
Herbrand qui contiennent (outre les couples (a, a) o a est nimporte quel
symbole de constante) :
{Employ(Jean, informatique), Employ(Paul, automatique)} ou
{Employ(Jean, informatique), Employ(Paul, maths)} ou
{Employ(Jean, automatique), Employ(Paul, automatique)} ou

Actes des deuximes assises nationales du GdR I3


{Employ(Jean, automatique), Employ(Paul, maths)} ou
{Employ(Jean, maths), Employ(Paul, automatique)} ou
{Employ(Jean, maths), Employ(Paul, maths)}.

2.1.4 Formules quelconques et hypothse du monde ouvert


Nous avons vu, dans la section 2.1.2, que les bases de donnes
classiques taient compltes du fait du type des informations quelles
stockent (faits instancis) et parce quelles font lhypothse du monde
ferm. Etendre le type des informations stockes tout en faisant
lhypothse du monde ferm peut conduire des bases incompltes. Nous
lavons vu dans la section 2.1.3. De mme, relcher lhypothse du
monde ferm (on dit alors que lon fait lhypothse du monde ouvert)
conduit aussi des bases incompltes.
Exemple. Considrons que lon sache que Jean est voisin de Paul ou
de Pierre et que lon sache que Pierre nest pas voisin de Paul. Ces
informations ne peuvent pas tre stockes dans une base de donnes
classique ni une base de donnes avec valeurs nulles. Mais elles
peuvent tre reprsentes par lensemble de formules logiques :
BD = {Voisin(Jean, Paul) Voisin(Jean, Pierre), Voisin(Pierre, Paul)}
Toutes les interprtations de Herbrand qui contiennent {Voisin(Jean,
Paul), Voisin(Pierre, Paul) } ou {Voisin(Jean, Pierre), Voisin(Pierre,
Paul)} sont des modles de Herbrand de BD.
Soit BD un ensemble de formules quelconques. Notons Mod(BD)
lensemble des modles de BD. Considrons une formule ferme Q qui
reprsente une question ferme. Rpondre Q dans BD revient vrifier
la satisfaisabilit de Q dans tous les lments de Mod(BD), ou ce qui est
quivalent dun point de vue thorique, revient faire une preuve dans
BD. Plus formellement, soit BD est un ensemble de formules. Si Q une
question ferme, la rponse Q est
OUI ssi M Mod(BD) M |=Q c.--d. | BD Q,
NON ssi M Mod(BD) M |=Q c.--d. | BD Q,
PEUT-ETRE sinon.
Une rponse OUI signifie que de faon certaine, Q est vraie. Une
rponse NON signifie que de faon certaine, Q est fausse. Notons que
puisque BD peut tre incomplte, la rponse une question Q pourra tre
ni OUI ni NON, mais une troisime valeur, note ici PEUT-ETRE et qui
reprsente lincertitude que lon a. Q sera alors considre comme
possiblement vraie.

Informations incompltes

Si Q(X) est une formule ouverte modlisant une question ouverte, la


rponse sera { A, n-uplets de symboles de constantes tels que : M
Mod(BD) M |= Q(A)}, c.--d. {A : n-uplets de symboles de constantes
tels que : | BD Q(A)}.
Exemple. Soit BD = { Employ(Jean, informatique) ProfesseurENSAE(Jean), x y Employ(x,y) cotise(x), x Professeur-ENSAE(x)
cotise(x) }.
Les informations contenues dans cette base expriment que Jean est
employ au dpartement informatique ou Jean est professeur lENSAE.
Les employs cotisent la Scurit Sociale, et les professeurs de
lENSAE aussi. Soit la question Est-ce que Jean est rattach au
dpartement informatique ?. On na ni | BD Employ(Jean,
informatique), ni | BD Employ(Jean, informatique). Donc la
rponse sera PEUT-ETRE, ce qui signifie que lon ne sait pas si Jean est
rattach au dpartement informatique. Soit la question Est-ce Jean cotise
la Scurit Sociale ?. On a | BD cotise(Jean). Donc la rponse sera
OUI, ce qui signifie que, mme si lon ne sait pas o exactement Jean
travaille, on sait avec certitude quil cotise la Scurit Sociale.
Cet exemple montre que, mme avec des informations incompltes, on
peut rpondre des questions avec certitude, le problme tant de trouver
un algorithme qui ralise ce calcul. Un de ces algorithmes a t dcrit par
Bauval et Cholvy (1991), o tendant les travaux de Stickel (1984) et de
Lozinski (1988), les auteurs prsentent un dmonstrateur de thormes,
dfini comme un mta interprteur de PROLOG, qui permet de faire des
preuves dans un ensemble de clauses quelconques. Ainsi, sur lexemple
prcdent, ce dmonstrateur de thormes permettra de rpondre
positivement la question : Est-ce que Jean cotise la scurit sociale ?
Ce dmonstrateur permet galement de fournir Jean comme unique
rponse la question ouverte : Qui cotise la scurit sociale ?
Cependant, il donnera la rponse PEUT-ETRE la question : Est-ce que
Jean est professeur lENSAE ?
Demolombe (1992) sest intress au calcul des rponses
conditionnelles. La rponse conditionnelle la question Q(X) est un
ensemble de formules instancies de la forme : Q(A) Cond(A,B), o
Cond(A,B) reprsente linformation quil manque pour dduire Q(A).
Lapplication de ce travail pour la question Est-ce que Jean est professeur
lENSAE ? donne la rponse conditionnelle : Professeur-ENSAE(Jean)
Employ(Jean, informatique), ce qui exprime que, si Jean nest pas
employ en informatique, alors il est professeur lENSAE.

10

Actes des deuximes assises nationales du GdR I3

Enfin, mme dans le cas o lon ne fait pas lhypothse du monde


ferm, il peut tre intressant dexploiter, si on la connat, une proprit
de la base qui est sa compltude vis vis du monde rel. Motro (1989)
puis Demolombe (1997) ont tudi la possibilit de prendre en compte
cette proprit, pour rpondre aux questions. Par exemple, des
informations {Enseigne(Paul, informatique), Enseigne(Pierre, automatique)} et de la mta-information : la base est complte pour les
enseignants dinformatique, on peut conclure de faon certaine que Pierre
nenseigne pas en informatique (puisque tous les enseignants
dinformatique sont connus de la base et que la base ne connat, comme
enseignant en informatique, que Paul). Par contre, on ne sait toujours pas
dire si oui ou non Paul enseigne en automatique.
1.2 Bases de donnes floues
Considrons maintenant le cas du traitement des donnes imprcises,
c.--d. le cas o des variables (attributs de relations) prennent des valeurs
reprsentes par des ensembles de candidats dont lun est cens tre sa
valeur exacte. Plus prcisment, nous nous focalisons sur le
formalisme des possibilits (pour sa compatibilit avec la problmatique
des requtes flexibles), mme si plusieurs des aspects que nous traitons
ici pourraient sadapter assez directement dautres formalismes
(probabilits, OR-sets par exemple).
Dans le cadre des bases de donnes, des valeurs imprcises peuvent
apparatre dans de nombreuses situations. On peut citer la constitution
dentrepts de donnes ou plus gnralement la fusion de donnes dont
les sources plus ou moins fiables apportent des informations non
identiques, de bases contenant des donnes obtenues par des mcanismes
de reconnaissance automatique dlivrant des rsultats intrinsquement
imprcis (reconnaissance dimages ou dobjets). On peut raisonnablement
penser que dans le futur de plus en plus dapplications vont recourir
lutilisation de donnes imprcisment connues. Cette situation
impliquera alors le stockage et la manipulation (en particulier
interrogation) de telles informations dans des bases de donnes et donc
lextension des systmes de gestion de bases de donnes afin quils
offrent ce genre de fonctionnalits. Les travaux des annes 80, la suite
de (Codd, 1979), sur les valeurs nulles ont montr quon ne pouvait
esprer tendre lensemble de lalgbre relationnelle ce type de bases (en
effet, les valeurs imprcises peuvent tre vues comme des raffinements
des valeurs nulles).

Informations incompltes

11

1.2.1 Informations imprcises et floues


Une base de donnes relationnelle possibiliste diffre dune base
usuelle en ce sens que certaines valeurs dattributs peuvent tre
imprcisment connues et reprsentes par une distribution de possibilit.
Une telle base peut sinterprter comme un ensemble de bases usuelles
(aussi appeles mondes), obtenues en choisissant un candidat pour chaque
valeur dattribut mal connue. Un degr de possibilit est associ chacun
des mondes afin dvaluer la qualit de lhypothse considrant cette base
comme reprsentant la ralit.
Exemple. A la base ci-aprs:
#id

Dure (ans)

emploi

{1/5a+ 0.8/4a + 0.3/3a}

caissier

{1/8a + 0.5/9a}

{1/manager + 0.6/caissier}

{1/4a + 0.8/5a}

vendeur

2a

vendeur

peuvent tre associs 24 mondes plus ou moins possibles dont le monde:

#id

dure

emploi

5a

caissier

8a

caissier

5a

vendeur

2a

vendeur

qui est possible au niveau 0.6, soit min(1, 0.6, 0.8, 1).
Le contenu de la base peut aussi sexprimer sous la forme dun
ensemble de formules de la logique possibiliste (Dubois, Lang et Prade,
1994), de la forme (p, ) o p est une formule bien forme de la logique
classique et est une borne infrieure de la ncessit (ou certitude) de p,
c.--d. N(p) ; par exemple en ce qui concerne #id = 2, on a {(8a(2)
9a(2), 1), (8a(2), 0.5), (manager(2) caissier(2), 1), (manager(2), 0.4)},
en se souvenant que la ncessit dun vnement est gale 1 moins la
possibilit de lvnement contraire.

12

Actes des deuximes assises nationales du GdR I3

La question gnrique qui se pose alors est la suivante : quelles


questions peuvent tre adresses des bases de donnes possibilistes ?
Par ailleurs, le modle possibiliste prcdent est-il suffisamment riche (ou
puissant) pour ces questions ? Dans les annes 80, Prade et Testemale
(1984) ont propos une approche permettant doprer des slections et
projections sur une relation dont les n-uplets peuvent contenir des
donnes imprcises, lobjectif tant dvaluer leur adquation et donc, in
fine, de les comparer. Plus rcemment, Bosc, Duval et Pivert (2000) se
sont intress diverses approches dinterrogation de telles bases et ont
identifi trois types de requtes assez sensiblement diffrentes :
- famille de requtes algbriques (ou SQL) dont linterprtation (et
lvaluation) peut tre dfinie sans recourir explicitement la
manipulation dinterprtations (Bosc, Pivert 2002). Lide est de dfinir
un modle de donnes en enrichissant le modle relationnel possibiliste
de sorte quon sache conduire le calcul de la requte en garantissant que le
rsultat est quivalent celui quon aurait obtenu en explicitant les
mondes. Le modle retenu inclut des relations imbriques permettant de
reprsenter des distributions de possibilit sur plusieurs attributs. De
plus, il est noter quun sous-ensemble limit doprations est
compatible avec une telle approche, mais quon peut aller au-del de
simples slections, grce, notamment un oprateur de
jointure particulier bien que frquent, o lune des deux relations
joindre ne contient que des valeurs prcises et correspond lextension
dune fonction, par exemple des couples nom de voiture marque.
- nouvelles requtes du type dans quelle mesure est-il possible que le
n-uplet <v 1, , vp> (o vi est une valeur usuelle) apparaisse comme
rponse la requte usuelle Q ?. Ces requtes, appeles requtes
possibilistes, peuvent tre vues comme des extensions des questions
oui/non et sont assez diffrentes des prcdentes. Elles posent elles aussi
la double question de leur primtre (i.e., quels oprateurs peuvent
apparatre dans Q) et dune procdure dvaluation efficace tirant parti de
la connaissance de la rponse dsire (le n-uplet de valeurs <v 1, , vp>)
et ne ncessitant pas lexplicitation des mondes reprsents par la base
possibiliste. Des lments de rponse ces questions sont apports par
Bosc, Duval et Pivert (2001, 2002).
- requtes tirant parti de la connaissance nouvelle, savoir la
reprsentation des valeurs imprcisment connues (alors que dordinaire,
une valeur et sa description coincident). Lide est donc dintroduire de
nouveaux critres de comparaison, qui portent non pas sur les valeurs
(comme dans les deux axes prcdents), mais sur les reprsentations. De
tels critres peuvent apparatre notamment dans des slections ou des

Informations incompltes

13

jointures. Cette approche est illustre par les requtes : trouver les
maisons dont le prix (suppos estim et donc mal connu) comporte au
moins un intervalle de 10000 euros o toutes les valeurs sont totalement
prfres ou encore trouver des maisons dont le prix ressemble cher
(terme dont la description en termes de distribution de possibilit est
donne. Les constituants de base dun langage dinterrogation supportant
cette catgorie de requtes orientes reprsentation sont dtaills par Bosc
et Pivert (1999).
Des problmes restent en suspens. Il faudra notamment approfondir les
bases de ces travaux et les formaliser, dfinir des architectures de
systmes de gestion de bases de donnes supportant les donnes
imprcises, implmenter des prototypes et entreprendre des
exprimentations permettant dtudier les performances des solutions
proposes (en regard de celles obtenues avec des donnes prcises), et
enfin tendre les approches en considrant par exemple des requtes
graduelles et non pas seulement boolennes comme actuellement.
1.1.2 Validit et compltude incertaine
Le cadre de la logique possibiliste permet dassocier des niveaux de
certitude des informations sur la compltude et la validit du contenu de
la base. Soient M(x) et B(x) exprimant, respectivement, que linformation
stocke par le n-uplet x est vraie dans le monde, et figure dans la base.
Lensemble de formules suivantes o vali (x) et compi (x) dnote des
conditions de validit et de compltude (Dubois et Prade, 1997),
{(B(x) M(x), ), ((B(x) vali (x)) M(x), i )i=1,k , (M(x) B(x),
1), ((M(x) compi (x)) B(x), 1i )i=1,l }
exprime ainsi en logique possibiliste que i) pour tout n-uplet x figurant
dans la base, il est certain au moins au degr que son information est
vraie dans le monde, ii) si x est dans la base et satisfait la condition de
validit vali alors il est certain au degr i > que x est vrai (si i = 1,
la validit est compltement certaine), iii) si x nest pas dans B alors x
est faux dans le monde avec une certitude 1 (o est la possibilit que
linformation dans la base ne soit pas complte), iv) si x nest pas dans B
et que la condition de compltude compi sapplique x, alors il est
certain au degr 1i > 1 que x est faux. Par exemple, pour une base
rpertoriant des vols ariens, ((B(x) arriv(x, Paris)) M(x), 1)
exprimera que toute information dans la base sur un vol x arrivant Paris
est totalement valide, tandis que (M(x) comp(x, Air Zanzibar) B(x),
0.8) indiquera que linformation dans la base sur les vols de la compagnie
Air Zanzibar peut (au degr 0.2) ne pas tre complte (c.--d. quil peut

14

Actes des deuximes assises nationales du GdR I3

exister dans le monde dautres vols qui ne figurent pas dans la base). On
peut ainsi hirarchiser les informations de la base selon leur validit ou
leur caractre complet, et utiliser la logique possibiliste pour raisonner
partir du contenu de la base et de ces mta-informations.

1.1.3 Information bipolaire


Linformation incomplte peut sexprimer de manire naturellement
bipolaire dans certaines situations (Dubois, Hajek et Prade, 2000),
(Dubois, Prade et Smets, 2001). Par bipolaire , on entend que
linformation est pour partie ngative (certaines valeurs, certaines
interprtations sont impossibles), et pour partie positive (certaines
valeurs, certaines interprtations sont garanties possibles). En gnral, les
deux ensembles dlments impossibles et dlments garantis possibles
sont disjoints (condition de cohrence), et ne couvrent pas tout le
rfrentiel. En dautres termes, on distingue entre un sur-ensemble
dlments non impossibles (NI), et un sous-ensemble dlments
garantis possibles (GP). Cette situation se gnralise au cas dune paire de
fonctions caractristiques densembles flous (*, * ) telle que * * .
Lexemple de la table ci-aprs illustre cette ide. Le muse A est pour
sr ouvert de 2 4 heures, et certainement ferm la nuit (de 21h 8h),
son prix dentre ne peut tre infrieur 2
ni suprieur 8
(rglements des muses), la tranche de prix entre 4 et 5 est garantie
possible (ce sont des prix pratiqus). Linformation sur le muse B est de
mme nature, mais floue (e.g., il y a seulement un degr de non
impossibilit gal 0.8 que le muse soit ouvert entre 9h et 10h).
Observons aussi que les deux attributs sont de natures diffrentes Heures
douverture est un attribut multi-valu, tandis que Prix est mono-valu.
Aussi, les ensembles (flous) ont-ils dans le premier cas un caractre
conjonctif, et disjonctif dans le second cas. Lvaluation de requtes face
une telle base de donnes pose des problmes plus gnraux que dans le
cas de simples valeurs dattributs mal connues. La logique possibiliste
permet de manipuler la fois des formules de la forme (p, ) avec N(p)
qui expriment la non-impossibilit de p puisque p nest possible au
plus quau degr 1 (i.e., (p) = max{*() t.q. |=p} 1 ),
et des formules de la forme [p, ] qui signifient que toutes les
interprtations de p sont garanties possibles au degr , ce qui se traduit
par une contrainte de la forme (p) (o est une mesure de
possibilit garantie dfinie par (p) = min{* () t.q. |=p}). Voir
(Benferhat et col., 2002).

Informations incompltes

#id-muse

Heures douverture

Prix ( )

NI: [8, 20]

NI: [2, 8]

GP: [2, 4]

GP: [4, 5]

A
B

NI: {0.2/8 + 0.8/9 + 1/[10, 18] +


0.5/19 + 0.2/20}
GP: 1/[2, 4] + 0.5/5

15

NI:{0.2/0 + 0.8/1 +
1/[2,7] + 0.5/[ 8, 9]}
GP: 0.5/3 + 1/[4, 5]

VUES INCOMPLETES ET INTEGRATION DE

BASES MULTIPLES
Avec l'mergence de l'Internet et de l'Intranet, il est possible d'accder
aujourd'hui diffrentes bases de donnes distantes, autonomes et
htrognes, contenant pourtant des informations quil peut tre
intressant dintgrer pour une application donne. La construction de
mdiateurs (Wiederhold, 1992) au dessus de bases de donnes multiples
et htrognes a pour but de donner lillusion aux utilisateurs quils
interrogent un systme de gestion de donnes centralis et homogne en
leur offrant comme interface de requtes un schma global unique (appel
aussi schma mdiateur). Contrairement un systme de gestion de bases
de donnes classique, un mdiateur ne contient pas de donnes, qui
restent stockes dans les diffrentes bases de donnes existantes selon un
format et un schma propres chaque base de donnes, mais des
descriptions abstraites de ces donnes sous forme de vues. Les vues
dcrivent en fonction du schma mdiateur le contenu de chaque base de
donnes existante que lon souhaite intgrer via le mdiateur.
Formellement, une vue est une requte (i.e., une formule logique) dfinie
sur les relations du schma mdiateur et identifie par un nom.
Pour rpondre aux requtes des utilisateurs, qui sont exprimes en
termes des relations du schma mdiateur, le mdiateur ne dispose donc
pas des extensions des relations de la requte, mais seulement des
extensions des vues. Le problme du calcul des rponses aux requtes
poses un mdiateur est donc formellement quivalent au problme du
calcul des rponses partir dextensions de vues. Or, ce problme est plus
difficile que le problme de lvaluation standard dune requte pour
laquelle on connat de faon complte les extensions des relations
apparaissant dans la requte. En effet, les instances des relations de la
requte doivent tre infres partir des instances (ou extensions) de vues

16

Actes des deuximes assises nationales du GdR I3

et des dfinitions de ces vues. Mme dans des cas simples, on ne peut
infrer les instances des relations partir de la requte que de faon
incomplte, comme lillustre lexemple suivant.
Exemple. Considrons un schma mdiateur qui contient lunique
relation binaire Rservation qui relie une personne aux personnes pour qui
elle a fait une rservation. Considrons la requte Q(x,y) : Rservation(x,
y) demandant de trouver tous les couples de personnes (x,y) tels que la
personne x a fait une rservation pour la personne y. Supposons que
seules trois bases de donnes trs particulires soient disponibles pour
rpondre ce type de requte : BD1 ne peut fournir que des personnes qui
ont fait une rservation pour elles mmes et pour quelquun dautre. Le
contenu de cette base de donnes peut tre dcrit par la vue V1 dfinie
par : V1(x) : Rservation(x, x) ( y (y =x) Rservation(x, y)) ; BD2
ne peut fournir que des personnes qui ont fait des rservations. Le
contenu de cette base de donnes peut tre dcrit par la vue V2 dfinie
par : V2(x) : ( y Rservation(x, y ) ; BD3 ne peut fournir que des
personnes pour qui des rservations ont t faites. Le contenu de cette
base de donnes peut tre dcrit par la vue V3 dfinie par : V3(x) : ( y
Rservation(y, x)).
Supposons que les extensions de ces vues soient : V1(a), V2(a),
V2(b), V3(c). Elles permettent de dduire les extensions incompltes
suivantes de la relation
Rservation :
Rservation(a,
a),
Rservation(a, ?), Rservation(b, ?), Rservation( ?, c)
La seule rponse prcise que lon puisse fournir avec certitude la
requte Q est <a, a>. Les autres rponses prcises, comme par exemple
<a, c>, sont possibles mais incertaines.
Le problme majeur est le calcul de toutes les rponses prcises et
certaines. Une rponse est prcise si elle est totalement instancie. Une
rponse une requte est certaine si elle fait partie du rsultat de
lvaluation de la requte sur nimporte quelle extension des relations de
la requte compatible avec les extensions de vues et leurs dfinitions.
Dans le cadre de lintgration de sources de donnes par mdiateur, le
problme dvaluation de requtes, qui est dj en soi plus complexe que
lvaluation standard de requtes, comme nous venons de le souligner, est
rendu encore plus complexe du fait que les donnes correspondant aux
extensions des vues ne sont pas facilement disponibles. Le rapatriement
au niveau du mdiateur de ces donnes a un cot prohibitif car elles sont
stockes de faon rpartie dans des sources distantes, et donc daccs
coteux. Elles sont de plus souvent volutives ou volatiles. Cela rend
impossible de fonder le calcul des rponses certaines sur un raisonnement

Informations incompltes

17

sur les extensions des vues. Les seules ressources disponibles au niveau
du mdiateur sont les dfinitions des vues.
Le calcul des rponses ne peut alors se faire que par rcriture de la
requte en termes de vues. Cela consiste reformuler la requte initiale en
une union de requtes exprimes uniquement laide des noms des vues,
appeles rcritures de la requte en fonction des vues. Chacune de ces
rcritures est une requte qui, ne contenant que des noms de vues, peut
alors tre value de faon standard sur les extensions de ces vues. Mme
si lexcution concrte de ces plans de requtes ncessite des interfaces
logicielles (appeles adaptateur ou wrapper) entre le mdiateur et les
sources de donnes, dun point de vue conceptuel, les rcritures
reprsentent les plans de requtes qui permettent daller extraire dans les
diffrentes bases de donnes les lments de rponses utiles pour le calcul
des rponses certaines de la requte initiale. Si dans lidal, on vise
lobtention de rcritures qui soient quivalentes la requte initiale, cela
nest pas toujours possible et on se contente en gnral dobtenir des
rcritures (maximalement) subsumes par la requte initiale. Une
rcriture est subsume par la requte si, en remplaant dans le corps de la
rcriture, chaque vue par sa dfinition, on obtient une formule logique qui
implique logiquement le corps de la requte initiale. A cause de cette
proprit dimplication logique, une rcriture subsume par la requte
fournit des plans de requtes dont lexcution fournit des rponses qui
sont ncessairement des rponses pertinentes pour la requte initiale.
Le problme de rcriture de requtes en termes de vues consiste
dterminer sil est possible de calculer lensemble de toutes les rcritures
maximalement subsumes dune requte.
Exemple.
Considrons un schma mdiateur permettant de dfinir
des requtes sur les employs dune entreprise en utilisant les relations
suivantes : Employ (e : Personne, d : Dpartement), Phone(e : Personne,
p: NumTel), Bureau(e : Personne, b : NumBureau).
Considrons que les donnes sont stockes dans 2 bases de donnes
distinctes BD1 et BD2 dont le contenu est spcifi en fonction des
relations du schma mdiateur par les 2 vues dont les dfinitions sont:
V1(e, b, d ) : Bureau(e, b) Employ(e, d). BD1 fournit des informations
sur les employs, leurs numros de bureau et leurs dpartements ; V2(e,
p ) : Phone(e, p) Employ(e, jouet). BD2 fournit des informations sur
les numros de tlphone des employs du dpartement jouet.
Considrons la requte Q(p, b) :Phone(sally, p) Bureau(sally, b)
demandant les numros de tlphone et de bureau de Sally. La seule

18

Actes des deuximes assises nationales du GdR I3

rcriture que lon peut obtenir pour cette requte en fonction des vues V1
etV2 est : QV(p, b) : V2(sally, p) V1(sally, b, d).
Il est important de noter que lon na pas la garantie dobtenir de
rponses par excution du plan de requtes correspondant cette rcriture,
et ce pour plusieurs raisons. Tout dabord, si Sally ne fait pas partie du
dpartement jouet, le plan de requtes correspondant la rcriture ne
ramnera aucune rponse. Cela est d lincompltude des donnes
disponibles relativement au schma mdiateur, qui est exprime dans la
dfinition des vues : la vue V2 spcifie dans sa dfinition quelle ne peut
que fournir des informations sur le dpartement jouet (Employ(e, jouet)).
Une autre cause dincompltude est lie au fait, que sauf information
supplmentaire, on ne sait pas si les bases de donnes dont on spcifie le
contenu par la dfinition de vues, sont compltes relativement ces
dfinitions.
Une extension de vue est complte si on peut supposer quelle contient
bien toutes les rponses la requte quelle dfinit. Par exemple, poser
que lextension de la vue V2 de lexemple prcdent est complte cest
garantir que la base de donnes BD2 dont elle modlise le contenu
contient bien tous les numros de tlphones de tous les employs du
dpartement jouet. Cette hypothse est souvent trop forte en intgration
dinformations o lon ne peut que supposer la correction mais pas la
compltude dune extension de vue. Poser que lextension de la vue V2
est correcte (sans tre ncessairement complte) exprime que la base de
donnes BD2 contient bien des numros de tlphone demploys du
dpartement jouet mais pas ncessairement tous.
De nombreux travaux rcents (Beeri, Levy, et Rousset, 1997 ; Halevy
2001 ; Abiteboul et Duschka, 1998 ; Calvanese, De Giacomo, et
Lenzerini, 2000 ; Calvanese, De Giacomo, Lenzerini et Vardi, 2000 ;
Goasdou, 2001) ont t effectus sur la dcidabilit et la complexit des
problmes de rcriture de requtes en termes de vues, et dvaluation de
requtes partir dextensions de vues, en fonction des langages utiliss
pour exprimer respectivement les requtes, les vues et les rcritures, et des
hypothses faites sur les extensions de vues relativement leurs
dfinitions. En particulier, Abiteboul et Duschka (1998), Calvanese, De
Giacomo et Lenzerini (2000) montrent linfluence de lhypothse de la
compltude des extensions de vues relativement leurs dfinitions sur la
complexit du problme. Il a t montr par Abiteboul et Duschka (1998)
que sous lhypothse dextensions de vues correctes (non ncessairement
compltes), le problme de rpondre une requtes Datalog partir des
extensions de vues dfinies comme des requtes conjonctives est dans P,
alors que sous lhypothse dextensions compltes des vues, ce problme

Informations incompltes

19

est co-NP-complet. Si le langage de requtes et de vues est Datalog,


alors, dans les deux cas, le problme est indcidable. Calvanese, De
Giacomo, et Lenzerini (2000) ont tendu ce genre de rsultats des
langages de requtes et de vues faisant partie de la famille des logiques de
description.
Beeri, Levy, et Rousset (1997) et Goasdou (2001) ont tudi le
problme de rcriture de requtes en termes de vues, quand les langages
de requtes, de vues et de rcriture sont des langages de la famille CARIN
combinant Datalog et les logiques de description. Calvanese, De
Giacomo, Lenzerini, et Vardi (2000) ont montr que lvaluation dune
rcriture dune requte en termes de vues, mme si on peut montrer
quelle est quivalente la requte (et pas simplement subsume), ne
garantit pas dobtenir toutes les rponses que lon peut obtenir par
lvaluation de la requte partir des extensions de vues. Autrement dit,
on obtient une nouvelle cause possible de lincompltude des rponses,
principalement de aux limites du pouvoir dexpression du langage de
rcriture. Ainsi, il peut se faire quune rcriture dfinie dans un langage
plus expressif que le langage de rcritures impos pour modliser les
plans de requtes conduise lobtention de plus de rponses que
nimporte quelle rcriture dans le langage de rcriture considr.
Goasdou (2001) fournit une condition suffisante assez gnrale
garantissant lobtention par rcritures de toutes les rponses possibles
une requte partir dextensions de vues. Si la requte possde un
nombre fini de rcritures maximales dfinies dans le langage des requtes
conjonctives avec ingalit, alors le rsultat de lvaluation de la requte
sur les extensions des vues est gal lunion des rponses obtenues par
excution des plans de requtes correspondant aux rcritures maximales.
Cette condition a pour corollaire de garantir quun mdiateur pourra
calculer toutes les rponses en un temps polynomial en fonction de la
taille des donnes (mme sil est exponentiel en fonction de la taille de la
requte et de la dfinition de vues). Ces travaux ont t appliqus dans la
conception et limplmentation du mdiateur PICSEL (Goasdou et col.,
2000; Rousset et col., 2002) en liaison avec France Telecom R & D.

4 RAISONNEMENT EN PRESENCE DINFORMATIONS INCOMPLETES


Par raisonnement en prsence dinformations incompltes, on entend
ici essentiellement des formes de raisonnement qui cherchent dune

20

Actes des deuximes assises nationales du GdR I3

manire ou dune autre fournir des conclusions non-triviales, plausibles,


fussent-elles provisoires, que le raisonnement dductif classique
nautoriserait pas compte tenu dun manque dinformation. Cest--dire
quon ne sintressera pas ici la propagation dinformations imprcises
ou incertaines en raisonnement dductif, comme par exemple le ralise le
raisonnement approch qui opre par combinaisons et projections partir
de distributions de possibilit reprsentant ce type dinformation (B.
Bouchon-Meunier et col., 1999).
Lide de manque dinformation est aussi associe la prsence
potentielle dexceptions non-spcifies dans une rgle, et labsence de
rgles sappliquant une situation donne, comme on le verra ensuite.
Mentionnons pour mmoire quune autre faon de grer le manque
dinformation peut tre dautoriser des rponses conditionnelles (cf.
section 2.1.4). Le cadre de la logique possibiliste permet dtendre la
problmatique du raisonnement hypothtique des informations
incertaines, en exploitant le fait quune clause possibiliste (p q, )
peut scrire de manire quivalente (q, min(v(p), )), o v(p) [0, 1] est
la valeur de vrit de p, ce qui exprime que q est certain au degr
pourvu que p soit vrai. On examine cependant brivement le problme
pos par linformation bipolaire, tout dabord.

1.1 Bipolarit
Le raisonnement dductif partir dinformations bipolaires pose des
problmes originaux, puisque le raisonnement doit rester en accord avec
ce quexprime chaque type dinformations : caractre non-impossible, ou
caractre garanti possible, dun ensemble dinterprtations. Prenons
lexemple de rgles si X est Ai alors Y est Bi avec i = 1,n.
Supposons quelles expriment que les situations (X, Y) est (Ai , non Bi )
sont impossibles, elles pourront alors tre reprsentes de manire
disjonctive sous la forme non Ai ou Bi . Dans le cas de linformation X est
A, on conclura par combinaison et projection que Y est B, o
B = A i (Ai B i ) o B = A R signifie que B = {y t.q. x
A et (x,y) R} et i (Ai B i ) = {(x,y) t.q. i (x,y) (Ai (Bi )c )},
(Bi )c tant le complmentaire de B i . On peut vrifier quon a bien B = B i
si A = Ai . Ceci est en accord avec le principe de rsolution en logique
possibiliste ( a b, ), (a c, ) | (b c, min(, )).
Si les rgles si X est Ai alors Y est Bi expriment plutt que les
situations (X, Y) est (Ai , Bi ) sont garanties possibles, alors les rgles sont

Informations incompltes

21

reprsentes de manire conjonctive sous la forme Ai et Bi . Lensemble


des rgles sera reprsent par la disjonction i (Ai B i ). Considrons
nouveau linformation X est A exprimant toujours que toutes les valeurs
dans (A)c sont impossibles pour X. Alors les valeurs garanties possibles
pour Y compte tenu de lentre imprcise X est A sont maintenant
dfinies par B = {y t.q. x A et (x,y) i (Ai B i )}. On a bien en
particulier B = B i si A = Ai .
Prenons lexemple de la rgle R1 si un employ est en catgorie 1
alors son salaire (en ) est ncessairement dans lintervalle [1000,
2000], et typiquement dans lintervalle [1500, 1800], et de la rgle R2 si
un employ est en catgorie 2 alors son salaire (en ) est ncessairement
dans lintervalle [1500, 2500], et typiquement dans lintervalle [1700,
2000]. Les valeurs typiques sont ici les valeurs garanties possibles.
Considrons le cas dune personne dont on sait seulement quelle est en
catgorie 1 ou 2. En employant le premier schma B = A i (Ai
B i ), avec A = {cat.1, cat.2}, A1 = {cat.1}, A2 = {cat.2}, B 1 = [1000,
2000], B 2= [1500, 2500], on trouve B = B 1 B 2 = [1000, 2500], un
intervalle qui contient ncessairement le salaire de cette personne. Le
second permet de dterminer un ensemble de valeurs garanties possibles
pour son salaire: B = {y t.q. x A et (x,y) i (Ai B i )}, avec A
= {cat.1, cat.2}, A1 = {cat.1}, A2 = {cat.2}, B 1 = [1500, 1800], B 2 =
[1700, 2000], donne B = B 1 B 2= [1700, 1800], qui sont les seules
valeurs qui peuvent tre garanties possible ici compte tenu de
limprcision sur la catgorie de cette personne. Cette dernire conclusion
peut par exemple aider proposer un salaire pour une personne dans la
catgorie est mal dtermine.
Le cas gnral de rgles et dentres floues (o A, les Ai et les B i sont
des ensembles flous) est tudi dans (Dubois et col., 2002).

1.2 Raisonnement base de similarit


On peut tre aussi amen complter de linformation manquante par
un raisonnement interpolatif, ou par raisonnement par analogie, sur la
base de relations de similarit.
Lide du raisonnement interpolatif est que, disposant de deux rgles
si X est Ai alors Y est Bi et si X est Aj alors Y est Bj , et considrant la
situation o X est A avec linformation que A est la fois proche de Ai
et de Aj en un certain sens, alors la conclusion Y est B o B est proche
de B i et de B j . Voir par exemple (Bouchon-Meunier et col., 1999) pour
une discussion de ce problme.

22

Actes des deuximes assises nationales du GdR I3

Le raisonnement par analogie est en lui-mme un cas extrme, o


partir dinformations factuelles et dun principe gnral exprimant que
plus des situations sont similaires certains gards, plus il est possible
quelles le soient dautres, on extrapole des conclusions factuelles
plausibles (alors que linformation ncessaire un raisonnement dductif
manque absolument). De plus les situations rpertories peuvent tre
elles-mmes dcrites de manire imprcise, incomplte, ou incertaine;
voir (Dubois, Hllermeier et Prade, 2002) sur ce sujet.

1.3 Raisonnement non-monotone


Il sagit ici du raisonnement partir de rgles ayant des exceptions
potentielles : les oiseaux volent, les manchots ne volent pas, et
appliques des situations particulires incompltement dcrites (on sait
quon affaire un oiseau, sans savoir si cest un manchot ou non).
Une rgle si A alors B, ayant des exceptions potentielles peut tre
reprsente, de manire bipolaire, dune part par lensemble de ses
exemples, les interprtations de A B, et dautre part par lensemble de
ses contre-exemples, les interprtations de A B c (ce qui quivaut se
donner lensemble de ses non-contre-exemples, les interprtations de Ac
B ). Cest dire que la rgle est reprsente par la paire BA = (A
B, Ac B). BA est appel vnement conditionnel. Une rgle BA
entrane smantiquement () la rgle DC, si les exemples de la
premire sont des exemples de la seconde, et , si les contre-exemples de
la seconde sont des contre-exemples de la premire ; ce qui scrit
(BA) (DC) ssi A B |= C D et si Cc D |= A c B.
Il est noter que ces deux dernires conditions impliquent pour des
probabilits que Prob(DC) Prob(BA). La conjonction de deux rgles
est dfinie par (BA) & (DC) = ((Ac B) (Cc D))(A C), ce
qui exprime quun ensemble de rgles nest applicable que si au moins
une rgle lest, et qualors nous disposons de la conjonction des
implications matrielles correspondantes. Ceci permet de rsoudre certains
paradoxes de limplication matrielle A B = Ac B. Par exemple
elle satisfait lquivalence (A C) B (A B) (C B) qui
semble trange si on considre que A B modlise la rgle si A alors
B. On peut par contre vrifier que (BA) (BC) = B(A C), ce qui
correspond mieux lintuition, o dnote la disjonction des
vnements conditionnels, duale de &, et est dfinie par (BA) (DC)
= ((A B) (C D))(A C). On peut galement distinguer entre les
rgles si A alors B et si nonB alors nonA. En effet, elles nont pas les

Informations incompltes

23

mmes exemples, alors que leur reprsentations par implication matrielle


sont identiques, car ces rgles ont les mmes contre-exemples. Ce modle
de rgle permet enfin de formaliser le raisonnement non-monotone. En
effet, observons qualors que A B implique (A C) B en logique
classique, la rgle si A et C alors B a gnralement moins dexemples
que la rgle si A alors B, si bien que BA nentrane pas smantiquement
B(A C) ; aussi ny aura-t-il pas dincohrence avoir ventuellement
la fois dans la base BA et B c (A C) (e.g. voleoiseau, et
vole(oiseau manchot)). De fait, il a t tabli quune relation de
consquence non-monotone satisfaisant les postulats du systme dit
dinfrence prfrentielle de Kraus, Lehmann et Magidor (1990) pouvait
tre reprsente en termes dvnements conditionnels (Dubois et Prade,
1994). Voir (Benferhat et col., 2002) pour ltude dautres relations de
consquence non-monotone permettant dobtenir un ensemble plus grand
de conclusions plausibles.

5 INFORMATIONS GRADUELLES ET IMPRECISES


POUR LE RESUME DE DONNEES STRUCTUREES
La massification des banques de donnes introduit de nouvelles
difficults dans l'analyse, la comprhension et l'interprtation des
informations stockes sur supports numriques. Il est humainement
impossible d'apprhender de faon globale le contenu d'une banque de
donnes dont le volume dpasse les quelques Kilooctets, ce qui doit tre
mis en relief avec les bases de donnes actuelles dont l'ordre de grandeur
est le Giga voire le Teraoctet. Or, il parat essentiel dans un processus
dcisionnel, de possder une vision d'ensemble des donnes sur lesquelles
on travaille, afin d'identifier les orientations et les tendances qui vont
permettre de prendre les bonnes dcisions, en termes d'anticipation de
phnomnes ou de raction des transformations structurelles.
L'objectif gnral des approches du rsum linguistique consiste
fournir une description synthtique et intelligible de tout ou partie d'une
collection d'objets. Cet objectif est moins ambitieux que celui de la
fouille de donnes en gnral en ce que lon sait ds le dpart sur quels
attributs on cible le rsum. Par exemple, dans le cadre d'une tude
pidmiologique grande chelle sur une population d'individus, il
semble tout fait pertinent d'interprter le rsultat des mesures des
niveaux grossiers de granularit, et non au cas par cas. Il est ici crucial de
possder des indicateurs gnriques (ou sociaux) sur le comportement des
individus. Or, les donnes brutes manipules sont issues de mesures

24

Actes des deuximes assises nationales du GdR I3

ralises individuellement sur chacun des lments de la population. Il est


donc ncessaire d'offrir une vision gnrale de l'ensemble (ou partie de)
des rsultats de l'enqute pidmiologique, en construisant de faon
automatique des rsums partir des donnes de l'tude. De faon
analogue, les tudes de march et autres analyses marketing sont
consommatrices d'indicateurs gnriques sur les donnes collectes auprs
des clients, afin de rpercuter les enseignements de ces analyses sur la
stratgie commerciale des entreprises.
Dans le cadre des rsums linguistiques, il existe essentiellement trois
approches : les rsums propositionnels, les rsums base de rgles
floues, les rsums granularit variable (hirarchiques ou
multidimensionnels). Les points communs de toutes les approches du
rsum linguistique sont la manipulation de donnes structures,
l'exploitation de partitions floues des domaines d'attributs et la
description des rsums par des tiquettes linguistiques (dans un langage
proche de celui de l'utilisateur).

5.1 Les rsums propositionnels


Dans un langage de requtes ad hoc, l'utilisateur formule des rsums
potentiels quune mthode de validation permet ensuite de confirmer ou
de rejeter, au regard d'une base de donnes. Ces rsums peuvent utiliser
des prdicats et des quantificateurs flous, afin de faciliter linterface avec
lutilisateur. Un premier type de proposition quantifie considre
correspond l'nonc suivant : Q n-uplets de R sont a sur A o R
dsigne une relation, Q est un quantificateur flou, et a reprsente une
tiquette linguistique associe un sous-ensemble flou sur le domaine de
l'attribut A. La proposition quantifie est value l'aide d'un degr de
validit scalaire = Q((t R a(t.A)) / |R|), o a(t.A) est le degr
dappartenance de la valeur (t.A) lensemble flou a (Yager et Rubinson,
1981). Cela traduit la compatibilit de la proportion floue de n-uplets de
R qui satisfont la description par a avec le quantificateur reprsent par
le sous-ensemble flou Q. L'approche a t ensuite tendue la prise en
compte de rsums linguistiques conjonctifs et disjonctifs (Yager, 1991),
ainsi qu la formulation de rsums conditionnels, de telle sorte que
l'expression la plus gnrale des rsums linguistiques devient: Q nuplets de R tant a sur A ET b sur B sont aussi c sur C ET/OU d sur D.
Une extension de cette approche consiste utiliser des cardinalits
valeur floue. Ainsi Bosc, Dubois et col. (2002) proposent de rsumer la
relation R sous la forme dune nouvelle relation dont les n-uplets sont les

Informations incompltes

25

n-uplets de R rinterprts en termes dtiquettes floues, ensuite regroups


en n-uplets prsentant les mmes tiquettes. Pour chaque tiquette ou
groupe dtiquettes, des cardinalits sont calcules sous forme de nombres
flous. A partir de ces cardinalits sont calculs des degrs flous de
confiance qui rendent compte de la robustesse de lnonc, selon la
variabilit des acceptions des tiquettes floues utilises.

5.2 Les rsums en terme de rgles floues


Les approches base de rgles floues se distinguent selon que la
dmarche est constructive ou dclarative, et selon la nature des rgles
floues mises en uvre. Une dmarche constructive est caractrise par la
recherche de rgles floues partir des donnes. Bosc, Litard et Pivert
(1998) construisent ainsi des rsums linguistiques en termes de rgles
dites graduelles. Il sagit dnoncs de la forme Plus les n-uplets de R
sont a1,i1 sur A1 et a2,i2 sur A2 et et ak,ik sur Ak , plus ils sont ak+1,i(k+1)
sur Ak+1, o Aj , pour k+1j1, reprsente un attribut de R, et aj,ij est une
tiquette linguistique issue d'une partition floue {aj,1 ,,aj,p } construite
sur l'attribut Aj . De faon gnrale, les auteurs cherchent extraire de tels
rsums linguistiques, valides, en s'appuyant sur les proprits
d'augmentation, de dcomposition et d'union vrifies par des
dpendances fonctionnelles floues dfinies de faon analogue aux rgles
graduelles pures. Les rsums ainsi spcifis sont fortement orients et
conduisent ncessairement prciser un univers d'entre (la prmisse) et
de sortie (la conclusion).
D'autres approches, elles dclaratives, envisagent non pas la
construction de rgles floues, mais leur validation. Ces approches
utilisent aussi la notion de dpendances fonctionnelles floues. En
particulier, celle propose par Rasmussen et Yager (1999) sappuie sur
leurs travaux de 1997, o une dpendance fonctionnelle XY entre les
ensembles d'attributs X et Y peut tre satisfaite par les n-uplets t de la
relation R un degr . La dpendance fonctionnelle floue sur R ainsi
spcifie correspond au rsum linguistique nonc par la rgle Si deux nuplets de R ont des valeurs semblables sur X, alors ils ont aussi des
valeurs semblables sur Y. Ce qui conduit sintresser des dpendances
fonctionnelles graduelles se traduisant en des rsums de la forme Plus
les n-uplets de R sont x sur X, plus ils sont y sur Y avec X et Y des
ensembles d'attributs de R, et x, y des proprits graduelles
respectivement reprsentes sur X et Y par des tiquettes linguistiques
telles qu'g sur Age, ou Elev sur Revenu.

26

Actes des deuximes assises nationales du GdR I3

5.3 Les rsums granularit variable


Quelques approches du rsum linguistique proposent de gnrer des
rsums des niveaux d'abstraction variables. Le principe gnral de ces
travaux repose sur l'utilisation de hirarchies conceptuelles floues
permettant la gnralisation des descripteurs linguistiques. Deux
approches sensiblement diffrentes ont t proposes.
Dans le cadre gnral des bases de donnes multidimensionnelles et
des outils OLAP (pour On-Line Analytical Processing), l'approche
propose par Laurent (2001) s'attache fournir une description
linguistique des cellules d'un cube flou (un cube flou C est dfini sur un
ensemble d'attributs de la BD, qui reprsentent les dimensions du cube,
et dont les valeurs peuvent tre imprcises et/ou incertaines), et propose
une mthode de gnration de rsums, partir des BD
multidimensionnelles floues.
L'approche hirarchique de la gnration de rsums linguistiques,
propose par Raschia et Mouaddib (2002), construit un arbre de rsums
dcrits sur l'ensemble des attributs d'une relation R par des tiquettes
floues. Les rsums ainsi reprsents sont qualifis de polythtiques. Le
pouvoir de synthse des rsums est alors dtermin par le niveau auquel
il se situe dans la hirarchie de rsums. La gnration des rsums se
dcompose en 3 phases distinctes : la rcriture des n-uplets, la
construction incrmentale de la hirarchie par application d'un algorithme
de classification conceptuelle, et la gnralisation des descriptions de
rsums (induction par attribut). La forme gnrale du rsultat est une
collection de rsums linguistiques partiellement ordonns, du plus
gnrique (la racine de l'arbre) aux plus spcifiques (les feuilles), et dont
l'expression gnrale peut tre dfinie comme : Q objets de R sont xS sur
X o Q est un quantificateur flou, et xS reprsente un ensemble
d'tiquettes linguistiques associes chaque attribut X de la relation R.
Plus prcisment, un rsum z est dfini sur chaque attribut A de R par
un ensemble de triplets (v, d, c) o v est une tiquette linguistique, d
reprsente le degr de satisfaction de la description de z par v et c est un
degr de reprsentativit de v, utile pour dterminer le poids de chaque
descripteur relativement aux autres descripteurs de z sur A.
Les connaissances de domaine, qui prennent la forme de partitions
floues, de variables linguistiques et de thsaurus relationnels flous sont
utilises, l'tape de rcriture, pour uniformiser le formalisme de
reprsentation des valeurs d'attributs et pour offrir l'utilisateur un
vocabulaire descriptif proche du sien, et l'tape de gnralisation, afin de
proposer des descriptions synthtiques et abstraites des rsums sur

Informations incompltes

27

chaque attribut. De ce fait, il est possible de produire des rsums


linguistiques exploitant la structure hirarchique des rsums, et dfinis
de faon gnrale par l'expression : Q objets de R tant xS sur X et yS sur
Y sont en fait xS' sur X o les xS' sont tous des spcialisations
d'lments de xS.
Le rsultat des processus de rsum de donnes structures, dfini
l'aide de sous-ensembles flous tiquets, peut faire l'objet d'une
exploitation intressante, dans la mesure o l'on s'appuie sur des SGBD
flous (possibilistes) pour stocker les rsums, et que l'on dveloppe des
mthodes d'interrogation flexible et de navigation pour les rsums. Le
principe des requtes coopratives, permettant la relaxation ou le
renforcement des prdicats de requte en fonction de l'tat de la BD,
pourrait tre appliqu travers le prisme des rsums, de faon guider
l'utilisateur dans sa recherche, vers des points d'intrt mis en lumire par
la construction des rsums.

6 CONCLUSION
Les informations dont on peut disposer sont souvent incompltes,
imprcises ou manent de sources htrognes, la comptence et la
fiabilit variables (pensons lexemple du Web). Ceci ne doit
videmment pas tre un obstacle leur gestion par des systmes
dinformations avancs, ou leur exploitation par des systmes
dinfrence. Larticle sest efforc de prsenter dans ses sections 2, 3 et 4
les principaux problmes que soulve la prise en compte dinformations
incompltes, et les approches qui ont t dveloppes en bases de donnes
et en intelligence artificielle depuis plusieurs annes. Larticle a fait aussi
une place importante des ides proposes plus rcemment (prise en
compte dinformations de compltude et de validit, interrogation portant
explicitement sur le caractre incomplet de linformation, modlisation
bipolaire de linformation, gestion de vues incompltes). La dernire
section traite, quant elle, de la gnration dinformations synthtiques,
donc incompltes, rsumant pour un utilisateur linformation stocke.
Une autre problmatique, non considre dans cet article, mais
galement en relation avec lide de rendre incomplte linformation, est
celle de lanonymisation des informations qui doivent tre rendues
accessibles, tout en empchant que ces informations puissent tre
rassocies par infrence des items sensibles (qui doivent rester
confidentiels) , ou des personnes prives.

28

Actes des deuximes assises nationales du GdR I3

Le fait d'avoir plusieurs sources sur les mmes types d'informations


peut pallier lincompltude de linformation, dans la mesure o on sait
les intgrer ou les fusionner. Ce dernier sujet na pas t abord dans cet
article, mais est dvelopp par exemple dans Bloch et Hunter (2001).

7 RFRENCES
[1] S. Abiteboul, O. Duschka (1998) Complexity of answering queries using
materialized views. Proc. PODS.
[2] A. Bauval, L. Cholvy (1991) Automated Reasoning in case of
inconsistency. Proc. 1st World Conf. on Fundamentals in Artificial
Intelligence (WOCFAI).
[3] C. Beeri, A. Levy, M.-C. Rousset (1997) Rewriting queries using views
in description logics. Proc. PODS .
[4] S. Benferhat, D. Dubois, H. Prade (2002) The possibilistic handling of
irrelevance in exception-tolerant reasoning. Annals of Mathematics and
Artificial Intelligence, 35 , 11-28.
[5] S. Benferhat, D. Dubois, S. Kaci, H. Prade (2002) Bipolar representation
and fusion of preferences in the possibilistic logic framework. Proc. of
the 8 th Inter. Conf. on Principles of Knowledge Representation and
Reasoning, April 22-25, Toulouse, Morgan Kaufmann, 421-432.
[6] I. Bloch, A. Hunter (eds.) (2001) Special Issue on Data and Knowledge
Fusion. Inter. J. of Intelligent Systems, 16 (10-11), 1107-1320.
[7] P. Bosc, D. Dubois, O. Pivert, H. Prade, et M. de Calms (2002) Fuzzy
summarization of data using fuzzy cardinalities. Proc. of the 9th Int.
Conf. IPMU'2002, vol. 3, Annecy, 1553-1559.
[8] P. Bosc, L. Duval, O. Pivert (2000) Value-based and representation-based
querying of possibilistic databases. In Recent Issues of Fuzzy
Databases, (G. Bordogna and G. Pasi, eds), Physica Verlag, 3-27.
[9] P. Bosc, L. Duval, O. Pivert (2001) A first approach to possibilistic
queries against possibilistic databases. Proc. Joint Conference Int.
Fuzzy Syst. Assoc. /North American Fuzzy Inf. Proc . Soc.
(IFSA/NAFIPS'2001), Vancouver, 2452-245. Version tendue in Fuzzy
Sets and Systems, 2003
[10] P. Bosc, L. Duval, O. Pivert (2002) About selections and joins in
possibilistic queries addressed to possibilistic databases. Proc. 13th
Conf. on Database and Expert Systems Applications (DEXA02), 597606.
[11] P. Bosc, L. Litard, O. Pivert (1998) Extended functional dependencies
as a basis for linguistic summaries. Proc. 2 nd Eup. Symp. PKDD, (J.
Zytkow, M. Quafafou, eds.), Berlin, Springer-Verlag, LNAI 1510, 255263.

Informations incompltes

29

[12] P. Bosc, O. Pivert (2002) Vers un modle relationnel possibiliste un


niveau de relations imbriques. Actes 20 me Congrs Inforsid, Nantes,
73-88.
[13] P. Bosc, O. Pivert (1999) On the Specification of Representation-Based
Conditions in a Context of Incomplete Databases. In : Database and
Expert Syst. Conf. (DEXA'99), Springer-Verlag, LNCS 1677, 594-603.
[14] B. Bouchon-Meunier, D. Dubois, L. Godo, H. Prade (1999) Fuzzy sets and
possibility theory in approximate and plausible reasoning. In: Fuzzy
Sets in Approximate Reasoning and Information Systems, (J. Bezdek et
al., eds.), Kluwer, 15-190.
[15] D. Calvanese, G. De Giacomo, M. Lenzerini (2000) Answering Queries
Using Views in Description Logics. Proc. AAAI .
[16] D. Calvanese, G. De Giacomo, M. Lenzerini, M. Vardi (2000) Answering
Regular Path Queries Using Views. Proc. ICDE.
[17] E. F. Codd (1979) Extending the Data Relational Model to capture more
meaning. Transactions of ACM on Database Systems, 4(4).
[18] R. Demolombre (1992) A strategy for the computation of conditional
answers. Proc. 10th European Conf. on Artificial Intelligence (ECAI).
[19] R. Demolombe (1997) Answering queries about validity and
completeness of data: from modal logic to relational algebra. In. Flexible
Query Answering Systems, (T. Andreasen, H. Christiansen, H. Larsen,
eds.), Kluwer Acad. Publ. 209-225.
[20] D. Dubois, P. Hajek, H. Prade (2000) Knowledge-Driven versus datadriven logics. J. of Logic, Language, and Information, 9, 65-89.
[21] D. Dubois, E. Hllermeier, H. Prade (2002) Fuzzy set-based methods in
instance-based reasoning. IEEE Trans. on Fuzzy Systems, 10 , 322-332.
[22] D. Dubois, J. Lang, H. Prade (1994) Possibilistic logic. In: Handbook of
Logic in Artif. Intelligence and Logic Programming, Vol. 3 (D. Gabbay,
C.J. Hogger, J.A. Robinson, D. Nute, eds.), Oxford Univ. Press, 439-513.
[23] D. Dubois, H. Prade (1994) Conditional objects as non-monotonic
consequ-ence relationships. IEEE Trans. on Syst., Man & Cybern., 24,
1724-1740.
[24] D. Dubois, H. Prade (1997) Valid or complete information in databases A possibility theory-based analysis. In: Database and Experts Systems
Applications (Proc. of the 8th Inter. Conf. DEXA'97), (A. Hameurlain,
A.M. Tjoa, eds), Toulouse, Springer Verlag, LNCS 1308, Berlin, 603-612.
[25] D. Dubois, H. Prade, Ph. Smets (2001) Not impossible vs . guaranted
possible in fusion and revision. In : Symbolic and Quantitative
Approaches to Reasoning with Uncertainty, Proc. 6th. ESCQARU, Sept.
19-21, Toulouse, Springer-Verlag, LNAI 21 43, 522-531.
[26] D. Dubois, H. Prade, L. Ughetto (2002) A new perspective on reasoning
with fuzzy rules. Proc. AFSS Int. Conf. Fuzzy Syst., Advan. in Soft
Computing, Calcutta, N. Pal, M. Sugeno, eds., Springer, LNAI 2275, 1-11

30

Actes des deuximes assises nationales du GdR I3

[27] F. Goasdou (2001) Rcriture de requtes en termes de vues dans CARIN


et intgration dinformations. Thse Universit Paris-Sud, novembre.
[28] F. Goasdou, V. Latts, M-C. Rousset (2000) The use of CARIN language
and algorithms for information integration: the PICSEL system. Inter. J.
of Cooperative Information Systems, 9(4).
[29] Halevy (2001) Answering Queries Using Views: a Survey. VLDB Journal.
[30] T. Imielinski, W. Lipski (1984) Incomplete information in relational
databases. J. of ACM, 31 (4).
[31] E. Lozinski (1988) Compiling facts in non Horn deductive systems.
Proc. VLDB
[32] S. Kraus, D. Lehmann, M. Magidor (1990) Nonmonotonic reasoning,
preferential models and cumulative logics. Artif. Intellig., 44 , 167-207.
[33] A. Laurent (2001) Generating fuzzy summaries from fuzzy
multidimensional databases. Proc. of the 4th Int. Symposium on
Intelligent Data Analysis (IDA'01), Lisbon, Sept.13-15, Springer-Verlag,
LNCS 2189, 24-33.
[34] J. Minker (1982) On indefinite databases and the closed world
assumption. Spinger-Verlag, LNCS 138.
[35] A. Motro (1989) Integrity = validity + completeness, ACM TODS, 14(4).
[36] H. Prade, C. Testemale (1984) Generalizing database relational algebra
for the treatment of incomplete/uncertain information and vague
queries. Information Sciences, 34 , 115-143.
[37] G. Raschia, N. Mouaddib (2002) A fuzzy set-based approach to database
summarization. Fuzzy Sets and Systems, 129(2), 137-162.
[38] D. Rasmussen , R. R. Yager (1997) A fuzzy SQL summary language for
data discovery. In Fuzzy Information Engineering: A Guided Tour of
Applications, ( D. Dubois, H. Prade, R. Yager, eds.), John Wiley, 253-264.
[39] D. Rasmussen and R. R. Yager (1999) Finding fuzzy and gradual
functional dependencies with summary SQL. Fuzzy Sets and Systems,
106, 131-142.
[40] R. Reiter (1983) Towards a logical reconstruction of relational database
theory. In On Conceptual Modelling : Perspectives from Artificial
Intelligence, Databases and Programming Languages. Springer Verlag.
[41] M-C Rousset, A. Bidault, C. Froidevaux , H.Gagliardi, F. Goasdou, C.
Reynaud, B. Safar (2002) Construction de mdiateurs pour intgrer des
sources d'information multiples et htrognes : le projet PICSEL.
Information, Interaction, Intelligence, 2(1), 9-58.
[42] M. Stickel (1984) A PROLOG technology theorem prover. New
Generation Computing, 2, 1984.
[43] R. Yager (1991) On linguistic summaries of data. In Knowledge
Discovery in Databases,(G. Piatetsky-Shapiro, W. Frawley, eds.), AAAI
Press, 347-363