Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
*Laboratoire MIRACL
Institut supérieur d’informatique et du multimédia de Sfax
BP 3030 - 3018 Sfax TUNISIE
{mohamed.mhiri, faiez.gargouri}@fsegs.rnu.tn
** Laboratoire LIRIS
Université Claude Bernard Lyon 1
djamal.benslimane@liris.cnrs.fr
RÉSUMÉ. Les systèmes d’information (SI) actuels sont de plus en plus complexes nécessitant
un énorme travail de modélisation, utilisant une quantité énorme des données. Par
conséquent, les concepteurs sont confrontés à un ensemble de problèmes liés à la
méconnaissance du domaine à modéliser et à la difficulté de déterminer les concepts et leurs
relations. Comme solution, nous proposons l’utilisation des ontologies comme moyen
d’assistance aux concepteurs pendant leur tâche de modélisation. En effet, Le rôle principal
de l’ontologie est d'avoir un consensus sur le vocabulaire à utiliser pour un domaine donné.
Dans cette article, nous présentons une approche de construction des ontologies pour la
conception des SI en insistant sur la détermination automatisée des différentes relations
sémantiques entre les concepts composant une ontologie.
ABSTRACT. The current information systems (IS) are increasingly complex requiring an
enormous work of modelling, using an enormous quantity of the data. Consequently, the
designers are confronted with a set of problems concerned in their ignorance of the modelled
field and the difficulty with the determination of the concepts and their relations. As solution,
we propose the use of ontologies like assistance to the designers during their modelling task.
Indeed, the principal role of ontology is to have a consensus on the vocabulary to use for a
given field. In this paper, we propose an automated approach for building IS’ ontologies by
determining the various semantic relations between the concepts composing an ontology. .
MOTS-CLÉS : conception des systèmes d’information, ontologie, représentation conceptuelle,
relations sémantiques.
KEYWORDS: Information systems design, ontology, conceptual representation, semantic
relationships.
1. Introduction
De nos jours, les systèmes d'information (SI) sont de plus en plus complexes,
nécessitant un énorme travail de modélisation. Les concepteurs sont souvent
confrontés à un ensemble de difficultés liées à la méconnaissance du champ d étude
et à la multitude des concepts utilisés. Ces problèmes sont principalement dus au
manque d'un consensus sur les vocabulaires utilisés pour un champ d étude donné.
En conséquence, les concepteurs peuvent, dans certains cas, commettre des erreurs
syntaxiques, structurelles et/ou sémantiques. Ces erreurs auront des conséquences
sur la cohérence des représentations conceptuelles (RC) résultats.
un autre côté, la tâche d analyse des besoins devient aussi très fastidieuse en
raison, en particulier, de la nouvelle orientation des applications actuelles, utilisant
massivement les nouvelles technologies (e-commerce, entrepôt de données...). Ces
applications se basent sur une énorme quantité de concepts provenant de sources
hétérogènes. Une telle hétérogénéité entraîne souvent des ambiguïtés sémantiques au
niveau des RC résultats. Les AGL actuels ne permettent pas la détection ni la
résolution de toutes les ambiguïtés énoncées. En effet, en raison de leur aspect
sémantique et du fait que les AGL ne disposent pas d informations précises sur le
domaine d étude, ces erreurs ne sont pas détectables. Les AGL se limitent
actuellement à la vérification de certaines erreurs syntaxiques relatives aux
spécificités des diagrammes utilisés. Par exemple, ils peuvent vérifier que le nom
d’une classe soit unique dans un diagramme donné. Paradoxalement, dans une RC
donnée, un concepteur peut indiquer qu’une voiture hérite d’une personne, sans que
cette erreur ne soit détectée. Cette limitation est due au manque de sémantique liée
aux divers termes utilisés dans la RC. Un travail préliminaire doit donc être ainsi
effectué pour représenter la sémantique explicite d un domaine de discours.
Plusieurs approches (mots-clés, dictionnaires, taxonomies) ont été proposées,
dans la littérature, pour la représentation des connaissances durant le processus de
modélisation d un domaine donné. Cependant, elles ne permettent pas de représenter
toutes les relations sémantiques et conceptuelles entre les concepts. Comme
solution, nous proposons l'utilisation des ontologies comme moyen d assistance aux
concepteurs pendant leur tâche de modélisation. Le rôle principal de l ontologie est
d'avoir un consensus sur le vocabulaire à utiliser pour un domaine donné. En effet,
une ontologie vise à représenter, d'une manière générique et réutilisable, la
sémantique d'un domaine donné (Guarino et al, 1995). Cette ontologie permet la
compréhension du domaine à modéliser, fournir les concepts caractérisant ce
domaine et vérifier la sémantique des RC.
Le cadre général de ces travaux de recherche, qui couplent deux domaines: la
conception des SI et les ontologies, concerne la proposition d une approche de
construction automatisée des ontologies pour la conception des SI. L ontologie
permet la détermination et la représentation des concepts d un domaine donné ainsi
que leurs relations conceptuelles et sémantiques. Cela nécessite évidemment
utilisation d un langage de représentation des ontologies dédié pour la conception
des SI, que nous avons appelé UMLOnto. Dans ce papier, nous nous limitons à la
présentation de la détermination automatique des relations sémantiques entre
concepts d une ontologie.
Cet article est organisé comme suit. La section 2 décrit brièvement notre
démarche pour la construction d une ontologie dédiée à la modélisation des SI. La
section 3 présente la démarche de détermination automatique des relations
sémantiques entre les concepts de l ontologie. La section 4 présente notre prototype,
intitulé OntoBuilder de construction automatique d ontologies dédiées aux SI en
illustrant ses principales fonctionnalités. L automatisation concerne la détermination
des relations sémantiques en utilisation leur formalisation en langage Z. La section 5
conclut ce travail et présente ses perspectives.
De nombreux travaux ont été proposés pour la construction des ontologies pour
un domaine donné. Nous pouvons citer comme exemple, les travaux de (Assadi et
al, 2000) qui propose une démarche de construction d une ontologie texte pour
transformer une spécification en langage naturel en un langage formel tout en
choisissant un contexte de référence, en structurant et en organisant les concepts.
un autre côté, il existe d après (Benslimane et al, 2003), deux approches pour
la construction d une ontologie. Elle peut débuter soit à partir de zéro ou à partir des
bases des données déjà existantes. Ces dernières permettent de capturer une certaine
réalité des concepts et d expliciter le contenu des sources d information. Autrement
dit, une ontologie représente un contexte de référence entre les systèmes coopératifs.
Par contre selon (Bachimont et al, 2005), les ontologies sont des systèmes
conceptuels, comprenant les concepts d un domaine et les relations les mettant en
jeu dans ce domaine. Pour cela, les ontologies peuvent se fonder sur une
terminologie structurée, à formaliser et à traduire dans un langage interprétable par
un ordinateur.
Une analyse des travaux de (Gandon et al, 2001) (Leclère et al, 2002) sur les
ontologies nous a permis de dégager un consensus sur le processus de conception
une ontologie exploitable dans un système à base de connaissances. La figure1
illustre ce consensus qui repose sur un enchaînement de trois étapes permettant de
passer des données brutes à l ontologie opérationnelle.
Données Modèle Ontologie Représentation
Brutes Conceptuel Formelle
Rci
3
1
Comparaison des concepts de RCi
Extraction des relations avec l ontologie Vi-1
Base de Conceptuelles
règles
formelles Déduction des relations sémantiques
Alimentation des relations Alimentation des relations
Conceptuelles sémantiques
4 2
Ontologie Vi
Par relation sémantique, nous sous-entendons toute relation, autre que celles
habituellement utilisées dans les RC UML et qui est susceptible d exister entre deux
concepts. C est le cas, par exemple, des relations de synonymie, d homonymie, .
La première étape pour la détermination automatique des relations sémantiques
entre les concepts de l ontologie est l extraction des différents concepts, existants
dans les diagrammes des RC. Elle concerne les concepts de noms de classes. Cette
extraction est effectuée en même temps avec une comparaison entre les rôles des
concepts joués dans les diagrammes.
Déterminations des
relations sémantiques
Base de règles entre concepts
<Root>
<Sortede>
Alimentation <Relation>
<defclass>
<name>C1</name>
Ontologie
<attribute/>
<operations/>
</defclass>
<defclass>
<name>C3</name>
Représentation de l’ontologie avec UMLOnto
<inherit>C1</inherit>
<attribute/>
<operation/>
ontologie.xml
Relation d’identité: c est une relation sémantique qui existe entre deux concepts
qui ont la même syntaxe, les attributs et les mêmes opérations. Exemple :
Identité(Personne, Personne).
Relation de Synonymie : est une relation sémantique qui existe entre deux
concepts qui expriment le même sens. Exemple : Synonymie(Personne, Individu).
Cette relation vérifie les propriétés suivantes :
La relation Synonymie() est une relation symétrique :
SI Synonymie(C1, C2) ALORS Synonymie(C2, C1).
La relation Synonymie() est transitive :
SI Synonymie(C1,C2) ET Synonymie(C2,C3) ALORS
Synonymie(C1,C3).
Dans les paragraphes suivants, nous présentons les règles de détermination des
relations sémantiques entre les concepts formalisées en Z (Spivey, 1992) (France et
al, 1997). Le choix de Z est motivé par le fait que c'est un langage formel basé sur la
logique ensembliste et très utilisé pour la spécification des SI. De plus, avec l outil
Z-eves1 nous permet de vérifier la validation des spécifications Z.
3.2.1. Identité
Deux concepts C1 et C2 sont identiques, s ils ont la même syntaxe, les mêmes
noms, les mêmes attributs et les mêmes opérations. La spécification Z de cette
relation est donnée par la figure 5.
1
http://www.ora.on.ca/z-eves/
3.2.2. Synonymie
Deux concepts C1 et C2 sont synonymes, s ils n ont pas la même syntaxe, mais
présentent les mêmes attributs et les mêmes opérations. Dans UMLOnto, la relation
de synonymie exprime une variante de sens entre deux concepts dans un même
domaine. Il ne s agit pas d’une synonymie linguistique. Mais la synonymie est
déduite à partir des caractéristiques des concepts (attributs et opérations). Cette
relation n est vérifiée entre deux concepts que si les règles de vérification (Cf. §3.1)
exprimées sur les caractéristiques des deux concepts soient vérifiées.
3.2.3. Sorte_de
Le concept C1 est une sorte de C2, s ils n ont pas la même syntaxe, mais
ensemble des attributs et des opérations de C1 est inclus dans l ensemble des
attributs et des opérations de C2. Cette relation de catégorisation représente un cas
particulier de la relation d héritage.
3.2.5. Antonomie
Deux concepts C1 et C2 sont antonomes, s ils n ont pas la même syntaxe, et la
négation de l ensemble des attributs et des opérations du C1 implique la
confirmation de l ensemble des attributs et des opérations du C2. Cette relation est
utilisée surtout lors de l héritage entre concepts (par exemple célibataire et marié qui
sont des personnes).
3.2.6. Equivalence
Deux concepts C1 et C2 sont équivalents, s ils n ont pas la même syntaxe, mais
C1 (resp. C2) a le même contexte que C2 (resp. C1). Le contexte concerne le(s)
lien(s) d un concept avec les autres dans une RC. Ces liens peuvent être des liens
conceptuels et/ou sémantiques.
Figure 10. Formalisation Z de la relation d’équivalence
Grâce à l expression Z des relations sémantiques entre les concepts d une ontologie,
il est possible d automatiser leur détermination. En effet, la figure 11 présente
algorithme utilisé pour la détermination de ces relations (Mhiri2 et al, 2006).
Equivalence
(C1, C2)
Base Ontologique
liste des synonymes,
liste
Desesautonomes,
autonomes,
cat égories
liste des catégories
Déterminationdes
Détermination desrelations
relationss sémantiques
émantiques
Conceptuelles Sémantiques
entreles
entre lesconcepts
concepts
Ontologie
5. Conclusion
6. Bibliographie
Assadi H., Bourigault D., analyses syntaxique et statistique pour la construction d'ontologies
à partir de textes, Ingénierie des connaissances, évolution récentes et nouveaux défis,
chapter 15, Eyrolles, collection technique et scientifique des Télécommunications. p. 243-
255, 2000.
Bachimont B., Baneyx A., Malaisé V., Charlet J., Zweigenbaum P., « Synergie entre analyse
distributionnelle et patrons lexico-syntaxiques pour la construction d'ontologies
différentielles » Terminologie et Intelligence Artificielle (TIA'2005), Rouen, France, 4-5
avril 2005.
Benslimane D., Arara A., Yetongnon K., Gargouri F., Ben Abdallah H. « Two approaches
for ontologies building :From-scratch and From existing data sources », the 2003
International Conference on Information Systems and Engineering ISE 2003, Montreal,
Canada, 20-24 July 2003.
France R.B, Bruel J.-M, Larrondo-Petrie M.M and Shroff M., « Exploring The Semantics of
UML Type Structures with Z », the Second IFIP International Conference on Formal
Methods for Open Object-based Distributed Systems, London, 1997.
Gandon F., Dieng-Kuntz R., « Ontologie pour un système multiagents dédié à une mémoire
entreprise », In Actes des journées francophones d’Ingénierie des Connaissances
IC’2001,1-20, Presses Universitaires de Grenoble, 2001.
Gruber T.R., «A translation Approach to portable ontology specification », Knowledge
Acquisition, vol. 5, 1993, p. 199-220.
Guarino N., Giaretta P., « Ontologies and knowledge bases, towards a terminological
clarification », Towards very large knowledge bases: knowledge building and knowledge
sharing, IOS Presse, pages 25-32, 1995.
Leclère L., Trichet T., Frûst F., « Construction of an ontology related to the projective
geometry ». RFIA 13th congrès des Reconnaissance des Frames et Intelligence
Artificielle, 2002, France.
Mhiri1 M., Mtibaa A., Gargouri F., « Towards an approach for building information
systems ontologies », FOMI’2005, 1st workshop Formal Ontologies Meet Industry, 9-10
June, Verona, Italy, 2005.
Mhiri2 M., Mtibaa A., Gargouri F., « UMLOnto: Towards a language for the specification of
information systems ontologies », SEKE’05, the Seventeenth International Conference on
Software Engineering and Knowledge Engineering, Taiwan, China, 14-16 July, 2005,
p.743-746.
Mhiri1 M., Chabaane S., Gargouri F., A Framework for Information Systems Ontologies ,
2nd International Conference on Information & Communication Technologies: From
Theory to Applications (ICTTA 06), Damascus-Syria, 24-28 Avril, 2006.
Mhiri2 M., Chabaane S., Mtibaa A., Gargouri F., « An algorithm for building Information
System s ontologies », 8th International Conference on Enterprise Information Systems.
Paphos ICEIS 2006, Cyprus, 23-27 May 2006.
Spivey J. M., The Z Notation, Prentice Hall, Hemel Hempstead, 2nd edition, 1992.