Vous êtes sur la page 1sur 2

Collaboration homme/machine pour l’extraction de connaissance dans un

wiki sémantique

Informations générales
• Encadrants : Emmanuel Nauer et Amedeo Napoli (équipe Orpailleur, LORIA)
• Téléphone : 03 54 95 85 13
• email : Emmanuel.Nauer@loria.fr,Amedeo.Napoli@loria.fr

1 Motivation et contexte
Ce travail s’inscrit dans la suite du projet Taaable (http://taaable.fr/) [2], qui a remporté le computer cooking
contest 2010 (http://vm.liris.cnrs.fr/ccc2010/doku.php). Le système mis en œuvre dans le cadre de ce pro-
jet permet de rechercher dans une base de recettes de cuisine, celles répondant aux contraintes énoncées par l’utilisateur.
Dans le cas où aucune recette ne satisfait les contraintes, des recettes similaires sont recherchées et adaptées selon le
principe du raisonnement à partir de cas. Adapter une recette de cuisine pour en créer une nouvelle nécessite de dis-
poser de connaissances sur les actions de préparation culinaire (peler, couper, raper, etc.), et sur les ingrédients (pomme,
poire, carotte, etc.). Une partie de ces connaissances a été modélisée manuellement sous la forme d’une ontologie et
stockée dans un wiki sémantique [3]. Cette ontologie sert de référentiel à l’annotation sémantique [5] des recettes qui
sont également stockées dans le wiki. Nous souhaitons mieux prendre en compte l’évolution de l’ontologie à travers
une collaboration homme/machine via le wiki. Dans ce cadre, l’application de méthodes de fouille de données per-
met de dégager des régularités dans les données, favorisant ainsi le regroupement d’entités similaires auxquelles il est
possible d’associer une sémantique [4].

2 Sujet
L’objectif du stage de master est l’étude théorique et pratique des interactions potentielles entre le processus d’anno-
tation, le processus d’extraction de connaissances et le processus d’évolution d’une ontologie. En effet, nous pensons
que l’exploitation de méthodes de fouille de données pour classifier les annotations existantes à l’instant t, va perme-
ttre de découvrir des régularités dans ces dernières dans le but de faire évoluer l’ontologie qui, en retour, améliorera
l’annotation à l’instant t + 1. Par exemple, l’existance d’un nombre suffisant de recettes contenant des carottes qui
sont rapées pourrait conduire à la création d’un concept Carotte rapée, qui servirait, en retour, à une annotation
plus précise. De la même façon, des concepts analogues tels que Céleri rapé, PommeDeTerre rapé, etc. pour-
raient être créés, et par extension, être généralisés en Légume rapé. Ce processus d’extraction de connaissance peut
être vu comme une collaboration entre l’homme et la machine, qui assiste les utilisateurs dans la maintenance et
l’évolution de l’ontologie ainsi que dans l’annotation. Dans ce contexte, les wikis sémantiques fournissent un support
intéressant pour mettre en œuvre une telle collaboration [1]. Un autre exemple concret d’application dans le domaine
de la cuisine concerne l’acquisition de connaissances d’adaptation. Ainsi, on aimerait pouvoir généraliser les sub-
situtions d’un ingrédient I1 (par exemple, poire) par un ingrédient I2 (par exemple, pomme) dans un ensemble de
recettes r1 , r2 , . . . , rn en une substitution de I1 par I2 pour une certaine catégorie recette (par exemple, les desserts, si
r1 , r2 , . . . , rn sont des desserts).
D’un point de vue théorique, l’étudiant doit produire une méthodologie pour faire évoluer l’ontologie en fonction
des annotations existantes, et réciproquement. Cette méthodologie devra être instanciée dans un wiki sémantique
existant. La plate-forme de fouille de données CORON [6], qui implémente un certain nombre d’algorithme de fouille
de données, sera mise à disposition du stagiaire.
Ce sujet donnera suite à une thèse, financée par l’INRIA, dans un autre cadre applicatif — un système d’annotation
sémantique de documents vidéo — via un contrat d’ores et déjà établi avec la société ”The Picture Factory” (Epinal).

Références bibliographiques
[1] Hernan Astudillo, Victor Codocedo, Gérôme Canals, Diego Torres, Alicia Diaz, Amedeo Napoli, Alan Gomes,
and Maria-Graça Pimentel. Combining knowledge discovery, ontologies, annotations, and semantic wikis. In
Mário Meireles Teixeira, editor, Webmedia Minicourse Book. SBC, 2009.
[2] F. Badra, R. Bendaoud, R. Bentebitel, P.-A. Champin, J. Cojan, A. Cordier, S. Desprès, S. Jean-Daubias, J. Lieber,
T. Meilender, A. Mille, E. Nauer, A. Napoli, and Y. Toussaint. TAAABLE: Text Mining, Ontology Engineering,
and Hierarchical Classification for Textual Case-Based Cooking. In M. Schaaf, editor, ECCBR 2008, The 9th
European Conference on Case-Based Reasoning, Trier, Germany, September 1-4, 2008, Workshop Proceedings,
pages 219–228, 2008.
[3] Amélie Cordier, Jean Lieber, Pascal Molli, Emmanuel Nauer, Hala Skaf-Molli, and Yannick Toussaint. Wik-
itaaable: A semantic wiki as a blackboard for a textual case-based reasoning system. In SemWiki 2009 – 4th
Semantic Wiki Workshop, Heraklion, Greece, May 2009.

[4] U. M. Fayyad, G. Piatetsky-Shapiro, P. Smyth, and R. Uthurusamy, editors. Advances in Knowledge Discovery
and data Mining. American Associatation for Artificial Intelligence, 1996.
[5] Siegfried Handschuh and Steffen Staab, editors. Annotation for the Semantic Web, volume 96 of Frontiers in
Artificial Intelligence and Applications. IOS Press, 2003.

[6] L. Szathmary and A. Napoli. CORON: A Framework for Levelwise Itemset Mining Algorithms. Supplementary
Proceedings of The Third International Conference on Formal Concept Analysis (ICFCA ’05), Lens, France, pages
110–113, 2005.