Académique Documents
Professionnel Documents
Culture Documents
Représentation Des Connaissances Travaux Pratiques N°1: Master IO MER 2016-2017 Farah Benamara Zitoune
Représentation Des Connaissances Travaux Pratiques N°1: Master IO MER 2016-2017 Farah Benamara Zitoune
Exercice 2: Thésaurus
• Qu'est ce qu'un thésaurus ? Que contient-il ?
• Allez sur le Thésaurus de l'UNESCO : http://databases.unesco.org/thesfr/
• Identifiez les descripteurs du micro-domaine Religion associé au domaine de la Culture
• Repérez les descripteurs Institution religieuse et Théologie
• Pour chacun de ces deux descripteurs précédents, identifiez les relations :
◦ Hiérarchiques
◦ Associatives
◦ Equivalences intra-linguistique
◦ Equivalences inter-linguistique
• Nous allons à présent découvrir le formalisme de représentation informatique du thésaurus de
l'UNESCO.
◦ Allez sur le site : http://skos.um.es/unescothes/
◦ Recherchez le descripteur Théologie
◦ Cliquez sur le lien RDF/XML et analysez le formalise SKOS (identifiez les balises, leurs
significations, etc.). Vous pouvez vous référer au site suivant pour une description des
principales balises SKOS : www.sparna.fr/skos/SKOS-traduction-francais.html
• Les synsets (synonym set) : ensemble de mots quasi-synonymes, sorte de « classe d'équivalence »
sémantique, représentant un sens (un concept) particulier. Chaque synset est accompagné d'un gloss
(sa définition) + exemples d'usage. Les mots ayant plusieurs sens appartiennent à plusieurs synsets
(les sens sont ordonnés par ordre de fréquence).
◦ Méronymie (partie-de),
Master IO MER 2016-2017 Farah Benamara Zitoune
◦ Implication,
◦ Dérivation morphologique .…
WordNet est actuellement composé de 150 000 mots organisés en 115 000 synsets. Il est accessible en ligne à
l'adresse : http://wordnet.princeton.edu/. Il existe pour d'autres langues : EuroWordNet, BalkaNet, Wolf
(WordNet français), ArabicWordNet, etc.