Vous êtes sur la page 1sur 30

05/12/2011

Le web smantique :
Une infrastructure indispensable aux systmes de KM t d
Dr. Rim Faiz Rim.Faiz@ihec.rnu.tn rimfaiz@yahoo.fr a @ya oo

Mastre Recherche Informatique

KM et technologies
le web smantique et les technologies quil sous-tend, intresse de plus en plus les organisations en qute dinteroprabilit et dautomatisation plus importante de la gestion de leurs informations et de leurs connaissances. Les systmes de KM tirent galement partie de cette nouvelle infrastructure qui leur offre la possibilit dexploiter lensemble des ressources informationnelles des organisations grce lutilisation dun langage commun.

05/12/2011

Un principe simple
Lide principale du WS repose sur la sparation entre les informations et leur prsentation prsentation. Il sagit den faciliter la gestion et le traitement. Ces oprations sont dautant plus simples que les ressources sont identifies de manire unique et organises autour dune ontologie dont l'objectif est de fournir des reprsentations formelles d'une partie du monde. d Une ontologie est donc un modle d'organisation des connaissances dans un domaine donn.
3

Un principe simple (suite)


Concrtement, le WS peut tre vu comme une infrastructure au sein de laquelle chaque ressource est couple des mtaq q p donnes qui sont dfinies laide de langages permettant de dcrire les ressources ainsi que les relations qui les lient laide de marqueurs smantiques. Dans ce domaine, deux langages sont aujourdhui en concurrence : dun ct le couple RDF et OWL, supports par le W3C, et de lautre Topic Maps, un standard propos par lISO. Ces langages constituent un socle pour dfinir des ontologies, entits indispensables pour faciliter lexploitation automatique ou semi-automatique de linformation par un ordinateur tout en gardant la signification du contenu pour les tres humains.
4

05/12/2011

Du rle central des ontologies


Dun point de vue strictement structurel, le WS sappui sur les technologies XML. Par contre, dun point de vue smantique, il ncessite lutilisation de deux formalismes complmentaires :
un formalisme de reprsentation des p connaissances, les ontologies. et un formalisme de raisonnement, linfrence.
5

Du rle central des ontologies


Dans le cadre de lentreprise et du KM, le WS et lutilisation des l ili i d ontologies offrent trois avances l i ff i majeures :
des possibilits de recherche amliores, une automatisation des tches possibles bien plus importantes, importantes une interoprabilit des systmes.

05/12/2011

Recherche amliore (1)


Les ontologies offrent des capacits de recherche trs i t puissantes. t En effet, lobjectif dune ontologie est de modliser les diffrents concepts dun domaine et surtout de dfinir les liens qui existent entre ces concepts. Chaque lment des documents qui utilisent cette ontologie possde une reprsentation smantique. smantique
deffectuer des recherches complexes constitues dlments possdant une relation smantique

Le Web aujourd'hui

Le Web Smantique

W3C Semantic Web Activity Marja-Riita Koivunen and Eric Miller, Nov. 2001

05/12/2011

Recherche amliore (2) : Exemple


la recherche des dirigeants des entreprises pharmaceutiques est beaucoup plus simple laide dune ontologie car celle-ci dcrit les liens qui existent entre un dirigeant et une entreprise, entre une entreprise et un secteur d activit, dactivit, etc.

Automatisation accrue (1)


Lutilisation dune ontologie permet un ordinateur de d connatre la signification d chaque l t l i ifi ti de h lment d t des documents et les relations qui les lient. De ce fait, il devient trs facile dautomatiser certaines tches grce des algorithmes dinfrence.
Linfrence est un processus q p p qui permet de p produire de nouvelles informations partir d'autres informations tenues pour acquises en utilisant de rgles formelles.

10

05/12/2011

Automatisation accrue (2)


Dans son expression la plus basique, linfrence revt la f t l forme dun simple mcanisme d pattern d i l i de tt matching
un mcanisme qui permet de comparer deux modles et de les apparier sils sont semblables.

Si par contre les informations fournies ne sont pas semblables, des mcanismes plus complexes, avec des chanes de raisonnement plus importantes, peuvent tre requis.

11

Automatisation accrue (3)


Ainsi, les algorithmes dinfrence dfinissent des actions raliser en f ti li fonction d t ti des types d concepts de t et des relations existantes entre eux. En dautres termes, on dfinit des tches partir des mta-donnes, ensuite grce la description du document laide de l ontologie, on est en mesure l aide lontologie dexploiter les entits du document pour raliser les tches dfinies de manire totalement automatique.
12

05/12/2011

Ex. Mta-donnes avec le Dublin Core


<html> <head><title>Rsultat de la recherche Logique sur Doc CISMeF</title> <meta name=DC Creator contentquipe CISMeF : Stfan Darmoni, name=DC.Creator Darmoni Magaly Douyre, Jean-Philippe Leroy, Josette Piot, Benoit Thirion ; cismef@chu-rouen.fr> <meta name=DC.Format scheme=IMT content=text/html> <meta name=DC.Language scheme=RFC1766 content=fr> <meta name=DC.Publisher content=Rouen University Hospital ; Centre hospitalier universitaire de Rouen > g py g <meta name=DC.Rights content=Copyright CHU de Rouen. Toute utilisation partielle ou totale de ce document doit mentionner la source><link rel=schema.RFC1766 href='http://www.ietf.org/rfc/rfc1766.txt'> <link rel='StyleSheet' href='/stylesheetreq.css' type='text/css'> </head> <body class=doccismefgeneral> 13 http://doccismef.chu-rouen.fr/ <>

Exemple de mta-donnes

14

05/12/2011

Linteroprabilit des systmes dinformation (1)


Parmi les diffrents aspects informatiques du KM celui de linteroprabilit du systme de gestion des l interoprabilit connaissances avec les systmes dinformation existant est sans doute lun des plus importants. En effet, pour quun tel systme puisse jouer pleinement son rle de support pour le transfert et le partage des savoirs de lentreprise il doit tre en l entreprise, mesure daccder lensemble des sources de donnes.
15

Linteroprabilit des systmes dinformation (2)


Malheureusement, la plupart des organisations, au cours des annes, ont multiplies les systmes pour g , p y p grer linformation et la connaissance : bases de donnes, G.E.D. , groupware, Intranet, etc.
Au final, elles ont mis en place des systmes indpendants et htrognes, possdant chacun un modle de donnes propres.

Aujourdhui, les efforts consentis sur les middleware nont de vritables impacts que sur les processus et trs peu sur les modles de donnes. Ceci handicape normment les systmes dl d d C i h di tl t de KM qui, pour intgrer diffrentes sources de donnes, doivent faire lobjet de dveloppements spcifiques aussi coteux que difficiles raliser et maintenir.

16

05/12/2011

Linteroprabilit des systmes dinformation (3)


Parmi les diffrentes solutions possibles ce problme, problme le WS semble aujourdhui tre le moyen qui aujourd hui simpose pour faciliter lintgration des systmes de KM au SI de lentreprise. Les ontologies fournissent les interfaces idales entre linformation et les diverses applications qui souhaitent les utiliser des fins de traitement. En effet, les ontologies offrent la possibilit de reprsenter et dorganiser la connaissance laide dun unique modle de donnes commun lensemble des applications de lentreprise.
17

Linteroprabilit des systmes dinformation (4)


Le WS fournit ainsi une infrastructure facilitant lintgration de sources dinformations htrognes. Dun i d D point de vue oprationnel, le WS peut tre utilis pour l i l l ili la mise en place de serveurs de connaissances dont le rle est :
dunifier et dorganiser laccs aux diffrentes sources dinformation disponibles dans lentreprise. Il sagit de systmes de mdiation qui permettent aux utilisateurs davoir une vision partage des connaissances de lentreprise, malgr lhtrognit de leurs sources.

Le grand intrt des serveurs de connaissances rside dans leur capacit intgrer lexistant. p g
de plus, cest un moyen simple dadresser la gestion des connaissances explicites en relation avec les usages et processus mtiers. libre dune importante partie de cette tche, lentreprise peut, de ce fait, semployer rflchir la meilleure faon de traiter les connaissances tacites..
18

05/12/2011

Que des avantages ?


Mme si le WS semble promis un bel avenir en entreprise, il f t noter que cette approche ne t i faut t tt h prsente pas, lheure actuelle, que des avantages. En effet, les entreprises qui souhaitent se lancer dans la mise en place dontologies sur lensemble de leur systme dinformation risquent de se trouver d information confrontes quelques difficults, essentiellement dues la relative jeunesse du march.
19

Que des avantages ?


Dune part, les outils permettant de crer et de grer les ontologies ne sont pas encore assez matures pour permettre li d t i li ti d l tili ti d ontologies d lindustrialisation de lutilisation des t l i dans l les entreprises. Ils ne sont pas daccs faciles et il nexiste pas encore de vritables standards. Toutefois, certains diteurs de logiciels proposent des solutions compltes qui intgrent les diffrents standards. Dautre part, il nexiste pas de mthodologies prouves et surtout prouves pour guider les entreprises dans la cration d ontologies. dontologies La cration dune ontologie est une affaire de spcialistes dans la mesure o il faut avoir des comptences la fois dans le domaine modliser mais aussi en reprsentation des connaissances et en linguistique. Une pluridisciplinarit des comptences encore rare
20

10

05/12/2011

Vision du web Smantique

Du Web daujourdhui ...


Le Web est exploit par des personnes qui recherchent des informations par lintermdiaire dun moteur de recherche et qui exploitent elles mmes elles-mmes le(s) rsultat(s). Le Web est difficilement exploitable par des machines.

22

11

05/12/2011

... au Web de demain


Le Web sera exploit principalement par des machines qui traiteront elles mmes les questions formules par elles-mmes des personnes et qui dlivreront des rsultats. Les machines peuvent traiter un volume dinformations plus grand et tre plus efficace que des humains
conditions que lon les munissent dune certaine forme dintelligence. di t lli quil existe une infrastructure leur permettant dexploiter correctement les informations.

23

Les trois gnrations du Web


Le Web statique : HTML la main permettant laccs uniforme li f l if linformation, ti
mais difficult de maintenance. pas de prise en compte des contenus dynamiques.

Le Web dynamique : Gnration la vole du contenu au moyen de base de donnes ou de transformations XML. Le Web Smantique.
24

12

05/12/2011

HTML
Balises HTML qui ont un sens pour la mise en forme : <H1> : titre <H2> : sous-titre Mlange du fond et de la forme, Aucune smantique par rapport au contenu : qui est lauteur ? Quand le document a t rdig ? Moteurs de recherches et indexation des pages, Pas de possibilit dexploiter des connaissances pour une gestion plus intelligente des informations : recherches par le contenu des documents, raisonnements, rsolution de problmes, ...
25

XML
Fausse ide reue : XML nest pas smantique ! On peut dfinir ses propres balises : <auteur>, <titre> Mais ne signifie pas plus quune balise <H1>, seulement une aide pour les humains pas pour les machines. XML cest de la syntaxe pauvre : permet c est syntaxe pauvre dexprimer seulement lenchssement (ou la hirarchie), la squence, la co-occurrence. Pas de typage : que des chanes de caractres !
26

13

05/12/2011

Le Web Smantique
Le Web smantique propos initialement par Tim Berners-Lee (W3 Consortium) est une nouvelle infrastructure devant permettre des agents logiciels daider plus efficacement diffrents types dutilisateurs dans leurs accs aux ressources sur le Web (sources dinformations et services).

27

Premires caractristiques du Web smantique


Les mta-donnes sont au coeur de la dmarche avec une grande diversit dans linterprtation et lutilisation de cette notion. notion Pas obligatoirement de techniques radicalement nouvelles : outils de lIntelligence Artificielle (reprsentation des connaissances) connus depuis les annes 70-80! Changement dchelle. Changement de contexte de dploiement : le Web et ses drivs : intranet, wap, wireless, ... Changement de niveau dinteroprabilit, douverture, de niveau de standardisation.
28

14

05/12/2011

Problmatique
Web actuel de plus en plus volumineux et diversifi Informations et les services sont de moins en moins exploitables Web actuel nest pas fait pour tre manipul de faon intelligente par les programmes informatiques Frustrations dans la recherche sur le web actuel Perte d t P t de temps considrable avant dobtenir id bl t d bt i linformation dsire

29

Evolutions venir :
le web smantique
Dfinition du Semantic Web : chantier d recherche d W3C h ti de h h du Constat des insuffisances du web actuel : absence de description et dindexation des ressources, etc. htrognit des formats p pas de structure explicite du web. p Objectifs : meilleure structuration du web, exploitation smantique de la nature du web...
30

15

05/12/2011

Proposition de solutions
Rendre smantique le web,
c'est complter l ' t lt les b li balises HTML par d des b li balises porteuses de sens (XML) ; c'est multiplier et organiser les mots-cls dans le document mme (sans que le lecteur ne voit de diffrence)

A un niveau plus lev,


c'est travailler l'indexation de toutes les ressources du web, documents et services (norme //RDF//), pour une exploitation optimale.

31

Web Smantique : infrastructure


Infrastructures standards : protocoles, langages, mcanismes, ... p pour exprimer ces descriptions les changer et intgrer des informations htrognes traduire entre diffrents formalismes raisonner partir de ces descriptions, scuriser ces changes ... Introduire une couche smantique permettant la description des contenus (mta-donnes) la t t ti d l structuration des ressources (li (liens h hypertextes ti t t tiquets) t ) avec un certain niveau de formalisation

permettre la recherche dinformations partir des concepts, des notions, et non plus de simples chanes de caractres (mots-cls)
32

16

05/12/2011

Web Smantique : infrastructure


Vocabulaires partags pour diffrentes communauts
ontologies comme conceptualisations partages au coeur partages, du WS Permettent dexprimer diffrents types de mta-donnes

(r) introduction des problmatiques documentaires de catalogage (avec les mta-donnes) et dindexation (avec les ontologies), MAIS :
de manire totalement automatise sur les connaissances et plus seulement sur les documents

33

La vision du Web smantique en rsum


Le Web smantique repose sur des langages et une infrastructure infrastructure. Objectif : donner la possibilit denrichir le Web actuel laide dinformations dites smantiques, utilisables par des machines. Associer aux ressources Web des informations structures descriptives sous la forme de mtadonnes (ou annotations).
34

17

05/12/2011

Principes et outils du WS
quadruple normalisation ncessaire, quatre directions de recherche :
identification des ressources numriques description des ressources : systmes de mtadonnes structuration des documents numriques : XML indexation des ressources : langages de description, thsaurus, ontologies, classifications

principe fondamental du web smantique :


sparation du contenu des documents de lorganisation de ce contenu
35

Quelles consquences du web smantique ?


Travail en profondeur dans la trame des documents, documents notion de granularit de linformation. possibilits indites de recherche intelligente sur le contenu. nouvelles formes de reprsentation de linformation : en amont (conception avec XML), en aval (recherche).
Un exemple : le portail mdical Caducee.net
Rseaux et Systmes d'Information Sant au service des professionnels
36

18

05/12/2011

Le web demain
Simplifier le rle de l'utilisateur dans la recherche l utilisateur et l'exploitation de l'information grce :
de meilleurs moteurs de recherche l'intgration facilit des sources de donnes la dcouverte, l'exploitation et la combinaison de services des possibilits accrues de raisonnement sur les donnes
37

Comment y arriver ?
Apprendre la smantique la machine (IA/KR)
structure du document dictionnaires connaissances sur la langue etc.

Ajouter des informations smantiques destines aux machines (SW)


Ajouter des concepts, relations, prdicats. Ajouter des rgles d'infrence
38

19

05/12/2011

Trois perspectives ... complmentaires terme ?


Voir le Web comme un vaste rseau interconnect p par des liens smantiques. q
aspect communicationnel

Voir le Web comme un vaste ensemble de ressources munis d'annotations ou de mtadonnes.


aspect informationnel

Voir le Web comme un ensemble de services combinables.


aspect fonctionnel Les points de vue du communicateur, du gardien de la connaissance et du commerant !!
39

Qu'est ce qui fait l'unit du WS?


Une infrastructure que peuvent utiliser diffrents agents logiciels ou "mdiateurs" utilisant des mdiateurs technologies voisines.
protocoles de communication, langages (ceux du W3C, Topic Maps, ) et de plus en plus d'outils.

Intgrant la reprsentation de connaissance g p dans le monde Web et XML Cration systmatique de standards
40

20

05/12/2011

Une infrastructure pour


exprimer des descriptions smantiques des ressources construire des cartes de sites retrouver ces ressources naviguer dans ses ressources les changer et intgrer des informations de ressources htrognes les traduire entre diffrents formalismes effectuer des raisonnements partir de ces descriptions scuriser ces changes . Utilisable dans diffrents domaines applicatifs 41

Le Web smantique et l'existant


S'appuient sur un existant riche adapt ...
Mtadonnes ingnierie de la connaissance reprsentation de la connaissance ...

Mais changement d'chelle de contexte de dploiement


le Web et ses drivs : intranet, extranet

de niveaux d'interoprabilit, d'ouverture, de niveau de standardisation

42

21

05/12/2011

L'automatisation du traitement des contenus passe par le Web smantique


Fonctions de classification, de d recherche, h h de navigation intersujet et interdocument dispositifs d'assistance l'indexation... espace de travail pour rexploiter les donnes extraites les applications du Web smantique sont nombreuses nombreuses. elles visent toutes l'automatisation du traitement des contenus

43

Applications potentielles
Recherche dinformation d information Maintenance de base documentaire Commerce lectronique Services immatriels (e-work, e-business) ..

44

22

05/12/2011

Des technologies de description et de classification


L'apport du Web smantique l'entreprise ?
Il se place principalement sur le terrain de la gestion des connaissances (KM). Concrtement, il dote les portails traditionnels, gnralement bass sur des mcanismes d'indexation 'plein texte' (questions / rponses), d un d'un niveau de modlisation (XML) supplmentaire contribuant amliorer la pertinence de leurs fonctions de recherche et de classification.
45

Des technologies de description et de classification


La bote outils du Web smantique couvre plusieurs grands enjeux de la gestion documentaire :
Les ressources ontologiques (OWL) permettent de fournir aux portails un cadre gnral de catgorisation. Les mta-donnes alloues aux documents (RDF) contribuent amliorer les capacits d'analyse des modules de recherche, en les tendant par exemple aux requtes multicritres et croises. Enfin, le champs taxinomique (Topic Map) affine la structuration des objets manipuls, en dcomposant par exemple les domaines d'une socit en familles et sousfamilles.
46

23

05/12/2011

Exemple de topic map (1)

47

Daprs Jean-Franois Baget, tienne Canaud, Jrme Euzenat et Mohand Sad-Hacid

Exemple de topic map (2)

Daprs J. Caussanel, M. Zacklad et al.

48

24

05/12/2011

La vision du Web smantique


en rsum

Diffrents langages pour dcrire, exploiter et raisonner sur l contenus d ressources i les t des Des connaissances qui s'appuient sur des ontologies. Utilisation de mtadonnes. Intgration automatique d'informations provenant de sources htrognes. td ht Utilisation et combinaison automatique de services Web
49

Recherches fondamentales pour le WS


Mta-donnes et a otat o s ta do es annotations Ontologies pour le WS Intgration de sources d'information htrognes Services Web et WS et bien sr les langages pour le WS et ...
50

25

05/12/2011

Conclusion
Le web smantique : une infrastructure indispensable aux systmes de KM
Possibilit de recherche amliore. Automatisation plus importante de la gestion des informations et des connaissances. Interoprabilit des systmes. p y

51

Bibliographie
www.w3.org/RDF www.oasis-open.org, Tim Berners-Lee, James Hendler and Ora Lassila (2001), The Semantic Web, ScientifAmerican.com (www.sciam.com), May. http://websemantique.org/ http://www.spectrum.ieee.org/WEBONLY/ http://www spectrum ieee org/WEBONLY/ Frank Van Harmelen (2004), The Semantic Web : What, Why, How , IEEE Distributed Systems Online, March http://dsonline.computer.org/0403/d/o3004.htm
52

26

05/12/2011

Quelques acronymes
URL : Uniform Resource Locator URI : Universal Resource Identifier HTML : Hyper Text Markup Language XML : eXtended Markup p Language XSDL : XML Schema Definition Language RDF : Resource Description Framework DAML : DARPA Agent Markup Language OIL : Ontology Inference Layer DARPA : Defence Advanced Research Project Agency W3C : World Wide Web Consortium
53

54

27

05/12/2011

Mta-donnes et annotations
Grande diversit
annotations documentaires annotations structurelles annotations sur les contenus ...

Varit de leur rles


catalogage recherche d'information aide la navigation construction dynamique de ressources : adaptation et personnalisation ...

De leurs conditions de productions


quels acteurs : professionnels / usagers de "base" statique / dynamique ...
55

Mta-donnes et Web smantique


Processus multi acteurs dans lequel des personnes publient ou reprent d ressources t des intressantes. Description par des fiches de mtadonnes. Regroupement dans un rfrentiel de ressources dapprentissage ( learning objects repository ). Associes d pages W b l A i des Web, les mta-donnes sont un lment de base du Web smantique. Pour des recherches intelligentes et lintgration dans des environnements dapprentissage.

56

28

05/12/2011

Ontologies
Spcifications dclaratives des concepts et des rles dans un domaine de disco rs n discours. Fournissent des vues structures et partageables des ressources. Donnent un vocabulaire pour les mta-donnes. p Par leur formalisation, permettent l'automatisation de certains raisonnements.
57

Ontologies, mtadonnes, agents logiciels et utilisateurs

www.semanticweb.org 58

29

05/12/2011

Le web smantique, mieux qu'un outil documentaire (1)


Sur un plan technique, le WS apparat comme une vritable rvolution dans l'accs l'information sur les rseaux. Il consiste en un enrichissement smantique de l'information
par l'ajout d'une couche permettant la description des contenus et la structuration des ressources avec un certain degr de formalisation, transformant ainsi l'Internet en une vaste base de donnes construite avec un langage structur.

Les ontologies sont l'un des outils utiliss pour y parvenir. l un


Ce sont des langages formaliss et consensuels qui, dcrivant un domaine du monde rel, permettent " de lier le contenu exploitable par la machine avec sa signification pour les humains ". L'objectif tant de donner un sens aux informations que mme les ordinateurs pourraient comprendre.
59

Le web smantique, mieux qu'un outil documentaire (2)


Les futurs usages du web smantique sont encore peu prvisibles mais, dans un proche avenir ces mais avenir, technologies vont tre utilises dans les entreprises, essentiellement sur le terrain de la gestion des connaissances. La mise en uvre du web intelligent concerne donc tous les aspects de la gestion documentaire et particulirement l'automatisation du traitement des l automatisation contenus. Les professionnels de l'information apparaissent donc juste titre des partenaires privilgis
60

30