I. Historique du web
II. Définition du web sémantique
III. Aspects
spects donnée du web sémantique
IV. La cartographie du web sémantique
V. Champ d’application du web sémantique
VI. Exemple du web sémantique
Conclusion
Introduction
Quand la donnée prend le dessus. C’est ainsi que pourrait être, très
vulgairement, résumé le Web sémantique. Un vaste projet qui a éclaté aux yeux
de tous suite à l‘intervention de Tim Berners-Lee, patron du W3C - et également
père du Web -, le consortium en charge de définir les standards du Web.
“J’ai un double rêve pour le Web. D’une part, je le vois devenir un moyen très
puissant de coopération entre les êtres humains. Et dans un second temps,
j’aimerais que ce soit les ordinateurs qui coopèrent. [...] Quand mon rêve sera
réalisé, le Web sera un univers où la fantaisie de l’être humain et la logique de
la machine pourront coexister pour former un mélange idéal et puissant.”
Les activités liées au Web sémantique existent depuis 1998 au sein du W3C,
et ont débouché depuis sur l’éclosion d’une série de technologies qui forment
l’ossature de l’ensemble. Désormais presque matures, ces standards restent
malgré tout peu utilisés, tout simplement car les principes du Web sémantique
demeurent, eux aussi, un peu flous dans l’esprit des internautes et dans celui des
entreprises.
I. Historique du Web :
Le web est sans nul doute une technologie majeure du 21ème siècle. Et si sa
nature, sa structure et son utilisation ont évolué au cours du temps, force est de
constater que cette évolution a également profondément modifié nos pratiques
commerciales et sociales.
Le web 1.0, encore appelé web traditionnel, est avant tout un web statique,
centré sur la distribution d’informations. Il se caractérise par des sites orientés
produits, qui sollicitent peu l’intervention des utilisateurs. Les premiers sites
d’e-commerce datent de cette époque. Le coût des programmes et logiciels
propriétaires est énorme et l’explosion de la bulle dot.com, en 2000, remet en
question cette approche de la toile.
Le Web Sémantique est une représentation abstractive des données sur le World
Wide Web, basée sur les standards RDF (Resource Description Framework)
ainsi que d’autres standards à définir. Il est en cours de développement par le
W3C, en collaboration avec un grand nombre de chercheurs et de partenaires
industriels.
Le web sémantique est aussi :
C’est une extension du web classique (HTML, HTTP, etc. ne sont pas
remis en cause).
1. RDF
Resource Description Framework (RDF) est un modèle de graphe destiné à
décrire de façon formelle les ressources Web et leurs métadonnées, de façon à
permettre le traitement automatique de telles descriptions. Développé par
le W3C, RDF est le langage de base du Web sémantique. L'une des syntaxes
(ou sérialisations) de ce langage est RDF/XML. D'autres sérialisations de RDF
sont apparues ensuite, cherchant à rendre la lecture plus compréhensible ; c'est le
cas par exemple de Notation3 (ou N3).
Le sujet, et l'objet dans le cas où c'est une ressource, peuvent être identifiés
par une URI ou être des nœuds anonymes. Le prédicat est nécessairement
identifié par une URI.
2. DAML+OIL
Mais avant d'étudier plus en détail DAML+OIL, nous donnons d'abord les
caractéristiques d'OIL, puis de DAML.
OIL est un langage de description et d'inférence sur les ontologies, basé sur
RDF. Il prend appui sur les logiques de description. Il est composé de plusieurs
couches :
3. OWL
Les langues plus tôt ont été utilisées pour développer des outils et des
ontologies mais elles n'ont pas été définies pour être compatibles avec
l'architecture du WWW en général et le Web Sémantique en particulier. OWL
en basant sur RDF nous donne les possibilités suivantes aux ontologies :
À ce moment, OWL est considéré par W3C comme une langue d'ontologie
standard. Il a non seulement la capacité de décrire les concepts dans un domaine
mais aussi d'une ensemble plus riche d'opérateurs, donc ces concepts bien
définis et bien décrits. On peut construire des concepts complexes en basant les
définitions des concepts plus simples. En outre, on peut vérifier si tous les
rapports et les définitions dans l'ontologie sont conformés et identifier quels
concepts s'adaptent sous quelles définitions. Donc, on peut maintenir la
hiérarchie correctement entre les classes.
Les composants de OWL :
Individus:
Propriété:
C’est une relation binaire entre deux individus. Par exemple : la propriété est
Collegue est un lien entre deux individu Tien et Hung..etc.. On a aussi les
propriétés qui peuvent être inversé.Par exemple: superviserDe est à l'inverse de
estSupervisePar..etc. Elle peut avoir une single valeur, qui s'appelle fonction ou
être transitif , symétrie.
Classes
Les OWL classes sont interprétées comme les ensembles avec des individus.
Elles sont décrites en utilisant les descriptions formelles qui énoncent
précisément les conditions pour être un membre de cette classe. Classes peuvent
être organisés en hiérarchie de super classe et sousclasse, qui est également une
taxonomie. Avec OWLDL, on peut faire automatiquement les relations entre
deux classes grâce au raisonner. Parfois, le mot concept remplace une classe ou
les classes sont une représentation concrète des concepts.
Les objets peuvent être des classes (c’est à dire, désigner un ensemble d’objets
aux propriétés communes). Ainsi, la classe Football_Player contient entre autres
Thierry Henry et Lionel Messi. Avec leurs données, les chercheurs considèrent
le graphe des associations entre classes. Considérons les triplets suivants :
{Lionel Messi, is a, Football Player}
{FC Barcelona, is a, Football Club}
{Lionel Messi, plays in, FC Barcelona}
Ces trois triplets sont résumés par les auteurs par deux classes : Football Player
et FC Barcelona, qui seront liées entre elles. Les liens sont plus ou moins forts
selon le nombre de triplets rdf qui établissent des liens entre les deux classes
considérées.
Le web sémantique permet d'agréger plusieurs données entre elles (ex : pour
une image : le lieu, la date, le nom des personnes, l'auteur, la date de prise de
vue, etc.) pour enrichir les possibilités de recherche d’informations et/ou se
connecter avec d'autres membres.
Les moteurs de recherche grand public assimilent peu à peu les technologies
du web sémantique, là ou d'autres moteurs en ont fait leur clef-de-voûte :
comme Tumbup, un nouveau moteur de recherche relié à Facebook et qui
s'appuie sur l'activité des membres du réseau social (recommandations sur des
lieux, produits, etc.) pour produire des résultats plus signifiants. On peut aussi
citer les moteur de recherche Wolfram Alpha, TrueKnowledge (interprétation du
langage naturel) et Zoom, un moteur intégrable à l'intranet, aux sites et blogs
d'entreprise pour structurer les données recherchées.
Ainsi, pour raisonner, il ne faut plus se baser sur les mots mais sur les classes.
Mais que signifie raisonner ? Raisonner c'est utiliser sa raison pour démontrer
quelque chose. C'est un terme très souvent employé en intelligence artificielle.
Conclusion