Académique Documents
Professionnel Documents
Culture Documents
Hicham BEHJA
La vision du Web sémantique
Tim Berners-Lee (W3C)
Le Web de demain
Un immense espace d'échanges de ressources entre
humains et machines permettant à des utilisateurs d'accéder
à de grands volumes d'informations et à des services variés
(répondre à des requêtes)
Le Web sera un espace partagé déclaratif et
navigable : un espace de discussion pour les
machines qui en exploitent toutes les ressources
pour résoudre des problèmes.
La manipulation de documents
pour le Web sémantique
Donner un sens aux documents avec des langages de
représentation des connaissances (logiques de descriptions)
pour attacher une sémantique aux éléments des documents.
3
Les langages du W3C
4
Les langages du W3C
• C’est une pyramide de langages
• Seulement les couches basses sont aujourd’hui relativement stabilisées.
• Deux types de bénéfices:
• Une approche graduelle dans les processus de standardisation et
d’acceptation par les utilisateurs.
• Permettre de disposer du langage au bon niveau de complexité, celle-ci
étant fonction de l’application à réaliser.
• Repose sur la notion d’URI (Uniform Resource Identifier):
• Elle permet d’attribuer un identifiant unique à un ensemble de ressources
(sur le Web, dans d’autres domaines (documents, téléphones portables,
personnes, etc.))
• En cours de standardisation
• Une autre caractéristique de tous ces langages est d’être systématiquement
exprimables et échangeables dans une syntaxe XML.
5
Le cadre du Web sémantique
Différents langages pour décrire, exploiter et raisonner sur
les contenus des ressources
Des connaissances qui s'appuient sur des ontologies
Utilisation de métadonnées
Intégration automatique d'informations provenant de
sources hétérogènes
Utilisation et combinaison automatique de services Web
7
Histoire des Ontologies
8
Histoire des Ontologies
9
Histoire des Ontologies
10
Histoire des Ontologies
Logiques de description
12
Histoire des Ontologies
13
Histoire des Ontologies
RDF
Resource Description Framework
14
Histoire des Ontologies
Communauté IC Communauté WS
HTTP
16
Historique : web de base
• Une couche applicative au dessus d'Internet (TCP/IP):
• HTML 1.0 (1992) HyperText Markup Language
http://www.w3.org/History/19921103-hypertext/hypertext/WWW/MarkUp/MarkUp.html
• Uniform Resource Locator (URL): RFC Dec. 1994
• HTML 2.0: RFC Novembre 1995
• HTTP 1.0: RFC in Mai 1996
• HTML 3.2: Recommandation 1997
• HTML 4.01: Recommendation 2000
• XHTML 2.0: arrêt de travail 2009
• HTML 5: Recommandation du W3C 28 octobre 2014
• HTML 5.1: W3C Recommendation 2016
• HTML 5.2: W3C Recommendation, 14 December 2017
• Normaliser les extensions les plus courantes
Tableaux, texte autour images, applets, indices/exposants
• Evolutions suivantes (Scripts, Stylesheets)
17
Historique : web structuré
HTTP/D XML
DTD - XML
Schema
18
Historique : web structuré
• Extensible Markup Language 1.0 Rec. 1998
XML 1.0 (Fifth Edition) W3C Recommendation 26 Novembre 2008
XML 1.1 (Second Edition), W3C Recommendation, 16 August 2006
• Un format textuel d'échange de données structurées
• Standard pour définir des langages balisés
• XML 2.0, XML Binary
19
Historique : web structuré
• Définir ses tag / balises / étiquettes / éléments
<?xml version="1.0" encoding="ISO-8859-1"?>
<post_it>
<urgent />
<sujet>Réunion</sujet>
<date>11-11-2011</date>
<message>Salle de réunion à 10h pour budget</message>
</post_it>
• Version et encodage
• Eléments en XML bien formé :
• une seule racine, balises emboîtées, balises fermées, balises
vides, majuscule/minuscules, pas commencer par un chiffre
ou par "xml", pas d’espaces dans les noms de balises…
20
Historique : web structuré
• Paramétrer / préciser une balise
<?xml version="1.0" encoding="ISO-8859-1"?>
<post_it importance="urgent">
<sujet>Réunion</sujet>
<date>11-11-2011</date>
<message xml:lang="fr"> Salle de réunion à 10h pour
budget</message>
</post_it>
21
Historique : web structuré
• Un document bien formé respecte le format XML
• Un document valide est un document bien formé qui respecte
une DTD ou un Schéma XML
• DTD / Schéma: standardiser et échanger des structures
• DTD: balises autorisées, attributs et enchaînements
• XML Schema est son successeur: une syntaxe XML et des
extensions (datatypes, types complexes, etc.)
• Uniform Resource Identifier
(URI RFC 2396 Août 1998, RFC 3986 Janvier 2005)
• Identificateur unique d’une ressource abstraite ou physique
exemple:
ldap://[2001:db8::7]/c=GB?objectClass?one
• URL = sous ensemble des URI (ID et localisation)
22
Historique : web structuré
HTTP/D XML
XLink
23
Historique : web sémantique
RDFS
OWL
RDF inférences
HTTP/D XML
XLink
24
Web sémantique : vision W3C
26
Web Sémantique
Évolution du Web pour permettre le
traitement des informations par des
programmes
Documents et données structurés (XML)
Associer sémantique (sens) aux documents
“A new form of Web content that is
meaningful to computers” Tim Berners-Lee
27
Sémantique
Sens, Meaning ?
28
XML
Définit la structure (syntaxe) comme un
arbre de syntaxe abstraite.
Mais rien sur la signification, le sens : la
sémantique
La sémantique permet de définir la
signification des balises, donc des
informations.
– Contraint les traitements
29
XML
30
XML
32
Sémantique
<book> book is a kind of Document
<authors> Documents have one or more
authors.
<author> an author is a Person
<title> a title which is a Literal
…
33
Sémantique
Objectif
– Décrire le sens avec un certain consensus.
– En utilisant des vocabulaires standardisés :
annotations et ontologies.
34
Applications
35
Applications
Annotation de documents multimédia :
trouver une séquence avec une condition
Site Web d’entreprise structuré par un
référentiel
Ingénierie des connaissances:
– Acquisition, capitalisation, modélisation,
partage, extraction, réutilisation … de
connaissances.
Bases de données ontologiques
Construction d’entrepôt de données
…
36
Quelques problématiques /
Recherche
Construction automatique d’ontologies
Alignement d’ontologies
Ontologies multi-expertes
…
Syntaxe, représentation, raisonnement …
37