Vous êtes sur la page 1sur 156

Formation Perfect Memory

LE WEB SÉMANTIQUE

Le Web Sémantique
Partie 1: Principes théoriques et standards

Cédric Klein - cedric.klein@perfect-memory.com


1
Formation Perfect Memory
LE WEB SÉMANTIQUE À propos

Personne

sous type de
auteur
contributeur
Cette formation permet d’appréhender les technologies
sémantiques dans leur ensemble: à quelles problématiques
répondent-elles ? Quels sont les standards et concepts à
maitriser ? Elle permet également d’introduire leurs usages
dans la plateforme de Perfect Memory.
COO Ingénieur sémantique

description
est est

Le Web Sémantique enseigne Cédric Klein

proposée à
travaille chez

ISIMA / UCA Perfect Memory


est spécialisé dans
est un
Établissement Éditeur logiciel
est un d’enseignement
Technologies sémantiques
sous type de
sous type de

Organisation 2
Formation Perfect Memory
LE WEB SÉMANTIQUE Sommaire

1. Le Web et les données : histoire et évolutions


2. Les limites de la donnée par l’exemple
3. Donner du sens aux données
4. La question du langage
5. L’ontologie
6. Des bases interopérables
7. L’inférence sémantique
8. Le spectre de représentation de la connaissance
9. Les standards – construction et requêtage d’un graphe sémantique
10. Atelier pratique – mise en œuvre du SPARQL
11. Les standards – modélisation d’une ontologie
12. Autres standards de structuration
13. De la table au graphe
14. Atelier pratique – introduction à l’éditeur d’ontologie Protégé
15. Cas d’usage industriels
16. Résumé et limitations
17. Mise en œuvre et plateforme Raffiné™ 3
Formation Perfect Memory
LE WEB SÉMANTIQUE

Question, observation
N’hésitez pas à demander

4
Formation Perfect Memory
LE WEB SÉMANTIQUE

1 Le Web et la donnée
Histoire et évolutions

5
Formation Perfect Memory
LE WEB SÉMANTIQUE 1 Le Web et la donnée – histoire et évolutions

1969 2021

6
Formation Perfect Memory
LE WEB SÉMANTIQUE 1 Le Web et la donnée – histoire et évolutions

1969 - Arpanet
On accède aux documents un par un en les téléchargeant

7
Formation Perfect Memory
LE WEB SÉMANTIQUE 1 Le Web et la donnée – histoire et évolutions

1. Ouvrir un terminal
2. Se connecter au serveur distant
3. Localiser le document sur le serveur distant
4. Télécharger le document sur sa machine locale L’accès à la donnée requiert une expertise
technique
5. Couper la connexion
6. Consulter le document sur sa machine locale
L’accès à la donnée demande du temps

Extraire l’information intéressante


prend du temps

8
Formation Perfect Memory
LE WEB SÉMANTIQUE 1 Le Web et la donnée – histoire et évolutions

1990 - World Wide Web

Web structuré
Robert Cailliau

Tim Berners-Lee

9
Formation Perfect Memory
LE WEB SÉMANTIQUE 1 Le Web et la donnée – histoire et évolutions

Aucune compétence technique requise

L’accès au document est simplifié

L’accès à l’information intéressante est facilité par


l’indexation (moteurs de recherche, …)

10
Formation Perfect Memory
LE WEB SÉMANTIQUE 1 Le Web et la donnée – histoire et évolutions

Du Web 1.0… …au Web 2.0

90’s 2000’s

Émergence de services collaboratifs (blogs, wikis, forums, réseaux


Ajouter du contenu requiert une expertise sociaux)
technique
Explosion des UGC
Lecture seule
Explosion du nombre de données

Tout le monde devient créateur de contenus 11


Formation Perfect Memory
LE WEB SÉMANTIQUE 1 Le Web et la donnée – histoire et évolutions

12
Formation Perfect Memory
LE WEB SÉMANTIQUE 1 Le Web et la donnée – histoire et évolutions

13
Formation Perfect Memory
LE WEB SÉMANTIQUE 1 Le Web et la donnée – histoire et évolutions

Aujourd’hui et demain

De plus en plus de supports De plus en plus de créateurs de contenus De plus en plus de données

14
Formation Perfect Memory
LE WEB SÉMANTIQUE 1 Le Web et la donnée – histoire et
évolutions

Ça devient problématique

15
Formation Perfect Memory
LE WEB SÉMANTIQUE 1 Le Web et la donnée – histoire et
évolutions
Exercice collectif
À votre tour

Que signifie « Jaguar » ?

Que signifie « TNT » ?

Que signifie «Ronaldo » ?

16
Formation Perfect Memory
LE WEB SÉMANTIQUE 1 Le Web et la donnée – histoire et
évolutions
Exercice collectif
Réponses

Sans contexte, toute demande d’information est


potentiellement une source d’erreurs.
17
Formation Perfect Memory
LE WEB SÉMANTIQUE

2 Les limites de la
donnée par l’exemple

18
Formation Perfect Memory
LE WEB SÉMANTIQUE 2 Limites de la donnée par l’exemple

19
Formation Perfect Memory
LE WEB SÉMANTIQUE 2 Limites de la donnée par l’exemple

Information

Data

20
Formation Perfect Memory
LE WEB SÉMANTIQUE 2 Limites de la donnée par l’exemple

Information

Data

21
Formation Perfect Memory
LE WEB SÉMANTIQUE 2 Limites de la donnée par l’exemple

22
Formation Perfect Memory
LE WEB SÉMANTIQUE 2 Limites de la donnée par l’exemple

Information

Data

23
Formation Perfect Memory
LE WEB SÉMANTIQUE 2 Limites de la donnée par l’exemple

24
Formation Perfect Memory
LE WEB SÉMANTIQUE 2 Limites de la donnée par l’exemple
La prise en compte du contexte

25
Formation Perfect Memory
LE WEB SÉMANTIQUE 2 Limites de la donnée par l’exemple
La prise en compte du contexte

France

26
Formation Perfect Memory
LE WEB SÉMANTIQUE 2 Limites de la donnée par l’exemple
La recherche d’information

27
Formation Perfect Memory
LE WEB SÉMANTIQUE 2 Limites de la donnée par l’exemple
La recherche d’information

28
Formation Perfect Memory
LE WEB SÉMANTIQUE 2 Limites de la donnée par l’exemple
La recherche d’information

29
Formation Perfect Memory
LE WEB SÉMANTIQUE 2 Limites de la donnée par l’exemple
La recherche d’information

30
Formation Perfect Memory
LE WEB SÉMANTIQUE 2 Limites de la donnée par l’exemple
La recherche d’information

31
Formation Perfect Memory
LE WEB SÉMANTIQUE 2 Limites de la donnée par l’exemple
Transmission

« jaguar »

32
Formation Perfect Memory
LE WEB SÉMANTIQUE 2 Limites de la donnée par l’exemple
En bref

Un même symbole peut avoir plusieurs interprétations différentes

Deux symboles peuvent donner lieu à la même information

Le contexte peut mener à deux informations différentes

Faire la différence entre Donnée et Information

33
Formation Perfect Memory
LE WEB SÉMANTIQUE

Quizz 1

34
Formation Perfect Memory
LE WEB SÉMANTIQUE Quizz 1

Le Web actuel se base sur le langage HTML. Ce langage décrit:


Une seule réponse

A Comment l’information est affichée

B Le sens de l’information

C Comment l’information est stockée

35
Formation Perfect Memory
LE WEB SÉMANTIQUE Quizz 1

La donnée « Jaguar » …
Une seule réponse possible

A Définit une marque de voiture

B Définit un animal

C Définit une succession de lettres

D Les 3 réponses

37
Formation Perfect Memory
LE WEB SÉMANTIQUE Quizz 1

Lesquelles des propositions ci-dessous évoquent les problèmes des systèmes basés sur les
technologies actuelles ?
Plusieurs réponses possibles

A Les liens entre les pages n’ont pas de signification

B Confusion entre présentation et signification

C Les documents sont long à télécharger

D Un même symbole peut avoir plusieurs interprétations différentes

E Ils ne sont pas adaptés aux documents vidéos et photos

38
Formation Perfect Memory
LE WEB SÉMANTIQUE Quizz 1

Qu’est-ce que ceci ?

39
Formation Perfect Memory
LE WEB SÉMANTIQUE Quizz 1

Qu’est-ce que ceci ?

40
Formation Perfect Memory
LE WEB SÉMANTIQUE

« La représentation d’un objet n’est pas l’objet lui-même. »

41
Formation Perfect Memory
LE WEB SÉMANTIQUE

3. Donner du sens aux


données

42
Formation Perfect Memory
LE WEB SÉMANTIQUE 3 Donner du sens aux données

43
Formation Perfect Memory
LE WEB SÉMANTIQUE 3 Donner du sens aux données
La couche donnée

Donnée

44
Formation Perfect Memory
LE WEB SÉMANTIQUE 3 Donner du sens aux données
La couche donnée

‘’ 15 ‘’

‘’ 2 ‘’

‘’ TGV ‘’

45
Formation Perfect Memory
LE WEB SÉMANTIQUE 3 Donner du sens aux données
La couche donnée

« La donnée est une inscription formatée minimale renvoyant à un fait »


Pr. Bruno Bachimont

Formatée : formulée dans un langage pourvue d’une syntaxe formelle et manipulable par une machine

Minimale : indécomposable en faits plus élémentaires ou sous-propositions

Fait : pourvue d’une valeur de vérité

46
Formation Perfect Memory
LE WEB SÉMANTIQUE 3 Donner du sens aux données
La couche donnée

« La donnée possède une signification non contextuelle »


Pr. Bruno Bachimont

âge = « 70 »
âge est une valeur pouvant varier de 0 à 150 de type entier naturel

47
Formation Perfect Memory
LE WEB SÉMANTIQUE 3 Donner du sens aux données
La couche information

Information

Donnée

48
Formation Perfect Memory
LE WEB SÉMANTIQUE 3 Donner du sens aux données
La couche information

‘’ 15 ‘’
Voiture n°15

‘’ 2 ‘’
2nde classe
‘’ TGV ‘’
TGV

49
Formation Perfect Memory
LE WEB SÉMANTIQUE 3 Donner du sens aux données
La couche information

« L’information correspond à la donnée mise en réseau. »


Pr. Bruno Bachimont

Réseau : la donnée peut être articulée et ou mise en relation avec d’autres données (schéma
relationnel, graphe, …)
Le réseau permet d’interpréter les données.

50
Formation Perfect Memory
LE WEB SÉMANTIQUE 3 Donner du sens aux données
La couche information

« La donnée est une représentation de l’information.


L’information est extraite par l’interprétation de la donnée.»

51
Formation Perfect Memory
LE WEB SÉMANTIQUE 3 Donner du sens aux données
La couche connaissance

Connaissance

Information

Donnée

52
Formation Perfect Memory
LE WEB SÉMANTIQUE 3 Donner du sens aux données
La couche connaissance

SNCF
‘’ 15 ‘’ Quai de gare
Voiture n°15
Billet moins cher

‘’ 2 ‘’
2nde classe
‘’ TGV ‘’
TGV

53
Formation Perfect Memory
LE WEB SÉMANTIQUE 3 Donner du sens aux données
La couche connaissance

« La connaissance est l’information plongée dans un contexte


d’interprétation. »
Pr. Bruno Bachimont

L’interprétation est enrichie par des règles contextuelles, culturelles et métiers.

âge = « 70 »
Dossier administratif : droits à la protection sociale
Dossier médical : facteur de risque

54
Formation Perfect Memory
LE WEB SÉMANTIQUE 3 Donner du sens aux données
La couche sagesse

Sagesse

Connaissance

Information

Donnée

55
Formation Perfect Memory
LE WEB SÉMANTIQUE 3 Donner du sens aux données
La couche sagesse

« Est sage celui qui possède les interprétants permettant de


dégager le sens des énoncés en contexte. »
Pr. Bruno Bachimont

C’est la capacité à prendre des décisions en toute connaissance, dont la machine est par
nature exclue.

56
Formation Perfect Memory
LE WEB SÉMANTIQUE

4. La question du langage

57
Formation Perfect Memory
LE WEB SÉMANTIQUE 4 La question du langage
Parler la même langue
Déception Stade Geoffroy-Guichard
Début du match
Action de jeu
Ligue des Champions

Coupe de la ligue
Première période Match amical
Kylian Mbappé
Neymar
Coup franc Coupe de France
Main Gardien
Tacle
Déplacement
Attaquant Corner Joie

Volley
Rose Termes
Interception Football masculin Handball
But Dribble Stade Gabriel-Montpied

Football féminin Football Bleu


Hôtel
Passe
Reprise de volley Blanc
Passe longue
Violence
Coupe de France féminine
Défenseur Colère
Stade de France Parc des Princes
58
Formation Perfect Memory
LE WEB SÉMANTIQUE 4 La question du langage
Parler la même langue

Début du match Stade Geoffroy-Guichard


Déception Ligue des Champions
Coup franc Kylian Mbappé
Action de jeu Neymar
Coupe de la ligue Coupe de France
Match amical Déplacement
Première période Stade Gabriel-Montpied
Main
Passe longue
Gardien
Football féminin
Tacle
Défenseur
Joie
Football

Liste
Corner
Volley Hôtel
Rose Dribble
Football masculin Passe
Handball Blanc
Interception Attaquant
But Violence
Bleu Coupe de France féminine
Reprise de volley
Colère
Parc des Princes
Stade de France

59
Formation Perfect Memory
LE WEB SÉMANTIQUE 4 La question du langage
Parler la même langue
Action de jeu Couleurs

Début du match Rose

Coup franc Bleu


Main
Blanc
Tacle

Corner

Interception

But

Dribble Taxonomie
Passe

Reprise de volley

Passe longue

Postes

Gardien

Attaquant

Défenseur

60
Formation Perfect Memory
LE WEB SÉMANTIQUE 4 La question du langage
Parler la même langue
Action de jeu Couleurs

Début du match Rose

Coup franc Bleu « couleur à domicile »


Main
Blanc « couleur en extérieur »
Tacle

Corner

Interception

But « donne un point supplémentaire »

Dribble Thésaurus
Passe

Reprise de volley

Passe longue

Postes

Gardien

Attaquant -> lié à But

Défenseur

61
Formation Perfect Memory
LE WEB SÉMANTIQUE 4 La question du langage
Parler la même langue

Quel est le prochain niveau ?

62
Formation Perfect Memory
LE WEB SÉMANTIQUE

5. L’ontologie

63
Formation Perfect Memory
LE WEB SÉMANTIQUE 5 L’ontologie
Le triangle sémiotique

Concept Jaguar (Animal)


Signifié

représente
symbolise

« jaguar » Symbole Référent


Signifiant réfère Thing / Chose

64
Perfect Memory Formation 64
Formation Perfect Memory
LE WEB SÉMANTIQUE 5 L’ontologie
Le triangle sémiotique

Concept Attentats de New-York


Signifié

représente
symbolise

« 11/09/2001 » Symbole Référent


Signifiant réfère Thing / Chose

65
Perfect Memory Formation 65
Formation Perfect Memory
LE WEB SÉMANTIQUE 5 L’ontologie
Du symbole au concept

« Jaguar » « Panthera onca »

« ジャガー »
#jaguar Animal

http://fr.wikipedia.org/wiki/Jaguar
#Animal

66
Formation Perfect Memory
LE WEB SÉMANTIQUE 5 L’ontologie
Du symbole au concept

« jaguar » « automobile Jaguar »

#Automobile

#jaguar Automobile

67
Formation Perfect Memory
LE WEB SÉMANTIQUE 5 L’ontologie
Du symbole au concept

« jaguar » « ‫» )شركة(جاغوار‬

#Organisation
#jaguar Organization

« Jaguar Cars Ltd »

68
Formation Perfect Memory
LE WEB SÉMANTIQUE 5 L’ontologie
Parler la même langue

effectue
Ontologie
Compétition
Couleur
Stade

porte compétition
est tournée à

Joueur met à l’image Séquence vidéo met à l’image Action de jeu

Faute
affiche sous-type de

joue dans filme

joue au poste

Discipline Emotion

est associé à
Poste

69
Formation Perfect Memory
LE WEB SÉMANTIQUE 5 L’ontologie
Parler la même langue

quartier général

Organisation
employé à
Personne
Document
Lieu
réside à est un sous type de master

master
Ville Client contractualise Contrat
est un sous type de
émet
est localisée à
loue Facture

est la capitale de

Pays Équipement

est un sous type de

Téléphone Box TV

70
Formation Perfect Memory
LE WEB SÉMANTIQUE 5 L’ontologie
L’ontologie: définition philosophique

« L’ontologie est l’étude philosophique de


l’être. Plus largement, c’est l’étude des
concepts qui se rapportent directement à
l’être, en particulier à l’existence, à la
réalité, ainsi qu’aux catégories
fondamentales de l’être et de leurs
relations. »

Wikipedia
71
Formation Perfect Memory
LE WEB SÉMANTIQUE 5 L’ontologie
Définition informatique

Conceptualisation
Modèle, domaine, concepts, relations, propriétés, instances, contextes

Explicite
Tout l’univers d’un cas d’usage donné doit être défini

Formelle
Compréhensible par la machine

Partagée
Doit être le fruit d’un consensus

72
Formation Perfect Memory
LE WEB SÉMANTIQUE 5 L’ontologie
Définition informatique

Représentation formelle de la
connaissance en vue de son
stockage, son partage et son
traitement

73
Formation Perfect Memory
LE WEB SÉMANTIQUE 5 L’ontologie

Et donc comment ça s’instancie ?

74
Formation Perfect Memory
LE WEB SÉMANTIQUE 5 L’ontologie
Parler la même langue

effectue

#Ligue Champions
#Blanc
#Parc des Princes

compétition
porte
est tournée à

#Neymar met à l’image Clip #123 met à l’image #Tacle #But

#Passe longue
affiche
joue dans filme

joue au poste

#Football masculin #Joie

est associé à
#Attaquant

75
Formation Perfect Memory
LE WEB SÉMANTIQUE 5 L’ontologie
Parler la même langue

quartier général

Centrale nucléaire

B_Simpson.pdf

employé à
master
réside à

Springfield Homer Simpson contractualise Forfait B&You #123

émet
est localisé à loue

Facture Octobre 2021


Etats-Unis iPhone 13

76
Formation Perfect Memory
LE WEB SÉMANTIQUE 5 L’ontologie

Du paradigme de l’arbre à
celui du graphe

77
Formation Perfect Memory
LE WEB SÉMANTIQUE 5 L’ontologie
Le paradigme de l’arbre

78
Formation Perfect Memory
LE WEB SÉMANTIQUE 5 L’ontologie
Se débarrasser du paradigme de l’arbre

prédicat
sujet objet
Ressource Ressource ou Literal

est une
Bouygues Telecom Entreprise
Resource Ressource

est dirigeant de
Richard Viel Bouygues Telecom
Ressource Ressource

date de création
Bouygues Telecom 04/10/1994
Ressource Literal

79
Formation Perfect Memory
LE WEB SÉMANTIQUE 5 L’ontologie
Se débarrasser du paradigme de l’arbre

Entreprise

est une

Richard Viel est dirigeant de Bouygues Telecom

date de création

04/10/1994

80
Formation Perfect Memory
LE WEB SÉMANTIQUE 5 L’ontologie
Se débarrasser du paradigme de l’arbre

Entreprise

est une

Richard Viel est dirigeant de Bouygues Telecom


logo
prénom miniature
date de création label
nom
« Richard » « Bouygues Telecom »@fr
« Viel » 04/10/1994

81
Formation Perfect Memory
LE WEB SÉMANTIQUE

6. Des bases
interopérables

82
Formation Perfect Memory
LE WEB SÉMANTIQUE 6 Des bases interopérables
Le Linked Open Data

Source: http://planet-data.eu/ 83 83
Formation Perfect Memory
LE WEB SÉMANTIQUE 6 Des bases interopérables
Le Linked Open Data

84
Formation Perfect Memory
LE WEB SÉMANTIQUE 6 Des bases interopérables
Le Linked Open Data

85
Formation Perfect Memory
LE WEB SÉMANTIQUE 6 Des bases interopérables
Le Linked Open Data

86
Formation Perfect Memory
LE WEB SÉMANTIQUE 6 Des bases interopérables
Le Web 3.0

Document
Document
Document

Relation sémantique Ressource


Ressource

Relation sémantique

Ressource
Ressource
Ressource

87
Formation Perfect Memory
LE WEB SÉMANTIQUE

7. L’inférence sémantique

88
Formation Perfect Memory
LE WEB SÉMANTIQUE 7 L’inférence sémantique
Donner des capacités de raisonnement à la machine

Règles d’inférence

Règle 1
Règle 2
Information
Informations stockées
Information
Information Raisonneur sémantique
Information
Information

89
Formation Perfect Memory
LE WEB SÉMANTIQUE 7 L’inférence sémantique
Donner des capacités de raisonnement à la machine

Homer est le père de Bart

Le frère de mon père est


est le frère de mon oncle

Herbert

Homer est le père de Bart


est de la même famille que
est l’oncle de
est le frère de

est de la même famille que est de la même famille que

Herbert

90
Formation Perfect Memory
LE WEB SÉMANTIQUE

8. Le spectre de
représentation de la
connaissance

91
Formation Perfect Memory
LE WEB SÉMANTIQUE 8 Le spectre de représentation de la connaissance

92
Formation Perfect Memory
LE WEB SÉMANTIQUE 8 Le spectre de représentation de la connaissance

Programmation logique

• Des faits, des règles et un interpréteur

• Le système ne doit contenir que des faits vrais

Si A alors B

93
Formation Perfect Memory
LE WEB SÉMANTIQUE 8 Le spectre de représentation de la connaissance

Logique de 1er ordre (ou predicate logic)

• Syntaxe : symboles et expressions pour définir le vocabulaire de base

• Sémantique : définit le sens de chaque expression. Aucune ambiguïté

• Prédicats

• Connecteurs logiques : et, ou, implique, …

• Quantificateurs : ∀ et ∃

Mars est une planète

Jupiter est plus grand que Mars

94
Formation Perfect Memory
LE WEB SÉMANTIQUE 8 Le spectre de représentation de la connaissance

Logique de description
• Formaliser la description de concepts pertinents et leur sémantique dans un domaine d’application donné

• Concepts : classe d’éléments dans un univers donné

• Rôles (prédicats) : liens entre les éléments. Relations binaires

• Individus : éléments d’un univers donné

• Opérateurs : <, >, ET, OU, quantificateur

• Axiomes : faits

• Règles : SI A alors B

• Décrit un univers donné en terme de propriétés et de contraintes qu’un individu doit satisfaire

95
Formation Perfect Memory
LE WEB SÉMANTIQUE 8 Le spectre de représentation de la connaissance

Logique de description

Une planète est soit tellurique, soit gazeuse

Une planète tellurique possède toujours 1 manteau

Mars est une planète tellurique

96
Formation Perfect Memory
LE WEB SÉMANTIQUE 8 Le spectre de représentation de la connaissance

Logique modale
• Une modalité spécifie des qualités du vrai

• pourrait, peut-être, possible, impossible, nécessaire, généralement, …

• Un fait peut être potentiellement vrai

Il y a peut-être de l’eau sur Mars

L’hiver il fait généralement froid

97
Formation Perfect Memory
LE WEB SÉMANTIQUE 8 Le spectre de représentation de la connaissance

Logique de 2nd ordre

• Permet des quantificateurs sur les prédicats

Il y a de l’eau sur Mars et il n’y a pas d’eau sur Mars

98
Formation Perfect Memory
LE WEB SÉMANTIQUE 8 Le spectre de représentation de la connaissance

99
Formation Perfect Memory
LE WEB SÉMANTIQUE 8 Le spectre de représentation de la connaissance

? Existe-t-il un glossaire centralisé

? Est-ce que le glossaire inclut des définitions précises de chaque terme

? Existe-t-il un entrepôt central stockant les données, y compris leurs types

? Est-ce que les données codifiées répondent à une énumération exhaustive ?

? Existe-t-il un moyen de supprimer les données dupliquées ou redondantes ?

? Existe-t-il des modèles de classification permettant classifier chaque donnée ?

? Est-ce que les workflows et web services utilisent ces même modèles ?

? Est-ce que l’entrepôt peut être utilisé au sein d’une architecture orientée modèle métier

? Est-ce que les utilisateurs sont formés pour extraire et réutiliser les données de l’entrepôt 100
Formation Perfect Memory
LE WEB SÉMANTIQUE 8 Le spectre de représentation de la connaissance

Quelle technologie
permet d’élever la
machine au niveau de
l’interopérabilité
sémantique

101
Formation Perfect Memory
LE WEB SÉMANTIQUE 3 Donner du sens aux données
La couche sagesse

Sagesse

Connaissance

Information

Donnée

102
Formation Perfect Memory
LE WEB SÉMANTIQUE 5 L’ontologie
Le triangle sémiotique

Concept Attentats de New-York


Signifié

représente
symbolise

« 11/09/2001 » Symbole Référent


Signifiant réfère Thing / Chose

103
Perfect Memory Formation 103
Formation Perfect Memory
LE WEB SÉMANTIQUE

Quizz 2

104
Formation Perfect Memory
LE WEB SÉMANTIQUE Quizz 2

Qu’est-ce que la sémantique ?


Une seule réponse possible

A L’étude du bon choix de langage pour répondre à une situation donnée

B L’étude des concepts, des relations qui les lient et ce qu’ils représentent

C L’étude du sens des signes et symboles

105
Formation Perfect Memory
LE WEB SÉMANTIQUE Quizz 2

Que signifie “compréhensible par la machine“ ?


Une seule réponse possible

A Le contenu est correctement structuré pour être affiché d’une manière compréhensible pour un humain

B Le contenu est correctement structuré pour être stocké de façon performante

C Le contenu peut être lu et interprété par la machine

D Le contenu peut être transformé sémantiquement par la machine

106
Formation Perfect Memory
LE WEB SÉMANTIQUE Quizz 2

L’inférence sémantique consiste à ….


Une seule réponse possible

A La détection d’erreurs de données

B La création de nouvelles informations

C La révélation d’informations

107
Formation Perfect Memory
LE WEB SÉMANTIQUE Quizz 2

Qu’est-ce qu’une ontologie ?


Une seule réponse possible

A Une base de données de graphe

B Un thesaurus hiérarchisant des termes entre eux selon différents axes

C Un modèle décrivant comment presenter l’information aux utilisateurs

D La description de concepts, relations et propriétés décrivant un univers fini

108
Formation Perfect Memory
LE WEB SÉMANTIQUE Quizz 2

Qu’est-ce que le Linked Open Data ?


Une seule réponse possible

A Un ensemble de bases d’informations structurées, connectées et ouvertes

B Un ensemble de bases documentaires axées sur des domaines spécifiques et ouvertes

C Un conglomérat de sites web encyclopédiques axés sur des domaines spécifiques et ouverts

D Aucune idée

109
Formation Perfect Memory
LE WEB SÉMANTIQUE Quizz 2

Une ontologie doit être


Plusieurs réponses possibles

A explicite D exhaustive

B formellement décrite E évolutive

C partagée (fruit d’un consensus) F documentée

110
Formation Perfect Memory
LE WEB SÉMANTIQUE

9. Les standards
Construction et
requêtage d’un graphe
sémantique
111
Formation Perfect Memory
LE WEB SÉMANTIQUE 9 Les standards – Construction et requêtage
W3C

a pour président

Tim Berners-Lee

112
Formation Perfect Memory
LE WEB SÉMANTIQUE 9 Les standards – Construction et requêtage
L’identification des ressources

• Ressource : Tout élément à décrire, avec une identité claire dans le contexte d’application

• URL (Uniform Resource Locator) : Identifie l’emplacement d’une ressource et le moyen d’agir sur elle

• URN (Uniform Resource Name) : Identifie une ressource indépendamment de son emplacement

• URI (Unique Resource Identifier) : Identifie une ressource de manière permanente

• URL : http://www.en.wikipedia.org/wiki/Uniform_resource_locator
• URN : urn:isbn:0-395-36341-1
• URI in the Semantic Web: http://dbpedia.org/resource/Uniform_resource_identifier
dbpedia:Uniform_resource_identifier

113
Formation Perfect Memory
LE WEB SÉMANTIQUE 9 Les standards – Construction et requêtage
L’identification des ressources

identifie
http://www.bouygues.fr/resource/ richard_viel bt:richard_viel

namespace
identifiant

identifie
http://www. bouygues.fr/resource/ bouygues_telecom bt : bouygues_telecom

namespace
identifiant

114
Formation Perfect Memory
LE WEB SÉMANTIQUE 9 Les standards – Construction et requêtage
RDF: Resource Description Framework

RDF
115
Formation Perfect Memory
LE WEB SÉMANTIQUE 9 Les standards – Construction et requêtage
RDF: Resource Description Framework

RDF

• Ressource : tout élément à décrire, avec une identité claire dans le contexte d’application

• Description : décrit des ressources, des propriétés et des relations

• Framework : ensemble d’outils et protocoles (URI, HTTP, XML, …), basé sur un modèle formel standard (sémantique)

116
Formation Perfect Memory
LE WEB SÉMANTIQUE 9 Les standards – Construction et requêtage
RDF: Resource Description Framework

prédicat
sujet objet
Ressource Ressource ou Literal

est une
Bouygues Telecom Entreprise
Resource Ressource

est dirigeant de
Richard Viel Bouygues Telecom
Ressource Ressource

date de création
Bouygues Telecom 04/10/1994
Ressource Literal

117
Formation Perfect Memory
LE WEB SÉMANTIQUE 9 Les standards – Construction et requêtage
RDF: Resource Description Framework

Sujet Prédicat Object

http://www.bouygues.fr/resource/bouygues_telecom http://www.bouygues.fr/resource/Entreprise

uri Ressource uri Ressource

http://www.w3.org/1999/02/22-rdf-syntax-ns#type
uri Prédicat

http://www.bouygues.fr/resource/bouygues_telecom « 1994-10-04 »^^xsd:date


uri Ressource Literal

http://www.bouygues.fr/resource/creationDate
uri Prédicat

118
Formation Perfect Memory
LE WEB SÉMANTIQUE 9 Les standards – Construction et requêtage
RDF: Resource Description Framework

Sujet Prédicat Objet

bt:bouygues_telecom bt:Entreprise

uri Ressource uri Ressource

rdf:type
uri Prédicat

bt:bouygues_telecom « 1994-10-04 »^^xsd:date


uri Ressource Literal

bt:creationDate
uri Prédicat

119
Formation Perfect Memory
LE WEB SÉMANTIQUE 9 Les standards – Construction et requêtage
RDF: Resource Description Framework

bt:Entreprise

rdf:type

bt:bouygues_telecom

bt:creationDate

« 04/10/1994 »^^xsd:date

120
Formation Perfect Memory
LE WEB SÉMANTIQUE 9 Les standards – Construction et requêtage
RDF: Comment stocker et sérialiser une information ?

RDF/XML
<?xml version="1.0" encoding="utf-8" ?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#">
<rdf:Description rdf:about="http://www.bouygues.fr/resource/bouygues_telecom">
<rdf:type rdf:resource="http://www.bouygues.fr/Entreprise"/> bt:Entreprise
</rdf:Description>
</rdf:RDF>
rdf:type
Turtle
bt:bouygues_telecom
<http://www.bouygues.fr/bouygues_telecom> a <http://www.bouygues.fr/Entreprise> .

N-triples

< http://www.bouygues.fr/bouygues_telecom > <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> < http://www.bouygues.fr/Entreprise > .

JSON-LD {
"@context": {
"rdf": "http://www.w3.org/1999/02/22-rdf-syntax-ns#",
"xsd": "http://www.w3.org/2001/XMLSchema#"
},
"@id": "http://www.bouygues.fr/bouygues_telecom",
"@type": "http://www.bouygues.fr/Entreprise"
}
121
Formation Perfect Memory
LE WEB SÉMANTIQUE 9 Les standards – Construction et requêtage
RDFS: définir classes et relations

RDFS
122
Formation Perfect Memory
LE WEB SÉMANTIQUE 9 Les standards – Construction et requêtage
RDFS: définir classes et relations

bt:Entreprise Utilise RDF et ajoute des définitions pour:


• Ajoute des hiérarchies de classe
• Ajoute des hiérarchies de prédicats
rdfs:subClasOf
• Ajouter des contraintes sur les prédicats

bt:Entreprise_Telecommunication

rdf:type

:Bouygues_Telecom
bt:Entreprise

bt:localisé_à

rdfs:subPropertyOf bt:Lieu
:Paris

bt:siège_social

123
Formation Perfect Memory
LE WEB SÉMANTIQUE 9 Les standards – Construction et requêtage
SPARQL

SPARQL
124
Formation Perfect Memory
LE WEB SÉMANTIQUE 9 Les standards – Construction et requêtage
SPARQL

• Langage de requêtage sémantique standard depuis 2008 (version 1.0)

• SPARQL 1.1 publié et standard depuis mars 2013

125
Formation Perfect Memory
LE WEB SÉMANTIQUE 4 Les standards du Web
Sémantique SPARQL

• Requête l’information et non pas la donnée


Qui a joué dans #dix_pour_cent ?

ftv:Person Dans quoi a joué #camille_cottin ?

ftv:casting Quelles sont les personnes qui ont


ftv:Actor ftv:Serie joué dans une comédie ?
ftv:actedIn

rdfs:subClassOf
Quelles sont les personnes qui ont
joué dans une série ?
ftv:ComedySerie
rdf:type Donne-moi tous les acteurs
ftv:actedIn
#camille_cottin #dix_pour_cent
Donne moi toutes les séries
ftv:casting
Est-ce que #camille_cottin est une
actrice ?

126
Formation Perfect Memory
LE WEB SÉMANTIQUE 4 Les standards du Web
Sémantique SPARQL

• Requête l’information et non pas la donnée

ftv:Serie
Si deux personnes ont travaillé sur la Qui travaille sur #dix_pour_cent ?
même série, alors elles sont collègues rdfs:subClassOf

ftv:ComedySerie Qui travaille avec #camille_cottin ?


ftv:worksOn
rdf:type

ftv:actedIn
Qui travaille sur la même série ?
#camille_cottin #dix_pour_cent

ftv:hasDirected

#marc_fitoussi
ftv:worksOn

127
Formation Perfect Memory
LE WEB SÉMANTIQUE 4 Les standards du Web
Sémantique SPARQL

• Format des requêtes

128
Formation Perfect Memory
LE WEB SÉMANTIQUE 4 Les standards du Web
Sémantique SPARQL

Qui a joué dans #dix_pour_cent ?

PREFIX ftv:<http://ftv.com/>
ftv:Person PREFIX uuid:<http://www.perfect-memo ....>
SELECT ?actor

ftv:casting WHERE {
ftv:Actor ftv:Serie
ftv:actedIn
?actor ftv:actedIn uuid:dix_pour_cent
rdfs:subClassOf
}
ftv:ComedySerie
rdf:type ?actor
ftv:actedIn
#camille_cottin #dix_pour_cent
#camille_cottin
ftv:casting

129
Formation Perfect Memory
LE WEB SÉMANTIQUE 4 Les standards du Web
Sémantique SPARQL

Quelles sont les personnes qui ont


joué dans une comédie ?

PREFIX ftv:<http://ftv.com/>
ftv:Person SELECT ?actor ?serie

WHERE {
ftv:casting
ftv:Actor ftv:Serie ?actor ftv:actedIn ?serie.
ftv:actedIn
?serie rdf:type ftv:ComedySerie
rdfs:subClassOf
}
ftv:ComedySerie
rdf:type

ftv:actedIn
#camille_cottin #dix_pour_cent
?actor ?serie
ftv:casting
#camille_cottin #dix_pour_cent

130
Formation Perfect Memory
LE WEB SÉMANTIQUE 4 Les standards du Web
Sémantique SPARQL

Qui travaille sur la même série ?


• Requête l’information et non pas la donnée

PREFIX ftv:<http://ftv.com/>
ftv:Serie SELECT ?person1 ?person2
Si deux personnes ont travaillé sur la
même série, alors elles sont collègues rdfs:subClassOf WHERE {

ftv:ComedySerie ?person1 ftv:colleague ?person2 .


ftv:worksOn }
rdf:type

ftv:actedIn
#camille_cottin #dix_pour_cent

?person1 ?person2
#marc_fitoussi
ftv:hasDirected #camille_cottin #marc_fitoussi

ftv:worksOn
#marc_fitoussi #camille_cottin

131
Formation Perfect Memory
LE WEB SÉMANTIQUE 4 Les standards du Web
Sémantique SPARQL

Est-ce que #camille_cottin est une


actrice ?

PREFIX ftv:<http://ftv.com/>
ftv:Person ASK

WHERE {
ftv:casting
ftv:Actor ftv:Serie
ftv:actedIn #camille_cottin rdf:type ftv:Actor .
rdfs:subClassOf
}
ftv:ComedySerie
rdf:type

ftv:actedIn YES
#camille_cottin #dix_pour_cent
ftv:casting

132
Formation Perfect Memory
LE WEB SÉMANTIQUE 4 Les standards du Web
Sémantique SPARQL

• Mais il y a toujours un problème…

Ressource
Ressource

?person1 ?person2

#camille_cottin #marc_fitoussi
Relation porteuse de sens

Ressource #marc_fitoussi #camille_cottin


Ressource
Ressource

• SELECT: retourne un tableau => La modélisation sémantique est perdue


• CONSTRUCT: récupérer un graphe sémantique

133
Formation Perfect Memory
LE WEB SÉMANTIQUE 4 Les standards du Web
Sémantique SPARQL

Qui travaille sur la même série ?


• Requête l’information et non pas la donnée
PREFIX ftv:<http://ftv.com/>
CONSTRUCT {

ftv:Serie ?person1 ftv:colleague?person2


Si deux personnes ont travaillé sur la
même série, alors elles sont collègues rdfs:subClassOf
}
WHERE {
ftv:ComedySerie
ftv:worksOn ?person1 ftv:colleague ?person2 .
rdf:type
}
ftv:actedIn
#camille_cottin #dix_pour_cent

#marc_fitoussi
ftv:hasDirected
ftv:colleague
#camille_cottin #marc_fitoussi
ftv:worksOn

134
Formation Perfect Memory
LE WEB SÉMANTIQUE

10. Exercice Pratique


Introduction au SPARQL

135
Formation Perfect Memory
LE WEB SÉMANTIQUE

11. Les standards


Modélisation d’une
ontologie

136
Formation Perfect Memory
LE WEB SÉMANTIQUE 11 Les standards : Modélisation d’une ontologie

OWL
137
Formation Perfect Memory
LE WEB SÉMANTIQUE 11 Les standards : Modélisation d’une ontologie

OWL: une extension du RDF et RDFS pour construire des ontologies

Étend RDF et RDFS en ajoutant des vocabulaires supplémentaires:

• Ajoute des définitions d’équivalence et de disjonction sur les classes, les relations et les propriétés

• Ajoute des définitions d’égalité et d’inégalité sur les instances

• Ajoute des définitions d’inverse

• Ajoute des contraintes de cardinalité

138
Formation Perfect Memory
LE WEB SÉMANTIQUE 11 Les standards : Modélisation d’une ontologie

OWL: une extension du RDF et RDFS pour construire des ontologies

• Définition d’une classe

• Définition d’une propriété

• Définition d’une relation

139
Formation Perfect Memory
LE WEB SÉMANTIQUE 11 Les standards : Modélisation d’une ontologie

OWL: une extension du RDF et RDFS pour construire des ontologies

foaf:name

owl:equivalentClass foaf:givenName
bt:Person foaf:Person
foaf:surname
rdfs:subClassOf
foaf:mBox

bt:BusinessMan bt:Actor

foaf:name “Richard Viel”


rdf:type

foaf:givenName “Richard”
:Richad_Viel
foaf:surname “Viel”

foaf:mBox r.viel@bouyges-telecom.com

140
Formation Perfect Memory
LE WEB SÉMANTIQUE 11 Les standards : Modélisation d’une ontologie

OWL: une extension du RDF et RDFS pour construire des ontologies

Réutilisation des concepts,


relations et propriétés de cette

Votre
autre ontologie
Une autre
ontologie ontologie

141
Formation Perfect Memory
LE WEB SÉMANTIQUE 11 Les standards : Modélisation d’une ontologie

OWL: une extension du RDF et RDFS pour construire des ontologies

bt:Person

rdfs:subClassOf

bt:BusinessMan bt:Actor

rdf:type
“Martin Bouygues (born 3 May 1952) is the chairman and chief executive officer of the French
company Bouygues (around 130,000 people in the world); founded by his father Francis Bouygues in
owl:sameAs dbpedia:abstract 1952. In 2015 he was listed as the world’s 481st richest person, and is a billionaire.”
:Martin_Bouygues
dbpedia:Martin_Bouygues dbpedia:birthDate 1952-05-03

dbpedia:thumbnail

dbpedia:birthPlace
dbpedia:Suresnes

142
Formation Perfect Memory
LE WEB SÉMANTIQUE 11 Les standards : Modélisation d’une ontologie

OWL: une extension du RDF et RDFS pour construire des ontologies

Récupérer les relations et propriétés


d’une autre source
La même ressource
Votre ressource
ailleurs

143
Formation Perfect Memory
LE WEB SÉMANTIQUE 11 Les standards : Modélisation d’une ontologie

Inférence

144
Formation Perfect Memory
LE WEB SÉMANTIQUE 11 Les standards : Modélisation d’une ontologie
Inférence

Exemple de règle d’inférence dans un Triple Store

Id: music_linked_musicians

music <radiofrance:musicBand> band


band <radiofrance:musicBandMember> member
------------------------------------
music <radiofrance:artist> member

radiofrance:musicBandMember
radiofrance:musicBand

The Beatles

Yellow Submarine
John Lennon 145
Formation Perfect Memory
LE WEB SÉMANTIQUE

12. Autres standards de


structuration

146
Formation Perfect Memory
LE WEB SÉMANTIQUE 12 Autres standards de structuration
HTML Sémantique

147
Formation Perfect Memory
LE WEB SÉMANTIQUE 12 Autres standards de structuration
HTML Sémantique

Permet d’insérer de l’information structurée directement dans une page web, compréhensible par les
moteurs de recherche

• Microformats: ajout de métadonnées interprétables par le HTML


– hCalendar, hCard, etc…

• RDFa 1.1 depuis 2013 permet l’indexation dans le HTML5 => recommandation du

148
Formation Perfect Memory
LE WEB SÉMANTIQUE 12 Autres standards de structuration
HTML Sémantique

Microdata

• itemscope: l’item lui-même

• itemtype: définit le type de l’item selon une typologie valide

• itemid: identifiant unique de l’item

• itemprop: indique un attribute spécifique selon un vocabulaire

• datetime: date ou durée

149
Formation Perfect Memory
LE WEB SÉMANTIQUE 12 Autres standards de structuration
HTML Sémantique

150
Formation Perfect Memory
LE WEB SÉMANTIQUE 12 Autres standards de structuration
HTML Sémantique

Schema.org
Un schema microdata historique. Désormais un vocabulaire qui fait autorité.

151
Formation Perfect Memory
LE WEB SÉMANTIQUE 12 Autres standards de structuration
HTML Sémantique

152
Formation Perfect Memory
LE WEB SÉMANTIQUE 12 Autres standards de structuration
HTML Sémantique

153
Formation Perfect Memory
LE WEB SÉMANTIQUE 12 Autres standards de structuration
HTML Sémantique

https://schema.org/

https://search.google.com/structured-data/testing-tool/u/0/

https://developers.google.com/search/docs/guides/search-gallery

154
Formation Perfect Memory
LE WEB SÉMANTIQUE 12 Autres standards de structuration
HTML Sémantique

Limitations

• Les informations sémantiques sont embarqués directement dans le HTML: confusion entre présentation et représentation

• Pas d’inférence sémantique

• Très corrélé avec les algorithmes d’interprétation des moteurs de recherche privés

155
Formation Perfect Memory
LE WEB SÉMANTIQUE

Sources ✓ https://datascientest.com/nosql

✓ https://fr.slideshare.net/abrisse/adopte-une-bdd

✓ Description Logic: A Formal Foundation for Ontology Languages and Tools , Ian Horrock :

http://www.cs.ox.ac.uk/people/ian.horrocks/Seminars/download/Horrocks_Ian_pt1.pdf

✓ https://en.wikipedia.org/wiki/Logic_programming

✓ https://en.wikipedia.org/wiki/Description_logic

✓ https://en.wikipedia.org/wiki/First-order_logic

✓ https://en.wikipedia.org/wiki/Second-order_logic

✓ https://www.wolterskluwer.com/en/expert-insights/understand-the-three-levels-of-

interoperability

✓ www.flaticon.com

156
Formation Perfect Memory
LE WEB SÉMANTIQUE

Rejoignez-nous
Cédric Klein
cedric.klein@perfect-memory.com
www.perfect-memory.com

157

Vous aimerez peut-être aussi