Vous êtes sur la page 1sur 25

Intelligence Artificielle

Reprsentation des connaissances


Introduction au web smantique Alain Boucher
Institut de la Francophonie pour lInformatique (IFI, Vietnam) alain.boucher(arobas)auf.org Cours prpar pour l'Institut de Technologie du Cambodge (ITC)

Reprsentation des connaissances


Problme central en IA
L'IA cherche reproduire l'intelligence humaine L'intelligence humaine est base sur la connaissance Comment reprsenter la connaissance en informatique ?

Pour comprendre une scne ou une histoire, il faut trouver une correspondance entre les lments perus et les choses connus. Les perceptions brutes (les phnomnes) sont compris par associations aux catgories mentales (les concepts).
Cela exige une reprsentation.
Cours d'intelligence artificielle 2

Reprsentation des connaissances


Pour des problmes jouets, la reprsentation nest pas vraiment importante. Les domaines complexes demandent des reprsentations plus gnrales et plus flexibles. Comment reprsenter des concepts comme:
Actions, Temps, Objets physiques, Croyance.

Cours d'intelligence artificielle

Acquisition et modlisation
Mise en vidence de deux problmes en amont : L'acquisition des connaissances
Comment donner la connaissance une machine ? Nous tudierons l'apprentissage dans une prochaine sance

La modlisation des connaissances


Comment dfinir ce qu'est la connaissance ? Comment la traduire en structures manipulables par un logiciel ?

Cours d'intelligence artificielle

Logique du premier ordre


On a dj vu lutilisation de la logique pour reprsenter certaines connaissances. En logique du premier ordre (LPO), on peut utiliser les prdicats ou les objets pour reprsenter les catgories.
Ex: BallonDeFootball(b) ou BallonDeFootballs Membre(b, BallonDeFootballs) ou b BallonDeFootballs SousEnsemble(BallonDeFootballs, Ballons) ou

BallonDeFootballs Ballons

Cours d'intelligence artificielle

Logique du premier ordre


Un objet est membre dune catgorie :
BFb

BallonDeFootballs

Une catgorie est une sous-classe dune autre :


BallonDeFootballs Ballons

Tous les membres dune catgorie ont certaines proprits :


x BallonDeFootballs Rond(x)

Les membres dune catgorie peuvent tre reconnus en identifiant certaines proprits :
Blanc(x) ^ Noir(x) ^ Rond(x) ^ Diametre(x)=25cm ^

x Ballons x BallonDeFootballs

Cours d'intelligence artificielle

Relations entre concepts


Nous devons pouvoir exprimer des relations entre les concepts reprsenter Exemple tir des rseaux smantiques :
Nuds : concepts Arcs : relations sorte-de

Voiture

Vhicule

Moteur

partie-de

Voiture
7

Cours d'intelligence artificielle

Contexte des relations entre les mots


Lastronome veut pouser une toile. Epouser Astronome Personne Astres Etoile Profession Plantes Observatoire
Cours d'intelligence artificielle

Clbrit

Soleil Cinma

Danseuse

Source : A. Cornjuols, Cours dIntroduction lintelligence artificielle


8

Ambiguts des mots (2)

Source : www-sop.inria.fr/acacia/personnel/Fabien.Gandon/lecture/emse_ontologie2002/
Cours d'intelligence artificielle

Ambiguts des mots (2)

Source : www-sop.inria.fr/acacia/personnel/Fabien.Gandon/lecture/emse_ontologie2002/
Cours d'intelligence artificielle

10

Catgories
Hritage : permet de simplifier la base de connaissances.
Catgorie Nourriture : Toutes les instances de Nourriture sont comestibles. Fruit est une sous-classe de Nourriture Pomme est une sous-classe de Fruit Alors, on sait que toutes les pommes sont comestibles.

Les relations de sous-classe organise les catgories en taxonomie.

Cours d'intelligence artificielle

11

Exemple de taxonomie

Cours d'intelligence artificielle

12

Hirarchie de concepts

Cours d'intelligence artificielle

13

Formaliser le langage

Source : www-sop.inria.fr/acacia/personnel/Fabien.Gandon/lecture/emse_ontologie2002/
Cours d'intelligence artificielle

14

Humain : reprsentation facile

Source : www-sop.inria.fr/acacia/personnel/Fabien.Gandon/lecture/emse_ontologie2002/
Cours d'intelligence artificielle

15

Machine : reprsentation par tiquettes

Source : www-sop.inria.fr/acacia/personnel/Fabien.Gandon/lecture/emse_ontologie2002/
Cours d'intelligence artificielle

16

Introduction au Web Smantique et aux ontologies

Cours d'intelligence artificielle

17

Internet : base de connaissances


Internet, et surtout le Web, est aujourd'hui la plus grande source de connaissances qui existe. Technologie pour
Accder des informations non structures, htrognes et distribues Laccs linformation et des sources de connaissance devient essentiel

Limportance dInternet est due :


Aux services quil nous fournis: IRC, ICQ, Chat, email, News groups, FTP, WWW, E-commerce, B2B, B2C, etc.

Cours d'intelligence artificielle

18

Introduction
WWW : succs fond sur sa simplicit, MAIS !
Dvelopp pour des lecteurs humains Les donnes actuelles sont principalement organises et structures pour tre simple transmettre et tre prsentes des humains HTML et PDF sont principalement des langages de prsentation de donnes <H2> Triple X </H2> : ne dit rien sur le titre sauf pour des humains Internet est de plus en plus utilis par des machines moteurs de recherche, robots, etc.

Cours d'intelligence artificielle

19

Recherche par mots-cls sur Internet


Problme : Chercher les livres de (Victor) Hugo sur le Web :
1) Nom Hugo en gnral 2) Roman vs Livre

Source : www-sop.inria.fr/acacia/personnel/Fabien.Gandon/lecture/emse_ontologie2002/
Cours d'intelligence artificielle

20

10

Problmes de linfo sur Internet


Accder, traiter linformation, extraire et interprter linformation
La majorit des donnes sur le web est sous une forme qui ne permet pas de lutiliser grande chelle. Pas de systme global de publication de donnes permettant aux machines et aux humains de les traiter vnements sportifs, mto, guides TV, guides cinma, etc. sont prsents par de nombreux sites Web, mais presque tous au format HTML (structure logique + prsentation) Comment trouver et extraire linformation pertinente pour diffrents services
Cours d'intelligence artificielle 21

Problmes de linfo sur Internet


Entrave la recherche, lextraction, la maintenance et la gnration dinformation Actuellement, pas daccs rel au contenu des documents
Contenu et Information pas accessible ni interprtable par des machines Pas possible de composer dynamiquement des documents cohrents et adapts aux utilisateurs

Cours d'intelligence artificielle

22

11

Web smantique
Le Web smantique
Les donnes doivent tre encodes de tel sorte que les contenus sens et smantique - du web soient plus comprhensibles pour les machines, ou en dautres termes par des algorithmes.

Cours d'intelligence artificielle

23

Gnrations de lInternet
3 m e G n ratio n W W W S p aration de la sm an tiq ue e t de la stu ctu re F ond e sur R D F , R D FS , O n tolo gies, Log ique , ...

2 m e G n ration W W W (F in 1990 ) S para tion d e la stru ctu re e t d e la p rse nta tio n F ond e sur X M L, X S L, ..

1 re G n ration W W W (D but 19 90) S p aration de la prsentation et de la loca lisation Fo nd e sur H T M L, P D F, ...

Source : Serge Garlatti, Cours sur les Documents virtuels adaptatifs


Cours d'intelligence artificielle

24

12

Architecture du SW
Proof:
Inference Engine

Ontology RDF + RDF Schema XML + Name Spaces URI

Semantic Level

Syntactic level Naming/Addressing Level

Cours d'intelligence artificielle

25

Niveau Adressage/Nommage : URI


URI : Uniform Resource Identifier (RFC 2396)
Un simple identifieur Web Chacun peut en crer dcentralis Ressource avec une URI tre sur le Web URL: ftp, gopher, http, internet mail, etc. (normalise) 1 Protocole, 1 machine, 1 chemin Le W3C maintient une liste des schmas dURI

Cours d'intelligence artificielle

26

13

Niveau Syntaxique : XML


XML : eXtensible Markup Language
Slection dun sous-ensemble de SGML simple implanter, mais nanmoins extensible : chacun dfini ses propres balises Sparation de la prsentation et du contenu XML a t conu pour dcrire des donnes Les balises XML ne sont pas prdfinis. Vous devez dfinir vos propres balises XML utilise un Document Type Definition (DTD) or an XML Schma pour un modle des donnes

Cours d'intelligence artificielle

27

Niveau Syntaxique : XML


XML nest pas un remplacement dHTML HTML a t conu pour afficher des donnes et se concentre surtout sur leur prsentation (taille, couleur, etc.) XML a t conu pour dcrire des donnes et se concentre sur la structure de ces donnes. XML a t conu pour assurer linteroprabilit XML et HTML sont complmentaire XSL / XSLT transforme XML en HTML

Cours d'intelligence artificielle

28

14

Niveau Syntaxique : XML


Proprits de XML
Indpendant des logiciels et matriels Infrastructure des changes de donnes structures Interoprabilit : conu pour dcrire des donnes, les stocker, les transporter et les changer et les partager XML DTD: une DTD dfini les lments constitutifs dun documents. Il dfini la structure syntaxique (un arbre) dun document type laide dune grammaire. Il permet donc toute application de vrifier la conformit dun document la DTD Et donc de manipuler et transformer celui-ci lorsquil est conforme cette DTD.
Cours d'intelligence artificielle 29

Niveau Syntaxique : XML


<?xml version="1.0"?> <!DOCTYPE note [ <!ELEMENT note (to,from,heading,body)> <!ELEMENT to (#PCDATA)> <!ELEMENT from (#PCDATA)> <!ELEMENT heading (#PCDATA)> <!ELEMENT body (#PCDATA)> ]> <note> <to> Tove </to> <from> Jani </from> <heading>Reminder </heading> <body> Don't forget me this weekend </body> </note>
Cours d'intelligence artificielle 30

15

Niveau Syntaxique : XML


<?xml version="1.0" encoding="ISO-8859-1"?> <!-- Edited with XML Spy v4.2 --> <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tyler</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> </CATALOG> Cours d'intelligence artificielle

31

Niveau Syntaxique : XML


XML
Ne contient aucune smantique formelle pour lordinateur Ce sont les humains qui donnent un sens, une smantique, aux balises et leur contenu pas les machines La smantqiue est un domaine qui tudie comment les symboles se rfrent aux objects Note ne rfrence rien pour une machine, la rfrence est uniquement faite dans lesprit des lecteur humains

Do RDF pour la smantique

Cours d'intelligence artificielle

32

16

Niveau smantique : RDF/RDFS


RDF Resource Description Framework RDFS Resource Description Framework Schema RDF/RDFS a t cr pour le traitement des mtadonnes
Ce sont des langages de description de mtadonnes au niveau smantique Fournit linteroprabilit au niveau smantique - entre applications pour lchange, le partage et la rutilisation dinformations non interprtable pour la machine

Cours d'intelligence artificielle

33

Niveau smantique : RDF/RDFS


RDF/RDFS provient principalement des communauts
De standardisation du Web Des bibliothques Des documents structurs Reprsentation de connaissances Programmation oriente objets et langages de modlisation Etc.

Cours d'intelligence artificielle

34

17

Niveau smantique : RDF/RDFS


RDF est un simple modle relationnel
Une dclaration RDF est constitue dun triplet Objet, Attribut, Valeur , dont chaque membre peut tre un littral ou une ressource web Ce triplet peut tre interprt comme le tuple suivant :

Sujet, Prdicat, Objet ou encore Prdicat (Sujet, Objet)


<http://music.fi/pieces#finlandia, creator, http://composer.org/Sibelius> <http://music.fi/pieces#finlandia, type, music>
Cours d'intelligence artificielle 35

Exemples

Niveau smantique : RDF/RDFS

{creator, [http://www.w3.org/Home/Lassila], "Ora Lassila"}

Source : Serge Garlatti, Cours sur les Documents virtuels adaptatifs


Cours d'intelligence artificielle

36

18

Niveau smantique : RDF/RDFS

Source : Serge Garlatti, Cours sur les Documents virtuels adaptatifs


Cours d'intelligence artificielle

37

Niveau smantique : RDF/RDFS


<rdf:rdf xmlns:rdf= http://www.w3.org/1999/02/22-rdf-syntax-nms# xmlns:dc= http://purl.org/dc/elements/1.1 <rdf:description rdf:about= http://music.fi/pieces#Finlandia > <dc:creator rdf:resource= http://composer.org/Sibelius > <rdf:type music </rdf:type> </rdf:description> <rdf:rdf>

Cours d'intelligence artificielle

38

19

Niveau smantique : RDF/RDFS


RDF Schma
RDF ne permet pas de spcifier le vocabulaire utilis dans une description RDF, comme par exemple : author , music , creator , etc. Cest--dire dfinir la smantique des proprits RDF Schma est une extension de RDF avec laquelle il et possible de Dcrire les concepts utiliss dans des dclarations RDF Un ensemble de contraintes sur les objets et les valeurs du triplet.

Cours d'intelligence artificielle

39

Niveau smantique : RDF/RDFS


RDF Schema
Pourrait tre vu comme un modle orient objet pour le WWW rdfs:Class & rdfs:SubClass dfinissent la hirarchie des classes rdf:type dfini les instances dune classe rdf:domain & rdf:range dfini des contraintes sur les types de ressources

Cours d'intelligence artificielle

40

20

Niveau smantique : RDF/RDFS

Source : Serge Garlatti, Cours sur les Documents virtuels adaptatifs


Cours d'intelligence artificielle

41

Requte formelle sur le Web

Source : www-sop.inria.fr/acacia/personnel/Fabien.Gandon/lecture/emse_ontologie2002/
Cours d'intelligence artificielle

42

21

Limite de la smantique RDF/RDFS


Chacun peut dvelopper son schma RDFS pour exprimer les liens smantiques pour son site web Problme : compatibilit smantique des connaissances exprimes sur diffrents sites web Solution : standardisation des schma de connaissances pour les domaines dapplication
Utilisation des ontologies (extensions de RDFS)

Cours d'intelligence artificielle

43

Niveau smantique : les Ontologies


Dfinir de manire dclarative un vocabulaire commun rsultat dun consensus social dans un domaine donn
Chaque lment de vocabulaire possde une interprtation unique partage par tous les membres du domaine

Dcrire la smantique des termes et leurs relations


Linterprtation de chaque terme est unique. Elle est fournie par une smantique formelle. Lensemble des termes et leurs relations fournissent un cadre interprtatif dpourvu dambigut pour chaque terme.

Cours d'intelligence artificielle

44

22

Niveau smantique: les Ontologies


Une dfinition des ontologies (Gruber 1993) :
An ontology is a formal, explicit specification of a shared conceptualization of a domain of interest. Conceptualisation : les objets, les concepts et autres entits qui sont supposs exister dans un domaine particulier et les relations quils entretiennent entre eux.

Fournir des mcanismes dinfrence qui respectent la smantique formelle.


Utilisation des mcanismes dinfrence de la logique Logique de descriptions
Cours d'intelligence artificielle 45

Ontology Web Langage (OWL)


OWL
Cest une version modifie de DAML (Darpa) + OIL (Europe) Conu pour des applications qui traitent le contenu, pas uniquement la prsentation des informations Une extension de RDFS, muni dune smantique formelle Constitu de trois langages OWL Lite OWL DL OWL Full

Cours d'intelligence artificielle

46

23

Ontology Web Langage (OWL)


OWL Lite
Classification hirarchie + contraintes simples

OWL DL
Pouvoir dexpression suprieur, avec compltude (toutes les conclusions sont calculables) et dcidabilit Cest une logique de description (DL)

OWL Full
Expressivit maximale, pas de garantie sur les rsultats de calculs

Outil de cration dontologies : Protg


http://protege.semanticweb.org
Cours d'intelligence artificielle 47

Web smantique + Ontologies


En crant son site web, on spcifie lontologie utilise
Une ontologie standard est dpos un endroit du web

Tous les sites web utilisant la mme ontologie parlent maintenant le mme langage
Possibilit dchanges automatiques Communications machine machine Par exemple : B2B : Business to Business

Une ontologie est limite un domaine dapplication Problme de la dfinition dontologies standards
Emergence dontologies approuves avec le temps
Cours d'intelligence artificielle 48

24

Quelques liens pour les ontologies


OWL - site du W3C http://www.w3.org/2004/OWL/ Web smantique http://www.semanticweb.org/ http://www.w3.org/2001/sw/ http://www.lalic.paris4.sorbonne.fr/stic/as5.html http://www.schemaweb.info/default.aspx Ontologies http://www.w3.org/2001/sw/WebOnt/ http://www.formalontology.it/index.htm http://ontology.buffalo.edu/ http://www.cs.utexas.edu/users/mfkb/related.html http://www.daml.org/ontologies/
Cours d'intelligence artificielle 49

25