Vous êtes sur la page 1sur 25

DEPARTEMENT ELECTRICITE ET MECANIQUE Cursus Ingnieur Semestre 4 : Informatique et Rseaux

Technologies XML pour lIntgration des donnes

Rima KILANY CHAMOUN

2011-2012

Plan du cours

Gnralits XML XML Namespaces Documents Valides: DTD Documents Valides: XML Schemas XPATH XSL XQuery SAX, DOM XML pipelining: XProc RDF OWL

Technologies XML

Gnralits

Dfinitions de base

XML = eXtensible Markup Language XML est un mtalangage universel


Permet de reprsenter les donnes changes sur le Web Et permet au dveloppeur de dlivrer du contenu depuis les applications d'autres applications ou aux navigateurs change prsente archive retrouve transforme chiffre ...

XML standardise la manire dont l'information est :


Origine et objectifs

XML est issu de la Gestion de Documents (GED) Sparation du fond de la forme.


Forme = prsentation partir de la structure (style) Fond = structure + donnes (contenu) SGML pour la structuration HTML pour la prsentation Approches mlangeant parfois le fond et la forme !

Multiples prcurseurs dont les plus connues :


Origine et Chronologie

1969 1986

GML : Gnralized Markup Language, IBM SGML : Standard Generalized Markup Language, ISO 8879, 1986 Mtalangage (permet de dfinir des langages de balisage) Utilisation industrielles lourdes : catalogues, documentations techniques HTML : HyperText Makup Language, CERN (Tim Berners-Lee) Une application de SGML, base du Web Cration du W3C Groupe de travail "SGML-light" XML 1.0, recommandation du W3C

1992

Oct. 1994 Juin 1996 Fv. 1998

Sept. 1998 Groupe de travail W3C XML divis en 5 groupes Toutes les nouvelles normes seront en XML
1999-2000 Diversification des usages (web, database), XML partout l o on ne l'attendait pas Augmentation de la complexit (toutes les normes prennent du retard)

2001

28 groupes de travail au W3C

Qu'est-ce que SGML ?

Une norme internationale :

Standard Generalized Markup Language ISO 8879 - 1989


lisible par ltre humain et traitable par une machine permet de dfinir des langages de balisage instances de DTD permet un balisage smantique du fond.

Un mtalangage de balisage de documents


Les documents sont baliss conformment la grammaire (la DTD)


Implique la notion de validit d'un document Sparation du fond et de la forme


possibilit de multiples prsentations un seul document en SGML plusieurs formats : Postcript, HTML, etc.

SGML: critiques

Trs lourd et complexe pour la mise en uvre de documents respectant ce format Une grande rigueur est demande l'entre des documents Standard complexe et complet pour le traitement des documents Utilis uniquement par les professionnels de la documentation Liens hypertextes possibles mais complexes Difficile utiliser sur le Web

Naissance de XML
SGML Niche technologique La communaut SGML a peur de ne pas profiter de l'essor de HTML

W3C Le Web est un mlange de prsentation et de structure

But commun : Re-aiguiller le Web vers un successeur de SGML: XML = SGML-

Groupe de travail constitu au sein du W3C par des gens de la communaut SGML Conception rapide et homogne XML est un sous-ensemble de SGML

De HTML XML
Document HTML

Document XML

jeu de balises fini et connu structure oriente prsentation exclusivement wysiwyg qui dpend du navigateur (!!) rutilisation limite cible : web exclusivement criture anarchique, pas de respect de charte graphique possible, temps perdu allou la prsentation stockage : SGF (syst. De gestion de fichiers)

jeu de balises extensible, priori non connu toutes structures (smantique) donnes auto-descriptives pas de prsentation intrinsque possible : obligation de feuille de style exploitation smantique possible, transformation de structure cible : Web, Wap, PDF, texte, autres changes entre applications rdaction de contenu exclusivement stockage : SGF, BdDR, natif (XND)

Xml native database:Tamino, XHive,

MarkLogic, TigerLogic, eXist, Berkeley Mixed, (relational et XML en meme temps): DB2, SQLServer, Oracle.

XML : Caractristiques

Sparation de la structure et de la prsentation Un nouveau langage d'change bas sur le balisage Idal pour l'change de donnes semi-structures Utilisable entre machines Plus simple que SGML Plus ouvert que XHTML Internationalisation (ASCII + Unicode) Dvelopp par XML Working Group dirig par le W3C (depuis 1996) XML 1.0 = recommandation officielle du W3C depuis le 10 fvrier 1998 Une version 1.1 en 2004 avec des changements mineures.

Les objectifs de conception de XML


Utilisable sans difficult sur internet Applicable un maximum de domaines dapplications Compatible avec SGML et HTML Facilit de traitement Document lisible par un humain Pas de codage binaire Se charge dans un bloc-note Spcification formelle et concise Documents XML faciles crer, mme la main La concision dans le balisage de XML est peu importante les documents sont d'ailleurs trs verbeux.

Dfinition

XML (eXtensible Markup Language) permet chacun de dfinir facilement son propre format de document, dcrire des documents ce format, et dutiliser des outils logiciels pour faciliter lutilisation de ce format. Les documents XML contiennent du texte. . . . . . structur laide de balises. Contrairement HTML, XML permet de dfinir de nouvelles balises, qui ne sont pas des balises de mise en forme. Un format de formats pour faciliter le partage de documents. Facilite linterprtation par une machine. On peut automatiser la dtection des balises. Possibilit dajouter des informations (attributs) aux lments, un attribut tant compos dun nom et dune valeur.

XML aujourd'hui

XML = un ensemble de langages et des technologies pour les documents et les donnes structurs Balisage de documents et de donnes Modles de documents Documents composites -> grce aux espaces de noms (Exemples :XHTML + MathML dans le mme fichier XML) Style Description de chemins Langages d'interrogation Transformation de structures Liens hypertexte Protocoles XML etc.

Compagnons XML

Des standards XML


Extensible Linking Language

XML based language, for creating simple and complex links XPath based, for addressing nodes, points ranges of a document

-> Wireless Markup Lang

-> Chemical Markup Lang

-> Rich Site Summary, XML based language, for describing and distributing news

La galaxie de standards
Dimension mtiers ebXML.org

ChessML cXML commerce XML UBL VoiceML SVG SMIL MathML XHTML XML XSL Outils applicatifs

OASIS

Universal Business Language (UBL)

W3C

Outils gnriques

Dimension technique

XSchema DOM

SOAP WSDL BPEL RDF

XML

Les langages techniques XML (1)


XML Infoset Extensible Markup Language Information Set Defines XML documents Abstract model of XML data; definition of terms (Elements, attributs, etc), utils par dautres spcifications comme XML Schema.. Non-XML schema XML-based schema language An earlier XML schema Allows you to specify styles Language for expressing stylesheets; consists of XSLT and XSL-FO Language for transforming XML documents Language to describe precise layout of text on a page

DTD XSD XDR CSS XSL

Document Type Definition XML Schema XML Data Reduced Cascading Style Sheets Extensible Stylesheet Language XSL Transformations XSL Formatting Objects

XSLT XSL-FO
XML

Les langages techniques XML (2)


XPath XML Path Language A language for addressing parts of an XML document, designed to be used by both XSLT and XPointer Supports addressing into the internal structures of XML documents XPointer XML Pointer Language

XLink
XQuery DOM

XML Linking Language


XML Query Language (draft) Document Object Model Simple API for XML

Describes links between XML documents


Flexible mechanism for querying XML data as if it were a database API to read, create and edit XML documents; creates in-memory object model API to parse XML documents; eventdriven

SAX

Data Island
Data Binding
XML

XML data embedded in a HTML page ex: <XML SRC="ch19_03.xml"


ID="states"></XML>

Automatic population of HTML elements from XML data ex:


Name: <INPUT TYPE="TEXT" DATASRC="#states" DATAFLD="name" SIZE="10">

Quelques applications de XML

Pages Web : XHTML (eXtended Hyper Text Markup Language) Mathmatiques : MathML Graphique vectoriel : SVG (SVG = Scalable Vector Graphics) Multimdia synchronis : SMIL (Synchronized Multimedia Integration Language)

Pages Web : XHTML

Le langage XHTML (eXtended Hyper Text Markup Language) est une extension des spcifications du langage HTML 4. Le langage HTML demeure fig et limit, XHTML s'engage l'purer et l'tendre par une srie de dfinitions XML. Le langage XHTML est portable, car il possde la particularit de pouvoir fonctionner aussi bien sur des outils conus pour le HTML que sur d'autres tourns plus spcifiquement vers XML. La conformit aux standards XML des documents XHTML, permet ces derniers d'tre directement compatible avec les outils XML. Le XHTML, dont l'criture est absolument correcte par rapport au HTML 4, rend les documents parfaitement compatibles avec les outils HTML.

Les diffrences les plus importantes vs HTML


XHTML elements must be properly nested XHTML elements must always be closed XHTML elements must be in lowercase XHTML documents must be well formed XHTML Empty elements must be terminated XHTML attributes must be quoted

Mathmatiques : MathML

Quand XML essaie dcrire des formules mathmatiques, il sappelle MathML. MathML est une recommandation du w3C depuis 1999. Il propose deux moyens dencodage des math: prsentation et contenu.
x2+1 Prsentation <math> <msup> <mi>x</mi> <mn>2</mn> </msup> <mo>+</mo> <mn>1</mn> </math> Contenu <apply> <plus/> <apply> <power/> <ci>x</ci> <cn>2</cn> </apply> <cn>1</cn> </apply>

Graphique vectoriel : SVG


SVG = Scalable Vector Graphics Un langage XML pour dcrire des graphiques 2D contenant :

<?xml version="1.0" standalone="no"?> <!DOCTYPE svg PUBLIC "-//W3C//DTD SVG 1.1//EN" "http://www.w3.org/Graphics/SVG/1.1/DTD/svg11.dtd">

<svg width="100%" height="100%" version="1.1" xmlns="http://www.w3.org/2000/svg"> <rect x="20" y="20" width="250" height="250" style="fill:blue;stroke:pink;stroke-width:5; fill-opacity:0.1;stroke-opacity:0.9"/> </svg>

des formes vectorielles des images du texte

Multimdia synchronis : SMIL


SMIL = Synchronized Multimedia Integration Language SMIL est pour le multimdia ce que (X)HTML est pour le texte Un format XML simple Intgration avec les autres technologies Web Intgration de mdias de diffrents formats (audio, video, images) Mcanismes puissants pour la gestion du temps, de la synchronisation et de l'animation

<smil> <body> <seq repeatCount="indefinite"> <img src="image1.jpg" dur="3s" /> <img src="image2.jpg" dur="3s" /> </seq> </body> </smil>

Vous aimerez peut-être aussi