Académique Documents
Professionnel Documents
Culture Documents
2011-2012
Plan du cours
Gnralits XML XML Namespaces Documents Valides: DTD Documents Valides: XML Schemas XPATH XSL XQuery SAX, DOM XML pipelining: XProc RDF OWL
Technologies XML
Gnralits
Dfinitions de base
Permet de reprsenter les donnes changes sur le Web Et permet au dveloppeur de dlivrer du contenu depuis les applications d'autres applications ou aux navigateurs change prsente archive retrouve transforme chiffre ...
Origine et objectifs
Forme = prsentation partir de la structure (style) Fond = structure + donnes (contenu) SGML pour la structuration HTML pour la prsentation Approches mlangeant parfois le fond et la forme !
Origine et Chronologie
1969 1986
GML : Gnralized Markup Language, IBM SGML : Standard Generalized Markup Language, ISO 8879, 1986 Mtalangage (permet de dfinir des langages de balisage) Utilisation industrielles lourdes : catalogues, documentations techniques HTML : HyperText Makup Language, CERN (Tim Berners-Lee) Une application de SGML, base du Web Cration du W3C Groupe de travail "SGML-light" XML 1.0, recommandation du W3C
1992
Sept. 1998 Groupe de travail W3C XML divis en 5 groupes Toutes les nouvelles normes seront en XML
1999-2000 Diversification des usages (web, database), XML partout l o on ne l'attendait pas Augmentation de la complexit (toutes les normes prennent du retard)
2001
possibilit de multiples prsentations un seul document en SGML plusieurs formats : Postcript, HTML, etc.
SGML: critiques
Trs lourd et complexe pour la mise en uvre de documents respectant ce format Une grande rigueur est demande l'entre des documents Standard complexe et complet pour le traitement des documents Utilis uniquement par les professionnels de la documentation Liens hypertextes possibles mais complexes Difficile utiliser sur le Web
Naissance de XML
SGML Niche technologique La communaut SGML a peur de ne pas profiter de l'essor de HTML
Groupe de travail constitu au sein du W3C par des gens de la communaut SGML Conception rapide et homogne XML est un sous-ensemble de SGML
De HTML XML
Document HTML
Document XML
jeu de balises fini et connu structure oriente prsentation exclusivement wysiwyg qui dpend du navigateur (!!) rutilisation limite cible : web exclusivement criture anarchique, pas de respect de charte graphique possible, temps perdu allou la prsentation stockage : SGF (syst. De gestion de fichiers)
jeu de balises extensible, priori non connu toutes structures (smantique) donnes auto-descriptives pas de prsentation intrinsque possible : obligation de feuille de style exploitation smantique possible, transformation de structure cible : Web, Wap, PDF, texte, autres changes entre applications rdaction de contenu exclusivement stockage : SGF, BdDR, natif (XND)
MarkLogic, TigerLogic, eXist, Berkeley Mixed, (relational et XML en meme temps): DB2, SQLServer, Oracle.
XML : Caractristiques
Sparation de la structure et de la prsentation Un nouveau langage d'change bas sur le balisage Idal pour l'change de donnes semi-structures Utilisable entre machines Plus simple que SGML Plus ouvert que XHTML Internationalisation (ASCII + Unicode) Dvelopp par XML Working Group dirig par le W3C (depuis 1996) XML 1.0 = recommandation officielle du W3C depuis le 10 fvrier 1998 Une version 1.1 en 2004 avec des changements mineures.
Utilisable sans difficult sur internet Applicable un maximum de domaines dapplications Compatible avec SGML et HTML Facilit de traitement Document lisible par un humain Pas de codage binaire Se charge dans un bloc-note Spcification formelle et concise Documents XML faciles crer, mme la main La concision dans le balisage de XML est peu importante les documents sont d'ailleurs trs verbeux.
Dfinition
XML (eXtensible Markup Language) permet chacun de dfinir facilement son propre format de document, dcrire des documents ce format, et dutiliser des outils logiciels pour faciliter lutilisation de ce format. Les documents XML contiennent du texte. . . . . . structur laide de balises. Contrairement HTML, XML permet de dfinir de nouvelles balises, qui ne sont pas des balises de mise en forme. Un format de formats pour faciliter le partage de documents. Facilite linterprtation par une machine. On peut automatiser la dtection des balises. Possibilit dajouter des informations (attributs) aux lments, un attribut tant compos dun nom et dune valeur.
XML aujourd'hui
XML = un ensemble de langages et des technologies pour les documents et les donnes structurs Balisage de documents et de donnes Modles de documents Documents composites -> grce aux espaces de noms (Exemples :XHTML + MathML dans le mme fichier XML) Style Description de chemins Langages d'interrogation Transformation de structures Liens hypertexte Protocoles XML etc.
Compagnons XML
XML based language, for creating simple and complex links XPath based, for addressing nodes, points ranges of a document
-> Rich Site Summary, XML based language, for describing and distributing news
La galaxie de standards
Dimension mtiers ebXML.org
ChessML cXML commerce XML UBL VoiceML SVG SMIL MathML XHTML XML XSL Outils applicatifs
OASIS
W3C
Outils gnriques
Dimension technique
XSchema DOM
XML
Document Type Definition XML Schema XML Data Reduced Cascading Style Sheets Extensible Stylesheet Language XSL Transformations XSL Formatting Objects
XSLT XSL-FO
XML
XLink
XQuery DOM
SAX
Data Island
Data Binding
XML
Pages Web : XHTML (eXtended Hyper Text Markup Language) Mathmatiques : MathML Graphique vectoriel : SVG (SVG = Scalable Vector Graphics) Multimdia synchronis : SMIL (Synchronized Multimedia Integration Language)
Le langage XHTML (eXtended Hyper Text Markup Language) est une extension des spcifications du langage HTML 4. Le langage HTML demeure fig et limit, XHTML s'engage l'purer et l'tendre par une srie de dfinitions XML. Le langage XHTML est portable, car il possde la particularit de pouvoir fonctionner aussi bien sur des outils conus pour le HTML que sur d'autres tourns plus spcifiquement vers XML. La conformit aux standards XML des documents XHTML, permet ces derniers d'tre directement compatible avec les outils XML. Le XHTML, dont l'criture est absolument correcte par rapport au HTML 4, rend les documents parfaitement compatibles avec les outils HTML.
XHTML elements must be properly nested XHTML elements must always be closed XHTML elements must be in lowercase XHTML documents must be well formed XHTML Empty elements must be terminated XHTML attributes must be quoted
Mathmatiques : MathML
Quand XML essaie dcrire des formules mathmatiques, il sappelle MathML. MathML est une recommandation du w3C depuis 1999. Il propose deux moyens dencodage des math: prsentation et contenu.
x2+1 Prsentation <math> <msup> <mi>x</mi> <mn>2</mn> </msup> <mo>+</mo> <mn>1</mn> </math> Contenu <apply> <plus/> <apply> <power/> <ci>x</ci> <cn>2</cn> </apply> <cn>1</cn> </apply>
SVG = Scalable Vector Graphics Un langage XML pour dcrire des graphiques 2D contenant :
<?xml version="1.0" standalone="no"?> <!DOCTYPE svg PUBLIC "-//W3C//DTD SVG 1.1//EN" "http://www.w3.org/Graphics/SVG/1.1/DTD/svg11.dtd">
<svg width="100%" height="100%" version="1.1" xmlns="http://www.w3.org/2000/svg"> <rect x="20" y="20" width="250" height="250" style="fill:blue;stroke:pink;stroke-width:5; fill-opacity:0.1;stroke-opacity:0.9"/> </svg>
SMIL = Synchronized Multimedia Integration Language SMIL est pour le multimdia ce que (X)HTML est pour le texte Un format XML simple Intgration avec les autres technologies Web Intgration de mdias de diffrents formats (audio, video, images) Mcanismes puissants pour la gestion du temps, de la synchronisation et de l'animation
<smil> <body> <seq repeatCount="indefinite"> <img src="image1.jpg" dur="3s" /> <img src="image2.jpg" dur="3s" /> </seq> </body> </smil>