Vous êtes sur la page 1sur 4

La technologie XML - Généralités

Plan

1. Introduction.........................................................................................................................1
2. Pourquoi XML ?.................................................................................................................1
3. Les caractéristiques de XML..............................................................................................2
4. Les avantages de XML.......................................................................................................2
5. Les technologies autour du langage XML..........................................................................3
6. Les outils XML...................................................................................................................3
7. Les applications existantes..................................................................................................4

1. Introduction
XML (eXtended Markup Language) est un langage de balisage extensible standardisé par le World Wide Web
Consortium (W3C). XML est principalement connu comme la future norme d'échange de documents sur le
WEB. Il peut être considéré comme une généralisation de HTML où, au lieu d'avoir un jeu de balises prédéfinies
ayant une signification prédéfinie, l'auteur peut "inventer" ses propres balises. En réalité, sous ce sigle se cache
un outil de description bien plus puissant reposant sur un langage générique (hérité de SGML). Le but de XML
est de faciliter le traitement automatisé de documents et de données. L'idée est de pouvoir structurer les
informations de telle manière qu'elles puissent être à la fois lues par des personnes sur le web et traitées par des
applications qui exploiteront de manière automatisée les informations en question. Ce papier démarrera par des
généralités. Nous présenterons ensuite une famille de technologies autour de XML et les outils qui permettent de
les supporter. Nous passerons en revue quelques applications existantes. Nous aborderons ensuite les notions de
base de XML en donnant des exemples d'applications.

2. Pourquoi XML ?
Avant l'apparition de XML, ils existaient :

 SGML : un langage de balisage normalisé, riche en sémantique mais relativement lourd à mettre en oeuvre
et inadapté au Web. Il permet de définir de nouveaux langages de balisage spécifiques est complexes.
 HTML : un langage parfaitement adapté au Web (puisque développé uniquement pour cette application)
mais dont les applications sont limitées par une bibliothèque de balises figée et réduite. Il ne peut pas
répondre aux besoins spécifiques de tous les domaines (mathématiques, chimie, musique, astronomie...).
HTML qui devait décrire le contenu du document s'est orienté vers la présentation du contenu.
Il convenait donc de définir un langage qui ait la facilité de mise en oeuvre de HTML tout en offrant la richesse
sémantique de SGML. C'est la raison d'être de XML. De manière plus formelle HTML 4.0 est une DTD de
SGML (et XHTML1.0 est à présent une DTD XML).

1
3. Les caractéristiques de XML
 XML est un sous-ensemble de SGML.
 les caractéristiques inutiles pour la publication sur le web ont été supprimées ;
 la création de DTD est plus simple qu'avec SGML;
 il est destiné à décrire le contenu du document et non pas son affichage. Ce dernier est géré par les feuilles
de style CSS et XSL ;
 il est flexible, on peut définir ses balises, et les utiliser dans un ou plusieurs documents ;
 le document ne sera affiché que s'il est bien formé et valide ; il est lisible pour l'humain (l'information
contenue sera toujours accessible, contrairement aux fichiers de certains logiciels, par exemple, il est
impossible de visualiser du RTF sans un logiciel qui connaisse ce format) ;
 le document XML est un texte qui n'est pas destiné à être lu par l'homme. Cependant, le fait que ce soit un
texte permet aux auteurs d'utiliser un éditeur de texte pour corriger le fichier.

4. Les avantages de XML


1. Lisibilité : les balises utilisent des termes assez intuitifs.
2. Indépendance du contenu de sa présentation : une balise indique ce que l’information signifie, non pas
comment l’afficher. L’information de formatage pour un fichier XML est écrite dans un langage de style et
elle est stockée séparément.
3. Réduction de la programmation : la plupart des vérifications d’erreurs sur la validité des documents est
faite par l’interpréteur. En outre, on peut travailler avec des DTD standard, par exemple : XML/EDI.
4. Portabilité : XML ouvre la programmation Java et Internet aux fonctionnalités portables et indépendantes
du navigateur. XML libère le contenu Internet du navigateur dans la même mesure que Java libère les
comportements d’un programme de la plate-forme. Java est une excellente plate-forme pour l’utilisation de
XML, et XML est une bonne représentation des données pour les applications Java.
5. Réutilisabilité : grâce à son statut de norme d’une part et à la structuration, la modularité et la possibilité de
description des documents obtenus d’autre part.

XML va permettre :
 aux humains :
 de saisir ou mettre à jour une seule fois un contenu pur, par exemple une bibliographie, sans se soucier
de la présentation ou des traitements futurs ; sans avoir à saisir des libellés tels que "auteur", "année de
parution" ; sans avoir à mettre les titres en italique.
 d'en générer ensuite automatiquement :
 de multiples présentations (en tableau, en liste …) sur de multiples médias (écran, papier, terminal
Braille, etc.);
 de multiple traitements (tris, sélections, réorganisations, génération automatique de libellés, tables
des matières, index, etc.) ;
 aux logiciels de comprendre/exploiter au mieux le contenu de ces pages, rendu désormais explicite par un
balisage spécifique, indépendant de toute application.

2
5. Les technologies autour du langage XML
Autour de la spécification XML 1.0 il existe une famille de technologies dont :

 CSS, permet de définir une feuille de style pour XML (et HTML) ;
 XSL, langage évolué pour la définition de feuilles de style propre à XML ;
 Xlink pour ajouter des liens hypertextes à un fichier XML ;
 XPointer pour pointer sur des éléments de données d'un document XML ;
 DOM Document Object Model pour manipuler des fichiers XML (et HTML) à partir d'un langage de
programmation ;
 Namespaces (domaines de noms) pour distinguer les noms utilisés dans les documents XML ;
 XForm pour les formulaires.

6. Les outils XML


Voici quelques éditeurs XML :

 XMLSpy est un très bon éditeur XML édité par Altova Inc.,
 Cooktop est un éditeur XML, XSLT, XPath et DTD puissant et totalement gratuit,
 XMetal est un logiciel puissant et flexible pour la création de documents XML,
 XMLWriter est un puissant éditeur XML,
 XMLMind représente un très bon éditeur XML,
 JXMLEditor est un éditeur XML écrit en Java,
 KXML Editor est un éditeur XML pour KDE.
Voici quelques outils de validation de syntaxe de:

 XHTML: http://validator.w3.org/
 Schémas: http://www.w3.org/2001/03/webdata/xsv
 Feuille de style CSS: http://jigsaw.w3.org/css-validator/validator-uri.html
 XML: http://www.stg.brown.edu/service/xmlvalid/
 XML: http://www.cogsci.ed.ac.uk/~richard/xml-check.html
 XML: http://www.xml.com/xml/pub/tools/ruwf/check.html
 XML: http://msdn.microsoft.com/downloads/samples/internet/xml/xml_validator/

3
7. Les applications existantes
XML est un métalangage permettant l'élaboration de nouveau langages (balisages spécialisés). En fonction du
domaine d’application dans lequel on souhaite publier on définit des balises qui lui sont propres. Nous citons ci-
dessous quelques applications existantes dérivées de XML :

 AML, Astronomical Markup Language, langage décrivant les différents types de données utilisées en
astronomie ;
 CDF, Channel Definition Format, utilisé par Microsoft pour décrire le contenu « Active Channel ». Une
chaîne délivre des informations directement à l'utilisateur en utilisant la technologie push d'un serveur
(envoi de contenus web à des utilisateurs sans que ceux-ci aient besoin d'accéder spécifiquement au site).
Les chaînes fournissent des informations récentes aux utilisateurs qui peuvent sélectionner le contenu Web
qu'ils souhaitent recevoir ;
 CML, Chemical Markup Language, pour la publication Internet des formules chimiques, de molécules, des
équations ;
 MathML, Mathematical Markup Language, notation mathématique sur le web ;
 PGML, Precision Graphics Markup Language, décrit les structures de données graphiques complexes avec
les primitives du langage Postscript. Il permet la conversion de documents aux formats ps et pdf en XML.
Les textes sont des données de caractères XML standard au sein d'un élément qui utilise les attributs x et y
pour définir le point de départ du fragment de texte. Il existe des éléments rectangle avec des attributs width
et height, fillcolor... ;
 RDF, Resource Description Framework, qui permet de récupérer des informations (auteur, URL, titre,
description) et de créer des bases de données permettant la recherche d'information ;
 SMIL, Synchronized Multimedia Integration Language, pour la création multimédia, il spécifie comment et
quand des éléments multimédia peuvent apparaître dans une page web. Par exemple on peut dire que sur la
page le texte apparaît suivi d'une série d'images qui sont accompagnées d'une musique. Il est là pour ajouter
un aspect temporel aux pages Web. Il permet de contrôler la position dans l'espace et dans le temps des
objets ;
 VML, Vector Markup Language, langage de balisage d'information graphique vectorielle.
 WML, Wireless Markup Language, pour l'internet mobile ;
 XTML, reformulation de HTML en XML. Les premières versions HTML 2.0, HTML 3.2, HTML 4.0,
HTML 4.01 de HTML étaient fondées sur SGML.

Vous aimerez peut-être aussi