Vous êtes sur la page 1sur 29

Universit Ibn Tofal

Ecole Nationale des Sciences Appliques

XML
(eXtensible Markup Language)
Chapitre 1:Syntaxe du langage XML

Pr: OUMAIRA ILHAM


1

Plan du cours

Chapitre 1:Syntaxe du langage XML

Chapitre 2: DTD et XML schma

Chapitre 3: CSS, XSL et XSLT

Chapitre 4: XML et PHP

Plan du Chapitre
1. Introduction
2. Historique
3. Syntaxe du langage XML

Problmatique (1)

Une page HTML

Code Source de la page HTML


<hml>
<head><title> </title> </head>
<body>
<H2>Bibliographie XML</H2>
<UL>
<LI> Jean-Christophe Bernadac, <I>Construire une application XML</I>,Eyrolles, 1999</LI>
<LI> Alain Michard, <I>XML, Langage et Applications</I>, Eyrolles, 1998 </LI>
<LI> William J. Pardi, <I>XML en Action</I>, Microsoft Press, 1999</LI>
</UL>
</body>
</html>

Problmatique (2)
Est-ce quon peut rutiliser les donnes saisies dans la page
HTML en les insrant, par exemple, dans une base de donnes
(table livre(Titre_livre,Auteur,Edition,Annee) ?

Toutes les balises d'une page HTML sont relatives la


prsentation de la page
Rien ne permet un logiciel de connatre le sens (la
smantique) du texte
Savoir que Alain Michard est l'auteur d'un livre intitul XML,
Langage et Applications, qui est paru en 1998, dont l'diteur,
Eyrolles
5

Solution
Pour pouvoir rutiliser une information , on doit la
structurer.
On a besoin dun langage de structuration de
donnes
Rponse: XML

Code Source

Rsultat dans le navigateur

Feuille de style CSS

Rsultat su le navigateur

10

Prsentation du XML

XML : (eXtensible Markup Language)

Langage balises tendu, ou Langage balises


extensible
XML a t mis au point par le XML Working Group
sous lgide du World Wide Web Consortium (W3C)
ds 1996.
Depuis le 10 fvrier 1998, les spcifications XML 1.0
ont t reconnues comme recommandations par le
W3C

11

Historique (1)
GML (1969)

SGML (1980)

HTML (1990)
XML (1998)

XHML (1999)
12

SGML (Standard Generalized Markup

Language)
Cr en 1986 [ISO 8879]
Sparation du fond et de la forme
Permet des puissants traitements informatiques sur
les documents
Proposition dun cadre dfini pour lexpression des
modles documentaires (validit, contrle)
Fournir un format de stockage et dchange
normalis
Trs lourd et complexe pour la mise en uvre de
documents respectant ce format

13

Historique (2)

1991, T. Berners-Lee a dfini le langage HTML pour le WEB. Ce


langage est une version simplifie l'extrme de SGML, destine
une utilisation trs cible.

XML est lintermdiaire entre SGML et HTML; xml vite les aspects
les plus complexes de SGML tout en gardant suffisamment de
souplesse pour une utilisation gnraliste.

La version 1.0 de XML a t publie en 1998 par le consortium W3C


(World Wide Web Consortium).

Version 1.1 en 2004: mise jour pour les caractres spciaux en


lien avec Unicode

14

Limitation de HTML (1)


HTML est conu pour la prsentation d'information
sous forme de pages web
HTML contient un nombre limit de balises dfini
La conception de HTML n'est pas approprie pour les
donnes

les balises ne renseignent pas sur les valeurs


incluses entre les balises
Les balises ne sont pas extensibles

15

Limitation de HTML (2)


Lorsque

les balises ne suffisent pas, les


constructeurs ont tendance dfinir leurs
propres balises pour rpondre leurs besoins
(incompatibilit) ex. HTML 2+, HTML 3.0
Mise jour dun ensemble de pages web trs
complexe :
hyperliens pointant dans tous les sens ;
restructuration ou remise en forme de
lensemble des pages du site fastidieux.
16

Avantages de XML

Sparation stricte entre contenu et prsentation

Simplicit, universalit et extensibilit

Format texte avec gestion des caractres spciaux

Structuration forte

Modles de documents (DTD [Chapitre 2] et


Schmas XML [Chapitre 3])

Format libre

17

Lapproche XML

Par rapport SGML


Trs semblable (baliss, DTD: schma de dfinition du
vocabulaire du document)
plus lger et moins strict (le DTD nest pas obligatoire et
na pas besoin de coller exactement au document)

Par rapport HTML


plus strict (oubli des guillemets ou de fin de balises non
accept).
balisage non prdfini : une syntaxe plus forte et plus
souple
18

Structure dun document XML


Un fichier XML est compos de:

Un prologue

Un lment racine (et un seul)


Un arbre d'lments et leurs attributs

Des Commentaires
Des instructions de traitement

Le Prologue (1)
<?xml

version="1.0"

encoding="ISO-8859-1"

standalone="yes"?>

Version : version du XML utilise dans le document, 1.0 (la


dernire version du langage, 1.1, date de fvrier 2004 mais ne
change rien quant ses bases) ;
Encoding : le jeu de codage de caractres utilis. Le jeu de
caractres habituel pour le franais est le ISO-8859-1. Il a
tendance tre remplac par l'ISO-8859-15 en attendant la
gnralisation de l'Unicode. Par dfaut, l'attribut encoding a
la valeur UTF-8. Cela permet l'ordinateur de savoir quel
caractre il doit afficher en rponse aux combinaisons de 1 et
de 0 que contient le fichier sur le disque dur ;
20

Le Prologue (2)

standalone : dpendance du document par rapport


une dclaration de type de document (DTD). Si

standalone a la valeur yes, le processeur de


l'application n'attend aucune dclaration de type de

document extrieure au document. Sinon, le


processeur attend une rfrence de dclaration de

type de document. La valeur par dfaut est yes.


21

L arbre d lments

Un lment d un document XML


une balise d ouverture
le contenu de l lment
une balise de fermeture
Exemple :<titre>Langage et Applications</titre>

Tout lment fils de larbre est compltement


inclus dans son pre (pas de recouvrement entre
balises)
Il existe un et un seul lment pre qui contient
tous les autres : l lment racine (root)

Les lments (1)

Les lments forment la structure mme du document : ce


sont les branches et les feuilles de l'arborescence.

Les lments peuvent contenir du texte, ou bien d'autres


lments, qui sont alors appels lments enfants ,
l'lment contenant tant quant lui appel logiquement
lment parent .

Exemple d'lment contenant du texte :


<titre>Les Misrables</titre>

Les lments (2)

Exemple d'lment contenant d'autres lments :


<livre>
<titre>L'Assommoir</titre>

<auteur>mile Zola</auteur>
<couverture couleur="rouge" />
</livre>

Remarque: il nya pas de rgle gnrale sur le choix de lutilisation dun


attribut ou dun lment. On considre le plus souvent quune

information courte est la plus susceptible dtre mise sous la forme dun
attribut

Commentaires
Un commentaire commence par <!-- et se termine par -->
Un commentaire tre plac n'importe quel endroit tant qu'il
se trouve l'extrieur d'une autre balise.
Exemple

<?xml version="1.0" encoding="UTF-8"?>

<!--

Element Racine -->

<biblio>
<livre>
<titre>Construire une application XML</titre>
<auteur>Jean-Christophe Bernadac</auteur>
<edition>Eyrolles</edition>
<annee>1999 </annee>
</livre>
</biblio>

25

Instructions de traitement
Une instruction de traitement est une instruction
interprte par l'application servant traiter le
document XML.
Les instructions de traitement qui servent le plus
souvent sont la dclaration XML ainsi que la
dclaration de feuille de style.
Exemple d'instruction de traitement :
<?xml-stylesheet type="text/css" href="biblio.css"?>
Dans cet exemple, l'application est xml-stylesheet, le
processeur de feuille de style de l'application traitant
le document XML.
26

Exemple de document XML

Dclaration format XML

<?xml version="1.0" encoding="ISO-8859-1?>

Dclaration schma associ <!DOCTYPE biblio SYSTEM "bibliot_1.dtd">


Dclaration feuille de style <?xml-stylesheet type="text/xsl" href="style.xsl"?>
Elements

< biblio >

Balise ouvrante
Contenu

Attribut
Nom d'attribut
Valeur d'attribut
Balise fermante

<livre isbn="2-212-08932-5">
<titre> Construire une application XML </titre>
<auteur> Jean-Christophe Bernadac </auteur>
</livre>
< /biblio >
27

Rgles syntaxiques

1.
2.
3.
4.

Commencer par une dclaration XML


Balisage sensible la casse
La valeur des attributs doit tre quote
Les lments ne doivent pas se
chevaucher
<jour> <mois> </jour>
</mois> interdit

5. Un lment doit encapsuler tous les


autres
6. Ne pas utiliser les caractres < et & seuls
28

Points importants

Les document DOIVENT tre bien-forms (wellformed)


un document ne contient qu'un seul lment racine
les balises ouvrantes doivent tre fermes et
correctement imbriques
les attributs doivent tre spcifis et mis entre guillemets
le contenu ne doit contenir que des caractres XML valides

Les documents PEUVENT tre valides


la structure et les contenus du document se conforment
des rgles spcifies par un "vocabulaire" (DTD ou XMLSchema)
29