Vous êtes sur la page 1sur 36

Initiation à XML

XML: Origine et Concepts


de base

1. Origines d’XML
2. HTML avantages et inconvénients
3. Les objectifs d’XML
4. La structure d’XML
5. Les atouts d’XML
6. Les Editeurs d’XML
XML : Origines
• XML= eXtensible Markup Language: langage de
marquage extensible ou langage à balises étendu
• Métalangage dont les bases peuvent être utilisées
pour créer d’autres langages
• XML est issu de SGML (Standard Generalized Markup
Language), un métalangage standard international
• XML est un Standard gratuit développé par XML
Working Group sous l'égide du World Wide Web
Consortium (W3C) depuis .1996
• XML 1.0 est recommandé officiellement par le W3C
(http://www.w3.org) depuis le 10 février .1998
• Supporté par les grands constructeurs
• IBM, Microsoft, HP, SUN, BEA, etc.
3
Un document est composé de 4 éléments:

Émetteur
Destinataire De :service RH
Date
À : M. le PDG
Référence
Contenu

LA STRUCTURE Le 03/11/2010
LE SUPPORT PHYSIQUE

NOTE n° 132-A

La DRH a évalué les


Service RH besoins en formation
M. Le PDG pour l’ensemble des
03/11/2010 personnels du groupe
132-A pour l’année …2010 LA MISE EN FORME
La DRH a évalué…

LES DONNEES

4
Un document numerique est composé de 3 fichiers

DOCUMENT NUMERIQUE = STRUCTURE + DONNEES + MISE EN FORME

1 FICHIER 1FICHIER 1FICHIER


pour la structure pour les données pour la mise en forme
(.xsd ou .dtd) (.xml) .(xsl ou .css)

5
HTML : présentation

• Proposé par le W3C comme


format de documents sur le <HTML>
Web <HEAD>
Langage avec des balises fixes <TITLE> Exemple </TITLE>
standardisées permettant la </HEAD>
mise en forme d’un texte <BODY>
<H1>Contenu du document</H1>
• Standard reconnu par tous les <A HREF = "http://www.server.fr/Info
navigateurs, très populaire sur /dir/test.html"> une référence
le Web externe
</A>
• Nouvelle version en cours de </BODY>
standardisation HTML ,5.0pour </HTML>
le web 2.0

6
HTML : inconvénients
• HTML a un ensemble pré-déterminé de balises
• Il n'est pas possible de créer de nouvelles balises.
• HTML est un langage de présentation
• Les balises donnent des indications sur la manière de présenter et non sur
le contenu.

• Mise à jour d’un ensemble de pages difficile :


• Restructuration ou remise en forme de l’ensemble des pages du site
fastidieux.
• Mélange le fond et la forme
• Données utiles et mises en forme mixées
• Pas de rigueur d'écriture:
• On peut écrire indifféremment une balise en minuscules ou en majuscules,
• ne pas indiquer la balise de fermeture
• faire chevaucher des balises différ9entes.
Présentation et Structuration

Titre XML: Des BD aux Services Web


Auteur Georges Gardarin
Section 1. Introduction
Paragraphe Ces dernières années ont vu l'ouverture des
systèmes d'information à l'Internet. Alors que
depuis les années 1970, ces systèmes se
développaient, le choc Internet …
Paragraphe Ainsi, on a vu apparaître une myriade de
technologies nouvelles attrayantes mais peu
structurantes voir perturbantes. Certaines n'ont
guère survécues …
L'urbanisation passe avant tout par la
Paragraphe standardisation des échanges : il faut
s'appuyer sur des standards ouverts, solides,
lisibles, sécurisés, capable d'assurer
l'interopérabilité avec l'Internet et les systèmes
d'information …
Section .2La société ProXML

8
Vue Balisée

<Livre>
<Titre> XML : Des BD aux Services Web</Titre>
<Auteur>Georges Gardarin</Auteur>
<Section titre = "Introduction">
<Paragraphe>Ces dernières années ont vu l'ouverture des systèmes d'information à l'Internet.
Alors que depuis les années 1970, ces systèmes se développaient, le choc Internet …
<Paragraphe>
<Paragraphe>Ainsi, on a vu apparaître une myriade de technologies nouvelles attrayantes
mais peu structurantes voir perturbantes. Certaines n'ont guère survécues …
</Paragraphe>
<Paragraphe>L' urbanisation passe avant tout par la standardisation des échanges : il faut
s'appuyer sur des standards ouverts, solides, lisibles, sécurisés, capable d'assurer
l'interopérabilité avec l'Internet et les systèmes d'information …
</Paragraphe>
</Section>
<Section titre= "La Société ProXML">

</Section>
</Livre>
9
XML: définitions de base

• XML est un méta-langage universel qui permet de structurer,


stocker et échanger les informations
• XML standardise la manière dont l'information est :
• Transformée (XSLT)
• Cryptée (XML Digital Encryption)
• archivée (XML-DataBases)
• Retrouvée (XPATH, XQUERY)
• Échangée (SOAP)

10
Les objectifs de conception:

• Les documents XML doivent être lisibles par l'homme


et raisonnablement clairs
• XML doit pouvoir être utilisé sans difficulté sur Internet
• XML doit soutenir une grande variété d'applications
• XML doit être compatible avec HTML
• Il doit être facile de créer des documents XML
• Il doit être facile d'écrire des programmes traitant les
documents XML

11
Structure d’un document XML
Structure d’un document XML

Un document XML est constitué de 4 éléments:


• Un Prologue
• Un élément racine (et un seul)
• Un arbre d'éléments et leurs attributs
• Des Commentaires (facultatifs)

13
Structure d’un document XML

?<xml version="1.0" encoding="ISO->?"8859-1 Prologue


<!-- ceci est une carte de visite-- > commentaire
<carteDeVisite>
<prénom<Sidi Mohamed</prénom> Élément racin
<nom>Benslimane</nom>
<adresse> Élément enfant
<numéro<42</numéro>
<voie type="avenue">1er Novembre 1954</voie>
<ville codepostal="220000">Sidi Bel Abbes</ville>
</adresse> Attribut
<note>
Enseigne <clé<XML>/clé< l’université de Sidi Bel Abbes
/<note>
/<carteDeVisite>

14
Le prologue

15
Le prologue
• Cette déclaration XML :est facultative, mais il est
préférable de l'utiliser;
• Les attributs "version", "encoding" et "standalone "
doivent être places dans cet ordre;
• Elle doit être positionnée en toute première ligne du
document XML.
• Par exemple, il ne faut ni commentaire, ni même une
simple ligne code avant elle.
• Le prologue contient d ’ autres élément (que nous
verrons plus tard)
• Instructions de traitement
• Type de Document
16
Elément
Un « nom » + un «contenu » + des « attributs » éventuels
Exemple :
<P>
Mohammed Benslimane
</p>
Nom p
Balise Ouvrante : <P>
Balise fermante : </p>
Contenu: Mohammed Benslimane
Contenu d’élément
Du texte <p>
Mohamed Benslimane
/ < p>
Des éléments <body>
<p>…</p> < … p>…</p>
</body>
Contenu mixte <p>
enseigne
<em>XML</em>
A l’université UDL
</p>
Eléments : syntaxe générale
• Une balise doit être nommée :
• Avec des minuscules )c'est mieux(, accentuées si l'on veut
• Eventuellement, des _ , des -, des ., des :, et des chiffres
• le nom doit toujours contenir au moins une lettre
• le premier caractère doit être alphabétique ou un tiret-souligné
• Le nom ne peut commencer par XML
• Aussi:
• Les balises doivent être correctement imbriquées)pas de
chevauchement).
• <P> bla <B> bla.</B> </P> est correct, alors que
• <P> bla <B> bla.</P> </B> ne l’est pas
• Toute balise ouverte doit être fermée <A>…</A>
• XML est sensible à la case (Titre  titre  TITRE)
19
Syntaxe des noms d’élément
(exemples)
• nom
• prénom
• à-la-ligne Mais pas…

• xsl:value-of • First name


• n123 • 2010-catalogue
• décompte.client • Nom/prenom
• first_name • 1234
• ‫مسإلا‬ • xmlSpécication
• _Ali

20
Structure d'un document
Hiérarchie de composition des éléments

>Documentation<
>intro<
/>intro<
>Chap<1
>Section<1
>Sous-section<1
Bla bla bla
/>Sous-section<1
>Sous-section<2
Bla bla bla
/>Sous-section<2
/>Section<1
>Section<2
/>Section<2
>Section<3
/>Section<3
/>Chap<1
>Chap<2
/>Chap<2
>Conclusion<
/>Conclusion<
/>Documentation<

21
Structure: Élément racine

• Tous les documents XML doivent avoir une balise UNIQUE


d'ouverture et de fermeture appelé l'élément racine (root
element) <? xml version="1.0" encoding="ISO -8859-1" ?>
<livres>
Exemple: <livre>
<titre>HTML 4, XML et Java 2</titre>
• Dans le fichier livres.xml, <isbn>2-7440-0628-9</isbn>
cette balise est <livres> <auteurs>
<nom_auteur>Eric Ladd</nom_auteur>
>nom_auteur>Jim O'Donnel</nom_auteur<
/>auteurs<
>description>
Ressources d'Experts HTML 4, XML et Java 2
se révèle l'ouvrage le plus complet.
/>description<
>prix Can="7000 DA</"
/>livre<
/>livres<

• Tous les autres éléments sont contenus à l'intérieur des balises


de l'élément racine; ce sont les sous-éléments (child elements.)
22
Structure: Élément racine

• Sert à donner au pgm d’analyse un point de


référence.
• Exemple

Oui Non

23
Attribut
• Les attributs sont codés au sein de la balise ouvrante de l’élément.
• Fournissent des informations supplémentaires sur l’élément
(qualifie l’élément)
• Syntaxe :nom="valeur" OU nom='valeur'
• L'ordre des attributs n'a pas d'importance
•La balise fermante est une balise simple
Exemple:

Nom d’élément Nom d’attribut Valeur d’attribut

<produit type = "papier">


….
</produit>
24
Attribut

• Attention : Un attribut pour un élément donné ne


peut avoir qu’une seule valeur
• Exemple
<produit type="val"1 type="val2">
...
</produit>
est interdit …
Évitons les attributs

• Ils ne peuvent pas contenir de valeurs multiple (les


éléments oui).
• Ne sont pas facilement extensible (futur).
• Ne peuvent pas décrire les structures.
• Ils sont plus difficile à manipuler par les programmes.
• Peuvent être remplacés par des éléments.

<produit type=“papier> “ <produit>


<code> 12345 /<code> <code> 12345 </code>
… <type> papier </type>
</produit> …
</produit>

26
Contenu vide

Exemple :
<br></br>

Raccourci équivalent

<br/>

27
Règle sur le texte

• Les caractères ,» ' « ,» & « ,» < « ,» > « et » " « ne


peuvent pas être utilisés dans le texte )car utilisés dans le
balisage) € on note:
• & «lt; »à la place de,» > «
• & «gt; »à la place de,» < «
• & «amp; »à la place de,» & «
• & «quot; »à la place de,» " «
• et & «apos; »à la place de.» ' «

30
Les commentaires

29
Caractérisation d'un document XML

• Un document XML est dit bien formé (Well-


Formed) s'il respecte les règles suivantes:
• Le document doit contenir au moins un élément.
• Il doit contenir un élément racine )Root Element).
• Tous les autres éléments doivent être contenus à l'intérieur
des balises de l'élément racine et ils doivent être imbriqués
correctement.
• Le document doit respecter les règles de syntaxe XML.

30
Exemple complet

XML 33
XML : Les atouts principaux
• Lisibilité : aucune connaissance ne doit théoriquement être
nécessaire pour comprendre un contenu d'un document XML
• clarté: séparation du fond et de la forme
• Une structure arborescente : permettant de modéliser la
majorité des problèmes informatiques
• Universalité et portabilité : les différents jeux de caractères sont
pris en compte; format texte (rien en binaire); il peut être
facilement distribué par n'importe quels protocoles à même de
transporter du texte, comme HTTP
• Intégrabilité : un document XML est utilisable par toute
application pourvue d'un » parser « (c'est-à-dire un logiciel
permettant d'analyser un code XML)
• Modularité: un document XML doit pouvoir être utilisable dans
tous les domaines d'applications;
• Extensibilité: XML est un métalangage dont les bases peuvent
être utilisées pour créer d’autres langages
34
XML :les Inconvénients

• Format texte  XML est bavard: grande quantité


de mémoire si l’on compare au format binaire
• Récent  encore peu ou moyennement supporté
)navigateurs Web récents)… ,
• Ça fait beaucoup de langages XML à connaître

33
Applications XML

• Diffusion de contenu sur le web


• complément à HTML, à CSS …
• Échange entre applications distribuées
• Services Web, …
• Archivage :
• Base de données XML
• Gestion de la connaissance
• Ontologies

34
Editeur XML
• Facilite la saisie
• Permet de vérifier la bonne formation
• Les règles syntaxiques ont-elles été respectées ?
• Peut mettre en forme votre document
• Exemple
• Oxygen: C' est un soft développé en Java, disponible sur Windows
et Unix
• BonFire Studio : très facile à utiliser, fonctionnalités de bases mais
suffisantes pour mes besoins.
• Xml-Spy: C'est un peu plus qu'un éditeur xml, il est payant mais existe
en version d'essai
• Cooktop: Il est entièrement gratuit et offre pas mal de possibilités.
• XMLwriter: Il est stable et facile à utiliser,
• XmlBuddy: sous Eclipse,
• Etc. 37
Questions ?

38

Vous aimerez peut-être aussi