site de Fabien Torre
Notes de cours sur le langage HTML
Motivations et principes du langage HTML pour la
structuration de documents sur le web : éléments,
balises, attributs, entités, métadonnées, nouveautés
amenées htmls, codages de questionnaires sous
forme de formulaires HTML, ete.
(1. Principes généraux
1.1 Motivation initiale
La motivation initiale est de pouvoir échanger des documents sur Internet en utilisant le
protocole HTTP (HyperText Tranfer Protocol).
est
La solution proposée a été le langage HTML (HyperText Markup Language). Celui-
indépendant de la machine et ouvert.
Il ne s'agit pas d'un langage de programmation : HTML permet uniquement de
structurer un document.
Un fichier HTML est un simple fichier texte que I'on peut ouvrir et modifier avec un
éditeur quelconque. Outre le texte du document, le fichier contient des balises qui vont
préciser la structure ou I'apparence du document.
Bali: t ut
Une balise peut prendre trois formes.
+ La premiére, la plus simple, un simple nom d’élément encadré par les signes
inférieur et supérieur :
Ce sera le cas des éléments ar ou HR.+ Dans un deuxiéme temps, la balise peut porter sur une partie précise du document,
auquel cas, elle doit s’ouvrir et se refermer :
texte concerné
igne / annonce la balise fermante. Voir par exemple I'élément 8 qui met le texte
encapsulé en gras.
+ Enfin, il peut étre nécessaire de préciser le comportement de la balise, cela se fait
avec des attributs, selon la syntaxe suivante :
texte concerné
Un attribut étant défini comme ceci :
non_attribut="valeur"
Ainsi, un paragraphe étant défini a l'aide de I'élément p, l'attribut ALIGN précisera
sa justification
. Structure d'un document
Le squelette de base que l'on retrouvera dans tout document HTML est le sui
en-téte du document
corps du document
Dans I'en-téte, on définira obligatoirement un titre a l'aide de l'élément TrTLe.
Voir également les attributs de l'élément sooy pour la définition des couleurs du
document et d'une éventuelle image de fond.
Pour étre plus rigoureux, la premiére ligne d'un document HTML doit mentionner un
DOCTYPE, c'est-a-dire le langage HTML que l'on va utiliser dans la suite. Les variations
possibles sont :+ respecter ou pas les contraintes d'un langage XML : si oui, il s‘agit de xHTML, sinon
de itm. 4.01;
* se restreindre aux éléments purement sémantiques ou s'autoriser les éléments de
mise en forme : dans le premier cas on fait du strict, sinon du Transitional.
Une autre précision important est I'encodage utilisé pour les caractéres : i] pourrait s'agir
de 1atin1, d'utfs, ete.
Finalement, si l'on fait le choix d'un HTML avec contraintes XML, éléments de mise en
forme et codage des caractéres en UTF8, le squelette du document devient :
en-téte du document avec un title
corps du document