Vous êtes sur la page 1sur 11

U.T.-1 PARTE 2 Lenguaje de marcado XHTML.

AWE

UNIDAD DE TRABAJO N1 PARTE2: XHTML

NDICE:

3.1.- Introduccin.

3.2.- Qu es XHTML?

3.3.- Ventajas del XHTML respecto al HTML.

3.4.- Qu debe cumplir un documento XHTML? Reglas.

3.5.- Requisitos de conformidad para Agentes de Usuario

3.6.- Modularizacin de XHTML

3.7.- XForms

3.8.- Terminologa utilizada en esta Unidad de Trabajo. N 3

3.1.- Introduccin.

Una vez que se ha visto y comentado el Lenguaje de Marcado de Hipertexto


(HTML) en la Unidad de Trabajo anterior, en esta Unidad de Trabajo se va a ver el
Lenguaje de Marcado XHTML. Para ello se comentan varios puntos, teniendo en
cuenta que el objetivo es dominar los cuatro puntos primeros del ndice (hasta el punto
3.4.), el 3.8 referente a la terminologa utilizada y el resto son complementarios al tema
para tener ms informacin sobre XHTML. Interesa sobre todo conocer:

Qu es XHTML?
Por qu surge este y qu ventajas tiene respecto al HTML?
En qu se diferencia del HTML?

3.2.- Qu es XHTML?

En sus inicios, el lenguaje HTML fue ampliamente adoptado por la


comunidad, lo que dio lugar a que el HTML empezar a crecer incorporando
etiquetas nuevas, pero sin demasiado control. Esto provoc que determinados
contenidos solo fueran accesibles desde determinados navegadores. Por tanto, esta
falta de estandarizacin dio lugar a que el HTML, dejar de ser tan sencillo como
era en un principio.

2 SMR IES VALLE DEL JERTE-CABEZUELA Pgina 1 de 11


U.T.-1 PARTE 2 Lenguaje de marcado XHTML. AWE

Es en ese momento, cuando XML hace aparicin y se postula como


alternativa al caos generado por el crecimiento de HTML. Sin embargo, XML est
orientado al intercambio de informacin ms que a la presentacin de la
misma. Como solucin se propone utilizar una combinacin de XML y HTML y de
esta forma y de un modo natural surge XHTML (eXtensible HyperText Markup
Languaje), como dialecto de XML pero con las caractersticas orientadas a
presentacin de informacin de HTML.

Por tanto, una de las principales diferencias es que HTML proviene de SGML
mientras que XHTML proviene de XML, lo que condiciona su sintaxis, entre otras
caractersticas.

Aparece desde la versin del HTML 4.0 y el XML 1.0., como ya hemos
mencionado como en una "reformulacin del lenguaje HTML en una
aplicacin XML".

Para ello, utiliza las reglas de alguno de los 3 DTDs definidos por el W3C. La
compatibilidad con agentes de usuario HTML existentes es posible siguiendo un
pequeo conjunto de reglas.

3.3.- Ventajas del XHTML respecto al HTML.

Las ventajas ms evidentes que ofrece el migrar a XHTML son:

Los documentos XHTML se establecen en base a las reglas XML. Por tanto,
pueden ser visualizados, editados y validados por cualquier herramienta
estndar XML.
Los documentos XHTML pueden escribirse para que funcionen igual o mejor
que lo hacan antes tanto en los agentes de usuarios conformes a HTML 4.0
como en los nuevos agentes conformes a XHTML 1.0.
Los documentos XHTML pueden contener aplicaciones (por ejemplo applets o
scripts) que se basen en DOM y que modifiquen la propia estructura del
documento XHTML. El DOM significa Modelo de Objetos del Documento que
es una interfaz de programacin de aplicaciones (API) para documentos
HTML y XML. Para saber ms, consulta el enlace:

http://html.conclase.net/w3c/dom1-es/introduction.html
Permite insertar en el documento XHTML nuestras propias marcas que no
tienen por qu estar definidas en el estndar general. Esto es lo que se
llama modularizacin XHTML.

2 SMR IES VALLE DEL JERTE-CABEZUELA Pgina 2 de 11


U.T.-1 PARTE 2 Lenguaje de marcado XHTML. AWE

Cada vez ms los accesos a la Red se hacen a travs de dispositivos que no


son PCs. XHTML est diseado para poder ser visualizado en cualquier tipo
de plataforma (telfonos mviles, tablets, PDAs ...).
Hacer las pginas legibles por personas discapacitadas. Al no tener marcas
que indiquen forma de representacin entremezcladas con el propio
contenido, es mucho ms fcil construir agentes de usuario que lean ese
contenido a personas invidentes o lo pasen a otros formatos como Braille.

3.4.- Qu debe cumplir un documento XHTML? Veamos sus


Reglas.

En este apartado se enumeran y detallan una serie de "reglas que debe


cumplir un documento para ser XHTML en vez de HTML":

1 REGLA.- Definido segn un DTD.

En XHTML 1.0 hay 3 DTDs definidos como estndar:

1. xhtml1-strict.dtd: Usado cuando queremos utilizar un sistema de marcas


realmente limpio y estructurado libre de cualquier marca que especifique
forma de representacin (<font>, <b>, <u>, ...). Est preparado para ser
usado junto con las CSS en las que se especifica el tipo de letra, colores,
fondos, etc.
2. xhtml1-transitional.dtd: La idea es tomar la ventaja de las capacidades
de XHTML incluyendo las hojas de estilo pero slo para hacer pequeos
ajustes a las marcas para beneficiar a aquellos que tienen navegadores
antiguos que no entienden las CSS.
3. xhtml1-frameset.dtd: Hay que usarlo cuando queramos tener Marcos
HTML para particionar la ventana del navegador en uno o ms marcos.

2 REGLA.- El elemento raz debe ser <html>

El elemento por el que empieza un documento XHTML debe ser <html> y el


que finaliza </html>

3 REGLA.- El elemento raz debe designar el espacio nominal

Debe designar el espacio nominal a travs del atributo xmlns teniendo que

ser el valor de ste para XHTML: http://www.w3.org/1999/xhtml

Un pequeo ejemplo de un documento XHTML:

2 SMR IES VALLE DEL JERTE-CABEZUELA Pgina 3 de 11


U.T.-1 PARTE 2 Lenguaje de marcado XHTML. AWE

<?xml version="1.0" encoding="UTF-8"?>

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0


Strict//EN""http://www.w3.org/TR/xhtml1/DTD/xhtml-strict.dtd">

<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="sp"


lang="sp">

<head>

<title>Biblioteca Virtual</title>

</head>

<body>

<p>Trasladada a <a href="http://vlib.org/">vlib.org</a>.</p>

</body>

</html>

EXPLICACIN DEL EJEMPLO:

En la lnea 01 se define que el documento va a ser de tipo xml versin 1.0 y


el tipo de codificacin de caracteres utilizados en dicho documento, en este caso,
UTF-8.

En la lnea 02 se hace la declaracin del DOCTYPE (ver explicacin en el


siguiente punto).

En la lnea 04 se hace referencia al espacio nominal de xhtml y


especificamos que el lenguaje es el Espaol.

El resto de lneas es la definicin del documento XHTML de la misma forma


que haramos si fuera HTML.

El espacio nominal XHTML 1.0 puede usarse conjuntamente con otros


espacios nominales XML aunque, los documentos as producidos, no sern
documentos XHTML 1.0 estrictamente conformes.

El siguiente ejemplo muestra cmo XHTML 1.0 podra usarse junto con con
la Recomendacin MathML:
NOTA:

2 SMR IES VALLE DEL JERTE-CABEZUELA Pgina 4 de 11


U.T.-1 PARTE 2 Lenguaje de marcado XHTML. AWE

El MathML o Mathematical Markup Language es un lenguaje de marcado


basado en XML, cuyo objetivo es expresar notacin matemtica de forma
que distintas mquinas puedan entenderla, para su uso en combinacin con
XHTML en pginas web, y para intercambio de informacin entre programas de
tipo matemtico en general.

El soporte de MathML es grande en programas matemticos (como Maple o


Mathcad), pero an escaso en navegadores (slo va plugins en Internet
Explorer, parcial en Mozilla).

Ejemplo XHTML con etiquetado MathML:

<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="sp" lang="sp">

<head>

<title>Un ejemplo matemtico</title>

</head>

<body>

<p>Lo que viene a continuacin es etiquetado MathML:</p>

<math xmlns="http://www.w3.org/1998/Math/MathML">

<apply> <log/>

<logbase>

<cn> 3 </cn>

</logbase>

<ci> x </ci>

</apply>

</math>

</body>

</html>

EXPLICACIN DEL EJEMPLO:

En la lnea 01 se especifica el espacio nominal de XHTML

En las siguientes lneas utilizamos los elementos habituales de HTML

2 SMR IES VALLE DEL JERTE-CABEZUELA Pgina 5 de 11


U.T.-1 PARTE 2 Lenguaje de marcado XHTML. AWE

En la lnea 07 indicamos que queremos utilizar el espacio nominal de MathML

Hasta la lnea 14 utilizamos los elementos de MathML que, en este caso


especifica log3x

Hasta el final volvemos a usar los elementos HTML

4 REGLA.- Debe existir una declaracin <!DOCTYPE>

Debe haber una declaracin de DOCTYPE previa a la declaracin del


elemento raz. Esta declaracin debe referenciar a uno de los 3 DTDs definidos
como estndar:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"


"DTD/xhtml1-strict.dtd">
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"DTD/xhtml1-transitional.dtd">
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Frameset//EN"
"DTD/xhtml1-frameset.dtd">

5 REGLA.- El documento debe ser "gramaticalmente correcto"

Un documento gramaticalmente correcto significa que todos los elementos


deben tener su marca de cierre y sin solapamiento con otros elementos.

BIEN: <p>esto es un prrafo <u>y esto subrayado</u>.</p>


MAL: <p>esto es un prrafo <u>y esto en negrita</p>.</u>
MAL: <p>esto es un prrafo <u>y esto en negrita</u>. (falta </p>)

6 REGLA.- Los nombres deben ir en minsculas

Los nombres de los elementos y de los atributos deben estar en minsculas.


Esto se debe a que XML distingue entre maysculas y minsculas.

BIEN: <html><body leftalign="0">hola mundo</body></html>


MAL: <HTML><Body LeftaligN="0">hola mundo</Body></HTML>

7 REGLA.- Todos los elementos deben indicar su cierre

Esto se debe a que en HTML 4.0 se pueden definir elementos que deberan
tener su cierre indicado pero que luego no utilizan.

EJEMPLO HTML EJEMPLO XHTML

2 SMR IES VALLE DEL JERTE-CABEZUELA Pgina 6 de 11


U.T.-1 PARTE 2 Lenguaje de marcado XHTML. AWE

<table> <table>
<tr> <tr>
<td>1 <td>1</td>
<td>2 <td>2</td>
</tr> </tr>
<tr> <tr>
<td>3 <td>3</td>
<td>4 <td>4</td>
</tr> </tr>
</table> </table>

8 REGLA.- Los valores de los atributos deben ir entrecomillados

Todos los valores de los atributos deben ir entrecomillados, incluso los


numricos.

BIEN: <table border="0" align="center">...</table>


MAL: <table border=0 align=center>...</table>

9 REGLA.- No soporte de atributos minimalizados

XHTML no soporta atributos minimalizados que son aquellos que slo


necesitan el nombre del atributo pero sin ningn valor.

EJEMPLO HTML (no soportado): <table><tr><td align=center


nowrap>...</td></tr></table>

10 REGLA.- Los elementos vacos deben tener su cierre

Un elemento vaco es aqul que no tiene principio o fin, sino que declara un
elemento en el metalenguaje para el cual est definido.

EJEMPLO HTML: <br> (Salto de lnea)


EJEMPLO XHTML: <br />

11 REGLA.- Incompatibilidades entre elementos

Existen ciertas incompatibilidades en el anidamiento de elementos. Esta


prohibicin se aplica a todas las profundidades de anidamiento.

a: no puede contener otros elementos a.


pre: no puede contener los elementos img, object, big, small, sub o sup.
button: no puede contener los elementos input, select, textarea, label,
button, form, fieldset, iframe o isindex.
label: no puede contener otros elementos label.
form: no puede contener otros elementos form.

2 SMR IES VALLE DEL JERTE-CABEZUELA Pgina 7 de 11


U.T.-1 PARTE 2 Lenguaje de marcado XHTML. AWE

3.5.- Requisitos de conformidad para Agentes de Usuario

Los agentes de usuario (aplicacin informtica que funciona como cliente)


deben cumplir una serie de reglas para representar documentos XHTML de forma
correcta.

1.- Ver si el XHTML es gramaticalmente correcto

El agente de usuario debe analizar y evaluar si un documento XHTML es


gramaticalmente correcto. Es decir, si cumple con todas las reglas definidas
anteriormente. En principio, y tal y como se est definiendo el estndar, si no es
gramaticalmente correcto el documento no se representa.

2.- Reconocer el atributo "id"

Cuando un agente de usuario procesa un documento XHTML como XML


genrico, tan slo debera reconocer atributos del tipo "id".

3.- Presentar el contenido de elementos no reconocidos

Si un agente de usuario encuentra un elemento que no reconoce, debe


presentar el contenido de dicho elemento.

4.- Ignorar atributos no reconocidos

Si un agente de usuario encuentra un atributo que no reconoce, debe


ignorar completamente la directriz que marque el atributo, es decir, el atributo y su
valor.

5.- Manejar valores desconocidos de atributos

Si un agente de usuario encuentra un valor de un atributo que no reconoce,


debe usar en su lugar el valor por defecto de dicho atributo (que se encuentra
definido en el DTD).

6.- Asignar ciertos valores como espacios en blanco

Los siguientes caracteres se definen en XHTML como caracteres de espacios


en blanco:

Espacio (&#x0020;)
Tabulacin (&#x0009;)
Retorno de carro (&#x000D;)
Avance de lnea (&#x000A;)

2 SMR IES VALLE DEL JERTE-CABEZUELA Pgina 8 de 11


U.T.-1 PARTE 2 Lenguaje de marcado XHTML. AWE

3.6.- Modularizacin de XHTML

A la vez que el uso de XHTML vaya pasando de los agentes de usuario del
ordenador de sobremesa tradicional a otras plataformas, est claro que no todos
los elementos de XHTML sern necesarios en todas las plataformas. Por ejemplo un
PDA o un telfono mvil pueden soportar slo un subconjunto elementos de XHTML.

El proceso de modularizacin rompe XHTML en una serie de pequeos


conjuntos de elementos. Dichos elementos pueden ser recombinados para cumplir
las necesidades de diferentes comunidades. Estos mdulos se definirn en un
documento posterior de la W3C.

XHTML es ms que una simple reformulacin de HTML para ajustarse a XML.


Posee adems una arquitectura extensible que permite la definicin de nuevos tipos
de documentos. El W3C prev que los desarrolladores, los autores de documentos y
los proveedores de contenidos utilizarn esta arquitectura para definir nuevos tipos
de documentos que se ajusten a sus necesidades. La Modularizacin de XHTML
hace la definicin de estos nuevos tipos de documentos relativamente sencilla.

Subconjuntos y extensibilidad

La modularizacin conlleva diversas ventajas:


Provee un mecanismo formal para acotar XHTML.
Provee un mecanismo formal para extender XHTML.
Simplifica la transformacin entre tipos de documento.
Promueve la reutilizacin de mdulos en nuevos tipos de documento.

Perfiles de documento

Un perfil de documento especifica la sintaxis y la semntica de un conjunto


de documentos. La conformidad con un perfil de documento provee una base para
la garanta de interoperabilidad. El perfil de documento especifica los recursos
necesarios para procesar los documentos de dicho tipo, es decir, qu formatos de
imagen pueden usarse, niveles de escritura de cdigo, soporte de hojas de estilo,
etc.

Para diseadores de productos, esto permite a distintos grupos la definicin


de su propio perfil estndar. Para los autores, esto permitir obviar la necesidad de
escribir diferentes versiones de documentos para diferentes clientes.

Para grupos especiales tales como qumicos, mdicos o matemticos esto


permitir la construccin de un perfil especial usando elementos HTML estndar

2 SMR IES VALLE DEL JERTE-CABEZUELA Pgina 9 de 11


U.T.-1 PARTE 2 Lenguaje de marcado XHTML. AWE

ms un grupo de elementos especficamente diseados para cubrir las necesidades


de los especialistas.

3.7.- XForms

Los formularios se introdujeron en la especificacin HTML en 1993. Desde


entonces han venido siendo una parte fundamental de la web y las necesidades han
crecido, ahora hay que poder conectar esos formularios con nuevas fuentes de
datos.

Objetivos

Soporte de navegadores para PDA, televisores y PCs de sobremesa adems


de impresoras y de escners.
Interfaz de usuario ms enriquecida para cubrir las necesidades de negocios,
de consumo y de aplicaciones de control de dispositivos.
Desacoplamiento de los datos en dos niveles: lgico y representacin.
Mejorar la internacionalizacin.
Soporte para formularios de datos estructurados.
Mltiples formularios por pgina y pginas por formulario.
Capacidad de realizar Suspend y Resume.

Cmo funcionan?

Los formularios se dividen en 3 capas:

Interfaz de usuario: permite la independencia del navegador que estemos


utilizando, ya sea un PDA, un PC de sobremesa, ...
Lgica de proceso: permite la definicin de dependencias entre campos, por
ejemplo, para ejecutar totales, no dejar rellenar un campo sin haber
rellenado otro previamente. Adems permite especificar mscaras para los
campos del formulario: fechas, monedas, DNI, ...
Modelo de datos: permite especificar, si por ejemplo tenemos un formulario
de pedidos, que tendremos datos pertenecientes al pedido y uno o varios
detalles de pedido que tendrn sus propios datos.

Como resultado, el formulario enva al servidor un documento XML con los


datos que han sido rellenados o, en su defecto, con los valores definidos por
defecto en su DTD.

3.8.- Terminologa utilizada en esta Unidad de Trabajo. N 3

Agente de usuario: es una aplicacin que lee y procesa documentos SGML


(para nosotros XHTML).
Atributo: es un parmetro de un elemento. El tipo y el rango de valores
incluyendo el valor por defecto se definen en el DTD.
CSS: son las Cascade Style Sheet (hojas de estilo). Contienen informacin
acerca de cmo hay que representar los datos de los documentos.
DOM: es el Document Object Model, se trata de una API de acceso a
documentos SGML.

2 SMR IES VALLE DEL JERTE-CABEZUELA Pgina 10 de 11


U.T.-1 PARTE 2 Lenguaje de marcado XHTML. AWE

DTD: es el Document Type Definition, es una coleccin de declaraciones


XML que definen la estructura, elementos y atributos que deben cumplir los
documentos conformes al DTD.
Elemento: Es la unidad bsica definida en el DTD. Son las marcas usadas
en los SGML
Convalidacin: La convalidacin es un proceso por el cual los documentos
SGML son contrastados con su DTD asociado, asegurndose de que la
estructura, el uso de elementos y el uso de atributos son consistentes con
las definiciones descritos en el DTD.
XML: son las siglas de Lenguaje de Etiquetado Extensible (eXtensible
Markup Language). Fue concebido como un medio para recobrar la potencia
y flexibilidad de SGML sin que adquiriese su complejidad. A pesar de ser una
forma restringida de SGML, XML conserva casi toda la potencia y riqueza de
las caractersticas de SGML. An manteniendo estas caractersticas, XML
elimina las ms complejas de SGML que hacan la creacin y diseo de los
agentes de usuario apropiados difcil y costosa.

2 SMR IES VALLE DEL JERTE-CABEZUELA Pgina 11 de 11

Vous aimerez peut-être aussi