Vous êtes sur la page 1sur 13

Tema 1.

Reconocimiento de las
caractersticas de lenguajes de marcas
1.1.
1.2.
1.3.
1.4.
1.5.
1.6.
1.7.

Definicin y clasificacin de lenguajes de marcas.


Tipos de lenguajes de marcas.
Evolucin de los lenguajes de marcas.
Etiquetas, elementos y atributos.
Organizaciones desarrolladoras.
Utilizacin de lenguajes de marcas en entornos Web.
Gramticas

Lenguajes de marcas y sistemas de gestin


de la informacin.
1

1.1. Definicin y clasificacin de lenguajes de marcas

informacin textual de un
documento con marcas relativas a su estructura.
Los LdM combinan la

El LdM especifica:
Cules son las etiquetas.
Dnde deben colocarse esas etiquetas.
Cul es el significado de cada etiqueta.
Las etiquetas o marcas NO se presentan al usuario final;
este slo ve

el contenido.

<noticia>
<lugar>Valencia</lugar>

A diferencia de los
lenguajes de programacin,
los lenguajes de marcas NO
tienen funciones aritmticas
ni variables.

<fecha>18/10/2013</fecha>
<desc>Open 500
Tenis</desc>
Lenguajes de marcas y sistemas de gestin
de la informacin.
2
</noticia>

1.2. Tipos de lenguajes de marcas


Lenguajes orientados a
presentacin. Codifican cmo ha
de presentarse un documento. Ej:
Microsoft Word.
Lenguajes procedurales. Las
etiquetas tambin se orientan a
presentaciones pero dentro de un
marco procedural que permite
definir macros y subrutinas. Ej: TeX,
LaTeX, Poscript.
Lenguajes descriptivos. No
definen qu se debe hacer, sino
que definen qu es cada
informacin. Ej: SGML y sus
derivados HTML, XML, ...

Las marcas de Word que


vemos con el smbolo .

Los documentos cientficos


con frmulas y los peridicos
se escriben con LaTeX..

Lenguajes de marcas y sistemas de gestin


de la informacin.
3

1.2. Tipos de lenguajes de marcas


HTML. Lenguaje destinado a la creacin de pginas Web que
permite mezclar en un mismo documento texto y contenidos
multimedia.
XML. Simplificacin y adaptacin de SGML que permite definir
lenguajes especficos segn las necesidades; es lo que se
conoce como un metalenguaje. No se utiliza slo en Internet;
se ha convertido en un estndar para el intercambio de
informacin entre plataformas.

Extensible. Puede definir nuevas etiquetas.


Estructurado. Se pueden modelar datos a cualquier nivel de complejidad.
Validable. Ya sea frente a una DTD o un Schema.
Abierto. Independiente de empresas, sistemas operativos, leguajes de
programacin o entornos de desarrollo.

Lenguajes de marcas y sistemas de gestin de la


informacin.

1.3. Evolucin de los lenguajes de marcas


Se introducen a finales de la dcada de los 60 para introducir
anotaciones dentro de los documentos electrnicos.
Se estandariza SGML (Standard Generalized Markup Language),
descendiente del GML de IBM.
A finales de los 80 en el CERN se crea HTML (Hyper-Text Markup
Language) con el objetivo de compartir informacin a travs de Internet.
Es el ms utilizado para crear pginas Web.
En los 90 el consorcio W3C (WorldWide Web Consortium) hace pblico
un nuevo estndar, XML (eXtended Markup Language), ms potente que
HTML.
En 2009 el consorcio W3C pone fin al
desarrollo de XHTML 2.0 a favor de HTML
SGML
5.
Grandes empresas y sitios comerciales con
HTML
XML
mucho pblico: XHTML y CSS en varias hojas
de estilo.
XHTM
Sitios web pequeos y pginas personales:
L
HTML y una hoja de estilos sencilla.
XML est orientado a la gestin,
5 visualizacin y
Lenguajes de marcas y sistemas de gestin de la informacin.
organizacin de
datos

1.3. Evolucin de los lenguajes de marcas


Si bien XML se ver en los temas 3, 4 y 5 conviene destacar
que...
XML es un estndar para escribir datos estructurados en un
fichero de texto.
Datos estructurados son documentos tales como una hoja de
clculo, la libreta de direcciones, parmetros de configuracin,
transacciones financieras o dibujos tcnicos. Los programas que
los generan, utilizan normalmente formatos binarios o de texto.
XML es un conjunto de reglas, normas y convenciones para
disear formatos de texto para tales tipos de datos, de forma que
produzca ficheros fciles de generar y de leer.
XML usa marcas y atributos, pero la diferencia estriba en que,
mientras en HTML cada marca y atributo est establecido
mediante un significado, incluyendo el aspecto que debe tener al
verse en un navegador, en XML slo se usan las marcas para
delimitar fragmentos de datos, dejando la interpretacin de stos
6
a la aplicacin que los lee.
Lenguajes de marcas y sistemas de gestin de la informacin.

1.4. Etiquetas, elementos y atributos


Tres son las partes de un
<direccion>
documento de lenguajes de
<nombre>
marcas:
<titulo>Sr.</titulo>
Etiquetas (tag). Es el texto
<nombre>Javier</nombre>
que van entre los smbolos <>.
<apellido>Luna</apellido>
Hay etiquetas de inicio
</nombre>
<nombre> y de fin
</nombre>.
<calle>Cervantes 24</calle>
Elementos. Estructuras
<ciudad
mediante las que se organiza el prov=VLC>Catarroja></ciudad
>
contenido del documento o
<codpost>46470</codpost>
acciones que se desencadenan
cuando el programa
</direccion>
navegador interpreta el
documento.
El elemento <nombre> tiene
Atributo. Par nombre-valor
tres elementos hijos <titulo>,
<nombre> y <apellido>
que se encuentra dentro de la
7
etiqueta inicial de un elemento
Lenguajes de marcas y sistemas de gestin de la informacin.

1.4. Etiquetas, elementos y atributos

Caractersticas de los lenguajes de marcas


Texto plano. Archivos que contienen slo caracteres de texto
ASCII, UTF-8, Pueden ser interpretados por un editor de
textos.
Compactos. Las instrucciones de marcado y contenido se
mezclan entre si: <h2>contenido</h2>.
Independencia del dispositivo. Un mismo documento se
interpreta de diversas formas, segn el dispositivo sea mvil o
PC.
Flexibles. Los lenguajes de marcas pueden combinarse en un
mismo archivo con otros lenguajes, como HTML con PHP, HTML
con Javascript.

Lenguajes de marcas y sistemas de gestin de la


informacin.

1.5. Organizaciones desarrolladoras


Organizacin Internacional para la Estandarizacin (ISO,
International Standard Organization). Es el organismo
encargado de promover y desarrollar normas internacionales
de fabricacin, comercio y comunicacin.
World Wide Web Consortium (W3C). Tutela el crecimiento y
organizacin de la Web.
1.6. Utilizacin de lenguajes de marcas en entornos Web

Una pgina Web es un documento electrnico adaptado para


la World Wide Web que forma parte de un sitio Web.
Las pginas Web estn escritas en un lenguaje de marcas que
proporciona la capacidad de insertar hiperenlaces HTML.
El contenido de la pgina puede ser predeterminado (pgina
web esttica) o generado en el momento de su visualizacin
o al solicitarla a un servidor Web (pgina web dinmica)
9
Lenguajes de marcas y sistemas de gestin de la informacin.

1.7. Gramticas
DTD
DTD. (Definicin de Tipo de Documento). Establece las reglas
de formacin del lenguaje formal: la combinaciones de smbolos
elementales que son sintcticamente correctas.
La especificacin del W3C para HTML 4.0 contempla 3 DTD:
DTD estricta (HTML 4.0 Strict DTD). Incluye los elementos y
atributos que no han sido declarados desaprobados
(deprecated).
DTD transaccional o flexible (loose) (HTML 4.0 Transitional
DTD). Incluye lo anterior ms los elementos desaprobados.
DTD para documentos con marcos (HTML 4.0 Frameset
DTD). Engloba todo lo incluido en el transaccional ms lo
relativo a la creacin de documentos con marcos (frames)

Lenguajes de marcas y sistemas


10 de gestin de la informacin.

1.7. Gramticas
DTD
La DTD es el formato de esquema nativo para validar
documentos XML. Utiliza una sintaxis no-XML para definir el
modelo de contenido de un documento XML vlido.
Define todos los elementos.
Define las relaciones entre los distintos elementos.
Proporciona informacin adicional que puede ser incluida en el
documento (atributos, entidades, notaciones).
Aporta comentarios e instrucciones para su procesamiento y
representacin de los formatos de datos.

Es el mtodo ms sencillo para validar documentos XML.

Lenguajes de marcas y sistemas de 11


gestin de la informacin.

1.7. Gramticas
ESQUEMA XML
XML Schemas es la evolucin de la DTD descrita por el W3C,
tambin denominada XSD (XML Schema definition).
Es un lenguaje ms complejo, potente y de mayor
expresividad que las DTD. Utiliza sintaxis XML.
A la hora de validar un documento, utilizar XSD supone un
gran consumo de recursos y tiempo debido a su gran
especificacin y complejidad en la sintaxis.
El modelo de datos de XML Schema incluye:
El vocabulario (nombres de elemento y atributo)
El contenido modelo (relaciones y estructura).
Los tipos de datos.

Lenguajes de marcas y sistemas de gestin de la informacin.


12

1.7. Gramticas
RELAX NG
Es un lenguaje de esquema basado en la gramtica.
Tiene un alto poder expresivo: permite validar datos que
aparezcan en cualquier orden.
Las aplicaciones de definicin de documentos y validacin
para RELAX NG son ms sencillas que las de XML Schema.
RELAX NG se ha convertido recientemente en un estandar
ISO como la parte 2 de DSDL (Document Schema Definition
Language).

Lenguajes de marcas y sistemas de 13


gestin de la informacin.

Vous aimerez peut-être aussi