Académique Documents
Professionnel Documents
Culture Documents
tar capacitado para percibir la estruc- las etiquetas HTML de una manera similar
tura del sitio atendiendo a aspectos vi- a como las interpretarı́a una persona cuando
suales tales como tamaño del texto, ubi- percibe la expresión visual de tales etiquetas.
cación del texto dentro de la página, etc. Por ejemplo, una de tales reglas podrı́a in-
dicar que textos escritos en negrita y de un
Para poder comprender el mensaje, el re-
determinado tamaño son titulares, o que los
ceptor debe ser capaz de leer e interpre-
enlaces que se encuentran precedidos de una
tar el código utilizado en la redacción del
determinada etiqueta son secciones.
mensaje, primordialmente lenguaje na-
El resto del presente artı́culo está estruc-
tural e imágenes.
turado como sigue: En la sección 2 se repasa
Si de lo que se trata es de ampliar el tipo brevemente diversas tecnologı́as relacionadas
de receptores capacitados para interpretar el con el problema abordado. En la sección 3 se
contenido del mensaje, por ejemplo cuando presenta con detalle el formalismo propues-
el receptor es un programa de ordenador, en- to para la descripción formal de la estruc-
tonces es la comunidad dedicada al estudio tura lógica de un sitio web, WLF. A con-
y desarrollo de la web semántica la que se tinuación se describe brevemente un navega-
ocupa de ello1 (Berners-Lee, Hendler, y Las- dor web basado en diálogo que hace uso de
sila, 2001). Si, por el contrario, la limitación WLF+WLFR. Y finalmente, se discuten al-
no la impone la capacidad cognitiva del re- gunos aspectos relevantes y lı́neas de trabajo
ceptor, si no la imposibilidad, por un motivo futuras que quedan abiertas a partir de la
u otro, de percibir la información codificada presente investigación.
en el sitio web, entoces es un aspecto inves-
tigado dentro del área de accesibilidad web 2. Trabajo relacionado
o WAI (web accessibility iniciative) 2 . Esta En la figura 1 se muestran diversos códi-
iniciativa anima al diseño de sitios web que gos o lenguajes ordenados según su capacidad
sean más fácilmente accesibles por personas expresiva y el coste computacional para la
con algún tipo de discapacidad. Sin embar- manipulación automática del mensaje escrito
go, son pocos los sitios que tienen en cuenta mediante tal código. En un extremo queda la
las recomendaciones más básicas en cuanto a descripción de un sitio web expresado exclu-
accesibilidad. sivamente en lenguaje natural. Un sitio web
En este trabajo se propone un enfoque cuyo contenido y estructura lógica sea des-
original para superar la limitación que crita exclusivamente usando lenguaje natu-
supone el “aspecto” de la mayorı́a de los sitios ral tiene una gran capacidad expresiva pero
web. Este enfoque requiere añadir el grado es inviable computacionalmente. Próximo a
de formalismo necesario para que un nave- este extremo se encuentra el conjunto forma-
gador pueda “conocer” cómo está la infor- do por HTML, junto con todo aquello que no
mación estructurada, aunque finalmente no se corresponde con un elemento de marca-
sepa de qué se habla allı́. Para ello, se pro- do: lenguaje natural, gráficos, sonidos. . . Por
pone un formalismo denominado Web Logic ello, que un algorı́tmo pueda “compreder” la
Forms (WLF) derivado directamente a par- informción codificada en un sitio web es casi
tir de HTML, y unas reglas que operan sobre tan difı́cil como si de texto plano se tratara.
WLF, denominadas WLFR (WLF Rules). El otro extremo de la cadena quedan aque-
WLF+WLFR permite dotar al navegador de llos sitios web cuyo significado está exclusiva-
la información suficiente referente a la estruc- mente codificado en algún lenguaje formal, si
tura del sitio web como para mostrar tal in- es que ello fuera posible. Esto asegurarı́a que
formación de la manera que resulte más ade- la semántica de ese sitio web es manejable
cuada al perfil de usuario. La conversión de en términos computacionales, pero a costa
un sitio ya existente al formalismo aquı́ pro- de severas limitaciones expresivas (Levesque
puesto si bien no es automática, es sencil- y Brachman, ). Un equilibrio deseable entre
la pues se reduce a acompañar el sitio web ambos extremos lo representa RDF y OWL3 .
con un conjunto de reglas WLFR que per- OWL es el acrónimo del inglés Web Onto-
mita al navegador interpretar correctamente logy Language, un lenguaje de marcado para
1
publicar y compartir datos usando ontologı́as
Web semántica: http://www.w3.org/2001/sw
2 3
Iniciativa para la accesibilidad de la web: RDF: http://www.w3c.org/rdf,
http://www.w3.org/WAI OWL:http://www.w3c.org/owl
18
Representación formal de la estructura lógica de sitios web, y su aplicación a un navegador web multilingüe basado en diálogo
en la Web. OWL, en su versión más popular, ploración del sitio web que se desea tratar.
OWL-DL, es una implementación de lógica Es en estas reglas justamente donde se codi-
descriptiva (Baader et al., 2003) que toma la fica la semántica adicional con que se quiere
sintaxis de un modelo de marcado construido enriquecer tal sitio, al modo en que, por ejem-
sobre RDF y codificado en XML. Ası́, un uso plo, OWL puede describir el contenido de un
adecuado de OWL permite el razonamien- sitio web, sólo que aquı́ la dificultad es menor,
to automático sobre el contenido de un sitio pues no se trata de describir el contenido sino
web, y requiere el diseño de una ontologı́a la estructura lógica del sitio.
que describa los objetos relevantes presentes
en tal sitio Web y relaciones entre éstos. El
problema es que esa ontologı́a tiene que ser
codificada por un experto, y esta tarea dista
mucho de ser trivial.
Existen diversas propuestas para repre- Por otra parte, existe una amplia varie-
sentar principalmente la estructúra lógica del dad de formalismos de representación que
sitio web, y es en este ámbito donde mejor en- dan soporte a diversos wrappers web tal co-
cuadra el presente trabajo. Ası́, en (Martı́nez- mo WHIRL(Cohen, 2000). Este lenguaje, que
Santiago, Ureña, y Garcı́a-Vega, 2001) se pro- también tiene inspiración logica, tiene una
pone una herramienta que permite derivar capacidad expresiva adecuada para obtener
a partir de ciertos sitios web un documento una representación formal de todo el con-
XML con etiquetas tales como “autor”, “tı́tu- tenido del sitio web, por lo que excede el
lo”, “sección”. Este modelo requiere descri- objetivo de WLF, y su complejidad. El es-
bir mediante un conjunto de sencillas reglas fuerzo que requiere escribir y mantener un
cómo extraer tales etiquetas del sitio web. Un wrapper para uno de estos lenguajes es simi-
aspecto destacable es la naturaleza jerárquica lar al que se requerı́a en una web semántica.
de tales reglas de tal modo que es posible Por ello, existen esfuerzos por conseguir au-
crear reglas que se aplican a cualquier pági- tomatizar la escritura de wrappers mediante
na web, sólo a las páginas pertenecientes a un técnicas de aprendizaje automático y minerı́a
sitio web, a una sección de ese sitio web, o in- de datos, pero es difı́cil, con el estado de la
cluso a una página determinada. Por contra, tecnologı́a actual, que una máquina “apren-
es una herramienta que queda limitada por el da” el contenido semántico de una web por
conjunto de reglas disponible, ası́ como por sı́ sola. Sin embargo, dado que WLF se cen-
su orientación a explorar sitios de contenido tra en la estructura del sitio, y no en su con-
periodı́stico por lo que le presupone una es- tenido, el esfuerzo de escribir y mantener uno
tructuración al sitio bastante rı́gida. En es- de tales wrappers es mucho menor. Por to-
ta lı́nea, el trabajo propuesto en (Chan y Li, do ello, el motivo último de WLF es descri-
2000) que aporta algo más de flexibilidad gra- bir un lenguaje computacionalmente asumi-
cias al uso de XSL como formalismo principal ble, de fácil escritura, y que aún ası́ tenga un
para representar aquellas reglas que permiten grado de formalismo útil para diversas tareas,
extraer información semántica del sitio web. como ADN, el navegador multilingüe basado
Nótese que en ambos casos es necesario elab- en diálogo descrito en la segunda parte de
orar un conjunto de reglas mediante la ex- este artı́culo.
19
Fernando Martínez Santiago, Arturo Montejo Ráez, Miguel Ángel García Cumbreras
20
Representación formal de la estructura lógica de sitios web, y su aplicación a un navegador web multilingüe basado en diálogo
21
Fernando Martínez Santiago, Arturo Montejo Ráez, Miguel Ángel García Cumbreras
Cuadro 2: Una porción de código HTML junto con su forma lógica equivalente
HTML WLF
<html> html(h1, none, open,1)
<title> Diario Digital </title> title(h2, h1, open, 2)
text(h2,“Diario Digital”)
title(h2, h1, closed, 3)
<body> body(h3, h2, open, 4)
<a href=“/opinion/col1.html”> a(h4,h3,open,5)
attr(“a”,h4)
fullValue(“a”,h4,“/opinion/col1.html”)
22
Representación formal de la estructura lógica de sitios web, y su aplicación a un navegador web multilingüe basado en diálogo
represente, además de un evento como es usu- tado que representa una página de iden-
al, un nuevo autómata. La transición se com- tificación, podrı́a almacenarse ahora el
pleta en el momento que el nuevo autóma- nombre de usuario y la clave facilitada.
ta llega a un estado final. De esta manera,
se crea una pila de autómatas conforme se En la figura 3 se muestra la arquitectura
va transitando a través del ATN, de man- propuesta tomando como ejemplo un diario
era similar a como se apilan los sitios web digital.
en el historial de un navegador web conforme La mayor limitación de ADN es que sólo
se visitan nuevos sitios. Ası́, cada autómata puede navegar sobre aquellas páginas web
se corresponde con un sitio web, y cada es- para las cuales se han creado las reglas WL-
tado representa una página determinada. Fi- FR pertinentes y, además, se ha diseñado el
nalmente, una transición queda descrita por automáta que describa el modo de naveg-
los siguientes elementos: ar en ese sitio web, si bien es posible crear
autómatas estándar para grupos de sitios
Operación test. Precondiciones que web que compartan una estructura de nave-
deben cumplirse para que tal transición gación similar. Por ejemplo, es posible crear
se lleve a cabo. Por ejemplo, que el un autómata para diarios, otro para comer-
usuario esté registrado. Este tipo de cio electrónico, otro para blogs, etc. Las pe-
información generalmente se obtiene a culiaridades de cada uno de estos sitios son
partir de la base de datos contenida en ocultadas por el gestor de navegación a través
el gestor de navegación. de la base de conocimiento.
Eventos. Órdenes de usuario que dirigen Actualmente, existe un primer prototipo
la navegación a través del sitio. Estas or- de ADN que opera sobre dos diarios en
denes se corresponden más o menos con español (El Mundo y el diario deportivo
la interacción usual con un navegador SPORT), uno inglés (The Guardian) y uno
web. Se permite cierto grado de flexi- francés (Le Monde), que confirma la viabili-
bilidad mediante el uso de expresiones dad de la arquitectura, si bien aun falta por
regulares. Este enfoque, si bien es sen- probar el enfoque en sitios que requieren un
cillo, resulta adecuado pues se trata de grado más alto de interactividad, como un
un diálogo sobre un dominio bien deli- sitio de comercio electrónico, por ejemplo.
mitado y dirigido por el navegador web.
Generalemente, se tratará de respuestas 5. Consideraciones sobre la
a preguntas concretras de ADN, como relación entre WLF y OWL
“¿Quiere visitar la sección de nacional,
Ya que OWL permite describir el con-
internacional o deportes?”.
tenido de un sitio web, ¿por qué no usar direc-
Operación action. Postcondiciones como tamente OWL?. Realmente, el hecho de des-
resultado de la ejecución de la transi- cribir la estructura de la página web usando
ción. Por ejemplo, si se abandona un es- lógica de predicados de primer orden o OWL
23
Fernando Martínez Santiago, Arturo Montejo Ráez, Miguel Ángel García Cumbreras
es irrelevante. OWL en su versión más equi- sitio web. Los estados son páginas o tipos de
librada, OWL-DL, es una implementación de páginas concretos de tal sitio, las acciones
la lógica descriptiva que es a su vez un sub- son órdenes de usuario que permiten saltar
conjunto de la lógica de predicados de primer de una página a otra, o a otro sitio web.
orden. Ası́ que el paso de LPO a OWL es más Ya que la web no es sólo HTML, una lı́nea
o menos trivial, si bien es cierto que OWL es, de trabajo futura es ampliar la definción de
en cierta forma, una especialización de LPO, WLF a otros lenguajes comunes en la codifi-
muy orientado a escribir ontologı́as y razonar cación de sitios web, tales como XML+XSL
sobre ellas. Es adecuado pues para represen- o lenguajes script.
tar qué contiene un sitio web, y no tanto cómo Por otra parte, la mayor limitación que
está organizado tal sitio, para lo cual en este tiene WLF es que requiere de la escritu-
trabajo se ha preferido la capacidad expresi- ra de las reglas WLFR mediante el análisis
va de la lógica tradicional. En cualquier ca- manual del texto HTML. Esperar que esta
so WLF no es una alternativa a OWL, sino tarea se pudiera realizar de manera total-
un procedimiento para derivar la forma lógi- mente automática es casi tanto como que-
ca de un sitio web. El lenguaje usado para rer que, al dı́a de hoy, una máquina pue-
codificar la forma lógica para posteriormente da comprender lenguaje natural en toda su
razonar sobre ella es secundario. En definiti- riqueza. En cualquier caso, si es posible rea-
va, no supone más que una pequeña variación lizar herramientas de apoyo, que mediante
sobre el mismo tema implementar WLF sobre algorı́tmos de aprendizaje automático super-
OWL. visado, puedan ayudar al experto humano en
el desarrollo de las reglas WLFR.
6. Conclusiones y trabajo futuro En lo relativo al navegador ADN, actual-
Se ha presentado un procedimiento de- mente se está evaluando con buenos resulta-
nominado WLF que permite representar dos la eficacia del navegador en sitios que re-
HTML mediante LPO. Ello permite, en quieran un alto grado de interacción, tal co-
primer lugar, dotar a la página de in- mo la realización de un pedido. Un segundo
formación referente a la estructura lógi- aspecto más ambicioso es dotar al gestor de
ca del sitio web. Esta información real- diálogo de cierta capacidad de comprensión
mente ya está latente en la página. El de lenguaje natural y planificación. Una com-
problema es que el lenguaje usado para prensión más elaborada del lenguaje natural
ello (HTML+texto+imagenes+...), es ex- permitirı́a diseñar planes para dar respuesta
tremadamente vago e impreciso, y por lo tan- a solicitudes de usuario que conlleven reali-
to intratable computacionalmente. Lo que el zar más de una acción a partir de una única
uso combinado WLF y WLFR posibilita es sentencia, tales como “navega a la sección de
justamente tratar de manera automática la deportes de El Paı́s”,que requiere navegar al
estructura lógica del sitio web, de forma simi- diario y luego a la sección solicitada, o “lista
lar a cómo la web semántica permite explotar los productos de la sección de electrodomésti-
el contenido de tal sitio, más allá de cómo tal cos de El Corte Inglés”.
contenido se muestre de cara al usuario.
7. Agradecimientos
Un ejemplo práctico de uso de
WLF+WLFR es el navegador web con- Este trabajo ha sido financiado par-
versacional multilingüe ADN, que interactúa cialmente mediante el proyecto TIMOM
con el usuario usando exclusivamente (TIN2006-15265-C06-03), del Ministerio de
lenguaje natural, presentando al usuario la Ciencia y Tecnologı́a, y el proyecto de inves-
información de manera ordenada y conve- tigación de la Universidad de Jaén con código
niente. Además, dado que ADN conoce la RFC/PP2006/Id 514.
estructura lógica del sitio es posible inter-
actuar con el usuario en el idioma de éste, Bibliografı́a
con independencia del idioma utilizado en el Baader, Franz, Diego Calvanese, Deborah L.
sitio web, si bien es cierto que la información McGuinness, Daniele Nardi, y Peter F.
finalmente solicitada se mostrará en el Patel-Schneider, editores. 2003. The De-
idioma original, salvo que se traduzca. ADN scription Logic Handbook: Theory, Imple-
es un relativamente sencillo gestor de diálogo mentation, and Applications. Cambridge
basado en ATNs. Cada ATN representa un University Press.
24
Representación formal de la estructura lógica de sitios web, y su aplicación a un navegador web multilingüe basado en diálogo
Berners-Lee, Tim, James Hendler, y Ora Las- Woods, W.A. 1970. Transition network
sila. 2001. The Semantic Web. A new grammars for natural language analysis.
form of Web content that is meaningful En CACM, volumen 13, páginas 591–606.
to computers will unleash a revolution of
new possibilities. The Scientific Ameri-
can, Mayo.
Chan, Jessica Choi Yuk y Qing Li. 2000.
WebReader: A Mechanism for Automat-
ing the Search and Collecting Information
from the World Wide Web. En WISE,
volumen 2, páginas 20–47.
Cohen, William W. 2000. WHIRL:
A word-based information representation
language. Artif. Intell., 118(1-2):163–196.
Levesque, Hector J. y Ronald J. Brachman.
Readings in Knowledge Representation.
Levin, Beth. 1993. English Verb Class-
es and Alternations: A Preliminary In-
vestigation. University of Chicago Press,
Chicago, IL.
Levy, D., R. Catizone, B. Battacharia,
A. Krotov, y Y. Wilks. 1997. Converse:
A conversational companion. En Proceed-
ings of the First International Workshop
on Human-Computer Conversation, pági-
nas 27–34, Bellagio, Italia.
Martı́nez-Santiago, Fernando, Alfonso
Ureña, y Manuel Garcı́a-Vega. 2001.
WWW como fuente de recursos lingüı́sti-
cos. Sociedad Española para el Proce-
samiento del Lenguaje Natural, 27:41–70.
McTear, M. 1998. Modelling spoken dia-
logues with state transition diagrams: ex-
periences with the cslu. En ICSLP.
Robinson, Kerry, D. Horowitz, E. Bobadilla,
M. Lascelles, y A. Suarez. 2004. Mod-
elling spoken dialogues with state transi-
tion diagrams: experiences with the cslu.
En SIGDIAL.
Rus, Vasile. 2002. Logic Form For Word-
Net Glosses and Application to Ques-
tion Answering. Ph.D. tesis, Computer
Science Department, School of Engineer-
ing, Southern Methodist University, Dal-
las, Texas.
Woods, W. A., 1973. Natural Language Pro-
cessing. Algorithmics Press, capı́tulo An
experimental parsing system for transi-
tion network grammars, páginas 111–154.
Rustin, R., New York.
25
Fernando Martínez Santiago, Arturo Montejo Ráez, Miguel Ángel García Cumbreras
HTML
<div class=“tituno”>
<a href=“/elmundo/2005/11/07/sociedad/1131392990.html” class=“tituno”>
Villepin autoriza el toque de queda en los lugares azotados por la violencia callejera
</a>
</div>
WLF
div(h1,none,open,1)
attr(“class”,h1)
fullValue(“class”,h1),“tituno”)
a(h2,h1,open,2)
attr(“href”,h2)
fullValue(“href”,h2,“/elmundo/2005/11/07/sociedad/1131392990.html”)
attr(“class”,h2)
fullValue(“class”,h2,“tituno”)
text(h2,“Villepin autoriza el toque de queda en los lugares azotados por la violencia calle-
jera”)
a(h2,h1,close,3)
div(h1,none,close,4)
WLFR
Obtener el titular:
all x1 x2 x3 div(x1,none,open,x3) & fullValue(“class”,x1)=“tituno” & a(x2,x1,open) &
text(x2)→diario.titular.texto(x2)
26