Vous êtes sur la page 1sur 121

Deteccindeinformacintemporalentextos

histricos Argentinos siglos XVIII y XIX


desdeunpuntodevistasemntico

Tesisdegrado
IngenieraenInformtica
OrientacinenSistemasdeProduccin

FACULTADDEINGENIERA
UNIVERSIDADDEBUENOSAIRES

Tesista: MiguelAgustnAbate
mabate@fi.uba.ar

Padrn: 84084

Directora:ProfesoraMaraFeldgen

Fecha: 17deAbril2016

1
Agradecimientos

Quiero dedicar este trabajo a mis padres, mis hermanas e Isabella quemeacompaarony
apoyaronduranteeldesarrollodelmismo.

Tambin quiero agradecer especialmente a mi directora de tesis, Prof. Mara Feldgen, que
meguientodomomentoparadarleformaaestatesis.

A los profesores de la Facultad de Ingeniera de la U.B.A. de los que fui aprendiendo a lo


largodeestosaosdecarrera.

A todos los que desarrollaron las herramientas y los recursos sobre losquemeapoypara
construirestatesis.

MiguelAgustnAbate

2
ndiceGeneral

1.Introduccin 6
1.1Objetivo 6
1.2AnotacinAutomticadeInformacinTemporal 7
1.3Problema 7
2.Anotacintemporaldetextos 8
2.1Anotacindeexpresionestemporales 8
2.1.1TareaMUCdereconocimientodeentidadestemporales 8
2.1.2Unesquemadeanotacinparaexpresionestemporales 9
2.2Anotacindeeventosconmarcastemporales 10
2.2.1FranjastemporalesdeMUC5yMUC7 10
2.2.2Asignandomarcastemporalesaclusulasdeeventos 10
2.2.3Sistemadeextraccindeeventosyrelaciones 11
2.2.4Anclajeyordenamientotemporaldeeventos 12
2.3Anotacinderelacionestemporales 13
2.3.1Anotacindeinformacintemporalintraoracional 13
2.3.2Anotacinsemnticadetextosdenoticias 14
3.Esquemasdeanotacinparainformacintemporal 16
3.1TIDESySTAG 16
3.2TERQAS:TimeMLyTimeBank 17
3.2.1TimeML 17
3.2.1.1LasprincipalesestructurasdeTimeML 18
3.2.1.1.1EVENT 18
3.2.1.1.2TIMEX3 19
3.2.1.1.3SIGNAL 19
3.2.1.1.4LINKS 20
3.2.1.1.4.1TLINK 20
3.2.1.1.4.2SLINK 21
3.2.1.1.4.3ALINK 22
3.2.2TimeBank 23
3.2.3AnotacinautomticaconTimeML 23
3.2.3.1GUTime 24
3.2.3.2EVITA 24
3.2.3.3GUTenLINK 25
3.2.3.4Slinket 25
3.2.3.5SputLink 26
3.2.4Experienciasenotrosidiomas 26
4.RolesSemnticos 28
4.1BasesLingsticas 28
4.1.1SemnticadeMarcos 31
4.1.2Losconceptosdeprototipoyperspectiva 31
4.1.3GramticadeCaso 32
4.1.4TeorasdeRolesSemnticos 35
4.2DescripcindeRolesSemnticos 37
4.2.1AlgunosRolesSemnticosComunes 37
3
4.2.2CaractersticasdelosrolesSemnticos 39
4.3RecursosdeRolesSemnticos 40
4.3.1FrameNet 40
4.3.1.1Elementosdemarco(FEs) 41
4.3.1.1.1Elementosdemarcocentrales 41
4.3.1.1.2Elementosdemarcoperifricos 41
4.3.1.1.3Elementosdemarcoextratemticos 41
4.3.1.1.4Elementosdemarcocentralnoexpresado 42
4.3.1.1.5Instanciacinnuladeelementosdemarco 42
4.3.1.2Relacionesentremarcos 42
4.3.1.2.1Relacionesdegeneralizacin 42
4.3.1.2.2Relacionesdeestructuradeeventos 42
4.3.1.2.3Relacionessistemticas 43
4.3.2VerbNet 43
4.3.3Propbank(PropositionBank) 43
4.3.4Wordnet 45
4.3.5ComparacinentreFrameNet,PropBankyWordnet 46
4.3.6Recursosenotrosidiomas 47
4.3.6.1Alemn 48
4.3.6.2Japons 48
4.3.6.3Espaol 49
4.3.6.4Sueco 49
4.3.6.5Portugus(Brasil) 49
4.4Anotacinautomtica 50
4.4.1AnotacinautomticadetextosconFrameNet 50
4.4.2AnotacinautomticadetextosconPropBank 51
5.Trabajosrelacionados 53
6.Desarrollo 55
6.1Esquemageneraldetrabajo 55
6.2Mdulomarcadordeeventos 56
6.2.1ConditionalRandomFields 57
6.2.2TiposdeEventosTimeMLyMarcosdeFrameNet 59
6.2.2.1AnlisisdelostiposdeeventosTimeMLcontralosmarcosde
FrameNet 59
6.2.2.1.1REPORTING 59
6.2.2.1.2PERCEPTION 60
6.2.2.1.3ASPECTUAL 61
6.2.2.1.4I_ACTION 62
6.2.2.1.5I_STATE 63
6.2.2.1.6STATE 64
6.2.2.1.7OCCURRENCE 65
6.2.3SolucinimplementadayCaractersticasdeltextoutilizadas 65
6.2.4Evaluacin 68
6.2.4.1Corpususadoycriteriodeevaluacin 68
6.2.4.2Resultados 71
6.2.4.3Contribucinycomparacinconelestadodelarte 72

4
6.3Mdulomarcadordelinks 73
6.3.1TiposLinksTimeML 74
6.3.1.1TLink 74
6.3.1.2SLink 77
6.3.1.3ALink 78
6.3.2RelacinentreFrameNetylinksTimeML 78
6.3.2.1FrameElements 78
6.3.2.2Frames 79
6.3.2.3RelacionesentreFrames 83
6.3.3Modelodeaprendizajesupervisado:SupportVectorMachines 84
6.3.4Procesodegeneracindedatosparaentrenamiento 84
6.3.5Caractersticaselegidasparaentrenarelalgoritmo 85
6.3.6Evaluacindelosresultados 86
6.3.6.1Corpususadoparalaspruebas 86
6.3.6.2Mtododeevaluacinutilizado 87
6.3.6.3DeteccinLINKyNO_LINKatravsdediferentes
oraciones(caso1) 88
6.3.6.4DeteccinyclasificacinTLINK,SLINK,ALINKNO_LINK
atravsdediferentesoraciones(caso2) 88
6.3.6.5DeteccinyclasificacindetodoslostiposdeLinkatravsde
diferentesoraciones(caso3) 89
6.3.6.6ClasificacinentreTLINK,SLINKyALINK
mismaoracin(caso4) 90
6.3.6.7ClasificacindetodoslostiposdeLink
atravsdediferentesoraciones(caso5) 91
6.3.6.8Comparacinconotrosproductos 92
6.3.7Conclusinsobredeteccindelinks 93
7.Elcasodelostextoshistricos 94
8.Conclusiones 98
9.Trabajofuturo 99
10.Referencias 100
11.Apndices 107
ApndiceA:RelacionesentreFramesextradasdelcorpusdeFrameNet
conunaherramientaqueseconstruyespecialmenteparaestetrabajo 107
ApndiceB:CausajudicialpordesembargodelaGoleta
NuestraSeoradelaCandelaria(18121816) 113
ApndiceC:PartesmilitaresdelaBatalladePavn(1861) 118

5
1.Introduccin
1.1Objetivo

Los manuscritos atesorados en bibliotecas y museos constituyen una importante


fuente de conocimiento e investigacin para los historiadores y el pblico en general. Para
preservar su integridad fsica y proveer acceso a una audiencia mayor, muchos de estos
manuscritos estn siendo digitalizados. Los catlogos digitales deben proveer
descripciones, metadatos e ndices de acceso a estos documentos que contengan
informacin de calidad, que permita cruzamiento entre colecciones relacionadas e
interoperabilidad.
Para construir las bibliotecas digitales es necesario un proceso de
semiautomatizacin de las tareas de obtencin y generacin de metadatos ydescripciones
usando los archivos existentes y los manuscritos. Esta informacin ademsserusadapor
lossistemasdebsquedasemntica.
La bsqueda semntica permite a un usuario plantear una consulta en contexto y
que los algoritmos recuperen los documentos que mejor se adaptenaella,nosimplemente
todos los que contienen el conjunto de palabras de la consulta. El armado de estas bases
de datos contextuales para los buscadores requiere de la aplicacin de tcnicas de
clasificacin de roles semnticos basada en caractersticas sintcticas, semnticas y
contextuales. Dentro del contexto de un corpus de documentos histricos uno de los
clasificadoresmsimportanteseselcontextotemporaldeloseventos.

Esta tesis se basa en elprocesamientodelainformacintemporal,unatareadentro


del campo del procesamiento del lenguaje natural (NLP). El objetivo deestatareaeshacer
explcitosloseventosyrelacionestemporalesexpresadosenuntexto.
La mayora de las soluciones actuales se basan en la informacin morfosintctica
del texto. Esto es una simplificacin que deja de lado muchas entidades y relaciones
temporales debido a que los conceptos temporales tienen una complejidad conceptual que
noescorrectamenterepresentadaenelnivelmorfolgicoosintctico.
La hiptesis de esta tesis es que la informacin temporal se manifiesta en el plano
semntico y, por lo tanto,alusarinformacin semntica parasudeteccinsepuedenlograr
mejoresresultados.
La cantidad de informacin disponible en medios digitales es cada vez mayor. Este
hecho pone enevidenciaunnuevoproblemaque esladificultadparaprocesaryaccederen
forma manual a esta informacin. Esto es particularmente cierto para el caso de archivos
histricos donde hay gran cantidad de documentos que abarcan periodos largos y muchas
veces su contenido es ambiguo y variable a travs de los aos. Otro problema que surge
con los textos histricos es que el momento de creacin de un documento puede ser
totalmentediferentealquehacereferenciaensucontenido.
El anlisis y la comprobacin de resultados se har sobre diferentes corpus de
documentos histricos argentinos pertenecientes al Instituto de Historia Argentina y
AmericanaDr.EmilioRavignanidelaUniversidaddeBuenosAires.

6
1.2AnotacinAutomticadeInformacinTemporal

La anotacin automtica de informacin temporal en textos es un rea que se ha


estado desarrollando intensivamente en la comunidad del Procesamiento del Lenguaje
Natural (NLP, por sus siglas en ingls) en los ltimos aos. La tarea consiste en hacer
explcitos a los elementos temporales en textos del lenguaje natural atravsdeunsistema
quelosidentifiqueylosanotesiguiendounesquemaestndar.Muchas reasdelNLP,tales
como, sumarizacin, sistemas que contestan preguntas, bsqueda, extraccin y
clasificacin de informacin se benefician al considerar y hacer uso de informacin
temporal.[GAIZAUSKAS01][MANI01][PUSTEJOVSKY01]

En este contexto,el esquemadeanotacinTimeML[PUSTEJOVSKY01]seconvirti
en uno de los estndares ms usados. Es importante notar que la cantidad de recursos
disponibles en idioma ingls es mucho mayor que en otros idiomas. Esto es importante ya
que uno de los objetivos de anotar textos temporalmente es poder hacer uso de estos
recursos para aplicaciones de aprendizaje automtico, pero para esefinesnecesariotener
grandescorpusdetextoanotados.

En trabajos anteriores (seccin 5), se demuestra que el uso de informacin
semntica mejora notablemente el reconocimiento y clasificacin de informacin temporal
en los textos. En el presente trabajo se profundizar en esta idea pero trabajando con los
marcossemnticosdelproyectoFrameNet[BAKER01].

1.3Problema

El problema que se presenta en esta tesis, es el de identificar automticamente
informacin temporal en textos de lenguaje natural usando informacin semntica,
particularmente aplicada al caso de textos histricos cuyo contenido es fragmentario y no
muy extenso. Entendindose porinformacintemporalaeventos,expresionestemporalesy
lasrelaciones(orden,inclusin,etc.)quesurgenentreestos.

En la seccin 2 se analizan los trabajos realizados sobre anotacin temporal. En la


siguiente seccin, se analizan diferentes esquemas de anotacin temporal que se usan
actualmente y cmofueronevolucionandoel desarrolloenestarea.Luego,seanalizanlas
bases lingsticas de los roles semnticos y, finalmente, en la seccin 5 se describen los
desarrollosexistentesenelrea.

7
2.Anotacintemporaldetextos

El reconocimiento automtico de expresiones temporales y eventos en textos de


lenguaje natural se ha convertido en un rea de investigacin activa en la lingstica
computacional y semntica. Una de las motivaciones de esta investigacin es la de poder
acceder a la informacin via contenido en vez de palabras clave. Hay avances en esta
direccin, ms especficamente en lo relacionado a reconocimiento de entidades propias
(tales como nombres, lugares, productos), sin embargo, el reconocimiento de eventos y su
anclajetemporalnoestresuelto.

Los eventos estn naturalmente anclados en el tiempo dentro de la narrativa de un


texto. Por esta razn, los eventos anclados en el tiempo son la base a partir de la cual se
razona sobre cmo cambia el mundo. Sin una forma de identificar y extraer eventos y su
anclaje temporal de un texto, se puede perder el verdadero contenido. Adems, como las
entidades y sus propiedades cambian a travs del tiempo, una base de datos sobre
entidades estara incompleta si no capturase la forma en que estas propiedades cambian
coneltiempo.

Los trabajos realizados de anotacin temporal, pueden dividirse en tres reas


generales: anotacin de expresiones temporales, anotacin de eventos con marcas
temporales y anotacin de relacionestemporales.Acontinuacinsedetallanlosdesarrollos
encadarea.

2.1Anotacindeexpresionestemporales

El trabajo ms extenso sobre anotacin de expresiones temporales, es el realizado


durante las MUCs (Message Understanding Conferences) y las extensiones de estos
trabajos.

2.1.1TareaMUCdereconocimientodeentidadestemporales

A mediados de la dcada de 1980, se realiz la primera de las siete Message


Understanding Conference, auspiciadas por DARPA. El objetivo de estas conferencias era
establecer un rgimen de evaluacin cualitativo parasistemasdeextraccindeinformacin
(IE) y entendimiento de mensajes (MU). La ltima MUC, MUC7, fue realizada en 1998.
ParamsinformacinsobrelasMUCssepuedever[GAIZAUSKAS01].

Dentro de todas las tareas definidas por las MUC que deban hacer los sistemas
participantes, la tarea relevante para esta tesis es la de reconocimiento de entidades, que
requiere el reconocimiento y clasificacin de entidades definidas tales como personas,
lugares,organizaciones,cantidadesmonetariasyfechas.

Desde el MUC5 en adelante, las fechas fueron parte de latareadereconocimiento

8
de entidades. Tienen que ser marcadas expresiones temporales (absolutasyrelativas)que
representan fechas u horas. Las expresiones temporales se clasificaban va el atributo
TYPE. Este atributo podra tomar el valor DATE para referirse a expresiones completas o
parcialesdefechasoTIMEparaexpresionescompletasoparcialesdehorasdelda.

2.1.2Unesquemadeanotacinparaexpresionestemporales

Wilson [WILSON01] describe los lineamientosparaanotar expresionestemporalesy


asociar una representacin cannica de los tiempos a los que se refieren. Tambin
introduce un mtodo para extraer dichas expresiones temporales desde diferentes
lenguajes.
Lasdoscaractersticasprincipalesson:

1. El enfoque va mucho ms all de loslineamientosusadosenlaMUC7.Elrangode


expresiones marcadas es mucho ms grande y, ms importante an, los valores
temporales comunicados por las expresiones temporales tienen una expresin ms
rica. La diferencia clave, es que en las MUCs, las expresiones temporales eran
simplemente anotadas mientras que en [WILSON01] se evala la expresin y
normalizalarepresentacindeltiempoalqueserefiere.
2. Las expresiones dependientes del contexto, como hoy son manejadas as como
tambin las expresiones completamente especificadas como 3 de Septiembre,
1997. El contexto puede ser local (en la misma oracin) o global (fuera de la
oracin). Las expresiones temporales indexadas,es decirquerequiereninformacin
conocimiento acerca del tiempo del discurso, como ahora tambinestnincluidas.
Un estudio de corpus [WILSON02] muestra que dos tercios de las expresiones
temporales en noticias impresas y emitidas por radio dependen del contexto, por lo
tanto,estacaractersticaesimportante.

Lossiguientescriteriossonconsideradosporelesquemadeanotacin:

Simplicidad con precisin: el esquema es lo suficientemente simple para ser


aplicado por personas pero tambin suficientemente preciso para ser usado en
variastareasdeprocesamientodelenguajenatural.
Naturalidad: se reflejan las distinciones que pueden esperarse que una persona
anotemsqueloquepuedahacerunsistemaautomtico.
Expresividad: los valores temporales se especifican lo mejor posible dentro de los
lmitesquepuedenserinferidosconfiablementeporunanotador.
Reproducibilidad: se usa un formato estndar (ISO8601 1997) para representarlos
valores temporales y la consistencia entre anotadores se asegura mediante el uso
deguasconejemplos.

La anotacin se realiza en dos pasos. Primero, todas las expresiones temporales


son marcadas y luego se identifica un valor temporal para estas expresiones. Se
representan tres tipos de valores temporales: puntos, duraciones y frecuencias. Los
problemas como lmites difusos (como en enladcadade1960)ynoespecificidad(como

9
enAbrilesusualmentehmedo)sontambintomadosencuenta.

A pesar de haber sido desarrollada en ingls, la representacin semntica usada


est pensada para ser usada a travs de diferentes idiomas y porendeayudaaldesarrollo
de anotadores temporales basados enunesquemadeanotacincomn.Secreuncorpus
de referencia en ingls compuesto de 32000palabrasdeuncorpusdedilogos telefnicos,
35000 palabras de textos del diario New York Times y 120000 palabras de noticias de
radiodifusin.

2.2Anotacindeeventosconmarcastemporales

2.2.1FranjastemporalesdeMUC5yMUC7

Como se mencion en la seccin anterior, MUC5 y MUC7 establecieron una


relacin entre eventos y tiempos. Se les pidi a los participantes asignar un tiempo de
calendario a ciertos tipos especficos de eventos (emprendimientos conjuntos y
lanzamientosdecohetes)

El llenado de plantillas de escenario requiere la identificacin de relaciones


especficas entre elementos de la plantilla. Por ejemplo, la tarea de llenado de plantilla de
escenario de MUC7 tena que ver con eventos de lanzamiento de cohetes. La plantilla de
escenario contiene informacin sobre vehculos, carga, lugar de lanzamiento, funciones de
la misin, etc. Adems contena un campo llamado LAUNCH_DATE, que contena un
enlace a la entidad temporal correspondiente (siesqueexistauntiempoalqueselopoda
asociar).

La relacin temporal entre un evento y el tiempo no se sigui evaluando ms. Las


relacionestemporalesentreeventosnoseconsideraron.

2.2.2Asignandomarcastemporalesaclusulasdeeventos

En el trabajo de Filatova et al. [FILATOVA01] se describe un mtodo para partir


historias de noticias en sus eventos y asignarles marcas temporales. Los autores analizan
referencias temporales implcitas (mayormente con un sistema de tiempos verbales) y
referencias temporales explcitas (adverbios temporales) para ayudar a reconstruirelorden
cronolgicodeloseventosenlanoticia.

Se asume que las clusulas simples son los eventos transmitidos por el texto y se
identifican usando un analizador lexicogrfico que produce rboles sintcticos marcados
semnticamente. Se ignoran algunos problemas de este enfoque, por ejemplo mltiples
verbos endiferentestiemposenunamismaoracincausancomportamientosincorrectosen
el sistema. La representacin temporal elegida, es una versin levemente modificada dela
sugeridaporAllen[ALLEN03].

10
La asignacin de marcas temporales usa dos puntos temporales de anclaje. Un
punto temporal es el tiempo del artculo (se us solo la fecha, no la hora del da) y el otro
punto temporal, es el ltimo asignado dentro de la misma oracin. El procedimiento de
marcadotemporales:

1. Se extraen las marcas temporales (presumiblemente se le asignan tiempos de


calendarioalasreferenciastemporalesexplcitas).
2. Se le asigna un tiempo a cada evento (representado por clusulas simples), el
tiempo ms recientemente asignado en la oracin o, si esto no est definido, el
tiempo del artculo. Dos tipos de reglas de seleccin son usadas al momento de
decidir qu tiempo es asignado. Un tipo es para oraciones con referencias
temporales explcitas y otro tipo es para oraciones sin referencias temporales
explcitas.Unejemplodelprimertipo,eslaregladelDiadelasemanaqueestablece
quesieldiadelasemanausadoenuna clusulasimpleesel mismoqueeldiadela
fecha del artculo, entonces el tiempo asignado al evento es el de la fecha del
artculo (puede haber excepciones, por ejemplo si hay palabras antes del da de la
semana que indican que el evento ocurri antes que el dia del artculo,entoncesse
le asigna otro tiempo al evento). Si laoracinnocontieneinformacinexplcitadela
fecha, entonces se le asigna un tiempo dependiente del tiempo del verbo. A
clusulas de evento en presente perfecto o pasado perfecto se les asigna un
intervalo abierto cuyo punto de inicio no es conocido y su punto de fin es la fecha
ms recientemente asignada o la fecha del artculo. Existen reglas similares parael
futuro, presente y pasado indefinidos. Cabe aclarar que estos tiempos verbales son
enelidiomaingls.

Luego de que todos los eventos son marcados temporalmente, todas las clusulas
de evento se ordenan cronolgicamente. Los autores reportan un recall de 60.76% (recall
se define como la cantidad de resultados correctos obtenidos dividida por la cantidad de
resultados que se deberan haber obtenido) y una precisin (precisin se define como la
cantidad de resultados correctos obtenidos dividida por la cantidad total de resultados
obtenidos)de55.82%,sobretextosdeuncorpusdepruebacreadoporFilatovaetal.

2.2.3Sistemadeextraccindeeventosyrelaciones

En el trabajo de Aone et al. [AONE01] se sugiere un sistema de extraccin de


eventos y relaciones pensado para gran escala (REES por sus siglas en ingls, Relation
and Event Extraction System). El sistema maneja un total de 100 tipos de relacin y
eventos, lo que representa una cobertura mucho ms grande que la usual en los sistemas
deextraccin.

El sistema consiste en tres mdulos de etiquetado especializados basados en


patrones, un mdulo de resolucin de correferencias de alta precisin y un mdulo
configurabledegeneracindeplantillas(templates).

El rendimiento final del sistema es particularmente bueno en extraccin de

11
relaciones y logra un 70% o ms de MedidaF (la MedidaF es la media armnica
ponderada entre precisin y recall) para 26 tipos de eventos por ahora. Adems, el diseo
deREESesaltamenteportableyconfigurableparaagregarnuevasrelacionesyeventos.

2.2.4Anclajeyordenamientotemporaldeeventos

El trabajo de Mani et al. [MANI01] plantea una solucin independiente del dominio
para el anclaje y ordenamiento temporal de eventos en textos de noticias. La solucin
planteainiciativasmixtasdeanotacindecorpusyaprendizajeautomtico.
Se usan las herramientas TEMPEX [WILSON02], para la deteccin de expresiones
temporales y CLAUSEIT (herramienta desarrollada adhoc) para identificar clusulas de
diferentestiposquesonloseventos.
El sistema calcula un valor temporal de referencia (tval) para cada clusula, este
valor puede ser el definido por una expresintemporalexplcitamencionadaenlaclusula,
o, si esta est ausente, unareferenciatemporalimplcitainferidadelcontexto.Paracalcular
estetval,sesigueelsiguientealgoritmo:

1. Se inicializa el tval con la fecha de creacin del documento. Luego para cada
clusulasehace:
a. Silaclusulatieneuntiempoexplcito,seleinicializaeltvalconesevalor.
b. Siesuntipodeclusularelativa,seasumequeeltvalesinaccesible.
c. Si el verbo de la clusula es del tipo reporte, seinicializaeltvalconlafecha
decreacindeldocumento.
d. Si la clusula est dentro de una cita (entre comillas), hereda el tval de la
clusulaquelaengloba.
e. Siningunodeloscasosanteriores,usarelvalormsrecientedeltval.

Adems del tval, se calculan varias caractersticas ms para cadaclusulacomoel


anchorexplicitqueindicaelanclajedeleventorespectodeltval(en,antesodespus).

Estas anotaciones, obtenidas de manera automtica, son analizadas por una


persona que las corrige dando como resultado una precisin de 59% para los valores de
tval y de 83.8% (que se transforma en 90.2% si se presupone el valor en para los no
definidos)paraelvalordeanchorexplicit.

Luego se usan estos datos para entrenar un clasificador estadstico, C5.0 Rules
[QUINLAN01], para aprender reglas de relaciones de anclaje y reglas para rastrear los
cambiosdelosvalorestval(mantiene,revierteocambia)atravsdeclusulassucesivas.

Finalmente, basndose en las mejores reglas de relaciones de anclaje, se generan


tuplas de anclaje para cada documento. Los tvals en las tuplas de anclaje del documento,
tambin estn parcialmente ordenadas, produciendo tuplas de pares ordenados de tvals.
Estos dos juegos de tuplas, se usanpara creartuplasdelinkdelaformalink(R,ei ,ej )donde

12
eiyej sonloseventoscorrespondientesalasclusulasiyj,yResalgnvalorentre{at,bef,
aft,undefined}(en,antes,despus,indefinido).

Este enfoque logra una precisin de84.6%enelanclajedeeventosyunamedidaF


75.4% en el ordenamiento parcial de estos. Estos nmeros son comparables con los de
otros trabajos: Filatova [FILATOVA01] obtuvo un 82% de precisin en el anclajedeunsolo
tipo de evento en 172 clusulas, mientras que Wilson[WILSON02]obtuvounaprecisinde
59.4% en elanclajede663verbos. Unadelascosasquedistingueestaaproximacin,esel
uso de anotadores humanos, aprendizaje automtico y la variedad de caractersticas
motivadaslingsticamente.

2.3Anotacinderelacionestemporales

2.3.1Anotacindeinformacintemporalintraoracional

El trabajo de Katz [KATZ01] apunta a crear un gran corpus multilinge endondese


marcan relaciones temporales intraoracionales en adicin a las anotaciones morfolgicas y
sintcticasestndar. Paralograresto,desarrollaronunmtodoneutralrespectodellenguaje
y neutral respecto de teoras para anotar las relaciones temporales en oraciones.Coneste
corpus, Katz espera lograr obtener automticamente el conocimiento lxico necesario para
determinarunainterpretacintemporalenundiscursonarrativo.

Se asocia un intervalo temporal a cada verbo en una oracin yseledaimportancia


a la relacin temporal entreesosverbos.Lainterpretacintemporaldebeestarntimamente
ligada al contexto sintctico (el cual es importante ya que no se puede saber de antemano
hasta qu grado las marcas usadas por el que habla son lexicogrficas y hasta qu grado
son gramaticales). Este enlace es necesario para mantener registro tanto de lasrelaciones
semnticas entre tiempos as como tambin de lasrelacionessintcticasentrelaspalabras
enlasoracionesquehacenreferenciaaestostiempos.

Los autores adoptaron una herramienta de anotacin sintctica desarrollada en la


Universidad deSaarbrucken[BRANTS01]aadiendounacapadeanotacinsemntica.Los
verbos en una oracin son enlazados va enlaces secundarios marcados con una relacin
temporal. Las posibles relaciones son las de precedencia, inclusin y sus duales.
Informacin indexante es incluida usando el smbolo o para el tiempo del discurso, este
smbolo precede a todas las oraciones antes de anotarlas. Un ejemplo se puede ver en el
grfico1:

13

Grfico1[BRANTS01]

El procedimiento de anotacin comienza con un TreeBank [TREEBANK01] anotado


sintcticamente. TreeBank es un corpus lingstico en el que cada frase ha sido analizada
sintcticamente. Luego se agrega el marcador del tiempo de discurso y se anotan las
relacionestemporalesentreverbostalcomolasentiendeelanotador.

En el trabajo de Katz se describe un mtodo para comparar informacin temporal


basado en una interpretacin modeloterica. Se cre un Treebank, con la posibilidad de
bsqueda, multilinge y anotado en donde cada oracin se guarda en una base de datos
relacional con anotaciones sintcticas y temporales. Esto hace posible realizar bsquedas
en el corpus del tipo Encontrar las oraciones que contienen una clusula relativa a la cual
selainterpretacomosolapandotemporalmentealaclusulaprincipal.

2.3.2Anotacinsemnticadetextosdenoticias

Schilder et al. [SCHILDER01] desarrollan un sistema de marcado para expresiones


temporales en artculos de noticias. Segn su definicin, las expresiones temporales son
pedazos de texto que expresan informacin temporal, directa o inferida,talescomofechas,
frases preposicionales y verbos. La parte principal de su sistema es un Transductor de
EstadosFinito(FST)basadoenreglaspredefinidas.Elidiomautilizadoeselalemn.

El objetivo final es establecer relaciones temporales entre todos los eventos del
texto. En el estado actual del proyecto, el objetivo es anclar las expresiones temporales a
una lnea de tiempo, a pesar de que la semntica de estas expresiones no est del todo
definidatodava.

Se clasifican las expresiones temporales en timedenoting expresiones (las que se


refieren a fechas decalendariouhorariosdereloj)yeventdenotingexpressions(lasque se
refieren a eventos). Las frases preposicionales como on Friday (el viernes) denotan
relacionestemporalesentreeventosytiempos.Eljuegoderelacionestemporalespropuesto
esbefore,after,incl,at,starts,finishesyexcl (equivalentesalaspropuestaspor[ALLEN04])

El sistema FST marca a todas las expresiones temporales y verbos, una versin
experimental tambin marca expresiones nominales. Tambin se propone una
representacin semntica, en base a la cual se realizan inferencias, especialmente sobre
relaciones temporales. En el estado actual, el FST establece relaciones temporales entre

14
tiempos y eventos. El sistema fue evaluado con un corpus pequeo (10 artculos de
noticias)ylaprecisingeneralfuede84.49%.

En la siguiente seccin se analizan los diferentes esquemas de anotacin temporal


queseusanenlaactualidadycmofueevolucionandoeldesarrolloenestarea.

15
3.Esquemasdeanotacinparainformacintemporal

La anotacin temporal es unaparteesencialdemuchostrabajosdecomprensinde


textos.EsfuerzosrecientescomoTIDES(Translingual InformationDetection,Extraction,and
Summarization), STAG (Sheffield Temporal Annotation Guidelines) y TimeML tratan de
proveerunlenguajedemarcadoparaanotacintemporal.
TIDES [FERRO01] define un juego de lineamientos para anotar expresiones
temporales con una representacin cannica de los tiempos a los que se refieren. STAG
[SETZER01] [SETZER02] provee lineamientos para anotar eventos e informacin temporal
en textos de noticias. TimeML [PUSTEJOVSKY01] se basa en TIDES y STAG yproveeun
esquemadeanotacinXMLparatiemposyeventos.
A continuacin se explican los esquemas TIDES y STAG para luego introducir
TimeML.

3.1TIDESySTAG

El estndar de anotacin TIDES [FERRO01] para expresiones temporales usa una


sola etiqueta XML <TIMEX2>. Esta etiqueta es una extensin de la etiqueta <TIMEX>
usada en las Message Understanding Conferences (MUC7,1998)quereemplazaelatributo
de categorizacin TYPE vs DATE con una serie de atributos que representan el verdadero
tiempo o fecha de una expresin. El estndar incluyelineamientosparaanotarexpresiones
temporales con unarepresentacin cannicade lostiemposalosqueserefieren,usandoel
estndarISO8601[ISO01].LossiguientessondosejemplosdeanotacinTIMEX2:

<TIMEX2VAL="1999FA">Fall1999</TIMEX2>
<TIMEX2VAL="20040423">today</TIMEX2>

Las expresiones temporales son vistas como objetivos independientes para la


anotacin y extraccin, y la etiqueta (tag) <TIMEX2> est pensado para soportar una
variedad de aplicaciones. En [WILSON02] se crea TEMPEX, un marcador temporal
automticoqueagregaetiquetas<TIMEX2>alosdocumentos.

Robert Gaizauskas y Andrea Setzer propusieron STAG (Sheffield Temporal


Annotation Guidelines) [SETZER01] [SETZER02] como un medio para anotar eventos,
expresiones temporales y las relaciones entre ellos. STAG clasifica los eventos en cuatro
grupos: ocurrencias, eventos de percepcin, eventos dereportey aspectuales.Losestados
no son anotados en STAG. En general, la subcategorizacin de marcos de eventos son
ignorados, excepto para eventos de reporte, percepcin y de aspecto, que usualmente
tienenaotroeventocomoatributo.

Los eventos y expresiones temporales se relacionan con las etiquetas


relatedToEvent,relatedToTimeyrelType.Losvalores delasdosprimerassonreferencias
a otros eventos o expresiones temporales, la tercera contiene un valor para el tipo de
relacin y puede ser uno de los siguientescincovalores:BEFORE,AFTER,INCLUDES,IS

16
INCLUDED y SIMULTANEOUS.Esteltimotipoesdecarcterdifusoeincluyetodo tipode
solapamientostemporales.UnejemplodeanotacinSTAG:

TheplanecrashedonWednesday
Theplane
<eventeid=9class=OCCURRENCEtense=PASTrelatedToTime=5
relType=ISINCLUDED>crashed< /event>
<timextid=5>Wednesday</timex>

En adicin a este esquema de anotacin, [SETZER01] propone un proceso de


anotacin de tres pasos para relaciones temporales. La primera fase consiste en anotar
relaciones que se hacen explcitas por marcas lingsticas en el texto. En la segunda fase
se identifican relaciones que no estn explcitamente marcadas en el texto. La ltima fase
consiste en un ciclo asistido por un usuario en el cual un componente temporal infiere
relaciones temporales y luego al usuario se le consulta para que provea nuevasrelaciones
cuandoelcomponentetemporalyanopuedeinferirms.

3.2TERQAS:TimeMLyTimeBank

Durante el ao 2002 se llev a cabo un taller, llamado TERQAS (Time and Event
Recognition for Question Answering Systems) [TERQAS01] el cualseenfocenresolverel
problema de cmoresponderpreguntasbasadasenel tiempo sobreeventos yentidadesen
untexto,especialmenteparaartculosdenoticias.

Para avanzar en el entendimiento de estosproblemas,eltallerTERQASsepropuso


dosobjetivosprincipales:

1. Definir y disear un meta estndar comn para el marcado de eventos, su anclaje


temporal y cmo se relacionan entre s enlosartculos denoticias.Estelenguajede
marcadosellamTimeML(TimeMarkupLanguage) .
2. Crear un corpus patrn anotado por personas y marcado con expresiones
temporales, eventos y relaciones temporales, basado en la especificacin TimeML.
EstecorpussedenominTIMEBANK.

3.2.1TimeML

El desarrollo de TimeML surge de la necesidad de extender y cambiar


caractersticas de los trabajos de Setzer [SETZER01] y Ferro [FERRO01], ya que al
aplicarselasideasdeestostrabajosentextosreales,aparecenproblemas.

En este contexto, surge el lenguaje de especificacin de eventos y expresiones


temporalesTimeML[PUSTEJOVSKY01].

TimeML est pensado para tratar cuatro problemas bsicos de la identificacin de


eventostemporales,ademsdelmanejobsicodetiemposverbalesyaspectos:
17

Registro temporal de eventos: identificar un evento y su anclaje temporal en el
tiempo
Ordenar eventos respectivamente entre s: propiedades lexicogrficas versus
propiedadesdeldiscursoenelordenamiento
Razonar con expresiones temporales vagamente especificadas: funciones
temporalescomolasemanapasadaodossemanasantes
Razonaracercadeladuracindeloseventos:cuandodurauneventoosuresultado

Algo nuevo que introduce TimeML respecto de otras formasdeanotacindetextos,


es que separa la anotacin de eventos y expresiones temporales de lo que es el anclaje u
ordenamientotemporal.
Hay cuatro estructuras principales que se especifican enTimeML:EVENT,TIMEX3,
SIGNALyLINK.

LascaractersticasquedistinguenaTimeMLson:

1. ExtiendelosatributosdelaanotacintemporalTIMEX2
2. Introduce funciones temporales que permiten expresiones especficas como: tres
aosatrsoelmespasado.
3. Identificasealesquedeterminanlainterpretacindeunaexpresintemporal:
a. Preposicionestemporales:por,durante,en.
b. Conectorestemporales:antes,despus,mientras.
4. Identificatodaclasedeexpresionesdeeventos:
a. Verbosconjugados:sehaido,fuecapturado,vaarenunciar
b. Adjetivosdeestadoyotrosmodificadores:hundido,avejentado,abordo.
c. Eventosnominales:OperacinMilitar,GuerradelGolfo.
5. Creadependenciasentreeventosytiempos:
a. Anclaje:Juansefueeljueves.
b. Ordenamiento:Lafiestaocurridespusdemedianoche.
c. Inclusin:JuandijoqueMaraparti.

3.2.1.1LasprincipalesestructurasdeTimeML

3.2.1.1.1EVENT

En TimeML se consideran eventos (la etiqueta correspondiente es <EVENT>) a


situaciones que suceden u ocurren. Los eventos pueden ser puntuales oporun periodode
tiempo. Tambin se consideran eventos a predicados que describen estados o
circunstanciasquemantienenunestadodeverdad.

Lostiposdeeventopuedenser:

1. Ocurrencia(OCCURRENCE):morir,chocar,construir,vender
2. Estado(STATE):abordo,secuestrado,amar

18
3. Reporte(REPORTING):dice,reporta,anuncia
4. IAccin(IACTION):probar,tratar,prometer,ofrecer
5. IEstado(ISTATE):creer,querer,intentar
6. Aspecto(ASPECTUAL):empezar,terminar,parar,seguir
7. Percepcin(PERCEPTION):ver,escuchar,sentir,mirar

3.2.1.1.2TIMEX3

La etiqueta TIMEX3 se usa para marcar expresiones temporales explcitas, como


horas,fechas,duraciones,etc.ExistentrestiposdeexpresionesTIMEX3:

1. Expresionestemporalestotalmenteespecificadas:Junio111989Verano,2002
2. Expresiones temporales sub especificadas: Lunes, la semana que viene, el ao
pasado,hacedosdas
3. Duraciones:tresmeses,dosaos

3.2.1.1.3SIGNAL

La etiqueta SIGNAL se usa para anotar secciones de textos, tpicamente palabras


que indican cmo los objetos temporales se relacionan entre s. El material marcado por
SIGNAL puede ser de diferentes tipos como por ejemplo, preposiciones temporales (ej en,
mientras),otrosconectorestemporales(ejcuando)osubordinadores(ejsi)

Unejemplodeusodeestastresetiquetassera:

Juanparti2dasantesdelataque.

Juan
<EVENTeid="e1"class="OCCURRENCE"tense="PAST"aspect="PERFECTIVE">
parto
</EVENT>
<MAKEINSTANCEeiid="ei1"eventID="e1"/>
<TIMEX3tid="t1"type="DURATION"value="P2D"temporalFunction="false">
2das
</TIMEX3>
<SIGNALsid="s1">
antes
</SIGNAL>
del
<EVENTeid="e2"class="OCCURRENCE"tense="NONE"aspect="NONE">
ataque
</EVENT>
<MAKEINSTANCEeiid="ei2"eventID="e2"/>

La anotacin MAKEINSTANCE es un enlace de realizacin indica diferentes instancias de

19
un determinado evento. Se pueden crear la cantidad de instancias que sean necesarias.
CadaEVENTintroducealmenosunainstancia.

3.2.1.1.4LINKS

Una de las innovaciones ms importantes de TimeML es la etiqueta LINK. Esta


etiqueta codifica diferentes relaciones que existen entre elementos temporales de un texto,
ascomotambinestableceelordenentreeventos.ExistentrestiposdeetiquetasLINK:

1. TLINK: es un enlace temporal que representa la relacin temporal mantenida entre


eventosoentreuneventoyuntiempo.
2. SLINK: es un enlace de subordinacin, usado en contextos que introducen
relacionesentredoseventosoentreuneventoyunaseal.
3. ALINK: es un enlace aspectual que representa la relacin entre un evento de
aspectoysueventoargumento.

3.2.1.1.4.1 TLINK

Representa la relacin temporal mantenida entre eventos o entre un evento y un


tiempo,yestableceunvnculoentrelasentidadeshaciendoexplcitosiestasson:

1. Simultneas:
2. Idnticas:(enreferenciaalmismoevento)
JuansedirigiaBoston.Durantesuviajesecomiunsndwich.
3. Unaantesquelaotra:
JuanpartiantesqueMarallegar.
4. Unadespusdelaotra:(loopuestode3)
5. Unainmediatamenteantesquelaotra:
Todoslospasajerosquemurieroncuandoelavinseestrellenlamontaa.
6. Unainmediatamentedespusquelaotra:(loopuestode5)
7. Unaincluyelaotra:
JuanllegaBostoneljuevespasado.
8. Unaesincluidaporelotro:(loopuestode7)
9. Unacuyaduracinestincluidadentrodeladuracindelaotra:
10. Unadeellaseselprincipiodelaotra:
JuanhavividoenBostondesde1998.
11. Unaseiniciporlaotra:(loopuestode10)
12. Unadeellaseselfinaldelaotra:
JuansequedenBostonhasta1999.
13. Unaesterminadaporlaotra:(loopuesto12)

Para ilustrar el uso de esta etiqueta, se puede ver el ejemplo anterior Juan parti 2 das
antesdelataque.

SedeberacrearunTLINKdeestaforma:

20

<TLINKeventInstanceID="ei1"signalID="s1"relatedToEvent="ei2"relType="BEFORE"
magnitude="t1"/>

Estevnculoexpresadosaserciones:
Quelapartidadejuan(ei1),estordenadaantesdelataque(ei2)
Queelintervalo queseparaestosdoseventostiene unamagnitudigualalvalordela
expresintemporal(t1)

3.2.1.1.4.2 SLINK

El vnculo de subordinacin es usado en contextos que introducen relaciones entre


doseventosoentreuneventoyunaseal.Sondelossiguientestipos:

1. MODAL (MODAL): relacin introducida en su mayora por verbos modales (poder,


deber, querer, etc.) y eventos que introducen una referencia a un mundo posible
I_STATEs:
a. Juandeberahabercompradovino.
b. MaraqueraqueJuancomprevino.
2. FACTIVO (FACTIVE): algunos verbos introducen una implicacin (o presuposicin)
sobrelaveracidaddelargumento.Algunosejemplossonolvidar,lamentar,lograr:
a. JuanseolvidqueestuvoenBostonelaopasado.
b. MarialamentanohabersecasadoconJuan.
c. Juanlogrirsedelafiesta.
3. CONTRAFACTIVO (COUNTERFACTIVE): el evento introduce una presuposicin
sobrelafaltadeveracidaddelargumento.
a. Juanolvidcomprarvino.
b. MaranopudocasarseconJuan.
c. Juanprevinoeldivorcio.
4. PROBATORIO (EVIDENTIAL): las relaciones probatorias son introducidas por
eventosdetipoREPORTINGoalgunosdetipoPERCEPTION:
a. Juandijoquecomprvino.
b. MaravioaJuantraersolocerveza.
5. PROBATORIO NEGATIVA (NEGATIVE EVIDENTIAL): introducidas por eventos de
tipoReporteoalgunosdetipoPercepcinyquetransmitenunapolaridadnegativa:
a. Juanseneghabercompradosolocerveza.
6. NEGATIVA (NEGATIVE): introducida solo por partculas de seales negativas (no,
ni):
a. Juannoseolviddecomprarvino.
b. JuannosequeracasarconMara.

Unejemplodeusodeestaetiquetaes:

GuillermoquiereensearelLunes.

21
Guillermo
<EVENTeid="e1"class="I_STATE"tense="PRESENT"aspect="NONE">
quiere
</EVENT>
<MAKEINSTANCEeiid="ei1"eventID="e1"/>
<SLINKeventInstanceID="ei1"subordinatedEvent="e2"relType="MODAL"/>
<EVENTeid="e2"class="OCCURRENCE"tense="NONE"aspect="NONE">
ensear
</EVENT>
<MAKEINSTANCEeiid="ei2"eventID="e2"/>
<SIGNALsid="s2">
el
</SIGNAL>
<TIMEX3tid="t1"type="DATE"temporalFunction="true"value="XXXXWXX1">
Lunes
</TIMEX3>
<TLINKeventInstanceID="ei2"relatedToTime="t1"relType="IS_INCLUDED"/>

3.2.1.1.4.3 ALINK

El vnculo aspectual representa la relacin entre un evento aspectual y su evento


argumento.Lasrelacionescodificadasporestaanotacinson:

1. Iniciacin:Juanempezaleer
2. Culminacin:Juantermindearmarlamesa
3. Terminacin:Juandejdehablar
4. Continuacin:Juansiguihablando

Unejemplodeusodeestaanotacinpodranser:

Elbotecomenzahundirse.

Elbote
<EVENTeid="e1"class="ASPECTUAL"tense="PAST"aspect="NONE">
comenz
</EVENT>
<MAKEINSTANCEeiid="ei1"eventID="e1"/>
<SIGNALsid="s1">
a
</SIGNAL>
<EVENTeid="e2"class="OCCURRENCE"tense="NONE"aspect="NONE">
hundirse
</EVENT>
<ALINKeventInstanceID="ei1"signalID="s1"relatedToEvent="e2"relType="INITIATES"/>

22

3.2.2TimeBank

TimeBank [PUSTEJOVSKY02] es el corpus patrn anotado conTimeML.Lostextos


que forman elcorpus, fueronelegidosparacubrirunagranvariedaddedominiosdenoticias
yvienendediversasfuentes:

Textos DUC (TIPSTER) del corpus de la DocumentUnderstandingConference que


cubre diferentes reas tales como biografas, eventos simples y mltiples. Esto
cubre12%delcorpus,o35textos
Textos del programa ACE (Automatic Content Extraction) que viene de
transcripciones de cadenas noticias (ABC, CNN, PRI, VOA) y cables de noticias
(AP,NYT). Esto representa un 17% (50 textos) y 16% (49 textos) del corpus,
respectivamente. Una delas caractersticasimportantesdelosdatosdeACEesque
los datos ya estaban marcados segn los lineamientos de marcado temporal de
TIDES,loqueayudmuchoaldesarrollodelmarcadoTIMEX3.
Textos del PropBank (Treebank2) que son artculos del diario Wall Street Journal,
estostextossonun55%o166textosdelcorpus.

El esfuerzo de anotacin se dividi en dos fases. Enla primerafasedelproyectose


anotaron un 70% de las expresiones temporales, vnculos y eventos. El 30%restanteenla
segundafase.

La anotacin de la primera fase, estuvo a cargo de un grupo reducido de 5


anotadores que participaron en el desarrollo del esquema de anotacin TimeML y que
previo a llevarse a cabo la anotacin, se reunieron para lograr consenso sobre los
estndaresdeanotacin.

La anotacin durante la segunda fase, estuvo a cargo de 45estudiantes quefueron


entrenadosparaestatarea.

Para ayudar a la anotacin, los documentos fueron preprocesados haciendo usode


laherramientaAlembicNLPsystem[ALEMBIC01].

Uno de los objetivos de la creacin de TimeBank, es su uso para el aprendizaje


automtico.Acontinuacinsereseanlostrabajosrealizadosenelrea.

3.2.3AnotacinautomticaconTimeML

En [VERHAGEN01] se describe TARSQI (Temporal Awareness and Reasoning


Systems for Question Interpretation), un sistema modular para la anotacin temporal
automtica que agrega expresiones temporales, eventos y relaciones temporales a textos
denoticias.
Una anotacin manual completa de textos con TimeML no es prctica dada la

23
complejidaddelatareaylagrancantidaddetextosdenoticiasexistentesparaprocesar.
El sistema TARSQI puede usarse de modo independiente o como una herramienta para
auxiliaralosanotadores.
Elsistema seorganizaen mdulosencadenadosquevanagregandodiferentestipos
de anotacin TimeMLaldocumento.Seasumequelaentradadelsistemaesundocumento
anotado gramaticalmente (POS tagging). El siguiente es un diagrama del sistema (grfico
2):

Grfico2[VERHAGEN01]

Acontinuacinseexplicacadaunodeestosmdulos.

3.2.3.1GUTime

El marcador GUTime, desarrollado en la Universidad de Georgetown, extiende las


capacidades del marcador TempEx [WILSON02]. TempEx est focalizado en el estndar
ACE TIMEX2. GUTime extiende a TempEx para manejar expresiones temporales basado
en el estndar TimeML TIMEX3, el cual permite un estilo funcional para codificar
desplazamientos en expresiones codificadas. Ademspuedemanejarunagranvariedadde
expresiones temporales que ACE TIMEX2 no puede. GUTime fue probado con datos de
entrenamiento de la tarea Time Expression Recognition and Normalization dando un
resultadode78%enMedidaFparatextolibre.

3.2.3.2EVITA

EVITA (Events in Text Analyzer) [SAURI03] es una herramienta de reconocimiento


de eventos que realiza dos tareas principalmente: identificacin robusta de eventos y

24
anlisis de caractersticas gramaticales, como tiempo y aspecto. La identificacin de
eventos est basada en la nocin de evento definida en TimeML. Se usan diferentes
estrategiasparaidentificareventosdentrodelacategoraverbo,sustantivooadjetivo.

3.2.3.3GUTenLINK

El marcador de TLINKs GUTenLINK, creado en la Universidad de Georgetown, usa


reglassintcticasylexicogrficascreadasamano.Manejatrestiposdecasos:

1. El evento est anclado sin una seal a una expresin temporal dentro de la misma
clusula.
2. El evento est anclado sin una seal a la fecha de creacindeldocumento(estees
un caso comn en los verbos de tipo reporte en textosdenoticias,quesuelenestar
asociadosalafechadecreacindeldocumentooaunoffsetpequeodeesta).
3. El evento en una clusula principal est anclado con una seal oconuna marcade
tiempo/aspecto al evento en una clusula principal de una oracin previa. En este
caso, se usa un FST (Finite State Transducer) para inferir la relacin temporal ms
probable entre los eventos basndose en las caractersticas de tiempo verbal y
aspecto que brinda TimeML para cada evento. Por ejemplo: un verbo no de estado
en tiempo pasado seguido por un verbo no de estado en pasado perfecto, con el
aspectogramaticalmantenido,sugierequeelsegundoeventoprecedealprimero.

3.2.3.4Slinket

El propsito de Slinket es introducir SLINKs automticamente, que en TimeML


especifican relaciones de subordinacin entre pares de eventos, y clasificarlos, basndose
enlafuerzamodaldelverbosubordinante,entre:

Factivos(Factive)
Contrafactivos(Counterfactive)
Probatorio(Evidential)
Negativoprobatorio(Negativeevidential)
Modal(Modal)

La entrada de Slinket es texto fragmentado conmarcas decategoraslexicogrficas


(POStag)yeventos.
Los SLINKs son introducidos por un grupo limitado de predicados verbales y
nominales tales como lamenta, dice, promete y trata, y en la mayora de los casos estn
claramente sealados por el contexto de la subordinacin. Slinket se basa en la
combinacindeconocimientolxicoysintctico.

La implementacin de este mdulo est lograda con una cascada de FSTs que
codificandiferentesreglas.

25
3.2.3.5SputLink

El mdulo de cierre temporal Sputlink, se encarga de tomar relaciones temporales


de un texto y, a partir de ellas, derivar nuevas relaciones. En otras palabras,haceexplcito
lo que est implcito. Sputlink est basado en el lgebra de intervalos de James Allen
[ALLEN04] y se inspira en los trabajos de Setzer [SETZER01] y Katz et al. [KATZ01] que
tambinintrodujeronunmdulodeclausuraenunambientedeanotacin.

Allen reduce todos los eventos y expresiones temporales a intervaloseidentifica13


relaciones bsicas entre intervalos. La informacin temporal en un documento es
representada como un grafodondeloseventosyexpresionestemporalessonlosnodosyla
relaciones temporales son las etiquetas de losarcosquelosunen.Elalgoritmode Sputlink,
como elde Allen,esbsicamenteunalgoritmodepropagacinderestriccionesqueusauna
tabla de transitividad para modelar el comportamiento compositivo de todos los pares de
relaciones.

3.2.4Experienciasenotrosidiomas

La anotacin de informacin temporal de textos con TimeML es aplicable a otros


idiomas fuera del ingls, siempre que se haga una adaptacin acorde a las caractersticas
propiasdellenguaje(tiemposverbales,usodelosverbosmodales,etc).

Sauri [SAURI02], siendo miembro del equipo original de TimeML, define los
lineamientosdeanotacinparagenerarunTimeBankenespaol.

Bittar et al. [BITTAR01] analizan la creacin de un TimeBank en francs usando


herramientas de anotacinautomtica.Comoenelcasodelespaol,setuvoque haceruna
correspondenciaentreelesquemaTImeMLylostiemposverbalesdelfrancs.

De manera similar Caselli et al. [CASELLI01] analiza los lineamientos para la


creacindeunTimeBankenitaliano.

Wonsever et al. [WONSEVER01] [WONSEVER02] van ms lejos que los trabajos
anteriores y crean un esquema de anotacin para lenguas romance, especialmente el
espaol, llamado SIBILA (Sistema automtico de respuestas basado en un modelo de
discurso). Una de las contribuciones ms importantes de este esquema, es el uso del
atributoFactivity(Factividad).
El atributo obligatorio factividad representa el grado de certeza del enunciador,
respecto de la ocurrencia del evento referido. Este atributo puede tomar los siguientes
valores:{SI|NO|FUTURO_PROG|FUTURO_NEG|POSIBLE|INDEF}.

SI:eventorealizado
NO:eventonorealizado
FUTURO_PROG:futuroprogramado
FUTURO_NEG:futuronegado

26
POSIBLE:posible
INDEF:indefinido

A continuacin se muestra un ejemplo de los valores que puede tomar el atributo factivity
obtenidode[WONSEVER02]:

La ministra DaisyTournanunciquealgunos reclusosdelCompenserntrasladadosal


interior del pas, para aliviar la superpoblacin de ese centro carcelario. No se conocen
msnovedades.

anunci=SI
serntrasladados=FUTURO_PROG
aliviar=POSIBLE
seconocen=NO

En la siguiente seccin se describen los roles semnticos, las teoras que los
trabajan, los recursos actuales que proveen informacin sobre ellos y las herramientas de
anotacinautomtica.
Como se mostrarmsadelante,dentrodetodalainformacinquebrindanlosroles
semnticos, existe informacin temporal (explcita o implcita) a partir de la cual se pueden
detectareventos,marcasyrelacionestemporales.

27
4.RolesSemnticos

4.1BasesLingsticas

Todos los elementos de contenido de un lenguaje se ven como predicados, por


ejemplo: expresiones que designan eventos, propiedades de, relaciones entre, entidades.
La predicacin, representa el mecanismo que permite instanciar propiedades, acciones,
atributos y estados. Las expresiones lingsticas pueden ser dependientes o
independientes. Las expresiones lingsticas dependientes son usualmente fenmenos
diferentes, mientras que las independientes son individuales. Por ejemplo, la palabra
sombrero puede ser comprendida fuera de cualquier circunstancia, tiempo o persona,
porque no tiene que estar atribuida a nada ni nadie es independiente, es decir, individual.
Por el contrario, si se considera la palabra rojo, las denotaciones de esta palabra no se
entienden fuera deuna asociacinconunindividuo:sombrerorojo.Entrminoslingsticos,
los fenmenosdependientessonpredicados,mientrasquelosindividualessonargumentos.
Larelacinentrefenmenoseindividuosseconocecomopredicacin.

Los predicados no se tratan como elementos aislados, sino como estructuras,


llamadas predicate frames [DIK01] o semantic frames [CHOMSKY01]. Dentro del predicate
frame, cada entidad (frame element) juega un rol, que puede llamarse thematic role
[FRAWLEY01], semantic case [FILLMORE04], semantic role [DILLON01], thematic relation
[GRUBER01] [JACKENDOFF01] o, desde una perspectiva puramente sintctica, role
[CHOMSKY01]. De hecho, los roles semnticos (semantic roles) representan relaciones
semnticas que conectanindividuosconfenmenos,oentrminoslingsticos,argumentos
con predicados. Luego de establecer las relaciones semnticas dentro de los predicate
frames (marcos de predicado), se agregan funciones pragmticas y sintcticas a cada
elementodelmarcodepredicado

Las relaciones semnticas son unadelasclasesmsviejasdeconstruccionesenla


teora lingstica. Esta longevidad, engendra variedad, por lo que se pueden encontrar
varias propuestas de diferentes juegos de roles semnticos. Estos juegos de roles van
desde muy especficos a muy generales, y muchos han sido usados en implementaciones
computacionalesdeuntipouotro.

Las relaciones semnticas pueden ser ejemplificadas con el marco Commercial


Transaction (Transaccin comercial), cuyos actores incluyen buyer, seller, goods y money
(comprador, vendedor, bienes y dinero). Dentro del gran conjunto de predicados
relacionados semnticamente,asociadosaestemarco,sepuedenmencionarbuy,sell,pay,
spend, y charge (comprar, vender, pagar, gastar, costo,y cargo),cadaunodeestosindexa
o evoca diferentes aspectos del marco. El verbo comprar se focaliza en el compradorylos
bienes, poniendo de fondo al vendedor y el dinero pagar se focaliza en el comprador, el
dinero y el vendedor, poniendo de fondo a los bienes y as con los dems. Laideaesque
conocer el significado de cualquiera de estos verbos requiere saber que sucede en una
transaccin comercial y, en alguna media, saber el significado de todos los predicados

28
involucrados en el marco. El conocimiento y experiencia estructurados por el marco
Transaccin Comercial provee el trasfondo y motivacin para las categoras representadas
por estos verbos. A continuacin (grfico 3) se puede ver la anotacin del marco
TransaccincomercialobtenidodelproyectoFramenet.

Grfico3[FRAMENET01]

29

Una descripcin completa de los predicados en el marco de Comercio tambin
puede incluir informacin sobre sus propiedades gramaticales y de varios patrones
sintcticos en los que ocurren.Qu elementos de marco puedenaparecercomosujetodel
verbo, u objeto, si es que hay alguno, y cual va a ser la forma sintctica superficial de los
dems elementos de marco?Cuales de estos elementos son opcionales y cules
obligatorios?Porejemplo,enlaoracin:

CarlacomprunacomputadoraaSallypor$100.

Hay cuatro elementos de marco para el predicado comprar: Carla, una


computadora, a Sally y por $100. El sujeto, Carla, es el comprador y objeto directo, una
computadora, representa a los bienes estos dos elementos son obligatorios para que el
significado del predicado sea completo. Si cualquiera de estos roles obligatorios no
estuviese en la oracin, el contenido informativo de la oracin estara incompleto y el
mensajenopodrasertransmitidosinclasificacionesagregadas.
Los otros dos elementos de marco son opcionales: a Sally es el vendedor y por
$100 representa al dinero. Su lexicalizacin en la oracin es solo de informacin
complementaria, y ni la presencia ni ausencia de esta informacin afecta el mensaje
principalsobrelacompradelacomputadoraquehizoCarla.

Considerar un marco ms general como el de transferencia de dinero, sirve como


recordatorio de los sustantivos cuyo significado puede describirse en trminos de marco
semntico, es decirrespectodelsubyacentemarcodetrabajoconceptualnecesarioparasu
entendimiento y en referencia al conocimiento y experiencia que el intrprete tiene de la
situacin de fondo. Entre los sustantivos relacionados al marco de transferencia de dinero
estn propina, rescate, mesada, reintegro, honorario, recompensa, matrcula,
retencin, bono, renta, precio, salario y pensin alimenticia. Referirse a una suma de
dinero con cualquiera de estos sustantivos, requiere informacin rica y detallada sobre un
escenario mucho ms grande que el del marco de Transaccin comercial, del cual la
transferencia de dinero es solo una pequea parte. Por ejemplo, usar el trmino pensin
alimenticia asume algo as como: dos personas que solan estar casadas, ahora estn
divorciadas luego del divorcio, se acuerda que uno de ellos le da al otro una suma de
dinero en intervalos regulares, usualmente mensual. Existen tambin otras cosas
involucradas, comonegociacioneslegales,dictmenesdelacorte,etc.Alo queapuntaesta
ideaesquecadapredicado(verboosustantivo)traeaparejadounaescenaentera.

Entre otros factores, considerados para una completadescripcindelossustantivos


relacionados al marco Transferencia de dinero, esta la sintaxis de las expresiones en las
cuales un sustantivo en particular aparece. Algunos sustantivos requieren el artculo
indefinido, mientras que otros requieren un pronombre posesivo.Laeleccindependede si
el dinero transferido es esperado y si la conversacin sobre el dinero toma lugar antes o
despusdeunacuerdosobrelatransferencia.Sieldineronoesesperado,sepuedeusarel
artculo indefinido:Ellaledioalmeserounapropina.Sieldineroesesperado,senecesitael
pronombreposesivo:Ellalediosusalarioalempleado.

30
Para capturar, en cada marco, las diferentes combinaciones semnticas y
sintcticas, los lingistas comenzaron a anotar grandes corpus con informacin
sintctica/semntica. Estos recursos, que se presentan en la seccin 4.3, fueron usados
para entrenar diferentes programas de aprendizaje automtico para desarrollarsoftwarede
anotacinautomticaqueenriquezcatextosconinformacinsemntica.

4.1.1SemnticadeMarcos

La semntica de marcos es un concepto introducido por Charles J. Fillmore


[FILLMORE03]. Se entiende como Marco a un determinado sistema de conceptos
relacionados de manera tal que para entender a cualquiera deellos, esnecesario entender
toda la estructura en la queestusadoese concepto.Porejemplo,sisedicefrerhayque
entender que se est refiriendoaAplicarcalor,queasuvezimplicaentender laexistencia
deuncocinero,unacomidayunelementoparacalentar.[FILLMORE02]
Un texto, por s solo, notransmitesutotalsignificadosinoqueesnecesariotenerun
trasfondo cultural para entenderlo. En esto se focaliza la semntica de marcos, trata de
enfatizarycapturarlacontinuidadentreellenguajeylaexperiencia.[FILLMORE01]
Se dice que un intrprete al leer un texto invoca, posiblemente de manera
inconsciente, determinados marcos que permiten darle sentido a la experiencia que se
quiere transmitir. En contraste, la evocacin de marcossemnticosesunprocesocognitivo
en el cual el intrprete responde aasociacionespropiasdel lenguajeconectandolossignos
lingsticos con marcos. El descubrimiento y anlisis de dichas asociaciones, propias del
lenguaje,constituyenlasemnticademarcos.
La semntica de marcos, estudia cmo lasformaslingsticasevocandeterminados
marcosycomoestosmarcospuedenintegrarseenlospasajesqueloscontienen.
Las observaciones fundamentales sobre las que trabaja la semntica de marcos,
son las maneras en las que los usuarios de un lenguaje entienden lo que es comunicado
por ese lenguaje. Es por esto, que la semntica de marcos es emprica, cognitiva y
etnogrfica. Los investigadores deben descubrir quemarcossurgendellenguajeenestudio
ya quenoexiste unlugarendondebuscarestainformacin.Implicamanejodesutilezasdel
lenguaje as como el aprendizaje sobre experiencias y valores de la cultura en la que se
estinmerso.

4.1.2Losconceptosdeprototipoyperspectiva

SedescribeunacantidaddeconceptosenFrameSemantics[FILLMORE05].Unode
esos conceptos, es el de Prototipo, entendido como una gran porcin de la cultura
presentedentrodelacualelsignificadodelapalabraesdefinidoyentendido.
Por ejemplo, para entender el significado de la palabra desayuno, es necesario
entender las instituciones y prcticas de la cultura en la cual esta categora existe. Eneste
caso, es necesario entender la prctica de comer tres comidas al da a intervalos ms o
menos fijos y que la comida ingerida en laprimerapartedeldaluegodelperiododesueo
tiene un men especial y que para esta comida se usa la palabra desayuno. Las
condiciones que define el prototipo, no necesitan estar presentes para que el intrprete
nativo use la palabra apropiadamente. Alguien que habla lengua espaola, puede usar la

31
palabra desayuno para la comida ingerida en cualquiera de las siguientes situaciones:
dormir toda la maana, comer huevos, tostadas y caf a las dos de la tarde quedarse
despierto toda la noche, comer huevos, tostadas y caf a las siete de la maana dormir
toda la noche, comer tostadas y caf a las siete de lamaana. Este rango deusos,puede
capturarse a cuenta del significado de la palabra que apela a un prototipo. La palabra
desayunoproveeunacategoraquepuedeserusadaenunavariedaddecontextos.

Otro concepto importante planteado en la Semntica de Marcos es el de


Perspectiva.Porejemploenlaoracin:

CarlalecomprunacomputadoraaSallypor$100.

Como se vio, esta oracin evoca el marco de Transaccin Comercial, desdelaperspectiva


delcomprador.Mientrasquelaoracin:

SallylevendiunacomputadoraaCarlapor$100.

evocaelmarcodeTransaccinComercialdesdelaperspectivadelvendedor.

La nocin de perspectiva depende, hasta cierto punto, en el conocimiento del


mundo.
Diferentes palabras, asumen diferentes perspectivas o esquematizaciones de la misma
escena. Entender la eleccin de palabras usadas para hablar de una escena, requiere
conocerloseventosquellevaronhastaesepunto.

En la siguiente seccin se describe la Gramtica de Caso desarrollada por Fillmore


queluegoextendiensuteoraoriginaldeSemnticadeMarcos.

4.1.3GramticadeCaso

En 1968, Charles Fillmore introduce la Gramtica de Caso [FILLMORE04]


basndose en la representacin del conocimiento lingstico desarrollada por Chomsky en
1965[CHOMSKY01].
En un momento en el que la mayora de los gramticos toman a la sintaxis como
punto de partida de cualquier teora del lenguaje, la gramtica de caso es un intento de
establecer una gramtica semntica. Lo primero que hace esta teora, es dividir la
representacin del lenguaje en dos estructuras: la estructura superficial (el conocimiento
sintctico) y la estructura profunda (el conocimiento semntico). El proceso del lenguaje
empieza al nivel de la estructura profunda con una representacin no verbal (una idea o
pensamiento)yterminaenlaestructurasuperficial(elmodoenquenosexpresamos).

En la gramtica de caso, los roles semnticos de los predicados fueron


considerados cruciales para la caracterizacin de verbos y clusulas. Fillmore
[FILLMORE04] define los marcos de caso como caracterizaciones de una escena o
situacin abstracta, de modo que para entender la estructura semntica del verbo, es

32
necesario entender las propiedades de dichas escenas. Segn Fillmore, el conocimiento
lingsticoestorganizadoalrededordelapredicacin,cadapalabrapredicacional(adjetivo,
verbo o sustantivo) evoca cierto nmero de casos profundos (o roles de caso, para
diferenciar de los superficiales o sintcticos), algunos obligatorios, otros opcionales, los
cuales forman su marco semntico. As, un marco de caso describe aspectos importantes
sobrevalenciasemnticadeverbos,adjetivosysustantivos.

Las Nociones de Caso (o Roles de Caso) son representaciones de los argumentos


lxicos de un predicado a un nivel semntico. Fillmore sugiere que el verbo establece un
conjunto de casos en una oracin, que pueden servistoscomoespaciosaserllenadospor
estructuras sintcticas. As, los roles de caso, se definen como los roles que juegan los
constituyentes de una oracin en la interpretacin de esaoracin,estosrolesson definidos
en un repertorio fijo. Este inventario de Casos es un conjunto de conceptos universales,
suficientes para la clasificacin de verbos deunlenguajeyreusableentodosloslenguajes.
LaslistadelosCasosdeFillmoreprimeramenteincluaseiscasos:

ElAgentivooAgente:elCasodelaentidadpercibidacomoinstigadordelaaccin
identificadaporelverbo,enotraspalabraselquehacelaaccin.

[Coln]AgentedescubriAmrica.

ElInstrumentaloInstrumento:elCasoenelqueunobjetoinanimadoouna
fuerzaseimplicanenunmodocausalenelestadooaccinidentificadosporel
verbo.


Serompilaventana[conunmartillo]Instrumento .

Dativo:elCasoqueesafectadoporelestadoolaaccinidentificadaporelverbo.


Juanledioellibro[aMara]Dativo .

A pesar de que el nombre de este casosemnticoes igualaldelcasosintctico,un


constituyente en el caso Dativo semntico no tiene que sernecesariamente uncasoDativo
sintctico, como en el ejemplo anterior. Un contraejemplo para mostrar esto se ve a
continuacin, en donde Mara tiene el caso semntico Dativo pero el caso sintctico
Acusativo.

Juanbesa[Mara].

Debido a esta similitud de nombres, Fillmore decidi dividir el caso Dativo en tres
casos:Experimentador,ObjetoyObjetivo.

Factivo o Resultativo: el Caso de la entidad u objeto que resultan de la accin o


estadoidentificadosporelverbo.Esterol,luegoesabsorbidoporelroldeObjeto.


Juandaa[lamesa]Resultativo .

33

Objeto: es el Caso semnticamente ms neutral. Cualquier entidad propia cuyo rol
en la accin o estado identificados por el verbo est dado por la interpretacin
semnticadelverboensmismo.Eselreceptordelaaccinverbal.

[Nuestracasa]Objetosequem.


Locativo: la ubicacin u orientacin espacialdelestadooaccinidentificadosporel
verbo. Fillmore distingue entredos tipos decasoLocativo:elLocativoModal, estoes
el Locativo que no pertenece a una frase verbal, acta como un adjunto, y el
Locativo Proposicional, el locativo que es parte de una frase verbal, acta como un
argumento.

Juanlavasuauto[enelgarage]LocativoModal .


Mariaguardasusjoyas[enunapequeacaja]LocativoProposicional .

Mientras que el verbo lavar tiene una valencia de dos (alguien lava algo) el verbo
guardar enelejemploanteriortieneunavalenciadetres(alguienguarda algoen unlugar).
Entonces, el rol locativo es un adjunto opcional en el primer ejemplo mientras que es un
argumento en el segundo. Sin embargo, estas sutiles diferencias entre los casos del
locativo,llevaronaFillmoreareconsiderarestacategoraentrabajosposteriores.

Luego de esta lista preliminar de casos, Fillmore not que eran necesarios casos
adicionalesporloquerefinlalistadecasosagregando:

Experimentador:laentidadimplicadaenuneventopsicolgicooestadomental.

[Lostiburones]Experimentadorolieronsangre.

Lospredicadospsicolgicosseexpresanenlaestructurasuperficialdellenguajecon
losverbosdesentidos(escuchar),emocin(gustar)ycognicin(creer).

Comitativo:elCasousadoparaexpresaracompaamiento.

Loschicosestn[conMaria]Comitativo.

Se refina el caso de Locacin en tres casos: el Camino, el Origen y el Objetivo. El


caso de Locacin es la localizacin espacial, el Camino representa la ruta y los casos de
Origen y Objetivo representan los puntos de partida y llegada de la accin o estado
invocadosporelverbo.

Tomscorri[atravsdeljardn]Camino[haciaelbordedelbosque]

Objetivo.

Maxva[dePars]Origen[aLondres]
Objetivo.

Temporal:estecasodefineelmomentoenelqueuneventotomalugar.

34

Sefueronajugar[alas10p.m.]Temporal

Fillmore provee evidencia lingstica para sus roles de casos (o casos profundos).
Por ejemplo, argumenta que los sujetos en (a.), (b.) y (c.) abajo tienen diferentes roles
temticos, Agente, Instrumento y Objeto respectivamente, considerando los hechosen(d.),
asumiendo un rol por argumento de frase sustantiva. La oracin errnea (e.) falla porque
tratadeasignarlosrolesAgenteeInstrumentoalsujeto.

a.[Juan]Agenterompi[laventana]
Objeto.


b.[Unmartillo]Instrumento rompi[laventana]Objeto .
c.[Laventana]Objetoserompi.

d.[Juan]Agenterompi[laventana]
Objeto[conunmartillo]

Instrumento .

e.[Juan]Agentey[unmartillo]
Instrumentorompieron[laventana] Objeto.

f.[Unmartillo]Instrumento rompi[laventana]Objeto
[conuncincel]Instrumento.

4.1.4TeorasdeRolesSemnticos

Fillmore [FILLMORE04] define seis roles de caso: Agente, Instrumento, Dativo,


Factivo, Objeto y Locacin. En la teora original de Fillmore, a los roles semnticos se los
llamo casos profundos (como se explic en la seccin anterior). La hiptesis central de su
teora, es que hay una relacin directa entre los casos profundos y las funciones
gramaticales como sujetos y objetos a las que l ubica comopertenecientesalaestructura
superficial de la oracin. Trabajos posteriores de Fillmore, mostraron que ese pequeo
conjunto de roles de casos profundos no eran suficientes paracaracterizarlaspropiedades
complementarias de los tems lxicos. Entonces, seagregaronExperimentador,Comitativo,
Locacin, Camino, Origen, Objetivo y Temporal. Finalmente, esto desemboc en la teora
de Semntica de Marcos, que ms tarde se plasm en el proyecto FrameNet (ver seccin
4.3.1)

Otra teora muy influyente sobre roles semnticos fue introducida por Ray
Jackendoff [JACKENDOFF01]. Empez con un conjunto de roles temticos originalmente
introducidos por Gruber en 1965 [GRUBER01]: Tema, Origen, Objetivo y Agente.
Jackendoff propuso varias modificaciones y refinamientos a este inventario de roles,
basndose en un nuevo formalismo al que llam Conceptual Semantics (Semntica
Conceptual). Segn Jackendoff, el significado de una expresin lingstica puede
representarse con una estructura conceptual compuesta de Conceptual Constituents
(Constituyentes Conceptuales). Un constituyente conceptual involucra una omsprimitivas
semnticas. Para cada constituyente principal en la estructura sintctica tiene que haber
una correspondencia con un constituyente en la estructura conceptual. El mapeo entre la
estructura sintctica y conceptual est dado porreglasdecorrespondencia.Apesardeque
la fonologa (forma fontica) y el significado (forma lgica) siempre fueron tratadoscomosi
derivaran de la sintaxis, Jackendoff dice que la jerarqua correcta consiste en poner a la
estructura conceptual en una punta, a la estructura fontica enotrapuntaylasintaxisenel
medio.

35

Otra perspectiva sobrela semnticaderoleseslaplanteadaporDowty[DOWTY01].
l afirma que hay una notableausenciadeconsensosobreloquesonlosrolestemticos.
Dowty rechaza la idea de asumir roles temticos individuales para cada verbo, por sobre
roles independientes de los verbos. En su teora, Dowty se focaliza en el problema de la
seleccin de argumentos.Laseleccindeargumentosanalizalosprincipiosque determinan
cules argumentos semnticos del verbo son expresados por cules relaciones
gramaticales (por ejemplo objeto, sujeto). Dowty dice que los roles temticos no deben ser
tratados como categoras discretas sino como conceptos prototpicos. De esta manera,
definidosprotoroles.
La idea de los proto roles es que en realidad hay slo dos conceptos de tipo rol
temtico involucrados en la seleccin de argumentos, y estos son conceptos agrupados,
es decir, no descritos de maneradiscreta.LosllamaProtoRolAgenteyProtoRolPaciente,
y las considera las nica categora temtica en la cual se establecen los principios de
enlace.Dowtypresentaunlistadodepropiedadesparaestosdosprotoroles:

ParaelProtoRoldeAgente:

involucracinvoluntariaeneleventooestado
sensibilidad(y/opercepcin)
causaruneventoocambiodeestadoenotroparticipante
movimiento(relativoalaposicindeotroparticipante)
existeindependientementedeleventonombradoporelverbo

ParaelProtoRolPaciente:

sufrecambiosdeestado
puedeserdecarcterincremental
afectadocausalmenteporotroparticipante
estacionarioenrelacinalmovimientodeotroparticipante
noexisteindependientementedelevento,onoexistecompletamente

Ninguna de estas propiedades son esencialesparaningnrol.Encambio,Dowtyda


el siguiente procedimiento: Principio de seleccin de argumento: en predicados con sujeto
y objeto gramaticales, el argumento para el cual el predicado tiene el mayor nmero de
propiedades de Proto Agente, ser lexicalizado como el sujeto de la oracin. El
argumento que tenga la mayor cantidad de propiedades de Proto Paciente, ser
lexicalizadocomoelobjetodirecto.[DOWTY01]

No se trata de encontrar una unificacin semntica para la lista de propiedades de


los dos proto roles. Proto Agente y Proto Paciente son conceptos agrupados o
generalizaciones de alto orden sobre significados que no necesitan ser considerados
como parte de la gramtica. En cambio, Dowty sugiere usar el principio de seleccin de
argumentoparalaadquisicindetemslxicos.

36
Varios lingistas tomaron aspectos de la idea de Proto Roles en sus modelos de
gramtica. La teora de Davis[DAVIS01]sobrelaconexinentreelsignificadodelapalabra
y la sintaxis, usa propiedades de los Proto Roles en un tipo de jerarqua de herencia
mltiple en el marco de HeadDriven Phrase Structure Grammar de Pollard y Sag
[POLLARD01]. Cada propiedad de Proto Rol escodificadaenellxicocomountipodentro
de una jerarqua de tipos y subtipos. Davis asume dos Macro Roles llamados Actor y
Experimentador,demanerasimilaralaterminologadeVanValin[VALLIN01].

Una de las teoras que influenci a los recursos lxicos como VerbNet y PropBank
fue desarrollada por Beth Levin [LEVIN01]. Levin dice que los marcos sintcticos son un
reflejo directo de la semntica de trasfondo. Ella defini clases de verbos basadas en la
habilidaddelverbodeocurrironoenparejaconmarcossintcticosquesondedeterminada
manera preservadores de significado. VerbNet es un recurso lxico en el cual las clases
originalesdeLevinfueronsubdivididasenclasesadicionalesqueson mssintcticamentey
semnticamentecoherentes(verseccin4.3.2).

4.2DescripcindeRolesSemnticos

Tradicionalmente, los roles semnticos son parte de la Linking Theory (Teora de


Enlace) [LEVIN01], que es una teora gramatical en donde se describe la interaccin entre
sintaxis y semntica. Los roles semnticos son usados para darle significado a los
constituyentes sintcticos. Lapreguntacentraldelalinkingtheoryescomosepuedeninferir
estos roles a partir de la sintaxis. Lo que es relativamente nuevo, es la asignacin
automtica de roles basada en la informacin sintctica. Debido a que los analizadores
sintcticos actualespuedenbrindar informacinsintcticabastantecorrecta,ltimamenteha
resurgidounintersenlaanotacinderolessemnticos.
Histricamente se han estudiado dos tipos de roles: los abstractos como Agente,
Paciente o Instrumento, y roles ms especficos asociados a verbos como Vendedor para
elverbovenderoCompradorparaelverbocomprar.

4.2.1AlgunosRolesSemnticosComunes

Teoras como la de Dowty [DOWTY01] definen slo dos roles Proto Agente y Proto
Paciente. Otras teoras definen como mnimo seis roles bsicos descritos por la Gramtica
deCaso(verseccin4.1.3).Algunosdelosrolestemticosmsconsiderados:

Agente:deliberadamenterealizaunaaccin

[Carlos]Agentetomlasopatranquilamente.

Experimentador:recibeentradasensorialoemocional

Elolorafloresllenlanarizde[Mara]Experimentador.

37
Tema:sufreunaaccinperonocambiasuestado.Avecesesintercambiablecon
Paciente.

Megusta[Juan]Tema.

Paciente:soportalaaccinycambiasuestado.


Lasrocasquecayeronaplastaron[elauto]Paciente.

Instrumento:usadoparallevaracabolaaccin


Emanuelcortellazo[conunastijeras]Instrumento.

Fuerzaocausanatural:llevaacabolaaccinsinvoluntadpropia

[Eltornado]Causanaturaldestruylaciudad.

Locacin:dondesellevaacabolaaccin

CarlosyLisajugaban[enelparque]Locacin.

DireccinuObjetivo:adndesedirigelaaccin


Elcaballosigui[haciaelestablo]Objetivo.

Receptor:untipoespecialdeobjetivoasociadoconverbosqueexpresanposesin


Lemandelacartaa[Juan]Receptor.

Origen:dondeseoriginalaaccin


Selanzelcohete[desdeelcuartelgeneral]Origen.

Tiempo:eltiempoenelquesucedelaaccin

[Ayer]meencontrconMaraenlacalle.

Beneficiario:laentidadquesebeneficiaconlaaccin

Lehiceunatortaa[Carla]Beneficiario.

Modo:lamaneraenlaquesellevaacabolaaccin

[Conurgencia]Modo,mecomuniqueconsufamilia.

Propsito:laraznporlacualsellevaacabounaaccin

38


Llameasucasa[parapedirayuda]Propsito.

Causa:loquecausquelaaccintomalugarenprimerainstancia

[Comotenahambre]Causa,secomilatorta.

Es importante notar que no hay diferencias claramente marcadas entre estas


relaciones. Por ejemplo, en la oracin Rompi la ventana con el martillo, algunos marcan
martillocomoInstrumentomientrasqueotroscomoAgente.

4.2.2CaractersticasdelosrolesSemnticos

Seconsideraquelosrolessemnticostienenlassiguientescaractersticas:

1. Existeunacantidadfijaderolessemnticos.
2. Losrolessemnticossonatmicos.
3. Acadaargumentodelverboseleasignaalgnrolsemntico.
4. Acadaargumentodelverboseleasignaunsolorolsemntico.
5. Losrolessemnticosasignadosalosargumentosdelverbosonnicos.
6. Losrolessemnticosnosonrelacionales.Estoes,porejemplo,sihayunrol
PacientenoimplicanecesariamentelapresenciadeunrolAgente.

Sinembargo,estascaractersticaspresentanproblemas.Enprincipio,lacantidadfija
de rolessemnticosesunacaractersticaenlaquenohayacuerdo.Existenpropuestasque
van desde una pequea cantidad hasta varios cientos. Basta con ver el caso de Dowty
[DOWTY01] que propone slo un par de roles o el caso de HPSG [POLLARD01] que
propone para cada verbo un juego particular de roles semnticos y que son diferentes de
losdecualquierotroverbo.
Otro problema, es la asuncin de que a un argumento se leasignaexactamenteun
solo rol. Esta caracterstica tambin es cuestionable, como se muestra en el siguiente
ejemplo:

Juancorridentrodelacasa.

Tanto Gruber [GRUBER01] como Jackendoff [JACKENDOFF01] coinciden en que
JuanpuedesertantoAgentecomoTema.
La distincin, que cada argumento de cada verbo se distingue de los otros
argumentos por el rol que se le asigna, es difcil de establecer en ejemplos como los que
siguen:

1. JuanjugconMara.
2. Juansepareceasumadre.
3. AesparecidoaB.

39
Enestosejemplos,losdosparticipantestendrnelmismorol.
Otro problema es cmo y dnde establecer los lmites entre los tipos de roles. Por
ejemploelcasodelosobjetosdirectosquepuedenserInstrumentosoComitativo.


Juanganelcaso[conunabogadomuybienpago]Instr./Comit. .

4.3RecursosdeRolesSemnticos

Con la idea de que un anlisis semntico del lenguaje puedecontribuiraldesarrollo


de aplicaciones basadas en lenguaje, se han desarrollado una cantidad de recursos
semnticos.AlgunosdelosmsprominentessonFramenetyPropBank.

4.3.1FrameNet

La semntica de marcos adquiereunagranrelevanciaconeldesarrollodelproyecto


FrameNet de la Universidad de Berkeley [BAKER01]. Dicho proyecto plantea irmsallde
los simples ejemplos didcticos de marcos semnticos y se dedica a construiruna basede
datos basada en marcos que contiene cientos de marcos, sus respectivos juegos de
palabras,ejemplosdeanotacionesyhastatextoscompletosanotados.

El proceso de anlisisparalaconstruccindeFrameNetsepuederesumirenlossiguientes
pasos:

1. Caracterizacin del marco: tipos de situaciones para las que el lenguaje provee
mediosespecialesdeexpresin.
UnejemploeselmarcoEstacionando.
Las palabras de este marco describen a alguien A deteniendo el movimiento de un
B.BpuedeavecesusarsemetonmicamenteparareferirseaAquelocontrola.
2. Describir y nombrar los elementos de marco (FEs): aspectos y componentes del
marco que es probable que sean mencionados en frases y oraciones instancias de
esemarco.
EnelcasodeEstacionando,AeselConductoryBeselVehculo.
3. Seleccionar unidades lexicogrficas (LUs) que pertenecen al marco: palabras de
cualquiertipoqueevoquenydependandeltrasfondoconceptualasociadoalmarco.
En el caso de Estacionando, tenemos aparcar.v, atracar.v, estacionar.v,
estacionarse.v,fondear.v
4. Anotar oraciones extradas deuncorpusquemuestrenformasrelevantesenlasque
las unidades lexicogrficasevocanalmarco.Estosehaceconayudadeunsoftware
deanotacin.
[CONDUCTOR El
chofer] [ TARGET estaciono]
[VEHCULOmi
auto]delantedela puertadelHotel
Ritz.
5. Generar automticamente entradas lexicogrficas, y descriptores de valencia que
contienen,resumiendolasobservacionesderivablesdeellos.
Enelcasodelejemploanteriorsera:

40
[CONDUCTOR:SUJETO:NP El
chfer] [ TARGET estaciono]
[VEHCULO:OBJETO:NPmi
auto] delante de la
puertadelHotelRitz.

El resultado del proyecto hasta el ao 2013 es de 1164 marcos descritos,unndice
de 12711 LUs, 168201 oraciones anotadasilustrando lasLUsy27691anotacionesdetexto
completo.

4.3.1.1Elementosdemarco(FEs)

Los elementos de marco (Frame Elements) son las entidades o propiedades que
puedenestarpresentesencualquierinstanciadelmarcoencuestin.
Se puede distinguir entre 3 diferentes tipos de marcos de acuerdo a su relevancia. Estos
tipos son central, perifricos y extratemticos. Tambin se puede nombrar un cuarto
valorposiblequeeseldecentralnoexpresado.

4.3.1.1.1Elementosdemarcocentrales

Un elemento de marco central, es aquel que instancia un componente


conceptualmente necesario de un marco,haciendoque estemarcoseanicoydiferentede
losdems.

Un ejemplo es el marco Venganza. En estecasolosFEsVENGADOR,CASTIGO,


AGRESOR, PERJUICIO y PARTE_PERJUDICADA son todos centrales porque un acto de
venganzanecesariamenteincluyetodosestosparticipantes.

Cuando se habladecentralidaddeunFE,sepuedennombrarciertascaractersticas
queestosdebenposeer,aunquenonecesariamentedebentenertodas:

Cuandounelementosiempretienequeestarmanifiesto,escentral.
Unelemento,quecuandoesomitido,recibeunainterpretacindefinida,escentral.
Es central un elemento cuya semntica no puede ser predicha por su forma. Su
interpretacindependepuramentedeltarget.

4.3.1.1.2Elementosdemarcoperifricos

Son elementos que no introducen eventos adicionales, independientes o nicos


ms all de los principales. Los FEsperifricosmarcannociones deltipoTIEMPO,LUGAR,
MODO, MANERA, GRADO y similares. No caracterizan exclusivamente al marcoypueden
aparecerencualquiermarcoqueseaapropiado.

4.3.1.1.3Elementosdemarcoextratemticos

Estos elementos, contrastan a un evento contra un contexto perteneciente a otro


estado delascosas.LosFEsextratemticos,nopertenecenconceptualmentealosmarcos

41
en donde aparecen. A diferencia de los FEs centrales y perifricos, los extratemticos, se
mantienen (mantienen su significado) a travs de los marcos anfitriones en los que
aparecen.

4.3.1.1.4Elementosdemarcocentralnoexpresado

Esta es una anotacin especial de elementos de marco para el caso en el que se


comportan como central en el marco en donde se lo esta marcando, pero que pueden no
aparecerenlosmarcosqueheredandeeste.

4.3.1.1.5Instanciacinnuladeelementosdemarco

Puede pasar que a veces no se puedan encontrar los FEs centrales deunLUenla
oracin construida alrededor de ese LU. Hay tres explicaciones para este fenmeno, una
gramticaydoslexicogrficas.
La explicacin gramatical, tiene que ver con construcciones gramaticales que
permiten la omisin de algn argumento. A estos casosselos denominaInstanciacinnula
constructiva (CNI). Ejemplos de esto son las oraciones en modo imperativo (Por favor
vyase),oracionesenvozpasiva(Fuimosestafados),etc.
Tambin existe la Instanciacin nula indefinida (INI) y la instanciacin nula definida
(DNI). Las DNI son en los casos en los que el elemento faltante es algo que ya est
entendidoeneltexto,oseavienedelcontexto.
Las INI se dan en los casos en donde se omite el objeto directo, es decir casos en
los que tpicamente verbos transitivos se usan como intransitivos. Un ejemplo es el verbo
Comer, Juan raramente come solo. Como se ve, puede drsele algn significado al objeto
faltante,peronoesalgodefinido.

4.3.1.2Relacionesentremarcos

Los marcos de FrameNet estn asociados entre s por diferentes relaciones, lo que
permite hacer afirmaciones sobre los tipos semnticos a diferentes niveles de generalidad.
Haysietetiposderelacionesysepuedenagruparentresgrupos:

4.3.1.2.1Relacionesdegeneralizacin

Herencia:elmarcohijoheredalosFEsdelpadreypuedeagregarotrosnuevos.
Perspectiva sobre: diferentes tems lxicos (ej: Comprar, Vender) evocan marcos
con diferentes perspectivas sobre un mismo evento abstracto (ej: Transaccin
Comercial).
Uso: el marco hijo depende del trasfondo del marco padre. Algunos de los FEs del
padrepuedenestarenelhijo,perononecesariamentetodos.

4.3.1.2.2Relacionesdeestructuradeeventos

42

Submarco: representan sub eventos de un evento ms complejo. Suele
corresponderse con un ordenamiento temporal. Por ejemplo, el marco Dar est
conectado con PreDar y PostDar, dando informacin sobre quin tiene que y
cuando.EstostresmarcosjuntosconstituyenelescenariodeDar.
Precede:estarelacinespecficaordenamientotemporal.

4.3.1.2.3Relacionessistemticas

Causade:elmarcopadrerepresentalacausadelmarcohijo.
Incoativo de (del aspecto verbal que expresa el comienzo de una accin): el marco
padre representa el incoativo y el hijo el estativo. Por ejemplo el marco Cambiar de
posicinenunaescala( subir,bajar)eselincoativodePosicinenunaescala.

4.3.2VerbNet

Uno de los estudios ms importantes sobre la relacin entre los roles semnticos y
las diferentes alternancias sintcticas, es el de Levin [LEVIN01]. Levin plantea que los
marcos sintcticos son un reflejo directo del significado semntico de un texto. Basado en
este principio, describe determinadas clases de verbos segn la posibilidad de que ese
verboaparezcaapareadocondeterminadomarcosintctico.
VerbNet [KIPPER01] extiende las clases de Levin aadiendo una representacin
abstracta de los marcos sintcticos para cada clase, con una correspondencia explcita
entrelaposicinsintcticayelrolsemnticoqueexpresan.
Porejemplo,paraelcasodelverboromper:

1. Juanrompilaventana./AgenteRELPaciente
2. Laventanaserompienpedazos./PacienteRELenpedazos

Las clases originales de Levin, que constituyen los primeros niveles de lajerarqua,
fueron refinadas para dar cuenta de diferencias semnticas y sintcticas ms profundas
dentrodeunaclase.
Actualmente, todas las clases de verbos de Levin fueron asignadas a etiquetas
temticas y marcos sintcticos, y ms de la mitad de las clases estn completamente
descritas, incluidos sus predicados semnticos. En muchos casos, la informacin adicional
provista por VerbNet para cada clase causa que estas se subdividan o que se tengan que
agregarjerarquas.[KIPPER02]

4.3.3Propbank(PropositionBank)

El proyecto PropBank, originalmente hace referencia al corpus creado por Marta


Palmer [PALMER01] en el cual se anotaron las proposiciones verbales y sus argumentos.
Este corpus est basando en el corpus de Penn TreeBank. Sin embargo, con el tiempo, el
trminoPropBankpasausarseparareferirseacualquiercorpusanotadodeesamanera.

43
PropBank se plantea realizar una aplicacin prctica de las ideas de Levin
[LEVIN01]yeltrabajorealizadoenelproyectoVerbNet.
La idea de PropBank escrear uncorpuslosuficientementegrande ycompletocomo
para poder realizar aplicaciones prcticasy estudiosempricosbasadosenloplanteadopor
Levin.
PropBank define roles semnticos basados en cada verbo. Los argumentos
semnticos de un verbo se numeran comenzando de cero. De este modo, para un
determinado verbo, el Arg0 va a ser el Agente y el Arg1 el tema. No se pueden realizar
generalizacionesparaargumentosdemayoresrdenes.

Unejemplo:

Framesetpatear.01moverconelpie
Arg0:Pateador
Arg1:Cosapateada
Arg2:Instrumento(pordefectoelpie)

Ejemplo1:[Arg0Juan]tratdepatear[Arg1lapelota],peroMaralasacenelltimomomento.

Un juego de roles correspondientes a un determinado uso del verbo, se denomina


roleset y se asocia con un determinado juego de marcos sintcticos que indican las
variaciones sintcticas permitidas en la expresin de ese roleset. Un roleset con sus
correspondientes marcos asociados, se denomina frameset. Un verbo polismico (que
tienemsdeunsignificado)puedetenermsdeunframeset.

Adems de los roles semnticos descritos en losrolesets,losverbospuedentomar


diferentestiposdeargumentosdemodificacin:

LOC:locacin
EXT:extensin
DIS:conectordediscurso
ADV:usogeneral
NEG:negacin
MOD:verbomodal
CAU:causa
TMP:tiempo
PNC:propsito
MNR:modo
DIR:direccin

Como PropBank est dividido en dos, el lxico de marcos y el corpus propiamente


dicho, el proceso de construccin tambin est dividido, en lo que se llama enmarcado y
anotacin.

El procesodeenmarcadoeselprocesodecrear losarchivosdemarcos,esdecirlas
coleccionesdeframesetsparacadalexema.Consisteen:

44

1. Sehaceunmuestreodeoracionesdelcorpusqueusenelverboenconsideracin.
2. Seagrupanestasinstanciasenunoomssentidosprincipales.
3. Cadasentido,pasaaserunframeset.
4. Para mostrar todas las posibles realizaciones sintcticas del frameset, se incluyen
varias oraciones sacadas del corpus. Si alguna realizacin en particular no es
encontradaenelcorpus(PennTreeBank),secreaunejemplo.

El proceso de anotacin consiste en la anotacin completa del corpus. En el caso original


dePropBank,elcorpuseselPennTreeBank.Consisteen:

1. Hacer una primera corrida de anotacin automtica con un algoritmo basado en


reglas.
2. Eltextopreanotado,escorregidomanualmenteporanotadoreshumanos.

Es importante notar que este proceso es realizado verbo por verbo, no tomando el
texto de corrido. La desventaja de esta aproximacin, es que es difcil obtener una idea
rpida del texto completamente anotado y poder prever la utilidad final del trabajo. Es por
esto, que se extrajo un subcorpus del TreeBank, formado por textos de ndole financiera y
fueloqueprimerosecomenzaanotar.

4.3.4Wordnet

El proyecto Wordnet [MILLER01] , es un proyecto iniciado por George A. Miller a


mediados de la dcada de 1980. Es una base de datoslxicadelidiomaingls(aunquese
fueroncreandodiferentesversionesenotrosidiomas).
Su construccin se basa en agrupar palabras en conjuntos de sinnimos llamados
synsets. Proporciona una definicin corta y general, y adems almacena relaciones
semnticasentreconjuntosdesinnimos.

LasrelacionessemnticasquesealmacenanenWordnetson:

Sinnimos (mismo significado): es la relacin bsica de Wordnet, porque WordNet


usajuegosdesinnimos(synsets)pararepresentarelsentidodelaspalabras.
Antnimo(significadoopuesto)
Hiponimia (subclase) y su inversa, Hiperonimia (superclase), son relaciones
transitivas entre synsets. Como usualmente existe una sola hiperonimia, esta
relacinorganizaelsignificadodelossustantivosenunaestructurajerrquica.
Meronimia (nombre de una parte) y su inversa, holonimia (nombre del todo), son
relacionessemnticascomplejas.
Troponimia, es para los verbos lo que la hiponimia es a los sustantivos. Sin
embargo,lasjerarquasresultantessonpocoprofundas.
Implicacin,esunarelacindeimplicanciaentreverbos.

45
4.3.5ComparacinentreFrameNet,PropBankyWordnet

Tanto el proyecto PropBank como FrameNet, tienen el objetivo comn de


documentar la realizacin sintctica de los argumentos de los predicados del idiomaIngls
anotando un corpus con roles semnticos. A pesar de las similitudes entre los dos
proyectos, sus metodologas son diferentes. FrameNet se enfoca en Marcos semnticos,
que se definen como una representacin esquemtica de situaciones que involucran a
varios participantes, proposiciones y otros roles conceptuales [FILLMORE03]. La
metodologa del proyecto procede en una forma de marcopormarco, esto quiere decir,
primero se escoge un marco semntico (por ej, Comercio), se define el marco y sus
participantes (elementos de marco) (COMPRADOR, BIENES, VENDEDOR, DINERO), se
listan los predicados lxicos que invocan ese marco (comprar,vender, etc.) y luego se
buscan ejemplos de oraciones para cada predicado en un corpus(paraestecasoseusel
British National Corpus)yseanotacadaelementodemarcoen cadaoracin.Lasoraciones
de ejemplo se eligen con el criteriode cubrirtodosloscasosderealizacionessintcticasde
los elementos de marco y se prefirieron ejemplos simples de estas realizacionesenvezde
ejemploscomplejos.
En contraste con FrameNet, PropBank, cuyo objetivo es el de brindar datos de
entrenamiento para sistemas de etiquetado estadstico, tiene queproveeranotacionespara
todaslasoracionespresentesenelPennTreeBank,sinimportarcuncomplejassean.
Similarmente a FrameNet, PropBank trata de etiquetar consistentemente verbos
relacionados semnticamente, basndose en las clases de VerbNet para determinar esta
relacin. Sin embargo, hay mucho menos nfasis en la definicin de la semntica de la
clase a la que estn asociados los verbos, aunque para verbos relevantes se provee ms
informacinmapendolosaVerbNet.
Los roles semnticos de PropBank para unadeterminadaclasedeVerbNet,pueden
no corresponder con los elementos semnticos etiquetados por un marco particular de
FrameNet,comoseveenlasiguientetabla.

ComparacindeMarcos

PropBank FrameNet
Comprar Vender COMERCIO
Arg0:comprador Arg0:vendedor Comprador
Arg1:cosacomprada Arg1:cosavendida Vendedor
Arg2:vendedor Arg2:comprador Pago
Arg3:preciopagado Arg3:preciopagado Bienes
Arg4:beneficiario Arg4:beneficiario Medida/Unidad

AnotacindeFrameNet:

1)[CompradorCarlos]compr[Bienesunauto][VendedoraGerardo][Pagopor$1000].
2)[VendedorGerardo]vendi[Bienesunauto][CompradoraCarlos][Pagopor$1000].

AnotacindePropBank:

46

3)[Arg0Carlos]compr[Arg1unauto][Arg2aGerardo][Arg3por$1000].
4)[Arg0Gerardo]vendi[Arg1unauto][Arg2aCarlos][Arg3por$1000].

En los ejemplos anteriores el marco de FrameNet COMERCIO incluye los roles


Comprador y Vendedor y los asigna consistentemente en dos oraciones que describen el
mismo evento. PropBank necesita un nivel msdeinferenciapara determinar quintienela
posesin del auto en cada caso. Sin embargo, FrameNet no indica que el sujeto en cada
caso esunAgente,hechoquesiserepresentaenPropBankaletiquetarlosdossujetoscon
Arg0. Esto no es obvio ya que el sujeto no siempre es necesariamente un Agente, como
suelepasarconoracionesenvozpasiva.

Hasta el momento, PropBank solo se dedica a trabajar con verbos, mientras que
FrameNet incluye sustantivos y adjetivos. La anotacinde PropBanktambindifiereenque
se hace en referencia a los rboles sintcticos del Penn TreeBank y no solamente se les
muestra estos rboles a losanotadorescuandoanalizanunaoracin, sinoqueselosobliga
a asignar las etiquetas semnticas a nodos de estos rboles. En FrameNet no se usan
rboles de anlisis sintctico. Los anotadores marcan el principio y el fin deloselementos
de marco en el texto y agregan una etiqueta de funcin gramaticalqueexpresalarelacin
sintcticadelelementodemarcoconelpredicado.

4.3.6Recursosenotrosidiomas

Los datos multilingsticos se refierenalaexistenciaderecursossimilaresparams


de un lenguaje. En la prctica, los datos multilingsticos pueden ser comparados slo si
representan el mismo tipo de informacin lingstica. Por ejemplo: el lxico, la ortografa,
fonologa,sintaxisosemntica.
Durante el proyecto EuroWordNet [VOSSEN01], cuyo objetivo era construir un
WordNet multilinge para ocho lenguajes europeos, sedistinguieron dosmtodosa losque
llamaronMergeApproach(unificacin)yelExpandapproach (expansin).
En el mtodo de Merge Approach, se crean diferentes recursos para diferentes
lenguajes desde cero. Luego se agregan enlaces que relacionan determinados tipos de
componentes interlingsticos. Segn Pianta et al. [PIANTA01], esta aproximacin genera
algunos problemas durante la etapa de alineacin. Argumentan que los recursos
desarrollados independientemente pueden ser ms divergentes que lo lingsticamente
necesario porque los diseadores del recurso son libres de tomar decisiones en un nivel
msabstracto.
En el mtodo Expand Approach se toma un recurso que esvistocomoestablepara
un lenguajeyse transfiereaotrolenguaje. Estoimplicaquealprincipiolaestructurageneral
del recurso se mantiene estable excepto por algunas informaciones obvia del lenguaje
especfico. El problema conocido de este mtodo es el hecho de que dos lenguajes
diferentes pueden lexicalizar diferentes conceptos y, por lo tanto, las relaciones entre las
diferentes estructuras varan de lenguaje a lenguaje. Por esta razn, el Expand Approach
requiereunaetapadelimpiezadelrecursoluegodelatransferenciainicial.

47
El Expand Approach tiende a producir recursos de estructura similar, bajo el riesgo
de dejardeladodiferenciasespecficasdellenguajeenlexicalizacin(esdecir,laestructura
dellxico).
Las bases de datos multilinges construidas en base al modelo FrameNet son
organizacionalmente similares. En principio, FrameNet permite referencias cruzadas
multilinges en muchos niveles, incluyendo marcos, unidades lxicas, lemas, o hasta
palabras de oraciones no anotadas. Los aspectos especficos del lenguaje en las
definiciones incluyen oraciones de ejemplo y generalizaciones de patrones de realizacin
sintctica. En los FrameNets en otros idiomas, se reemplazan los ejemplos en ingls por
ejemplosenelidiomaencuestinquecumplanlamismafuncin.

4.3.6.1Alemn

El proyecto SALSA [ERK02], consiste en marcar manualmente y semi


automticamente un corpus en idioma alemn con roles semnticos para poder derivar un
recurso semntico lxico grande independiente de cualquier dominio. El corpus usado es
TIGER, un corpus de 1.5 millones de palabras de diarios de noticias con su estructura
sintctica anotada manualmente, y cuya anotacin semntica se hizo usando los roles
semnticosdeFrameNet.
Para representar este corpus, surgi la necesidad de crear unformatodeanotacin
multi nivel estandarizado, que integre anotacin semntica de roles con otros niveles de
anotacin lingstica. As surgen dos formatos para la descripcin y codificacin de
informacinsobrerolessemnticosenelcorpus:

el formato TIGER/SALSA XML: provee una representacin modular para roles


semnticosyestructurasintctica.
el formato TextSALSA XML: una versin liviana de TIGER/SALSA XML diseada
paraanotacinmanualconuneditorXML.

El diseo de TIGER/SALSA XML es genrico y adaptable por lo que no est limitado a la


anotacin de roles semnticos ni a este corpus. TIGER/SALSA XML puede codificar roles
semnticos que son especficos del verbo (como el caso de PropBank), especficos de
gruposdeverbos(comoFrameNet),ogenerales(comoelPragueTreeBank).

4.3.6.2Japons

El proyecto de FrameNet en Japons (JFN) [JPNFRAMENET01] comenz en el


2002 en la Universidad de Keio (aunque tambin incluye investigadores de la Universidad
de Tokio). El corpus del JFN contiene hasta el momento 1 milln de oraciones obtenidas
del corpus anotado de la Universidad de Kioto. Este corpus contiene ms de 40000
oracionesanotadasmorfolgicaysintcticamente.
De este proyecto, surgen preguntas importantes de investigacin tales como hasta
qu punto la aproximacin de Semntica de Marcos es adecuada para analizar el lxico
japons y tambin en qu medida los marcos existentes basados en el idioma ingls son
aplicablesparacaracterizarlasunidadeslxicasjaponesas.

48

4.3.6.3Espaol

ElproyectodeFramenetenEspaol(SFN)[SUBIRATS03]esauspiciadoporel
DepartamentodeCienciayTecnologadeEspaaydesarrolladoporlaUniversidad
AutnomadeBarcelonaporunequipolideradoporelDr.CarlosSubiratsRggeberg.El
objetivodelFrameNetenespaoleseldeanotaruncorpusdecitasydescubrirpatronesde
valenciasparaungrannmerodepalabraspredicativas,mostrandocmoestospatrones
devalenciasoninstanciadosenoracionesverdaderas.
CadaentradadelFrameNetenEspaolproveeenlacesaotrosrecursoslxicos,
incluidoslossynsetsysuscategorizacionesdemarcossintcticosdelEuroWordNeten
Espaol.Losentregablesdelproyectoconsistenenlabasededatos:entradaslxicaspara
cadapalabra,descripcindelosmarcosysubcorpusanotados.SFNusauncorpusde300
millonesdepalabras,elmismosoftwareybasededatosqueeldelproyectodeBerkeley.El
corpusdelSFNincluyeEspaolAmericanoyEuropeo.Lostextosquelocomponen
provienendediferentesfuentestalescomodiariosdenoticias,opinindelibrosyensayos
humanistasentreotros.Estostextosheterogneoshacenuntotalde350millonesde
palabras.

4.3.6.4Sueco

Investigadores de la Universidad de Gotemburgo estn construyendo el FrameNet


Sueco (SweFN++) [SWEFRAMENET01] basado principalmente en lxico sueco existente,
pero usando losmarcosy elementosdemarcodelFrameNetdeBerkeley.Losdatossonde
acceso libre y estn disponibles en diferentes formatos. Para el ao 2010 reportaron tener
ms de 2300 unidades lxicas y 51 marcos. El lxico viene con oraciones de ejemplopara
cadaelementodemarcocentraldelosmarcosquetienenhechos.

4.3.6.5Portugus(Brasil)

En la Universidad Federal de Juis de Fora en Brasil se ha estado trabajando para


crear una base de datos lxica tipo FrameNet en portugus brasileo (FrameNet Brasil)
[BRFRAMENET01], en colaboracin con el equipo de FrameNet en Berkeley. Crearon un
corpus de aproximadamente 104 millones de palabras provenientes de texto escrito,
dilogos transcritos y subttulos de pelculas. Adems desarrollaron su propio software de
anotacin. Los primeros datos disponibles para el pblico general constan de 32 marcos y
38unidadeslxicas.
Uno de losgrandesobjetivosdetodoslosproyectosmencionados,eslogrargenerar
sistemas de anotacin automtica de textos y as poder utilizar la salida de estos como
informacin de entradaparasistemasdeextraccindeinformacin,sistemasquecontestan
preguntas,clasificadoresyotrosdentrodeloqueeselprocesamientodellenguajenatural.

49
4.4Anotacinautomtica

4.4.1AnotacinautomticadetextosconFrameNet

Existen variosproyectosqueencaranel problemadelanotacinautomticaderoles


semnticos(ASRL,AutomaticSemanticRoleLabeling) ,algunosdelosmsconocidosson:

Shalmaneser.[LINKSHAL1][ERK01]
LTH.[LINKLTH1]
SEMAFOR.[LINKSEMAFOR1]

Uno de los artculos ms citados y fundamentales sobre ASRL y FrameNet es el


Automatic Labeling of Semantic Roles (2002) [JURAFSKY01] en el cual se hace un
estudio exhaustivo de la relacin de determinadas caractersticas del texto tales como
sintaxis,morfologa,mododelosverbos,etc.ylosrolessemnticos.
Este trabajo se basa en la linking theory de Levin que en trminos generales dice
que la realizacin sintctica de los argumentos de un predicado, es predecible desde su
semntica. Esta relacin, sugiere que puede ser posible aprender a reconocer relaciones
semnticasapartirdeindicacionessintcticas.
El sistema estadstico de anotacin automtica planteado por Jurafsky
[JURAFSKY01],tieneenconsideracinlassiguientescaractersticas(features)deltexto:

Tipo de Frase (PhraseType) :caractersticaqueindicaeltiposintcticodela
frase que expresa elrolsemntico.Diferentes rolessemnticostienden aser
realizados por diferentes categoras sintcticas. Por ejemplo, el rol
SPEAKER, del marco comunicacin, tiende a aparecer como una frase
nominal, NP (noun phrase) . Las categoras sintcticas que se usan, son las
delproyectoPennTreebank.
Categora dominante (Governing Category) : la correlacin entre roles
semnticos y realizacin sintctica como sujeto u objeto directo, es uno de
los primeros hechos que la linking theory de Levin trata de explicar. De
estas observaciones se pueden obtener reglas como Si existeunAGENTE,
ste se convierte en el sujeto sintctico. A esta caracterstica se la llama
Categora dominante o gov. Tiene solo dos valores posibles, S o VP, segn
sean sujetos u objetos de verbos, solo aplica al tipo de frase NP. Se
demostrqueenotrostiposnotienemuchoefecto.
Camino del rbol de anlisis sintctico (Parse Tree Path): esta
caracterstica est diseada para capturar la relacin sintctica entre un
constituyenteysupredicado.

50

Grfico4[JURAFSKY01]


Se define como el camino (path) desde el predicado a travs del rbol de
anlisis sintctico hasta el constituyente.Serepresentacomo unacadenade
etiquetas no terminales del rbol enlazadas con smbolos indicando
movimientos arriba y abajo en el rbol. Comoenelcasodelejemplo(grfico
4), sera VBVPSNP. Si bien es una cadena de smbolos, el sistema lo
tratacomounatributoatmico.
Posicin (position): este atributo indica si el constituyente a etiquetarocurre
antes o despus del predicado. Esta caracterstica est muy correlacionada
conlafuncingramaticalypuedeservirparadisminuirelefectodeerroresde
anlisissintctico.
Voz (voice): caracterstica que distingue entre verbos pasivos y activos, es
importante para predecir roles semnticos porque elobjetodirectodeverbos
activoscorrespondeasujetosdeverbospasivos.
Palabra cabecera (headword): esta es una caracterstica lxica y provee
informacin sobre el tipo semntico del que cumple el rol. Las palabras
cabeceras de los nodos, se determinan usando el mismo juego de reglas
determinsticasusadasporCollins[COLLINS01].

En el artculo de Subirats [SUBIRATS01] se comparan las dos herramientas de


anotacin automticas: Shalmaneser y SEMAFOR entrenadas conelFrameNetenespaol
y se concluye que SEMAFOR obtiene mejores resultados yademsabarcamscasosque
Shalmaneser.

4.4.2AnotacinautomticadetextosconPropBank

En PropBank, la anotacinautomtica,esparteconstitutivadelproyecto.Unodelos
objetivos explcitos de PropBank es poder proveer datos de entrenamiento para
herramientasdeanotacinautomticasupervisada.
Una de las ventajas que tiene PropBank para este objetivo, es que las oraciones

51
elegidas para ser anotadas son del corpus del Wall Street Journal usado para el proyecto
Penn Treebank, y por esto, todas tiene un rbol sintctico chequeado por anotadores
humanos. Esta informacin sintctica de calidad, le da una ventaja importante en el
momento de entrenar herramientas que usan esta informacin como caracterstica.
[PALMER01]
El mtodo de anotacin automtica de Propbank, descrito por Palmer [PALMER01]
se basa en el trabajo de Jurafsky [JURAFSKY01] y que originalmente fue pensado para
FrameNet.

52
5.Trabajosrelacionados

En trabajos previos [LLORENS01/2/3/4] se hizo uso de informacin semntica


brindada por PropBank para mejorar la anotacin automtica de textos con TimeML. En
general se concluy que el uso de informacin semntica mejora notablemente el
reconocimiento y clasificacin deinformacintemporalenlostextos.Comomejoraytrabajo
a futuro estos trabajos sugieren el uso de los roles de FrameNet y de un anlisis ms
profundo sobre qu caractersticas de los roles semnticos a tenerencuentaparaentrenar
losmodelos[LLORENS02].

En el artculo de Schilder [SCHILDER01] se presenta un sistema FST (Finite State
Transducers) que marca informacin temporal en textos, basado principalmente en reglas
de sintaxis. Luego genera una representacin semntica de las expresiones detectadas y
estolepermitehacerinferencias,especialmentesobrelasrelacionestemporales.

En el trabajo de Congmin [CONGMIN01] se plantea el problema de reconocer
informacin y relaciones temporales en textos haciendo uso, entre otras caractersticas de
lostextos,losrolessemnticos(ej:.AGENTEoSUJETO).

Es interesante la investigacin de Uzzaman [UZZAMAN01] en donde plantean los
sistemas TRIPS ([ALLEN01]/[ALLEN02])yTRIOSpararesolverproblemasdemarcacinde
informacin y relaciones temporales en textos. Para el entrenamiento de las herramientas
de etiquetado se usan diferentes tcnicas y caractersticas del texto. Entre las
caractersticas usadas, estn las de informacin semntica que se extraen usando la
ontologa TRIPS LF (Logical Form), diseada para ser motivada lingsticamente e
independiente del dominio. Los tipos semnticos fueron creados con consideraciones
lingsticas ms que por requerimientos de componentes del sistema. En general, lostipos
semnticos en la ontologa LF son compatibles con los tipos de FrameNet. El analizador
sintctico TRIPS usa un nmero ms reducido y general de roles semnticos para enlazar
los argumentos sintcticos y semnticos al contrario de FrameNet que posee un juego
extenso de elementos de marco especializados. La ontologa LF define aproximadamente
2500 tipos semnticos y 30 roles semnticos. En el trabajo de Uzzaman [UZZAMAN02] se
extiende el desarrollo de este trabajo y se estudia el agregado de ms informacin e
informacin semntica a las anotaciones de TimeML y proponen la creacin de un nuevo
corpusconestainformacin,TRIOSTimeBank.

Otro trabajo que usa informacin semntica para la extraccin de informacin
temporal, es el de Ling [LING01]. Este trabajo parte de la base de que en el rea de
extraccin de informacin por mucho tiempo no se consider la variable temporal de la
informacin extrada. Se presenta el mtodo TIE (Temporal Information Extraction). El
problema que se plantean resolver es, dada una secuencia de oraciones de texto en
lenguaje natural (T), se busca generar un juego de elementos temporales (E) y sus
respectivas restricciones (C) . Los elementos pertenecientes a E, pueden ser eventos o
referencias temporales (por ejemplo: los oficiales fueron despachados o 1999). Las
restricciones C, son desigualdades lineales que denotan inicio, comienzo y duracin delos

53
elementos temporales. El objetivo es lograr extraer la mayor cantidad de elementos
temporalesyeljuegoderestriccionesmscompactoposible.
Entrminosgenerales,elflujodetrabajodeTIEsedivideen:

1. Preprocesamiento:
a. Eventos y atributos temporales: se usa el software Evita y GUTime (ver
seccin 3.2.3) para detectar eventos yexpresionestemporales,marcndolos
conanotacionesTimeML.
b. Caractersticas de dependencia: se generan pares de dependencias entre
elementos.Porejemplo:

Australia ha sido independiente desde 1901 genera
prep_since(independiente,1901)

c. Caractersticas SRL (roles semnticos): se busca el argumento temporal
AMTMPparacadaverbo(siesquetieneargumentotemporal).

2. Identificacin de Relaciones Temporales: se usa un modelo probabilstico pre
entrenado con datos de TimeBank y combinado con reglas de transitividad, para
clasificarcadaelementotemporal.

Finalmente se compara la precisin de TIE contra otros tres sistemas de extraccin de


informaciontemporal,dandocomoresultadounanotablemejora.

54
6.Desarrollo

Existen tres grandes grupos de elementos temporales que se pueden marcar enun
texto, como se explicenlaseccin3.2.1.1,son:TIMEX3,EVENTsyLINKs.Caberecordar
que los elementos TIMEX3 son expresiones temporales explcitas, tales como horas,
fechas, duraciones,etc. Los elementos EVENT son situaciones que suceden u ocurren,
pudiendoserpuntualesoporunperiododeterminadode tiempo.LuegoestnlosLINKsque
representanrelacionestemporalesydeordenentreEVENTsyentreEVENTsyTIMEX3.
La tarea de deteccin de marcas temporales TIMEX3 est bastante madura dentro
del rea de procesamientodellenguajenatural.Comosemencionenlaseccin3.2.3.1,la
herramienta GUTime, que es parte del juego de herramientas TARSQI, brinda una
MedidaF de 78% para anotar texto libre con TIMEX3. Es por eso que en este trabajo se
pone especial nfasis en las tareas de deteccin de EVENTs y LINKs. Sin embargo son
necesarias las marcas temporales TIMEX3 para la deteccin y anclaje de los otros
elementostemporales,porloquedebernestardentrodelostextosanotados.
Debido a que la naturalezadeloseventos(EVENTs)en untextoesdiferentealade
los enlaces (LINKs) entre estos eventos, se separa el trabajo de deteccindeEVENTsyel
de deteccin de LINKS en dos mdulos de trabajo diferentes. Se analiza cmo la
informacin semntica interacta con los LINKs y EVENTs ayudando para su deteccin. A
continuacin se explica cmo se encar en lneas generales el anlisis en cadamdulode
trabajo.

6.1Esquemageneraldetrabajo

Para comenzar, se parti del corpus de TimeBank 1.2 que est compuesto por
textosmarcadosconetiquetasTimeML.
Como siguiente paso, se us la herramienta de anotacion semntica automtica
SEMAFOR para anotar este mismo corpus. De esta manera se obtuvo un corpus anotado
conTimeMLyMarcosdeFrameNet.
En este punto el trabajo se divide en las dos ramas mencionadas, la deteccin de
EVENTsporunladoyladeteccindeLINKsporotro.
Para la generacin de modelos dedeteccindeEVENTs,sedesarrollaronunaserie
de herramientas que interpretan las anotaciones de FrameNet ydeEVENTsTimeML,y,de
esta manera, generar archivos de entrenamiento con diferentes caractersticas a tener en
cuenta. Estos archivos de entrenamientos, fueron usados para entrenar los modelos de
deteccin de EVENTs usando un algoritmo de CRF provisto por la herramienta CRFSuite.
Esta ltima sucesin de pasos se repiti las veces necesarias para detectar las
caractersticasquemsmejoraronlosmodelos.
Para la generacin de modelos de deteccin de LINKs, se procede de manera
anloga a la usada para los EVENTs con la diferencia de que en este caso el algoritmo
utilizadoeseldeSVMprovistoporlaherramientaWeka.Seexplicamsadelante.
En el grfico5semuestraunesquemadeldesarrollodelosdiferentescomponentes
yanlisis.

55

Grfico5

En la siguiente seccin se analiza el mdulo marcadordeeventosylosanlisisque


lofundamentan.

6.2Mdulomarcadordeeventos

Enlasiguienteoracin,sepuedenvermarcadosdoseventos:

On theotherhand,it's<EVENTeid="e1"class="OCCURRENCE">turning</EVENT>outto
be another very <EVENT eid="e369" class="STATE">bad</EVENT> financial <TIMEX3
tid="t83" type="DURATION" value="P1W" temporalFunction="false"
functionInDocument="NONE">week</TIMEX3>
forAsia.

Una de las principales caractersticas que se ven de las marcas de eventos es que
son consumidoras de texto. Diferente es el caso de los enlaces que no son consumidores,
como se explicar ms adelante. Esto hace que el hecho de que una palabra sea o no un
evento, depende mucho del contexto que la rodea. Esta es una de las principales razones
por las que se decidi utilizarelalgoritmodeclasificacinCRF(ConditionalRandomFields)
tal como lo hace Llorens [LLORENS02], adems de ser el msfrecuentementeusadopara
este tipo de tareas de anotacin automtica. A continuacin se describe CRF y se

56
profundizaensusbeneficiosparaelpresentetrabajo.

6.2.1ConditionalRandomFields

Conditional Random Fields (CRFs)es unaclasedemtododemodeladoestadstico


usualmente aplicado a reconocimiento de patrones y aprendizaje automtico
[LAFFERTY01]. Mientras que los clasificadores estadsticos ordinarios predicen una
etiqueta para una muestra sin tener en cuenta las muestras vecinas, un CRF puede tomar
en cuenta este contexto. PorejemploelCRFdecadena lineal,muy popularyeficienteenel
campo del procesamiento del lenguaje natural, predice secuencias de etiquetas para las
muestras dadas. Una de las ventajas clave de los CRF, es su flexibilidad para incluir una
extensavariedaddecaractersticasdeentradaarbitrariasydependientes.

Se puede ver la tarea de marcado de eventos como un problema de etiquetado de


secuencias.Asumiendoque:
Xesunavariablealeatoriasobrelasecuenciadedatosaseretiquetados
Y es una variable aleatoria sobre la correspondiente secuencia de etiquetas
(ocultas/desconocidas)
TodosloscomponentesYisonmiembrosdeunalfabetofinito
Xpuedevariarsobreoracionesdelenguajenatural
Ypuedevariarsobreetiquetasdeeventosdeesasoraciones
es un juego de posibles etiquetas de eventos IOB2 (formato IOB2: (B)egin,
(I)nside,(O)utside)

Elsiguienteejemplo(tabla1)ilustraelproblema:

X Y

l ?

vendi ?

la ?

propiedad ?
Tabla1[LLORENS02]

?=B_EVENT,I_EVENT,O

Las variables X e Y estn distribuidas conjuntamente sobre las secuencias de


etiquetas y observaciones. Sin embargo, a diferencia de los Modelos Ocultos de Markov
que son de tipo generativo y en donde se modelap(X,Y).EnelcasodelosCRFs,queson
de tipo discriminativo, construyen un modelo condicional del aparejamiento de las
secuenciasdeobservacionesyetiquetas,modelandop(Y|X)

57

Grficamente,losCRFssonrepresentadosporgrafosnodirigidos,G=(V,E)siendoque
Y=(Yv),vV,asYesindexadaporlosvrticesdeG.

Entonces (X, Y) es un Conditional Random Field si las variables Yv obedecen la propiedad


deMarkovrespectodelgrafocuandosoncondicionadasporX:

P(Yv|X,Yw,vw)=P(Yv|X,Yw,vw)

vwsignificaqueYwyYwsonvecinosconectadosenG.

Para extender este problema a la clasificacin de eventos (hasta ahora es solo


deteccin), habra que extender el alfabeto para que abarque losdemstiposdeeventos
deTimeML(ocurrencia,estado,reporte,etc)

Para el problema que se quiere resolver en esta tesis, esta es una tcnica
recomendada de aprendizaje automtico a utilizar. Los eventos pueden depender de
propiedades estructurales de las oraciones del lenguaje natural y la informacin semntica
estrelacionadaconlaestructuradeloseventos.

Porejemplo:

El controlador en el centro de Boston <EVENT eid="e22"


class="I_ACTION">trata</EVENT> de <EVENT eid="e24"
class="OCCURRENCE">remontar</EVENT>alvueloTWAochocientos.

El <EVENT eid="e56" class="REPORTING">d ice<


/EVENT> que el y el Papa <EVENT
eid="e57" class="I_STATE">quieren</EVENT><EVENT eid="e59"
class="ASPECTUAL">terminar</EVENT> la <EVENT eid="e60"
class="OCCURRENCE">explotacin< /EVENT>delhombreporelhombre.

Una caracterstica de los eventos de tipo I_ACTION, I_ASPECT y ASPECTUAL es


quesiemprepresentanaotrodeevento.

Dado este anlisis, se concluye que los CRFs son tiles en el reconocimiento de
eventosenloscualeslaspropiedadessecuencialesyestructuralesseanrelevantes.

En la siguiente seccin, se procede a analizar comparativamente a los eventos de
TimeML contra los diferentes marcos deFrameNet.Deestamanerasedemostrarcmola
informacin semntica de FrameNet es sumamente rica y til para elobjetivopropuestode
deteccindeeventostemporales.

58
6.2.2TiposdeEventosTimeMLyMarcosdeFrameNet

Como se detall anteriormente (Seccin 3.2.1.1), TimeML define diferentes tiposde


eventos (Reporting, Perception, Aspectual, I_Action, I_State, State y Occurrence).
Realizando el anlisis para estatesis,seencontrunarelacinmuyestrechaentrelostipos
deeventosdeTimeMLydeterminadosmarcosdeFrameNet.

Cabe aclarar que muchos tipos de eventos, se relacionan con ciertas palabras. Sin
embargo, esto no quiere decirquecadavezqueapareceesa palabraexpresa uneventode
ese tipo. Es decir, las palabras pueden ser ambiguas con respecto al tipo del evento. Este
problemadeambigedadesparcialmentesolucionadoconelusodemarcossemnticos,ya
quelosmarcosdistinguenelsentidodelaspalabras.
Por ejemplo, la palabra (o Unidad Lxica en trminos de FrameNet) decir puede
pertenecer a al Frame Spelling_and_pronouncing (Ej: Mi pequea sobrina no puededecir
prestidigitacin) o al Frame Statement (Ej:Evelyndijoquenoestabalistaparasalir).Enel
primer caso el verbo decir no representara un evento mientras que en el segundo
representauneventodetipoReporting.

A continuacin se detallan cada tipo de Eventos TimeML ycomocadaunodeestos


se puede relacionar con determinados marcos en la jerarqua de marcos de FrameNet. En
los diferentes ejemplos de marcos semnticos, aparecen determinadas partes del texto en
color. Este tipo de presentacin, es la usada por FrameNet en su sitio web
(https://framenet.icsi.berkeley.edu/fndrupal/home) para que sea simple de entender que
parte de la oracin corresponde a determinado elemento de marco. Adems, en los
ejemplos se muestran diferentes grficos que muestran relaciones entre Marcos de
FrameNet, estos grficos fueron obtenidos con la herramienta web provista por FrameNet
(https://framenet.icsi.berkeley.edu/fndrupal/FrameGrapher).

6.2.2.1AnlisisdelostiposdeeventosTimeMLcontralosmarcosdeFrameNet

6.2.2.1.1REPORTING

EstetipodeeventocoincideconladefinicindelosmarcosReportingyStatement.

Los eventos de tipo Reporting describen la accin de una persona u organizacin


declarandoalgo,narrandounevento,informandosobreunevento,etc.
Algunos ejemplos de esto pueden ser los terminos: decir, reportar, contar, explicar,
establecer.

Juandijoquenohuboincidentesduranteelfindesemana.
Marinaexplicquenohabaquedejarelartefactoconectadodurantelanoche.

EstaesladefinicindelmarcoStatementextradadelproyectoFramenet:

59
Este frame contiene verbos y sustantivos que comunican el acto de un Orador de
dirigir un Mensaje a un Receptor usando lenguaje. Se puede usar una gran variedad de
palabrastalescomodeclara,deciroinsistir.

Elladijoqueyollegaratarde.

La propiedad de herencia de los frames, nos permite extender las conclusiones


obtenidas para un frame, en este caso Statement, hacia todos sus descendientes
actuales o que se vayan creando a futuro con la evolucin natural del proyecto
FrameNet.

Enelgrfico6semuestraundiagramadelframeStatementysushijos:

Grfico6[FRAMENET02]

6.2.2.1.2PERCEPTION

Esta clase incluye eventos que involucran la percepcin fsica deotroevento.Estos


eventossontpicamenteexpresadosporverboscomo:ver,mirar,observar,escuchar,or.

Eltestigoledijoalapolicaqueviounhombrecorriendo.

UnmarcorelacionadoconestetipodeeventoesPerceptioncuyadefinicines:

Un Perceptor percibe un Fenmeno. El marco general Perception es un contexto


heredado para todos los marcos que tienen que ver con un ser sensible que responde a
cambios en el ambiente, independientemente de las modalidades sensoriales. Los marcos
que heredan pueden expresar modalidades (ver, escuchar, degustar, oler), o pueden
enfatizar las experiencias o actos del perceptor (ojear), o las propiedades del fenmeno
percibido(traqueteo,vibrar).

Yohueloalgopodrido.

LaestructuradeherenciadelmarcoPerception (grfico7):

60

Grfico7[FRAMENET02]

6.2.2.1.3ASPECTUAL

Esta clase de evento, se focaliza en diferenciar diferentes facetas de la historia de


unevento.

1. Iniciacin:empezar,comenzar,originar,iniciar
2. Reiniciacin:reiniciar
3. Terminacin:parar,cancelar,terminar,cesar,discontinuar,interrumpir,abandonar
4. Culminacin:terminar,completar
5. Continuacin:continuar,proceder,seguir,persistir,perseverar

ElvolcnempezamostrarsignosdeactividadenAbrilporprimeravezen600aos.

Existen varios marcos que se relacionan con este tipo de evento. Por ejemplo:
Process_start, Process_resume, Process_stop, Process_end, Process_continue. Como se
puedever,elparalelismoentreloseventosdetipoAspectualyframesesmuymarcado.

Es interesante analizar parte del esquema de herencia y causalidad para estos


frames(grfico8):

61

Grfico8[FRAMENET02]

Se ve claramente como existe un marco paracadaaspecto delos eventos.Adems


FrameNet brinda informacin sobre causalidad de estos eventos (informacin sobre el
orden). Esto ltimo va a ser de utilidad ms adelante cuando se analicen los enlacesentre
eventos.

6.2.2.1.4I_ACTION

Denota una Intensional Action (Accin Intensional). Cabe aclarar que el trmino
Intensional (como opuesto de extensional) en el rea delingstica,serefierealconjunto
de rasgos o propiedades que forman el significado de un concepto [COOK01]. Los
contextos en donde el valor de verdad de una proposicin depende del conocimiento, son
decarcterintensional.
Sin embargo, existen trabajos como el de Chrisholm [CHRISHOLM01] que
establecen que los fenmenos intencionales son intensionales. Por ejemplo, los actos
mentales, tales como creer o pensar, forman contextosintensionales.Estapropiedadesde
gran importancia para establecer relaciones entre determinados marcos de FrameNet y el
tipodeeventoI_ACTION.
Un I_ACTION requiere un argumento de evento (que debe aparecer explcitamente
en el texto) que describe una accin o situacin sobre la que se puede inferiralgodadosu
relacinconlaI_ACTION.
Por ejemplo, los eventos pasados como argumentos de los las I_ACTION en 1 no
necesariamentepasaroncuandoelI_ACTIONsucede.
Tambin se incluyen en esta categora lospredicadosperformativos(esdecirqueel
hechodeexpresarlos,eslaaccin.Ej:yopienso...).Estossonlosejemplosdel5al9.

Algunos ejemplos en donde se marca el I_ACTION en negrita y los eventos que


estosintroducensubrayados:

1. tratar,luchar,probar.
Israelestuvotratando decomprarmasmascarasenelexterior.

62
2. investigar,investigacin,ahondar.
Unanuevafuerzapolicialcomenzai nvestigarlosasesinatosdelos2estudiantes.
3. atrasar,posponer,dificultar,aplazar.
IsraelpediralosEstadosUnidosp osponer unataque militarcontraIrak.
4. prevenir,evitar,cancelar.
Carlosevitunadiscusin conAnayndosemstempranodelafiesta.
5. pedir,ordenar,persuadirrogar,comandar,urgir,autorizar.
Lespidieronqueselleven consigolospapelesimportante.
6. prometer,ofrecer,asegurar,proponer,decidir.
SaharaofreciprestarunjuegodevajillaaMara.
7. jurar.
8. nombrar,nominar,apuntar,declarar,proclamar.
CarlosnominaNoeliaparaocuparelpuestodegerente.
9. sugerir,alegar.

Algunos frames que se relacionan con este tipo de evento son: Intentionally_act,
Attempt, Research, Scrutiny, Change_event_time, Hindering, Avoiding, Preventing,
Request,Commitment,Offering,Deciding,Name_conferral

Para ejemplificar, se puede observar el esquema de herencia de Avoiding (grfico


9):


Grfico9[FRAMENET02]

6.2.2.1.5I_STATE

Los eventos I_STATE son similares a los de la clase anterior. Esta clase incluye
estados que refieren a mundos posibles oalternativos(quesemarcanconcorchetes enlos
ejemplos) los cuales pueden ser introducidos por clusulas subordinadas (12),
nominalizaciones(3)ofrasesverbalessinconjugar(4).

63

1. Juansiente[queAnanodeberairalcineestanoche].
2. Una vez que logren extinguirlo, ellos esperan que [los residentes comiencen a
volverasuscasas].
3. Nohayraznporlacualnoestaramos preparadospara[unataque].
4. Albertotemenopoder[abrirlapuertadelsalnconesallave].

Acontinuacinselistanalgunosejemplosrepresentativos:

1. creer,pensar,sospechar,imaginar,dudar,sentir,estarseguro
2. querer,desear,anhelar
3. desear,aspirar,esperar,planear
4. temer,odiar,preocupar
5. necesitar,requerir,demandar
6. estarlisto,estarpreparado,estardeseoso
7. estarhabilitado,estarinhabilitado

Algunos frames que se puedenrelacionarconestoseventossonDesiringyPurpose


(grfico10)


Grfico10[FRAMENET02]

6.2.2.1.6STATE

Este tipo de evento describe circunstancias en las cuales algo toma el valor de
verdad. Lo interesante para esta tesis es que siempresevanamarcarlos estadosqueson
introducidos por un evento de tipo I_ACTION, I_STATE o REPORTING. Por lo que tienen
una dependencia estructural que va a ser considerada por el algoritmo de aprendizaje
automtico.

Algunos ejemplos (el evento de tipo STATE en negrita, el evento que lo introduce
subrayado):

64
Elmedilacrisis.
SaddamHuseinbuscpaz enotrofrente.
HarSheficontalapolicaqueRabineraunt raidor.

El frame que tiene que ver con este tipo de evento es State. Este frame engloba
muchosotrosensujerarquadeherencia(grfico11).


Grfico11[FRAMENET02]

6.2.2.1.7OCCURRENCE

Este tipo de evento incluye todos los otros tipos de eventos quedescribenalgoque
ocurreenelmundo.Algunosejemplos:

El Ministro de Defensa dijo que hasta ahora aterrizaron 16 aviones conequiposde


proteccincontraarmasbiolgicasyqumicas.

Dos erupcionesmoderadasjusto antesdelas3p.m.domingoparecieron presagiar


unaexplosinmayor.

El frame Event es el que mejor se ajusta a este tipo de evento debido a su


caractersticageneralista.

Hasta este punto, se analiz de una manera general la estrecha relacin entre los
marcos de FrameNet y los tipos de evento TimeML. En la seccin siguiente,sedescribela
aplicacin del algoritmo y seleccin de caractersticas del texto para la generacin de
modelosquepermitenlaclasificacinyreconocimientoautomticosdeeventosTimeML.

6.2.3SolucinimplementadayCaractersticasdeltextoutilizadas

Como se estableci anteriormente en la seccin 6.2.1, se escogi el mtodo de


aprendizaje CRF para la clasificacin y reconocimiento de los eventos. Particularmente se
us la implementacin de CRF hecha en la herramienta CRFSuite [LINKCRFSUITE1]
usando el algoritmo OrthantWise Limitedmemory QuasiNewton (OWLQN) que es una
variante de Limitedmemory BroydenFletcherGoldfarbShanno (LBFGS) con
regularizacinL1yL2ycoeficienteC1=1yC2=1.

Este es un algoritmo de optimizacin delafamiliade losmtodosquasiNewtonque


aproxima el algoritmo BFGS usando una limitada cantidad de memoria computacional.

65
Dado este requerimiento lineal de memoria, el algoritmo es particularmente apto para ser
aplicado a problemas de optimizacin con un gran nmerodevariables.Estohacequesea
el algoritmo de eleccin para ajustar modelos CRF. En la prctica,elalgoritmomejoralos
pesos de las caractersticas muy lentamente alprincipiodelproceso deentrenamiento para
luegoconvergeralosvaloresptimosrpidamenteenelfinal.

Adems se useljuegodecaractersticasdenso,estoesqueelalgoritmoconsidera
todaslaposiblescombinacionesdetransicionesyestados.
La parte ms importante de la aplicacin del algoritmo CRF es la correcta eleccin
decaractersticasdeltextoparausar.
Como restriccin impuesta por la hiptesis de la tesis, no se usarn caractersticas
propias del idioma analizado o de su morfologa, ya que se quieren obtener resultados
aplicables a textos independientemente del idioma (lexemas, monemas, palabra,
desinencia, cantidad de letras, etc). Se espera que esto tambin brinde el beneficio de
poderaprovecharlariquezaderecursosinformticossemnticosenotrosidiomas.
Las caractersticas semnticas usadas son las brindadas por FrameNet y la
herramientaqueseusparamarcarelcorpusdetrabajofueSEMAFOR.
A continuacin se enumeran las caractersticas semnticas que se tomaron en
cuenta:

esTarget:caractersticaquedeterminaparacadatrminosieselTarget delFrame
ono.
Coreness(FECoreness):caractersticaquemuestraparacadatrminosutipode
Coreness,esdecir,surelevanciadentrodelFrame.Puedetenerlosvalores:Core,
CoreUnexpressed,PeripheraloExtraThematic
Frame(F):paracadatrminoseobtieneelFramedeFrameNetalquepertenecesi
esquetiene.Comoseanalizanteriormente,hayunarelacinimportanteentrelos
marcosdeFrameNetylosEventosdeTimeML.
FrameElement(FE):elelementodemarcoquecorrespondealtrmino
especficamentedentrodelmarcoalquepertenece.
FramePadre(FP):sebuscaenelesquemadeherenciadeFrameNetalFrame
padre.Lamotivacindeestacaractersticaespodercapturarlajerarquade
herenciadeFrameNet.
FramePadredelPadre(FPP):comolacaractersticaanteriorsoloqueunnivelms
haciaarriba.
CantidaddeFrameElementsqueenglobanalFEactual(cEng):seobservaque
unacaractersticaimportanteparacapturarelrboldeFramesqueanotanauna
oracin,eslacantidaddeFrameElementsqueenglobanalFEactual.

Con esta eleccin de caractersticas de los trminos que brinda FrameNet, se trata
de capturar no solo la informacin semntica sino tambin la estructura de jerarqua de
Frames de FrameNet, que, en s misma, tambin es informacin semntica. Esto se
demuestraenelgrfico12:

66

Grfico12[SALTO01]

67
LamismaoracinmarcadaconTimeML:

Qantaswillalmost<EVENTeid="e1"class="OCCURRENCE"
stem="double">double</EVENT>itsflights
betweenAustraliaandIndia< SIGNALsid="s57">by</SIGNAL><TIMEX3tid="t43"
type="DATE"value="199808"temporalFunction="true"functionInDocument="NONE"
anchorTimeID="t41">August< /TIMEX3>inthe<EVENTeid="e2"
class="OCCURRENCE"stem="search">search</EVENT>fornewmarkets
<EVENTeid="e27"class="STATE"stem="untouch">untouched< /EVENT>bythe
cripplingAsianfinancial<EVENTeid="e26"class="OCCURRENCE"
stem="crisis">crisis</EVENT>.

OracinobtenidadelcorpusdeTimeBank1.2(APW19980213.1320)

6.2.4Evaluacin

En esta seccin primero se define el corpus utilizado para las pruebasycriteriosde


evaluacin. Luego se muestran los resultados obtenidos. Finalmente se compara con el
estadodelarteenelrea.

6.2.4.1Corpususadoycriteriodeevaluacin

ParalaevaluacinseuselcorpusTimeBank1.2(verseccin3.2.2TimeBank)
distribuidolibrementeporlaLinguisticDataConsortium[LINKLDC1].

LacomposicindelasanotacionesTimeMLenTimeBank1.2sepuedeverenel
grfico13ytabla2:

68

Grfico13


TipoAnotacin Instancias
EVENT 7935
MAKEINSTANCE 7940
TIMEX3 1414
SIGNAL 688
ALINK 265
SLINK 2932
TLINK 6418
Tabla2

Paraelcasoqueinteresaahora,sepuedeverundetalledeladistribucindetiposde
eventosenelgrfico14ytabla3:

69

Grfico14



TipoEvent Instancias
Reporting 1021
Perception 48
Aspectual 258
I_Action 673
I_State 582
State 1107
Occurrence 4192
Total 7881

Tabla3

Para todos los casos se us 5fold Cross Evaluationparaobtenerlosresultados.La


eleccin de este mtodo de evaluacin se hizo principalmenteporqueeselestndarusado
entrabajossimilaresyporlotantofacilitalacomparacinderesultados.

Estas son las medidas usadas para puntuar los diferentes resultados de los modelos
aplicados:

70
Precisin:

anotacionesCorrectas
totalAnotacionesModelo

Recall:

anotacionesCorrectas
totalAnotacionesCorpus

FMeasure(F =0,5):

1,25*precisin*recall
0,25*precisin+recall

6.2.4.2Resultados

En la tabla 4 se muestran los resultados obtenidos tanto para reconocimientocomo


paraclasificacin.ElMejorFoldmuestraelmejorcasodemedicinF =0,5.

Precisin Recall F =0,5 MejorFold


Reconocimiento 77,17% 58,13% 72,42% 79,41%
Clasificacin 60,25% 34,48% 52,41% 57,35%
Tabla4

ElresultadomuestraunvalordeFporencimadelaprobabilidadaleatoriaquees50%.

Enlatabla5semuestrandemaneradetalladalosresultadosparalatareadeclasificacin:

Precisin Recall F =0,5

Occurrence 60,17% 34,05% 52,17%


I_Action 85,71% 17,39% 48,00%
I_State 73,33% 40,74% 63,22%
Reporting 88,04% 90,12% 88,45%
State 64,29% 8,26% 27,28%
Aspectual 88,89% 26,67% 60,61%
Perception 36,67% 16,33% 29,36%
Tabla5

71
Todos los resultados superaron la probabilidad aleatoria que es 15%. Sin embargo,
haycasosenlosqueseobtuvieronmejoresresultadosqueenotros.

El mejor resultado se obtuvo en el caso de Reporting (88,45%), este valor alto se


puede atribuir a que la relacin entre este tipo de evento y los marcos de FrameNet
relacionados es muy clara. Siempre surgen bajo las palabras decir, contar, relatar, etc
que se corresponden con el Marco Reporting, Statement y sushijos.Ademshayunagran
cantidaddeinstanciasdeentrenamientoenelcorpusdeTimeBank1.2.
Despus hay otros resultados que estn por encima del 48% como Occurrence,
I_State,I_ActionyAspectual.
En el caso de Occurrence tiene a su favor la gran cantidad de instancias de
aprendizaje presentes en el corpus, sin embargo al ser una categora prcticamente de
descarte que se correlaciona slo con el marco Event y que no tiene una correlacin muy
fuerte con los diferentes tipos de marcos de FrameNet, hace que el resultado no sea muy
alto.
En el caso de los tipos de evento Aspectual, el nmero bastantealtoconsiderando
la escasa cantidad de instancias de entrenamiento. Este hecho se debe a que hay una
correlacin muy marcada entre los marcos Process_start, Process_resume, Process_stop,
Process_end, Process_continue, etc y los eventos de tipo Aspectual. Sepodraconsiderar
queeselfenmenoinversodeloquesucediconOccurrence.
Los casos de I_State y I_Action, sucede lo mismo que con los eventos Aspectual.
HayunafuertecorrelacinentreeltipodeeventosylosmarcosdeFrameNet.
En el caso del tipoState,elresultadoespobreencomparacinconlosdems.Esto
se da porqueenFrameNetlosmarcosrelacionadosconestadossesolapan conlosFrames
que anteriormente se relacionaron con el tipo de evento Aspectual. Hay que destacar que
State es una clase muyricayentrminos delemas,lxico, sintaxis,etc.Seranecesarioun
mayordesarrolloenFrameNetparalograrmayorgranularidadenestetipodemarco.
El peor caso se da con el tipo Perception, dado que el problema tiene una escasa
cantidad de instancias anotadas en TimeBank para el entrenamiento. Sera necesario un
mayor trabajo de anotacin en TimeBank para revertir este problema. No as en FrameNet
dondeestnbiendistinguidoslosmarcosrelacionadosconlapercepcin.

6.2.4.3Contribucinycomparacinconelestadodelarte

Para medir la contribucin general que logra el modelo planteado, se compara


contra una lnea de base. La lnea de base que se plantea en la publicacin de Llorens
[LLORENS02] es apta para ser usada en este caso. Para obtener esta lnea base, Llorens
analiza TimeBank 1.2 y observa que la mayora de los eventos estn representados por
verbos y a su vez estos eventosensumayorapertenecenaltipoOccurrence.Entonces,la
lnea base propuesta paracomparareslaqueanotatodoslosverboscomoeventosdeltipo
Occurrence.

72
Enlatabla6semuestraunacomparacindelosresultados:

Precisin Recall F =0,5

ReconocimientoModeloPropuesto 77,17% 58,13% 72,43%


ClasificacinModeloPropuesto 60,25% 34,48% 52,42%
ReconocimientoLneaBase 72,50% 65,20% 70,91%
ClasificacinLneaBase 46,01% 53,19% 47,29%
Tabla6

Se observa una mejora de 1,5% y 5,13% en Reconocimiento y Clasificacin


respectivamente. Estos valores no son muy grandes pero considerando las limitaciones
impuestas por la hiptesis de la tesis (el uso exclusivo de atributos semnticos), se los
puedeconsiderarmuybuenos.

Para contrastar estos resultados,seeligi elsistemaEVITA[SAURI03]quecombina
tcnicas estadsticas y lingsticas. Por un lado, usa un juego de reglas creadas
manualmente basadas en informacin morfosintctica. Por otro lado, usa un mdulo de
desambiguacin Bayesiano para identificar eventos. Basados en estos conceptos, se cre
una implementacin de EVITA llamada SimEvita [BETHARD01]. Los resultados obtenidos
por SimEvita para reconocimiento y clasificacin son,respectivamente,73%y51%paraF.
Que son valor comparables a los obtenidos por el modelo planteado. Considerando que la
solucin planteada en esta tesis es totalmente diferente y, a la vez, ms restrictiva, los
resultadossonprometedores.

6.3Mdulomarcadordelinks

En esta seccin se analiza larelacindelosmarcosdeFrameNet conlosdiferentes


tipos de enlaces temporales reconocidos por TimeML para luego definir los parmetros
necesariosdeunalgoritmoquepermitaelreconocimientoylaclasificacinautomtica.

En la seccin 3.2.1.1 se describen los tipos y subtipos de enlaces temporales que


distingueTimeML.Las3grandescategorasenlasquesedividenson:

TLINK: es un enlace temporal que representa la relacin temporal mantenida entre


eventosoentreuneventoyuntiempo.
SLINK: es un enlace de subordinacin, usado en contextos que introducen
relacionesentredoseventosoentreuneventoyunaseal.
ALINK: es un enlace aspectual que representa la relacin entre un evento de
aspectoysueventoargumento.

Unejemplodeestaanotacin:

73
GuillermoquiereensearelLunes.

Guillermo
<EVENTeid="e1"class="I_STATE"tense="PRESENT"aspect="NONE">
quiere
</EVENT>
<MAKEINSTANCEeiid="ei1"eventID="e1"/>
<SLINKeventInstanceID="ei1"subordinatedEvent="e2"relType="MODAL"/>
<EVENTeid="e2"class="OCCURRENCE"tense="NONE"aspect="NONE">
ensear
</EVENT>
<MAKEINSTANCEeiid="ei2"eventID="e2"/>
<SIGNALsid="s2">
el
</SIGNAL>
<TIMEX3tid="t1"type="DATE"temporalFunction="true"value="XXXXWXX1">
Lunes
</TIMEX3>
<TLINKeventInstanceID="ei2"relatedToTime="t1"relType="IS_INCLUDED"/>

Una de las primeras caractersticas que se ven en las anotaciones de tipo link es
que no consumen texto, es decir son meta anotaciones que relacionan eventos entre s y
eventoscontiempo.
Otra caracterstica, es que su rangodeanotacinestodoeldocumentoencuestin,
esdecir,quenoestnlimitadasaunaoracinoprrafo.
Estas caractersticas hacen que los links sean muy ricos en cuanto alainformacin
semntica temporal que brindan y a su vez los hacen muy difciles de detectar mediante
algoritmosdeaprendizajeautomtico.

En lassiguientesseccionesseanalizanlostiposdelinksy comoexisteunaestrecha
relacin con ciertas propiedades de los marcosdeFrameNet.Luegoseanalizaelalgoritmo
usado para el aprendizaje automtico y las caractersticas elegidas para entrenarlo.
Finalmente se presentan los resultados obtenidos y a partir de estos, se plantea una serie
de suposiciones que se pueden hacer para el caso de los textoshistricosquepodranser
beneficiosas.

6.3.1TiposLinksTimeML

Serevisanlosdiferentestiposysubtiposdelinksparaluegovercmosepueden
correlacionarcondiferentesaspectosdeFrameNet.

6.3.1.1TLink

Comoseexplicenseccionesanteriores,ellink detipoTLinkseencargademarcar
relacionestemporalesentreeventoyentreeventosytiempo(Timex3).Sedivideenvarios
tipossegneltipoderelacinquemarcan,estosson:

74

1. Simultneas (relType=SIMULTANEOUS): dos eventos que suceden
simultneamente.
2. Idnticas(relType=IDENTITY):referencianalmismoevento
3. Una antes que la otra (relType=BEFORE): marca que un evento/tiempo sucede
antesqueotro.
4. Una despus de la otra (relType=AFTER): lo opuesto de 3. Marca que un
evento/tiemposucededespusqueotro.
5. Una inmediatamente antes que la otra (relType=IBEFORE): como el caso 3 pero
inmediatamenteeneltiempo.
6. Unainmediatamentedespusquelaotra(relType=IAFTER):loopuestode5.
7. Unaincluyelaotra(relType=INCLUES):
8. Unaesincluidaporelotro(relType=IS_INCLUDED):(loopuestode7)
9. Unacuyaduracinestincluidadentrodeladuracindelaotra(relType=DURING):
10. Unadeellaseselprincipiodelaotra(relType=BEGINS):
11. Unaseiniciporlaotra(relType=BEGUN_BY):(loopuestode10)
12. Unadeellaseselfinaldelaotra(relType=ENDS):
13. Unaesterminadaporlaotra(relType=ENDED_BY):(loopuesto12)

Ejemplos de un texto extrado y traducido al espaol del corpus TimeBank 1.2 (documento
ABC19980108.1830.0711):

<TIMEX3 tid="t82" type="DATE" value="19980108" temporalFunction="false"


functionInDocument="CREATION_TIME">19980108</TIMEX3>

Por otro lado, est <EVENT eid="e1" class="OCCURRENCE">tornando</EVENT> ser


otra muy <EVENT eid="e369" class="STATE">mala</EVENT> <TIMEX3 tid="t83"
type="DURATION" value="P1W" temporalFunction="false"
functionInDocument="NONE">semana</TIMEX3>financiera
paraAsia.
La <EVENT eid="e3" class="OCCURRENCE">asistencia</EVENT> financiera delBanco
MundialyelFondoMonetarioInternacional
noestn<EVENTeid="e4"class="OCCURRENCE">ayudando</EVENT>.
En <TIMEX3 tid="t85" type="DURATION" value="P1D" temporalFunction="true"
functionInDocument="NONE" anchorTimeID="t82">las ltimas veinticuatro
horas</TIMEX3>,elvalor
de la bolsa de Indonesia ha <EVENT eid="e7" class="OCCURRENCE">cado</EVENT>
enundoceporciento.
La moneda de Indonesia ha <EVENT eid="e9"
class="OCCURRENCE">perdido</EVENT>
veintisisporcientodesuvalor.
En Singapur, las acciones <EVENT eid="e10"
class="OCCURRENCE">tocaron</EVENT> una baja <TIMEX3 tid="t86"
type="DURATION" value="P5Y" temporalFunction="false"
functionInDocument="NONE">decincoaos</TIMEX3>.

75
En las Filipinas, una baja de <TIMEX3 tid="t87" type="DURATION" value="P4Y"
temporalFunction="false"functionInDocument="NONE">cuatroaos</TIMEX3>.
Y en Hong Kong, una <EVENT eid="e147" class="OCCURRENCE">cada</EVENT> de
tresporciento.
Mas <EVENT eid="e153" class="OCCURRENCE">problemas</EVENT> en Hong Kong
para un lugar, para una economa, que muchos expertos <EVENT eid="e11"
class="I_STATE">pensaron</EVENT>algunavez
<EVENTeid="e376"class="STATE">invencible</EVENT>.

<MAKEINSTANCE eventID="e1" eiid="ei375" tense="PRESENT"


aspect="PROGRESSIVE"polarity="POS"pos="VERB"/>
<MAKEINSTANCE eventID="e3" eiid="ei377" tense="NONE" aspect="NONE"
polarity="POS"pos="NOUN"/>
<MAKEINSTANCE eventID="e4" eiid="ei378" tense="PRESENT"
aspect="PROGRESSIVE"polarity="NEG"pos="VERB"/>
<MAKEINSTANCE eventID="e7" eiid="ei379" tense="PRESENT"
aspect="PERFECTIVE"polarity="POS"pos="VERB"/>
<MAKEINSTANCE eventID="e9" eiid="ei380" tense="PRESENT"
aspect="PERFECTIVE"polarity="POS"pos="VERB"/>
<MAKEINSTANCE eventID="e10" eiid="ei381" tense="PAST" aspect="NONE"
polarity="POS"pos="VERB"/>
<MAKEINSTANCE eventID="e147" eiid="ei382" tense="NONE" aspect="NONE"
polarity="POS"pos="NOUN"/>
<MAKEINSTANCE eventID="e153" eiid="ei383" tense="NONE" aspect="NONE"
polarity="POS"pos="NOUN"/>
<MAKEINSTANCE eventID="e11" eiid="ei384" tense="PAST" aspect="NONE"
polarity="POS"pos="VERB"/>
<MAKEINSTANCE eventID="e376" eiid="ei438" tense="PAST" aspect="NONE"
polarity="POS"pos="ADJECTIVE"/>
<MAKEINSTANCE eventID="e369" eiid="ei431" tense="PRESENT" aspect="NONE"
polarity="POS"pos="ADJECTIVE"/>

<TLINK lid="l1" relType="BEFORE" eventInstanceID="ei377"


relatedToEventInstance="ei378"/>
<TLINKlid="l2"relType="INCLUDES"timeID="t85"relatedToEventInstance="ei379"/>
<TLINK lid="l3" relType="IS_INCLUDED" eventInstanceID="ei380"
relatedToTime="t85"/>
<TLINKlid="l4"relType="INCLUDES"timeID="t85"relatedToEventInstance="ei381"/>
<TLINK lid="l8" relType="IS_INCLUDED" eventInstanceID="ei382"
relatedToTime="t85"/>
<TLINKlid="l9"relType="DURING"eventInstanceID="ei383"relatedToTime="t82"/>
<TLINKlid="l6"relType="BEFORE"timeID="t87"relatedToTime="t82"/>

76

6.3.1.2SLink

El link de subordinacin es usadoencontextosqueintroducenrelacionesentredos


eventosoentreuneventoyunaseal.Sondelossiguientestipos:

1. Modal (relType=MODAL): relacin introducida en su mayora por verbos modales


(poder, deber, querer, etc.) y eventos que introducen una referencia a un mundo
posibleI_STATEs.
2. Factivo (relType=FACTIVE): algunos verbos introducen una implicacin (o
presuposicin) sobre la veracidad del argumento. Algunos ejemplos son olvidar,
lamentar,lograr.
3. Contrafactivo (relType=COUNTER_FACTIVE): el evento introduce una
presuposicinsobrelanoveracidaddelargumento.
4. Probatorio (relType=EVIDENTIAL): las relaciones probatorias son introducidas por
eventosdetipoREPORTINGoalgunosdetipoPERCEPTION.
5. Probatorio Negativo (relType=NEG_EVIDENTIAL): introducidas por eventos de tipo
REPORTING o algunos de tipo PERCEPTION y que transmiten una polaridad
negativa.
6. Negativa(NEGATIVE):introducidasoloporpartculasdesealesnegativas(no,ni).

Ejemplos de un texto extrado y traducido al espaol del corpus TimeBank 1.2 (documento
APW19980213.1310):

Las encuestas han<EVENT eid="e62" class="REPORTING">mostrado</EVENT> un


<EVENT eid="e63" class="OCCURRENCE">apoyo</EVENT> del pblico republicano por
un<EVENTeid="e64"class="OCCURRENCE">aumento</EVENT>,
subiendo desde aproximadamente 35 por ciento hace varios aos hasta aproximadamente
51porciento
esteao,mientraselsentimientopromonrquicodisminuye.

<MAKEINSTANCE eventID="e62" eiid="ei2049" tense="PRESENT"


aspect="PERFECTIVE"polarity="POS"pos="VERB"/>
<MAKEINSTANCE eventID="e63" eiid="ei2050" tense="NONE" aspect="NONE"
polarity="POS"pos="NOUN"/>
<MAKEINSTANCE eventID="e64" eiid="ei2051" tense="PRESPART" aspect="NONE"
polarity="POS"pos="VERB"/>

<SLINK lid="l70" relType="MODAL" eventInstanceID="ei2050"


subordinatedEventInstance="ei2051"/>

77
<SLINK lid="l59" relType="EVIDENTIAL" eventInstanceID="ei2049"
subordinatedEventInstance="ei2050"/>

6.3.1.3ALink

El link aspectual representa la relacin entre un evento aspectual y su evento


argumento.Lasrelacionescodificadasporestaanotacinson:

1. Iniciacin(relType=INITIATES):representaunarelacindeiniciodeunevento.
2. Culminacin (relType=CULMINATES): representaunarelacinde culminacindeun
evento
3. Terminacin (relType=TERMINATES): representa una relacinde terminacindeun
evento
4. Continuacin (relType=CONTINUES):representaunarelacindecontinuacindeun
evento
5. Reiniciacin (relType=REINITIATES): representa una relacin de reinicio de un
evento

Ejemplos de un texto extrado y traducido al espaol del corpus TimeBank 1.2 (documento
ABC19980108.1830.0711):

<TIMEX3tid="t196"type="DATE"value="PRESENT_REF"temporalFunction="true"
functionInDocument="NONE"anchorTimeID="t82">Ahora</TIMEX3>connueva
<EVENTeid="e26"class="OCCURRENCE">construccin</EVENT>en<EVENT
eid="e27"class="ASPECTUAL">camino</EVENT>,tresdesuscompradoressehan
<EVENTeid="e28"class="OCCURRENCE">retirado</EVENT>.

<MAKEINSTANCEeventID="e27"eiid="ei396"tense="NONE"aspect="NONE"
polarity="POS"pos="NOUN"/>
<MAKEINSTANCEeventID="e26"eiid="ei395"tense="NONE"aspect="NONE"
polarity="POS"pos="NOUN"/>

<ALINKlid="l46"relType="INITIATES"eventInstanceID="ei396"
relatedToEventInstance="ei395"/>

6.3.2RelacinentreFrameNetylinksTimeML
6.3.2.1FrameElements

Al analizar las estructuras de FrameNet, se pueden ver diferentes definiciones que


tienen un correlato directo con la tarea de deteccin de informacin temporal. Empezando
por una de las unidades ms pequeas constructivas de los marcos de FrameNet, estos
son los Frame Elements (ya explicados en mayor profundidad en la seccin 4.3.1). Los
elementos de marco (Frame Elements) son las entidades o propiedades que pueden estar

78
presentes en cualquier instancia del marco en cuestin. En un relevamiento noexhaustivo,
podemosveralgunoscasosdeFEqueevocanrelacionestemporales.

Algunosejemplos:

Duration
Period_of_iterations
Duration_of_final_state
Frecuency
Iteration
Particular_iteration
Circumstances
Containing_event
Coordinated_event
Correlated_variable
Time
Relative_time
Whole
Interval
Destination_time
Destination_event
Salient_event
Focal_time
Landmark_time
End_point
Cause
Event

Segn el contexto del Frame en el que se est trabajando, cada FE tendr su


significado y relevancia. La ideaesque,mediantelacorrectaeleccindecaractersticasdel
texto,elalgoritmopuedacaptarestasrelacionesymarcarlas.

6.3.2.2Frames

Pasando al casode losmarcos,sepuedevermsclaraestaidea.Acontinuacinse


escogen ciertos marcos que se consideran ejemplificadores de las caractersticas que se
intentan capturar mediante el sistema desarrollado y se resaltan ciertos aspectos de sus
definiciones.

Frame:Location_in_time

Definicin:Laspalabras/senesteFramedetallanunmomentoparticulareneltiempo.Este
ocurregeneralmentecondemostrativoscomoesteoese.

Ejemplo:Mstardeeseda,1816,Argentinadeclarlaindependencia.

79

FErelevantes:
Focal_time [foc]: El punto temporal particular. Si hay untiempoespecificado,esees
eltiempofocal.Sino,eltiempofocaleslaunidad.Sihayunaexpresinapositivaque
especifica una entidad que no es necesariamente msgrande queeltarget, tantola
unidadcomolaespecificacinsonelFE.
Relative_time [RelT]: denota las palabrasqueubicaneltiemporespectodeunpunto
identificableeneltiempo.
Salient_event[sal_eve]:uneventoasociadoconunpuntotemporaldado.

Frame:Change_event_time

Definicin: En este Frame, un Agent o Cause cambiael tiempo deunEvent.ElEventvaa


tomar lugar en un Destination_time o con respecto a un Destination_event. Esto puedeser
logradomedianteciertosMeans,deciertaManneroenciertoDegree.

Ejemplo:Lalluviademorelpartidodeftbol

FERelevantes:
Agent:laentidadanimadaqueproduceelcambioeneltiempodelevento.
Cause:lafuerzanosensiblequeproduceelcambioeneleventodeltiempo.
Event:elsucesoquecambiadetiempo.
Degree:elgradoenelqueeleventocambiadetiempo.
Destination_event:eslaocasincontralacualelcambiodetiempodeleventotoma
lugar.
Destination_time:eseltiempoenelcualeleventorealmenteocurre
Manner:eslamaneraenlaqueelcambiodetiempotomalugar.
Means:describeelmodoenelqueelcambiodetiempotomalugar.

Frame:Process_start

Definicin:UnEventempiezaenciertoTimeyPlace.Tambinsepuedeindicarlarazn.

Ejemplo:Elproyectoempezayer

FERelevantes:
Event:nombredeleventoqueocurre.
Time:cuandoocurreelevento.
Place:lugardondeocurreelevento
Duration[Dur]:elperiododetiempoduranteelcualelprocesocontinaluegode
empezado.
Frequency[Freq]:elnmerodevecesqueeltipodeeventoespecificadoempieza.

80
ExistenFramesdeestructurasimilaraestequeseocupandelosdistintosmomentosdeun
proceso:
Process_completed_state
Process_continue
Process_end
Process_initial_state
Process_pause
Process_resume
Process_stop
Process_stopped_state
Process_uncompleted_state

Frame:Temporal_collocation

Definicin: se identifica un objeto o sujeto que se mueve, atravsdeltiempooelespacio,


queocurrealmismotiempoqueunamarcayaconocida.

Ejemplo:
Tratdehacersecargodeesoensuultimavisita.

Megustaespecialmentelasobremesaenlanoche.

FERelevantes:
Landmark_entity[LEn]:laentidadquedesignaeltiempoparaunsujetouobjetoque
semueveeneltiempo.
Landmark_event[LEv]:eleventoquedesignaelmomentoenelqueelsujetou
objetoquesemueveeneltiempoocurre.
Landmark_period[LPe]:elperiodoenelqueelsujetouobjetoquesemueveenel
tiempoocurre.Esteperiodopuedesercclico,yenesecaso,hayqueinterpretarlo
conelcontexto.
Trajector_entity[TEn]:laentidadqueocurreenunmomento.
Trajector_event[TEv]:eleventoqueocurreenalgnmomento.
Trajector_period[TPe]:elperiodoqueocurreconrespectodealgnmomento.

Frame:Simultaneity

Definicin: dos Events suceden al mismo tiempo. Esto puede ser el caso de una relacin
simtricaentredosEvents, oasimtricaentreunLandmark_eventcuyaocurrenciaconocida
seusaparadescribircuandounProfiled_eventsucedi.

Ejemplo:Loseventoscoincidieron

81
FERelevantes:
Landmark_event[Ent2]:eleventooperiodocontraelcualelProfiled_eventes
juzgado.
Profiled_event[Ent1]:eleventoqueseafirmaocurrealmismotiempoque
Landmark_event
Events[Ents]:losestadosdesituacinqueseaseguranestarcorrelacionados.

Frame:Change_event_time

Definicin: en este Frame, un Agent o Cause cambia el tiempo de un Event. El Event


pasar a sucederenuncierto Destination_timeoconrespectoaunDestination_event.Esto
solopuedeserrealizadoconciertosMeans,deciertaManner,oenciertoDegree.

Ejemplo:Lalluviaatraselpartido.

FERelevantes:
Agent:eslaentidadanimadaquehaceelcambioeneltiempodelEvent
Cause:eslafuerzanosensiblequehaceelcambioeneltiempodelEvent
Event:eseleventoquecambiadetiempo
Destination_time:eseltiempoenelqueelEventocurrerealmente.
Destination_event:eslaocasinenlacualeltiempodelEventrealmenteocurre.
Means:describelosmediosporloscualeselqueelcambiodetiemposucede.
Manner:describelamaneraenlaqueelcambiodetiemposucede.
Degree:describelaextensinconlacualelcambiodetiemposucede.
Time[tim]:eltiempoenelcualelretrasoocurre.

Algunosotrosframesquebrindanmuchainformacintemporal:

Change_event_duration
Temporary_stay
Calendric_unit
Cause_Impact
Event
Event_instance
Temporal_subregion
Holding_off_on
Waiting
Location_in_time

Esta lista no es exhaustiva pero sirve para ejemplificar el tipo de informacin


temporal que brinda FrameNet. De hecho, casi todos los Frames tienenalgunFEquehace
referenciaalTiempooaalgntipodeperiodicidadofrecuencia.

82
A continuacin se analiza el ltimo caso, que es el de las relaciones entre Frames
(verseccin4.3.1).

6.3.2.3RelacionesentreFrames

FrameNetdistingueseistiposderelacionesentreFrames:

Herencia
Perspectivasobre
Uso
Submarco
Precede
Causade
Incoativo

Analizando la definicin de cada una de estas relaciones, se concluy que hay


cuatrodeellasquebrindaninformacinderelacionestemporalesentreeventos.Estasson:

Submarco:estarelacinnoesnecesariamentetemporalperomuchasvecesloesya
quedivideuneventocomplejoeneventosmspequeos.Estosuelecoincidirconel
ordenamientotemporaldeestoseventosorelacionesdeinclusin.
PorejemploelcasodelFrameActivitytienecomosubmarcosa
Activity_abandoned_state,Activity_done_state,Activity_finish,Activity_ongoing,
Activity_pause,Activity_paused_state,Activity_prepare,Activity_ready_state,
Activity_resume,Activity_start,Activity_stop
Precede:estarelacinsiempreespecificaunordenamientotemporal.
Porejemplo(grfico15)lossiguientesFrames


Grfico15

Lasflechasrepresentanlasrelacionesdeprecedencia.

Causade:relacinquedescribelacausalidadentredosmarcos.Esgeneralmente
mapeableaunarelacintemporal.
Porejemplo,elFrameGivingtieneunarelacindecausalidadconelFrameGetting.
Esdecir,estarelacinguardalainformacindequedarescausantedeobtener.

83
Incoativode:vienedelaspectoverbalqueexpresaelcomienzodeunaaccin.Por
definicindelaspectoincoativo,estarelacinsiempreimplicaunarelacintemporal.
Porejemplo,elFrameGettingesIncoativodelFramePossession.

6.3.3Modelodeaprendizajesupervisado:SupportVectorMachines

Para crear los modelos de clasificacin de links, se us SVM (Support Vector


Machines) [CORTES01]. Los SVMs son modelos de aprendizaje supervisado con
algoritmos de aprendizaje asociados que analizan datos y reconocen patrones, y son
usados para clasificacin y anlisis de regresin. Dado un juego de ejemplos de
aprendizaje, cada uno marcado con una de dos categoras, un algoritmo de entrenamiento
SVM construye un modelo que asigna los nuevos ejemplos a una u otra categora,
hacindolounclasificadorbinariolinealnoprobabilstico.
Un modelo SVM es la representacin de los ejemplos como puntos en un espacio,
mapeados de modo que los ejemplos de diferentes categoras son separados por una
divisin clara lo ms grande posible. Los nuevos ejemplos son mapeados en el mismo
espacio prediciendo que pertenecen a una categora segn el lado de la brecha en el que
caigan.

Adems de lograr una clasificacin lineal, los SVMs pueden lograr eficientemente
una clasificacin no lineal usando lo que se conoce como kernel trick, esto es
implcitamente mapeando sus entradas en espacios de caractersticas de varias
dimensiones.

6.3.4Procesodegeneracindedatosparaentrenamiento

Como se explic en secciones anteriores, las relaciones de Link se dan entre


Eventos y/o Timex a lo largo de todo el documento. A continuacin se detalla la mecnica
elegidaparagenerarlosdatosdeentrenamiento.
Se parte de un archivo marcado con Events y Timex3 adems de los Frames
semnticos de FrameNet. Se crean posibles relaciones entre todos estos Events/Timex3.
Para poder referenciar a las dos partes de estas posibles relaciones, se opt por llamarlas
ParteAyParteB.
Para cada unadeestas relacionessehacenexplcitasciertascaractersticasconlas
cuales el algoritmo SVM har el modelo para categorizar entre LINK y NO_LINK
(reconocimiento)yluegoclasificarentrelosdiferentestiposdeLINK.
Uno de los primeros problemas que surgen para entrenar los modelos, es el gran
desbalance de datosquesegenerayaquelamayoradelasposiblesrelacionesgeneradas
terminan siendo NO_LINK. Este es un problema que suele aparecer en este tipo de
mtodos de aprendizaje automtico explicado en el artculo de He [HE01]. Una de las
posibles soluciones que se plantea para este tipo de problemas es el de hacer under
sampling, es decir que en el proceso de muestreo se recolectan menos muestras de los
casosnegativos.Esaeslasolucinqueseaplicenestecaso.
En la siguiente seccin, se explica cada una de lascaractersticaselegidasde cada
relacinparaelentrenamiento.

84
6.3.5Caractersticaselegidasparaentrenarelalgoritmo

Distancia_oraciones: este valor es la distancia (en oraciones) entre la parte A y la


parte B de la relacin. Puede ser 0 (en la mismaoracin),1(oraciones contiguas)o
2 (una oracin de separacin). Obviamente las relaciones pueden estar a ms
distancia, pero analizando los datos se observa que la mayora de las relaciones
temporales suceden en ese rango de distancia. Adems al usar un mayor rangode
distancia, la cantidad de relaciones posibles crece exponencialmente (as como
tambin crecen la cantidad de casos negativos) haciendo el problema de
clasificacinyreconocimientoinmanejable.
FrameA:elFramequegobiernaalaparteAdelarelacin.
FrameB:elFramequegobiernaalaparteBdelarelacin.
FramePadreA: el Frame padre del Frame que gobierna la parte A. Paracapturarla
estructuradejerarquasdeFrameNet.
FramePadreB: el Frame padre del Frame que gobierna la parte B. Paracapturarla
estructuradejerarquasdeFrameNet.
FramePadrePadreA:idemFramePadreAperounnivelms.
FramePadrePadreB:idemFramePadreBperounnivelms.
CompartenFrame: puede tomar el valor SI en caso de que la parte A y B estn
gobernadasporelmismoFrame.TomaelvalorNOencasocontrario.
LabelA:elnombreFrameElementdelaparteA.
LabelB:elnombreFrameElementdelaparteB.
CorenessLabelA: puede tomar los valores Core, CoreUnexpressed, Peripheral o
ExtraThematic.EselCoreness delFEdeA.
CorenessLabelB: puede tomar los valores Core, CoreUnexpressed, Peripheral o
ExtraThematic.EselCoreness delFEdeB.
Relacion: si es que la parte A y B tienen Frames y estos son diferentes y adems
hay una relacin entre ellos, esta caracterstica toma ese valor. Puede ser
Inheritance, ReFraming_Mapping, Using, Inchoative_of, See_also, Precedes,
Subframe,Causative_ofoPerspective_on.
RelRolA: segn el tipo de relacin que existaentreelFramedelaparteAyB,cada
partecumplirunroldentrodeestarelacin.EstetomaelvalordelroldelaparteA.
RelRolB: segn el tipo de relacin que existaentreelFramedelaparteAyB,cada
partecumplirunroldentrodeestarelacin.EstetomaelvalordelroldelaparteB.
TipoParteA: especifica de qu tipo es la parte A. Puede ser algn tipo de Eventoo
unTimex.
TipoParteB: especifica de qu tipo es la parte B. Puede ser algn tipo de Eventoo
unTimex.
AEnglobadoPorB: para capturar la estructura de cmo se relacionan las partes de
larelacinencuantoainclusindentrodeFrameElements.PuedevalerSIoNO.
BEnglobadoPorA: para capturar la estructura de cmo se relacionan las partes de
larelacinencuantoainclusindentrodeFrameElements.PuedevalerSIoNO.

A continuacin se detallan las diferentes pruebas hecha para la deteccin y


clasificacindeLINKS.

85
6.3.6Evaluacindelosresultados

6.3.6.1Corpususadoparalaspruebas

Al igual que en el caso de los eventos, para la evaluacin se us el corpus


TimeBank 1.2 (ver seccin 3.2.2 TimeBank). La composicin de las anotaciones de Links
TimeMLenTimeBank1.2semuestraenlatabla7ygrfico16:

Subtipo Subtotal Total


ALINK_CONTINUES 69
ALINK_CULMINATES 30
ALINK_INITIATES 91
ALINK_REINITIATES 14
ALINK_TERMINATES 54 258
SLINK_CONDITIONAL 45
SLINK_COUNTER_FACTIVE 47
SLINK_EVIDENTIAL 1140
SLINK_FACTIVE 394
SLINK_MODAL 1261
SLINK_NEG_EVIDENTIAL 6 2893
TLINK_AFTER 879
TLINK_BEFORE 1375
TLINK_BEGINS 61
TLINK_BEGUN_BY 66
TLINK_DURING 298
TLINK_DURING_INV 1
TLINK_ENDED_BY 161
TLINK_ENDS 73
TLINK_IAFTER 38
TLINK_IBEFORE 34
TLINK_IDENTITY 721
TLINK_INCLUDES 571
TLINK_IS_INCLUDED 1334
TLINK_SIMULTANEOUS 660 6272
Tabla7

86

Grfico16

6.3.6.2Mtododeevaluacinutilizado

Paratodoslos casosseuso10foldCrossEvaluationparaobtener losresultados.La


eleccin de este mtodo de evaluacin se basa en que es el mtodo usado por trabajos
similaresporloquesefacilitalacomparacinderesultados.

Estas son lasmedidasusadasparapuntuarlosdiferentesresultadosdelosmodelos


aplicados:

Precisin:

anotacionesCorrectas
totalAnotacionesModelo

87

Recall:

anotacionesCorrectas
totalAnotacionesCorpus

FMeasure(F =1):

2*precisin*recall
precisin+recall

Los casos 1 3, son de deteccin y clasificacin de links con una distancia de


oracionesdehasta2.

Luego, pensando en el problema de la deteccin de informacin temporal en


fragmentos de textos histricos reducidos se limita la distancia de oraciones a 0. Es decir,
se evala la deteccin y clasificacin de LINKS dentro de una misma oracin. Adems se
hace una segunda suposicin considerando el caso de los textos histricos cortos. Se
observa que enesostextos,hayunapredominantecantidaddeinformacintemporal,porlo
que podemos suponer que todos los links que pueden generarse son efectivamente algn
tipo de link.Esdecirsereducelatareasimplementealadeclasificar.Estossonloscasos4
5.

6.3.6.3DeteccinLINKyNO_LINKatravsdediferentesoraciones(caso1)

Precisin Recall F =1

LINK 92,90% 94,30% 93,60%


NO_LINK 67,50% 62,10% 64,70%
Tabla8

6.3.6.4DeteccinyclasificacinTLINK,SLINK,ALINKNO_LINKatravsdediferentes
oraciones(caso2)

Precisin Recall F =1

SLINK 71,70% 69,10% 70,40%


TLINK 74,20% 74,80% 74,50%
ALINK 51,00% 41,00% 45,50%
NO_LINK 65,40% 69,60% 67,40%
Tabla9

88
6.3.6.5DeteccinyclasificacindetodoslostiposdeLinkatravsdediferentesoraciones
(caso3)

Precisin Recall F =1

SLINK_MODAL 51,60% 81,40% 63,20%


TLINK_IS_INCLUDED 48,20% 74,60% 58,60%
NO_LINK 66,30% 69,00% 67,60%
TLINK_DURING 50,00% 0,50% 0,90%
SLINK_FACTIVE 40,50% 24,10% 30,20%
TLINK_BEFORE 25,40% 22,70% 24,00%
TLINK_INCLUDES 0,00% 0,00% 0,00%
TLINK_IDENTITY 33,10% 16,30% 21,80%
SLINK_EVIDENTIAL 63,50% 84,20% 72,40%
TLINK_SIMULTANEOUS 24,40% 14,30% 18,00%
SLINK_COUNTER_FACTIVE 76,90% 22,20% 34,50%
TLINK_AFTER 24,80% 29,40% 26,90%
ALINK_TERMINATES 42,90% 28,60% 34,30%
TLINK_IAFTER 0,00% 0,00% 0,00%
TLINK_ENDED_BY 42,40% 9,20% 15,10%
SLINK_NEG_EVIDENTIAL 0,00% 0,00% 0,00%
ALINK_CULMINATES 44,80% 52,00% 48,10%
TLINK_BEGUN_BY 0,00% 0,00% 0,00%
ALINK_INITIATES 51,80% 42,60% 46,80%
ALINK_CONTINUES 34,30% 34,30% 34,30%
SLINK_CONDITIONAL 100,00% 6,70% 12,50%
TLINK_BEGINS 0,00% 0,00% 0,00%
TLINK_IBEFORE 0,00% 0,00% 0,00%
TLINK_ENDS 0,00% 0,00% 0,00%
ALINK_REINITIATES 100,00% 25,00% 40,00%
TLINK_DURING_INV 0,00% 0,00% 0,00%
Tabla10

89
6.3.6.6ClasificacinentreTLINK,SLINKyALINKmismaoracin(caso4)

Precisin Recall F =1

TLINK 80,20% 81,50% 80,80%


SLINK 75,40% 74,70% 75,00%
ALINK 47,80% 37,50% 42,00%
Tabla11

90
6.3.6.7ClasificacindetodoslostiposdeLinkatravsdediferentesoraciones(caso5)

Precisin Recall F =1

SLINK_EVIDENTIAL 76,30% 78,60% 77,40%


TLINK_INCLUDES 0,00% 0,00% 0,00%
TLINK_IS_INCLUDED 55,60% 80,60% 65,80%
SLINK_MODAL 52,90% 82,10% 64,30%
TLINK_DURING 0,00% 0,00% 0,00%
TLINK_BEFORE 20,80% 37,00% 26,60%
SLINK_FACTIVE 21,70% 8,00% 11,70%
TLINK_SIMULTANEOUS 19,00% 10,30% 13,40%
TLINK_AFTER 21,30% 18,50% 19,80%
SLINK_COUNTER_FACTIVE 71,40% 11,10% 19,20%
TLINK_IDENTITY 38,10% 17,90% 24,40%
TLINK_ENDED_BY 40,00% 6,80% 11,60%
ALINK_TERMINATES 40,00% 33,30% 36,40%
TLINK_IAFTER 0,00% 0,00% 0,00%
SLINK_NEG_EVIDENTIAL 0,00% 0,00% 0,00%
ALINK_CULMINATES 55,00% 44,00% 48,90%
TLINK_BEGUN_BY 0,00% 0,00% 0,00%
ALINK_INITIATES 44,60% 37,30% 40,70%
ALINK_CONTINUES 30,00% 26,50% 28,10%
TLINK_BEGINS 0,00% 0,00% 0,00%
SLINK_CONDITIONAL 0,00% 0,00% 0,00%
TLINK_IBEFORE 0,00% 0,00% 0,00%
TLINK_ENDS 0,00% 0,00% 0,00%
ALINK_REINITIATES 0,00% 0,00% 0,00%
TLINK_DURING_INV 0,00% 0,00% 0,00%
Tabla12

En el caso 1 es muy simple, pero relevante, ya que es la distincin entre LINK y


NO_LINK, sin importar tipos o subtipos de estos. Se pueden observar muy buenos
resultados.

En el caso 2 hay una granularidad mayor ya que distingue entre ALINK, TLINK,
SLINK y NO_LINK. En este caso tambin los resultados son buenos (comparando contra
una lnea base de probabilidad aleatoria del 25%), ya que se obtuvo una medidaFdems
de 65% para todosloscasosexceptopara ALINKqueseobtuvo45%.Esta diferenciaseda
91
debido a que la cantidad de casos de ALINKsenelcorpusesbastantemenoralosdems,
porlotantoelmodeloobtenidoparaladeteccinnoestanbuenoparaestoscasos.

En el caso 3 hay una muy alta granularidad ya que distingue entre tipos y subtipos
de links. En este caso los resultado son dispares. Existen casos en los queseobtiene0%,
esto se debe a que la cantidad de instanciasdeesoscasossontanescasasquenollegaa
detectar ninguna en el corpus de prueba. Sin embargo hay muy buenos resultados en los
casos de SLINK_MODAL (63%), TLINK_IS_INCLUDED (58%), NO_LINK (67%) y
SLINK_EVIDENTIAL (72%). Los dems casos superan la lnea base del 4% (que es el
modeloaleatorio),porloqueselospuedeconsideraraceptables.

En el caso 4, que es el caso en donde solamente se clasificaentre TLINK,ALINKy


SLINK, se obtuvieron muy buenos resultados que superan la lnea base del 33% (modelo
aleatorio). Un 80% de medida F para TLINK y un 75% para SLINK. La medida paraALINK
nofuetanaltaporlamismaraznqueenelcaso2.

En elcaso5, queeselcasodeclasificacinperoconmuyaltagranularidaddetipos,
aplicaelmismoanlisisqueenelcaso3.

En conclusin, los mejores resultados de deteccin y clasificacin se obtienen para


una granularidad media (TLINK, SLINK, ALINK y NO_LINK).Estosedebe principalmentea
que al aumentar mucho la granularidad de tipos, los casos en el corpus se hacen muy
escasos haciendo que el modelo generado no sea tan bueno. Sin embargo, considerando
esta alta granularidad y que se us solamente la informacin semntica brindada por
FrameNetparaarmarlosmodelos,estosresultadossonmuybuenos.

6.3.6.8Comparacinconotrosproductos

Como se detall en la seccin 3.2.3, laherramientamsusadaparaladeteccin de


informacin temporal incluyendo enlaces temporales es el TARSQI Toolkit. Dentro de este
juego de herramientas dedeteccintemporal,haytresquesonusadasparaladeteccinde
enlaces: GutenLink, Slinket y Sputlink (explicados en con mas detalle en las secciones
3.2.3.3,3.2.3.4y3.2.3.5respectivamente).

La herramienta GutenLinkestdedicada adetectarrelacionesdetipoTLINKusando


reglassintcticasylexicogrficascreadasamanoysolomanejatrestiposdecasos.

La herramienta SLinket es usada para detectar relaciones de tipo SLINK y tambin
estbasadaenreglasyparaciertoscasos.

Finalmente la herramienta SputLink se dedica a derivar nuevas relaciones


temporales (TLINKs) basndose en reglas de lgebra de intervalos de James Allen
[ALLEN04]

92
Como se puede ver son herramientas limitadas a ciertos casos y con reglas
prefijadas, lo que las hacen bastante rgidas. La medida F que reportan es de 75%.
Adems, es importante remarcar que ninguna se dedica al caso de deteccin de tipos de
enlaceALINK.
Por lo que la aproximacin elegida, usando un mtodo totalmente diferente y ms flexible,
entradentrodelrangodeestasherramientas.

6.3.7Conclusinsobredeteccindelinks

La deteccin de links escomplejaporelproblemadeladispersindedatos.Estees


un problema que se les presenta en otras herramientas y en la propia generada para esta
tesis. Sin embargo, el mtodo semntico desarrollado en conjunto con tcnicas para
trabajar el desbalance de datos, obtuvo muy buenos resultados tanto para deteccin como
paraclasificacin.
Adems como se va a explicar en la siguiente seccin, muchosdeestosproblemas
se simplificanaltrabajarconelcasoparticulardeloscopetesdetextoshistricosargentinos
delsigloXVIIIyXIX.

93
7.Elcasodelostextoshistricos

Una de las primeras caractersticas que se observan en los copetes de textos


histricos es su limitada extensin (una o dos oraciones). Esta caracterstica, en un primer
anlisis puede parecer que juega en contra del objetivo de esta tesis que es el de detectar
informacin temporal haciendo uso de la informacin semntica (hay pocainformacin,por
lo tanto hay poca informacin semntica). Sin embargo, al analizarlostextos,sepuedever
que estos son muy estructurados (todos los copetes tienen una fecha exactaasociada),su
informacin es fuertemente orientada a lo temporal y las oraciones son cortas, simples y
precisas.

Todasestascaractersticaspermitenhacersuposicionestalescomoque:

Todosloseventosqueaparecenenlasoracionestienenalgnenlacetemporalentre
si. Esto resuelve el problema de dispersin al convertir el problema en uno de
clasificacin.
Cuando no hayunTIMEXenlaoracin,sepuedeusarlafechaqueestexplcitaen
eldocumento.
Al ser pocas oraciones y simples, se limita an ms elproblemadeladispersinde
datoscuandoseconsideranlasrelacionesentreoraciones.

Debidoalafaltadeherramientasdeanotacinautomticasemnticaparatextosen
espaol,sepasaaejemplificarconuncasoanotadomanualmentequeseobtuvodel
ApndiceC:

Documento 2.Benito Nazar a Wenceslao Paunero. Relacin de la actuacin de su


regimiento en la batalladePavn.Derrotadelaartilleraenemiga.Manifestacionesde
Bartolom Mitre. Mencin del Comandante Alsina. Actuacin de un escuadrn de
caballera. Comportamiento del Cap. RamnMuzalSubtenienteZennNazar.Toma
deunabanderaenemiga.SanNicolsdelosArroyos,20desetiembrede1861.F.2y3.

Anotadosemnticamente(algunasoracionesderelevanciaparaelejemplo):

Oracin1:

Relacindelaactuacindesuregimientoe nlabatalladePavn.

FRAME:Intentionally_act
FEs:Agent,Place

RelacindelaactuacindesuregimientoenlabatalladePavn.

FRAME:Statement
FEs:Message

94
En este caso, el mdulo de anotacin de eventos marca actuacin como un
eventodetipoOCCURRENCEyrelacincomouneventodetipoREPORTING.

Seguidamente, el mdulo de anotacin de links crea un TLINK entre el evento


Relacin y el DCT(DocumentCreationTime=20desetiembrede1861)yunSLINKentre
loseventosrelacinyactuacin.

Oracin2:

Derrotadelaartilleraenemiga.

FRAME:beat_opponent
FEs:Loser

En este caso el mdulo de anotacin de eventos anota a Derrota como unevento


de tipo OCCURRENCE y el mdulo de linkscreaunlinkentreeleventoDerrotayelDCT.
Este ultimo link no es del todo correcto ya que la fecha de laderrotanoeslamismaquela
decreacindeldocumento,peroesunaaproximacinaceptable.

Oracin3:

Tomadeunabanderaenemiga.

FRAME:Conquering
FEs:Theme

En este caso el mdulodeanotacindeeventosanotaaTomacomouneventode


tipo OCCURRENCE y el mdulo de linkscreaunlinkentreeleventoTomayelDCT.Este
ultimolinknoesdeltodocorrectoporelmismomotivoqueenlaoracinanterior.

Las anotaciones TimeML mencionadas en los ejemplos anteriores quedan del


siguientemodoeneltexto:

BenitoNazaraWenceslaoPaunero.<EVENTeid="e1"
class="REPORTING">Relacin</EVENT>dela<EVENTeid="e2"
class="OCCURRENCE">actuacin</EVENT>desuregimientoenlabatalladePavn.
<EVENTeid="e3"class="OCCURRENCE">Derrota</EVENT>delaartilleraenemiga.
ManifestacionesdeBartolomMitre.MencindelComandanteAlsina.Actuacindeun
escuadrndecaballera.ComportamientodelCap.RamnMuzalSubtenienteZenn
Nazar.<EVENTeid="e4"class="OCCURRENCE">Toma</EVENT>deunabandera
enemiga.SanNicolsdelosArroyos,<TIMEX3tid="t0"TYPE="DATE"
functionInDocument="CREATION_TIME"value="18610920">20desetiembrede
1861</TIMEX3>.

<MAKEINSTANCEeiid="ei1"eventID="e1"/>
<MAKEINSTANCEeiid="ei2"eventID="e2"/>

95
<MAKEINSTANCEeiid="ei3"eventID="e3"/>
<MAKEINSTANCEeiid="ei4"eventID="e4"/>
<TLINKlid=l1eventInstanceID="ei1"relatedToTime="t0"relType="IS_INCLUDED"/>
<TLINKlid=l2eventInstanceID="ei3"relatedToTime="t0"relType="IS_INCLUDED"/>
<TLINKlid=l3eventInstanceID="ei4"relatedToTime="t0"relType="IS_INCLUDED"/>
<SLINKlid=l4eventInstanceID="ei1"subordinatedEventInstance="ei2"
relType="EVIDENTIAL"/>

Otroejemplo,tomadodelanexoB:

ParaejemplificarlasrelacionestemporalesentreFrames,setomaelsiguientecopete:

Documento 14. Testimonio de Ignacio de Ezaurdi: refiere que la lancha que ha sido
propiedad de don F. Biscaya fue apresada junto a otras en lo arroyos de Gualeguay
por el Cte Samaniego. Fue rematada adquirindola Don Antonio del Texo. 29 de
agostode1814.

Entonces,anotandosemnticamente:

Oracin1:

Refierequelalanchaquehasidopropiedadded onF.Biscayafueapresadaj untoaotras


enloarroyosdeGualeguayporelCteSamaniego.

FRAME:Pre_transfer
FEs:Theme,Donor

Oracin2:

FuerematadaadquirindolaDonAntoniodelTexo.

FRAME:Transfer
FEs:Theme,Recipient

Haciendo foco solamente en estos dos frames (Pre_transfer y Transfer), el mdulo


de marcado de eventos genera dos eventosdetipoOCCURRENCE,unoparaapresaday
otroparaadquirindola.
Luego, el mdulo de marcado de Links crea un link de tipo TLINK de subtipo
BEFOREdenotandoqueeleventodeapresadasucediantesqueeldeadquirindola.
Este tipo de informacin semntica est modelada por las relaciones entre frames
de FrameNet. En este caso particular es la relacin Precedes que indica que el frame
Pre_transfersucedeantesqueelframeTransfer.

96
Las anotaciones TimeML mencionadas en el ltimo ejemplo quedan del siguiente
modoeneltexto:

Testimonio de Ignacio de Ezaurdi: refiere que la lancha que ha sido propiedad de don F.
Biscaya fue <EVENT eid="e1" class="OCCURRENCE">apresada</EVENT> junto a otras
en lo arroyos de Gualeguay por el Cte Samaniego. Fue rematada <EVENT eid="e2"
class="OCCURRENCE">adquirindola</EVENT> Don Antonio del Texo. 29 de agosto de
1814.

<MAKEINSTANCEeiid="ei1"eventID="e1"/>
<MAKEINSTANCEeiid="ei2"eventID="e2"/>
<TLINKeventInstanceID="ei1"relatedToEvent="ei2"relType="BEFORE"/>

97
8.Conclusiones

La hiptesis que se planteo para esta tesis es que la informacin temporal se


manifiesta en el plano semntico y, por lo tanto, al usar informacin semntica para su
deteccinsepuedenlograrmejoresresultados.

Para probar esta hiptesis, su us la informacin semntica brindadaporFrameNet


dando muy buenos resultados, adems de mostrar unenfoquedistintoparaunatareaen la
que hasta el momento se usaron herramientas de reglas fijas o bien basadas en la
informacin morfosintctica del texto. Estos enfoques, si bien llegan a buenos resultados,
muchas veces consideran pocos casos o dejan de lado muchas entidades y relaciones
temporales debido a que los conceptos temporales tienen una complejidad conceptual que
noescorrectamenterepresentadaenelnivelmorfolgicoosintctico.

Para el caso particular de los textos histricos, al poder contextualizar


temporalmente los textos, permite que una herramienta de digitalizacin automtica trate
con precisin ciertos trminos del texto haciendo que disminuya el error y haciendo ms
rpida la tarea del revisor humano. Por ejemplo, si la referida herramienta de digitalizacin
detecta que una palabra puede ser Pavn o Pern, mediante la contextualizacin
histrica podra determinar en forma precisa con Pavn situando el texto enelperiodode
septiembre de 1861. Este es un ejemplo simple, pero se puede aplicar tambin para
modismosoformasdepalabrasquecambiaronsusintaxisconeltiempo.

Adems, la deteccin de informacin temporal en textos histricos, crea la


posibilidad de indexar estas bases de datos de textos histricos usando informacin
temporal. De este modo se le da al investigador una herramienta mucho ms poderosa en
elmomentodeconsultaryrelacionarhechoshistricos.

Otra conclusin importante, es que este enfoque genera modelos de deteccin de
informacin temporal que no estn atados al idioma en el que est redactado el texto en
cuestin. Adems, permite que diferentes avances en el rea de anotacin semntica en
diferentes lenguajes (creacin de corpus, anotacin automtica, etc.) colaboren para
mejorarelresultadodelasideasaplicadasenestatesis.

98
9.Trabajofuturo

En este trabajo se demostr que eluso deinformacinsemnticaparaladeteccin


de informacin temporal es una alternativa posible, el trabajo a futuro puede enfocarse en
dosgrandesejes.
El primero, y ms importante, es la necesidad de aumentar la cantidad de recursos
semnticos disponibles en la comunidad. Los resultados deestatesisdemuestranquevale
la pena dedicar tiempo al desarrollo y/o mejora de anotadores automticos semnticos
tales como SEMAFOR, LTH, Shalmaneser, TARSQI, etc. Siguiendo esta lnea, es
importante aumentar la dimensin y lacoberturadecorpusrelacionadosconlasemnticae
informacin temporal como Propbank, FrameNet, FrameNet en otros idiomas, TimeBank,
etc. Toda mejora e innovacin en este tipo de recursos, impactarn positivamente en los
resultadosobtenidosenestetrabajo.
Otro de los grandes ejes de trabajo futuro es el de la profundizacin del anlisis
temporal de los textos histricos. Dentro de esta tarea se pueden incluir el desarrollo de
herramientas de precisin de trminos basadas enelperiodohistricoenelqueseubicael
texto. Otro anlisis posible,eslaindexacindetextoshistricosbasndoseensu contenido
temporalparafacilitarsuconsulta.

99
10.Referencias

[ALEMBIC01]MaxPlanckInstituteforPsycholinguistics(2012,January11th).Alembic
Workbench.TheLanguageArchive,MaxPlanckInstituteforPsycholinguistics,
https://tla.mpi.nl/tools2/tooltype/annotation/alembicworkbench2/,Accedido03/11/2015

[ALLEN01]Allen,J.,Manshadi,M.,Dzikovska,M.,&Swift,M.(2007,June).Deeplinguistic
processingforspokendialoguesystems.ProceedingsoftheWorkshoponDeepLinguistic
Processing.AssociationforComputationalLinguistics.4956.

[ALLEN02]Allen,J.F.,Swift,M.,&DeBeaumont,W.(2008,September).Deepsemantic
analysisoftext.Proceedingsofthe2008ConferenceonSemanticsinTextProcessing.
AssociationforComputationalLinguistics.343354

[ALLEN03]Allen,J.F.,&Ferguson,G.(1994).Actionsandeventsinintervaltemporallogic.
Journaloflogicandcomputation,4(5),531579.

[ALLEN04]Allen,J.F.(1983).MaintainingknowledgeabouttemporalIntervals.
CommunicationsoftheACM,26(11),832843.

[AONE01]Aone,C.,&RamosSantacruz,M.(2000,April).REES:alargescalerelationand
eventextractionsystem.ProceedingsofthesixthconferenceonAppliednaturallanguage
processing.AssociationforComputationalLinguistics.7683.

[BAKER01]CollinF.Baker,CharlesJ.Fillmore,andJohnB.Lowe.(1998).TheBerkeley
FrameNetproject.ProceedingsoftheCOLINGACL1998,Montreal,Canada.

[BETHARD01]Bethard,S.,&Martin,J.H.(2006,July).Identificationofeventmentionsand
theirsemanticclass.Proceedingsofthe2006ConferenceonEmpiricalMethodsinNatural
LanguageProcessing.AssociationforComputationalLinguistics.146154

[BITTAR01]Bittar,A.,Amsili,P.,Denis,P.,&Danlos,L.(2011).FrenchTimeBank:an
ISOTimeMLannotatedreferencecorpus.Proceedingsofthe49thAnnualMeetingofthe
AssociationforComputationalLinguistics(shortpapers).130134.

[BOGURAEV01]Boguraev,Branimir,&RieKubotaAndo.(2007).EffectiveuseofTimeBank
forTimeMLanalysis.Annotating,extractingandreasoningabouttimeandevents.Springer
BerlinHeidelberg.4158.

[BRANTS01]Brants,T.&O.Plaehn.(2000).InteractiveCorpusAnnotation.Proceedingsof
LREC2000.

[BRFRAMENET01]UniversidadFederalJuizdeFora.(2009).FrameNetBrasil.Laboratorio
deLexicografaComputacional,UniversidadFederalJuizdeFora.
http://www.ufjf.br/framenetbr/,Accedido12/03/2016

100

[CASELLI01]Caselli,T.,Lenzi,V.B.,Sprugnoli,R.,Pianta,E.,&Prodanof,I.(2011,June).
AnnotatingEvents,TemporalExpressionsandRelationsinItalian:theItTimemlExperience
fortheItaTimeBank.InLinguisticAnnotationWorkshop.143151.

[CHOMSKY01]NoamChomsky.(1965).AspectsoftheTheoryofSyntax.MITPress,
Cambridge.

[CHRISHOLM01]Chisholm,C.R.(1967).ArticleonIntentionality.P.Edwards(ed.),The
EncyclopediaofPhilosophy.

[COLLINS01]Collins,Michael.(1999).HeadDrivenStatisticalModelsforNaturalLanguage
Parsing.Ph.D.thesis,UniversityofPennsylvania,Philadelphia.

[CONGMIN01]Min,C.,Srikanth,M.,&Fowler,A.(2007,June).LCCTE:ahybridapproach
totemporalrelationidentificationinnewstext.Proceedingsofthe4thInternational
WorkshoponSemanticEvaluations.AssociationforComputationalLinguistics.219222.

[COOK01]Cook,RoyT.(2009).IntensionalDefinition.InADictionaryofPhilosophicalLogic.
Edinburgh:EdinburghUniversityPress.155.

[CORTES01]Cortes,C.,&Vapnik,V.(1995).Supportvectornetworks.Machine
learning,20(3),273297.

[DAVIS01]AnthonyDavis.(2001).LinkingbyTypesintheHierarchicalLexicon.CSLI
Publications,Stanford.

[DIK01]SimonC.Dik.(1987).Conceptsofcase.ChapterSomePrinciplesofFunctional
Grammar.Number3.GunterNarrVerlagTubingen.

[DILLON01]G.L.Dillon.(1977)IntroductiontoContemporaryLinguisticSemantics.
PrenticeHall,NewJersey.

[DIPAJAN01]Das,Dipajan.,Schneider,N.,Chen,D.,&Smith,N.A.(2010).SEMAFOR1.0:
Aprobabilisticframesemanticparser.LanguageTechnologiesInstitute,SchoolofComputer
Science,CarnegieMellonUniversity.

[DOWTY01]DavidDowty.(1991).Thematicprotorolesandargumentselection.Language,
67(3):547619.

[ERK01]Erk,K.,&Pado,S.(2006).Shalmaneseratoolchainforshallowsemanticparsing.
ProceedingsofLREC(Vol.6).

[ERK02]Erk,K.,Kowalski,A.,Pado,S.,&Pinkal,M.(2003)Towardsaresourceforlexical
semantics:AlargeGermancorpuswithextensivesemanticannotation.Proceedingsof
ACL03,Sapporo.

101

[FERRO01]Ferro,L.,Mani,I.,Sundheim,B.&Wilson,G.(2001).TIDESTemporal
AnnotationGuidelines.Version1.0.2MITRETechnicalReport,MTR01W0000041

[FILATOVA01]Filatova,E.,&Hovy,E.(2001,July).Assigningtimestampstoeventclauses.
ProceedingsoftheworkshoponTemporalandspatialinformationprocessingVolume13..
AssociationforComputationalLinguistics.13.

[FILLMORE01]Fillmore,CharlesJ,&Baker,C.(2010).Aframesapproachtosemantic
analysis.TheOxfordhandbookoflinguisticanalysis,313339.

[FILLMORE02]Fillmore,CharlesJ.(1982).Framesemantics:Linguisticsinthemorning
calm.111137.

[FILLMORE03]Fillmore,CharlesJ.(1976).Framesemanticsandthenatureoflanguage*.
AnnalsoftheNewYorkAcademyofSciences280.1:2032.

[FILLMORE04]Fillmore,CharlesJ.(1968).Thecaseforcase.InBachandHarms,editors,
UniversalsinLinguisticTheory.Holt,Rinehart,andWinston,NewYork.188.

[FILLMORE05]Fillmore,CharlesJ.(1985).Framesandthesemanticsofunderstanding.
QuadernidiSemantica,6.2:222254.

[FRAMENET01]FrameNetProject.(1997).FrameIndex.FrameNetProject,International
ComputerScienceInstitute,Berkeley,California.
https://framenet.icsi.berkeley.edu/fndrupal/frameIndex,Accedido09/03/2016

[FRAMENET02]FrameNetProject.(1997).FrameGrapher.FrameNetProject,International
ComputerScienceInstitute,Berkeley,California.
https://framenet.icsi.berkeley.edu/fndrupal/index.php?q=FrameGrapher,Accedido
09/03/2016

[FRAWLEY01]W.Frawley.(1992).LinguisticSemantics.Hillsdale,NJ:LawrenceErlbaum
Associates.

[GAIZAUSKAS01]Gaizauskas,R.,&Wilks,Y.(1998).Informationextraction:Beyond
documentretrieval.Journalofdocumentation,54(1),70105.

[GRUBER01]JeffreyGruber.(1965).Studiesinlexicalrelations.PhDthesis,MIT.

[HE01]He,H.,&Garcia,E.A.(2009).Learningfromimbalanceddata.KnowledgeandData
Engineering,IEEETransactionson,21(9),12631284.

[ISO01]ISO8601:2004DataelementsandinterchangeformatsInformationinterchange
Representationofdatesandtimes.

102
[JACKENDOFF01]RayJackendoff.(1990).Semanticstructures.MITPress,Cambridge,
Massachusetts.

[JPNFRAMENET01]KeioUniversity.(2002).JapaneseFrameNetProject.KeioUniversity,
Japan.http://jfn.st.hc.keio.ac.jp/,Accedido12/03/2016

[JURAFSKY01]Gildea,D.,&Jurafsky,D.(2002).Automaticlabelingofsemanticroles.
Computationallinguistics,28(3),245288.

[KATZ01]Katz,G.,&Arosio,F.(2001,July).Theannotationoftemporalinformationin
naturallanguagesentences.ProceedingsoftheworkshoponTemporalandspatial
informationprocessingVolume13.AssociationforComputationalLinguistics.15.

[KIPPER01]Kipper,K.,Dang,H.T.,&Palmer,M.(2000,July).Classbasedconstructionof
averblexicon.InAAAI/IAAI.691696.

[KIPPER02]Kipper,K.,Korhonen,A.,Ryant,N.,&Palmer,M.(2006,June).Extending
VerbNetwithnovelverbclasses.ProceedingsofLRECVol.2006,No.2.2.1.

[LAFFERTY01]Lafferty,J.,McCallum,A.,&Pereira,F.C.(2001).Conditionalrandomfields:
Probabilisticmodelsforsegmentingandlabelingsequencedata.

[LEVIN01]Levin,B.(1993).Englishverbclassesandalternations:Apreliminary
investigation.Vol.348.Chicago:UniversityofChicagopress.

[LING01]Ling,X.,&Weld,D.S.(2010,March).TemporalInformationExtraction.AAAI,Vol.
10.13851390.

[LINKCRFSUITE1]Okazaki,N.(2011).CRFSuite.ElectricalEngineeringandApplied
Physics,Sendai,Japan.http://www.chokkan.org/software/crfsuite/,Accedido12/09/2015

[LINKLDC1]LinguisticDataConsortium.(1992).LinguisticDataConsortium.Universityof
Pennsylvania,USA.www.ldc.upenn.edu,Accedido12/09/2015

[LINKLTH1]LundUniversity.(2007).TheLTHSystemforFrameSemanticStructure
Extraction.Dept.ofComputerScience,LundUniversity,Sweden.
http://nlp.cs.lth.se/software,Accedido12/09/2015

[LINKSEMAFOR1]Das,D.,Thomson,S.,Kshirsagar,M.,Martins,A.,Schneider,N.,Chen,
D.,&Smith,N.(2010).SEMAFORSoftware.CarnegieMellonUniversity,Pittsburgh,USA.
http://www.ark.cs.cmu.edu/SEMAFOR,Accedido12/09/2015

[LINKSHAL1]UniversityofSaarlandes.(2007).Shalmaneser:AShallowSemanticParser.
ComputationalLinguisticsandPhonetics,UniversityofSaarlandes,Saarbrcken,Germany.
http://www.coli.unisaarland.de/projects/salsa/shal,Accedido12/09/2015.

103
[LLORENS01]Llorens,H.(2012).ASemanticApproachtoTemporalInformation
Processing.ProcesamientodelLenguajeNatural,48,115118.

[LLORENS02]Llorens,H.,Saquete,E.,&NavarroColorado,B.(2010,August).TimeML
eventsrecognitionandclassification:learningCRFmodelswithsemanticroles.Proceedings
ofthe23rdInternationalConferenceonComputationalLinguistics.Associationfor
ComputationalLinguistics.725733.

[LLORENS03]Llorens,H.,Navarro,B.,&Saquete,E.(2009).FromSemanticRolesto
TemporalInformationRepresentation.InMICAI2009:AdvancesinArtificialIntelligence.
SpringerBerlinHeidelberg.124135.

[LLORENS04]Llorens,H.,Navarro,B.,&Saquete,E.(2009,September).UsingSemantic
NetworkstoIdentifyTemporalExpressionsfromSemanticRoles.RANLP.219224.

[LONNEKER01]LnnekerRodman,B.,&Baker,C.F.(2009).TheFrameNetmodelandits
applications.NaturalLanguageEngineering,15(03),415453.

[MANI01]Mani,I.,Schiffman,B.,&Zhang,J.(2003,May).Inferringtemporalorderingof
eventsinnews.Proceedingsofthe2003ConferenceoftheNorthAmericanChapterofthe
AssociationforComputationalLinguisticsonHumanLanguageTechnology:companion
volumeoftheProceedingsofHLTNAACL2003shortpapersVolume2.Associationfor
ComputationalLinguistics.5557.

[MILLER01]Miller,GeorgeA.(1995).WordNet:alexicaldatabaseforEnglish.
CommunicationsoftheACM38.11.3941.

[PALMER01]Palmer,M.,Gildea,D.,&Kingsbury,P.(2005).Thepropositionbank:An
annotatedcorpusofsemanticroles.Computationallinguistics,31(1),71106.

[PIANTA01]Pianta,E.,Bentivogli,L.&Girardi,C.(2002).MultiWordNet.developingan
alignedmultilingualdatabase.Proceedingsofthe1stInternationalWordNetConference,
Mysore,India.

[POLLARD01]Pollard,C.,&Sag,I.A.(1994).Headdrivenphrasestructuregrammar.
UniversityofChicagoPress.

[PUSTEJOVSKY01]Pustejovsky,J.,Castano,J.M.,Ingria,R.,Sauri,R.,Gaizauskas,R.J.,
Setzer,A.,...&Radev,D.R.(2003).TimeML:Robustspecificationofeventandtemporal
expressionsintext.Newdirectionsinquestionanswering,3,2834.

[PUSTEJOVSKY02]Pustejovsky,J.,Hanks,P.,Sauri,R.,See,A.,Gaizauskas,R.,Setzer,
A.,...&Lazo,M.(2003,March).Thetimebankcorpus.Corpuslinguistics,Vol.2003.40.

[QUINLAN01]Quinlan,R.(2014).C5.0release2.07GPLEdition[software].DataMining
Tools,RuleQuestResearch,Australia.https://www.rulequest.com/download.html.Accedido

104
15/04/2016.

[RUPPENHOFER01]Ruppenhofer,J.,Ellsworth,M.,Petruck,M.R.,Johnson,C.R.,&
Scheffczyk,J.(2006).FrameNetII:Extendedtheoryandpractice.Berkeley,California,USA.

[SALTO01]UniversityofSaarlandes.(2007).TheSALSAtool[software].Computational
LinguisticsandPhonetics,UniversityofSaarlandes,Saarbrcken,Germany.
http://www.coli.unisaarland.de/projects/salsa/page.php?id=software

[SAURI01]Saurii,R.,Littman,J.,Knippen,B.,Gaizauskas,R.,Setzer,A.,&Pustejovsky,J.
(2005).TimeMLannotationguidelines.http://timeml.org/publications/specs.html,Accedido
13/04/2016.

[SAURI02]Saur,R.,Batiukova,O.,&Pustejovsky,J.(2009).AnnotatingEventsinSpanish.
TimeMLAnnotationGuidelines.VersionTempEval2010.

[SAURI03]Saur,R.,Knippen,R.,Verhagen,M.,&Pustejovsky,J.(2005,October).Evita:a
robusteventrecognizerforQAsystems.ProceedingsoftheconferenceonHuman
LanguageTechnologyandEmpiricalMethodsinNaturalLanguageProcessing.Association
forComputationalLinguistics.700707

[SCHILDER01]Schilder,F.,&Habel,C.(2001,July).Fromtemporalexpressionsto
temporalinformation:Semantictaggingofnewsmessages.Proceedingsoftheworkshopon
TemporalandspatialinformationprocessingVolume13.AssociationforComputational
Linguistics.9.

[SETZER01]Setzer,A.(2001).TemporalInformationinNewswireArticles:anAnnotation
SchemeandCorpusStudy,PhDdissertation,UniversityofSheffield.

[SETZER02]Setzer,A.,&Gaizauskas,R.(2001,July).Apilotstudyonannotatingtemporal
relationsintext.ProceedingsoftheworkshoponTemporalandspatialinformation
processingVolume13.AssociationforComputationalLinguistics.11.

[SUBIRATS01]SubiratsRggeberg.(2012)Laintegracindelasemnticademarcosyla
semnticadesimulacin:aplicacionesalprocesamientosemnticoautomticodelespaol.

[SUBIRATS02]SubiratsRggeberg,C.(2009).FrameNetEspaol:unanlisiscognitivodel
lxicodelespaol.Terminologaysociedaddelconocimiento.309320.

[SUBIRATS03]SubiratsRggeberg,C.&Petruck,M.R.L..(2003).Surprise:Spanish
FrameNet!InWorkshoponFrameSemantics,InternationalCongressofLinguists,Prague,
CzechRepublic.

[SWEFRAMENET01]Ahlberg,M.,Borin,L.,Dannlls,D.,Forsberg,M.,Gronostaj,M.T.,
Heppin,K.F.,Johansson,R.,Kokkinakis,D.,Olsson,L.&Uppstrm,J.(2011).Swedish
FrameNet++.UniversityOfGothenburg,Sweden.http://spraakbanken.gu.se/eng/swefn,

105
Accedido12/03/2016

[TERQAS01]TimeML.(2002).TimeandEventRecognitionforQuestionAnswering
Systems.ARDAWorkshoponAdvancedQuestionAnsweringTechnology.
http://www.timeml.org/terqas/index.html,Accedido12/09/2015

[TREEBANK01]UniversityofPennsylvania.(1992).PennTreeBank.LINCLaboratory,
ComputerandInformationScienceDepartment,UniversityofPennsylvania,USA.
http://www.cis.upenn.edu/~treebank/,Accedido12/09/2015

[UZZAMAN01]UzZaman,N.,&Allen,J.F.(2010,July).TRIPSandTRIOSsystemfor
TempEval2:Extractingtemporalinformationfromtext.Proceedingsofthe5thInternational
WorkshoponSemanticEvaluation.AssociationforComputationalLinguistics.276283.

[UZZAMAN02]UzZaman,N.,&Allen,J.F.(2010,May).TRIOSTimeBankCorpus:
ExtendedTimeBankCorpuswithHelpofDeepUnderstandingofText.LREC2010.

[VALIN01]VanValinJr,R.D.(2005).Exploringthesyntaxsemanticsinterface.Cambridge
UniversityPress.

[VERHAGEN01]Verhagen,M.,Mani,I.,Sauri,R.,Knippen,R.,Jang,S.B.,Littman,J.,...&
Pustejovsky,J.(2005,June).AutomatingtemporalannotationwithTARSQI.Proceedingsof
theACL2005onInteractiveposteranddemonstrationsessions.Associationfor
ComputationalLinguistics.8184.

[VOSSEN01]Vossen,P.(1999).EuroWordnetgeneraldocument(Version3Final).
UniversityofAmsterdam.EuroWordNetLE24003,LE48328.

[WILSON01]Wilson,G.,Mani,I.,Sundheim,B.,&Ferro,L.(2001,July).Amultilingual
approachtoannotatingandextractingtemporalinformation.Proceedingsoftheworkshopon
TemporalandspatialinformationprocessingVolume13.AssociationforComputational
Linguistics.12.

[WILSON02]Wilson,G.&Mani,I.,(2000,October).Robusttemporalprocessingofnews.
Proceedingsofthe38thAnnualMeetingonAssociationforComputationalLinguistics.
AssociationforComputationalLinguistics.6976.

[WONSEVER01]Wonsever,D.,Ros,A.,Malcuori,M.,Moncecchi,G.,&Descoins,A.
(2012).Eventannotationschemesandeventrecognitioninspanishtexts.InComputational
LinguisticsandIntelligentTextProcessing.SpringerBerlinHeidelberg.206218.

[WONSEVER02]Wonsever,D.,Malcuori,M.,&Ros,A.(2008).Sibila:esquemade
anotacindeeventos.TechnicalReport,BibliotecaInCoPEDECIBA.811

106
11.Apndices

ApndiceA:RelacionesentreFramesextradasdelcorpusdeFrameNet
conunaherramientaqueseconstruyespecialmenteparaestetrabajo

El motivode lacreacindeestaherramienta,fuequeeltipoderelacinentreframes
es una de las caractersticas usadas en el momento de entrenar el modelo declasificacin
deLINKs.

Relacin:Precedes
Later=Quitting,Earlier=Being_employed
Later=Being_employed,Earlier=Get_a_job
Later=Post_lose_possession,Earlier=Lose_possession
Later=Lose_possession,Earlier=Pre_lose_possession
Later=Activity_abandoned_state,Earlier=Activity_stop
Later=Activity_done_state,Earlier=Activity_finish
Later=Activity_resume,Earlier=Activity_paused_state
Later=Activity_stop,Earlier=Activity_ongoing
Later=Activity_finish,Earlier=Activity_ongoing
Later=Activity_paused_state,Earlier=Activity_pause
Later=Activity_pause,Earlier=Activity_ongoing
Later=Activity_ongoing,Earlier=Activity_start
Later=Activity_start,Earlier=Activity_ready_state
Later=Activity_ready_state,Earlier=Activity_prepare
Later=Post_giving,Earlier=Giving
Later=Giving,Earlier=Pre_giving
Later=Post_getting,Earlier=Getting
Later=Getting,Earlier=Pre_getting
Later=Post_transfer,Earlier=Transfer
Later=Transfer,Earlier=Pre_transfer
Later=Receiving,Earlier=Pre_receiving
Later=Post_receiving,Earlier=Receiving
Later=Bail_decision,Earlier=Entering_of_plea
Later=Entering_of_plea,Earlier=Notification_of_charges
Later=Altered_phase,Earlier=Change_of_phase
Later=Verdict,Earlier=Jury_deliberation
Later=Jury_deliberation,Earlier=Court_examination
Later=Change_of_state_endstate,Earlier=Event
Later=Event,Earlier=Change_of_state_initial_state
Later=Criminal_process,Earlier=Criminal_investigation
Later=Criminal_investigation,Earlier=Committing_crime
Later=Arriving,Earlier=Departing
Later=Sentencing,Earlier=Trial
Later=Trial,Earlier=Arraignment

107
Later=Arraignment,Earlier=Arrest
Later=Success_or_failure,Earlier=Attempt
Later=Getting_up,Earlier=Being_awake
Later=Waking_up,Earlier=Sleep
Later=Sleep,Earlier=Fall_asleep
Later=Being_awake,Earlier=Waking_up
Later=Fall_asleep,Earlier=Being_awake
Later=Process_continue,Earlier=Process_resume
Later=Process_resume,Earlier=Process_stopped_state
Later=Process_stopped_state,Earlier=Process_stop
Later=Process_stop,Earlier=Process_continue
Later=Process_start,Earlier=Process_initial_state
Later=Process_continue,Earlier=Process_start
Later=Process_end,Earlier=Process_continue
Later=Process_completed_state,Earlier=Process_end
Later=Meet_with,Earlier=Assemble
Later=Labor_product,Earlier=Text
Later=Death,Earlier=Being_born
Later=Dying,Earlier=Being_born
Later=Dying,Earlier=Birth
Later=Death,Earlier=Birth
Later=Death,Earlier=Dying
Later=Existence,Earlier=Coming_to_be
Later=Out_of_existence,Earlier=Ceasing_to_be
Later=Ceasing_to_be,Earlier=Existence
Later=Resolve_problem,Earlier=Confronting_problem
Later=Repel,Earlier=Invading
Later=Conquering,Earlier=Invading
Later=Employment_end,Earlier=Employment_continue
Later=Employment_continue,Earlier=Employment_start
Later=Firing,Earlier=Employing
Later=Employing,Earlier=Hiring
Later=Visit_host_departure,Earlier=Visit_host_stay
Later=Visit_host_stay,Earlier=Visit_host_arrival
Later=Visiting_scenario_departing,Earlier=Visiting_scenario_stay
Later=Visiting_scenario_stay,Earlier=Visiting_scenario_arrival
Later=Visitor_departure,Earlier=Visiting
Later=Visiting,Earlier=Visitor_arrival
Later=Hit_or_miss,Earlier=Aiming
Later=Placing,Earlier=Removing
Later=Process_stopped_state,Earlier=Process_pause
Later=Process_pause,Earlier=Process_continue
Later=Process_uncompleted_state,Earlier=Process_stop
Later=Activity_paused_state,Earlier=Activity_stop
Later=Activity_ongoing,Earlier=Activity_resume

108
Relacin:Causative_of
Inchoative/state=Getting,Causative=Giving
Inchoative/state=Being_dry,Causative=Cause_to_be_dry
Inchoative/state=Corroding,Causative=Corroding_caused
Inchoative/state=Make_noise,Causative=Cause_to_make_noise
Inchoative/state=Process_end,Causative=Cause_to_end
Inchoative/state=Ground_up,Causative=Grinding
Inchoative/state=Purpose,Causative=Eventive_cognizer_affecting
Inchoative/state=Leadership,Causative=Change_of_leadership
Inchoative/state=Posture,Causative=Change_posture
Inchoative/state=Being_in_operation,Causative=Change_operational_state
Inchoative/state=Fluidic_motion,Causative=Cause_fluidic_motion
Inchoative/state=Eclipse,Causative=Hiding_objects
Inchoative/state=Take_place_of,Causative=Replacing
Inchoative/state=Expansion,Causative=Cause_expansion
Inchoative/state=Amalgamation,Causative=Cause_to_amalgamate
Inchoative/state=Come_together,Causative=Gathering_up
Inchoative/state=Being_obligated,Causative=Imposing_obligation
Inchoative/state=Progress,Causative=Cause_to_make_progress
Inchoative/state=Becoming_detached,Causative=Detaching
Inchoative/state=Death,Causative=Killing
Inchoative/state=Change_of_phase,Causative=Cause_change_of_phase
Inchoative/state=Become_silent,Causative=Silencing
Inchoative/state=Being_named,Causative=Name_conferral
Inchoative/state=Undergo_change,Causative=Cause_change
Inchoative/state=Process_start,Causative=Cause_to_start
Inchoative/state=Change_of_consistency,Causative=Cause_change_of_consistency
Inchoative/state=Emanating,Causative=Emitting
Inchoative/state=Inchoative_attaching,Causative=Attaching
Inchoative/state=Change_position_on_a_scale,
Causative=Cause_change_of_position_on_a_scale
Inchoative/state=Inchoative_change_of_temperature,
Causative=Cause_temperature_change
Inchoative/state=Absorb_heat,Causative=Apply_heat
Inchoative/state=Moving_in_place,Causative=Cause_to_move_in_place
Inchoative/state=Proliferating_in_number,Causative=Cause_proliferation_in_number
Inchoative/state=Perception_body,Causative=Cause_bodily_experience
Inchoative/state=Breaking_apart,Causative=Cause_to_fragment
Inchoative/state=Rotting,Causative=Cause_to_rot
Inchoative/state=Used_up,Causative=Exhaust_resource
Inchoative/state=Perception_experience,Causative=Cause_to_perceive
Inchoative/state=Experiencer_focus,Causative=Cause_emotion
Inchoative/state=Process_resume,Causative=Cause_to_resume
Inchoative/state=Being_wet,Causative=Cause_to_be_wet
Inchoative/state=Process_pause,Causative=Interrupt_process
Inchoative/state=Becoming_separated,Causative=Separating

109
Inchoative/state=Success_or_failure,Causative=Thwarting
Inchoative/state=State_continue,Causative=Cause_to_continue
Inchoative/state=Process_continue,Causative=Cause_to_continue
Inchoative/state=Being_at_risk,Causative=Endangering
Inchoative/state=Recovery,Causative=Cure

Relacin:Inchoative_of
Stative=Remembering_information,Inchoative=Memorization
Stative=Membership,Inchoative=Becoming_a_member
Stative=Getting,Inchoative=Possession
Stative=Dead_or_alive,Inchoative=Death
Stative=Awareness,Inchoative=Coming_to_believe
Stative=Existence,Inchoative=Coming_to_be
Stative=Personal_relationship,Inchoative=Forming_relationships
Stative=Being_up_to_it,Inchoative=Rising_to_a_challenge
Stative=Being_detached,Inchoative=Becoming_detached
Stative=Process_continue,Inchoative=Process_start
Stative=Temperature,Inchoative=Inchoative_change_of_temperature
Stative=Being_attached,Inchoative=Inchoative_attaching
Stative=Position_on_a_scale,Inchoative=Change_position_on_a_scale
Stative=Aggregate,Inchoative=Come_together
Stative=Altered_phase,Inchoative=Cause_change_of_phase
Stative=Shapes,Inchoative=Go_into_shape

Relacin:Subframe
Component=Removing,Complex=Cause_motion
Component=Placing,Complex=Cause_motion
Component=Activity_resume,Complex=Activity
Component=Success_or_failure,Complex=Attempting_scenario
Component=Attempt,Complex=Attempting_scenario
Component=Being_awake,Complex=Sleep_wake_cycle
Component=Getting_up,Complex=Sleep_wake_cycle
Component=Halt,Complex=Motion
Component=Quitting_a_place,Complex=Intentional_traversing
Component=Getting_underway,Complex=Motion
Component=Setting_out,Complex=Travel
Component=Arriving,Complex=Traversing
Component=Departing,Complex=Traversing
Component=Quitting_a_place,Complex=Self_motion
Component=Having_commercial_agreement,Complex=Commerce_scenario
Component=Commercial_transaction,Complex=Commerce_scenario
Component=Altered_phase,Complex=Change_of_phase_scenario
Component=Change_of_phase,Complex=Change_of_phase_scenario
Component=Post_receiving,Complex=Receiving_scenario
Component=Receiving,Complex=Receiving_scenario
Component=Pre_receiving,Complex=Receiving_scenario

110
Component=Post_getting,Complex=Getting_scenario
Component=Getting,Complex=Getting_scenario
Component=Pre_getting,Complex=Getting_scenario
Component=Post_transfer,Complex=Transfer_scenario
Component=Transfer,Complex=Transfer_scenario
Component=Pre_transfer,Complex=Transfer_scenario
Component=Post_giving,Complex=Giving_scenario
Component=Giving,Complex=Giving_scenario
Component=Pre_giving,Complex=Giving_scenario
Component=Firing,Complex=Employer's_scenario
Component=Employing,Complex=Employer's_scenario
Component=Hiring,Complex=Employer's_scenario
Component=Quitting,Complex=Employee's_scenario
Component=Being_employed,Complex=Employee's_scenario
Component=Get_a_job,Complex=Employee's_scenario
Component=Employment_end,Complex=Employment_scenario
Component=Employment_continue,Complex=Employment_scenario
Component=Employment_start,Complex=Employment_scenario
Component=Court_examination,Complex=Trial
Component=Being_born,Complex=Cycle_of_life_and_death
Component=Death,Complex=Cycle_of_life_and_death
Component=Dead_or_alive,Complex=Cycle_of_life_and_death
Component=Out_of_existence,Complex=Cycle_of_existence_scenario
Component=Ceasing_to_be,Complex=Cycle_of_existence_scenario
Component=Existence,Complex=Cycle_of_existence_scenario
Component=Coming_to_be,Complex=Cycle_of_existence_scenario
Component=Repel,Complex=Invasion_scenario
Component=Invading,Complex=Invasion_scenario
Component=Conquering,Complex=Invasion_scenario
Component=Food_gathering,Complex=Agriculture
Component=Planting,Complex=Agriculture
Component=Hunting,Complex=Hunting_scenario
Component=Hunting_success_or_failure,Complex=Hunting_scenario
Component=Committing_crime,Complex=Crime_scenario
Component=Criminal_investigation,Complex=Crime_scenario
Component=Criminal_process,Complex=Crime_scenario
Component=Have_visitor_over,Complex=Receive_visitor_scenario
Component=Drop_in_on,Complex=Visit_host
Component=Visit_host_departure,Complex=Visitor_and_host
Component=Visit_host_stay,Complex=Visitor_and_host
Component=Visit_host_arrival,Complex=Visitor_and_host
Component=Visiting_scenario_stay,Complex=Visiting_scenario
Component=Visiting_scenario_departing,Complex=Visiting_scenario
Component=Visiting_scenario_arrival,Complex=Visiting_scenario
Component=Visitor_departure,Complex=Visitor_scenario
Component=Visiting,Complex=Visitor_scenario

111
Component=Visitor_arrival,Complex=Visitor_scenario
Component=Historic_event,Complex=Individual_history
Component=Hit_or_miss,Complex=Attempt_distant_interaction_scenario
Component=Aiming,Complex=Attempt_distant_interaction_scenario
Component=Purpose,Complex=Attempting_scenario
Component=Causation,Complex=Causation_scenario
Component=Jury_deliberation,Complex=Trial
Component=Verdict,Complex=Trial
Component=Impact,Complex=Cause_impact
Component=Sleep,Complex=Sleep_wake_cycle
Component=Process_stopped_state,Complex=Process
Component=Process_stop,Complex=Process
Component=Process_start,Complex=Process
Component=Process_resume,Complex=Process
Component=Process_initial_state,Complex=Process
Component=Process_end,Complex=Process
Component=Process_continue,Complex=Process
Component=Commerce_goodstransfer,Complex=Commercial_transaction
Component=Commerce_moneytransfer,Complex=Commercial_transaction
Component=Lose_possession,Complex=Lose_possession_scenario
Component=Pre_lose_possession,Complex=Lose_possession_scenario
Component=Post_lose_possession,Complex=Lose_possession_scenario
Component=Arrest,Complex=Criminal_process
Component=Change_of_state_endstate,Complex=Change_of_state_scenario
Component=Change_of_state_initial_state,Complex=Change_of_state_scenario
Component=Event,Complex=Change_of_state_scenario
Component=Activity_start,Complex=Activity
Component=Activity_paused_state,Complex=Activity
Component=Activity_done_state,Complex=Activity
Component=Activity_abandoned_state,Complex=Activity
Component=Activity_stop,Complex=Activity
Component=Activity_pause,Complex=Activity
Component=Activity_prepare,Complex=Activity
Component=Activity_ready_state,Complex=Activity
Component=Waking_up,Complex=Sleep_wake_cycle
Component=Process_completed_state,Complex=Process
Component=Activity_ongoing,Complex=Activity
Component=Activity_finish,Complex=Activity
Component=Building_subparts,Complex=Buildings
Component=Fall_asleep,Complex=Sleep_wake_cycle
Component=Entering_of_plea,Complex=Arraignment
Component=Notification_of_charges,Complex=Arraignment
Component=Bail_decision,Complex=Arraignment
Component=Trial,Complex=Criminal_process
Component=Arraignment,Complex=Criminal_process
Component=Sentencing,Complex=Criminal_process

112
Component=Precipitation,Complex=Weather
Component=Finish_competition,Complex=Competition
Component=Process_pause,Complex=Process
Component=Process_uncompleted_state,Complex=Process

ApndiceB:CausajudicialpordesembargodelaGoletaNuestraSeora
delaCandelaria(18121816)

Transcripcindeloscopetesquedescribenalosdocumentoshistricos
correspondientesalarchivoCausajudicialpordesembargodelaGoletaNuestraSeorade
laCandelaria(18121816)quesuministrelInstitutodeHistoriaArgentinayAmericanaDr.
EmilioRavignaniyqueseusaronenlapresentetesis:

Expediente instruidoconmotivodelacaptura deunnavo queparticip delas


actividades de corso en el Ro de la Plata durante la guerra de la
independenciaylasdisputasentornoasupropiedad.

Documento2.ElGobiernoSuperiorProvicionaldelasProvinciasUnidasdelRiodelaPlata
concedelicenciadenavegacinytrficoalaGoletaNuestraSeoradelaCandelaria,
desdelosCabosdeSanAntonioySantaMarahastaelinteriordelRiodelaplata.Buenos
Aires1defebrerode1812.

Documento3.AntonioBiscayaalSuperiorGobierno:solicitaselerestituyalagoletadesu
propiedadquefueapropiadaporlasfuerzasmilitaresdeGualeguaychu.Resealas
peripeciasdesuviaje.Sinfecha.

Documento4.DictamendelAsesortitulardesestimandoelpedidopueslagoletafue
apresadaconotrosbuquesarmadosquehostilizabanlascostasentrerrianasdelas
ProvinciasUnidas.BuenosAires,29dejuliode1814.

Documento5.InformesobrelacargadelBuqueNuestraSeoradelRosario.BuenosAires,
6deagostode1814.

Documento6.EntregadelbuquealDonPabloJosdeEzeizaeinventariodelanave.
BuenosAires,8deagostode1814.

Documento7.DeclaracindeJuanPereyraViana.BuenosAires,13demarzode1813.

Documento8.DeclaracindePedroPascualDelgado,BuenosAires,31demarzode
1813.

Documento9.DeclaracindeHilarioAvalos.BuenosAires,2deabrilde1813.

113
Documento10.PresentacindeFranciscodeSalezNuez:Sealaqueeselunico
propietariotantodelbuquecomodelacargaembargados.Mencionasusserviciosala
revolucinylosperjuiciosquehasufirdo.Solicitasecitentestigospararecabartestimonios.

Documento11.Sealaqueeselunicopropietariotantodelbuquecomodelacarga
embargados.Mencionasusservicisoalarevolucinylosperjuiciosquehasufirdo.Solicita
secitentestigospararecabartestimonios.

Documento12.RequerimientodeJulindeGregorioEspinsoa:solicitaseleentregueel
cargamentodecuerosquelefueronremitidosenlalanchaNuestraSeoradela
Candelaria.Sinfecha.

Documento13.EscritopresentadoporFranciscodeSalesNuez:Reiteralasolicitudde
restitucindedelBuqueysucargamentoporserdesupropiedad.yconsideraquedebe
tomarposesindelosmismoshastatantoseresuelvalacausajudicial.Sinfecha.

Documento14.TestimoniodeIgnaciodeEzaurdi:refierequelalanchaquehasido
propiedaddedonF.BiscayafueapresadajuntoaotrasenloarroyosdeGualeguayporel
CteSamaniego.FuerematadaadquirindolaDonAntoniodelTexo.29deagostode1814.

Documento15.PresentacindeFranciscodeSalezNuez:reiterasurequerimientodeque
lesearestituidosubuqueycargamento.Alegasusservicosalacausarevolucionario,la
prisinsufridaenMontevideo.RecusaalasesorletradoAngelMarinaodeElaqueentiende
enlacausa.BuenosAires,1desetiembrede1814

Documento16.SeadmitelarecusacinysenombraaAsesorGeneralaFlixFras.
BuenosAires,2desetiembrede1814.

Documento17.DeclaracindeIgnaciodeElzuardi.BuenosAires,24desetiembrede
1814.

Documento18.DeclaracindeFranciscoVillaris.BuenosAires,24desetiembrede1814.

Documento19.DeclaracindeFelizardoFernndez.BuenosAires,24desetiembrede
1814.

Documento20.DeclaracindeFranciscoMartnezdeHaedo.BuenosAires,27de
setiembrede1814.

Documento21.DeclaracindeJuanCarlosWright,TteCnldelescuadrndemilicias
regladasdelGualeguay.BuenosAires,27desetiembrede1814.

Documento22.DictamendelAsesorFraspidiendosedeaudienciaalreclamante
FranciscodeSalesNuezysepaseelexpedientealGobernadorIntentendenteparaque
resuelvaydecuentadesuresolucin.BuenosAires,14deoctubrede1914

114
Documento23.PresentacindeFranciscodeSalesNuez.hacereferenciaalembargode
partedelacargadelbuque.Manifiestasudisposicinapagarunafianzaporsuvalorpara
queseleentreguelacargayprotestaporlosperjuiciosquesufre.BuenosAires,20de
octubrede1814.

Documento24.PresentacindelosapresadoresdelaGoletaNuestraSeoradelRosario
JosGutirrez,JosGregorioSamaniego,JosIgnacioGonzlez,JosMarcelinoPelez,
PabloJosLen,NazarioGmez,FelipeRodrguezyJosElasPealvaconfiriendopoder
aPabloJosdeEzeizaenlademandaycobrodelamencionadagoletaquebajocoaccin
fueronobligadosavenderaDonAntonioTexo.AunqueselahabancedidoyaaEzeyza
debieronentregarselaalmencionadoTexoportemordelosjefesdequienesvena
recomendado(JosArtigasyOtorgues).AsimismofacultamosaEzeizaparaqueanule
aquelactoyaccioneenrepresentacindesuspersonaseneljuicio.16deagostode1814.

Documento25.PresentacindePabloJosdeEzeizaalGobernadorIntendente:presenta
poderysolicitaselereconozcacomopartelegtimaenlacausa

Documento26.PresentacindeIsabeldeAlzagaalSupremoDirector.Siendoesposa
legtimadeAngleMarianoElasolicitaselerestituyanlasmarquetasdeseboyotros
efectossesehallabanenlaGoletaNuestraSeoradelRosairo.Dichosefectosfueron
sustraidosdesuestanciaylasmarquetasllevanlamarcadesupropiedad.

Documento27.PedroJosedeElaaAntonioTexo:Sehacereferenciaalaventadeunos
efectos.

Documento28.PresentacindeFranciscoPaulinodeSalesNuez.Presentadocumento
quecertificalaventadecuerosymarquetasdeseboporpartedeAngelMarianoElaa
AntonioJosTexoyquepruebalalegitimaposesinquetienedeesosyotrosefectos.S/f.

Documento29.EscritodeIsabeldeAlzagaennobredesumaridoAngelMarianoElaal
SupremoDirector:Manifiestaquenadiehatenidofacultaddehacerlasventasmencionadas
porTexonisumaridohacomunicadoordenparaellas.Accedeaqueseleentreguenesos
efectosaNuezbajofianzayencalidadderesponderdesuvaloralosprecioscorrientes
siemprequesejustifiquelasustraccindelamarquetas.

Documento30.DecretodelGobernadorIntendentedisponiendolaentregadelosefectos
embargadosaFranciscoPaulinodeSalesNuez.BuenosAires,22denoviembrede1814.

Documento31.PresentacindeFranciscoPaulinodeSalesNuezalGobernador
Intendente:Presentafianzaparaqueseleentreguenlosefectosembargadossegunlo
dispuestoporelDecretodel22denoviembre.BuenosAires,23denoviembrede1814.

Documento32.FranciscoPaulinodeSalesNuezcertificaanteelEscribanoMayorde
GobiernolarecepcindelosefectossegnlodispuestoporelGobernadorIntendente.
BuenosAires,26denoviembrede1814.

115
Documento33.RequerimientodelComandanteGregorioSamaniego:Manifiestaquela
goletaapresadaenunhechodearmasfuelegitimamentesubastadadeacuerdoconlos
interesados,ylicitamenteadquiridaporelcomprador.Objetapresentacioneshechasenla
causaysolicitaseintimeaFranciscoPaulinodeSalesNuezparaqueleaboneelvalorde
dichaembarcacinparaaliviarlasnecesidadesqueestatravesando.Mencionasu
servicios.CampamentodelTala,noviembre21de1814.

Documento34.FranciscoPaulinodeSalesNuezconfierepoderaJulinGregorio
Espinosaparaquelorepresenteentodotipodeoperacionescomerciales,antelos
tribunalesyenespecialenlacausaquesesigueporlagoletaNuestraSeoradelRosario
conocidatambinpordelaCandelariaodeBiscaya.BuenosAires,23dediciembrede
1814.

Documento35.PresentacindeJulindeGregorioEspinosa,apoderadodeFrancisco
PaulinodeSalesNuez:solicitasehagacomparecerenlacausaaAntonioJosdelTexoa
quiensupoderdanteacompradoelbuque.BuenosAires,4demarzode1815.

Documento36.PresentacindelCnldemiliciasPabloEzeizaalGobernadorIntendente:
Manifiestaquehabiendoreclamdoelbuquebajolapersoneradelosvecinosde
Gualeguaychuquelohabanapresadoyselohabancedido,conelpoderdelosmismos
impugnolaventaquedelbuquehabiahechoAntonioJosdelTExoaPaulinodeSales
Nuezporhaberloaquelcompradoconviciosdenotorianulidad.Vistaslascomplicaciones
deljuicioylosperjuiciosquesufreadmitequelalanchapaseapoderdeSalesNuezen
lasmismascondicionesyresponsabilidadesquelaposeeactualmentel,hastala
resolucindelacausa.

Documento37.PresentacindeAntonioJosdelTexoalGobernadorIntendente.
DesestimalasolicituddeFranciscoPaulinodeSalesNuezenquesolicitarespondaporel
despojodequesesientevictimaporpartedePabloJosedeEzeiza.BuenosAires,11de
mayode1815.

Documento38.DecretodelGobernadorIntendenteJosMaraSoler:Ordenalarestitucin
bajoinventariolalancaNuestraSeoradelRosarooCandelariaaFranciscoPaulinode
SalesNuez,aqueinsereservadederechoparaquecontraquienpuedaydebaaccione
porlosdaosyperjuicioscausadosporelembargodedichobuque.BuenosAires,11de
mayode1815.

Documento39.FranciscoSalezNuezrevocaelpoderconferidoaJulinGregorio
EspinosayloconfiereaAntonioJosdelTexoparaquelorepresenteenlacausacivilque
tienependienteanteelGobernadorIntendentecontraPabloJosdeEzeizaporlos
perjuiciossufridoscomoconsecuenciadelembargodelalanchaNuestraSeoradela
Candelariaysucargamento.BuenosAires,29deabrilde1815.

Documento40.AntonioJosdelTexoalGobernadorIntendente:Comoapoderadode
FranciscodeSalezNuez,solicitaordenealCapitandelpuertoMartnThompsonle

116
entreguelaembarcacindeacuerdoaloresueltoporelGobernadorIntendente.Buenos
Aires,13demayode1815.

Documento41.ManuelMutisalCapitndelPuerto:Comunicaentregadelaembarcacin
coninventarioaAntonioJosdelTexo.BuenosAires,15demayode1815.

Documento42.Certificacindelosmaestrosmayorescalafatesycarpinterosdelpuerto
porordendelCapitnMartnThompsonyasolicituddeAntonioJosdelTexosobreel
estadodelagoleta.Informanquelaembarcacinnoestencondicionesdenavegar.
Detallanlasrefaccionesnecesariasysucosto.BuenosAires,19demayode1815.

Documento43.ElCnldemiliciasPabloJosdeEzeizaalGobernadorIntendente:
Comunicaquehadesistidodelospoderesqueselehabianotorgadoparalitigarenla
causayauncuandolalanchasobrelaqueseestlitigandolefuedonadaporsus
poderdantessuintervencinenlosautoshasidosoloencondicindeapoderadoporlo
cualnocorresponderespondaporlosperjuiciosquesemencionan.Alavezinformaque
porlasconvulsionespoliticasenellitoralylapersecucindeARtigashaperdidotodo
contactoconsuspoderdantes,algunodeloscualeshansidoemigradoyotroshansufrido
lapenacapital.solicitasedesestimenporimprocedenteslosrequerimeintosefectuadospor
AntonioJosdelTexo.S/f

Documento44.AntonioJosdelTexoalGobernadorIntendente:solicitasedesestimela
presentacindePabloJosdeEzeiza.MencionaqueelmencionadoEzeizahaganado
muchosmilesconelrobodelreferidobuqueysehaconstadadoeldeterioroenqueha
entregadolaembarcacin.

Documento45.AutodelGobernadorIntendenteManuelLuisdeOliden:aclaraqueelauto
del11demayoanteriorquereservaelderechodelapartedeSalezNuezparaque
accionepordaosyperjucioscontraquienpuedaydeba,noadjudicaresponsabilidadal
CnlPabloJosdeEzeiza.BuenosAires,22dejunode1815.

Documento46.DeclaracindeFranciscoPaulinodeSalezNuez:Refierediversos
incidentesrelacionadosconlacausaysutramitacin.Manifiestatenerunbuenconceptode
PabloJosdeEzeizaynotenerreclamoalgunocontrasupersona.Sealaquehaceesta
declaracinparaevitarmalesmayoresyenobjetoalajusticia.

Documento47.PabloJosdeEzeizayFranciscodeSalesNuezalGobernador
Intendente:presentacindeldocumentoanterior,envirtuddelacualdanporconcluida
cualquiergestinentrelosfirmantes.

Documento48.DecretodelGobernadorIntendentedeclarandosobreseidalacausaylibre
detodaresponsabilidadelCnlPabloJosdeEzeiza

Documento49.Tasacindelascostascausadasporlosautos.BuenosAires,16deagosto
de1815.

117
Documento50.CandelariaPardoalGobernadorIndente:Comoconsortelegtimay
apoderadadeAntonioJosTexosolicitalosautosdelacausa.BuenosAires,22de
diciembrede1815.

Documento51.PresentacindelCnldeMiliciasPabloJosdeEzeizaalGobernador
Intendente:SolicitaqueserevoquelavistadeautosrequeridaporlaapoderadadeAntonio
JosedelTextoporhaberconluidolacausa.

Documento52.DecretodelGobernadorIntendenteManuelLuisdeOliden.BuenosAires,
23deenerode1816.Disponequehabiendoconcluidalacausayrealizadalatasaciny
conluidalacausapordecretodel3deagostode1815,estafenecidalarepresentacinque
AntonioJosdelTextoejercaennombredeFranciscodeSalesNuez.ysedeclarano
parteaCandelariaPardoparapromoveraccinalgunaenrelacinconlacausa.Serevoca
lavistadeautos.

Documento53.DeclaracindeFranciscodeSalezNuez.ConcepcindelUruguay,26de
agostode1815.

Documento54.CandelariaPardo,mujerlegtimayapoderadadeAntoniodeSalezNuez
alGobernadorIntendente:solicitasereviseeldecretoporelcualsedeclaraconcluidala
causa,einhabilitadosuesposoparapromoveraccionesenlamisma.Detallalasinjusticias
dequehasidovictimasuesposo.

Documento55.DecretodelGobernadorIntendente.BuenosAires,14defebrerode1816.

Documento56.ElCnldemiliciasPabloJosdeEzeizaalGobernadorIntendente:seala
queporundecetoanteriorhasidodeclaradonoparteenlacausa.Apreciacionessobreel
desarrollodeljuicioylaactituddelosotrosinvolucradoseneljuicio.S/f.

Documento57.ElgobernadorIntendenteautorizalavistadelosautosporpartede
CandelariaPardo.BuenosAires,12demarzode1816.

Documento58.ElgobernadorIntendenteautorizalavistadelosautosporpartede
CandelariaPardo.BuenosAires,12demarzode1816.

Documento59.PabloJosdeEzeizaalGobernadorIntendente:Sealaqueundecreto
anteriorlohadesvinculadodelacausa.Consecuentementesolicitasesuspendael
testimonioqueselepidehastatantosecitenlaspartesqueverdaderamenteseconsideren
legtimasenelasunto.BuenosAires,18deabrilde1816DecretodelGobernador
Intendentedisponequesecumplaeldecretodel26deabrilde1815.

ApndiceC:PartesmilitaresdelaBatalladePavn(1861)

118
Transcripcindeloscopetesquedescribenalosdocumentoshistricoscorrespondientesal
archivoPartesmilitaresdelaBatalladePavn(1861)quesuministrelInstitutode
HistoriaArgentinayAmericanaDr.EmilioRavignaniyqueseusaronenlapresentetesis:

Setratadelosinformespresentadosporlosjefesyoficialesdelejrcitodel
EstadodeBuenosAires(A.Alsina,M.deGainza,L.Aguero,E.Mitre,J.
Arredondo,etc.),sobrelasaccionesdelastropasbajosumando,ascomo
delinformepresentadoporW.Paunero(JefedelEstadoMayor)aBartolom
Mitre(GobernadordeBuenosAires).TambinincluyeunacartadeJustoJ.de
UrquizaenlaqueexplicaalasautoridadesdelaConfederacinArgentinalas
razonesporlasqueseretiraasuprovincia.Estacoleccinsecomponede21
documentos,entremanuscritoseimpresos,conuntotalde73foliostiles
(101imgenes).

Documento1.JuanAyalaalCnl.JulioGarca.Comunicaqueleremiteelpartegeneraly
losparcialesreferentesalabatalladePavn.BuenosAires,15desetiembrede1891.F.1.

Documento2.BenitoNazaraWenceslaoPaunero.Relacindelaactuacindesu
regimientoenlabatalladePavn.Derrotadelaartilleraenemiga.Manifestacionesde
BartolomMitre.MencindelComandanteAlsina.Actuacindeunescuadrndecaballera.
ComportamientodelCap.RamnMuzalSubtenienteZennNazar.Tomadeunabandera
enemiga.SanNicolsdelosArroyos,20desetiembrede1861.F.2y3.

Documento3.BenitoNazaraWenceslaoPaunero.Informaacercadelaartilleray
municionestomadasalenemigoenlabatalladePavn.CampamentodeCariaga,23de
setiembrede1861.F.4y5.

Documento4.WenceslaoPauneroaBartolomMitre.Informedetalladodelasoperaciones
realizadasporelEjrcitodeBuenosAiresdesdesusalidadelcampamentodeRojashasta
eldadelabatalladePavn.CampamentodeCariaga,27desetiembrede1861.F.6a13.

Documento5.LuisArgueroaEmilioMitre.Leinformadelasaccionesquelibraronlas
tropasqueestabanbajosumandodurantelabatalladePavn.CampamentoGeneralde
SanNicols,20desetiembrede1861.F.14y15.

Documento6.LuisArgueroaEmilioMitre.Refiereladestacadaactuacindealgunosdelos
hombresbajosumando.CampamentoGeneraldeSanNicols,20desetiembrede1861.
F.16y17.

Documento7.EmilioMitreaWenceslaoPaunero.LeadjuntalospartesdelosJefesde
Brigada,conlasoperacionesrealizadasporcadaunodeellos,durantelabatalladePavn.
Incluyeelsuyoendondedadetallesdelasaccionesquelibraronlastropasqueestaban
bajosumando,ascomoelnmerodeheridos,bajasyprisioneros.Campamentode
Cariaga,22desetiembrede1861.F.18a20.

119
Documento8.PabloDazaWenceslaoPaunero.DacuentadeloocurridoenPavn.
Adjuntalospartesdelosjefesquetenaasusrdenes(Ctes.EmilioCastro,AdolfoAlsina,
JulinMurga).CampamentodeCariaga,20desetiembrede1861.F.21a30vta.

Documento9.N.FaciaLuisMaraArguero.Informaacercadelasoperacionesefectuadas
porlastropasasumandoenlabatalladePavn.CampamentodeSanNicols.F.31y32.

Documento10.JosArredondoaLuisMaraArguero.Informaacercadelasoperaciones
efectuadasporlastropasasumandoenlabatalladePavn.CampamentodeSanNicols.
F.33y34.

Documento11.A.GalvnaLuisMaraArguero.Informaacercadelasoperaciones
efectuadasporlastropasasumandoenlabatalladePavn.CampamentodeSanNicols.
F.35y36.

Documento12.IgnacioRivasaEmilioMitre.Elevalalistadelosheridosymuertosdelos
cuerposqueformaronladivisindesumandoenlabatalladePavn.CampamentodeSan
Nicols,20desetiembrede1861.F.37a38.

Documento13.MartndeGainzaaIgnacioRivas.Informaacercadelasoperaciones
efectuadasporlastropasasumandoenlabatalladePavn.CampamentodeSanNicols.
F.39y40.

Documento14.PartesdelosJefesGainza,Arredondo,Fraga,Landa,AldecoayRosetien
losquesedetallanlosJefes,OficialesytropadelEjrcitodelaConfederacintomados
prisionerosenlabatalladePavn.SanNicols,20desetiembrede1861.F.41a51.

Documento15.UrquizaalMinistrodeGuerrayMarinaPascualEchage.Partedelabatalla
dePavn.Hacereferenciasalafaltadehombres,armamentosymunicionesdelejrcito.
Falenciasenelarmadeinfantera.Planespreviosalabatalla.Dispositivodesusfuerzas,
detalledelabatalla.Causasdesuretirada.Comentariossobresuestadodenimo.Seala
quecareciderdenesparaoperarsobrelaProvinciadeBuenosAires.MencionaaJefes
capacesdeproseguirlaluchaantesumalestadodesalud.Necesidaddequeselogrela
paz.Diamante,20desetiembrede1861.F.52a61vta.

Documento16.ElMinistrodeGuerrayMarinaPascualEchageaUrquiza.Acusarecibo
delpartedelabatalladePavn.ReconocimientodelGobiernoalosJefes,oficialesytropas
porsucomportamiento.Herosmodelasdivisionesentrerrianas.Pesarporeldeteriorode
susalud.Paran,30desetiembrede1861.F.62a65.

Documento17.ResolucindelMinisteriodeGuerrayMarina.Sehacereferenciaaldecreto
delPresidenteDerqui,ascendiendoavariosJefesmilitaresqueactuaronenlabatallade
Pavn,yalpartedelcombate.Paran,28desetiembrede1861.F.66.

Documento18.ElPresidenteDerquialMinistrodeGuerrayMarina,PascualEchage.
InformadesuestablecimientoenRosarioydesuresolucindeponersealfrentedelas

120
operaciones.Reorganizacindelasfuerzasconfederadas.Actituddelapoblacinrosarina.
Actuacindelacaballeraylainfantera.ValorylealtaddelosgeneralesFrancia,Lpez
Jordn,ySa.Justificasusascensos.Medidasparareunirlasfuerzasdispersas.Abandono
delcampodebatalladeUrquiza.DesignacindeBenjamnVirasorocomoJefedelEjrcito
deOperaciones.NecesidaddecomunicarloshechosalVicePresidentePedernera.
Paran,28desetiembrede1861.F.67a70.

Documento19.ImpresodelPresidenteDerqui.Ascensodevariosjefes.MontedeFlores,
20desetiembrede1861.F.71.

Documento20.ImpresodelpresidenteDerqui.NombramientodeBenjamnVirasorocomo
JefedelEjrcitodeOperaciones.AludealaenfermedaddeUrquiza.Necesidadde
continuarconlasoperaciones.Rosario,22desetiembrede1861.F.72.

Documento21.Impresos.ParteoficialdelaBatalladePavnremitidoporBenjamn
Virasorodel20desetiembrede1861.DecretosdelPresidenteDerquirelacionadosconla
organizacindelejrcitodelosdas20y21desetiembrede1861.F.73.

121

Vous aimerez peut-être aussi