Académique Documents
Professionnel Documents
Culture Documents
Deteccindelairona
Hola. Soy Paolo Rosso de la Universitat Politcnica de Valencia e intentar contaros algo
sobre el tema fascinante de la irona y de su deteccin.
Bueno, primero hay que distinguir entre lenguaje natural y lenguaje figurado. Por ejemplo si
os dicen eres un bombn no hay que tomarlo literalmente, tiene otro sentido figurado.
Entonces su procesamiento automtico es, como se puede comprender, ms difcil.
Lo interesante de la irona y su deteccin es, por ejemplo, por el tema de la polaridad en el
anlisis de sentimientos, porque la irona es una manera implcita de negar el sentimiento de
un determinado texto.
Nosotros hemos trabajado con ejemplos en social media, por ejemplo en Twitter, y como
podis imaginar es muy importante detectar la irona desde la perspectiva de la reputacin
de una empresa, de una persona Aqu veis algunos ejemplos que se refieren al caso de
Toyota cuando tuvo problemas de freno y acelerador.
My car
broke down
! Nooooo! I bought a Toyota so that it wouldnt
brake down
.
:(
Como podis ver, se juega con esta ambigedad, estos cambios a nivel lxico y sintctico.
Hay casos en los cuales la irona ha resultado muy interesante como disparador de ventas de
producto. El caso que por ejemplo podis encontrar en internet de una camiseta, The
Mountain Three Wolf Moon Short Sleeve Tee. Todo empez por algunos comentarios
irnicos acerca de esta camiseta que, aparentemente, alguien as bromeando se puso la
camiseta y al salir del supermercado en seguida tuvo xito con una cuantas mujeres. De ah
se dispararon los comentarios y la venta del producto y Amazon, desde entonces, le interesa
poder ver si algn comentario es irnico como potencial disparador de inters de venta de
algunos productos.
En el caso del lenguaje figurado, no solo irona o sarcasmo. Para empezar, no es nada fcil
distinguir en muchas ocasiones irona y sarcasmo y, generalmente, se considera todo como
una irona, como una macrocategora, y el sarcasmo como un tipo especfico de irona
menos sutil, y ms directa si queremos. Tambin un ejemplo de lenguaje figurado es el
humor. Hay trabajos previos de investigadores como Tony Veale, como Carlo Strapparava o
Rada Mihalcea que trabajaron en irona, humor; y tambin metfora, por ejemplo Tony
Veale.
Sobre la manera como intentamos abordar el reconocimiento del humor, la deteccin de la
irona, al principio intentamos considerar las features, las caractersticas, que nos dieron
buenos resultados en el reconocimiento del humor.
Aunque irona es algo ms especfico, ms sutil, intentamos considerar algunas de estas
caractersticas enriquecidas con algunas ms como la polaridad de las palabras, el lado
emocional del contenido, es decir, la informacin que se puede conseguir en recursos como
WordNet Affect, el grado de cun agradable pueden ser unas palabras esta informacin se
puede encontrar en el diccionario Whissels desarrollado por psicolingistas.
Hicimos unos experimentos con un corpus de los ejemplos irnicos que causaron este efecto
viral en las ventas en Amazon. Para las personas interesadas, pueden ir leyendo los
resultados que publicamos en uno de los artculos pero fueron bastantes mediocres, es
decir, alrededor del 60 % de accuracy (precisin). Eso implica que la irona es algo ms sutil
que el humor, se necesita un modelo ms ambicioso, ms profundo para intentar detectar
algunos al menos de estos casos.
As, intentamos abarcar el problema de la deteccin de la irona a travs de cuatro
macrocategoras, considerando una cierta manera de estilo de escritura, cmo se utilizan los
signos de puntuacin, los emoticones, los adverbios que implican negacin, como
nevertheless, que muestran un cierto cambio implcito a lo que se estaba diciendo
anteriormente. Lo mismo para adverbios que en cierta manera dan un sentido de cambio en
el tiempo
suddenly
,
now
.
Tambin es importante considerar el grado de cun inesperado puede ser cierto comentario
irnico porque la irona se basa justo en eso.
Por ejemplo, se ha intentado considerar el balanceado de la primera parte de un comentario
respecto de la segunda, y esto se puede medir con medidas como las de
semantic-relatedness. Algunas se pueden encontrar en la pgina de Ted Pedersen.
Tambin consideramos features que siempre han dado buenos resultados en tareas como la
atribucin de autora en las que el estilo de escritura es muy importante, como n-gramas de
caracteres, saltos o skip n-grams, o tambin polarity s-grams, secuencias de la polaridad de
las palabras de un cierto texto. La intuicin es que potencialmente en un comentario irnico
se podra decir algo positivo y de repente algo negativo.
Como he dicho anteriormente, se ha considerado tambin el contexto emocional, es decir,
no solo el aspecto de lo agradable que puede ser una palabra sino cun fcil es tener una
representacin mental, su grado de activacin todo esto ha sido desarrollado en el
diccionario Whissels.
Aqu se puede ver un ejemplo,
Activation:
Para acabar, no es nada fcil distinguir entre irona, sarcasmo y stira. Generalmente se les
suele considerar como sinnimos o que la irona es una macrocategora en la que el
sarcasmo y hasta la stira son categoras un poco ms especfica.
If you find it hard to laugh at yourself, I would be happy to do it for you
My mother never saw the irony in calling me a son-of-a-bitch
Muchas gracias por vuestra atencin.
Bibliografa
Reyes A., Rosso P., Buscaldi D. (2012). From Humor Recognition to Irony Detection:
The Figurative Language of Social Media. In: Data & Knowledge Engineering, vol. 74,
pp.1-12
Reyes A., Rosso P. Making Objective Decisions from Subjective Data: Detecting Irony
in Customers Reviews. In: Journal on Decision Support Systems, vol. 53, issue 4, pp.
754760
Reyes A., Rosso P., Veale T. (2013). A Multidimensional Approach for Detecting Irony
in Twitter. In: Language Resources and Evaluation, vol. 47, issue 1, pp. 239-268
Reyes A., Rosso P. (2013). On the Difficulty of Automatically Detecting Irony: Beyond
a Simple Case of Negation. In: Knowledge and Information Systems, May DOI:
10.1007/s10115-013 0652-8
Creado el 29/12/2015
ltima versin: 29/12/2015
Paolo Rosso, Universitat Politcnica de Valencia
Comunidad moocTLH
Esta obra est bajo una
licencia de Creative Commons