Vous êtes sur la page 1sur 5

Creado el 29/12/2015

ltima versin: 29/12/2015


Paolo Rosso, Universitat Politcnica de Valencia
Comunidad moocTLH
Esta obra est bajo una
licencia de Creative Commons

Reconocimiento-CompartirIgual 3.0 Unported


.

Deteccindelairona
Hola. Soy Paolo Rosso de la Universitat Politcnica de Valencia e intentar contaros algo
sobre el tema fascinante de la irona y de su deteccin.
Bueno, primero hay que distinguir entre lenguaje natural y lenguaje figurado. Por ejemplo si
os dicen eres un bombn no hay que tomarlo literalmente, tiene otro sentido figurado.
Entonces su procesamiento automtico es, como se puede comprender, ms difcil.
Lo interesante de la irona y su deteccin es, por ejemplo, por el tema de la polaridad en el
anlisis de sentimientos, porque la irona es una manera implcita de negar el sentimiento de
un determinado texto.
Nosotros hemos trabajado con ejemplos en social media, por ejemplo en Twitter, y como
podis imaginar es muy importante detectar la irona desde la perspectiva de la reputacin
de una empresa, de una persona Aqu veis algunos ejemplos que se refieren al caso de
Toyota cuando tuvo problemas de freno y acelerador.

My car
broke down
! Nooooo! I bought a Toyota so that it wouldnt
brake down
.
:(
Como podis ver, se juega con esta ambigedad, estos cambios a nivel lxico y sintctico.
Hay casos en los cuales la irona ha resultado muy interesante como disparador de ventas de
producto. El caso que por ejemplo podis encontrar en internet de una camiseta, The
Mountain Three Wolf Moon Short Sleeve Tee. Todo empez por algunos comentarios
irnicos acerca de esta camiseta que, aparentemente, alguien as bromeando se puso la
camiseta y al salir del supermercado en seguida tuvo xito con una cuantas mujeres. De ah
se dispararon los comentarios y la venta del producto y Amazon, desde entonces, le interesa
poder ver si algn comentario es irnico como potencial disparador de inters de venta de
algunos productos.

En el caso del lenguaje figurado, no solo irona o sarcasmo. Para empezar, no es nada fcil
distinguir en muchas ocasiones irona y sarcasmo y, generalmente, se considera todo como
una irona, como una macrocategora, y el sarcasmo como un tipo especfico de irona
menos sutil, y ms directa si queremos. Tambin un ejemplo de lenguaje figurado es el
humor. Hay trabajos previos de investigadores como Tony Veale, como Carlo Strapparava o
Rada Mihalcea que trabajaron en irona, humor; y tambin metfora, por ejemplo Tony
Veale.
Sobre la manera como intentamos abordar el reconocimiento del humor, la deteccin de la
irona, al principio intentamos considerar las features, las caractersticas, que nos dieron
buenos resultados en el reconocimiento del humor.
Aunque irona es algo ms especfico, ms sutil, intentamos considerar algunas de estas
caractersticas enriquecidas con algunas ms como la polaridad de las palabras, el lado
emocional del contenido, es decir, la informacin que se puede conseguir en recursos como
WordNet Affect, el grado de cun agradable pueden ser unas palabras esta informacin se
puede encontrar en el diccionario Whissels desarrollado por psicolingistas.
Hicimos unos experimentos con un corpus de los ejemplos irnicos que causaron este efecto
viral en las ventas en Amazon. Para las personas interesadas, pueden ir leyendo los
resultados que publicamos en uno de los artculos pero fueron bastantes mediocres, es
decir, alrededor del 60 % de accuracy (precisin). Eso implica que la irona es algo ms sutil
que el humor, se necesita un modelo ms ambicioso, ms profundo para intentar detectar
algunos al menos de estos casos.
As, intentamos abarcar el problema de la deteccin de la irona a travs de cuatro
macrocategoras, considerando una cierta manera de estilo de escritura, cmo se utilizan los
signos de puntuacin, los emoticones, los adverbios que implican negacin, como
nevertheless, que muestran un cierto cambio implcito a lo que se estaba diciendo

anteriormente. Lo mismo para adverbios que en cierta manera dan un sentido de cambio en
el tiempo
suddenly
,
now
.
Tambin es importante considerar el grado de cun inesperado puede ser cierto comentario
irnico porque la irona se basa justo en eso.
Por ejemplo, se ha intentado considerar el balanceado de la primera parte de un comentario
respecto de la segunda, y esto se puede medir con medidas como las de
semantic-relatedness. Algunas se pueden encontrar en la pgina de Ted Pedersen.
Tambin consideramos features que siempre han dado buenos resultados en tareas como la
atribucin de autora en las que el estilo de escritura es muy importante, como n-gramas de
caracteres, saltos o skip n-grams, o tambin polarity s-grams, secuencias de la polaridad de
las palabras de un cierto texto. La intuicin es que potencialmente en un comentario irnico
se podra decir algo positivo y de repente algo negativo.
Como he dicho anteriormente, se ha considerado tambin el contexto emocional, es decir,
no solo el aspecto de lo agradable que puede ser una palabra sino cun fcil es tener una
representacin mental, su grado de activacin todo esto ha sido desarrollado en el
diccionario Whissels.
Aqu se puede ver un ejemplo,
Activation:

My male(1.55) ego(2.00) so eager(2.25) to let(1.70) it be stated(2.00) that


Iam THE MAN(1.8750) but wont allow(1.00) my pride(1.90) to admit(1.66)
that being egotistical(0) is a weakness(1.75) ...
Imagery:

Yesterday(1.6) was the official(1.4) first(1.6) day(2.6) of spring(2.8)... and


there was over a foot(2.8) of snow(3.0) on the ground(2.4).
Pleasantness :

The guy(1.9000) who(1.8889) called(2.0000) me Ricky(0) Martin(0)


has(1.7778) a blind(1.0000) lunch(2.1667) date(2.33).
La idea es determinar cul es el grado de
imagery
,
activation
y
pleasantness
,
y luego jugar un
poco con ciertos umbrales, arriba de los cuales probablemente un cierto comentario podra
ser irnico.
Hemos hecho unos experimentos con un corpus de tuits, y sin entrar mucho en los
resultados, s se puede notar que estas 4 macrocategoras han ayudado en la deteccin de la
irona, consiguiendo resultados con decission tress alrededor del 75 % de acierto.

Para acabar, no es nada fcil distinguir entre irona, sarcasmo y stira. Generalmente se les
suele considerar como sinnimos o que la irona es una macrocategora en la que el
sarcasmo y hasta la stira son categoras un poco ms especfica.
If you find it hard to laugh at yourself, I would be happy to do it for you
My mother never saw the irony in calling me a son-of-a-bitch
Muchas gracias por vuestra atencin.

Bibliografa
Reyes A., Rosso P., Buscaldi D. (2012). From Humor Recognition to Irony Detection:
The Figurative Language of Social Media. In: Data & Knowledge Engineering, vol. 74,
pp.1-12
Reyes A., Rosso P. Making Objective Decisions from Subjective Data: Detecting Irony
in Customers Reviews. In: Journal on Decision Support Systems, vol. 53, issue 4, pp.
754760
Reyes A., Rosso P., Veale T. (2013). A Multidimensional Approach for Detecting Irony
in Twitter. In: Language Resources and Evaluation, vol. 47, issue 1, pp. 239-268

Reyes A., Rosso P. (2013). On the Difficulty of Automatically Detecting Irony: Beyond
a Simple Case of Negation. In: Knowledge and Information Systems, May DOI:
10.1007/s10115-013 0652-8

Irony in Italian: SENTIPOL @ EVALITA-2014


http://www.evalita.it/2014/tasks/sentipolc
SA of figurative language in Twitter: @ SemEval-2015
http://alt.qcri.org/semeval2015/task11/

Creado el 29/12/2015
ltima versin: 29/12/2015
Paolo Rosso, Universitat Politcnica de Valencia
Comunidad moocTLH
Esta obra est bajo una
licencia de Creative Commons

Reconocimiento-CompartirIgual 3.0 Unported


.

Vous aimerez peut-être aussi