Académique Documents
Professionnel Documents
Culture Documents
Grigori Sidorov
Instituto Politcnico Nacional
Mxico
29
Junio
2014
Ismael Daz Rangel: Laboratorio de Lenguaje Natural y Procesamiento de Texto, Centro de Investigacin en
Computacin (CIC), Instituto Politcnico Nacional (IPN). Mxico. Correo electrnico: ismael1099@hotmail.com
Grigori Sidorov: Laboratorio de Lenguaje Natural y Procesamiento de Texto, Centro de Investigacin en Computacin (CIC), Instituto Politcnico Nacional (IPN). Mxico. Correo electrnico: sidorov@cic.ipn.mx
Sergio Surez Guerra: Laboratorio de Lenguaje Natural y Procesamiento de Texto, Centro de Investigacin en
Computacin (CIC), Instituto Politcnico Nacional (IPN). Mxico. Correo electrnico: ssuarez@cic.ipn.mx
Fecha de recepcin: septiembre de 2012
Fecha de aceptacin: febrero de 2014
32
Resumen
Este artculo presenta un mtodo para la
creacin de diccionarios marcados con un valor
especfico (por ejemplo, las emociones, la polaridad) para su uso en varias tareas de procesamiento de lenguaje natural realizadas por computadoras. En el diccionario creado las palabras
seleccionadas se han etiquetado con seis emociones bsicas. Para eso, las palabras primero
fueron analizadas (anotadas) manualmente por
mltiples evaluadores y ponderadas automticamente a base de estas. El mtodo se aplic
para el idioma espaol. Las palabras que conforman el diccionario fueron etiquetadas con las
categoras emocionales bsicas: alegra, enojo,
miedo, tristeza, sorpresa y repulsin. A diferencia de otros diccionarios para computadoras, el
diccionario propuesto contiene ponderaciones
Palabras clave: diccionario marcado con emociones; factor de probabilidad de uso afectivo; concor
dancia entre evaluadores; anlisis de sentimientos; mtodo de kappa ponderado.
Abstract
This paper presents a method for creation
of dictionaries marked with specific values (for
example, emotions, polarity) for use in various
tasks of automatic natural language processing.
In the created dictionary, the selected words are
tagged with six basic emotions. For this, they
are first analyzed (annotated) manually by multiple annotators and automatically weighted
on the basis of these evaluations. The method
was applied to the Spanish language. The paradigm chosen for tagging the words that form
the dictionary corresponds to basic emotional
categories: joy, anger, fear, sadness, surprise and
disgust. Unlike other dictionaries, our dictionary
contains weightings that correspond to percen-
tages of probability of being used with the sense related to emotion. Each word was evaluated
by multiple annotators, and, subsequently, the
agreement between them was analyzed with the
method of weighted kappa adapted for multiple
entries. On the basis of these results, we propose
a new measure that estimates the probability of
the affective use: probability factor of affective
use (PFA), which serves to provide potentially
emotional words with the weight. PFA can be
used as data in automatic systems for emotional
analysis of texts. PFA refers to the use tendency
of each word, which is useful for automatic systems.
Keywords: emotional dictionary; probability factor of affective use; agreement between annotators;
sentiment analysis; method of weighted kappa.
1. Introduccin
La deteccin automtica de sentimientos
en texto cada da cobra un mayor inters en diversos sectores; en parte se debe a la inmensa
cantidad de informacin disponible en la red,
como son anlisis o evaluaciones de productos
de consumo, programas informticos, deportes,
pelculas, etctera, todo ello accesible en sitios
especializados como revistas electrnicas, blogs
y foros; son tambin una importante fuente de
informacin los sitios de ventas, como, por ejemplo, Amazon. A su vez, es de creciente inters la
identificacin de contenido emocional presente
en sitios de noticias y redes sociales como Facebook y Twitter.
33
Es ms comn encontrar trabajos relacionados con los dos ltimos enfoques. Las dimensiones emocionales consideran el nivel presente
sobre tres aspectos: valencia (o polaridad), activacin y control. La polaridad indica si existe un
estado emocional positivo o negativo, donde la
felicidad se considera positiva y la tristeza negativa. La activacin indica una situacin activa o
pasiva del estado emocional, donde el extremo
activo puede ser la excitacin y el pasivo la calma. El control indica por un lado la dominacin y
al otro extremo la sumisin.
TABLA 1
Algunas teoras de clasificacin de emociones bsicas
INVESTIGADOR
Arnold
EMOCIONES
BSICAS
BASES
Ekman,
Friesen y
Ellsworth
Ira, repulsin,
miedo, alegra,
tristeza, sorpresa
Expresiones
fisiolgicas
faciales
universales
Gray
Rabia, terror,
ansiedad, alegra
Involuntarias
McDougall
Relacin a
los instintos
1 http://www.internetworldstats.com/stats.htm
34
con un sentido emocional, considerando diferentes contextos de aplicacin; tercero, se aplic una adaptacin del mtodo de concordancia
ponderada en las evaluaciones realizadas, mientras que ANEW no lo hace.
Dado que la mayor cantidad de recursos estn hechos para el idioma ingls, es importante
desarrollarlos para otros idiomas, especficamente para el espaol, donde tan solo en Amrica Latina existen ms de 235 millones de usuarios de Internet (internautas1).
El trabajo tiene la estructura siguiente. En
el apartado 2, se explica el criterio de seleccin
de palabras y su colocacin en una categora
emocional especfica. En el apartado 3, se indica
cmo, con la ayuda de mltiples evaluadores,
se realizaron estimaciones acerca del contenido emocional de las palabras seleccionadas,
siguiendo una serie de criterios de valoracin y
reglas de etiquetado. En el apartado 4, se realiza
un anlisis de las evaluaciones utilizando el mtodo de kappa ponderado, haciendo adecuaciones para su aplicacin sobre mltiples evaluadores. En la seccin 5, se escogen los datos de los
evaluadores ms afines usando la informacin
obtenida en el anlisis de concordancia entre
ellos, para calcular el factor de probabilidad de
uso afectivo (FPA) asociado a cada palabra. Al final, se presentan conclusiones.
res estadsticos, fue construido semiautomticamente y no todos los resultados fueron revisados manualmente, por lo que son de esperarse
algunas clasificaciones incorrectas (Martn y
otros, 2010). Por otro lado, las palabras de este
recurso tambin estn separadas por categoras
emocionales bajo el enfoque de Ekman.
Para la creacin del diccionario propuesto
se tomaron todas las palabras incluidas en cada
categora del recurso WordNet-Affect, con los resultados mostrados en la tabla 2.
TABLA 2
Palabras por categora obtenidas del WordNet-Affect
Lo siguiente consisti en integrar los resultados de los tres traductores automticos y eliminar los duplicados; la cantidad de trminos
resultantes por categora emocional se puede
observar en la tabla 4.
TABLA 4
Cantidad de palabras por categora despus
de la traduccin
CATEGORA
PALABRAS (ESPAOL)
Alegra
1,177
Repulsin
206
Enojo
959
CATEGORA
PALABRAS (INGLS)
Miedo
431
Alegra
399
Sorpresa
267
Repulsin
252
Tristeza
551
Enojo
137
Total
3,591
Miedo
53
Sorpresa
67
Tristeza
202
Total
1,110
35
Sin embargo, algunos resultados de la traduccin deben ser descartados; por ejemplo, en
la categora tristeza se encuentra la palabra inglesa blue, el traductor entreg tristeza, pero
tambin azul; en espaol este trmino no tiene
ninguna relacin con la tristeza, por lo que debe
ser suprimido. Para garantizar la calidad de las
palabras se realiz una revisin manual de cada
una de las 3,591 palabras. Todas las acepciones
de cada palabra presentes en el diccionario
de Mara Moliner (1996) fueron verificadas manualmente para ver si existe alguna relacin con
las emociones bsicas: el criterio fue mantener
aquellas palabras de las que, en alguna de sus
TABLA 3
Segmento con traduccin de palabras
PALABRA
INTERPRETER
BABYLON
adorably
adorablemente
adorablemente
adorablemente,
encantadoramente
adoration
adoracin
adoracin
adoracin,
pleitesa,
veneracin
PALABRAS (ESPAOL)
Alegra
668
Repulsin
209
Enojo
382
Miedo
211
Sorpresa
175
Tristeza
391
Total
2,036
36
37
TABLA 6
Segmento de lista de palabras etiquetadas con la emocin miedo
TABLA 7
Evaluaciones realizadas en las palabras de cada
categora emocional
CATEGORA
PALABRAS
EVALUADORES
Alegra
668
19
Repulsin
209
17
Enojo
382
17
Miedo
211
19
Sorpresa
175
19
Tristeza
391
17
Total
2,036
108
TABLA 8
Estimaciones de evaluadores
#
PALABRA
NULA
BAJA
MEDIA
ALTA
abundancia
1 (5.3%)
2 (10.5%)
8 (42.1%)
8 (42.1%)
acabalar
7 (36.8%)
1 (5.3%)
9 (47.4%)
2 (10.5%)
acallar
9 (47.4%)
8 (42.1%)
1 (5.3%)
1 (5.3%)
acatar
9 (47.4%)
5 (26.3%)
4 (21.1%)
1 (5.3%)
accin
6 (31.6%)
7 (36.8%)
4 (21.1%)
2 (10.5%)
aceptable
4 (21.1%)
3 (15.8%)
11 (57.9%)
1 (5.3%)
aceptacin
3 (15.8%)
2 (10.5%)
6 (31.6%)
8 (42.1%)
acicate
4 (21.1%)
6 (31.6%)
7 (36.8%)
2 (10.5%)
aclamacin
3 (15.8%)
2 (10.5%)
4 (21.1%)
10 (52.6%)
4. Anlisis de evaluaciones
En las evaluaciones donde se involucren los
estados afectivos la subjetividad podr estar
presente, por lo que se espera que existan algunas diferencias en las estimaciones entre un evaluador y otro; sin embargo, lo que nos interesa es
saber dnde hay mayores coincidencias, ya que
con ello se sabe qu tanto se puede o no relacionar una palabra con un contexto afectivo.
Por otro lado, las discrepancias pueden estar
dadas por la displicencia al realizar las evaluaciones, incluso es probable que algn evaluador
realice el marcaje integral o parcialmente
de manera aleatoria. Por lo que es necesario
un mecanismo con el cual se pueda analizar la
concordancia entre las evaluaciones realizadas,
y descartar el trabajo de los evaluadores que presenten una notoria discordancia con respecto a
los dems evaluadores.
En trminos generales, la concordancia es
el grado con que dos o ms observadores, mtodos, tcnicas u observaciones estn de acuerdo
sobre el mismo fenmeno observado (Corts,
2008). Por lo tanto, la concordancia no evala
la validez o la certeza sobre observaciones con
relacin a un estndar de referencia dado, sino
cun afines estn entre s las observaciones sobre el mismo fenmeno.
El ndice de acuerdo observado simplemente expresa en qu proporcin hubo coincidencia
en la clasificacin entre los observadores, en relacin al total de elementos examinados. Este
se obtiene sumando la cantidad de objetos de
estudio donde hubo coincidencias en las evaluaciones, y se divide por el total de objetos analizados. El problema que plantea este ndice bsico
es que una parte de ese acuerdo puede deberse
exclusivamente al azar.
El ndice de kappa diseado por Cohen (1960)
ajusta el efecto del azar en la proporcin de la
concordancia observada. En esencia, el proceso
38
EVAL 1
Negativo
Total
Positivo
n11
n12
A1
Negativo
n21
n22
A2
Total
B1
B2
n11 es la cantidad de los objetos que el evaluador 1 y 2 han estimado como positivos2.
n12 es la cantidad de objetos que el evaluador 1 calific como positivos y el 2 como negativos.
n21 es la cantidad de objetos que el evaluador 1 calific como negativos y el 2 como positivos.
n22 es la cantidad de los objetos que el evaluador 1 y 2 apreciaron como negativos.
A1 y A2 son la suma de los elementos de su
fila (A1 = n11 + n12).
B1 y B2 son la suma de los elementos de su
columna (B1 = n11 + n21).
N es la cantidad de objetos evaluados.
2 Las sumatorias se realizan considerando la evaluacin de un mismo objeto; esto aplica a las dems celdas.
P0 Pe
k=
1 Pe
donde:
Po es la proporcin de acuerdo observado y
se calcula con:
(2)
P0 =
j=1
njj
N
Cat 1
Cat 2
...
Cat m
Total
Cat 1
n11
n12
...
n1m
A1
Cat 2
n21
n22
...
n2m
A2
...
...
...
...
...
...
Cat m
nm1
nm2
...
nmm
Am
N2
Total
B1
B2
...
Bm
Pe =
j=1
Aj Bj
N2
Pe =
39
EVAL 1
GRADO DE ACUERDO
< 0.0
sin acuerdo
0.0 0.2
insignificante
0.2 0.4
bajo
0.4 0.6
moderado
0.6 0.8
bueno
0.8 1.0
muy bueno
EVAL 1
Cat 1
Cat 2
...
Cat m
Cat 1
w11
w12
...
w1m
Cat 2
w21
w22
...
w2m
...
...
...
...
...
Cat m
wm1
wm2
...
wmm
[ij]
m1
Cat 2
Cat 3
Cat m
Cat 1
2/3
1/3
Cat 2
2/3
2/3
1/3
Cat 3
1/3
2/3
2/3
Cat 4
1/3
2/3
b) Peso bicuadrado
Cat 2
Cat 3
Cat m
Cat 1
8/9
5/9
Cat 2
8/9
8/9
5/9
Cat 3
5/9
8/9
8/9
Cat 4
5/9
8/9
Pow Pew
1 Pew
wij
( NA ( NB
i
M1
Nmero de parejas =
Cat 1
ij
El mtodo de kappa ponderado es nicamente para dos evaluadores. Este trabajo tiene
ms evaluadores; sin embargo, es posible utilizar el kappa ponderado trabajando por parejas
de evaluadores y al final hacer un promedio total
con todos los valores obtenidos. Trabajar de esta
manera tambin da la oportunidad de conocer
el aporte en cuanto a concordancia de cada
evaluador; para ello, solo se estima el promedio
de los valores de kappa obtenidos entre dicho
evaluador vs. todos los dems. Para saber cuntas parejas diferentes se pueden formar entre
todos los evaluadores usamos:
(10)
EVAL 2
(7)
(9)
i=1 j=1
TABLA 13
( nN
(ij)2
wij = 1
(m1)2
EVAL 1
wij
i=1 j=1
EVAL 1
Pow=
1 i, j m
(6)
p+i
wij = 1
(8)
( (
(5)
Los valores de los pesos dependen de la importancia que se quiera adjudicar a los desacuerdos. Inicialmente Cohen propuso una escala lineal (tabla 13a) de pesos dada por:
40
M2
i=1
41
TABLA 14
TABLA 15
Parejas
1 evaluador
Parejas
2 evaluador
Parejas
M evaluador
kw_eval {1_1}
kw_eval {2_1}
kw_eval {M_1}
CATEGORA
LINEAL
BICUADRADO
kw_eval {1_2}
kw_eval {2_2}
kw_eval {M_2}
Alegra
0.641
0.771
Enojo
0.649
0.781
kw_eval {1_M}
kw_eval {2_M}
kw_eval {M_M}
Miedo
0.671
0.798
Repulsin
0.622
0.741
Sorpresa
0.641
0.76
Tristeza
0.647
0.779
En este punto se procedi a obtener el ndice de kappa promedio de cada evaluador, esto se
realiz haciendo la sumatoria de todas las parejas de estimaciones de kappa que se formaron
con cada evaluador (i) y dividiendo el resultado
entre la cantidad de evaluadores menos uno.
M
1
kw_pevali =
M1
kw_eval{i_j}
(11)
ij
j=1
Para conocer el grado de concordancia general o total de todas las evaluaciones sobre el
diccionario se promedian todas las concordancias:
(12)
1
kwtotal =
M
kw_pevali
i=1
Los resultados obtenidos para cada diccionario se muestran en la tabla 15, donde lineal y
bicuadrado se refieren al tipo de pesos usados
en la estimacin del ndice de kappa.
kwtotal
TABLA 16
Estimaciones de concordancia para cada evaluador
en la categora alegra vs. todos los dems
kwtotal
42
centaje con que se utiliza un trmino para denotar una emocin. Ntese que se us el ndice de
kappa para elegir a los evaluadores ms afines. A
partir de este momento ya no usamos kappa. La
matriz de evaluaciones tiene la forma mostrada
en la tabla 18.
EVALUADOR
LINEAL
BICUADRADO
0.685
0.834
13
0.697
0.833
16
0.688
0.823
15
0.674
0.822
Evaluador
Palabra
Cat 1
Cat m
0.685
0.821
E1
P1
n111
18
0.684
0.813
E1
P2
n121
n11m
n12m
0.682
0.812
E1
PN
n1N1
12
0.667
0.793
E2
P1
n211
0.649
0.787
E2
P2
n221
n1Nm
n21m
n22m
0.664
0.786
19
0.656
0.772
EM
PN
nMN1
nMNm
14
0.645
0.766
10
0.631
0.758
0.615
0.748
0.631
0.746
0.607
0.741
11
0.55
0.668
17
0.549
0.663
0.528
0.659
TABLA 17
Estimaciones de kappa con 10 evaluadores
kwtotal
CATEGORA
LINEAL
BICUADRADO
Alegra
0.726
0.860
Enojo
0.699
0.834
Miedo
0.743
0.872
Repulsin
0.705
0.837
Sorpresa
0.717
0.838
Tristeza
0.718
0.851
TABLA 18
Matriz con todos los datos de evaluaciones por
cada emocin
EPjk =
nijk
i=1
PEPjk =
100
EPjk
M
43
wk =
k1
m1
k=1
TABLA 19
Porcentajes de probabilidad de uso afectivo en palabras del diccionario alegra
PROBABILIDAD DE USO AFECTIVO
#
PALABRA
NULA [%]
BAJA [%]
MEDIA [%]
ALTA [%]
abundancia
50
50
acabalar
40
60
acallar
50
40
10
acatar
50
40
10
accin
30
30
30
10
aceptable
20
80
aceptacin
20
50
30
acicate
10
50
40
aclamacin
10
10
10
70
(16)
FPAj
PEPjk wk
100
k=1
44
1. Palabra abundancia. El 50% de los evaluadores cree que dicho trmino siempre denota algo relacionado con la alegra, el otro
50% cree que se usa en la misma proporcin
para denotar algo relacionado o no con la
alegra. Con estas evaluaciones se observa
una alta correspondencia entre la palabra
citada y la emocin alegra, de ah su alto valor de FPA.
2. Palabra acallar. El 50% cree que este trmino no tiene relacin alguna con la emocin
alegra, 40% piensa que aunque s puede
6. Conclusiones
TABLA 20
Fragmento de los valores FPA para la categora alegra
PROBABILIDAD DE USO AFECTIVO
#
PALABRA
NULA [%]
BAJA [%]
MEDIA [%]
ALTA [%]
FPA
abundancia
50
50
0.830
acabalar
40
60
0.396
acallar
50
40
10
0.198
acatar
50
40
10
0.198
accin
30
30
30
10
0.397
aceptable
20
80
0.594
aceptacin
20
50
30
0.696
acicate
10
50
40
0.429
aclamacin
10
10
10
70
0.799
3 http://www.cic.ipn.mx/~sidorov
45
7. Bibliografa citada
Boldrini, Ester y otros, 2009: EmotiBlog: an annotation scheme for emotion detection and analysis in non-traditional textual genres, Proceedings of the 2009 International Conference on
Data Mining, 491-497.
Cohen, Jacob, 1960: A coefficient of agreement
for nominal scales, Educational and Psychological Measurement 20, 37-46.
Cohen, Jacob, 1968: Weighted kappa: nominal
scale agreement with provision for scaled disagreement or partial credit, Psychological Bulletin 70, 213-220.
Cortes, dgar, 2008: Comparacin en la estimacin
del VO2max a travs de un monitor de frecuencia cardaca Polar S810 y una prueba de esfuerzo
maximal en banda sin fin segn el protocolo de
Balke, en deportistas universitarios entrenados
en resistencia aerbica en la ciudad de Bogot.
Tesis de maestra en Epidemiologa Clnica, Universidad Nacional de Colombia.
Cowie, Roddy y Randolph Cornelius, 2003: Describing the emotional states that are expressed in
speech, Speech Communication Special Issue
on Speech and Emotion 40, 5-32.
Ekman, Paul, 1972: Universals and cultural diffe-
46
Esuli, Andrea y Fabrizio Sebastiani, 2006: SentiWordNet: A Publicly Available Lexical Resource
for Opinion Mining, Fifth international conference on Language Resources and Evaluation
(LREC 2006), 417-422.
Fleiss, Joseph y Jacob Cohen, 1973: The equivalence of weighted kappa and the intraclass correlation coefficient as measures of reliability,
Educational and Psychological Measurement 33,
613-619.
Greenberg, Leslie, 2000: Emociones: Una gua interna, Bilbao: Descle De Brouwer.
Landis, Richard y Gary Koch, 1977: The measurement of observer agreement for categorical
data, Biometrics 33, 159-174.
Martn, Tamara y otros, 2010: Opinion Polarity
Detection - Using Word Sense Disambiguation
to Determine the Polarity of Opinions, Proceedings of the International Conference on Agents
and Artificial Intelligence (1), 483-486.
Moliner, Mara, 1996: Diccionario de uso del espaol, tercera edicin, Madrid: Gredos.
Moreno, Antonio y otros, 2010a: Sentitext: sistema de anlisis de sentimiento para el espaol,
Procesamiento del Lenguaje Natural 45, 297-298.
Moreno, Antonio y otros, 2010b: Anlisis de Valoraciones de Usuario de Hoteles con Sentitext: un
sistema de anlisis de sentimiento independiente del dominio, Procesamiento del Lenguaje Natural 45, 31-39.
Moreno, Antonio y otros, 2011: Domain-neutral,
Linguistically-motivated Sentiment Analysis: a
performance evaluation, XXVII Congreso de la
Sociedad Espaola para el Procesamiento del
Lenguaje Natural, 361-369.
Moreno, Antonio y Chantal Prez, 2013: LexiconBased Sentiment Analysis of Twitter Messages
Redondo, Jaime y otros, 2007: The Spanish adaptation of ANEW (Affective Norms for English
Words), Behavior Research Methods 39, 600-605.
Rusell, James, 1980: A circumplex model of
affect, Journal of Personality and Social Psychology 39, 1161-1178.
Scherer, Klaus y Paul Ekman, 1984: On the Nature
and Function of Emotion: A Component Process
Approach en Approaches to emotion, Hillsdale
New Jersey: Lawrence Erlbaum Associates, 293317.
Smith, Craig, 1989: Dimensions of appraisal and
physiological response in emotion, Journal of
Personality and Social Psychology 56 (3), 339-353.
Stone, Phillip y otros, 1966: The General Inquirer: A
Computer Approach to Content Analysis, Oxford
England: The M.I.T. Press.
Strapparava, Carlo y Alessandro Valitutti, 2004:
WordNet-Affect: an affective extension of wordnet, Proceedings of the 4th International Conference on Language Resources and Evaluation,
1083-1086.
Strapparava, Carlo y Rada Mihalcea, 2007: SemEval-2007 Task 14: Affective Text, Proceedings of
the 4th International Workshop on the Semantic Evaluations (SemEval 2007), Praga, Repblica
Checa.
Wundt, Wilhelm, 1896: Grundriss der Psychologie,
Leipzig, Alemania: Verlag von Wilhelm Engelmann.