Académique Documents
Professionnel Documents
Culture Documents
KEYWORDS:
reviews
opinion mining, polarity lexicon, word n-grams, Latent semantic analysis, movie
Yves Bestgen
de termes prsents dans celle-ci. Les mots rares dans une langue ou ceux qui ont un
emploi spcifique dans un domaine d'application (abyssal, dsopilant, navet ou
encore nullard et chichiteux dans des critiques de films) y sont rarement pris en
compte.
Les approches qui s'appuient sur des corpus partent galement d'un ensemble de
mots germes dont la polarit est connue a priori, mais calculent les similarits au
moyen d'une analyse statistique des contextes de cooccurrences des mots, avec ou
sans recours des modles d'espaces vectoriels reprsentant le contenu smantique
des mots sous la forme de vecteurs. Un mot est considr comme d'autant plus
positif qu'il est plus proche des germes positifs et plus loign des germes ngatifs.
Pouvant tre appliques des corpus de trs grandes tailles (des milliards de mots
rcolts sur le web comme l'ont fait Velikovich et al., 2010) ou des corpus
spcifiques une application (Bestgen, 2008), ces techniques rpondent aux
limitations des approches bases sur des ressources linguistiques, mais s'appuient sur
des informations plus bruites que celles qui sont encodes manuellement par des
linguistes dans des ressources comme Wordnet ou comme un dictionnaire de
synonymes. Rcemment, Bestgen et Vincze (2012) ont montr que les approches
bases sur un corpus permettaient de gnrer des normes lexicales ayant une fiabilit
quivalente celles obtenues en demandant des juges d'valuer les mots.
Une des limites de ces techniques automatiques d'estimation de la polarit est
que le lexique produit ne contient le plus souvent que des mots simples et donc
aucun groupe de mots, ou n-grammes de mots, alors que la polarit de celles-ci peut
tre trs diffrente de celle des mots qui les composent (Polanyi et Zaenen, 2003). A
titre d'exemple, on peut trouver dans un corpus de critiques de films : courrez le
voir, le plus beau navet, faussement subversif, d'habitude excellent ou encore jamais
ridicule. Si quelques tudes proposent des techniques d'estimation de la polarit qui
s'appliquent aux n-grammes (Turney, 2002; Velikovich et al., 2010; Vernier et
Monceaux, 2010), aucune n'a essay de dterminer le gain apport par ceux-ci par
rapport un lexique compos exclusivement de mots. Ainsi, la technique
dveloppe par Velikovich et al. (2010), qui est base sur la construction d'un
graphe partir des cooccurrences de mots et d'units polylexicales dans un corpus
de 4 milliards de pages web, a t value dans une tche de classification de
phrases annotes manuellement, mais sans distinguer les mots simples des
squences composes de plusieurs mots. De mme, Turney (2002) a propos
d'attribuer des scores de polarit des bigrammes sur la base de leur proximit avec
des mots germes positifs et ngatifs, proximits mesures partir des rponses des
requtes envoyes au moteur de recherche AltaVista. Il a montr que cette technique
permet de prdire significativement la note attribue des critiques par leur auteur,
mais, tout comme Velikovich et al. (2010), Turney ne compare pas les bigrammes
aux unigrammes. Or, s'il n'est pas difficile de trouver des exemples d'expressions
polylexicales dont la polarit est diffrente de celle des mots qui la composent, on
peut se demander si leur prise en compte est susceptible d'apporter un gain
significatif. Afin d'essayer d'apporter une premire rponse cette question, la
Yves Bestgen
Yves Bestgen
3. Exprience
3.1 Objectifs
Afin de se faire une premire ide de l'intrt qu'il y a d'tendre l'estimation
automatique de la polarit de termes des n-grammes, la prsente exprience tente
d'abord de rpondre la question suivante : lorsque la technique prtend qu'un ngramme est positif (ou ngatif), l'est-il vraiment et surtout l'est-il plus souvent que
lorsque cette technique fait la mme prdiction pour un mot? Pour rpondre cette
question, il n'est pas possible d'employer la procdure classiquement utilise pour
valuer les mots. En effet, celle-ci consiste comparer les polarits prdites celles
obtenues en demandant des juges d'valuer des mots sur cette dimension, comme
c'est le cas dans les normes Valemo, F-POL ou encore le General Inquirer dans sa
version anglaise ou franaise (Turney et Littman, 2003; Vincze et Bestgen, 2011).
Or, ma connaissance, aucune norme de ce type n'est disponible pour les ngrammes. Pour pouvoir nanmoins valuer la qualit de ceux-ci, la solution adopte
consiste employer des textes dont la polarit est connue parce que les auteurs de
ceux-ci leur ont attribu une note sur une chelle de polarit, comme c'est
frquemment le cas pour les critiques de films. Si une procdure d'estimation de la
polarit est efficace, on doit s'attendre observer plus frquemment les termes (mots
ou n-grammes) les plus ngatifs dans les critiques ngatives et les termes les plus
positifs dans les critiques positives.
Cette premire manire d'valuer l'extension de SO-LSA et DIC-LSA aux ngrammes peut tre qualifie d'intrinsque en ce sens qu'elle vise dterminer la
qualit des scores de polarit attribus automatiquement des n-grammes en dehors
de toute application concrte. La deuxime analyse vise dterminer si la prise en
compte de n-grammes en plus des mots permet d'amliorer la prdiction de la
polarit de textes.
3.2 Mthode
3.2.1 Corpus pour l'extraction des espaces smantiques et pour la phase de test
Bestgen (2008) ayant montr que tant SO-LSA que DIC-LSA taient plus
efficaces pour estimer des polarits lorsque le corpus partir duquel l'espace
smantique est extrait contient des textes similaires ceux qui doivent tre valus
lors de la phase de test, les textes employs tant pour extraire les espaces
smantiques que pour la phase de test ont t extraits d'un mme site Web, le site
Allocine.fr. Ce site rassemble de nombreuses informations sur le cinma, dont une
ample section de partage social dans laquelle les spectateurs peuvent donner leur
avis propos de films.
Un programme Perl a t employ pour slectionner dans la base de donnes
tous les films produits entre 2006 et septembre 2012 qui ne relevaient pas des
catgories Divers ou Documentaires, pour lesquels on disposait d'au moins une
critique de presse (de sorte d'liminer des sries tlvises) et qui avaient t
comments au moins 50 fois. Ce programme extrayait toutes les critiques de
spectateurs disponibles en enregistrant le titre du film, le rdacteur de la critique, la
date de diffusion de la critique, le texte de celle-ci et la note attribue par l'auteur.
Cette note, au moment de la construction du corpus, tait prsente sur une chelle
allant de 0 5 par pas d'un demi-point, 0 correspondant un film nul et 5 un chefd'oeuvre.
Plusieurs post-traitements ont t effectus sur les textes des critiques afin de
transcoder ou de recoder des caractres spciaux et de supprimer quelques balises
html. Ensuite, chaque critique a t traite par le programme TreeTagger (Schmid,
1994) afin d'tre segmente en tokens (mots, mais aussi signes de ponctuation,
symboles...) et lemmatise. En moyenne, la longueur des critiques est de 86 tokens
avec un cart-type trs lev de 92 et une tendue allant de 1 4434 tokens. Afin de
rduire cette tendue, les critiques de moins de 30 tokens et de plus de 418 ont t
supprimes, ces valeurs liminant les critiques considres arbitrairement comme
trop courtes pour les inclure dans le tableau lexical et le pour-cent (1%) des critiques
les plus longues.
Le corpus intgral est compos de 648 619 critiques propos de 1837 films
diffrents et compte un peu plus de 65 millions de tokens. Comme indiqu ci-dessus,
ce corpus a t employ pour l'extraction des espaces smantiques et pour la phase
de test. Afin de garantir autant d'indpendance que possible entre l'tape d'estimation
des polarits et l'tape d'valuation, le corpus intgral a t divis alatoirement en
deux sous-corpus (A et B) contenant chacun approximativement 324 000 critiques.
Le corpus B a t employ pour l'valuation des polarits estime sur la base d'une
analyse smantique latente du corpus A et l'inverse a t effectu lorsque le corpus
A est utilis pour la phase de test. Les rsultats donns dans la suite correspondent
toujours la moyenne des scores obtenus sur chaque demi-corpus.
3.2.2 Slection des mots et des n-grammes
Pour la construction des tableaux lexicaux et la phase de test, on n'a conserv
dans chaque critique que les mots apparaissant au moins cinq fois dans l'ensemble
du corpus et appartenant une des catgories grammaticales suivantes : nom,
adjectif, verbe et conjonction. Pour les termes composs de plus d'un mot, les
mmes conditions s'appliquent chacun des mots qui les composent ainsi que la
ncessit que tous les mots se suivent directement et fassent partie de la mme
phrase. On a choisi dans la prsente tude de se limiter aux n-grammes composs au
maximum de quatre mots.
3.2.3 Construction des espaces smantiques et estimation de la polarit
Les matrices de cooccurrences critiques termes ont t soumises une
dcomposition en valeurs singulires ralise par le programme SvdpackC (Berry et
al., 1993) et les 300 premiers vecteurs propres ont t conservs, ce nombre tant
Yves Bestgen
Polarit
1.4
1.4
1.6
2.2
2.6
2.8
3.1
3.2
Mot
contrlable
outil
risquer
entier
revenir
admiratif
doux
sincrit
Polarit
3.5
4.3
4.5
4.9
5.0
5.7
6.0
6.1
Tableau 1 : Polarit de mots sur une chelle allant de trs dsagrable (1.0) trs
agrable (7.0).
- Quadrigrammes (4G) : (-) absolument rien ne tre, avoir rien avoir sauver, ne
faire jamais peur, pas trop mauvais mais ; (+) drle mais aussi mouvant, paratre
plus vrai que, personnage tre terriblement attachant, simple mais pas simpliste.
3.3.1 Analyse 1 : Impact de la prsence conjointe de mots et de n-grammes sur
l'estimation de la polarit
La premire analyse a pour objectif de vrifier que la prsence dans un espace
smantique des n-grammes en plus des mots ne modifie pas les scores de polarit
attribus aux mots. Pour rpondre cette question, on a corrl les scores de polarit
des mots obtenus sur la base des quatre espaces smantiques : celui n'incluant que
des mots et ceux incluant en plus des mots un type de n-grammes. Ces corrlations
sont trs leves puisque toutes sont suprieures 0.93 tant pour SO-LSA que pour
DIC-LSA.
3.3.2 Analyse 2 : Efficacit de la procdure pour estimer la polarit de n-grammes
La deuxime analyse vise dterminer si les n-grammes les plus ngatifs
s'observent dans les critiques les plus ngatives et les n-grammes les plus positifs
dans les critiques les plus positives. Pour rpondre cette question, les critiques de
chaque corpus de test ont t divises en trois tranches selon que la note attribue
par l'auteur est infrieure ou gale 1.5, suprieure ou gale 3.5 ou intermdiaire,
cette dernire tranche n'tant pas employe dans les analyses. Les mots et les ngrammes de chaque longueur ont t indpendamment rangs du plus ngatif au
plus positif et diviss en tranches en fonction des pourcentiles1 suivants : 1 %,
2.5 %, 5 %, 10 %, 25 %, 33.33 %, 66.67 %, 75 %, 90 %, 95 %, 97.5 % et 99 %.
Pour les termes identifis comme ngatifs, la premire tranche (1 %) inclut le pour
cent des valeurs les plus ngatives, la deuxime (2.5 %) le pour cent et demi suivant,
la troisime (5 %) les 2.5 % qui suivent et ainsi de suite. Pour les termes identifis
comme positifs, la tranche 99 % inclut le pour cent des valeurs les plus positives, la
tranche 97.5 % le pour cent et demi suivant et ainsi de suite. De cette manire,
chaque terme est inclus dans une et une seule tranche. Les termes appartenant au
tiers le plus neutre (de 33.34 % 66.66 %) n'ont pas t analyss.
On a ensuite dtermin pour chaque terme de chaque tranche dans combien de
critiques ngatives et dans combien de critiques positives il apparat. Si la procdure
est efficace, on devrait observer plus de termes ngatifs dans les critiques ngatives
et plus de termes positifs dans les critiques positives. L'indice d'efficacit pour un
terme est donc la proportion de cas dans lesquels il apparat dans une critique de
polarit attendue. Pour les termes ngatifs, il correspond au rapport entre le nombre
d'occurrences dans des critiques ngatives divis par le nombre total d'occurrences
du terme. Pour les critiques positives, le numrateur est le nombre d'occurrences du
terme dans des critiques positives.
Yves Bestgen
Les tableaux 2 et 3 prsentent les scores d'exactitude moyens pour les 4 types de
termes et les 12 tranches calculs sur les deux sous-corpus de test et ce pour les deux
techniques d'estimation.
---
+++
Tranche
1.0
2.5
5.0
10.0
25.0
33.0
67.0
75.0
90.0
95.0
97.5
99.0
Mot
0.73
0.60
0.53
0.47
0.41
0.37
0.71
0.72
0.75
0.77
0.79
0.83
2G
0.76
0.65
0.55
0.48
0.39
0.33
0.77
0.79
0.82
0.83
0.85
0.88
3G
0.76
0.68
0.60
0.53
0.42
0.35
0.79
0.82
0.86
0.87
0.90
0.92
4G
0.74
0.71
0.61
0.55
0.45
0.37
0.80
0.84
0.88
0.92
0.94
0.96
3G
0.49
0.58
0.56
0.49
0.41
0.35
0.77
0.81
0.86
0.88
0.90
0.92
4G
0.55
0.62
0.56
0.51
0.43
0.37
0.78
0.83
0.89
0.91
0.93
0.95
---
+++
Tranche
1.0
2.5
5.0
10.0
25.0
33.0
67.0
75.0
90.0
95.0
97.5
99.0
Mot
0.49
0.52
0.47
0.43
0.38
0.36
0.69
0.70
0.72
0.75
0.78
0.81
2G
0.47
0.53
0.50
0.44
0.37
0.34
0.75
0.78
0.81
0.83
0.85
0.89
On observe logiquement que les scores d'exactitude sont plus levs pour les
termes ayant les polarits les plus extrmes, mais aussi qu'ils sont plus levs pour
les n-grammes que pour les mots et galement plus le paramtre n est grand. On
note aussi que les scores sont nettement meilleurs pour les termes positifs que pour
les termes ngatifs. Pour les termes ngatifs, l'exactitude est mme souvent
infrieure la valeur que produirait une attribution de la polarit par une procdure
totalement alatoire (0.50). Une performance aussi faible n'tait pas attendue. Enfin,
si SO-LSA est trs nettement plus efficace (ou moins inefficace) que DICLSA pour
les mots ngatifs, les diffrences pour les n-grammes positifs sont trs faibles et pas
toujours son avantage.
3.3.3 Analyse 3 : Utilit des n-grammes pour prdire la polarit de textes
La dernire analyse vise dterminer si la prise en compte de n-grammes en plus
des mots permet d'amliorer la prdiction de la polarit de textes. Pour ce faire, j'ai
employ une procdure d'estimation de la polarit d'un texte trs simple, mais
relativement efficace (Turney, 2002; Bestgen, 1994, 2008), qui considre que la
polarit d'un texte est gale la moyenne de toutes les polarits connues. Comme
dans l'analyse prcdente, les polarits des termes ont t calcules sur un des deux
sous-corpus et le test a port sur l'autre sous-corpus. Le tableau 4 donne les
corrlations entre la note attribue aux critiques par les auteurs et la polarit estime
sur la base des mots, des unigrammes et des bigrammes (Mot-2G), des unigrammes,
bigrammes et trigrammes (Mot-2G-3G) et de l'ensemble des termes disponibles
(Mot-2G-3G-4G).
Ces valeurs peuvent tre compares un niveau de base : la corrlation obtenue
lorsqu'on estime la polarit des critiques au moyen du dictionnaire de polarit
original, compos de 3253 mots, chacun valu par une trentaine de personnes.
Cette corrlation n'est que de 0.37. Il apparat qu'tendre une norme de polarit
mme seulement des mots amliore nettement la qualit de la prdiction puisqu'on
passe d'une corrlation de 0.37 0.50. L'adjonction des bigrammes aux mots
amliore aussi la prdiction, mais moins fortement. Le gain pour les n-grammes de
taille suprieure est nettement plus limit. On observe aussi que SO-LSA est
lgrement plus efficace que DIC-LSA.
Mot
Mot-2G
Mot-2G-3G
Mot-2G-3G-4G
SO-LSA
0.52
0.58
0.58
0.58
DIC-LSA
0.50
0.54
0.55
0.55
Tableau 4 : Corrlations entre les polarits des critiques estimes par les
procdures automatiques et les notes attribues par les auteurs.
Une srie d'analyses complmentaires ont t menes en faisant varier les termes
employs pour prdire la polarit des critiques de manire ne prendre en compte
que les termes les plus extrmes ou seulement les termes positifs. Cette dernire
option a donn lieu des performances trs faibles. Se baser exclusivement sur les
termes les plus extrmes donne lieu des corrlations trs lgrement meilleures,
mais a aussi pour consquence de rduire le nombre de critiques auxquelles la
Yves Bestgen
technique peut attribuer un score parce que certaines critiques ne contiennent plus
aucun terme dont la polarit a t estime. Une comparaison avec les rsultats
obtenus sur l'ensemble du matriel de test devient donc discutable.
4. Discussion et conclusion
Cette recherche a pour objectif principal d'valuer l'intrt qu'il y a d'tendre
l'estimation automatique de la polarit de termes des n-grammes. Deux procdures
efficaces pour estimer la polarit de mots ont t modifies de manire pouvoir
attribuer un score de polarit ce type d'expressions. L'exprience rapporte indique
que plus un n-gramme contient de mots, plus frquemment il est observ dans une
critique de mme polarit que lui. Les valeurs obtenues pour les n-grammes positifs,
surtout pour les expressions les plus extrmes, peuvent tre considres comme trs
leves tant donn qu'il n'est pas rare que des critiques globalement ngatives
mentionnent nanmoins quelques qualits et que, comme d'autres chercheurs l'ont
dj not (Ghorbel et Jacot, 2011), un matriel de test compos de critiques de films
n'est pas exempt d'erreurs. La critique reprise ci-dessous, trouve par hasard sur le
site allocin.fr et ne faisant pas partie du matriel exprimental, en est un exemple
particulirement manifeste : 1 - Trs mauvais : Du grand Claude Chabrol. Une
merveille ce film, une bouffe de bonheur ! Les acteurs s'amusent et le rsultat est
convaincant; Philippe Noiret atteint la quasi-perfection dans son rle d'animateurtl-hypocrite, Robin Renucci est littralement fondant, Bernadette Lafont est
parfaitement horripilante dans son rle de masseuse et Anne Brochet s'en tire bien
pour un rle difficile jouer. Une trame qui tient la route et un dcor parfait
viennent s'ajouter un film hors du commun !
Cette analyse a aussi mis en vidence un rsultat inattendu. Les termes identifis
comme ngatifs par la procdure automatique sont nettement moins souvent
associs des critiques ngatives que les termes positifs des critiques positives et
ceci est vrai tant pour les mots que les n-grammes. On peut se demander si ce
rsultat ne devrait pas tre interprt, en partie au moins, comme une faiblesse de la
procdure d'valuation et non de la procdure d'estimation des polarits. En effet, on
trouve parmi les n-grammes ngatifs frquents dans des critiques positives des
expressions comme pas vraiment mauvais mais, pouvoir tre meilleur si ou encore
tre trop lisse. Ces n-grammes sont clairement ngatifs, mais ils ont leur place dans
une critique globalement positive qui souligne quelques lments plus ngatifs. Ce
rsultat s'explique sans doute aussi par le type de textes employs dans l'exprience.
Comparant diffrents types de critiques (film, banque, voiture...), Turney (2002) a
observ que, contrairement aux autres types, le contenu du film (film d'horreur,
drame social) peut aussi avoir une forte polarit sans que celle-ci soit lie au point
de vue de l'auteur de la critique propos de celui-ci : on peut apprcier fortement un
film qui vous remplit d'effroi et on peut tre heureux d'avoir vers de nombreuses
larmes sur les malheurs des personnages. Il serait donc intressant de reproduire
l'exprience avec un matriel compos de critiques d'un tout autre type afin de
dterminer si, dans celui-ci aussi, les termes identifis comme ngatifs sont peu
souvent associs des critiques ngatives. Quoiqu'il en soit, une tude approfondie
de l'estimation de la polarit de termes ngatifs est indispensable.
La dernire analyse indique que la prise en compte des n-grammes permet
d'amliorer la prdiction de la polarit de critique de films. Dans cette analyse aussi,
les rsultats peuvent tre vus comme trs bons tant donn la nature particulirement
simpliste de la procdure d'assignation d'une polarit aux critiques : la simple
moyenne de toutes les polarits connues dans le texte en question. Il n'en reste pas
moins que le bnfice le plus important s'observe lors de l'adjonction des bigrammes
aux mots et que ni les trigrammes, ni les quadrigrammes n'ont un effet
supplmentaire important.
Enfin, les diffrentes analyses effectues mettent en vidence une lgre
supriorit de SO-LSA sur DIC-LSA. Cette observation s'explique probablement par
le fait que les points de repre employs dans SO-LSA ont, en partie au moins, t
slectionns par Turney et Littman (2003, Turney, 2002) parce qu'ils taient
justement associs des critiques positives (excellent, bon) ou des critiques
ngatives (mauvais, mdiocre).
Globalement, les rsultats obtenus plaident en faveur de l'intgration de ngrammes dans les lexiques de polarit construits par une procdure automatique
partir d'un corpus. Non seulement les n-grammes semblent tre des indicateurs plus
fiables de polarit que les mots (analyse 2), mais leur combinaison avec ces mmes
mots permet une meilleure prdiction de la polarit de textes (analyse 3). Il faut
toutefois rester prudent en raison du caractre exploratoire de la prsente tude et de
ses limitations. En premier lieu, les rsultats ont t obtenus par l'analyse d'un seul
type de textes : des critiques dposes sur des sites de partage social. Les gnraliser
d'autres types de textes est indispensable. L'intrt majeur des techniques
employes est qu'elles ne prennent pas en compte les notes attribues aux critiques
lors de l'estimation de la polarit. Ces techniques peuvent donc tre appliques tout
corpus, que celui-ci inclue ou non une valuation de l'opinion mise dans le texte.
Des billets de blogs, des commentaires de lecteurs et mme des articles de presse
peuvent tre soumis ces techniques pour tendre un lexique de polarit. Il sera
seulement ncessaire d'utiliser une autre procdure d'valuation des performances
que celle employe dans la prsente recherche.
Ensuite, les espaces smantiques utiliss pour estimer les polarits sont
uniquement extraits d'un corpus spcifique au matriel de test. Ce choix a permis par
exemple de dtecter comme trs ngatifs des termes tels que truelle que l'on trouve
employe dans des expressions comme Les blagues sont torches la truelle ou
soulignant la truelle. Il serait nanmoins intressant de comparer l'efficacit des
procdures d'estimation sur la base d'un corpus spcifique ou d'un corpus gnrique
afin de dterminer si les observations de Bestgen (2008), obtenues dans une analyse
de phrases extraites d'articles de presse, peuvent tre reproduites avec des critiques.
Yves Bestgen
Une autre question, plus fondamentale, laquelle cette recherche ne rpond pas
est de dterminer si la construction des lexiques de polarit est le lieu o prendre en
compte les facteurs contextuels qui affectent la polarit des mots. L'autre option
consiste laisser le traitement des effets contextuels pour d'autres modules du
systme d'analyse de l'opinion comme c'est frquemment le cas pour la ngation.
L'intrt de l'approche base sur les n-grammes est que les effets contextuels sont
(potentiellement) dcouverts de manire automatique et non au travers de l'analyse
manuelle et fine d'un corpus de textes. Il reste toutefois prouver que cette manire
de procder est aussi efficace que le recours des modules spcifiques.
Remerciements
Yves Bestgen est chercheur qualifi du F.R.S-FNRS. Il tient remercier Nadja
Vincze, auteure de la version prliminaire du programme Perl employ pour
collecter les critiques.
5. Bibliographie
Abbsasi A., Chen H., Salem A. Sentiment analysis in multiple languages: Feature selection
for opinion classification in Web forums , ACM Transactions on Information Systems
26, 2008.
Berry M., Do, T., O'brien G., Krishna V., Varadhan S. SVDPACKC : Version 1.0 user's guide,
Tech. Rep. CS-93-194, University of Tennessee, Knoxville, TN, October 1993.
Bestgen Y. Can emotional valence in stories be determined from words? , Cognition and
Emotion, 7, 1994., p. 21-36.
Bestgen Y. Dtermination de la valence affective de termes dans de grands corpus de
texte , Actes de CIFT'02, 2002, p. 81-94.
Bestgen Y. Building affective lexicons from specific corpora for automatic sentiment
analysis , Proceedings of LREC 2008, 496-500.
Bestgen Y.,Vincze N. Checking and bootstrapping lexical norms by means of word
similarity indexes , Behavior Research Methods, 44, 2012, p. 998-1006.
Brooke J. A Semantic Approach to Automated Text Sentiment Analysis. Simon Fraser
University, 2009.
Chesley P., Vincent B., Xu L., Srihari R.K. Using verbs and adjectives to automatically
classify blog sentiment , Proceedings of AAAI-CAAW-06, 2006, p. 27-29.
Deerwester S., Dumais S. T., Furnas G. W., Landauer T. K., Harshman R.. Indexing by
Latent Semantic Analysis , Journal of the American Society for Information Science,
vol. 41, 1990, p. 391-407.
Esuli A., Sebastiani F., Sentiwordnet: A publicly available lexical resource for opinion
mining , Proceedings of LREC06, 2006, p. 417-422.
Yves Bestgen
Turney P., Littman M. Measuring Praise and Criticism: Inference of Semantic Orientation
from Association , ACM Transactions on Information Systems, vol. 21, 2003, p. 315346.
Velikovich L., Blair-Goldensohn S., Hannan K., McDonald R., The Viability of Webderived Polarity Lexicons . Proceedings of NAACL, 2010, p. 777-785.
Vernier M., Monceaux L. Enrichissement dun lexique de termes subjectifs partir de tests
smantiques , Traitement automatique des langues 51, 2010, 125-149.
Vernier M., Monceaux L., Daille B., Dubreil E. Catgorisation smantico-discursives des
valuations exprimes dans la blogosphre , Actes de TALN 2009.
Vincze N., Bestgen Y., Identification de mots germes pour la construction d'un lexique de
valence au moyen d'une procdure supervise , Actes de TALN11, vol. 1, 2011, p. 223234.
Wiebe J., Wilson T., Bruce R., Bell M., Martin M., Learning subjective language ,
Computational Linguistics, vol. 30, 2004, p. 277-308.
Wilson T., Wiebe J., Hoffmann P.. Rcognizing contextual polarity in phrase-level sentiment
analysis , Proceedings of the 2005 Human Language Technology Conference and the
Conference on Empirical Methods in Natural Language Processing, 2005, p. 347-354.
Wilson M. D., The MRC Psycholinguistic Database: Machine Readable Dictionary, Version
2 , Behavioral Research Methods, Instruments and Computers, vol. 20, 1988, p. 6-11.
Yu H., Hatzivassiloglou V. Toward answering opinion questions : Separating facts from
opinions and identifying the polarity of opinion sentences , Proceedings of the
Conference on Empirical Methods in Natural Language Processing (EMNLP), 2003, p.
129-136.