Vous êtes sur la page 1sur 3

L'extraction des sentiments et des opinions contenus dans les évaluations en ligne est devenue un

sujet important dans le traitement du langage naturel, l'apprentissage automatique et l'exploration


du Web .

La classification des sentiments des revue en ligne est le travail le plus fondamental et le plus
important dans le traitement du langage naturel [1,2].

Actuellement, la classification des sentiments des avis (positifs et négatifs) a été largement étudiée,
mais elle ne peut pas répondre à la demande d'analyse fine des sentiments des avis [3-7].

Les recherches d'Horrigand montrent que les consommateurs sont prêts à payer un supplément de
20 à 99 % pour acheter un produit noté cinq étoiles au lieu d'un produit noté quatre étoiles [8]. Cela
montre que les nuances des évaluations de produits peuvent entraîner des changements
spectaculaires dans les ventes de produits.

Dans le cadre de la surveillance de l'opinion publique, le gouvernement souhaite non seulement


comprendre les catégories de sentiments positifs et négatifs des évaluations, mais aussi approfondir
la compréhension de l'intensité des sentiments positifs et négatifs pour distinguer l'urgence des
événements d'opinion publique et prendre différentes mesures.

Par conséquent, les chercheurs accordent de plus en plus d'attention aux prévisions d'évaluation des
revues (RRP).

Les méthodes RRP existantes sont principalement basées sur le contenu des revues. Du point de vue
du traitement du langage naturel, le contenu des revues est converti en un vecteur de
caractéristiques textuelles, puis un modèle de régression linéaire est utilisé pour modéliser les RRP
[9-13].

Les recherches d'Horrigand montrent que les consommateurs sont prêts à payer un supplément de
20 à 99 % pour acheter un produit noté cinq étoiles au lieu d'un produit noté quatre étoiles [8].

Par exemple, Qu et al. ont considéré le RRP comme un problème d'ingénierie des caractéristiques, et
ont amélioré la performance du RRP en extrayant différentes caractéristiques, telles que des mots,
des modèles lexicaux, des structures syntaxiques et des sujets sémantiques du contenu des revues
[10].

Zhang et al. ont utilisé un CNN profond sur l'intégration des mots pour apprendre les caractéristiques
des revues, qui sont ensuite introduites dans une couche softmax pour obtenir des prédictions de
sentiment [13].
Les méthodes existantes de PRR qui sont basées sur le contenu des revues ont une hypothèse
implicite : la polarité et l'intensité du sentiment exprimées par les mêmes mots de sentiment sont
cohérentes, et la polarité et l'intensité du sentiment exprimées par des mots de sentiment différents
sont différentes.

Toutefois, cette hypothèse implicite ne tient pas dans le scénario réel. Par exemple, un utilisateur
exigeant a donné une note de cinq points au téléphone portable Huawei avec le mot de sentiment
"bon", tandis qu'un autre utilisateur tolérant pourrait donner une note de quatre étoiles avec le
même mot de sentiment "bon". Différents utilisateurs utilisent les mêmes mots de sentiment pour
exprimer une intensité de sentiment différente, ce qui reflète le contexte de l'utilisateur du mot de
sentiment est très important pour RRP.

Par exemple, le mot "simple" dans la revue "ce film est simple" exprime un sentiment négatif. Alors
que dans la critique "ce téléphone est simple à utiliser", il exprime un sentiment positif. Pour
différents produits, les mêmes mots de sentiment sont utilisés pour exprimer différentes polarités de
sentiment, ce qui reflète le contexte du produit du mot de sentiment a un certain impact sur le RRP

Grâce à l'analyse ci-dessus, on peut constater que le RRP n'est pas seulement lié au contenu du texte
d'évaluation, mais aussi aux informations sur le contexte de l'utilisateur et sur le produit.

Certaines études ont montré que les informations sur le contexte de l'utilisateur sont une source de
données importante pour la prédiction des évaluations en ligne [14-17].

Wang et al. pensent que la note n'est pas entièrement déterminée par le contenu de l'avis, car un
utilisateur exigeant peut commenter tous les produits avec des mots durs, même s'il donne une note
très élevée au produit [14].

Certains chercheurs pensent que les informations sur le contexte du produit sont une autre source
de données importante pour la prédiction des évaluations en ligne. Tang et al. pensent qu'un produit
possède une collection de mots spécifiques au produit qui conviennent pour l'évaluer [15]. Par
exemple, les gens préfèrent utiliser "élégant" et "stable" pour évaluer un smartphone, tandis qu'ils
aiment utiliser "sans fil" et "mécanique" pour évaluer un clavier.

Wu et al. Pensent que les mêmes mots peuvent avoir des significations différentes, voire opposées,
dans les évaluations de différents produits [16]. Par exemple, "facile" est un sentiment positif dans
"cet appareil photo numérique est facile à utiliser", mais il peut avoir un sens négatif dans "la fin de
ce film est facile à deviner".

Le principal problème des méthodes RRP existantes qui sont basées sur le contenu des revues est
que la dépendance du mot sentiment par rapport au contexte de l'utilisateur et au contexte du
produit ne peut pas être traitée très bien en se basant uniquement sur les informations du contenu
de la revue.

Nous proposons donc une méthode de prédiction du classement des revues basée sur le contexte
utilisateur et le contexte produit (RRP + UC + PC). Notre méthode modélise d'abord la dépendance
du mot sentiment par rapport au contexte de l'utilisateur, et propose une méthode de prédiction de
l'évaluation des revues qui combine le contenu de la revue et le contexte de l'utilisateur. Ensuite,
nous modélisons la dépendance des mots de sentiment par rapport au contexte du produit, et nous
proposons une méthode de prédiction de l'évaluation des revues basée sur le contenu des revues et
le contexte du produit. Enfin, une méthode de prédiction de l'évaluation des critiques basée sur le
contexte de l'utilisateur et du produit est proposée.

Vous aimerez peut-être aussi