Vous êtes sur la page 1sur 14

Lanalyse de lmotion dans les forums de sant

Cline Battaa (Doctorante en Sciences de linformation et de la communication luniversit Stendhal de Grenoble)


Groupe de Recherche sur les Enjeux de la Communication (GRESEC), Universit Stendhal, Laboratoire Gresec, Grenoble 3 celine.battaia@u-grenoble3.fr

RSUM
Les travaux sur lmotion dans les forums sont nombreux en Linguistique et Psychologie. Lobjectif de cette contribution est de proposer une analyse de lmotion dans les forums de sant selon langle des Sciences de lInformation et de la Communication mais galement selon une approche interdisciplinaire. Il sagira ici, dtudier lmotion comme un critre de pertinence lorsque des personnes malades effectuent des recherches dans les forums. Ce papier introduit la mthodologie utilise en traitement automatique de la langue an de rpondre cette interrogation. Ainsi, le travail prsent abordera lexploitation dun corpus de messages de forums, la catgorisation semi-supervise et lutilisation du logiciel NooJ pour traiter de manire automatique les donnes.

ABSTRACT
Analysis of Emotion in Health Fora Studies about emotion in fora are numerous in Linguistics and Psychology. This contribution approaches this subject from an Information and Communication Sciences point of view, and studies emotion as a criteron of pertinence for patients in a health forum. This paper introduces the empirical step of automatic language processing in order to answer this question, and uses data processing on the corpus of forum messages, semi-supervised categorisation of messages and use of software NooJ for Natural Language Processing.

MOTS-CLS : motion, forum de sant, traitement automatique de la langue, dsambigusation


lexicale.

KEYWORDS: emotion, health forum, automatic language processing, lexical disambiguation.

Actes de la confrence conjointe JEP-TALN-RECITAL 2012, volume 3: RECITAL, pages 267280, Grenoble, 4 au 8 juin 2012. c 2012 ATALA & AFCP

267

Introduction

La recherche dinformation peut tre dnie comme lactivit dun individu qui vise localiser et traiter une ou plusieurs informations au sein dun environnement documentaire complexe, an de rpondre une question ou rsoudre un problme (Dinet et Rouet, 2002). Dans le contexte de la maladie rare, grave, ou chronique, la recherche dinformation est une activit subordonne dautres objectifs tels que rechercher des informations pratiques, des renseignements sur les traitements ou encore des contacts avec dautres malades (Romeyer, 2008). Pour les Sciences de lInformation et de la Communication, la sant est un domaine illustrant les volutions du processus de recherche dinformation (Boube et Tricot, 2010). En effet, ce champ est tellement important quil inuence mme le domaine de la recherche dinformation en gnral [...] sur peu prs tous les aspects : besoin dinformation, tche de recherche dinformation, dmarche de recherche dinformation, valuation des sources, etc. (Boube et Tricot, 2010). Avec le succs dInternet (Renahy et al., 2007) et plus prcisment des forums de sant (Paganelli et Clavier, 2010), se pose la question de lvaluation de linformation recherche. En effet, dans ces dispositifs, il nest pas possible de mobiliser les critres de pertinence prcauniss par les diffrents modles reprsentant le processus de recherche dinformation (auteur, date, sources, etc.). Nous nous intressons, par consquent, aux critres de pertinence mobiliss par les malades pour valider les informations mdicales recherches dans des forums. En effet, puisquil nest pas possible de mobiliser les critres traditonnels tels que la connaissance de lauteur, la source, ou encore ladquation avec le domaine, nous nous demandons comment les malades valident les diffrentes informations trouves. Lors dune maladie grave, rare, ou chronique, la motivation des malades utiliser un forum de sant est informationnelle mais galement motionnelle (Paganelli et Clavier, 2010). Cela nous amne nous intresser lmotion non pas seulement comme raison pour rechercher de linformation dans les forums de sant mais galement comme critre de pertinence pour valuer les recherches faites dans dispositifs. tudier lmotion comme critre de pertinence est une approche originale car cela permet de mettre en lumire les mutations du processus de recherche dinformation et terme, proposer un nouveaux paradigme de recherche dinformation. Pour rpondre cette question, nous formulons quatres hypothses : a) les malades utilisent le forum de sant pour des raisons motionnelles mais galement parce quil sapparente un dispositif de recherche dinformation simple utiliser et non contraignant, b) dans les forums de sant lvaluation de linformation se fait de manire affective, c) Les malades sont la recherche dastuces de vie avec la maladie, d)lorsquil y a de linformation mdicale, elle est donne sur un ton motif. An dafrmer ou inrmer ces hypothses, nous avons mobilis deux mthodes de travail empirique : une mthode dexprimentation-entretien et une mthode de traitement automatique de la langue. Dans ce travail, nous prsenterons dabord notre posture thorique puis la mthode de traitement automatique de la langue employe. Nous expliciterons, donc, la catgorisation semi-supervise utilise an de classer les diffrents types de messages et lutilisation du logiciel NooJ an dtudier la proximit entre des termes motifs et des termes mdicaux. Enn, dans la dernire partie nous prsenterons les premiers rsultats obtenus.

268

2
2.1

tat de lart
Cadre

Plusieurs modles dcrivent les diffrentes tapes adoptes par un utilisateur lors dune recherche dinformation (Barry et Schamber, 1998), (Guthrie, 1988), (Kuhlthau, 1991), etc. Ces modlisations sont majoritairement issues des Sciences de lInformation et de la Communication et de la Psychologie Cognitive. Les Sciences de lInformation et de la Communication, mettent laccent sur le fait que la recherche dinformation est un processus dans le sens o il sagit dune suite continue de faits prsentant une unit (Boube et Tricot, 2010). Il sagit dune activit dynamique et volutive car humaine. Cependant, pour la Psychologie Cognitive, lactivit de recherche dinformation nexiste pas intrinsquement mais dpend de contextes dutilisation diffrents. Lindividu ralise une tche et saperoit quil manque de connaissances pour la mener bien. Il dcide donc de pallier ce manque et de rechercher les informations qui lui font dfauts. Mais pour cela il doit possder des connaissances sur le contenu qui lui manque car, pour le domaine de la Psychologie Cognitive, il nest pas possible de rechercher une information sans avoir un minimum de connaissances sur le domaine. Quelque soit la posture disciplinaire de ces modles, tous accordent une place importante lvaluation de la pertinence de linformation ou du document slectionn. Ils mettent en vidence des critres de conance que les individus doivent utiliser pour leur recherche. Ainsi, des critres tels que ladquation au thme recherch, la clart des donnes, la source do provient le document, lauteur, sont autant dindices qui peuvent tre mobiliss pour valuer linformation (Barry et Schamber, 1998). Cependant, force est de constater que les nouvelles technologies ont transform les pratiques de recherche dinformation (Boube et Tricot, 2010). En effet, diffrentes enqutes ralises en Europe et aux tats-Unis, mettent en avant le fait quInternet est de plus en plus utilis pour rechercher de linformation mdicale (Aube et Thor, 2010). Le champ de la sant est un domaine dans lequel ces volutions sont le plus visibles (Boube et Tricot, 2010). Le succs de la recherche sant en ligne est tel que Google Flu dtecte les pidmies de grippe quelques jours avant leur survenue en analysant les requtes des malades (Ginsberg et al., 2008). Pour certains chercheurs, Internet conduirait trois types de recherche de la part des personnes malades (Aube et Thor, 2010) : une logique professionnelle : le malade cherche obtenir des informations pour lui permettre dapprhender la dcision des mdecins. une logique consumriste : le malade utilise Internet pour confronter les informations sur sa maladie, les diffrents traitements et ainsi faire un choix. une logique communautaire : le malade participe des rseaux communautaires, tels que des forums, o sexercent la fois change dinformations de sant et informations personnelles. Nous nous intressons cette dernire logique car, dans les pays occidentaux, les forums de sant rencontrent beaucoup de succs (Paganelli et Clavier, 2010). Un forum peut se dnir comme un dispositif de communication mdiat par ordinateur, asynchrone et anonyme (Blanchard, 2007). Cest un lieux dchange o linformation est

269

construite collectivement et le contenu auto-structur. En effet, les participants sont la fois producteurs et usagers de linformation (Clavier et al., 2010). Par consquent, linconvnient majeur des informations dlivres dans un forum, que ce soit des informations sur un utilisateur ou dans le contenu du message, est limpossibilit de mobiliser les critres dvaluation traditionnellement utiliss, mme si le forum est hberg dans un site able. Se pose alors la question de savoir pourquoi les forums de sant ont autant de succs. Il apparat que ce dispositif prsente, un double objectif : un soutien informationnel et motionnel (Gaglio, 2010), (Paganelli et Clavier, 2010). Avant de poursuivre, il nous semble important de dnir ce que nous entendons par motion car bien que ce concept ait t trs tudi ces dernires annes, il reste assez difcile apprhender de faon claire (Novakova et Tutin, 2009a). Il existe plusieurs systmes de dnitions de lmotion. Ainsi, les spcialistes ne sont pas toujours daccord sur les dnitions adopter. Dans notre travail, nous avons choisi de traiter de lmotion au sens large du terme. Cela signie que nous englobons lmotion (joie, tristesse, haine, etc.) et les sentiments (amertume, crainte, honte, etc.) (Blumenthal, 2009). Pour les Sciences de lInformation de la Communication, la prise en compte de lmotion dans le processus de recherche dinformation nest pas nouveau. Nanmoins, force est de constater que lmotion nest tudie que en tant qumotion ressentie par un individu dans les tapes de sa recherche ou dans des lieux documentaires. titre dexemple, nous pouvons citer le modle Information Search Process cr en 1991 (Kuhlthau, 1991). Contrairement aux prcdentes modlisations du processus de recherche dinformation, celui-ci mettait en vidence les rle des motions et de la conance en soi dans les tapes dune recherche documentaire. Le modle ISP se compose de six phases : une phase dinitiation qui correspond lapparition dune sensation dincertitude et dattente informationnelle, une phase de slection o lindividu dnit ce quil veut rechercher et a donc un sentiment doptimisme, une phase dexploration qui correspond une phase de rexion et dacquisition dinformation une phase de formulation. Cette tape correspond une phase de srnit, dincertitude diminue et une augmentation de conance dans sa recherche, une phase de collecte des donnes qui renforce la conance de lindividu au fur et mesure quil trouve des informations, Enn, une phase de prsentation des rsultats. Lindividu na pas dincertitude mais se trouve dans un tat de satisfaction ou dinsatisfaction. Au cours de ces tapes, lindividu va chercher rduire son principe dincertitude. Lincertitude est un tat cognitif vague, difcile formuler pour lindividu et souvent accompagn de sentiments de confusion ou de frustration (Boube et Tricot, 2010). Plus rcemment, dautres travaux, se sont interrogs sur le rle de lmotion dans la dtermination des prises de dcision (Julien et al., 2005) ou encore sur le lien entre contrle de lmotion et tche de recherche en ligne (Kim, 2008). Il semblerait quInternet favorise le lien entre recherche dinformation et motion (Abbasi et al., 2008). Leur enqute met en avant la richesse motionnelle des discours sur Internet. Par consquent, ces dernires annes, lanalyse des sentiments a t appliqu diffrentes formes du web et dans diffrents domaine. Par exemple, lanalyse des sentiments dans les forums a dj t trait en linguistique mais dans le but damliorer la qualit dun systme dextraction de sentiment grce au traitement

270

automatique de la langue naturelle (Maurel et al., 2008). Plus gnralement, dautres travaux en linguistique cherchent caractriser les motions, tudient un ou deux champs smantiques de lmotion ou encore travaillent sur lextraction automatique des affects (Novakova et Tutin, 2009a), (Barb, 2007). Nous nallons pas tudier lmotion de cette manire l mais nous aider des prcdents travaux pour nous intresser aux indices motionnels contenus dans les messages des forums de sant et nous demander si lmotion peut devenir un critre de pertinence.

2.2

Hypothses

A/ Les malades ou proches de malades cherchent principalement des astuces de vie avec la maladie Les travaux raliss prcdemment (Romeyer, 2008), (Lemire, 2009),(Clavier et al., 2010) mettent en avant le fait que les internautes, et plus prcisment les malades ou proches de malades, recherchent principalement des informations pratiques concernant la vie avec la maladie ; ceux-ci veulent, par exemple, obtenir des astuces sur la gestion des effets secondaires dun mdicament pour la thyrode. Or, dautres tudes ont des rsultats contraires et rvlent que : Dans son panorama de la consommation dinformations sur lInternet mdical, D. Nabarette (Nabarette, 2002) y relie cinq buts : sinformer pour connatre (maladies, traitements...), choisir (praticiens, plans de soins...), superviser laction des professionnels, produire (un diagnostic...), se coordonner dans le cadre de la relation patient/mdecin. Notre enqute rvle une prminence de la premire catgorie (Gaglio, 2010) . Il nous semble important de pouvoir dterminer quel type dinformation vont chercher les malades dans les forums de sant. Or, les rsultats des travaux raliss jusqu prsent ne vont pas toujours dans le mme sens. Aprs une premire observation et un croisement des lectures qui ont pu tre faites, nous mettons lhypothse que les malades sont plutt la recherche dastuces de vie avec la maladie. An de typer les informations contenues dans notre corpus, nous ralisons, laide dun partenariat avec le Laboratoire dInformatique dOrlans, une catgorisation semi-supervise. B/ Linformation mdicale est donne sur un ton motif Par information mdicale nous voulons dire information mdicale (professionnelle) et information de sant (grand public, non spcialise) (Romeyer, 2008). Plusieurs enqutes telles que celle de Jolle Kivits (Kivits, 2006), dHlne Romeyer (Romeyer, 2008), ou encore Grard Gaglio (Gaglio, 2010) rappellent que la relation avec le praticien ne change pas dans le sens o les professionnels de sant restent les principales sources dobtention de linformation mdicale(Vercher et Touboul, 2011). Les forums de sant ne sont donc pas des lieux uniquement faits pour changer de linformation mdicale. tant donn que le forum est un lieux dchange avec dautres malades, nous pensons que les informations mdicales sont dlivres sur un ton motif car li lexprience et au ressenti que le malade prouve face la maladie. An dinrmer ou afrmer cette hypothse, nous allons nous servir du logiciel NooJ et observer la proximit entre les termes dmotion et les termes mdicaux. Les deux hypothses suivantes ne font pas lobjet dun traitement automatique de la langue mais dune exprimentation conmplte par des entretiens. Cela nous permet la fois de

271

dpasser le biais mthodologique puisque les entretiens ne sont nalement que des discours sur leurs pratiques faites par les individus interrogs, et non lobservation du processus en train de se faire (Blanchard, 2007). Nanmoins, nous avons choisi de les voquer brivement, an de prsenter de manire approfondie le cadre thorique sur lequel la recherche est fonde. C/ Motivation des malades utiliser le forum de sant Nous pensons que, outre la dimension motionnelle et le fait de pouvoir sexprimer entre personnes malades, que lon peut retrouver dans dautres dispositifs, le forum de sant donne limpression dtre un outil de recherche dinformation moins contraignant que les autres pour deux raisons. La premire est que lon peut poser les questions que lon veut sans avoir besoin de naviguer entre plusieurs sources pour obtenir une rponse. Il est galement possible de trouver des informations sans avoir besoin de participer, de sinscrire. La lecture des messages suft. La deuxime raison, induite par les observations qui ont pu tre menes lors de la composition du corpus de travail, est que lorsque les malades obtiennent une rponse leur question ou nen ressentent plus le besoin, il est plus facile de ne plus participer au forum. Nous nous appuyons ici sur les travaux dH. Romeyer (Romeyer, 2008). En effet, son enqute de 2008 a rvl que les malades ne cherchent pas a tablir de lien avec les autres malades. Cest la raison pour laquelle nous pensons que ds quils ont obtenu satisfaction ou non avec leur recherche, les malades ne participent plus ou ne lisent plus les messages des forums de sant . D/ valuation affective de linformation faite dans les forums de sant Nous considrons le forum de sant comme une source dinformation dimension affective dans le sens o les malades partagent aussi bien des informations mdicales que personnelles (Clavier et al., 2008), (Clavier et al., 2010), (Paganelli et Clavier, 2010). Les messages sont un mlange dinformations objectives et motionnelles. Pour nous, lmotion change la perception quun internaute a du message et modie les critres de slection habituellement utiliss. Cela signie que les malades sattachent aux indices motionnels contenu dans un message pour lvaluer. Plus un message contiendra dindices motionnels (mots, ponctuation exagre, smileys), plus les individus auront conance dans linformation vhicule. Cela leur donnerait limpression que le message na pas pu tre invent. Par consquent, nous pensons que plus un message contiendra des termes motifs, plus les malades le considreront comme vrai, comme digne de conance car ils se reconnaissent dans les termes motifs utiliss.

Mthodologie du travail empirique

Dans cette partie, nous prsentons la mthodologie de traitement automatique de la langue mobilise pour rpondre nos deux premires hypothses (A/ et B/). Le nombre de forums de sant francophones existant sur Internet est trop lev pour quil soit possible de les recenser de manire exhaustive. Notre parti-pris a donc t de les rpertorier laide du Catalogue et Index des Sites Mdicaux de langue Franaise (Cismef 1 ), du site Health On the Net Foundation (Honcode 2 ) et via une requte sans la zone de recherche de deux moteurs de recherche. 3 . Le Cismef est un projet initi par le Centre Hospitalier Universitaire de Rouen depuis
1. http ://www.chu-rouen.fr/cismef/ 2. http ://www.hon.ch/HONcode/French/ 3. Forum+sant dans Google et Yahoo

272

1995. Des documentalistes et mdecins recensent des sites mdicaux rpondant au rfrentiel des critres de qualit de linformation de sant sur le net (netscoring 4 ). Le netscoring a t dvelopp par un groupement de professionnels de sant, bibliothcaires mdicaux et juristes. Le Honcode quant lui,est nance par le Canton de Genve, des projets Europens, la Haute Autorit de Sant de France (HAS) et la fondation Provisu. Sa mission est de guider les utilisateurs dinternet vers des sources dinformations mdicales et de sant ables. Les forums accessibles via ces trois types de sources, ont t catgoriss selon leur spcialisation : forums de sant gnralistes, spcialiss dans une maladie, modrs, modrs par un mdecin. Nous avons slectionn des ls de discussion traitant de maladies rares, graves, ou chroniques car nous pensons quils sont plus mme de fournir la fois des donnes informationnelles et motionnelles. Dautre part, il est extrment difcile de trouver un forum spcialis sur le rhume par exemple. Or, nous voulons pouvoir effectuer des comparaisons entre forums gnralistes et forums spcialiss. Nous travaillons sur un corpus de 2481 messages rpertoris comme suit : Forums gnralistes modrs par un mdecin= catgorie GD Forum Atoute (8 ls de discussion, 631 messages) Forums gnralistes modrs= catgorie GM Forums Au fminin (1 l de discussion, 101 messages), Doctissimo (1 l de discussion, 159 messages), E-sant (1 l de discussion, 172 messages) et Sant mdecine (2 ls de discussion, 150 messages). Forums spcialiss modrs par un mdecin= catgorie SD Forums Ligue Cancer (6 ls de discussion et 329 messages) et Traitement du pied bot la naissance (14 ls de discussions, 292 messages). Forums spcialiss modrs= catgorie SM Forums maladies Lysosomales (2 ls de discussion, 153 messages), Renaloo (2 ls de discussion, 157 messages), Solhand (3 ls de discussion, 173 messages) Vivre sans thyrode (1 l de discussion, 164 messages). Il aurait t intressant pour notre enqute de pouvoir galement analyser des forums de sant non modrs mais nous nen avons pas trouv. Un traitement semi-automatique (avec le logiciel Python 5 ) a t ralis sur notre corpus. Nous avons en effet, rpertori et class les informations externes au contenu des messages tel que le titre des ls de discussion, la source, lurl ou encore le nombre de messages. Nous avons souhait traiter ces informations an de pouvoir effectuer des comparaisons entre les diffrents ls de discussion mais galement an davoir une trace darchivage. Nous avons ensuite cr un ltre Python an de numroter automatiquement les messages et de ne conserver que le texte. Linconvnient majeur est la suppression des smileys car le ltre ne conserve que le texte et non les images. Les smileys ont ensuite t intgrs au corpus en tant que signication (par exemple : SMILEY=SOURIRE).
4. http ://www.chu-rouen.fr/netscoring/ 5. http ://www.python.org/

273

3.1

Catgorisation semi-supervise

La catgorisation semi-supervise se fait en partenariat avec le Laboratoire dInformatique Fondamentale dOrlans 6 . La classication semi-supervise est une hybridation entre la classication supervise (ou classication par apprentissage) et la classication par extraction (non-supervise). La classication par apprentissage permet dtablir des classications partir de documents pr-classs tandis que, la classication par extraction consiste en une fouille de donnes. Cela permet de pallier le nombre trop lev de documents en les classant de manire automatique. Faire du semi-supervis dans le cadre de ce travail, permet dorienter la classication et de faire ainsi du clustering semi-supervis avec plusieurs vues : lexique, smileys, ponctuation exagre. Lobjectif est donc de rpondre lhypothse concernant le type dinformation recherche par les malades (hypothse A/) et de pouvoir ainsi catgoriser de manire semi-automatique les messages. Loriginalit de cette mthode est galement de permettre de travailler en parallle sur les diffrentes manires de transmettre lmotion dans un forum de sant, savoir les mots, la ponctuation et les smileys. En effet, quelques fois lmotion nest pas transmise par les termes motifs.

Je conduis pour aller au boulot , mais c'est mais arriver de m'endormir en voiture aprs le travail SMILEY=PEUR fatigue . Je vais a Crteil environ tout les 18 mois comme la maladie et stable ( pour le moment ,rien ne dit que sa peut valuer !!!!!! Forum spcialis modre Solidarit Handicap, Fil de discussion Syndrome de Poems (numro 1), Message SMSH01-0014
Nous avons, dans un premier temps, cr une liste de catgories daprs le compte rendu du colloque : web participatif et sant (Paganelli et Clavier, 2010), dune exploration de notre corpus, et de forums de sant sur Internet. La raison pour laquelle nous avons dcid de procder ainsi est que nous ne voulons pas avoir de catgories correspondant uniquement notre corpus car cela risquerait de fausser les rsultats. Une pr-catgorisation manuelle de 586 messages du corpus a ainsi t faite et envoy au laboratoire dInformatique Fondamentale dOrlans. 9 items ont ainsi pu tre mis en vidence :

Astuces face la maladie Autre Demande de prsentation de soi ou dun proche sans voquer son rcit de vie, prsentation de soi sans voquer son rcit de vie avec la maladie, encouragements sans apports dinformations, demande de contact physique ou virtuel, rponse une demande de contact, proposition de contact sans demande pralable dans les autres messages. Feed Backs
6. le LIFO

274

Hors sujet Informations ponctuelles Informations sur le traitement suivi Information sur la maladie en gnral Ressenti vis--vis de la maladie Tmoignage Ces classes ont ensuite t divises en sous-catgories. Le typage des messages et le corpus de travail ont ensuite t envoys au LIFO pour traitement informatique.

3.2

Traitement automatique de la langue avec NooJ

Une phase de lemmatisation prcde le traitement du corpus avec NooJ 7 . Elle permet de ramener les termes leur forme de lemme, mais galement de corriger les fautes (nombreuses dans les forums). Lemmatiser le corpus permet, en effet, de mettre en vidence les fautes puisque le logiciel ne reconnatra pas les mots mal orthographis et les catgorisera comme unknows . La lemmatisation a t faite laide du logiciel Treetagger 8 . Ne pas corriger les erreurs auraient compliqu lanalyse du corpus puisque les termes mal orthographis nauraient pas pu tre analyss par NooJ. NooJ est un environnement linguistique cr en 1993 , dabord sous le nom dINTEX, par M. Silberztein (Svetla et al., 2007). Il permet de formaliser les langues naturelles, de dvelopper des applications de traitement automatique du langage mais galement de travailler sur de gros corpus (Yamouni-Aoughlis, 2010). An de pouvoir afrmer ou inrmer notre hypothse sur la proximit de termes motifs et de termes mdicaux (hypothse B/), nous avons cr des grammaires an de localiser les adjectifs, noms et verbes motifs. La gure 1 prsente un extrait de la grammaire faite pour les adjectifs.

FIGURE 1 Extait de la grammaire NAdjectif


7. http ://www.nooj4nlp.net/pages/nooj.html 8. http ://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/

275

Les affects ne constituent pas une classe homogne (Novakova et Tutin, 2009b). Certains se rapprochent des sentiments (par exemple honte), dautre des motions (par exemple peur). Nanmoins, force est de constater que nous ne travaillons pas sur la catgorisation de lmotion en tant que tel. Pour le moment, nous ntudions pas la valeur des termes utiliss par les internautes mais nous nous servons de listes de termes motifs pour analyser la manire dont est transmise linformation mdicale. Le but est danalyser la proximit entre les termes motifs et les termes mdicaux. Les trois grammaires (Nadjectif, Nnom et Nverbe) permettent de mettre en lumire les phrases contenant des affects. Une comparaison est ensuite faite an de vrier la prsence ou non de termes mdicaux transmis aussi bien sous la forme spcialise (Carcinome cellules claires) que sur le mode grand public (Tumeur rnale). Linconvnient de cette mthode est de ne pas pouvoir mettre en lumire des expressions ne mobilisant pas a priori deaffects mais transmettant nanmoins une motion : en avoir gros sur la patate. Pour pallier ce dsagrment, nous tablirons une liste dexpressions retant des motions et nous crerons une quatrime grammaire. Enn, il nous semble important de prciser, que les paramtres standarts de Treetagger et NooJ ont t utliss pour traiter le corpus.

4
4.1

Premiers rsultats et discussion


Les malades recherchent des tmoignages

Nous sommes en attente des rsultats de la catgorisation semi-supervise. Nanmoins, le typage manuel transmis au LIFO, nous permet dafrmer, priori, que les malades ne sont pas la recherche dastuce de vie (un saignement du nez provoqu par un mdicament pour le foie). Les messages analyss contiennent essentiellement des tmoignages, des rcits de vie lis la maladie. En effet, sur 586 messages traits, 150 proviennent dchanges de tmoignages (17 demandes, 24 apports de tmoignages suite une demande, 109 apports de tmoignages sans demande particulire au pralable). 116 messages sont lis au ressenti motionnel vis--vis de la maladie, 95 correspondent des demandes de contact et/ou encouragments, 93 concernent des changes dinformation sur les traitements, 66 sont hors sujet. 47 messages sont des retours sur les rponses (feedback), 46 concernent des changes dinformations ponctuelles, dastuce de vie et 19 changes traitent de la maladie en gnral. Il sagit majoritairement dchanges de tmoignages et de ressentis avec la maladie. Cela conrme lafrmation de Cline Paganelli et Viviane Clavier (Paganelli et Clavier, 2010), savoir que les motivations des malades sont dordre motionnel. Par contre cela remet en cause les travaux faits par (Clavier et al., 2010) puisque les rsultats de leur tude montrent que les malades sont plutt la recherche dastuce de vie avec la maladie. Le traitement entier du corpus doit tre attendu pour gnraliser les rsultats. Nanmoins les premires donnes montreraient que les malades nutilisent pas les forums dans un but informationnel. Ces rsultats doivent tre mis en parrallle avec la thse ralise par (Snis, 2003), pour qui les malades restent attachs au monde mdical pour valider les informations recherches sur Internet. Cela expliquerait galement un autre de ses rsultats, savoir que les

276

patients sont hostiles la prsence de mdecins comme intervenants dans les forums. Ce ne sont pas, pour eux des lieux de recherche mais dchange de leur vie.

4.2

Linformation mdicale nest pas donne sur un ton motif

La question de lmotion dans les forums est majoritairement traite selon une approche communicationnelle dichotomisante. Ce type de communication favoriserait lmergence dune communication motive entre crit et oral (ponctuation exagre, smileys)tandis que, linverse, dautres tudes considrent que la communication dans les forums et plus gnralement la communication mdiatise par ordinateur, entraverait la communication motionnelle (Ati et al., 2010). Les premiers rsultats obtenus avec lanalyse du corpus par NooJ, conrment la catgorisation semi-supervise du contenu et laissent penser que la communication motionnelle exite bien mais elle est rserve aux tmoignages, aux expriences de vie avec la maladie et non avec la diffusion dinformations mdicales. Ainsi, sur 200 messages analyss, 153 contiennent de lmotion que cela soit par les smileys, les mots ou la ponctuation exagre :

Ma mre se fait oprer mercredi et depuis 2 jours, comme vous, son moral est au plus bas. Elle angoisse et est trs ngative. Heureusement elle n'a ni vertige ni maux de tte mais elle est trs fatigue Forum Gnaraliste Modre par un mdecin Atoute, Fil de discussion Opration d'un mningiome, Message GDAT02-0002

Sur les 57 messages restants, 22 messages contiennent des informations objectives comme des informations pratiques par exemple et seulement 35 messages contiennent des informations mdicales. Daprs nos premiers rsultats, les informations mdicales ne semblent pas tre transmises sur un ton motionnel :

mon mdecin me prescrit un scanner et le 5 Juillet : mningiome 4 x 3,5 x 2,5 avec dme. Premier contact avec un chirurgien de la Piti-Salptrire (en vacance) RDV pour consultation le 11/8, diagnostique : opration pour le 30 Aot. Je suis entre l'hpital le 29 car j'avais pass les examens demands chez moi. Le 29 au soir double douche avec shampooing la Btadine, lger somnifre et le lendemain matin 6H. Forum Gnaraliste Modre par un mdecin Atoute, Fil de discussion Opration d'un mningiome, Message GDAT02-0006

277

Les donnes recuillies, donnent limpression que lmotion est vraiment rserve lapport dinformations personnelles. On peut alors sinterroger sur lmotion comme critre de pertinence. En effet, cela laisse penser que les individus ont peur de ne plus tre crdibles sils dlivrent une information mdicale avec beaucoup dmotion. Le forum de sant serait, avant dtre un lieu de recherche dinformation, un dispositif de maintien de lien entre des personnes vivant la mme exprience de maladie.

Conclusion

Ce travail sintresse lanalyse de lmotion dans ltude des pratiques de recherche dinformation, que les spcicits propres aux forums font voluer (Paganelli et Clavier, 2010) et tout particulirement dans le domaine de la sant o la abilit des informations mdicales recherche est difcilement vriable pour des malades. Cest la raison pour laquelle il est intressant dtudier comment lmotion peut devenir un critre de pertinence. La mthodologie prsente dans larticle a mis en vidence que les malades semblent plutt tre la recherche de rcit de vie avec la maladie. Les conversations, lorsquelles concernent la maladie en elle-mme sont plus objectives. Lmotion intervient lorsquil sagit dchange plus personnels sur la vie avec la maladie. Les premiers rsultats nous laissent penser que lmotion nest pas un critre de pertinence en tant que tel car elle nintervient pas dans les changes dinformations mdicales mais dans lchange de tmoignages, de ressenti vis--vis de la maladie. Cela conrme les rsultats de lenqute mene par (Clavier et al., 2008), savoir que les malades ne viennent pas pour rechercher des informations mdicales stricto sensu mais pour partager leur exprience avec la maladie. La mutation du processus de recherche dinformation interviendrait dans le sens o des personnes recherchent des informations ltres par lexprience de lindividu et non plus des informations objectives. Nanmoins, les rsultats sont complter par la continuation du travail de terrain (catgorisation semi-supervise et traitement NooJ de tout le corpus), mais galement par la phase dexprimentation-entretien an dapprhender le discours des malades mais aussi leur manire de faire.

Remerciements
Un grand merci Julien Corman qui a lemmatis le corpus de travail avec Treetagger et Agns Tutin pour nous avoir transmis les listes de termes motifs.

Rfrences
ABBASI, A., CHEN, H. et SALEM, A. (2008). Sentiment analysis in multiple languages : Feature selection for opinion classication in web forums.

278

ATIFI, H., GAUDUCHEAU, N. et MARCOCCIA, M. (2010). Lexpression et le rle des motions dans les forums de discussion. In YASRI-LABRIQUE, E., diteur : Les forums dediscussion : agora du XXIme sicle ? Thorie, enjeux et pratiques discursives, pages 7187. Paris. AUBE, S. et THOR, C. (2010). La construction des savoirs relatifs aux mdicaments sur internet : tude exploratoire dun forum sur les produits amaigrissants utiliss sans supervision mdicale. In RENAUD, L., diteur : Les mdias et la sant : de lmergence lappropriation des normes sociales, pages 239266. Qubec. BARB, M. (2007). Analyses linguistiques et modlisations des connaissances en vue dun traitement automatique des e-mails entrants : vers un systme de veille dans le tourisme arien. BARRY, L. C. et SCHAMBER, L. (1998). Users criteria for relevance evaluation : a cross-situational comparison. Information Processing and Management, 34(2-3):219236. BLANCHARD, G. (2007). La communication politique partisane sur Internet : des pratiques et des stratgies nouvelles ? BLUMENTHAL, P . (2009). Les noms dmotion : trois systmes dordre. In NOVAKOVA, I. et TUTIN, A., diteurs : Le lexique des motions, pages 4179. Grenoble. B OUBE, N. et TRICOT, A. (2010). Quest-ce-que rechercher de linformation ? : tat de lart, page 204. Villeurbanne. CLAVIER, V ., PAGANELLI, C., MANES-GALLO, M.-C., MOUNIER, E., ROMEYER, H. et STAII, A. (2010). Dynamiques interactionnelles et rapport linformation dans les forums de discussion mdicale. In MILLERAND, F. e. a., diteur : Web social : mutation de la communication, pages 297314. Qubec. CLAVIER, V ., PAGANELLI, C., MANES-GALLO, M.-C., MOUNIER, E., ROMEYER, H. et STAII, A. (Qubec 6-7 mai 2008). Web participatif et sant : de nouveaux rapports linformation ? In Web participatif : mutation de la communication ? DINET, J. et ROUET, J.-F. (2002). La recherche dinformation : processus cognitifs,facteurs de difcults et dimension de lexpertise. In PAGANELLI, C., diteur : Interaction Homme-Machine et recherche dinformation, pages 113161. Paris. GAGLIO, G. (2010). Consommation dinformations sur internet et modulation de la relation aux mdecins. le cas daidantes de malades atteints dune pathologie lourde. Sociologies Pratiques, 1(20):6374. GINSBERG, J., MOHEBBI, M.-H., P . R.-S. B. L., SMOLINSKI, M.-S. et BRILLIANT, L. (2008). Detecting inuenza epidemics using search engine query data. GUTHRIE, J. T. (1988). Locating information in documents : Examination of a cognitive model. Reading Research Quarterly, 23:178199. JULIEN, H., MCKECHNIE, L. E. F. et HART, S. (2005). Affective issues in library and information science systems work : A content analysis. Library and Information Science Research, 27(4):453 466. KIM, K. (2008). Effects of emotion control and task on web searching behavior. Information Processing and Management, 44(1):373385. KIVITS, J. (2006). Informed patients and the internet : a mediated context for consultations with health professionnals. Journal of Health Psychology, 11(2):269282. KUHLTHAU, C. C. (1991). Inside the search process : Information seeking from the users perspective. Journal of the American Society for Information Science, 42(5):361371.

279

LEMIRE, M. (2009). Internet et responsabilisation : perspective de lusager au quotidien. Sant Publique, 21:1325. MAUREL, S., CURTONI, P . et DINI, L. (Fontainebleau - 2008). Lanalyse des sentiments dans les forums. In Atelier Fouille des Donnes dOpinion. NABARETTE, H. (2002). Linternet mdical et la consommation dinformation par les patients. Rseaux, 4:249286. NOVAKOVA, I. et TUTIN, A. (2009a). Le lexique des motions. Grenoble. NOVAKOVA, I. et TUTIN, A. (2009b). Les motions sont-elles comptables. In NOVAKOVA, I. et TUTIN, A., diteurs : Le lexique des motions, pages 6579. Grenoble. PAGANELLI, C. et CLAVIER, V . (2010). Le forum de discussion : une ressource informationnelle hybride entre information grand public et information spcialise. In YASRI-LABRIQUE, E., diteur : Les forums dediscussion : agora du XXIme sicle ? Thorie, enjeux et pratiques discursives, pages 3954. Paris. RENAHY, E., PARIZOT, I. et CHAUVIN, P . (2007). Whist :a web-based survey on health information seeking on internet in france. Rapport technique, Paris, INSERM. ROMEYER, H. (2008). Tic et sant : entre information mdicale et information de sant. SVETLA, K., MAUREL, D. et SILBERZTEIN, M. (2007). Formaliser les langues avec lordinateur : de INTEX NooJ. SNIS, F. (2003). Pourquoi accder linformation mdicale sur Internet par le biais des groupes de discussion ? Qualit, centres dintrrt et motivations des participants aux forums mdicaux. propos du forum Usenet Fr.bio.medecine. VERCHER, E. et TOUBOUL, A.-L. (2011). Linformation sant : entre vulgarisation scientique et circulation communautaire, le cas des sites sant 2.0. In Internet et sant : regards croiss France/Qubec. Lyon : Mdiathque Universit Lyon 1, 21 fvrier. YAMOUNI-AOUGHLIS, Y. (2010). Construction dun dictionnaire lectronique de terminologie informatique et analyse automatique de textes par grammaires locales.

280

Vous aimerez peut-être aussi